Knowledge VaultReading Workbench
Reading Detail

嘘,Claude 正在「做梦」!睡一觉疯狂进化,一夜暴涨 6 倍战力

BestBlogs.dev · 2026-05-07
#人工智能
Open Original
archivedone

Snapshot Reader

Captured

📌 一句话摘要

Anthropic 在 Claude 开发者大会上发布了托管智能体的三项新功能:Dreaming(记忆整理)、Outcomes(自动评分)和多智能体编排,通过模拟人类 REM 睡眠机制让 AI Agent 在任务间隙自动优化记忆,配合评分和协作机制将任务完成率提升最高 6 倍。

📝 详细摘要

文章报道了 Anthropic 在 Code with Claude 开发者大会上发布的托管智能体平台三大新功能。Dreaming 功能让 AI Agent 在两次任务间隙自动回顾历史会话、合并重复记忆、更新过时信息并发现隐藏规律,类似人类 REM 睡眠的记忆整合机制。Outcomes 功能提供独立的自动评分系统,通过隔离的评估器对 Agent 输出进行打分和迭代优化,在文件生成场景下将任务成功率提升 8-10 个百分点。多智能体编排允许主 Agent 将复杂任务拆解并分发给搭载不同模型和工具的专家子 Agent 并行处理。文章通过月球采矿无人机着陆模拟案例展示了三者的协同效果,并提到法律 AI 公司 Harvey 使用后任务完成率提升约 6 倍。同时报道了 Anthropic 与 SpaceX 达成算力合作,租用 22 万张 GPU 为托管智能体服务提供算力支撑。

💡 主要观点

  1. Dreaming 功能让 AI Agent 在任务间隙自动整理和优化记忆库。 该功能模拟人类 REM 睡眠机制,定时读取 Agent 现有记忆库和最多 100 个历史会话,自动合并重复项、更新过时信息、挖掘隐藏规律,生成全新的优化记忆库,且不修改原始数据,开发者可审查后再决定是否采纳。
  2. Outcomes 提供独立的自动评分系统,提升 Agent 输出质量。 开发者定义评分标准后,系统分配独立评估器对 Agent 输出进行打分和迭代优化,评估器与执行 Agent 完全隔离避免偏见。在文件生成场景下,docx 任务成功率提高 8.4%,pptx 提高 10.1%。
  3. 多智能体编排支持复杂任务的分解与并行协作。 主 Agent 将大任务拆解后分发给搭载不同模型和工具的专家子 Agent,基于共享文件系统并行工作,主 Agent 可随时协调进度,所有操作细节在控制台完全可追溯。

💬 文章金句

  • Dreaming 永远不会修改输入的原始记忆库。它生成的是一个全新的输出记忆库,开发者可以先审查结果,不满意就直接丢弃。
  • 由于评估器和干活的 Agent 完全隔离,因此不会被 Agent 自身的推理过程带偏。
  • 根据 Anthropic 的内部测试,相比标准 prompt 循环,Outcomes 把任务成功率提升了最高 10 个百分点。越难的问题,提升越明显。
  • 法律 AI 公司 Harvey 用上 Dreaming 后,任务完成率飙升了大约 6 倍。

📊 文章信息

AI 初评:86
来源:新智元
作者:新智元
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3197
标签: Anthropic, Claude, AI Agent, Dreaming, 多智能体编排