Snapshot Reader
Captured
📌 一句话摘要
Anthropic 在 Claude 开发者大会上发布了托管智能体的三项新功能:Dreaming(记忆整理)、Outcomes(自动评分)和多智能体编排,通过模拟人类 REM 睡眠机制让 AI Agent 在任务间隙自动优化记忆,配合评分和协作机制将任务完成率提升最高 6 倍。
📝 详细摘要
文章报道了 Anthropic 在 Code with Claude 开发者大会上发布的托管智能体平台三大新功能。Dreaming 功能让 AI Agent 在两次任务间隙自动回顾历史会话、合并重复记忆、更新过时信息并发现隐藏规律,类似人类 REM 睡眠的记忆整合机制。Outcomes 功能提供独立的自动评分系统,通过隔离的评估器对 Agent 输出进行打分和迭代优化,在文件生成场景下将任务成功率提升 8-10 个百分点。多智能体编排允许主 Agent 将复杂任务拆解并分发给搭载不同模型和工具的专家子 Agent 并行处理。文章通过月球采矿无人机着陆模拟案例展示了三者的协同效果,并提到法律 AI 公司 Harvey 使用后任务完成率提升约 6 倍。同时报道了 Anthropic 与 SpaceX 达成算力合作,租用 22 万张 GPU 为托管智能体服务提供算力支撑。
💡 主要观点
- Dreaming 功能让 AI Agent 在任务间隙自动整理和优化记忆库。 该功能模拟人类 REM 睡眠机制,定时读取 Agent 现有记忆库和最多 100 个历史会话,自动合并重复项、更新过时信息、挖掘隐藏规律,生成全新的优化记忆库,且不修改原始数据,开发者可审查后再决定是否采纳。
- Outcomes 提供独立的自动评分系统,提升 Agent 输出质量。 开发者定义评分标准后,系统分配独立评估器对 Agent 输出进行打分和迭代优化,评估器与执行 Agent 完全隔离避免偏见。在文件生成场景下,docx 任务成功率提高 8.4%,pptx 提高 10.1%。
- 多智能体编排支持复杂任务的分解与并行协作。 主 Agent 将大任务拆解后分发给搭载不同模型和工具的专家子 Agent,基于共享文件系统并行工作,主 Agent 可随时协调进度,所有操作细节在控制台完全可追溯。
💬 文章金句
- Dreaming 永远不会修改输入的原始记忆库。它生成的是一个全新的输出记忆库,开发者可以先审查结果,不满意就直接丢弃。
- 由于评估器和干活的 Agent 完全隔离,因此不会被 Agent 自身的推理过程带偏。
- 根据 Anthropic 的内部测试,相比标准 prompt 循环,Outcomes 把任务成功率提升了最高 10 个百分点。越难的问题,提升越明显。
- 法律 AI 公司 Harvey 用上 Dreaming 后,任务完成率飙升了大约 6 倍。
📊 文章信息
AI 初评:86
来源:新智元
作者:新智元
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3197
标签:
Anthropic, Claude, AI Agent, Dreaming, 多智能体编排