Knowledge Vault

Snapshot Reader

Captured

📌 一句话摘要

Anthropic 在 Claude 开发者大会上发布了托管智能体的三项新功能：Dreaming（记忆整理）、Outcomes（自动评分）和多智能体编排，通过模拟人类 REM 睡眠机制让 AI Agent 在任务间隙自动优化记忆，配合评分和协作机制将任务完成率提升最高 6 倍。

📝 详细摘要

文章报道了 Anthropic 在 Code with Claude 开发者大会上发布的托管智能体平台三大新功能。Dreaming 功能让 AI Agent 在两次任务间隙自动回顾历史会话、合并重复记忆、更新过时信息并发现隐藏规律，类似人类 REM 睡眠的记忆整合机制。Outcomes 功能提供独立的自动评分系统，通过隔离的评估器对 Agent 输出进行打分和迭代优化，在文件生成场景下将任务成功率提升 8-10 个百分点。多智能体编排允许主 Agent 将复杂任务拆解并分发给搭载不同模型和工具的专家子 Agent 并行处理。文章通过月球采矿无人机着陆模拟案例展示了三者的协同效果，并提到法律 AI 公司 Harvey 使用后任务完成率提升约 6 倍。同时报道了 Anthropic 与 SpaceX 达成算力合作，租用 22 万张 GPU 为托管智能体服务提供算力支撑。

💡 主要观点

Dreaming 功能让 AI Agent 在任务间隙自动整理和优化记忆库。 该功能模拟人类 REM 睡眠机制，定时读取 Agent 现有记忆库和最多 100 个历史会话，自动合并重复项、更新过时信息、挖掘隐藏规律，生成全新的优化记忆库，且不修改原始数据，开发者可审查后再决定是否采纳。
Outcomes 提供独立的自动评分系统，提升 Agent 输出质量。 开发者定义评分标准后，系统分配独立评估器对 Agent 输出进行打分和迭代优化，评估器与执行 Agent 完全隔离避免偏见。在文件生成场景下，docx 任务成功率提高 8.4%，pptx 提高 10.1%。
多智能体编排支持复杂任务的分解与并行协作。 主 Agent 将大任务拆解后分发给搭载不同模型和工具的专家子 Agent，基于共享文件系统并行工作，主 Agent 可随时协调进度，所有操作细节在控制台完全可追溯。

💬 文章金句

Dreaming 永远不会修改输入的原始记忆库。它生成的是一个全新的输出记忆库，开发者可以先审查结果，不满意就直接丢弃。
由于评估器和干活的 Agent 完全隔离，因此不会被 Agent 自身的推理过程带偏。
根据 Anthropic 的内部测试，相比标准 prompt 循环，Outcomes 把任务成功率提升了最高 10 个百分点。越难的问题，提升越明显。
法律 AI 公司 Harvey 用上 Dreaming 后，任务完成率飙升了大约 6 倍。

📊 文章信息

AI 初评：86

来源：新智元

作者：新智元

分类：人工智能

语言：中文

阅读时间：13 分钟

字数：3197

标签： Anthropic, Claude, AI Agent, Dreaming, 多智能体编排

阅读完整文章