Knowledge Vault

Snapshot Reader

Captured

📌 一句话摘要

本文深入拆解了开源 AI 智能体 Hermes Agent 的四层记忆系统架构，揭示了其如何通过冷热分离、缓存优先和分层记忆设计，解决了 OpenClaw 等同类系统在记忆管理上的核心误区。

📝 详细摘要

本文基于对 Hermes Agent 开源代码库的直接分析，系统性地拆解了其记忆系统的设计哲学与实现细节。文章指出，Hermes 的核心设计原则是「保持提示词稳定以利用缓存，其他一切繁杂信息都交给工具」。为此，它构建了四层记忆架构：第一层是存储在 MEMORY.md 和 USER.md 中的固化提示词记忆，容量极小（约 1300 Token），只保存高频、稳定的事实；第二层是基于 SQLite 的 session_search 历史会话存档，通过全文搜索和辅助模型摘要实现按需回溯；第三层是长对话压缩前的记忆冲刷机制，确保重要信息在摘要前被保留；第四层是技能管理，将复杂的操作流程保存为可复用的程序记忆。文章还对比了 Hermes 与 OpenClaw 的区别，强调 Hermes 更关注缓存效率，认为「不是所有东西都配住在系统提示词这个黄金地段」。

💡 主要观点

Hermes Agent 拥有四层记忆系统：固化提示词记忆、历史会话搜索、程序记忆和用户建模。 这四层分别对应不同粒度和访问频率的信息，通过冷热分离策略，将高频使用的稳定事实压缩进提示词，低频历史信息则通过工具按需检索。
核心设计原则是保持提示词稳定以最大化缓存效率。 Hermes 刻意将 MEMORY.md 和 USER.md 的容量限制在极小的 1300 Token 左右，并固化在会话开始时生成的系统提示词中，避免频繁改动导致缓存失效，从而降低延迟和成本。
Hermes 通过记忆冲刷机制在长对话压缩前保留关键信息。 当会话过长需要压缩时，Hermes 会先触发一次额外的模型调用，指示模型将用户偏好、修正建议等值得记住的信息写入 MEMORY.md，避免摘要过程造成信息丢失。
Hermes 与 OpenClaw 的关键区别在于对缓存效率的重视程度。 OpenClaw 的记忆更接近以 Markdown 为中心的日志存储，而 Hermes 严格限制提示词记忆的容量，将历史记录存入 SQLite 并仅在需要时搜索，体现了不同的设计取舍。

💬 文章金句

Hermes 拥有的不是一套记忆系统，而是四套。
保持提示词稳定以便利用缓存（Caching），其他一切繁杂信息都交给工具。
Hermes 希望 MEMORY.md 和 USER.md 保持精简、高频且对缓存友好。
记忆应该让智能体变得更好用，而不是通过摧毁提示词的稳定性来换取博闻强识。
真正的诀窍不是记住更多，而是在正确的层级、以正确的成本，记住正确的事情。

📊 文章信息

AI 初评：90

精选文章：是

来源：宝玉的分享

作者：宝玉

分类：人工智能

语言：中文

阅读时间：12 分钟

字数：2901

标签： Hermes Agent, 记忆系统, AI Agent, 提示词缓存, 开源

阅读完整文章