Knowledge Vault

Snapshot Reader

Captured

📌 一句话摘要

本文深度拆解 Claude Code 的上下文窗口管理机制，提出其核心是「全量重写加分通道恢复」的工程化思路，而非滑动窗口或定期摘要等常见方案。

📝 详细摘要

文章以面试场景为引，系统分析了 Claude Code 的上下文管理方案。首先解释了上下文窗口的概念及其在 Agent 场景下的挑战（工具调用双倍记账、大文件读取、Lost in the Middle 等），并指出行业常见方案（滑动窗口、每 N 轮摘要、向量召回）的不足。核心部分详细介绍了 Claude Code 的 5 层压缩金字塔：大结果存磁盘、Snip 砍远古消息、Micro-Compact 时间衰减、Context Collapse 读时投影、Auto-Compact 全量摘要。文章重点拆解了最顶层的 Auto-Compact 机制，包括触发时机（绝对 token 阈值，上限减 13k）、取舍逻辑（全量重写对话，语义信息进摘要，状态信息走附件）、摘要 prompt 设计（9 部分结构化清单，禁止工具调用，强调用户消息枚举和当前进度细粒度）、以及压缩后的接续机制（清缓存、并发生成附件、包装接力提示语）。最后给出了面试回答的结构化建议，并总结了其「信息分通道管理」的工程哲学。

💡 主要观点

Claude Code 采用 5 层压缩金字塔，从轻到重管理上下文。 包括大结果存磁盘、Snip 砍远古消息、Micro-Compact 时间衰减、Context Collapse 读时投影和 Auto-Compact 全量摘要，前 4 层零 API 开销，仅在极端情况下触发最重的全量摘要。
Auto-Compact 的核心是「全量重写对话」加「分通道恢复」。 将所有历史消息送入摘要器重写，语义信息进结构化摘要，关键状态信息（最近文件、异步任务）通过附件通道恢复，永久指令（CLAUDE.md）通过清缓存自动重新加载。
摘要 prompt 设计精良，包含 9 部分结构化清单和防呆机制。 要求模型仅输出文本，禁止工具调用；输出包含 9 个固定章节，特别强调枚举所有用户消息和以最细粒度描述当前进度，确保压缩后 agent 能无缝接续工作。
触发时机基于绝对 token 阈值，而非轮数或比例。 触发线为「有效上下文窗口减去 13k 缓冲」，该缓冲基于摘要任务 p99.99 输出长度统计得出，保证了压缩操作的安全空间，且不随模型窗口大小变化而膨胀。

💬 文章金句

上下文管理不是「省 token」，是「保信息结构」。
不同信息走不同通道，谁也别碰谁的地盘。
Claude Code 用的不是滑动窗口、定期摘要、向量召回那一类常见方案，而是一种叫「全量重写加分通道恢复」的工程化思路。
再厉害的模型也有自己的「小动作」，prompt 工程很多时候就是在跟模型的惯性做拉扯。
这种带着血味儿的设计，才是从生产环境里活下来的。

📊 文章信息

AI 初评：88

来源：小林coding

作者：小林coding

分类：人工智能

语言：中文

阅读时间：56 分钟

字数：13789

标签： Claude Code, 上下文窗口, Agent, 源码分析, Auto-Compact

阅读完整文章