Knowledge Vault

Snapshot Reader

Captured

📌 一句话摘要

李宏毅系统梳理了 AI 自我修正从 decoding、workflow 到 reasoning 与 RL 的技术路线，并指出自我反思并不总是最有效的算力投入。

📝 详细摘要

这是一堂高质量的 AI 技术课程，系统整理了大模型自我修正能力的三条路线。第一部分讨论 inference 阶段的修正方法，包括 Contrastive Decoding、Logit Lens、不同层或不同输入条件下的对比，以及 NTI 如何用 KV Cache 降低测试时干预成本。第二部分讨论 workflow 层面的 generation + verification，并提醒读者直觉上的「批判比生成容易」并不总在实验中成立；在算力有限时，多样化采样与 Majority Vote 往往比单次自我反思更划算。第三部分进入 reasoning 与 RL，说明可验证奖励如何让模型在 CoT 中自然出现检测和修正错误的行为，也呈现了学界对 RL 是否创造新能力的争论。视频的价值在于把一年多的研究脉络串成清晰框架，适合 AI 研究学习者、工程实践者和需要判断 reasoning 技术方向的读者。

💡 主要观点

自我修正可以先从 inference 阶段介入。 课程讲解了 Contrastive Decoding、Logit Lens、CAD、NTI 等方法如何通过对比正常与错误状态，在不改模型参数的情况下调整输出。
workflow 反思不一定比多样化采样更划算。 课程强调 generation + verification 的效果并不稳定，在算力有限时，多数决常常是更有效的提升方式。
RL 与 reasoning 让模型在参数层面学会修正路径。 通过可验证奖励，模型可能在 CoT 中自然形成先尝试、再检测和修正的行为，但学界仍在争论 RL 是放大已有能力还是教出新能力。

💬 文章金句

有三個不同的方向，第一個方向是去改 inference 的過程。
contrast decoding 的優點就是它沒有動到模型的參數。
正確的知識並不等同於能夠自我修正。

📊 文章信息

AI 初评：92

精选文章：是

来源：Hung-yi Lee

作者：Hung-yi Lee

分类：人工智能

语言：中文

阅读时间：4 分钟

字数：894

标签：自我修正, Contrastive Decoding, Reasoning, 强化学习

播放完整视频

Reflection 心得

note · 2026-05-16

# ai-practices reflection ## Review Decision - decision: likely_practice - archive_type: practice candidate archive - review_level: detail review - item_id: b7e58e7cb84f92bb52b1daa7f9da8ed9a34073177eff0824f4a1dd4f538ba8b1 - title: AI 能自我修正嗎？從 decoding、workflow 到 reasoning 的技術發展整理 - url: https://www.bestblogs.dev/video/8019367?amp%3Bentry=rss_article_item&amp%3Butm_campaign=resources&amp%3Butm_medium=feed - feed: BestBlogs.dev - 精选文章 - source: freshrss_sync - suggested_domain: agent-workflow - validation_status: partially-reviewed - content_length: 1036 ## Why Strong AI workflow/coding signal with source or practice wording. ## Core Judgment 该条目具备 AI/Agent/workflow 实践信号，已完成 detail review 并进入 practice 候选。下一步应从正文中提炼 Action / Constraint / Validation / Transferability，再决定是否写正式 note。 ## Boundaries 当前是 practice candidate，不是最终 verified practice；正式 note 仍需 deep review 或人工确认。 ## Detail Preview 📌 一句话摘要李宏毅系统梳理了 AI 自我修正从 decoding、workflow 到 reasoning 与 RL 的技术路线，并指出自我反思并不总是最有效的算力投入。 📝 详细摘要这是一堂高质量的 AI 技术课程，系统整理了大模型自我修正能力的三条路线。第一部分讨论 inference 阶段的修正方法，包括 Contrastive Decoding、Logit Lens、不同层或不同输入条件下的对比，以及 NTI 如何用 KV Cache 降低测试时干预成本。第二部分讨论 workflow 层面的 generation + verification，并提醒读者直觉上的「批判比生成容易」并不总在实验中成立；在算力有限时，多样化采样与 Majority Vote 往往比单次自我反思更划算。第三部分进入 reasoning 与 RL，说明可验证奖励如何让模型在 CoT 中自然出现检测和修正错误的行为，也呈现了学界对 RL 是否创造新能力的争论。视频的价值在于把一年多的研究脉络串成清晰框架，适合 AI 研究学习者、工程实践者和需要判断 reasoning 技术方向的读者。 💡 主要观点自我修正可以先从 inference 阶段介入。课程讲解了 Contrastive Decoding、Logit Lens、CAD、NTI 等方法如何通过对比正常与错误状态，在不改模型参数的情况下调整输出。 workflow 反思不一定比多样化采样更划算。课程强调 generation + verification 的效果并不稳定，在算力有限时，多数决常常是更有效的提升方式。 RL 与 reasoning 让模型在参数层面学会修正路径。通过可验证奖励，模型可能在 CoT 中自然形成先尝试、再检测和修正的行为，但学界仍在争论 RL 是放大已有能力还是教出新能力。 💬 文章金句有三個不同的方向，第一個方向是去改 inference 的過程。 contrast decoding 的優點就是它沒有動到模型的參數。正確的知識並不等同於能夠自我修正。 📊 文章信息 AI 初评： 92 精选文章：是来源： Hung-yi Lee 作者： Hung-yi Lee 分类：人工智能语言：中文阅读时间： 4 分钟字数： 894 标签：自我修正 , Contrastive Decoding , Reasoning , 强化学习播放完整视频 ## Claude / Codex Next Step 请基于该 item 正文提炼一条 AI practice，必须包含使用场景、执行步骤、约束边界、验证方法，以及在 Claude/Codex 中可复制的操作说明。 ## Index - domain: agent-workflow - source-type: freshrss_sync - validation-status: partially-reviewed - decision: likely_practice

note · 2026-05-16

AI 自我修正闭环：Generate→Attempt→Verify→Train + 自我博弈 + 三种失效模式监控。核心：限制因素是验证器质量而非模型容量。已产出正式 note：notes/2026-05-16-closed-loop-self-improvement-agents.md（质量评分 8/8）