Knowledge VaultReading Workbench
Reading Detail

Andrej Karpathy:Software 3.0、Vibe Coding 与 Agentic Engineering 的完整框架

BestBlogs.dev - 精选文章 · 2026-04-29
#人工智能
Open Original
archivedone

Snapshot Reader

Captured

📌 One-Sentence Summary

Andrej Karpathy 在这场主题演讲中提出 Software 3.0 时代——提示词取代编程,LLM 成为可编程计算机,「Agentic Engineering」作为协调随机性智能体的新工程学科崛起——并论证人类的理解力是不可外包的终极瓶颈。

📝 Summary

在这场主题演讲对话中,OpenAI 联合创始人、「Vibe Coding」概念发明者 Andrej Karpathy 提出了理解当前 AI 时代最完整的框架,围绕三个互锁的核心思想展开。 **Software 3.0**:从 Software 1.0(显式代码),到 2.0(通过数据集策划训练权重),再到 3.0——编程变成了写提示词。LLM 是可编程的解释器,上下文窗口是控制它的杠杆。Karpathy 用自己的 MenuGen 应用做了具体演示:他构建了一个 OCR 餐厅菜单并生成菜品图片的 app——后来才意识到 Software 3.0 版本只需一个 Gemini 提示词就能把图片直接渲染到原始菜单照片上。他的整个 app「根本不该存在」。 **可验证性与锯齿形智能**:AI 在输出可验证的领域(数学、代码)进步最快,因为实验室能在这些领域构建高密度强化学习环境。这产生了「锯齿形」能力:Claude Opus 4.7 能重构 10 万行代码库或发现零日漏洞,却告诉你步行 50 米去洗车。能力高度依赖实验室将什么放入了训练数据和 RL 环境——开发者必须通过实证探索自己的应用落在哪个「回路」上,而不是凭基准分数推断能力。 **Vibe Coding vs. Agentic Engineering**:Vibe Coding 拉高了地板线——任何人都能构建出一些东西。Agentic Engineering 在更快速推进的同时,守住了专业软件的质量上限。它把智能体视为「随机实习生」——能记住 API 细节,但仍会犯类别性错误,比如将 Stripe 邮箱和 Google 账号邮箱交叉用作用户标识符。人类角色转变为:制定详细规格、保持审美判断、主导架构决策,以及将智能体引向正确的问题。 演讲最后以「动物 vs. 幽灵」框架收尾:LLM 不是具有内在动机的动物智能,而是由预训练分布和外挂 RL 塑造的统计模拟回路。最关键的一句话:「你可以外包你的思考,但你无法外包你的理解。」

💡 Main Points

  1. Software 3.0 将编程重新定义为写提示词:LLM 是可编程的解释器,上下文窗口是开发者的控制杠杆。 Software 1.0 靠显式代码,2.0 靠整理数据集训练神经网络,3.0 则通过编写提示词、管理上下文来指挥一个作为通用解释器的 LLM。MenuGen 案例是最好的注脚:当一个 Gemini 提示词就能原生渲染同样的结果,构建传统 app 的整个做法已然过时。
  2. AI 能力呈「锯齿形」,因为它由可验证的训练领域和实验室优先级塑造,而非通用智能。 前沿模型在数学、代码、象棋上能力突出——不是因为这些领域简单,而是因为它们能提供密集的 RL 奖励信号。在不可验证或代表性不足的领域,能力止步不前。开发者必须通过实证探索自己的应用落在哪个 RL 回路上;从基准分数推断能力是不可靠的。洗车悖论把这一点展示得淋漓尽致。
  3. Agentic Engineering 是有别于 Vibe Coding 的独立学科:它在协调强大但随机性强的智能体的同时,守住专业质量上限。 Vibe Coding 拉高了可及性的地板。Agentic Engineering 守住了质量的天花板——零安全漏洞、正确的架构决策、可防御的生产系统。核心技能包括:设计机器可读的详细规格、维护对全局项目一致性的监督、提供智能体仍缺乏的审美与架构判断。
  4. 智能体是「幽灵」——没有内在动机的统计模拟回路,而非动物智能——这一认知框架彻底改变你构建和评估智能体的方式。 对智能体发火没有用,因为它没有情感基础。智能体不在乎结果,没有好奇心,也不会出于内在动机自我纠错。它们由预训练分布和 RL 奖励塑造。理解这一点能防止你将失败模式人格化,并促使你把它们作为经验工具去探索,而非盲目信任的同事。
  5. 人类的理解力是不可削减的瓶颈:思考可以外包,理解不能。 随着智能体承担越来越多的认知工作,人类的角色转变为「导演」——这需要对自己在构建什么、为什么构建有真正的理解。AI 辅助的知识库和把 AI 当导师使用,成为强化人类理解而非替代它的工具。瓶颈沿抽象层级向上移,而非消失。

💬 Key Quotes

  • 我开始注意到,用最新的模型,代码块直接就出来了,我继续要求更多,它依然没问题,我都不记得上次纠错是什么时候了,然后我就越来越信任这个系统,然后就开始 Vibe Coding 了。
  • 我的 MenuGen 基本上是多余的,它在旧范式里运作,那个 app 根本不该存在。
  • Vibe Coding 是在提升所有人在软件领域的能力下限,地板抬高了,所有人都能 Vibe Code 任何东西,这很了不起。而我说的 Agentic Engineering,是在守住专业软件时代曾经存在的质量上限。
  • 你可以外包你的思考,但你无法外包你的理解。

📊 Article Meta

AI Screening:93
Featured:Yes
Source:Sequoia Capital
Author:Sequoia Capital
Category:人工智能
Language:英文
Read Time:2 min
Word Count:499
Tags: Software 3.0, Vibe Coding, Agentic Engineering, Andrej Karpathy, 锯齿形智能