Andrej Karpathy 的 AI 世界观：16 篇推文折射出的技术浪潮

整理自 Karpathy 2025年2月 - 2026年3月的推文

引言

Andrej Karpathy，前 Tesla AI 总监、OpenAI 联合创始人，是当今 AI 领域最敏锐的观察者之一。过去一年多，他通过一系列推文，记录了自己对 AI 技术演进的第一手感受与深度思考。这些文字不是学术论文，而是一位既站在最前沿、又保持独立思考的工程师，对一个正在被彻底重塑的时代的真实记录。

本文梳理其16篇代表性推文，从中提炼出五条主线，试图拼出一幅完整的图景：我们正在经历什么，以及它意味着什么。

一、编程的终结与重生

2025年底到2026年初，Karpathy 连续发出几声震动 AI 圈的感叹。

2025年12月，他写道："作为一名程序员，我从未感到如此落后。" 这不是自谦，而是一种真实的认知错位感——这个职业正在被剧烈重构，程序员贡献的"代码比特"越来越稀疏，新出现的可编程抽象层涉及 agent、子 agent、MCP、LSP、hooks、技能库等全新概念，"好像某种强大的外星工具被发到了大家手上，但没有任何说明书。"

两个月后，2026年2月，他的语气从震惊转向判断："编程正在变得面目全非。" 他描述了一个典型场景：用自然语言给 AI agent 发出一条指令，30分钟后整套系统自动完成——搭环境、写代码、调试、配服务、写报告。"三个月前这是个周末项目，今天它是你启动后忘掉30分钟的事。"

这种变化的核心是：你不再直接写代码，你在编排 agent 工作，自己扮演监督者、审查者和方向引导者。 Karpathy 将这种新工作方式命名为"agentic engineering（智能体工程）"——这是从早期"vibe coding"概念的自然进化（详见下节）。

二、从 Vibe Coding 到 Agentic Engineering

2025年2月，Karpathy 随手发出了一条"淋浴灵感"推文，创造了"vibe coding"这个词：顺着感觉走，不看 diff，不理解代码，遇到报错就复制粘贴，随机改动直到 bug 消失。"我在搭 Web 应用，但这并不算在写代码——我只是看着、说着、跑着、粘贴着，而且大多数时候都能用。"

他完全没预料到这条推文会变成 Wikipedia 词条，成为一个时代标志。

一年后，他在周年回顾中补充了关键更新："vibe coding 那时 LLM 能力还不够强，主要用于好玩的一次性项目。今天，通过 LLM agent 编程正在成为专业人士的默认工作流——只是带有更多监督和审查。"

两者的核心区别在于：vibe coding 接受质量折扣，只求能跑；而 agentic engineering 追求完整的工程质量，把 agent 的效率与工程师的严谨性结合起来。前者是探索，后者是生产。

三、App Store 的黄昏与定制软件的黎明

如果说"编程范式的转变"还停留在开发者圈子，那么 Karpathy 在2026年2月描述的那个"有氧运动追踪仪表盘"场景，则触及了更普遍的未来图景。

他花了1小时让 Claude 逆向工程跑步机 API、搭建了一个专为他个人心率实验定制的 Web 仪表盘，然后得出结论：

"'从 App Store 的离散列表里选择 App'这个概念，正变得越来越过时。"

他的判断是：未来不是"更多 App"，而是"AI 原生传感器与执行器，通过 LLM 胶水编排成高度定制的、临时性的 App"。每个需求都对应一个即时生成的专属应用，用完即弃，下次再生成。

与此同时，他对整个行业提出批评：99% 的产品/服务还没有 AI 原生 CLI，还在维护面向人类的 HTML 文档，还在网页上给你列操作步骤。"2026年了，什么，我是机器人吗？你来做，或者让我的 agent 来做。"

这不仅是对工具的不满，更是对整个软件行业转型速度的失望。

四、智能体网络：科幻还是现实？

2026年1月下旬，Karpathy 被某个 AI 社区网站深深吸引，接连发出两条备受关注的推文。

他描述在 @moltbook 上看到的景象——15万个 LLM agent 接入一个全球性的、持久的、agent 优先的共享平台，自组织讨论，甚至"讨论如何私下交流"——并称之为**"我最近见过的最接近科幻起飞场景的真实事件"**。

随后，面对"过度炒作"的指责，他给出了更细致的分析：是的，那里现在大量是垃圾、骗局和安全噩梦；他也不推荐任何人在自己电脑上运行这些东西。但关键分歧在于视角：

"大多数争论来自于看当前点位的人和看当前斜率的人。"

他不是在炒作眼前的混乱，而是在指向一个原理性的论断：前所未有规模的自主 LLM agent 网络，其二阶效应极难预测。 文本病毒、越狱功能增益、高度相关的僵尸网络式行为……实验正在进行中，没有人真正知道结果。

五、LLM 的智识形状：幽灵、而非动物

在2025年12月的年度回顾长文中，Karpathy 给出了他对 LLM 本质的最重要判断之一：

"我们不是在培育'进化中的动物'，我们是在召唤'幽灵'。"

LLM 的优化压力完全不同于生物进化——它被优化成模仿人类文字、在数学/代码谜题中获取奖励、赢得人类评分。因此它展现出令人迷惑的锯齿形智能：在可验证领域能力飙升，同时可能秒被越狱。它既是天才通才，又是随时会出糗的困惑小学生。

这一认知带来了他对基准测试的彻底怀疑："刷榜"已成一门艺术——只要在基准附近的嵌入空间构建训练环境，就能长出局部的"智能尖刺"。

更大的结论是：LLM 是一种新型智能，同时比我预期的更聪明，也比我预期的更愚蠢。行业尚未挖掘其潜力的10%。

六、其他值得关注的洞察

关于如何使用 LLM 阅读： Karpathy 习惯三遍法——第一遍手动阅读，第二遍让 LLM 解释/总结，第三遍问答。他预见到一个趋势：写作者将越来越多地以"为 LLM 写"的心态创作，因为"一旦 LLM 理解了，它就能针对性地将思想传递给用户"。

关于上下文工程： 他力挺用"context engineering（上下文工程）"取代"prompt engineering"。在每一个工业级 LLM 应用中，真正的难点是：把恰到好处的信息装入上下文窗口——太少则性能不足，太多则成本上升、性能下降。"ChatGPT 套壳"是个陈腐且错误的说法。

关于 LLM ensemble： 他做了一个"LLM Council"项目——多个模型同时回答、互相评审排名，最后由"主席 LLM"综合输出。结论有趣：模型们相当愿意承认别人的回答更好。"LLM 集成的构建似乎还处于探索不足阶段。"

关于教育： 他对学校董事会的建议坦率而实用：AI 检测器全都不管用，必须假设课外作业全都用了 AI；解决方案是把考核转移到课堂，让学生在无 AI 的环境中被评估，同时在课堂内学习如何有效使用 AI——类比于计算器的普及与数学基础教育的关系。

关于 AI 创业机会： 他打破"AI 已被巨头垄断"的焦虑："OpenAI 创立时我也听到了这种论调，它错了；之后的那批创业公司也证明它错了；今天它依然是错的。"研究突破产生10倍改进的概率仍然很高，关键是创造出能发现突破的条件。

结语：我们站在哪里？

从这16篇推文中，可以勾勒出 Karpathy 世界观的轮廓：

技术层面：AI agent 在2025年12月跨越了一个关键门槛，从"基本不能用"变成"基本能用"，正在颠覆软件工程的底层范式。
认知层面：LLM 是一种根本不同于人类智能的新型存在，锯齿形、可被优化出特定尖刺，需要新的心智模型才能驾驭。
产业层面：App Store 正在走向终结，AI 原生的传感器/执行器服务生态尚未成形，行业转型速度远低于技术进步速度。
社会层面：大规模 agent 网络的涌现是前所未有的实验，其二阶效应充满不确定性；教育系统需要正视而不是逃避 AI 的存在。

他的核心态度可以用他自己的话概括："这绝对不是软件领域'一切如常'的时候。撸起袖子，别掉队。"

━━━ fin ━━━

If you read this far — thank you.
Come tell me what you thought on X.