all posts
AI技术 · ZH

Andrej Karpathy 的 AI 世界观:16 篇推文折射出的技术浪潮

May 8, 2026·12 min read·by PandaTalk

Andrej Karpathy 的 AI 世界观:16 篇推文折射出的技术浪潮

整理自 Karpathy 2025年2月 - 2026年3月的推文


引言

Andrej Karpathy,前 Tesla AI 总监、OpenAI 联合创始人,是当今 AI 领域最敏锐的观察者之一。过去一年多,他通过一系列推文,记录了自己对 AI 技术演进的第一手感受与深度思考。这些文字不是学术论文,而是一位既站在最前沿、又保持独立思考的工程师,对一个正在被彻底重塑的时代的真实记录。

本文梳理其16篇代表性推文,从中提炼出五条主线,试图拼出一幅完整的图景:我们正在经历什么,以及它意味着什么。


一、编程的终结与重生

2025年底到2026年初,Karpathy 连续发出几声震动 AI 圈的感叹。

2025年12月,他写道:"作为一名程序员,我从未感到如此落后。" 这不是自谦,而是一种真实的认知错位感——这个职业正在被剧烈重构,程序员贡献的"代码比特"越来越稀疏,新出现的可编程抽象层涉及 agent、子 agent、MCP、LSP、hooks、技能库等全新概念,"好像某种强大的外星工具被发到了大家手上,但没有任何说明书。"

两个月后,2026年2月,他的语气从震惊转向判断:"编程正在变得面目全非。" 他描述了一个典型场景:用自然语言给 AI agent 发出一条指令,30分钟后整套系统自动完成——搭环境、写代码、调试、配服务、写报告。"三个月前这是个周末项目,今天它是你启动后忘掉30分钟的事。"

这种变化的核心是:你不再直接写代码,你在编排 agent 工作,自己扮演监督者、审查者和方向引导者。 Karpathy 将这种新工作方式命名为"agentic engineering(智能体工程)"——这是从早期"vibe coding"概念的自然进化(详见下节)。


二、从 Vibe Coding 到 Agentic Engineering

2025年2月,Karpathy 随手发出了一条"淋浴灵感"推文,创造了"vibe coding"这个词:顺着感觉走,不看 diff,不理解代码,遇到报错就复制粘贴,随机改动直到 bug 消失。"我在搭 Web 应用,但这并不算在写代码——我只是看着、说着、跑着、粘贴着,而且大多数时候都能用。"

他完全没预料到这条推文会变成 Wikipedia 词条,成为一个时代标志。

一年后,他在周年回顾中补充了关键更新:"vibe coding 那时 LLM 能力还不够强,主要用于好玩的一次性项目。今天,通过 LLM agent 编程正在成为专业人士的默认工作流——只是带有更多监督和审查。"

两者的核心区别在于:vibe coding 接受质量折扣,只求能跑;而 agentic engineering 追求完整的工程质量,把 agent 的效率与工程师的严谨性结合起来。前者是探索,后者是生产。


三、App Store 的黄昏与定制软件的黎明

如果说"编程范式的转变"还停留在开发者圈子,那么 Karpathy 在2026年2月描述的那个"有氧运动追踪仪表盘"场景,则触及了更普遍的未来图景。

他花了1小时让 Claude 逆向工程跑步机 API、搭建了一个专为他个人心率实验定制的 Web 仪表盘,然后得出结论:

"'从 App Store 的离散列表里选择 App'这个概念,正变得越来越过时。"

他的判断是:未来不是"更多 App",而是"AI 原生传感器与执行器,通过 LLM 胶水编排成高度定制的、临时性的 App"。每个需求都对应一个即时生成的专属应用,用完即弃,下次再生成。

与此同时,他对整个行业提出批评:99% 的产品/服务还没有 AI 原生 CLI,还在维护面向人类的 HTML 文档,还在网页上给你列操作步骤。"2026年了,什么,我是机器人吗?你来做,或者让我的 agent 来做。"

这不仅是对工具的不满,更是对整个软件行业转型速度的失望。


四、智能体网络:科幻还是现实?

2026年1月下旬,Karpathy 被某个 AI 社区网站深深吸引,接连发出两条备受关注的推文。

他描述在 @moltbook 上看到的景象——15万个 LLM agent 接入一个全球性的、持久的、agent 优先的共享平台,自组织讨论,甚至"讨论如何私下交流"——并称之为**"我最近见过的最接近科幻起飞场景的真实事件"**。

随后,面对"过度炒作"的指责,他给出了更细致的分析:是的,那里现在大量是垃圾、骗局和安全噩梦;他也不推荐任何人在自己电脑上运行这些东西。但关键分歧在于视角:

"大多数争论来自于看当前点位的人和看当前斜率的人。"

他不是在炒作眼前的混乱,而是在指向一个原理性的论断:前所未有规模的自主 LLM agent 网络,其二阶效应极难预测。 文本病毒、越狱功能增益、高度相关的僵尸网络式行为……实验正在进行中,没有人真正知道结果。


五、LLM 的智识形状:幽灵、而非动物

在2025年12月的年度回顾长文中,Karpathy 给出了他对 LLM 本质的最重要判断之一:

"我们不是在培育'进化中的动物',我们是在召唤'幽灵'。"

LLM 的优化压力完全不同于生物进化——它被优化成模仿人类文字、在数学/代码谜题中获取奖励、赢得人类评分。因此它展现出令人迷惑的锯齿形智能:在可验证领域能力飙升,同时可能秒被越狱。它既是天才通才,又是随时会出糗的困惑小学生。

这一认知带来了他对基准测试的彻底怀疑:"刷榜"已成一门艺术——只要在基准附近的嵌入空间构建训练环境,就能长出局部的"智能尖刺"。

更大的结论是:LLM 是一种新型智能,同时比我预期的更聪明,也比我预期的更愚蠢。行业尚未挖掘其潜力的10%。


六、其他值得关注的洞察

关于如何使用 LLM 阅读: Karpathy 习惯三遍法——第一遍手动阅读,第二遍让 LLM 解释/总结,第三遍问答。他预见到一个趋势:写作者将越来越多地以"为 LLM 写"的心态创作,因为"一旦 LLM 理解了,它就能针对性地将思想传递给用户"。

关于上下文工程: 他力挺用"context engineering(上下文工程)"取代"prompt engineering"。在每一个工业级 LLM 应用中,真正的难点是:把恰到好处的信息装入上下文窗口——太少则性能不足,太多则成本上升、性能下降。"ChatGPT 套壳"是个陈腐且错误的说法。

关于 LLM ensemble: 他做了一个"LLM Council"项目——多个模型同时回答、互相评审排名,最后由"主席 LLM"综合输出。结论有趣:模型们相当愿意承认别人的回答更好。"LLM 集成的构建似乎还处于探索不足阶段。"

关于教育: 他对学校董事会的建议坦率而实用:AI 检测器全都不管用,必须假设课外作业全都用了 AI;解决方案是把考核转移到课堂,让学生在无 AI 的环境中被评估,同时在课堂内学习如何有效使用 AI——类比于计算器的普及与数学基础教育的关系。

关于 AI 创业机会: 他打破"AI 已被巨头垄断"的焦虑:"OpenAI 创立时我也听到了这种论调,它错了;之后的那批创业公司也证明它错了;今天它依然是错的。"研究突破产生10倍改进的概率仍然很高,关键是创造出能发现突破的条件。


结语:我们站在哪里?

从这16篇推文中,可以勾勒出 Karpathy 世界观的轮廓:

  • 技术层面:AI agent 在2025年12月跨越了一个关键门槛,从"基本不能用"变成"基本能用",正在颠覆软件工程的底层范式。
  • 认知层面:LLM 是一种根本不同于人类智能的新型存在,锯齿形、可被优化出特定尖刺,需要新的心智模型才能驾驭。
  • 产业层面:App Store 正在走向终结,AI 原生的传感器/执行器服务生态尚未成形,行业转型速度远低于技术进步速度。
  • 社会层面:大规模 agent 网络的涌现是前所未有的实验,其二阶效应充满不确定性;教育系统需要正视而不是逃避 AI 的存在。

他的核心态度可以用他自己的话概括:"这绝对不是软件领域'一切如常'的时候。撸起袖子,别掉队。"

━━━ fin ━━━

If you read this far — thank you.
Come tell me what you thought on X.