2026-01-13 17:33

一条Karpathy推文引发的开发者九级地震

品玩

本文来自微信公众号：硅星GenAI ，作者：周华香

2025年12月27日，Andrej Karpathy在推特上发了一条长推文。

这不是普通的技术分享，而是一次公开的自我审视——这位前特斯拉Autopilot负责人、OpenAI创始团队成员、无数开发者心中的技术偶像，坦言自己"从未如此强烈地感到落后"。

更关键的是，他说自己"能变得强大10倍"，只要能正确串联起过去一年出现的工具。而无法做到这一点，"感觉就像是技能问题"。

这条推文迅速在技术圈炸开。转发过万，点赞数万。因为它戳中了一个所有开发者都能感受到，但很少有人能清晰表达的现实：

软件工程这个职业，正在被一场"9级地震"彻底重塑。

两周后，知名技术YouTuberTheo（t3.gg创始人、Ping Labs CEO）制作了一期视频回应这条推文。视频标题直白得有些残酷："You're falling behind.It's time to catch up."（你正在落后，是时候追上了）

Theo的核心观点很清晰：Karpathy的感受不是个例，而是整个行业正在经历的集体转型。那些还在观望的人，已经"正式迟到"了。

本文完整编译Theo的这期视频，结合Karpathy推文的核心洞察，为你拆解这场正在发生的革命，以及如何在这场变革中不被淘汰。

永久拐点：游戏规则已经改写

Theo的核心论断简洁有力：软件工程领域已经到达了一个永久性的拐点（permanent inflection point）。

这不是又一次技术迭代，不是从jQuery到React那种级别的变化，而是更根本的东西——开发者这个职业本身正在被重新定义。

他用了一个精准的比喻：这是一场“9级地震”。不是余震，不是小打小闹，而是能够改变地貌的那种巨震。

AI不再是"助手"，而是"伙伴"

过去几年，我们见证了各种AI编程工具的诞生：GitHub Copilot、Tabnine、Codeium……但在Theo看来，那些工具本质上还是"智能补全"——它们能帮你写完一行代码，但你还是那个真正在编程的人。

但现在不一样了。

Theo透露了一个让很多人震惊的数据：在他自己的工作中，以及他运营和顾问的多个团队里，现在70%到90%的代码是AI生成的。

不是辅助生成，不是参考生成，而是直接生成。

对比一下时间线：

2023年：AI能帮你写函数，你需要检查和修改
2024年：AI能帮你写模块，你需要整合和调试
2026年：AI能帮你写整个功能，你需要审查和优化

这个趋势的终点在哪里？Theo认为，可能根本没有终点，只有持续的加速。

"等等看"的窗口期已经关闭

Theo引用了一句很有意思的话：“宁愿迟到也不要太早……但我们现在已经过了那个时间点。”

在2023到2024年，持观望态度是合理的。那时候工具不成熟，成本高昂，可靠性存疑。很多开发者会说：“让子弹飞一会儿，看看这东西到底行不行。”

但到了2026年，这个态度已经变成了负担。

基础模型的能力已经达到生产级别，推理成本每8周减半，工具生态已经成熟到可以直接上手的程度。Cursor、Claude Code、Windsurf这些工具已经不是"试验品"，而是生产力工具。

Theo的判断很直接：现在开始适应AI的人，已经是"officially late"（正式迟到）了。再等下去，就不是迟到的问题，而是会缺席整场比赛。

你的角色正在被"重构"

传统的开发流程是线性的：需求→设计→编码→测试→部署。开发者的核心价值在"编码"那一环——你能多快、多准确地把逻辑转化为代码。

但现在，这个流程正在被解构重组。

Theo用了一个编程术语来形容这种变化：“The role of the programmer is being dramatically refactored.”（程序员的角色正在被彻底重构。）

重构后的角色是什么？不再是"手写代码的工匠"，而是"编排AI Agent的指挥家"。

你需要掌握的不再是语法细节、算法实现、框架特性，而是：

Agents（智能体）：如何设计和使用AI代理
Sub-agents（子智能体）：如何拆解任务给不同的AI
Contexts（上下文管理）：如何给AI提供恰当的信息
Memory（记忆机制）：如何让AI记住项目的历史和决策
Workflows（工作流）：如何编排AI的协作流程
MCP、LSP：新的协议和接口标准

这是一个全新的可编程抽象层。就像从汇编到高级语言是一次抽象层的跃迁，现在我们正在经历从"手写代码"到"编排AI"的又一次跃迁。

来自真实世界的证据：Ramp的Inspect Bot

理论说得再多，不如一个真实的案例来得有说服力。Theo在视频中重点介绍了Ramp公司（一家金融科技独角兽）的内部工具：Inspect Bot。

这个工具的工作流程简单到有些"可怕"：

自动监控：连接到Sentry（错误监控平台），实时扫描生产环境的错误

智能筛选：自动识别出最常见的Top 20错误

自动修复：为每个错误启动一个"子会话"（child session），也就是一个独立的AI Agent

代码提交：AI自主编写修复代码，并提交Pull Request

人工审核：工程师只需要审查PR，决定是否合并

整个流程中，人类只出现在最后一步。

对比一下传统的bug修复流程：

传统：发现bug→分配给工程师→排查问题→编写修复→测试→提交→审核→部署（耗时数小时到数天）
AI流程：发现bug→AI自动修复→人工审核→部署（耗时数分钟）

工程师的角色从"修bug的人"变成了"审核修复方案的人"。

agent.md：你和AI之间的"圣经"

Ramp的工程副总裁Rahul和工程师Nicolas Bevacqua还分享了另一个关键策略：维护agent.md或claude.md文件。

这个策略的核心思想很简单：每当你需要手动修改AI生成的代码时，不要只是改完就算了，而是要：

记录这次修改的原因

提炼成通用规则

更新到agent.md文件中

让AI在未来自动遵循这个规则

Rahul的团队报告说，他们每天会多次更新这些文档。结果是，AI的输出质量持续提升，需要人工干预的情况越来越少。

Theo对此的评价一针见血：“Every manual edit you make is an opportunity foragent.mdimprovement.”（你做的每一次手动编辑，都是改进agent.md的机会。）

这就像是在训练一个学徒，但这个学徒的学习速度是人类的百倍千倍。

定制微调已死，长live提示工程

Theo在视频中宣告了一件很多人可能还没意识到的事：定制微调（custom fine-tuning）已经过时了。

这个判断乍一听很反直觉。过去几年，微调一直被视为让AI适应特定任务的最佳方式。但Theo给出了三个理由：

第一，基础模型进化太快了。微调一个模型需要8周时间，但基础模型每8周就有重大升级。等你的微调版本训练好，新的基础模型已经出来了，而且往往比你的微调版本还要强。这就像你花三个月造了一辆自行车，结果市面上已经开始卖汽车了。

第二，推理成本暴降。2024到2026年，推理成本每8周减半。微调的主要价值之一就是"提高效率降低成本"，但当基础模型的成本已经低到可以忽略时，微调的性价比就消失了。

第三，通用模型更强。Claude 4.5、GPT-4o这些最新的通用模型，在大多数场景下已经超过了定制微调的模型。除非你的场景极其特殊，否则通用模型+好的提示词，效果会更好。

那新的策略是什么？Prompt优化+Agent Docs+工作流编排。这个组合的迭代周期不是"周级"而是"小时级"，你可以快速试错、快速调整、快速改进。

“滑板手视角”：重新看待每一个重复任务

Theo在视频中用了一个绝妙的类比：滑板手看世界的方式。

普通人看到楼梯和扶手，会想：“这是障碍，得小心绕过去。”

滑板手看到楼梯和扶手，会想：“这是机会，可以滑一段。”

AI时代的开发者也应该有这种视角转换。当你看到一个重复性任务时，不应该想"这很烦"，而应该想"这是自动化的机会"。

Slop Code的新价值

过去，有很多小任务我们会直接忽略：

批量重命名文件
生成测试数据
写一次性的数据迁移脚本
自动化某个手动操作

原因很简单：写这个脚本可能要30分钟，但手动做只要10分钟，不划算。

但在AI时代，这个计算彻底改变了。让AI写这个脚本只需要2分钟，而且这个脚本以后可以复用、可以改进、可以分享给团队其他人。

Theo把这类代码叫做"slop code"（马虎代码），但这个词不是贬义，而是指那些过去因为投入产出比不划算而不会被写出来的代码。AI降低了创建成本，让这些"边际项目"变得可行。

他自己就用AI构建了一个1万行代码的资产管理工具，只是为了支持一个小型游戏项目。在传统世界里，这种"投入产出比不划算"的工具根本不会存在。

启示很明确：不要再用"手写代码的成本"去评估是否做某件事，而要用"Prompt的成本"去评估。这会打开无数新的可能性。

五步追赶指南：从"迟到"到"跟上"

理论讲完了，Theo给出了非常具体的行动指南。他把这个过程拆解成五个递进的步骤。

Step 0：立即接入AI代码审查

第一步是最简单、风险最低的：在你的代码库中接入AI驱动的代码审查工具。

推荐的工具包括Graptile和CodeRabbit。这些工具会在PR阶段自动检查代码质量、发现潜在bug、提出优化建议、标注安全隐患。

为什么是Step 0？因为这一步零成本、零风险、立竿见影。你不需要改变任何工作流程，只需要在CI/CD流程里加一个步骤。效果是，在人类审查之前，AI已经帮你过滤掉了90%的低级错误。

Step 1：测试AI的极限

第二步是建立直觉：找一个你过去花了一周时间完成的任务，尝试用AI在几分钟内完成。

不要期待AI完美完成，重点是建立对AI能力边界的直觉。只有知道边界在哪里，你才能有效地编排它。

Theo的建议很直接：“If you’re not at least a little bit uncomfortable,you are not trying hard enough.”（如果你没有感到哪怕一点点不适，说明你还不够努力。）

Step 2：学会阅读AI的思考过程

第三步是理解AI：使用"Plan Mode"（规划模式）观察AI如何推理。

大多数AI编程工具都有这个功能，AI会先分析代码库结构、制定实现计划、拆解成子任务、然后逐步执行。

看这个过程的目的不是学习具体技巧，而是理解AI如何看待代码、如何组织逻辑、在哪里会卡住。这就像看棋手复盘，你不仅要知道结果，还要理解每一步的考量。

Step 3：建立agent.md体系

第四步是积累经验：在你的代码库中创建并维护agent.md或claude.md文件。

这个文件记录了所有项目特定的规则、常见模式、已知问题、最佳实践。每次你手动修改AI代码时，就往这个文件里加一条规则。

效果是指数级的：

第一周：AI准确率从60%提升到75%
第一个月：AI准确率提升到85%
三个月后：AI准确率接近95%

你的工作从"写代码"逐渐变成了"提需求"。

Step 4：学会编排多个Agent

最后一步是终极目标：让多个AI Agent协同工作，像交响乐团一样。

这涉及到Sub-agents（不同Agent负责不同任务）、Context管理（给每个Agent提供恰当的信息）、Memory机制（让Agent记住历史）、Workflow编排（定义协作流程）。

Theo的评价是：“焦点已经从’程序员贡献的代码位’转移到了更高层次的编排：智能体、子智能体、上下文、记忆和工作流。”

这是一个全新的技能树，而且这个技能树还在快速生长。

给管理者的严重警告

Theo在视频中专门用了一段时间，直接对话技术管理者和CTO们。语气罕见地严肃。

他的核心警告是：不要强制员工使用落后的模型。

很多公司出于"成本控制"或"数据安全"的考虑，要求工程师使用公司内部微调的老模型，或者限制使用Claude Opus、GPT-4o等最新模型。

Theo的判断很直接：“Forcing them to use older or inferior internal models will lead to top talent leaving.”（强制他们使用旧的或劣质的内部模型，会导致顶尖人才离职。）

原因很简单：优秀的工程师会意识到，在这家公司，自己的生产力被人为限制了，技能增长速度比市场慢了，正在用落后的工具做落后的事。结果就是人才流失，竞争力下降，形成负向循环。

他还驳斥了一个常见的成本计算谬误。很多管理者会说：“Claude Opus每百万token要$15，我们自己的模型只要$0.5，必须省钱。”

但真实的计算是：一个高级工程师的时薪是$100-200，如果用劣质模型，工程师需要修改50%的AI输出；用最佳模型，工程师只需要修改5%。哪个更省钱？

答案显而易见。推理成本每8周减半，工程师工资每年涨10%。这笔账怎么算都是工具成本可以忽略。

尾声：地震正在发生

Andrej Karpathy说他"从未如此强烈地感到落后"，这听起来像是坏消息。但换个角度看：如果连站在最前沿的人都在全力奔跑，那说明这个领域还远未定型。

机会还在，但窗口正在快速关闭。

就像Theo所说的，现在行动的人已经"正式迟到"了，但迟到总比缺席好。真正危险的不是现在开始，而是继续观望。

2026年，软件工程的规则已经改写。问题不再是"AI能否取代程序员"，而是“会用AI的程序员将取代不会用AI的程序员”。

AI创投日报频道: 前沿科技

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定