一条Karpathy推文引发的开发者九级地震
2026-01-13 17:33

一条Karpathy推文引发的开发者九级地震

本文来自微信公众号: 硅星GenAI ,作者:周华香


2025年12月27日,Andrej Karpathy在推特上发了一条长推文。


这不是普通的技术分享,而是一次公开的自我审视——这位前特斯拉Autopilot负责人、OpenAI创始团队成员、无数开发者心中的技术偶像,坦言自己"从未如此强烈地感到落后"。


更关键的是,他说自己"能变得强大10倍",只要能正确串联起过去一年出现的工具。而无法做到这一点,"感觉就像是技能问题"。


这条推文迅速在技术圈炸开。转发过万,点赞数万。因为它戳中了一个所有开发者都能感受到,但很少有人能清晰表达的现实:


软件工程这个职业,正在被一场"9级地震"彻底重塑。


两周后,知名技术YouTuberTheo(t3.gg创始人、Ping Labs CEO)制作了一期视频回应这条推文。视频标题直白得有些残酷:"You're falling behind.It's time to catch up."(你正在落后,是时候追上了)


Theo的核心观点很清晰:Karpathy的感受不是个例,而是整个行业正在经历的集体转型。那些还在观望的人,已经"正式迟到"了。


本文完整编译Theo的这期视频,结合Karpathy推文的核心洞察,为你拆解这场正在发生的革命,以及如何在这场变革中不被淘汰。


永久拐点:游戏规则已经改写


Theo的核心论断简洁有力:软件工程领域已经到达了一个永久性的拐点(permanent inflection point)。


这不是又一次技术迭代,不是从jQuery到React那种级别的变化,而是更根本的东西——开发者这个职业本身正在被重新定义。


他用了一个精准的比喻:这是一场“9级地震”。不是余震,不是小打小闹,而是能够改变地貌的那种巨震。


AI不再是"助手",而是"伙伴"


过去几年,我们见证了各种AI编程工具的诞生:GitHub Copilot、Tabnine、Codeium……但在Theo看来,那些工具本质上还是"智能补全"——它们能帮你写完一行代码,但你还是那个真正在编程的人。


但现在不一样了。


Theo透露了一个让很多人震惊的数据:在他自己的工作中,以及他运营和顾问的多个团队里,现在70%到90%的代码是AI生成的。


不是辅助生成,不是参考生成,而是直接生成。


对比一下时间线:


  • 2023年:AI能帮你写函数,你需要检查和修改


  • 2024年:AI能帮你写模块,你需要整合和调试


  • 2026年:AI能帮你写整个功能,你需要审查和优化


这个趋势的终点在哪里?Theo认为,可能根本没有终点,只有持续的加速。


"等等看"的窗口期已经关闭


Theo引用了一句很有意思的话:“宁愿迟到也不要太早……但我们现在已经过了那个时间点。”


在2023到2024年,持观望态度是合理的。那时候工具不成熟,成本高昂,可靠性存疑。很多开发者会说:“让子弹飞一会儿,看看这东西到底行不行。”


但到了2026年,这个态度已经变成了负担。


基础模型的能力已经达到生产级别,推理成本每8周减半,工具生态已经成熟到可以直接上手的程度。Cursor、Claude Code、Windsurf这些工具已经不是"试验品",而是生产力工具。


Theo的判断很直接:现在开始适应AI的人,已经是"officially late"(正式迟到)了。再等下去,就不是迟到的问题,而是会缺席整场比赛。


你的角色正在被"重构"


传统的开发流程是线性的:需求→设计→编码→测试→部署。开发者的核心价值在"编码"那一环——你能多快、多准确地把逻辑转化为代码。


但现在,这个流程正在被解构重组。


Theo用了一个编程术语来形容这种变化:“The role of the programmer is being dramatically refactored.”(程序员的角色正在被彻底重构。)


重构后的角色是什么?不再是"手写代码的工匠",而是"编排AI Agent的指挥家"。


你需要掌握的不再是语法细节、算法实现、框架特性,而是:


  • Agents(智能体):如何设计和使用AI代理


  • Sub-agents(子智能体):如何拆解任务给不同的AI


  • Contexts(上下文管理):如何给AI提供恰当的信息


  • Memory(记忆机制):如何让AI记住项目的历史和决策


  • Workflows(工作流):如何编排AI的协作流程


  • MCP、LSP:新的协议和接口标准


这是一个全新的可编程抽象层。就像从汇编到高级语言是一次抽象层的跃迁,现在我们正在经历从"手写代码"到"编排AI"的又一次跃迁。


来自真实世界的证据:Ramp的Inspect Bot


理论说得再多,不如一个真实的案例来得有说服力。Theo在视频中重点介绍了Ramp公司(一家金融科技独角兽)的内部工具:Inspect Bot。


这个工具的工作流程简单到有些"可怕":


  • 自动监控:连接到Sentry(错误监控平台),实时扫描生产环境的错误


  • 智能筛选:自动识别出最常见的Top 20错误


  • 自动修复:为每个错误启动一个"子会话"(child session),也就是一个独立的AI Agent


  • 代码提交:AI自主编写修复代码,并提交Pull Request


  • 人工审核:工程师只需要审查PR,决定是否合并


  • 整个流程中,人类只出现在最后一步。


    对比一下传统的bug修复流程:


    • 传统:发现bug→分配给工程师→排查问题→编写修复→测试→提交→审核→部署(耗时数小时到数天)


    • AI流程:发现bug→AI自动修复→人工审核→部署(耗时数分钟)


    工程师的角色从"修bug的人"变成了"审核修复方案的人"。


    agent.md:你和AI之间的"圣经"


    Ramp的工程副总裁Rahul和工程师Nicolas Bevacqua还分享了另一个关键策略:维护agent.md或claude.md文件。


    这个策略的核心思想很简单:每当你需要手动修改AI生成的代码时,不要只是改完就算了,而是要:


  • 记录这次修改的原因


  • 提炼成通用规则


  • 更新到agent.md文件中


  • 让AI在未来自动遵循这个规则


  • Rahul的团队报告说,他们每天会多次更新这些文档。结果是,AI的输出质量持续提升,需要人工干预的情况越来越少。


    Theo对此的评价一针见血:“Every manual edit you make is an opportunity foragent.mdimprovement.”(你做的每一次手动编辑,都是改进agent.md的机会。)


    这就像是在训练一个学徒,但这个学徒的学习速度是人类的百倍千倍。


    定制微调已死,长live提示工程


    Theo在视频中宣告了一件很多人可能还没意识到的事:定制微调(custom fine-tuning)已经过时了。


    这个判断乍一听很反直觉。过去几年,微调一直被视为让AI适应特定任务的最佳方式。但Theo给出了三个理由:


    第一,基础模型进化太快了。微调一个模型需要8周时间,但基础模型每8周就有重大升级。等你的微调版本训练好,新的基础模型已经出来了,而且往往比你的微调版本还要强。这就像你花三个月造了一辆自行车,结果市面上已经开始卖汽车了。


    第二,推理成本暴降。2024到2026年,推理成本每8周减半。微调的主要价值之一就是"提高效率降低成本",但当基础模型的成本已经低到可以忽略时,微调的性价比就消失了。


    第三,通用模型更强。Claude 4.5、GPT-4o这些最新的通用模型,在大多数场景下已经超过了定制微调的模型。除非你的场景极其特殊,否则通用模型+好的提示词,效果会更好。


    那新的策略是什么?Prompt优化+Agent Docs+工作流编排。这个组合的迭代周期不是"周级"而是"小时级",你可以快速试错、快速调整、快速改进。


    “滑板手视角”:重新看待每一个重复任务


    Theo在视频中用了一个绝妙的类比:滑板手看世界的方式。


    普通人看到楼梯和扶手,会想:“这是障碍,得小心绕过去。”


    滑板手看到楼梯和扶手,会想:“这是机会,可以滑一段。”


    AI时代的开发者也应该有这种视角转换。当你看到一个重复性任务时,不应该想"这很烦",而应该想"这是自动化的机会"。


    Slop Code的新价值


    过去,有很多小任务我们会直接忽略:


    • 批量重命名文件


    • 生成测试数据


    • 写一次性的数据迁移脚本


    • 自动化某个手动操作


    原因很简单:写这个脚本可能要30分钟,但手动做只要10分钟,不划算。


    但在AI时代,这个计算彻底改变了。让AI写这个脚本只需要2分钟,而且这个脚本以后可以复用、可以改进、可以分享给团队其他人。


    Theo把这类代码叫做"slop code"(马虎代码),但这个词不是贬义,而是指那些过去因为投入产出比不划算而不会被写出来的代码。AI降低了创建成本,让这些"边际项目"变得可行。


    他自己就用AI构建了一个1万行代码的资产管理工具,只是为了支持一个小型游戏项目。在传统世界里,这种"投入产出比不划算"的工具根本不会存在。


    启示很明确:不要再用"手写代码的成本"去评估是否做某件事,而要用"Prompt的成本"去评估。这会打开无数新的可能性。


    五步追赶指南:从"迟到"到"跟上"


    理论讲完了,Theo给出了非常具体的行动指南。他把这个过程拆解成五个递进的步骤。


    Step 0:立即接入AI代码审查


    第一步是最简单、风险最低的:在你的代码库中接入AI驱动的代码审查工具。


    推荐的工具包括Graptile和CodeRabbit。这些工具会在PR阶段自动检查代码质量、发现潜在bug、提出优化建议、标注安全隐患。


    为什么是Step 0?因为这一步零成本、零风险、立竿见影。你不需要改变任何工作流程,只需要在CI/CD流程里加一个步骤。效果是,在人类审查之前,AI已经帮你过滤掉了90%的低级错误。


    Step 1:测试AI的极限


    第二步是建立直觉:找一个你过去花了一周时间完成的任务,尝试用AI在几分钟内完成。


    不要期待AI完美完成,重点是建立对AI能力边界的直觉。只有知道边界在哪里,你才能有效地编排它。


    Theo的建议很直接:“If you’re not at least a little bit uncomfortable,you are not trying hard enough.”(如果你没有感到哪怕一点点不适,说明你还不够努力。)


    Step 2:学会阅读AI的思考过程


    第三步是理解AI:使用"Plan Mode"(规划模式)观察AI如何推理。


    大多数AI编程工具都有这个功能,AI会先分析代码库结构、制定实现计划、拆解成子任务、然后逐步执行。


    看这个过程的目的不是学习具体技巧,而是理解AI如何看待代码、如何组织逻辑、在哪里会卡住。这就像看棋手复盘,你不仅要知道结果,还要理解每一步的考量。


    Step 3:建立agent.md体系


    第四步是积累经验:在你的代码库中创建并维护agent.md或claude.md文件。


    这个文件记录了所有项目特定的规则、常见模式、已知问题、最佳实践。每次你手动修改AI代码时,就往这个文件里加一条规则。


    效果是指数级的:


    • 第一周:AI准确率从60%提升到75%


    • 第一个月:AI准确率提升到85%


    • 三个月后:AI准确率接近95%


    你的工作从"写代码"逐渐变成了"提需求"。


    Step 4:学会编排多个Agent


    最后一步是终极目标:让多个AI Agent协同工作,像交响乐团一样。


    这涉及到Sub-agents(不同Agent负责不同任务)、Context管理(给每个Agent提供恰当的信息)、Memory机制(让Agent记住历史)、Workflow编排(定义协作流程)。


    Theo的评价是:“焦点已经从’程序员贡献的代码位’转移到了更高层次的编排:智能体、子智能体、上下文、记忆和工作流。”


    这是一个全新的技能树,而且这个技能树还在快速生长。


    给管理者的严重警告


    Theo在视频中专门用了一段时间,直接对话技术管理者和CTO们。语气罕见地严肃。


    他的核心警告是:不要强制员工使用落后的模型。


    很多公司出于"成本控制"或"数据安全"的考虑,要求工程师使用公司内部微调的老模型,或者限制使用Claude Opus、GPT-4o等最新模型。


    Theo的判断很直接:“Forcing them to use older or inferior internal models will lead to top talent leaving.”(强制他们使用旧的或劣质的内部模型,会导致顶尖人才离职。)


    原因很简单:优秀的工程师会意识到,在这家公司,自己的生产力被人为限制了,技能增长速度比市场慢了,正在用落后的工具做落后的事。结果就是人才流失,竞争力下降,形成负向循环。


    他还驳斥了一个常见的成本计算谬误。很多管理者会说:“Claude Opus每百万token要$15,我们自己的模型只要$0.5,必须省钱。”


    但真实的计算是:一个高级工程师的时薪是$100-200,如果用劣质模型,工程师需要修改50%的AI输出;用最佳模型,工程师只需要修改5%。哪个更省钱?


    答案显而易见。推理成本每8周减半,工程师工资每年涨10%。这笔账怎么算都是工具成本可以忽略。


    尾声:地震正在发生


    Andrej Karpathy说他"从未如此强烈地感到落后",这听起来像是坏消息。但换个角度看:如果连站在最前沿的人都在全力奔跑,那说明这个领域还远未定型。


    机会还在,但窗口正在快速关闭。


    就像Theo所说的,现在行动的人已经"正式迟到"了,但迟到总比缺席好。真正危险的不是现在开始,而是继续观望。


    2026年,软件工程的规则已经改写。问题不再是"AI能否取代程序员",而是“会用AI的程序员将取代不会用AI的程序员”。

    AI创投日报频道: 前沿科技
    本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
    如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
    正在改变与想要改变世界的人,都在 虎嗅APP
    赞赏
    关闭赞赏 开启赞赏

    支持一下   修改

    确定