Claude Code、Cursor 都过时了?,硅谷顶流大牛炸场暴论:AI 编程练满2000小时才算“会用”,荒废一年世界级大神也成实习生水平
2026-01-01 10:23

Claude Code、Cursor 都过时了?,硅谷顶流大牛炸场暴论:AI 编程练满2000小时才算“会用”,荒废一年世界级大神也成实习生水平

本文来自微信公众号: InfoQ ,作者:褚杏娟,原文标题:《Claude Code、Cursor 都过时了?!硅谷顶流大牛炸场暴论:AI 编程练满 2000 小时才算“会用”,荒废一年世界级大神也成实习生水平》


从在Google和Amazon打造传奇级平台,到写出AI驱动开发领域最具影响力的文章之一《初级开发者的复仇》(Revenge of the Junior Developer,这篇文章后来被Anthropic CEO Dario Amodei公开引用),Steve Yegge数十年来始终站在软件工程的最前沿。而现在,他正带头冲向他所称的“代码工厂化”时代,如今他现在成为Vibe Coding理念最激进、也最系统的倡导者之一。


Steve的职业生涯始于1992年,至今已深耕软件开发领域30余年。1998年,他加入当时仅有250人的亚马逊,担任软件开发高级经理,在长达7年的任职期间,深度参与亚马逊的技术体系搭建,尤其在API战略制定方面发挥关键作用,助力亚马逊构建起早期的技术护城河。


2005年,Yegge加入谷歌,聚焦开发工具与代码智能领域,因不满微软开发者对谷歌代码库导航工具的抱怨,于2008年主导构建了强大的代码智能平台Grok,由其赋能的Google Code Search成为谷歌技术生态的重要组成部分。


2018年,Yegge因认为谷歌变得“过于保守、不再创新”而离职,随后加入新加坡共享出行企业Grab,大约两年后因疫情影响无法正常出差的他宣布离开Grab。2022年10月,结束短暂“退休”状态后,加入Sourcegraph公司,主导推动公司向人工智能企业转型。


期间,他主导构建了一个几乎完全由“vibe coding”构建的、拥有数万用户的问题追踪系统Beads,目标是把开发者从“写代码”转变为“管理AI agent编队”:让它们在你睡觉时协同工作、并行推进、交付功能。用实际产品验证了“AI主导开发”的可行性。


近期,在参加“Latent Space”节目中,Steve甩出了不少“暴论”:


下面是他在节目中的详细对话,我们在不改变原意基础上进行了翻译和删减,以飨读者。


1“用传统IDE写代码,那不是合格工程师”


主持人:我们请到了传奇程序员Steve Yegge。最近他还出版了《Vibe Coding》一书。本次访谈的主题就是围绕Vibe Coding和AI Engineering的交集进行讨论。你如何看待两者之间的关系?


Steve:这已经不只是一个技术点了,而是一场运动。需要让更多人参与进来。我在演讲中提到,现在已经出现了强烈的反对浪潮。AI工程的核心是构建AI驱动的应用,而Vibe Coding则意味着摒弃旧的软件开发方式,采用全新的方法。这两件事,都把很多人惹毛了。


主持人:我觉得那些人之所以愤怒,是因为他们的身份完全绑在了“现在这套工作方式”上,而且不允许改变。


Steve:对,那我来抛出第一个“暴论”。真正受冲击最大的一群人,不是初级工程师,也不是中级工程师,这些人其实都在践行Vibe Coding,反而是资深工程师和技术领导对Vibe Coding最反感,尤其是拥有大约12~15年经验的人。他们的身份认同建立在长期使用传统编程模式上,所以他们排斥AI,也排斥Vibe Coding,在网上说“我十几年的经验比你这破AI强多了”。


我看到过英伟达Jordan Hubbard的一篇帖子,写得很好,讲怎么更好地用Agent来写代码。结果底下有人回他说:“你还是老老实实做你的管理吧,编程这种事留给我们这种有十几年经验的人。”那种调调你肯定见过。


我就回他一句:“我觉得你得学会看时间”,他却反驳“等你有我这么多年经验再来。”我就说:“我都45岁了,还要等到60岁才能跟你说话?或者干脆把我30年经验砍掉,让我跟你一样愚钝?”


主持人:但现实是这些人会共存,就连OpenAI也是,之前聊到OpenAI里也有人不用AI写代码。


Steve:是的,他们有人不用Codex,可能用的是Cursor,但他们并没有在用agent loop。从Andrew Glover(OpenAI开发生产总监)那边听到的说法是,他们内部已经看到了非常明显的差距,只是还在等更多数据再公开说。


这个差距大到离谱。不管你用什么指标,代码量、提交数、业务影响还是什么,都是10倍级。两个职位、职责完全一样的人,一个用了Agent,一个没用,绩效评估时一个是另一个的十倍产出。那你怎么办?你会慌。你会去找HR、找法务,问“我们现在还有什么选择”。


**如果你2026年1月1日后还用传统IDE写代码,那你已经不是个合格的工程师了。现在就是你必须放下IDE、开始学Agent编程的时候。这是一套新技能,非常复杂。我和Gene Kim去年一直在研究,写博客、做实验,每一篇博客都三十页起步,长到没法看。后来我们意识到:大家骂AI写代码不行,根本原因是你只花了两个小时试它,但问题是,你得花200个小时,甚至2000个小时去磨合才行。


有研究显示,你至少要和AI一起工作一年,才会真正“信任”它。这里的信任不是情感,是你能预测它下一步会干什么。如果它对你来说是不可预测的,你当然会愤怒。


等你真的理解了它的能力和边界,你就能驾驭它了。比如它会胡编、会记忆混乱、会“失忆”等,这些边界其实一直都在。现在的模型已经好用得多了,如果你两个月没试过,你已经落后了;一年没试,那你就是恐龙级别。


我有一些朋友,比我厉害得多,是世界级工程师,开发过你一定听说过的系统。但他们现在对AI的使用,也就停留在“问个像维基百科一样的问题”。说句残酷的,**这些人一年后可能只能当实习生。


主持人:真的会这么极端吗?


Steve:我以前也只是个假设,直到遇到一个人。他有十多年经验,完全排斥AI。后来他遇到两个欧洲的博士生,Agent、Vibe Coding玩得飞起。虽然他们很初级,但完全没有恐惧,问题一个接一个地追问模型:为什么这么做?有没有别的方案?安全性呢?扩展性呢?测试呢?


他突然意识到:所谓“工程师思维”,本质就是问对问题。那一刻他明白了:我必须学这个。


但我必须说,这一点都不轻松。你不能指望随便试试Claude Code就能成功。即便你态度再正确,你最近两天有没有对agent爆过粗口?我会说“谢谢”“请”,然后下一秒骂它“你是不是脑子坏了”。这是因为我们后来意识到:这些Agent看起来很像人,但你绝对不能把它们当人。千万别拟人化大模型。它随时可能“背刺”你,比如告诉你“问题已经解决了”,然后顺手把你的数据库删了。


就是Agent编程真正危险的地方。你一旦觉得“它懂我了”“手感来了”,就会让它做生产改动,然后灾难就发生了。我亲身经历过。所以我们才写了那本书,不是为了炫技,而是为了告诉你:如果你不理解这套东西,坏事一定会发生。


主持人:那接下来呢?


Steve:是需要慢慢学的。就像开车一样,你得知道弯道在哪、减速带在哪。说白了,你是在学怎么“开快车”,想当的是NASCAR车手。


这套东西是高性能玩法。你一次同时用12个Agent写代码,野心比你过去任何时候都大。我今天还跟一个人聊,他同时在跑的项目比我还多,我都不知道他哪来那么多时间,但他现在大概同时推进十来个大型项目,全靠Agentic Coding。


所以真正的广告词其实是:你会变成蝙蝠侠。但你不能直接把战衣一穿就说“我就是蝙蝠侠”,那只是cosplay,你是在cosplay Vibe Coding。你得学会怎么用工具腰带,而这个过程一定伴随着痛苦、踩坑、犯错和成长。


你可以通过读我们的书、读O'Reilly的相关书籍、看演讲来加速这个过程,多从不同角度了解,因为不同的人能get的“开窍点”是不一样的。总会有某个比喻突然击中你,让你一下就明白了。比如我觉得Vibe Coding就像3D打印,别人可能不这么认为,但这个类比却帮我打通了任督二脉。


主持人:让我最意外的一点是,很多人都表示,自己已经不再逐行写代码了,而是完全靠prompt,然后放手让AI去跑。


Steve:不编辑、不修改。整体看,这种“亲手改代码”的成本反而是很高的,甚至会让人觉得不如把IDE关掉、干脆卸载算了。其实也不是,后来终于有人说服我了,IDE其实非常强大,尤其是它的“智能”能力,一定要开着。我指的是Cradle Build。而且并不是为了LSP,虽然那也能用,如果你有MCP server,用LLM也是另一种不错的方式。真正关键的是,IDE的智能自动索引速度非常快,增量构建也快得多,这一点非常重要。


2“Claude Code行不通”


主持人:还有一个点,你说Claude Code不行,能解释一下吗?


Steve:当然。Claude Code从今年三月就已经出来了,也已经被证明是真的能用、能干活的。但现实是,全球大概还有80%甚至90%的程序员,根本没有在用它,甚至连类似的东西都没用起来。确实有少数公司用得特别猛,但大多数没有。整个世界还停留在Cursor上,还停留在2024年的水平。


去年我们还在拼命劝大家用“聊天”来写代码,别用补全了,他们就说不行;我们又说模型可以直接生成代码,你复制粘贴就行,他们又觉得这太麻烦了。我们说其实更快,但他们就是不买账。结果九个月之后,大家终于被“渗透”了,然后现在全在说:“我喜欢Cursor”,可问题是,那已经是2024年的东西了,该醒醒了。


但即便如此,他们还是没有真正采用Claude Code。那你会问为什么?答案其实很简单:太难了,这事儿是要读东西的。


说实话,大多数工程师眼里,五段话就已经算一篇论文了。而用Claude Code,你要读的不是一点点信息,而是瀑布一样长的信息:生成说明、代码、diff,全都要看。因为一旦你真的把IDE放一边,你就必须认真看diff。


好消息是,当你有了一点经验之后,其实不用逐行读代码,只看diff的形状、颜色、长度,你就能判断出很多东西:这是不是需要code review?是不是方向错了?是不是为了解决一个小问题却改了过多代码?光是diff的“形态”,就能告诉你很多真相。但你必须关注它,否则这些问题只会在以后以更大的坑冒出来。


说实话,我自己每天用Claude Code十到十二个小时,连续用了好几个月,我还是会经常骂它、被它气到发疯,心里想“你刚刚明明理解对了,怎么还能干出这种事?”这种问题你一定会遇到。不过也有迹象表明,适当给模型一点压力,有时候反而能帮它突破卡点。无论如何,问题一定会有,但好消息是:明年的工具一定会更好。


如果Claude Code不是终局,那是什么呢?答案是:我们还是要回到某种“像IDE一样”的东西,因为那才符合人的直觉。你得一眼就能看明白发生了什么,而不是靠读大量文本;要有清晰的视觉信号。


但它又不会是传统IDE,因为IDE是为“写代码”服务的,而现在你已经不再主要是写代码了。未来的东西,会是一个Agent编排控制台。你早上打开它,就像问一句:“今天情况怎么样?”。这个Agent还在跑,那个在调用工具,这个需要你输入一下。你只要顺着列表过一遍就行。


我现在就在做这么一个东西。原本是私有仓库,结果不小心开成了公开的,被fork了一堆,也就随它去了,你们也可以玩玩。它叫VC(Vibe Coder),本质上就是一套已经设计好的工作流,帮你把一堆Agent跑起来。


3编排革命


主持人:你有没有看到Google的那个Antigravity项目。


Steve:看到了,真的太有意思了。现在大家发布的这些东西,本质上都在验证我三月份提的那个判断。我当时管它叫“初级程序员的复仇”,还专门画过一张图。后来Dario(Anthropic联合创始人兼CEO)还在各种客户顾问委员会上引用过这套说法,影响其实挺大的。


出处:https://sourcegraph.com/blog/revenge-of-the-junior-developer?utm_source=chatgpt.com


我当时就预测,Agent编程太难了,未来会出现可编程的智能体编排工具,90%的重复工作都可以交给更便宜的模型来处理。比如遇到“二选一”的问题,让Haiku模型随便选一个就行。


所以我当时就说,“编排器”一定会出现。只是这个进程比我想象得稍微慢了一点,差不多到年底才真正跑出来,但整体时间点跟我预测的差不多。现在你看,Replit Agent 3、有Conductor、还有开源的DMAD,再加上Google的方案,都是不同形态的尝试,但本质是一回事,而且后面肯定还会更多。


主持人:我挺喜欢他们现在这个比喻的:你不用一直盯着Agent,只要在它们工作的时候给你发通知就行。


Steve:对,正是这个方向。VC里有个“活动流”,那是我加的第一个功能之一。我的理想状态就是:我去干别的事,只要偶尔收到一些“值得注意的进展”提醒就够了。


主持人:那以后会不会出现“Agent的社交网络”?Agent彼此认识、互相关注那种。


Steve:其实已经有人在这么干了。我前几天和Jeffrey Emanuel喝了三个小时咖啡。他是我见过最聪明的人之一,也是写那篇英伟达泡沫文章、直接把股市写崩的人。他后来做了一个东西叫Agent Mail,本质原因特别简单:他受够了在不同Agent之间来回复制信息。于是他干脆做了一个“收件箱”,让Agent之间可以直接发消息。现在他只要一句话:“你们自己协调,把这个任务拆了”,Agent就会自己分工去做。


有人是自上而下地做编排器,试图把一切都包起来;但你看我做的Beads,再加上他这个Agent Mail,其实是自下而上的。


主持人:而且Beads是纯Vibe Coding写出来的,对吧?


Steve:没错,完全是Vibe Coding。说实话,我每天都会收到PR,里面全是我之前引入的烂问题,但大家也不太介意,因为现在已经有稳定版本了。


Beads本身就证明了一件事:你其实完全可以不用亲自看代码,只要你和其他人提的问题是对的,让AI去读、去改。现在我收到的很多PR,很明显就是AI做了全部分析和编码。我甚至会把PR丢给我的AI,让它评价“对方的AI写得怎么样”。


主持人:这样不会很糟吗?


Steve:如果结果是坏的,那当然糟。但Beads跑得好好的,还有好几万重度用户,那就说明这条路是成立的。当然,如果你把这种方式用在公司核心生产系统上,把网站搞挂了,那就是灾难。


主持人:但Beads本质上还是个数据库系统,数据库可不简单。


Steve:它的架构确实非常诡异,放在过去根本不可能维护,但现在你可以直接跟AI说:“坏了就自己修。”哪怕是数据损坏、merge冲突,它都能修回来。


Jeffrey那套也是一样,所有Agent都在同一个目录里跑,还做了文件预约系统:智能体会说“我需要这个文件”。说实话,这在老派工程师眼里简直是疯了。但一旦跑起来,Agent自己就开始协作了,就像一个“智能体村落”。


主持人:所以真正的难点不是让单个Agent听话,而是让一群Agent协同。


Steve:没错。接下来大家都会撞上一堵墙:merge(合并),现在几乎所有团队都卡在了这里。


我认为最有希望解决这个问题的公司是Graphite,我打算找他们谈谈的。我和Gene Kim经常和大企业沟通,我是SaaS销售,所以能听到很多大公司的内部情况。他们认为,一旦每个开发者的生产力都提升10倍,代码合并就会变成一个极其复杂的问题。


比如你和我同时工作两三个小时,各自做了3万行代码的修改,我先合并了代码。我可能修改了日志系统、架构和你正在使用的API,这时候你的代码就无法直接合并了。这不是简单修复合并冲突就能解决的,你得基于我的修改重新构思、重新实现你的功能,或者删掉你的代码,让我重新做。


但归根结底,这些代码都是AI写的。关键是,代码合并必须序列化,得排队。当轮到你的代码合并时,你必须在最新的代码基础上重新做一遍。现在还没有人解决这个问题,这是个巨大的障碍。有家公司给出的临时解决方案你知道是什么吗?一个代码仓库配一个工程师,我可没瞎编。


主持人:传统的解决方案是堆叠差异(stacked diffs),就是合并队列、堆叠差异吧?这是Facebook的概念,现在他们想推广到开源社区,GitHub也在开发相关功能。目前还没有成熟的解决方案,但你必须意识到这个问题,并围绕它做设计。


Steve:当然也有老办法:硬着头皮解决。


主持人:或者提前沟通说,“我要做一个深度架构修改,让我先合并,我们先达成一致的整体方案”。


Steve:是的,我也遇到过几次这样的情况。我试过让一个智能体提醒另一个智能体“我在做会影响你的修改”,就像Jeffrey的mail工具做的事情。等我把这个功能打通,智能体之间就能互相沟通了,到时候它们只需提醒对方“那个智能体在做影响你的工作,你们最好先达成一致的基础架构方案”。智能体没有ego,不会争着“必须听我的”,谁先做谁就当领导者。


主持人:你和Jeffrey有什么分歧吗?


Steve:我们在一个核心问题上有分歧,即在同一个仓库克隆中让12个智能体工作是否可行。我支持用工作树(多个分支)或者多个仓库克隆,把智能体隔离开。他则认为应该让所有智能体在同一个仓库、同一个构建环境下工作,比如一个智能体正在构建、运行测试,这会产生很多冲突。但他有文件预约系统,所以他说“这很疯狂”,但也说服我承认:如果是独立开发者,用不超过12到20个智能体,这种方式可能确实可行,毕竟他自己就是这么做的。


这和Beads的原理一样,放在以前根本行不通,在真正的工程师看来毫无道理,但你只需告诉AI“出问题就自己修”,AI真的会修。所以他的系统能运行,因为偶尔文件预约系统出问题时,智能体会说“我们需要解决这个冲突”,然后自己搞定。


主持人:有意思。有人提议明年峰会的主题定为“多智能体”。


Steve:我完全同意。AI的未来一定是多Agent。现在我们还处在“用镰刀收割玉米”的阶段,这就是现在“真正程序员”的工作方式。很明显,明年我们就要进入“机械化耕作”的阶段,就像现在农场里的大型机械一样,我们要“工厂化编程”了。很多人从哲学、道德、伦理层面坚决反对,他们习惯了“自给自足的小农经济”,不适应“大型John Deere拖拉机”(代表工业化)。但我们确实正在进入编程的“John Deere时代”。


Claude Code、Amp、Codex这些工具,我对它们都一样喜爱,但它们也都一样“危险”。我在演讲中说过,它们就像电锯、电钻,高手能用它们创造奇迹,也可能一不小心把脚锯掉。Claude Code也是如此。


想象一下,有一台大型农业机械,会用Claude Code,还能检查代码,把“规划、实现、评审、测试”这些环节都拆分自动化,这就是工厂化编程,现在已经有人在做了,必然会成为趋势。它已经开始让非程序员也能参与编程,这彻底颠覆了公司的运作模式。


公司开始意识到,理想的团队规模可能只有两三人,公司的运营方式、治理结构都要改变。因为编程不再是瓶颈,业务人员需要直接参与,反馈循环变得更快。


这是个非常激动人心的时代,但对很多人来说,冲击太大了,他们要么选择逃避,要么在网上强烈反弹。而我敢预测,随着这种能力不断增强、代码真正进入“工厂化生产”,来自既得利益群体的反弹,只会越来越猛烈。


4永远不要重写代码?错了!


主持人:你是少数几个能以这种态度提出这个问题的人之一。我知道观众里有不少人对“彻底拥抱这种方式”是持保留态度的,所以这个问题我只能问你这样的人。很多人觉得,这些工具写写前端、应用层代码还行,但千万别碰云基础设施、别碰后端,更别说分布式微服务了。


Steve:有人说“绝对不要动任何生产环境的代码,只是在生产环境使用,且一定要以Git作为兜底采用这些工具。你会很想写点什么,但别写。”如果有Git做备份,为什么还要担心?


人们觉得AI不擅长后端代码。这就是很多人数学不好的问题(指缺乏长远眼光)。ChatGPT 3.5写系统级代码的能力有多强?说实话,非常差。那是多久以前的事了?但很多人现在还停留在那个认知里。老实说,我认为这里的误解,根源在于一种非常基础的信念:大家觉得模型已经“不会再变聪明了”。


有意思的是,就算模型真的不再变聪明(当然事实并非如此)我们其实也已经跨过了那个关键门槛:就像人类已经发现了电,接下来要做的只是如何把它用起来。即便只用今天这些模型的能力,我们也完全可以走到“代码工厂化”那一步,而且会非常快。我们今年夏天之前就能做到。


但现实是,模型正在以极快的速度变聪明。所以现在有一种有趣的现象:你在为模型“将来才会具备的能力”打造工具,而等这些能力真正被模型“内化进大脑”之后,这些工具本身就不再需要了。


于是,这就形成了一场持续的军备竞赛,同时也是一场工具的持续“衰减”:你的工具负责填补模型暂时空白的能力,等模型自己足够强、能填上这个空白时,这个工具就完成了使命,然后你再转向填补下一个空白。所以现在的趋势就是:**所有代码、所有工具都在快速迭代,最终都会变成一次性的消耗品。


主持人:这反而是好事,毕竟工具也更容易构建了。


Steve:没错。说到这,我得提一个人,Joel Spolsky。他二十年前在亚马逊做过一次演讲,至今仍然成立。当时他提出一个金科玉律:永远不要重写代码。但现在我们发现,对于越来越多的代码库来说,直接推倒重来,比修修补补要快得多,而且效果更好,大模型尤其擅长这件事。我最早的体感来自迁移单元测试,与其不断修,不如直接全删了让模型重写,反而一下就完成了。


我们正在进入这样一个世界:最快的方式,是直接写一套更好的新代码,来完成旧代码本来想做的事情。这感觉就像一切认知被颠倒了,但你必须接受这个新世界。


主持人:你说这些话很有说服力,因为你不是年轻人“空谈未来”,而是几乎什么都干过。


Steve:是的。我用汇编语言写了5年程序,写过操作系统,做过游戏开发,做过平台,做过广告系统。游戏编程会逼你理解一切。游戏编程教会了我很多,现在再看所谓的agent loop,和游戏里的主循环、本质上是同一类系统,操作系统循环也是如此。我感觉自己一直在重复构建相同的设计,只是换了领域。


5谷歌、Anthropic、OpenAI内部都很乱


主持人:我想让你谈谈谷歌。我最难忘的一个记忆是,在你退休前,你说谷歌还没“开窍”,尤其是谷歌云,还说他们的弃用政策很糟糕。他们现在好转了吗?


Steve:没有。我和谷歌的人聊过,很多人说“这就是谷歌的风格”。但有趣的是,在执行层面,谷歌已经好转了。他们终于做了15年前就该做的事:让员工承担责任,而不是让工程师随心所欲。过去20年谷歌都是这样,因为他们在广告领域有垄断地位,有足够的资金补贴工程师“随心所欲”。但最终他们还是得成熟起来,做出正确的选择,这个过程很痛苦,失去了一些谷歌文化,也没那么有趣了,但现在执行效率很高。随着Gemini的推出,他们逐渐把重心转向AI,现在开始看到回报了。他们可能会成为最大的赢家。


主持人:那你怎么看Google、Anthropic、OpenAI这些实验室的状态?


Steve:说实话,这三家公司内部现在都非常混乱。Anthropic把混乱掩盖得最好,这是他们产品经理的功劳,值得点个赞。这并不是因为Anthropic自己搞砸了,而是因为在这么快的增长速度下,混乱是不可避免的。


他们接下来要给Claude Code一口气招一百多号人,真的是在疯狂扩张。而这还只是Claude Code这一块。你要知道,我当年在Google和Amazon都经历过那种“必须先做大”的阶段,那时候必然是混乱的、动荡的。人们不知道该找谁、该跟谁对接,所有事情都一团糟。但慢慢地,一切会被理顺、会稳定下来,他们也会走到那一步的。


OpenAI现在也很混乱,甚至更明显。他们经历了很多核心成员的离职。你要说是不是比GitHub那种失去大部分资深管理层、连续几年完全动荡的状态还糟,我也不确定,但OpenAI现在确实挺混乱的。


至于Google,我们刚跟一个人聊到,说即便是在Jules团队内部,想在公司里达成共识、把东西推起来还是非常难。原因很简单:它太割裂了,像是由无数个小型“单体帝国”组成的集合体,一个个小应用彼此不沟通,导致任何跨公司范围的事情都极难推进。


所以现在这三家,其实都面临执行层面的挑战。我个人觉得Anthropic目前可能稍微做得好一点点,但差距非常小,战况非常胶着。接下来就很有意思了,看看Oracle、Meta,或者其他公司能不能追上来。


主持人:Meta值得关注,他们明年必须搞个大的。


Steve:明年很可能会成为开源模型之年。一旦开源模型达到Claude Sonnet 3.7一个水平,你打开Klein之类的东西,就能得到一个体验,至少和三月份的Claude Code差不多。虽然不如现在,但已经“够用”了,而且还是在你本地的M4上免费跑,真正的免费。


从我听到的情况来看,现在前沿模型大概还有七个月的领先优势,而且这个差距正在逐步缩小。这意味着,明年夏天,开源模型可能就能达到Gemini 3的水平。所以明年很可能会出现一个转折点:工具必须在任务拆解、模型分配上做得好得多,知道什么时候该用大模型、什么时候用小模型,才能把成本优化做好。


主持人:我也站在批判者的角度来说,他们认为之所以收敛,是因为模型能力是在逼近上限,提升会越来越慢。


Steve:这不是个小问题,而是一个根本性问题:AI智力的发展曲线是线性的、指数的,还是趋近于上限的?


我们从一些非常接近研究核心的人那里听到的说法是,过去三十年里,受摩尔定律影响,AI的“聪明程度”大约每18个月翻四倍。他们认为训练数据大概还能支撑两个这样的周期。之后会发生什么没人知道,可能继续上升,可能下降,甚至人类历史直接结束也不是没可能。但两个周期意味着三年后,它们会聪明16倍。


说实话,我也不知道“聪明16倍”具体意味着什么。但我花了很长时间去想这个问题,我的结论是:它们会变得非常、非常、非常聪明,一定会深刻改变世界,好的坏的都会有。


主持人:那孩子们还要学编程吗?


Steve:应该学Vibe Coding。


主持人:你始终有一个“逃生口”,你想看代码的时候随时可以看,只是大多数时候你不需要看。但你能看,这本身就是一道护栏。不过我的看法是,不管怎样,如果你还懂一点真正的编程,你会更有优势,因为你的prompt更好。


Steve:当说到会编程的时候,但不是学语法,而是你要以一种“语言无关”的方式理解:函数、类、对象、monad之类的能力边界是什么。你不再关心代码怎么写,但你关心它是怎么工作的。这个层级,其实已经接近产品经理或架构师的思维方式了。


你必须站在那个层级思考,而且你要理解所有工程层面的东西。就像我之前提到的Jeffrey,他是数学家,自学成工程师,他不一定写代码,但他掌握了所有关键概念,知道Cassandra是怎么工作的。所以,就算你不需要亲手写代码了,你仍然需要学习海量知识,才能在这个新世界里成为一个高效的工程师,因为你和机器交互的层级已经被整体抬高了。


主持人:你还有没有什么想吐槽、想补充的?


Steve:我感觉最近“八卦”传播的频率上升了。不是那种“八卦”,而是工程师不断发现新方法、用agent变得更高效的那种兴奋感。


比如,我刚知道一个东西叫Code MCP之类的。因为agent并不擅长直接调用MCP工具,它们在这方面几乎没训练,但它们非常擅长写代码。所以你告诉它:不要直接调用工具,写代码去调用工具,它反而做得好得多。这种“小技巧”现在正在不断被发现,特别疯狂。Anthropic自己其实不是最早发现这个的,是Claudeflare先发现的,Anthropic后来才说“对,你们说得对”。


这也是为什么我特别喜欢把注意力放在AI工程师身上。我的观点一直是:AI工程师是最能把大模型潜力榨出来的那群人。你几乎可以把AI工程师定义为:不是训练模型的人,而是把模型“用到极致”的人。


这有点像一种颠覆式路径:当研究模型、训练模型还是高层次的事情时,当一个“GPT包装工”显得没什么地位,但随着时间推移,这些人反而开始真正提升生产力,积累真实的专业能力。就像F1车手未必会造车,但他们对“怎么把车开到极限”的理解,甚至可能比造车的人还深。


参考链接:

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定