谷歌Gemini项目接连流失核心人才,顶级研究者分别加入OpenAI和Anthropic,推动AI竞争进入拼研究范式的新阶段。 ## 1. 谷歌AI核心人才接连出走暴露深层问题 年初谷歌DeepMind副总裁大卫·西尔弗出走创业,两个月前谷歌创始人布林因Gemini编程落后亲自干预组建突击队,2024年以27亿美元被召回拯救Gemini的核心负责人沙泽尔,离职加入OpenAI。 人才流失暴露谷歌短板:作为AI发明能力顶尖的公司,在成果快速释放与商业化上能力不足,DeepMind与Google Brain合并后,内部人才、组织、文化整合并未完成。 ## 2. 沙泽尔与卡帕西的技术定位差异 沙泽尔是Transformer、T5、稀疏专家混合模型(MoE)路线的核心开拓者,硬研究实力更强,属于大模型架构发明者。 卡帕西早期参与视觉语言对齐研究,有工业界落地经验,擅长科普技术塑造工程文化,公众与工程界影响力更大,属于研究工程文化塑造者。 ## 3. 沙泽尔加盟OpenAI的核心价值 沙泽尔可帮助OpenAI平衡大模型规模、成本与吞吐,利用自身MoE、模型并行等经验解决“做大模型不爆成本”的问题;探索预训练扩展新拐点,用稀疏激活等方法继续扩大模型有效容量;凭借character.ai创业经验助力OpenAI开发人格化交互消费级AI产品;还能直接带入Gemini的训练、架构、工程经验。 ## 4. 卡帕西加盟Anthropic的核心价值 卡帕西可帮助Anthropic提升Claude预训练研究效率,推进用Claude辅助研发下一代模型;将人模型协作的经验系统化,强化Claude在编码、智能体、研究辅助上的能力;补强Anthropic基础模型训练能力,推动其从对齐安全优势向全链路顶级研发升级;凭借顶流影响力吸引更多优秀人才,提升Anthropic行业声誉。 ## 5. AI行业竞争进入新阶段 OpenAI押注下一代模型架构与规模化训练核心能力,Anthropic抢占下一代模型研发方式与AI辅助研究新范式。 2026年前沿AI竞争已经从单纯抢夺算力,正式进入比拼研究范式、拼新架构新方法的阶段。
OpenAI与Anthropic的研究对决升级,会让谷歌再亮红灯吗
2026-06-19 01:24

OpenAI与Anthropic的研究对决升级,会让谷歌再亮红灯吗

本文来自微信公众号: 未尽研究 ,作者:未尽研究


DeepMind的核心人物、工程副总裁、Gemini模型的联合负责人,这几个头衔并不足以说明沙泽尔在AI界的影响力有多么重磅,他是Transformer论文的作者之一,2024年,谷歌花了27亿美元,把他从自己的创业项目character.ai那里拉回来,拯救Gemini大模型。


沙译尔的离开,对于谷歌是一个重大打击。年初谷歌DeepMind副总裁、强化学习的旗手、哈萨比斯最早的创业伙伴西尔弗(David Siver)出走创业;两个月前谷歌创始人布林(Sergi Brin)对Gemini在编程方面落后于Anthropic感到不满,亲自干预,成立了一支突击队来补上短版。Gemini今年以来乏善可陈,这次沙泽尔离开,增加了它的不测,甚至会增加谷歌DeepMind CEO哈萨比斯的不测。


沙泽尔对于Gemini有多重要,甚至流传着一个段子,他只动了几行训练代码,Gemini的质量立竿见影地提升。


沙泽尔的离开暴露了谷歌的老问题:它可能仍是世界上最会产生AI发明的公司之一,却不一定是最能快速释放和商业化这些发明的组织。


沙泽尔回到谷歌不到两年又去了OpenAI,问题可能不只是薪酬,而是顶级研究者对速度、权力、产品方向、组织摩擦、发布节奏,自有其判断。它也令人猜测,当初DeepMind与Google Brain合并之后,可能只是暂时缓解了Gemini大模型追赶OpenAI的问题,但其内部的人才、组织与文化的整合,可能并未告成。


所有往事,皆为序章。接下来OpenAI与Anthropic的对决,将在很大程度上是沙泽尔与卡帕西谁能发出更大的光芒。如果只论对大模型技术路线的硬核底层贡献,沙泽尔的研究硬实力更强;如果论AI文化、工程教育、研究品味、产品化感知和公众影响力,卡帕西影响更大。


沙泽尔是Transformer论文作者之一,这篇论文提出了完全基于注意力的架构,成为后来的GPT、BERT、T5、Gemini、Claude等几乎所有现代大模型的基础。他还是T5论文作者之一;T5把各种自然语言任务统一成text-to-text框架,对后来的指令模型、统一任务接口影响很大。更重要的是,沙泽尔是当下最流行的稀疏专家混合模型(sparse MoE)路线的关键开拓人物:2017年,Sparsely-Gated MoE这篇论文把按样本激活部分专家的条件计算推向实用化;Switch Transformer又把MoE简化到更容易规模化训练,并展示了万亿参数稀疏模型的路径——也基本上是DeepSeek和中国所有开源模型后来的道路。


卡帕西的贡献则更丰富。他早期在斯坦福大学做计算机视觉、多模态图像描述,与李飞飞合作的图像-语言对齐工作,是视觉语言结合的重要早期代表之一。他是OpenAI早期成员,后来在特斯位领导Autopilot视觉团队,把深度学习从研究系统推向真实世界的高风险工程系统。


但卡帕西的特殊影响力还在于他对把复杂技术讲清楚,并建立起工程直觉。他的“AI教育三件套”:如斯坦福计算机视觉课CS231n、“手搓”模型minGPT/nanoGPT、视频公开课Neural Networks:Zero to Hero、还有他发明的流行词如vibe coding等,都让他成为一代工程师理解深度学习和LLM的入口级人物。


沙泽尔更像是架构发明者,而卡帕西则更像研究工程文化的塑造者。谁影响力更大,无法给出一个简单的答案,可以从以下几层来比较:



沙泽尔加盟OpenAI,最可能攻克的几个问题:


第一,下一代基础模型架构与MoE效率。OpenAI需要在更大规模、更低成本、更高吞吐之间找到新平衡。沙泽尔的MoE、提升预训练效率的Switch Transformer、解码更快的multi-query attention、模型并行的Mesh TensorFlow经验,正好可用于解决“把模型做大但不把成本做爆”的问题。


第二,预训练扩展(scaling)的新拐点。当数据、算力、成本都变成瓶颈,单纯稠密scaling越来越贵。沙泽尔的价值在于,他长期思考如何用条件计算、稀疏激活、系统并行,继续扩大模型有效容量。


第三,产品级人格化与长对话体验。不要忘了他还创办了character.ai。OpenAI如果要做更强的个人助理、长期记忆、人格化交互、消费级AI关系产品,沙泽尔也有独特经验。


第四,Gemini的内部知识转移。他刚刚还是Gemini的联合负责人,对Google最新一代模型训练组织、架构选择、工程路线有直接经验。这对OpenAI的战略意义,不只是一个科学家加入,而是一个竞品核心模型负责人加入。


卡帕西去Anthropic,最可能攻克的是另一组问题。


第一,Claude的预训练研究效率。他加入Anthropic的预训练团队,并将参与用Claude加速预训练研究本身。Anthropic现在的重视的竞争力不只是模型本身,而是能否让模型帮助自己做下一代模型研究。


第二,把AI编码/AI研究工作流系统化。卡帕西精通人如何与模型协作写代码、做实验、建立直觉。Anthropic已经在Claude Code、长程智能体、研究辅助上很强,卡帕西加入后,可能会把这种能力进一步内化到模型研发流程里。


第三,补强Anthropic的基础训练气质。Anthropic过去最鲜明的标签是对齐、安全、宪法AI、Claude的产品体验。卡帕西加入预训练团队,说明Anthropic不满足于后训练和产品体验强,而是要在基础模型训练、数据、架构、实验自动化上继续加码。


第四,研究品味与人才吸引力。卡帕西在社交媒体上是AI顶流,能吸引大量优秀工程师和研究者的。他的加入本身就是Anthropic声誉的一部分,说明它不只是安全公司,也正在成为顶级模型研发公司。


OpenAI在用沙泽尔争夺下一代模型架构和规模化训练的核心发动机;Anthropic则用卡帕西去抢占下一代模型研发方式和AI辅助研究范式的研究操作系统。


这两位顶尖研究者的变动,正好说明2026年前沿AI竞争已经从单纯抢算力,进入拼研究的阶段,看谁能建立起模型架构、训练系统和研究方法的新范式。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定