本文来自微信公众号: 每日天使 ,作者:每日天使
桑达尔·皮查伊(Sundar Pichai)是谷歌和Alphabet的首席执行官。自2015年出任CEO以来,他带领谷歌完成了从搜索公司到全栈AI公司的转型——TPU、Gemini、Waymo、DeepMind,这些名字背后都有他的决策印迹。
本期播客由Cheeky Pint节目制作,主持人为John和知名投资人Elad Gil。三人围绕谷歌在AI竞赛中的历史与未来展开了长达一小时的深度对话,涵盖:Transformer为什么发明于谷歌却没能第一个产品化?谷歌为什么能从"搜索已死"的悲观叙事中反转?1800亿美元的CapEx如何分配?2026年真正的瓶颈是内存还是芯片?Search的未来是消亡还是进化?以及,皮查伊认为哪一刻让他真正"感受到了AGI"。
这不是一场PR访谈。皮查伊在多个问题上给出了超出外界预期的坦诚——包括承认谷歌曾错失时机、初创公司在AI转型上天然有优势、以及太空数据中心这个听起来离谱的项目为何已经悄悄启动。
访谈实录
一、Transformer往事:谷歌发明的,为何被别人先做成产品?
【John(主持人)】谷歌发明了Transformer,但将其真正产品化的却是ChatGPT这类外部产品。你现在怎么看待这段历史?
【桑达尔】Transformer其实有一点被误解了,值得讲清楚。它的诞生并不是纯粹的学术研究,而是有具体产品目标驱动的——当时团队想解决的是翻译质量问题。同样,TPU的诞生也是被产品逼出来的:语音识别做出来了,突然要卖给二十亿用户,芯片根本不够用,怎么把推理做下去?Transformer一诞生就被直接用进了搜索,BERT和MUM带来了搜索质量的大幅跃升,但外界可能低估了这一点,因为我们衡量搜索质量的方式太专业,不太显眼。
【桑达尔】我们内部也确实在研发类似ChatGPT的产品,叫LaMDA。你可能还记得,曾有一位谷歌工程师认为LaMDA已经有了意识——他其实是在和一个早期版本的ChatGPT对话。我们在I/O大会上发布了AI Test Kitchen,里面跑的就是LaMDA,但我们对它做了很多限制,因为内部测试版本毒性太高,没办法直接推出去。加上谷歌有很强的搜索质量文化,对产品质量的标准要求更高,所以没有第一个出手。但说我们没想到、没做到产品那个方向,这是不准确的。
【John】所以根本原因不是研究和产品之间有鸿沟?
【桑达尔】对,这是一个复合因素导致的结果。OpenAI和微软的合作协议也是在ChatGPT发布前两个月才签的,他们是在感恩节那周悄悄上线的,根本没做大规模宣传,也没预料到会爆。我们在消费互联网行业,突然冒出一个颠覆性产品不奇怪——就像Facebook时代冒出了Instagram,当时他们直接买了。事后来看,也许编程侧的信号我们没能及时捕捉到:GPT-2到GPT-3再到GPT-4的能力跃升,如果你是在用它写代码,感受会比纯语言任务强烈得多。
二、速度哲学:搜索响应时间要精确到毫秒
【John】谷歌一直把速度当作核心差异点——最早的Google搜索会显示响应时间,Chrome比竞争对手快,现在Gemini跑在TPU上也快得出奇。速度究竟是明确的产品策略,还是更复杂的考量?
【桑达尔】我始终把延迟当作一款好产品的核心特征之一。而且延迟优秀几乎总是意味着产品的底层技术做得扎实。当然还有另一种速度——上线速度、迭代节奏、发布周期,这两个都重要。但说到延迟,问题在于你一边要压缩延迟,一边能力前沿又在不断扩展,怎么平衡?这是很复杂的。
【桑达尔】举个例子,搜索团队现在有子团队级别的"延迟预算",精确到毫秒。你节省了3毫秒,就获得1个积分;用了5毫秒的预算,就贡献1.5毫秒给用户。每个团队的预算不同,可能是10毫秒,可能是30毫秒,但都有严格的审查机制。人类对延迟的感知大概从几百毫秒开始,我们在过去五年里把搜索延迟压低了30%,与此同时功能在不断增加。这就是为什么在Gemini里,我们非常重视能力和速度的平衡——Flash模型达到Pro模型约90%的能力,但快很多、服务成本也低很多。
三、搜索的未来:不会消亡,会进化成智能体调度器
【John】AI模式下的搜索、Gemini的融入、Agent流……你怎么看搜索的未来?它是分发渠道、未来产品,还是N种人机交互方式之一?
【桑达尔】我觉得搜索每次面对新的技术转变,都能从中做更多的事情。移动时代,搜索进化得很快——你从纽约地铁钻出来,不是在找网页,是想去某个地方,产品随之改变。向前展望,很多信息检索类的查询都会变成搜索中的智能体任务,你在完成任务,同时有多个线程在并行跑。
【John】搜索十年后还会存在吗?
【桑达尔】它会一直进化。搜索未来可能是一个智能体管理器,你在里面同时推进很多事情。你提的问题核心是:"一行以内的提示词+一堆排序结果"这种产品模式还会存在吗?但你看今天的AI模式搜索,用户就在做深度研究查询了,那已经不符合你说的那个定义了。我觉得不应该把自己困在十年后的蓝图里,因为现在的曲线陡峭到一年内的进展就已经足够惊人了。这是一个扩张性的时代,不是零和博弈——就像TikTok崛起之后YouTube依然活得很好。
四、谷歌的AI反转:投资者误读了什么?
【John】大约一年前,市场对谷歌极度悲观——"搜索已死"、核心商业模式受攻击,股价跌到150美元左右。现在大家都意识到这判断有多可笑。作为当事人,你认为投资者当时误读了什么?
【桑达尔】在那个时刻,我的感受是:公司的建立本来就是为了这个时刻准备的。垂直整合不是意外,是刻意的。我们已经在研发第七代TPU了,2016年的I/O大会上我们就宣布了TPU和AI数据中心,那是2016年。我们当时确实在前沿大模型上落后了,但所有能力都在:研究团队、基础设施团队、各业务平台都有。然后突然发现,有一个共同的技术可以同时加速所有业务——搜索、YouTube、Cloud、Waymo,全都靠AI的进步。这是一种高度杠杆化的进步方式。
【桑达尔】我当时完全没觉得是零和竞争。谷歌会扩大十倍,但仍然有足够空间让其他人做大。亚马逊在谷歌崛起后依然活得很好,Facebook也是。真正让外界看到谷歌回来的,应该是Gemini 2.5——特别是多模态能力上的突破,以及Gemma系列。但前沿竞争极其激烈,每隔一段时间就有人在某个维度超越,我们也在某些地方领先,动态会持续变化。
五、我"感受到AGI"的那一刻
【John】有研究人员说,谷歌团队没有其他几个顶级实验室那么"AGI信仰",你认为这是真的吗?这会影响你们在构建什么?
【桑达尔】这说法我不同意。我们从300亿扩张到1800亿美元CapEx量级,不是不相信这条曲线才做的。我觉得更多是语义问题——谷歌是一家有大量产品触达数十亿用户的公司,说话方式可能不同。你去看DeepMind的Demis、Jeff Dean,以前Ilya、Dario也都在谷歌,他们对AGI的思考深度不比任何人浅。如果你是个更年轻的公司,或者是纯研究实验室,位于旧金山,这些小因素可能让你的语气听起来更"AGI信仰",但底层的技术判断我认为并没有本质差异。
【John】那你有没有"感受到AGI"的时刻?
【桑达尔】最早是2012年,Jeff Dean演示最早版本的Google Brain,神经网络识别出猫的那一刻。然后是DARPA无人车挑战赛,看车自己开。还有Demis演示最早期模型的"想象力"。这些时刻很多。但在今天这个时代,最有感觉的是:你给AI布置一个复杂的编程任务,整个过程没有打开过IDE,你在某种智能体管理器里看着它一步步完成,然后才意识到它在用什么语言写——那种感觉就像魔法。最近我自己做了一个小项目,跑完之后才想起去问它用的什么语言。这种曲线的陡峭程度,让你觉得未来一定有更大的进展。
六、2026年最大的瓶颈:不是芯片,是内存
【John】谷歌今年CapEx是1750亿到1850亿,但就算你想花4000亿也花不出去,因为内存不够、电力不够、连电工都招不到足够的数量。能梳理一下当前的各类瓶颈吗?
【桑达尔】从根本上往上推,要追溯到晶圆产能——这是根本约束。电力和能源相对更可解,但许可审批和监管环境是个制约。美国在这方面需要认真学习中国的建设速度,我们要有一种思维转变:怎么把物理世界的建设速度提高十倍?数据中心禁令之类的阻力可能越来越多,这不是几个人决定加快就能解决的问题。
【桑达尔】内存是当前最关键的瓶颈之一。主要内存厂商没办法在短期内大幅扩张产能,所以这是近期的硬约束,随时间会逐步放松。约束也会逼出创新——我们会让这些系统的效率提升30倍,这些都在同步发生。我会把这比作霍尔木兹海峡:你油价定多高都无所谓,一天从系统里抽走2000万桶石油,就得相应消灭2000万桶的需求。内存也一样,最终有些人就是拿不到他们想要的内存。
【John】这会不会形成模型侧的寡头格局——谁现在有算力,谁就能拉开差距?
【桑达尔】这是一个合理的分析框架。不过有一些有趣的例外,比如Gemma 4——这是我们刚发布的开源模型,在中国以外应该是当前最好的开源模型之一。前沿模型和Gemma 4之间的代差,既大又不那么大。你在谈的是一堆权重文件,能放进一个USB盘——不像SpaceX火箭,你在数据中心跑了好几个月,最后输出的是一个普通文本文件,就像Word文档一样。这种独特属性让我觉得需要不断挑战那些框架,不能直接套用。
七、谷歌的长期赌注:量子、机器人、太空数据中心
【Elad(主持人)】谷歌持有SpaceX、Anthropic的股权,控股Waymo,内部还有TPU、量子计算……还有哪些外界低估的隐藏资产?
【桑达尔】我们正在考虑太空数据中心,目前是一个非常小的团队,就像当年Waymo刚开始时一样。如果你把眼光放到二十年后,大多数数据中心该放在哪里?这是一个极难解决的问题。量子我们在非常坚定地推进,我对它很兴奋。在分子模拟方面,自然界本质上是量子的,所以你最终需要量子系统才能更好地模拟它。经典计算可能能用压缩和抽象的方法逼近,但我直觉上认为量子在模拟天气、模拟现实方面会有优势。技术历史告诉我们,当一个东西真正能用了,人们的创造力会在上面找到你完全没预料到的应用。就像移动电话加上GPS,催生了Uber——做手机的人没有一个预测到这个结果。
【桑达尔】还有机器人。GDM团队在机器人上的投入很深,Gemini Robotics模型在空间推理上是业界最先进的。我们在和Boston Dynamics、Agile等公司合作,方向很坚定。另外,Wing无人机配送服务——在不算遥远的将来,将有4000万美国人能用上Wing的配送服务。还有Isomorphic Labs,专注用AI覆盖药物发现的所有步骤,不只是分子设计,而是从整个流程提升成功率——这是我见过的最聪明的生物医药AI方法论。
八、资本分配哲学:Waymo为什么没被砍掉?
【John】这可能是个典型的金融从业者问题:谷歌的项目极度异质化,YouTube增加推荐算法投入有清晰的ROI模型,Waymo可能要十年后才能大规模商业化,量子计算更是要二十年。你怎么跨项目比较资本配置,做出取舍?
【桑达尔】这是个好问题,我比以往任何时候都更有感触——因为现在TPU的分配让这个问题更加具体了,连Waymo都需要TPU。说实话,我非常期待AI作为辅助工具帮助解决这类问题,一旦把所有数据打通,模型已经有能力做这件事了,只是数据还没完全打通。从历史上看,谷歌的优势之一是在周期很早期就做决策——那个时候投入的初始资金往往很小,但你保持长期承诺,然后跟踪底层技术曲线,而不是财务模型。量子怎么判断?我们看逻辑比特的错误率,看稳定逻辑比特的门槛能不能按时达到,团队能不能实现那些里程碑。
【桑达尔】Waymo是个好例子。两三年前,大部分人对自动驾驶感到悲观,我们反而加码了。我们追踪的是Waymo Driver在安全性和可靠性上的底层曲线,那条曲线一直在向好。有些阶段进展慢,那时候你需要的是对团队能力的信心,相信他们能突破。谷歌历史上确实一直持有较多净现金,回头看Waymo,如果它早几年达到现在的成熟度,我会更早加大投资。但你要做好资本管理,在不确定性大的时候不能无节制地烧。现在AI浪潮给了我们更多高ROIC的部署机会,所以我们在加快节奏。
九、谷歌内部如何分配算力?CEO每周盯计算预算
【John】历史上R&D的主要成本是人。现在TPU成了和人头一样重要的稀缺资源。具体来说,预算流程是怎么运作的?你给一个项目批人头之外,还要批TPU配额吗?
【桑达尔】我们一直有算力预算,但现在这件事变得前所未有地紧迫。我们用TPU也用GPU,ML算力规划已经是一件很精细的事情。现在是,我每周会花一个专门的小时审查这件事,粒度到具体项目和团队。算力是最稀缺的资源,必须确保它流向最值得的地方。
【John】那Google Cloud给外部客户分配算力,和内部项目的需求怎么平衡?
【桑达尔】靠提前规划。Cloud团队做前向规划,内部需求也做前向规划。所有已经签给客户的合约是神圣不可侵犯的。在一个全面受限的环境里,规划能解决大部分问题,但坦白说,Cloud团队也会说他们没有足够的算力。
十、企业AI扩散的真实障碍
【John】模型能力已经很强了,但大公司实际的AI渗透率还很低。我见到的障碍包括:一、Prompt工程需要时间积累;二、公司特定知识的学习曲线;三、AI生成代码的"爆炸半径"大,协作困难;四、数据权限体系需要重建;五、角色定义需要重新思考。这些问题你们怎么在解决?
【桑达尔】你描述的就是Gemini企业版和Google Agentspace团队正在攻克的路线图。我们自己内部使用,撞到同样的墙,然后反馈给产品团队。现在有些团队,比如我们的GDM和软件工程团队,工作流已经转变得很深了——他们住在这个智能体管理器的世界里,在用一种完全新的方式工作。上周我们刚把这套工具铺到搜索团队。
【桑达尔】身份和权限控制是真实的硬问题,我们在认真解决。大公司的变革管理本来就比小公司难,这可能是初创公司在AI原生上真正的优势——他们面试时就可以筛选AI原生思维,不需要做转型培训。我们必须主动推动这个变革。我的判断是:2027年将是很多非工程流程真正开始转变的关键年份。完全由AI自动完成的业务预测,我估计2027年会出现真正的转折点。
十一、那些从小开始的大事:太空数据中心与Post-training新突破
【John】谷歌很多改变世界的事情都是从小项目开始的,比如Transformer。现在谷歌内部有什么让你兴奋的小事情?
【桑达尔】太空数据中心,目前就是几个人、一个小预算,先完成第一个里程碑。我认为即使是大想法,也要从小处着手。这是一个例子。另外,昨天我和一个人聊了很长时间,他在做Post-training的一项改进,是一个人在独立推进,我听完觉得,"哦,这个会在结果上体现出一个漂亮的跳跃。"这就是这个时代的力量——有人随时在某个角落做出让你惊喜的进展。具体内容我还不方便说,但总有一天会发布的。太空数据中心、新的ML技术——这些就是我现在最兴奋的小事。
【John】太好了。Sundar,谢谢你。
【桑达尔】非常愉快,谢谢你们。再见。
