本文来自微信公众号: 每日天使 ,作者:每日天使
编者按
这是Google CEO Sundar Pichai在2026年5月IO大会期间接受的一场对话。Interviewer是Matthew Berman,时长虽然只有30分钟,但信息密度极高——从Agent重塑互联网、开源战略的深层博弈到中美AI竞赛,Pichai罕见地给出了非常具体的判断。
特别是关于"为什么不发布大型开源前沿模型"和"如何看待中国开源模型的质量"这两个问题,他的回答既坦率又微妙,值得每一位关注AI产业的人仔细读一读。
导语
Sundar Pichai执掌Google已经十年。这十年里,他见证了搜索帝国向AI帝国转型的全过程。2026年的Google,正站在一个微妙的拐点上:一方面,Gemini系列模型正在以Flash/Pro双轨策略蚕食市场份额;另一方面,来自中国开源模型的压力、AI安全问题的日益严峻、以及对算力的无底洞式需求,都在考验着这家科技巨头的战略定力。
在这场30分钟的对话中,Pichai谈论了Agent如何成为互联网的基础设施层、为什么他选择对开源大模型"有所保留"、中美AI竞赛的真正战场在哪里,以及——非常坦诚地——承认Google的算力根本不够用。
QA正文
一、AI Agent:互联网的新入口
Matthew Berman:你是对互联网未来有着极强洞见的人。现在Agent正在渗透互联网的每一个角落,你觉得Agent会成为大多数人接入互联网的入口吗?
Sundar Pichai:Agent将成为我们工作方式的基础组成部分。用过Agentic工作流的人都知道那种超能力般的感觉。现在最前沿的开发者已经在部署和编排Agent了——比如在anti-gravity里构建操作系统的demo,本质上就是一个Agentic工作流。
但我认为,人们使用Agent和人们直接使用网络并不冲突。当你在娱乐自己、或者在做一些有意义的事情时,你仍然想要亲自参与。买周杂货还是给爱人挑选礼物,这是完全不同的使用场景。Agent应该帮人类处理那些不得不做的苦差事——比如填18个表单去换个驾照——让人类有更多时间去享受互联网带来的快乐和目的感。
Matthew Berman:但把这么大的信任交给Agent来做信息"把关人",我们怎么确保信任对了Agent?Agent会不会错误地决定我们应该看到什么信息?
Sundar Pichai:其实你已经在做类似的事了。Gmail的垃圾邮件过滤器就是一个Agent,它在替你过滤信息。Waymo也是——人们愿意坐在后座让车自己开,是因为我们花了很长时间用数据和运营记录来证明它是安全的。
所以我相信这取决于你交付了多少价值。建立用户信任是一段共同的旅程。这也是为什么我们在Gemini Spark上采取了谨慎的步骤——它底层能力非常强,但我们先从第一方产品(Gmail、日历等)做起,确保用户有控制感和透明感,然后再逐步开放第三方MCP和完整的计算机使用能力。
Matthew Berman:说到信任,我过马路时其实更信任Waymo而不是人类司机。这种感觉几乎是即时的。希望Agent也能给人同样的感觉。
但我也担心,我们和"原始互联网"之间正在增加越来越厚的缓冲层。从浏览器到App,再到Agent,这种抽象层次越来越高。你怎么看?
Sundar Pichai:YouTube就是一个好例子——人们对自己关注和喜爱的创作者有很强的连接感。人是有不同心态的:有时候他们想主动发现内容,购物对很多人来说本身就有乐趣。所以人们不会完全外包这些体验。
对于新闻来说,人们有自己的可信来源。通过Google搜索、YouTube和Agent,我们认为生态系统的价值永远是巨大的,Agent的工作应该是帮助用户连接到这些价值,而不是取代它。你说得对,有时候Agent确实在中间扮演了角色——但这往往是好事,因为它帮用户更快地得到了他们想要的东西。同时,内容创作的工具也在爆炸式增长,人们会创造更多内容。所以最终会找到一个新的平衡。
二、AI网络安全:从Mythos到Code Mender
Matthew Berman:Google一直在思考网络安全,你们有没有看到AI增强的网络攻击在加剧?
Sundar Pichai:我们一直在关注这个前沿。Google在很多安全领域都是先驱——比如零信任架构。因为我们运营着触及数十亿人的产品,所以必须站在前沿。
我们在内部安全团队中已经相当积极地部署了Agentic工作流,用来检测漏洞、生成补丁、验证补丁是否有效、然后部署。过去两年,随着模型能力的提升,我们能检测到的漏洞越来越多了。
Mythos确实是一个转折点——Anthropic造了一个在那个特定任务上非常优秀的模型。但我们要强调今天IO的一个可能被低估的发布:Code Mender。这是我们内部用的产品,它能全天候自动识别漏洞、生成补丁、测试验证并部署。我们还刚刚完成了对Wiz的收购,Wiz在实时监控漏洞方面是最前沿的。Code Mender和Wiz的组合,让我们在内部保持着前沿位置。
Matthew Berman:说到Mythos,Anthropic选择不公开发布。OpenAI则选择发布了GPT-5.5的网络安全版本。你觉得哪种做法更合适?
Sundar Pichai:这取决于模型能力。如果它没有从根本上改变现有的能力边界,那么公开发布是可以的。但在安全领域,有很成熟的惯例——比如Google的Project Zero,我们的团队找到漏洞后会通知厂商,给90天时间来修复,然后才公开承认。
所以如果你突然拥有了某种会从根本上改变前沿的东西,我认为和政府密切合作、以负责任的方式处理是合理的。这和网络安全行业的做法一致。当然,同时也要确保足够多的人能接触到它,以便修复自己的系统。这两者需要并行。
Matthew Berman:所以没有一个固定的阈值,而是要看每个模型相对当前前沿的跳跃幅度?
Sundar Pichai:对。你引入的下一个模型是1%-2%的改进,还是20%的跳跃?这就是判断的依据。
三、开源战略:为什么Google不放大型前沿模型?
Matthew Berman:Google和英伟达几乎是目前唯一真正有开源模型战略的公司。但你们的Gemma模型是小型、面向边缘设备的。为什么不发布一个大型开源前沿模型?
Sundar Pichai:Google从骨子里是开源的支持者。我们建立在一堆开源系统之上,我个人参与过Chromium和Android,还有Kubernetes——Google为开源世界做出了很多重大贡献。
在AI领域,我们一直在迭代Gemma模型。Gemma 4的最新发布非常好。但你看,达到前沿需要巨大的投入——看看我们的资本开支就知道了。你投入了大量研发资金来产生增量的前沿模型,这个过程中你也在发现新技术。我们都需要对此保持清醒。
但我们也致力于确保有一个开源生态能够发展。所以我们采取的是平衡策略。
Matthew Berman:但一家Google规模的公司,如果有能力同时做大型闭源和大型开源,为什么不两者都做?大多数美国创业公司也会面临同样的问题——开源在美国有可行的商业模式吗?
Sundar Pichai:我们不仅做开源——我们大量投资Flash和Flash-Lite模型的原因之一,就是提供更多选择。这些模型也是真正的"工作马"。
关于开源商业模式——你看,现在有很多非常好的开源模型,尤其是来自中国的,很多创业公司在采用。技术发展有周期性:有时候前沿推进太快,开源可能跟不上;有时候技术曲线放缓,开源就能实现飞跃。很难完全预测。但我预期会有一个强大的开源生态持续存在,我们肯定会在其中扮演角色,也希望其他人也能加入。
四、中国开源模型与美国AI的选择
Matthew Berman:说到中国,他们一直在发布令人难以置信的开源模型。如果我是一个企业CEO,看到DeepSeek以极低成本提供了接近前沿的性能,我为什么不用中国的开源AI?选择美国AI的理由是什么?
Sundar Pichai:说到底,企业是在解决问题。他们需要一个完整的解决方案。如果你在做客服系统,你需要可预测性、可靠性、一致性、安全性。企业在优化很多因素。
这给开源模型和闭源模型都留出了空间。会有服务商在开源模型周围构建生态系统,这很有道理。也会有人选择闭源模型。这是一个开放市场,人们有大量选择。
如果模型是开源的,并且有合适的许可证,我认为来源地不那么重要。开源意味着有一个社区在负责和关心它——如果出了问题,不会没人注意到。这本身就创造了一个信任基础。
我其实更担心的是:美国是否做了足够多的事情来确保我们站在前沿?这才是我思考问题的方式。
Matthew Berman:但也有一种观点说,如果我们持续构建在中国开源模型之上,他们就会针对自己的芯片优化模型,最终我们会建立在对另一个国家技术的依赖上。这种担忧有道理吗?
Sundar Pichai:AI的基础逻辑是——因为模型变化太快了,你构建应用的方式必须是能够随时替换底层模型的。模式生态系统变化非常剧烈,所以你必须保持足够的动态适应能力。现在下定论还为时过早。
五、Flash vs Pro:为什么要做"工作马"模型?
Matthew Berman:我一直很喜欢观察前沿实验室的模型策略。Anthropic和OpenAI几乎只专注于绝对前沿,而Google在冲前沿的同时也非常强调"工作马"级别的Flash模型。为什么这是战略核心?
Sundar Pichai:我们的使命宣言里有一句话——让技术"普遍可及且有用"。我们一直深度关注如何让最重要的技术尽可能广泛地扩散。我们非常兴奋于推动效率,确保最好的模型能以最快、最便宜的方式运行。
我们必须为搜索做到这一点,因为我们要把它提供给数十亿人。我们想把它放进Gemini,也想给开发者用。这个策略已经取得了巨大成功。尤其是3.5 Flash——我在Keynote上也提到了——我听到很多CIO在担心公司AI预算爆表。这种焦虑是真的,而且随着时间推移只会更严重。
在一个Agentic工作流中,模型需要被反复调用很多次,拥有一个能力强但快速高效的模型至关重要。即使在token效率方面,Flash的成本效益也非常突出。我们在内部也在混合使用Pro和Flash。大多数公司都应该学会这样使用。
Matthew Berman:你是不是在暗示,如果通向AGI的路径是递归自我改进的AI,那么谁先到达谁就赢了,其他都不重要?
Sundar Pichai:首先,这项技术伴随着巨大的责任。我们所有人都需要谨慎,不惜一切代价避免"竞态条件"。我们欠人类的是负责任地部署这项技术。
你说的对,现在确实有这么一个时刻——曲线非常陡峭,你在曲线上哪个位置很重要。但几个月前我们发布3.0的时候,大家都说"我们遥遥领先,没人能追上"。而在前沿实验室之间,竞争非常激烈,我们各有长短,预训练发布周期也不一样,高峰不会同时出现。所有这些因素造成了认知差距,且每四到六周就会发生剧烈变化。
确实只有少数几个实验室处于真正的前沿,后面有很大的差距。递归自我改善的场景可能会出现。但如果它出现了,我们就必须比今天更加负责任地处理——这和网络安全领域的情况没有区别。AI越先进,就越应该是一个社会层面的对话,而不是单家公司的对话。
六、算力瓶颈:Google也供不应求
Matthew Berman:所有模型策略最终都落到算力上。Google同时在给自己的产品、数十亿用户、API客户和竞争对手提供推理服务,还在卖TPU。我听说Google的收入实际上是被算力限制的。现在Google的算力状况如何?
Sundar Pichai:我们确实在过去几年做出了大胆的算力投资决策。但即便如此,没有人坐在这个位子上会说"我们当初该少投一点"。我们正处在一个特别的时刻——成本也在上涨,给定预算能买到的算力比之前计划的要少,因为内存价格等等都在涨。
我们在云计算方面可以独立于内部需求做长期规划。这很好。但一部分挑战是——当你在Google Cloud支持客户时,客户看到anti-gravity上3.5 Flash以800 token/秒运行的demo,就会问"我们能拿到那个吗?"所以你还得去满足客户的需求。这不是一个简单的平衡。
Matthew Berman:所以你们的算力需求确实远超供给?
Sundar Pichai:绝对如此。这就是为什么我们更加重视3.5 Flash。我们能不能做一个更好的全模态模型?可以。但怎么做才能让尽可能多的人用上它?所以你在不断做取舍——包括要不要做一个更大的Ultra级模型来提升能力前沿,但那又意味着只有很少的人能用上。每个公司都在做这种取舍,有时候事后你会觉得"也许当时应该做不同的选择"。
Matthew Berman:现在Google的算力瓶颈到底是什么?土地?政治意愿?
Sundar Pichai:瓶颈的定义就是——你解决了一个,另一个就会冒出来。在不同时间点上,你会遇到:物理上建设和审批数据中心的能力、这些中心需要的电力、然后是系统的核心组件——它们全都是瓶颈。你需要所有这些同时到位才能生产出一块芯片。
现在有几个平行的瓶颈同时存在。如果所有人都认定内存是瓶颈,明天你可能又发现其实不是内存,是别的东西。但可以确定的是,目前整个技术栈的各个层面都存在系统性瓶颈。
视频链接:https://www.youtube.com/watch?v=IB7IW6zX-H0
