本文整理自Google CEO皮查伊2026年IO大会对话，涵盖AI产业核心判断，披露了Google当前面临的算力等真实挑战。 ## 1. AI Agent重塑互联网结构，不会完全取代原生互联网体验 - AI Agent会成为基础工作组成部分，帮人类处理繁琐事务，但不会成为互联网的唯一入口，人们仍会主动参与娱乐、购物等体验。 - 信任建立是渐进过程，Google先在Gmail、日历等第一方产品部署Gemini Spark，再逐步开放第三方能力，最终会形成新的功能平衡。 ## 2. AI网络安全需要分级应对，能力跳跃越大越要保守发布 - Google已在内部部署AI Agent工作流自动检测修复漏洞，本次大会发布的Code Mender结合收购的Wiz，可实现漏洞全流程自动化处理。 - 安全模型发布没有固定阈值：如果只是1%-2%的能力改进可公开发布，若带来20%以上的能力突破，需先和政府合作负责任处理，同时保障足够开放供行业修复系统。 ## 3. AI开源与产业竞争，Google选择平衡策略 - Google本身是开源的重要贡献者，当前选择「前沿闭源+中小开源Gemma」的平衡策略，因为前沿大模型研发投入极高，需要兼顾商业投入与生态发展。 - 针对中国低成本高性能开源模型，皮查伊认为合规开源模型的来源不重要，开源社区本身会建立信任；美国更该关注自身能否保持AI前沿优势，企业应用层需要保持底层模型的动态替换能力。 ## 4. Google双轨模型策略与算力现状 - Google采用「前沿Pro+高效Flash」双轨策略，核心是践行「普遍可及」的使命，3.5 Flash具备极高的token成本效益，能缓解企业AI预算焦虑，适配Agent多轮调用的场景。 - 皮查伊明确承认Google当前对算力的需求远超供给，整个技术栈从数据中心建设审批、电力到核心芯片组件都存在系统性瓶颈，大模型迭代中需要持续做能力覆盖范围的取舍。 - 当前全球AI前沿竞争剧烈，每4-6周格局就会剧烈变化，需要避免不计成本的AGI竞逐，负责任发展才是核心原则。

2026-06-01 21:09

Google CEO Sundar Pichai：模型迭代太快了，我们对算力的需求远超供给，AI Agent将接管互联网底层

每日天使

本文来自微信公众号：每日天使，作者：每日天使

编者按

这是Google CEO Sundar Pichai在2026年5月IO大会期间接受的一场对话。Interviewer是Matthew Berman，时长虽然只有30分钟，但信息密度极高——从Agent重塑互联网、开源战略的深层博弈到中美AI竞赛，Pichai罕见地给出了非常具体的判断。

特别是关于"为什么不发布大型开源前沿模型"和"如何看待中国开源模型的质量"这两个问题，他的回答既坦率又微妙，值得每一位关注AI产业的人仔细读一读。

导语

Sundar Pichai执掌Google已经十年。这十年里，他见证了搜索帝国向AI帝国转型的全过程。2026年的Google，正站在一个微妙的拐点上：一方面，Gemini系列模型正在以Flash/Pro双轨策略蚕食市场份额；另一方面，来自中国开源模型的压力、AI安全问题的日益严峻、以及对算力的无底洞式需求，都在考验着这家科技巨头的战略定力。

在这场30分钟的对话中，Pichai谈论了Agent如何成为互联网的基础设施层、为什么他选择对开源大模型"有所保留"、中美AI竞赛的真正战场在哪里，以及——非常坦诚地——承认Google的算力根本不够用。

QA正文

一、AI Agent：互联网的新入口

Matthew Berman：你是对互联网未来有着极强洞见的人。现在Agent正在渗透互联网的每一个角落，你觉得Agent会成为大多数人接入互联网的入口吗？

Sundar Pichai：Agent将成为我们工作方式的基础组成部分。用过Agentic工作流的人都知道那种超能力般的感觉。现在最前沿的开发者已经在部署和编排Agent了——比如在anti-gravity里构建操作系统的demo，本质上就是一个Agentic工作流。

但我认为，人们使用Agent和人们直接使用网络并不冲突。当你在娱乐自己、或者在做一些有意义的事情时，你仍然想要亲自参与。买周杂货还是给爱人挑选礼物，这是完全不同的使用场景。Agent应该帮人类处理那些不得不做的苦差事——比如填18个表单去换个驾照——让人类有更多时间去享受互联网带来的快乐和目的感。

Matthew Berman：但把这么大的信任交给Agent来做信息"把关人"，我们怎么确保信任对了Agent？Agent会不会错误地决定我们应该看到什么信息？

Sundar Pichai：其实你已经在做类似的事了。Gmail的垃圾邮件过滤器就是一个Agent，它在替你过滤信息。Waymo也是——人们愿意坐在后座让车自己开，是因为我们花了很长时间用数据和运营记录来证明它是安全的。

所以我相信这取决于你交付了多少价值。建立用户信任是一段共同的旅程。这也是为什么我们在Gemini Spark上采取了谨慎的步骤——它底层能力非常强，但我们先从第一方产品（Gmail、日历等）做起，确保用户有控制感和透明感，然后再逐步开放第三方MCP和完整的计算机使用能力。

Matthew Berman：说到信任，我过马路时其实更信任Waymo而不是人类司机。这种感觉几乎是即时的。希望Agent也能给人同样的感觉。

但我也担心，我们和"原始互联网"之间正在增加越来越厚的缓冲层。从浏览器到App，再到Agent，这种抽象层次越来越高。你怎么看？

Sundar Pichai：YouTube就是一个好例子——人们对自己关注和喜爱的创作者有很强的连接感。人是有不同心态的：有时候他们想主动发现内容，购物对很多人来说本身就有乐趣。所以人们不会完全外包这些体验。

对于新闻来说，人们有自己的可信来源。通过Google搜索、YouTube和Agent，我们认为生态系统的价值永远是巨大的，Agent的工作应该是帮助用户连接到这些价值，而不是取代它。你说得对，有时候Agent确实在中间扮演了角色——但这往往是好事，因为它帮用户更快地得到了他们想要的东西。同时，内容创作的工具也在爆炸式增长，人们会创造更多内容。所以最终会找到一个新的平衡。

二、AI网络安全：从Mythos到Code Mender

Matthew Berman：Google一直在思考网络安全，你们有没有看到AI增强的网络攻击在加剧？

Sundar Pichai：我们一直在关注这个前沿。Google在很多安全领域都是先驱——比如零信任架构。因为我们运营着触及数十亿人的产品，所以必须站在前沿。

我们在内部安全团队中已经相当积极地部署了Agentic工作流，用来检测漏洞、生成补丁、验证补丁是否有效、然后部署。过去两年，随着模型能力的提升，我们能检测到的漏洞越来越多了。

Mythos确实是一个转折点——Anthropic造了一个在那个特定任务上非常优秀的模型。但我们要强调今天IO的一个可能被低估的发布：Code Mender。这是我们内部用的产品，它能全天候自动识别漏洞、生成补丁、测试验证并部署。我们还刚刚完成了对Wiz的收购，Wiz在实时监控漏洞方面是最前沿的。Code Mender和Wiz的组合，让我们在内部保持着前沿位置。

Matthew Berman：说到Mythos，Anthropic选择不公开发布。OpenAI则选择发布了GPT-5.5的网络安全版本。你觉得哪种做法更合适？

Sundar Pichai：这取决于模型能力。如果它没有从根本上改变现有的能力边界，那么公开发布是可以的。但在安全领域，有很成熟的惯例——比如Google的Project Zero，我们的团队找到漏洞后会通知厂商，给90天时间来修复，然后才公开承认。

所以如果你突然拥有了某种会从根本上改变前沿的东西，我认为和政府密切合作、以负责任的方式处理是合理的。这和网络安全行业的做法一致。当然，同时也要确保足够多的人能接触到它，以便修复自己的系统。这两者需要并行。

Matthew Berman：所以没有一个固定的阈值，而是要看每个模型相对当前前沿的跳跃幅度？

Sundar Pichai：对。你引入的下一个模型是1%-2%的改进，还是20%的跳跃？这就是判断的依据。

三、开源战略：为什么Google不放大型前沿模型？

Matthew Berman：Google和英伟达几乎是目前唯一真正有开源模型战略的公司。但你们的Gemma模型是小型、面向边缘设备的。为什么不发布一个大型开源前沿模型？

Sundar Pichai：Google从骨子里是开源的支持者。我们建立在一堆开源系统之上，我个人参与过Chromium和Android，还有Kubernetes——Google为开源世界做出了很多重大贡献。

在AI领域，我们一直在迭代Gemma模型。Gemma 4的最新发布非常好。但你看，达到前沿需要巨大的投入——看看我们的资本开支就知道了。你投入了大量研发资金来产生增量的前沿模型，这个过程中你也在发现新技术。我们都需要对此保持清醒。

但我们也致力于确保有一个开源生态能够发展。所以我们采取的是平衡策略。

Matthew Berman：但一家Google规模的公司，如果有能力同时做大型闭源和大型开源，为什么不两者都做？大多数美国创业公司也会面临同样的问题——开源在美国有可行的商业模式吗？

Sundar Pichai：我们不仅做开源——我们大量投资Flash和Flash-Lite模型的原因之一，就是提供更多选择。这些模型也是真正的"工作马"。

关于开源商业模式——你看，现在有很多非常好的开源模型，尤其是来自中国的，很多创业公司在采用。技术发展有周期性：有时候前沿推进太快，开源可能跟不上；有时候技术曲线放缓，开源就能实现飞跃。很难完全预测。但我预期会有一个强大的开源生态持续存在，我们肯定会在其中扮演角色，也希望其他人也能加入。

四、中国开源模型与美国AI的选择

Matthew Berman：说到中国，他们一直在发布令人难以置信的开源模型。如果我是一个企业CEO，看到DeepSeek以极低成本提供了接近前沿的性能，我为什么不用中国的开源AI？选择美国AI的理由是什么？

Sundar Pichai：说到底，企业是在解决问题。他们需要一个完整的解决方案。如果你在做客服系统，你需要可预测性、可靠性、一致性、安全性。企业在优化很多因素。

这给开源模型和闭源模型都留出了空间。会有服务商在开源模型周围构建生态系统，这很有道理。也会有人选择闭源模型。这是一个开放市场，人们有大量选择。

如果模型是开源的，并且有合适的许可证，我认为来源地不那么重要。开源意味着有一个社区在负责和关心它——如果出了问题，不会没人注意到。这本身就创造了一个信任基础。

我其实更担心的是：美国是否做了足够多的事情来确保我们站在前沿？这才是我思考问题的方式。

Matthew Berman：但也有一种观点说，如果我们持续构建在中国开源模型之上，他们就会针对自己的芯片优化模型，最终我们会建立在对另一个国家技术的依赖上。这种担忧有道理吗？

Sundar Pichai：AI的基础逻辑是——因为模型变化太快了，你构建应用的方式必须是能够随时替换底层模型的。模式生态系统变化非常剧烈，所以你必须保持足够的动态适应能力。现在下定论还为时过早。

五、Flash vs Pro：为什么要做"工作马"模型？

Matthew Berman：我一直很喜欢观察前沿实验室的模型策略。Anthropic和OpenAI几乎只专注于绝对前沿，而Google在冲前沿的同时也非常强调"工作马"级别的Flash模型。为什么这是战略核心？

Sundar Pichai：我们的使命宣言里有一句话——让技术"普遍可及且有用"。我们一直深度关注如何让最重要的技术尽可能广泛地扩散。我们非常兴奋于推动效率，确保最好的模型能以最快、最便宜的方式运行。

我们必须为搜索做到这一点，因为我们要把它提供给数十亿人。我们想把它放进Gemini，也想给开发者用。这个策略已经取得了巨大成功。尤其是3.5 Flash——我在Keynote上也提到了——我听到很多CIO在担心公司AI预算爆表。这种焦虑是真的，而且随着时间推移只会更严重。

在一个Agentic工作流中，模型需要被反复调用很多次，拥有一个能力强但快速高效的模型至关重要。即使在token效率方面，Flash的成本效益也非常突出。我们在内部也在混合使用Pro和Flash。大多数公司都应该学会这样使用。

Matthew Berman：你是不是在暗示，如果通向AGI的路径是递归自我改进的AI，那么谁先到达谁就赢了，其他都不重要？

Sundar Pichai：首先，这项技术伴随着巨大的责任。我们所有人都需要谨慎，不惜一切代价避免"竞态条件"。我们欠人类的是负责任地部署这项技术。

你说的对，现在确实有这么一个时刻——曲线非常陡峭，你在曲线上哪个位置很重要。但几个月前我们发布3.0的时候，大家都说"我们遥遥领先，没人能追上"。而在前沿实验室之间，竞争非常激烈，我们各有长短，预训练发布周期也不一样，高峰不会同时出现。所有这些因素造成了认知差距，且每四到六周就会发生剧烈变化。

确实只有少数几个实验室处于真正的前沿，后面有很大的差距。递归自我改善的场景可能会出现。但如果它出现了，我们就必须比今天更加负责任地处理——这和网络安全领域的情况没有区别。AI越先进，就越应该是一个社会层面的对话，而不是单家公司的对话。

六、算力瓶颈：Google也供不应求

Matthew Berman：所有模型策略最终都落到算力上。Google同时在给自己的产品、数十亿用户、API客户和竞争对手提供推理服务，还在卖TPU。我听说Google的收入实际上是被算力限制的。现在Google的算力状况如何？

Sundar Pichai：我们确实在过去几年做出了大胆的算力投资决策。但即便如此，没有人坐在这个位子上会说"我们当初该少投一点"。我们正处在一个特别的时刻——成本也在上涨，给定预算能买到的算力比之前计划的要少，因为内存价格等等都在涨。

我们在云计算方面可以独立于内部需求做长期规划。这很好。但一部分挑战是——当你在Google Cloud支持客户时，客户看到anti-gravity上3.5 Flash以800 token/秒运行的demo，就会问"我们能拿到那个吗？"所以你还得去满足客户的需求。这不是一个简单的平衡。

Matthew Berman：所以你们的算力需求确实远超供给？

Sundar Pichai：绝对如此。这就是为什么我们更加重视3.5 Flash。我们能不能做一个更好的全模态模型？可以。但怎么做才能让尽可能多的人用上它？所以你在不断做取舍——包括要不要做一个更大的Ultra级模型来提升能力前沿，但那又意味着只有很少的人能用上。每个公司都在做这种取舍，有时候事后你会觉得"也许当时应该做不同的选择"。

Matthew Berman：现在Google的算力瓶颈到底是什么？土地？政治意愿？

Sundar Pichai：瓶颈的定义就是——你解决了一个，另一个就会冒出来。在不同时间点上，你会遇到：物理上建设和审批数据中心的能力、这些中心需要的电力、然后是系统的核心组件——它们全都是瓶颈。你需要所有这些同时到位才能生产出一块芯片。

现在有几个平行的瓶颈同时存在。如果所有人都认定内存是瓶颈，明天你可能又发现其实不是内存，是别的东西。但可以确定的是，目前整个技术栈的各个层面都存在系统性瓶颈。

视频链接：https://www.youtube.com/watch?v=IB7IW6zX-H0

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定