谷歌Gemini上线新算力消耗限额机制引发付费用户不满，多家头部大模型厂商均采取类似操作，标志AI订阅蜜月期已结束。 ## 1. Gemini推出全新限额机制谷歌从5月20日起将Gemini原按天按条数计费改为算力消耗制：根据prompt复杂度、对话长度、功能类型扣除对应额度，文字扣费少，写代码、生成视频扣费多，且不向用户公示具体消耗数值。新机制采用**5小时滚动窗口限额+每周总量上限**的双重限额，超出后需等待周期刷新，付费Pro用户也会触发限额，一般仅能支撑20-30个非复杂问题，生成图文后问题量会进一步降到20个以内，触发限额后会被降级到低配模型。 ## 2. 新机制大幅压缩付费权益，引发用户不满原付费Pro用量为免费用户的33倍，Ultra为166倍，调整后8美元/月Plus仅为免费用户2倍，20美元/月Pro仅为免费用户4倍，同等付费对应的服务大幅缩水。谷歌AI编程产品Antigravity同步收紧限额，Pro用户5条对话即可消耗50%的5小时额度，所有共享套餐的第三方模型共用同一额度池，大批用户发起退订，相关知乎话题单日暴涨几十万热度。 ## 3. 多家头部大模型厂商同步调整计费模式 OpenAI今年4月将Codex从按消息收费改为按token计费加积分制，将Pro拆分100美金、200美金两档，支持额外购买积分包，逻辑与谷歌一致。 Anthropic将Agent SDK、GitHubActions等产品从订阅额度中拆分，单独采用月度积分计费。**超半数头部大模型公司已转向按量计费或混合定价，AI订阅已转为云账单逻辑**。 ## 4. 计费模式调整的核心原因算力供给紧张是全行业共性问题，谷歌自身供应TPU，同时为Anthropic提供价值400亿美元的TPU供应合同，但自身DeepMind研究团队仍需排队等算力，甚至引发核心研究员出走。本次全行业限额调整，本质是整个AI订阅模式的蜜月期已经结束。

2026-05-25 17:56

Gemini也叛变了，付费用户变小丑

夕小瑶科技说©

本文来自微信公众号：夕小瑶科技说，作者：夕小瑶编辑部

上周，谷歌悄悄上线了一套新的Gemini限额机制，引起了众怒。

一大批订阅用户发现和Gemini聊了没几轮，就提示“您已达到当前用量限额，请等待刷新”。Linux和reddit还有知乎上网友的讨论炸了锅。

之前Gemini的限额是按条数算，按天刷新。免费用户一天5条，Pro用户一天100条，不管你怎么问，“今天的天气怎么样”还是“开发一个网页游戏”，都按一条算，反正是你多花钱就多用。

但现在不是了。

改成了算力消耗制。

我是Pro用户，也收到了同样的通知邮件。

从5月20号开始，Gemini改成了基于算力消耗的计费方式。

你发一句“帮我翻译这段话”和你说一句“帮我用Python写一个爬虫”，消耗的额度完全不同。系统会综合计算你的prompt复杂不复杂、对话有多长、用了什么功能，然后扣除对应的额度。文字对话扣得少，写代码、生成视频扣的多。

但是，消耗了多少？不能告诉你。

谷歌官方原话是限制触发速度取决于模型类型及功能负载。也就是我到底用了多少Token？这代码耗了多少算力？用之前都不知道🤷/。Gemini也开始玩另外两家不给明确数字的玩法。

然后是限额的刷新机制也改了。

双重限额上线，5小时滚动窗口限额+周用量limit限额。

第一层是5小时的滚动窗口，用完额度就等5小时后刷新，第二层是是每周总量上限，一旦你这周的总消耗到顶了，只能等下周重置。

这套限额不是只卡免费用户的，还有付费的订阅用户，一大批用户上线第一天就撞上了限额。

知乎上话题《如何评价Gemini于2026年5月17日实行的新限额形式？》一天内暴涨了几十万热度，底下一位网友吐槽说自己是Pro用户，5h limit也就是=3个低质量视频+2个低质量图片+5个简单问题的pro extend，用完之后就降级到低配的Flash-lite模型。

有网友说5小时limit大概是支撑20-30个非复杂问题，如果有图片则会消耗的更快，降到20个问题。

限额这还不是让用户最破防的操作。

打开Gemini官网套餐页，就能看到8美金/月的Plus用户，用量是免费用户2倍，20美金/月的Pro用户是免费用户的4倍用量。

蛤？之前我买个会员，Pro用户是免费版的33倍，Ultra是免费版的166倍，最起码能畅通稳定使用，现在花8美元也就是免费版的2x倍量，付费用户直接变小丑了，还不如注册两个账号。

这波操作上线之后，舆论失控了。

不止是Gemini，谷歌家的AI编程工具Antigravity那边同样被网友骂疯了。新的算力消耗制上线后，Pro用户发现5条对话就能烧掉50%的5小时额度，连续聊上10分钟也会撞上限额。大批用户纷纷吵着要退订。因为同样的话费，服务明显降级变少。

而且因为Flash和Pro模型额度被合并进同一个池子，限额感知更强。

很多人可能不太了解Antigravity，它是谷歌家的AI编程产品，IDE和CLI两种形式都有。一个很大的卖点是你订阅谷歌的Pro或Ultra套餐，不光能用Gemini，还能直接切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型，不用额外付费，不用API，直接能用到claude家的模型，好多人也是冲着20美金用上Claude Opus来的。但是，所有模型共享同一个额度池。

其实，Antigravity的限额收紧比Gemini早得多，从去年12月就开始了，26年3月份已经有用户发现高级模型的刷新周期从5小时悄悄变成了按周，之前还能5小时一刷，现在就得等一周。

紧接着为了平息怒火，谷歌两天内连着加了两轮3倍额度。

网友对Gemini到底降了多少额度做了一个简单总结。总之就是大家的结论一致，还是比以前少。

如果你以为只有谷歌一家在抠，那就大错特错了。

往旁边看一眼，OpenAI和Anthropic也在干类似的事。今年4月，Codex从按消息收费改成了按token计费加积分制，Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用，逻辑和谷歌几乎一模一样。

Claude那边，也把Agent SDK、GitHubActions这些产品从订阅额度里拆出来了，单独走月度积分。

三家几乎一致，都从“交月费随便用”到“交月费只是起步价，用多少算多少”的路走。超过一半以上的头部大模型公司都已经在用按量计费或混合定价了，AI订阅早就变成了云账单的逻辑。

为什么？因为算力是真的不够用。

谷歌自己造TPU，按说应该不缺，也是竞争对手的算力供应商，比如跟Anthropic签了400亿美元的TPU供应合同，但是谷歌自己的DeepMind研究团队还是要排队等算力，导致核心研究员出走。

这波限额叛变的不是谷歌，是整个AI订阅模式的蜜月期，结束了。

[1]Google Antigravity Plans:https://antigravity.google/docs/plans

[2]OpenAI Help,using Codex with your ChatGPT plan:https://help.openai.com/en/articles/20001106

[3]Anthropic,Higher limits for Claude Code with SpaceX Colossus:https://www.anthropic.com/news/higher-limits-spacex

[4]Claude Support,use the Claude Agent SDK with your Claude plan:https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan

[6]linux.do,Ultra 3小时后5h额度剩20%:https://linux.do/t/topic/1760337

[7]linux.do,3x补丁被质疑“先缩水再补”:https://linux.do/t/topic/2219076/11

[8]linux.do,周限触发后刷新变4天:https://linux.do/t/topic/1538942/5

[9]linux.do,rate limits/quota/token池换算讨论:https://linux.do/t/topic/2219076

AI原生产品日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP