谷歌Gemini上线新算力消耗限额机制引发付费用户不满,多家头部大模型厂商均采取类似操作,标志AI订阅蜜月期已结束。 ## 1. Gemini推出全新限额机制 谷歌从5月20日起将Gemini原按天按条数计费改为算力消耗制:根据prompt复杂度、对话长度、功能类型扣除对应额度,文字扣费少,写代码、生成视频扣费多,且不向用户公示具体消耗数值。 新机制采用**5小时滚动窗口限额+每周总量上限**的双重限额,超出后需等待周期刷新,付费Pro用户也会触发限额,一般仅能支撑20-30个非复杂问题,生成图文后问题量会进一步降到20个以内,触发限额后会被降级到低配模型。 ## 2. 新机制大幅压缩付费权益,引发用户不满 原付费Pro用量为免费用户的33倍,Ultra为166倍,调整后8美元/月Plus仅为免费用户2倍,20美元/月Pro仅为免费用户4倍,同等付费对应的服务大幅缩水。 谷歌AI编程产品Antigravity同步收紧限额,Pro用户5条对话即可消耗50%的5小时额度,所有共享套餐的第三方模型共用同一额度池,大批用户发起退订,相关知乎话题单日暴涨几十万热度。 ## 3. 多家头部大模型厂商同步调整计费模式 OpenAI今年4月将Codex从按消息收费改为按token计费加积分制,将Pro拆分100美金、200美金两档,支持额外购买积分包,逻辑与谷歌一致。 Anthropic将Agent SDK、GitHubActions等产品从订阅额度中拆分,单独采用月度积分计费。**超半数头部大模型公司已转向按量计费或混合定价,AI订阅已转为云账单逻辑**。 ## 4. 计费模式调整的核心原因 算力供给紧张是全行业共性问题,谷歌自身供应TPU,同时为Anthropic提供价值400亿美元的TPU供应合同,但自身DeepMind研究团队仍需排队等算力,甚至引发核心研究员出走。 本次全行业限额调整,本质是整个AI订阅模式的蜜月期已经结束。
Gemini也叛变了,付费用户变小丑
2026-05-25 17:56

Gemini也叛变了,付费用户变小丑

本文来自微信公众号: 夕小瑶科技说 ,作者:夕小瑶编辑部


上周,谷歌悄悄上线了一套新的Gemini限额机制,引起了众怒。


一大批订阅用户发现和Gemini聊了没几轮,就提示“您已达到当前用量限额,请等待刷新”。Linux和reddit还有知乎上网友的讨论炸了锅。


之前Gemini的限额是按条数算,按天刷新。免费用户一天5条,Pro用户一天100条,不管你怎么问,“今天的天气怎么样”还是“开发一个网页游戏”,都按一条算,反正是你多花钱就多用。


但现在不是了。


改成了算力消耗制。


我是Pro用户,也收到了同样的通知邮件。



从5月20号开始,Gemini改成了基于算力消耗的计费方式。


你发一句“帮我翻译这段话”和你说一句“帮我用Python写一个爬虫”,消耗的额度完全不同。系统会综合计算你的prompt复杂不复杂、对话有多长、用了什么功能,然后扣除对应的额度。文字对话扣得少,写代码、生成视频扣的多。


但是,消耗了多少?不能告诉你。


谷歌官方原话是限制触发速度取决于模型类型及功能负载。也就是我到底用了多少Token?这代码耗了多少算力?用之前都不知道🤷/。Gemini也开始玩另外两家不给明确数字的玩法。


然后是限额的刷新机制也改了。


双重限额上线,5小时滚动窗口限额+周用量limit限额。



第一层是5小时的滚动窗口,用完额度就等5小时后刷新,第二层是是每周总量上限,一旦你这周的总消耗到顶了,只能等下周重置。


这套限额不是只卡免费用户的,还有付费的订阅用户,一大批用户上线第一天就撞上了限额。


知乎上话题《如何评价Gemini于2026年5月17日实行的新限额形式?》一天内暴涨了几十万热度,底下一位网友吐槽说自己是Pro用户,5h limit也就是=3个低质量视频+2个低质量图片+5个简单问题的pro extend,用完之后就降级到低配的Flash-lite模型。



有网友说5小时limit大概是支撑20-30个非复杂问题,如果有图片则会消耗的更快,降到20个问题。


限额这还不是让用户最破防的操作。


打开Gemini官网套餐页,就能看到8美金/月的Plus用户,用量是免费用户2倍,20美金/月的Pro用户是免费用户的4倍用量。



蛤?之前我买个会员,Pro用户是免费版的33倍,Ultra是免费版的166倍,最起码能畅通稳定使用,现在花8美元也就是免费版的2x倍量,付费用户直接变小丑了,还不如注册两个账号。


这波操作上线之后,舆论失控了。



不止是Gemini,谷歌家的AI编程工具Antigravity那边同样被网友骂疯了。新的算力消耗制上线后,Pro用户发现5条对话就能烧掉50%的5小时额度,连续聊上10分钟也会撞上限额。大批用户纷纷吵着要退订。因为同样的话费,服务明显降级变少。



而且因为Flash和Pro模型额度被合并进同一个池子,限额感知更强。



很多人可能不太了解Antigravity,它是谷歌家的AI编程产品,IDE和CLI两种形式都有。一个很大的卖点是你订阅谷歌的Pro或Ultra套餐,不光能用Gemini,还能直接切换到Claude Sonnet、Claude Opus、GPT-OSS这些第三方模型,不用额外付费,不用API,直接能用到claude家的模型,好多人也是冲着20美金用上Claude Opus来的。但是,所有模型共享同一个额度池。


其实,Antigravity的限额收紧比Gemini早得多,从去年12月就开始了,26年3月份已经有用户发现高级模型的刷新周期从5小时悄悄变成了按周,之前还能5小时一刷,现在就得等一周。


紧接着为了平息怒火,谷歌两天内连着加了两轮3倍额度。




网友对Gemini到底降了多少额度做了一个简单总结。总之就是大家的结论一致,还是比以前少。



如果你以为只有谷歌一家在抠,那就大错特错了。


往旁边看一眼,OpenAI和Anthropic也在干类似的事。今年4月,Codex从按消息收费改成了按token计费加积分制,Pro也拆成了100美金和200美金两档。用完了可以买积分包继续用,逻辑和谷歌几乎一模一样。


Claude那边,也把Agent SDK、GitHubActions这些产品从订阅额度里拆出来了,单独走月度积分。


三家几乎一致,都从“交月费随便用”到“交月费只是起步价,用多少算多少”的路走。超过一半以上的头部大模型公司都已经在用按量计费或混合定价了,AI订阅早就变成了云账单的逻辑。


为什么?因为算力是真的不够用。


谷歌自己造TPU,按说应该不缺,也是竞争对手的算力供应商,比如跟Anthropic签了400亿美元的TPU供应合同,但是谷歌自己的DeepMind研究团队还是要排队等算力,导致核心研究员出走。


这波限额叛变的不是谷歌,是整个AI订阅模式的蜜月期,结束了。


[1]Google Antigravity Plans:https://antigravity.google/docs/plans


[2]OpenAI Help,using Codex with your ChatGPT plan:https://help.openai.com/en/articles/20001106


[3]Anthropic,Higher limits for Claude Code with SpaceX Colossus:https://www.anthropic.com/news/higher-limits-spacex


[4]Claude Support,use the Claude Agent SDK with your Claude plan:https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan


[6]linux.do,Ultra 3小时后5h额度剩20%:https://linux.do/t/topic/1760337


[7]linux.do,3x补丁被质疑“先缩水再补”:https://linux.do/t/topic/2219076/11


[8]linux.do,周限触发后刷新变4天:https://linux.do/t/topic/1538942/5


[9]linux.do,rate limits/quota/token池换算讨论:https://linux.do/t/topic/2219076

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP