本文对比OpenAI Codex与Anthropic Claude Code等主流AI编程工具的用户反馈、定价策略与产品路线,梳理行业差异化发展现状。 ## 1. Codex 500万用户福利活动遭用户质疑作秀 为庆祝用户突破500万,OpenAI重置了所有付费ChatGPT用户的Codex额度,仅缓解了高频用户的使用压力。 多数用户反映此次统一重置实际收益极低:不少用户周额度刚重置,本次重置无增量,甚至有用户因此损失了1天额度,福利引发争议。 ## 2. Claude Code占据Token消耗主导,用户迁移多因额度限制 CostHawk追踪100名高强度AI编程开发者的数据显示,Claude Code总Token消耗达3697亿,占比88.9%,96名开发者使用它,仅56%用户单独使用Claude Code。 相同基准任务下,Claude Code Token消耗量约为Codex的3倍,额度限制是推动用户转向Codex的核心原因,多数重度用户选择多工具搭配使用。 ## 3. 分层定价成为行业共识,厂商策略存在差异 目前AI编程行业普遍采用20美元入门档+200美元高阶档的分层定价,既降低试用门槛,也让重度用户为高算力消耗付费,对冲厂商推理成本,该模式被OpenAI、Anthropic及Cursor、Replit等平台普遍采用。 OpenAI采用细颗粒度Token计费,通过临时倍数优惠卡位竞品、稳住重度用户;Anthropic将全场景入口纳入同一订阅,额度消耗透明度低,高端模型定价进一步拉开个人与企业用户门槛,更侧重服务企业客户。 ## 4. 三大头部产品路线分野明确,适配不同用户需求 Claude Code从终端切入适配现有工作流,靠体验设计强化生产力感受,产品逻辑是“用更多token解决问题”,适配希望获得写作成就感的开发者。 Codex界面克制,侧重真实工程效率,通过computer use验证结果减少不必要token消耗,适配追求稳定可靠的经验工程师。 Cursor押注云端工作流,其云端agent可支持团队级协作任务,更贴近未来企业开发形态,开放生态成熟度仍不足。
Codex500万用户福利被怼“作秀”,Claude Code 吃掉近九成Token,OpenAI 抢用户败在“小气”上?
2026-06-01 16:23

Codex500万用户福利被怼“作秀”,Claude Code 吃掉近九成Token,OpenAI 抢用户败在“小气”上?

本文来自微信公众号: InfoQ ,作者:褚杏娟,原文标题:《Codex 500万用户福利被怼“作秀”!Claude Code 吃掉近九成 Token,OpenAI 抢用户败在“小气”上?》


“所有付费版ChatGPT订阅用户的Codex使用额度已完成重置。你的每周额度和每小时额度都应该已经恢复到100%。今天就让token去创造些了不起的东西吧,玩得开心。”OpenAI Codex负责人Tibo发帖称。


据悉,这一举措是为了庆祝Codex用户突破500万大关。这意味着,近期因达到Codex使用上限而受限的ChatGPT付费用户,可以重新获得完整额度,继续使用Codex。已有用户确认,自己的周额度已从约60%恢复到99%,表明本次重置已经在部分用户账户中生效。此前,ChatGPT Plus、Pro等用户达到使用限制后,需要购买额外credits以继续使用。


不过,用户们对此次OpenAI的重置“福利”的反应并不相同。


一部分用户对额度恢复表示欢迎,“我当时真的很努力得想用掉我的token,哈哈”还有用户表示,“你额度重置的帖子,正好推了我一把,让我终于去试了试fast模式。我之前一直没用,是担心使用额度烧得太快。但这次额度重置之后,我就很容易拿它来跑真正的eval和review-agent工作了。现在,新鲜出炉的token已经给我带来过量多巴胺了。”


但更多人的态度是:“实际上,它并没有给大多数人带来任何真正的好处,只是表面上的重置而已。”


对许多人来说,新一周刚开始不到一天,额度还没来得及消耗多少,突然重置反而浪费。不少用户表示,自己的常规周重置刚刚发生不久,因此这次额外重置几乎没有带来实际收益。



有用户询问当前是否按5倍计算,也有人问100美元订阅档是否不再拥有双倍使用量。帖子下方回复称,按太平洋时间计算,双倍额度仍会持续到当天结束。



还有用户表示自己在这次本是“福利”的活动中反而亏了。“我的每周额度原本应该在6号重置,而且我除了打开应用查看重置日期之外,并没有实际使用额度。结果现在我的每周重置日期变成了7号。如果用户的额度本来还是100%,这次统一重置就不应该把他的重置日期往后推。”Jimmni说道。


对此,有网友回复解释称,“在小于7天的窗口期内,你不可能真正处于100%额度状态。你需要至少发送一条prompt/消息来启动这一周的计量周期,而这会让你的额度低于100%(不过四舍五入后,界面上可能仍然显示为100%)。”


Jimmni回复称,他之前的经验是,只要打开应用,Codex就会把5小时额度设成99%、每周额度设成100%,这样就足以“锁定”用户的重置日了,并不需要真的至少发送一条prompt。其最后直接道,“对我来说,少了一天。这次重置对我完全是负面的。”


统一重置,确实能缓解部分高频用户的使用压力,但重置时机、双倍额度持续时间、不同订阅档位的权益差异,以及周额度窗口如何计算,仍是用户最关心、但也很难统一解决的问题。


1Claude Code 8倍于Codex token消耗


“美国人还没醒的时候先用Claude;等美国用户上线、Claude变慢之后,再切到Codex。”Anthropic一直拿用户来调整工具和定价策略,Codex借此用户500万了,但Claude Code依然是开发者们首选。


页面显示,CostHawk榜单共追踪了100名operator,总Token消耗达到4159亿。其中,榜首用户LunarCircuit使用量约为525亿Token;榜单Top 1%用户贡献了12.6%的Token消耗,显示高强度AI编程用户对总体使用量具有明显拉动作用。


从工具占比看,Claude Code仍是当前榜单中的绝对主力。页面显示,Claude Code消耗约3697亿Token,占比88.9%;Codex消耗约462亿Token,占比11.1%;Cursor消耗约77万Token,占比接近0%。榜单还显示,100名operator中,有96名使用Claude Code,43名使用Codex,2名使用Cursor。



不过,值得关注的是,Codex和Claude Code的设计不同,也会导致同一个任务的token消耗量有很大差异。有开发者在一次标准Figma集成任务中,在相同提示词、相同代码仓库、相同目标输出下,Codex和Claude Code的Token消耗了现可显著差异:Codex完成一项基准任务约消耗7.2万个Token,而Claude Code约消耗23.5万个Token,后者消耗量约为前者3倍。


另外,榜单进一步区分了用户类型:仅使用Claude Code的用户占56%,多工具用户占40%,仅使用Codex的用户占3%,仅使用Cursor的用户占1%。这意味着,在高强度AI编程用户中,Claude Code仍是主入口,但相当一部分用户已经开始同时使用多款AI编程工具。


在增长趋势上,Cursor本月增长速度比Codex快1.3倍。其中,Cursor本月增长100%,Codex增长79.1%,Claude Code增长0.1%。不过,由于Cursor当前基数较小,其高速增长更多体现为早期扩张信号,尚未改变整体Token份额格局。


“从Claude Code切换到OpenAI Codex”这不是最近才兴起的话题。


月前,Reddit上就有开发者询问,从Claude Code迁移到Codex的用户体验如何。发帖者称,自己过去数月一直使用Claude Code Max x20,同时结合Serena、MCP、GSD1等工具,并在多个项目中并行使用,但经常遇到会话额度耗尽的问题。


帖子下,部分开发者已经开始把Codex作为主力工具。一名拥有30多年开发经验的用户表示,Codex对自己来说“能完成工作”,并认为Codex在编写更具未来可维护性的代码方面表现更好;相比之下,Claude有时需要反复要求修正,尤其在前端任务上表现较弱。不过他也提醒,AI工具不会对代码库承担长期责任,最终负责的人仍然是开发者自己。


另一名有20年经验、在FAANG工作的工程师则表示,他通常会在Claude Code和Codex之间切换,尤其是在额度受限时。他认为,Codex在最新版本中已经成为自己的首选,原因是反馈更快、推理更好,但他仍然倾向于同时保留两者,并在复杂设计和规划阶段让两个工具互相“对抗式”审查:先让一个工具形成方案,再让另一个工具提出批评。也有用户明确表示准备取消Claude订阅,完全依赖Codex。


不过,不少用户认为,Claude Code在规划模式和多智能体工作流上仍有优势。有开发者的工作流是:用Claude Opus进行规划,用Codex执行,再回到Claude做清理和优化。他认为,GPT 5.5仍然会遗漏不少东西,Claude在理解意图和整体设计上仍有不可替代之处。


额度和价格,是推动用户迁移的重要因素。一名此前几乎只使用Claude Code的开发者表示,自己转向Codex的主要原因就是使用限制。即便在每月100美元方案下,也可能几天内耗尽每周token。他认为Claude更擅长理解目标,但Codex更擅长严格遵循指令。与此同时,他也指出Codex应用体验并不理想,自己主要使用Codex CLI,且过去为Claude构建的插件和技能无法一键迁移,需要重写。


该用户还提到,OpenAI的核心聊天界面不计入同样的五小时窗口限制,因此可以用网页端进行初步规划或小型编码任务;而Claude网页聊天也会消耗同一订阅窗口,这使得Claude在重度开发场景中更容易受到限制。评论区也有人认为,这正是Claude难以与OpenAI竞争的原因之一。


与此同时,也有用户提醒,频繁耗尽额度未必只与工具有关,可能也和工作流管理不当有关。有开发者指出,如果同时在3到5个项目中使用Claude Code,首先要改进的是会话纪律,而不是简单更换工具。过长的历史记录、无目的浏览代码库以及插件过度堆叠,都会烧掉大量token。即便换成Codex,如果仍然不控制项目会话和任务切片,也可能只是“从一个供应商那里买到了同样的泥潭”。


2AI编程:个人与团队间的10倍价差


随着AI编程工具的快速发展,其商业模式也正在收敛。


无论Claude Code还是Codex,都采用了低门槛入门、高强度使用单独收费的模式,并形成了几乎相同的订阅分层:个人用户入门价格约为每月20美元,而面向高频专业开发者的高级档位则跳至每月200美元。



根据相关公开讨论和产品信息,80%-90%的用户通常远低于入门档限制,而前5%-10%的高频用户贡献了绝大多数推理负载。对于厂商而言,如果继续采用过于宽松的固定价格模式,轻度用户将长期补贴重度用户,最终导致推理成本失控。因此,200美元档位的作用,是将高消耗开发者单独分层,使真正高频、专业、依赖AI编程工具的人为更高算力消耗付费,同时避免普通用户为自己用不到的资源买单。


速率限制也进一步强化了这一分层。AI编程工具通常会设置一定时间窗口内的使用上限,例如每隔数小时重置一次。当开发者在项目进行过程中频繁触及额度限制时,往往更倾向于升级到高阶订阅,而不是切换到其他工具。对于已经将Claude Code或Codex嵌入日常开发流程的用户来说,使用习惯和工作流本身也会提高迁移成本。


推理成本是这套价格结构形成的另一关键原因。前沿模型运行成本高昂,尤其是在涉及复杂推理、工具调用和代码执行时,重度用户的实际算力消耗可能远超订阅价格。有分析称,Claude Code Max每月200美元订阅所提供的使用量,如果按随用随付的API Token价格计算,成本可能超过1000美元。


对厂商而言,200美元固定订阅费既可以带来更稳定的高价值用户收入,也能在一定程度上对冲推理负载波动带来的成本风险。OpenAI的ChatGPT Pro订阅推出后,曾被报道称在数月内带来显著年化收入增长;Anthropic推出Max档位,也被视为对高频开发者需求和成本结构的直接回应。


这种定价方式对AI公司具有明显吸引力。20美元档负责降低试用门槛、扩大用户基数和收集使用数据;200美元档则承接那些从工具中获得更高商业价值、也更愿意由个人或公司报销费用的专业用户。相比难以预测的按Token计费,订阅收入也更便于厂商规划GPU集群、推理资源和研发预算。


这一趋势并不局限于Anthropic和OpenAI。Cursor、Replit等AI IDE和编程平台也已显示出类似阶梯式定价迹象。其底层逻辑基本相同:AI编程工具的使用量差异极大,重度用户带来的推理成本远高于普通用户,厂商必须通过分层定价维持可持续商业模式。


不过,大趋势下的一些细节可能存在差异:Codex正试图把AI编程能力做成一套可计量、可审计的Token经济系统,Claude Code则更强调通过Claude统一工作台锁定开发者日常使用。


从产品定位看,Codex正在从“ChatGPT订阅附赠能力”转向“订阅额度+Token化计费”。OpenAI先将Codex纳入ChatGPT Plus、Pro、Business、Enterprise、Edu等多个订阅方案,通过ChatGPT现有用户入口扩大覆盖面;随后再通过Codex credits和token费率,对高强度开发者使用进行货币化。


OpenAI在4月初,将Codex定价从过去“按消息/PR平均扣点”,改为与API token用量对齐,即按每百万输入Token、缓存输入Token、输出Token消耗credits。不同模型对应不同费率,输出Token通常明显更贵。这意味着,开发者的长上下文、多轮修复、长输出、代码审查等行为,都会被拆解回更细颗粒度的Token成本。


更值得关注的是OpenAI的促销策略。当前,OpenAI为Pro 100美元档提供2倍Codex使用量,直到2026年5月31日,相当于将标准5x临时提升至10x;Pro 200美元档则在20x Plus的基础上,将5小时Codex限额临时维持在25x Plus。这一设计,一方面是在用100美元档位正面卡位Claude Max 5x,另一方面也是通过200美元档稳住真正的重度用户,降低其因额度焦虑转向Claude Code的可能性。


Anthropic消耗不够透明,也更“企业定制”


相比之下,Anthropic将Claude、Claude Code、Claude Desktop等入口统一纳入同一套订阅预算。Claude Code的策略更像是在把Claude打造成开发者全天候工作台,而不是单独售卖一个coding产品。



这使得Claude Code的商业价值不仅来自代码工具本身,更来自对开发者日常工作流的锁定。一旦用户把Claude Code当作主力工具,Claude在聊天、文档、代码、分析等场景中的整体订阅粘性都会增强。


不过,相比Codex将本地消息、云端任务、代码审查、模型窗口和credits拆得更清楚,Claude Code的额度消耗对用户来说更难精确判断。


近日,Claude Mythos 25美元/每百万输入token、125美元/每百万输出token的定价,也引发了社区讨论。


“按这个价格,Mythos上一次深度推理会话的成本,可能就相当于过去Claude Sonnet一整个月的使用费用。这个价位也会从根本上改变所有依赖长上下文推理的创业公司的经济模型。”有网友说道。


不少网友认为,这种高价策略正在进一步拉开个人用户与企业级用户之间的使用门槛,也显示出Anthropic正将高端能力更多瞄准基础设施层和生产环境,而非个人开发者。


有用户将其称为“给有钱技术宅准备的新档位”,甚至调侃可能会出现“1000美元套餐”。类似“不适合穷人”的评论,也反映出社区对高端模型定价门槛的直观感受。有开发者调侃称,自己凌晨两点进行轻量级代码修改时,入门级模型已经足够使用,“他们想收多少钱就收多少”。另一位用户也表示,价格确实高,自己夜间写代码仍会使用预算型模型,把钱省下来用于周末出行,同时该开发者也好奇高端模型是否真的能提供与价格匹配的能力。


不过,部分用户认为价格并非完全不可接受。有网友提到,此前部分高端模型的API调用价格更高,因此当前价格在高端推理模型市场中并不算极端。也有人表示,如果已有最高订阅档位,或许能够承受这类模型的使用成本。


“若输出价格达到每百万Token 125美元,这一定价架构瞄准的并不是个人用户,而是基础设施层客户。”有开发者指出。


这场讨论也再次展现了模型的定价模式:低成本轻量模型可能继续承担日常使用和个人开发场景,而高价前沿模型则更多服务于高价值工作流、企业生产环境和基础设施层调用。而上面的订阅套餐列表项目可能还只是开始,未来或许有更多的可选项,同时开发者对各种收费花样可能也会越来越蒙圈。


3AI编程工具的路线分野


除了定价策略,AI编程工具的路线也逐渐走出了差异。


开发者“Theo-t3․gg”认为,Claude Code重体验与情绪,Codex强调效率与验证,Cursor押注云端工作流,这三个产品代表了三条不同的路线,三者真正的差异不在于“谁更聪明”,而在于背后团队对“未来如何构建软件”的理解完全不同。


Claude Code的最大特点是选择从终端切入,而不是要求开发者切换IDE、安装新应用或迁移到云端环境。它的优势在于“站在开发者已经所在的位置”,通过CLI直接接入现有工作流。


这种路径让Claude Code快速获得开发者接受。过去Cursor在AI编程工具中拥有很强的心智占位,但如今Claude Code已经接过这一位置。在一些创业者和开发者群体中,原本大量使用Cursor的人,已经明显转向Claude Code。


不过,Theo-t3․gg也指出,Claude Code的另一面是强烈的“体验设计”和“营销属性”。他认为,Claude Code不只是开发工具,也是Anthropic展示“用Anthropic模型构建AI应用”能力的窗口。其sub-agent、pet mode、终端动画、token计数、加载状态等设计,都在强化一种“事情正在大量发生”的生产力感,也非常适合在X/Twitter上截图传播。


在其看来,Claude Code的底层哲学可以概括为:如果更多token能解决问题,那就使用更多token。比如通过sub-agent并行检查项目、用大量agent审计代码、让模型在终端里执行更多操作。这种方式往往确实能让用户感觉“非常高产”,但也可能带来更高的token消耗和成本压力。


与Claude Code相比,Codex的产品气质完全不同。Codex的界面更克制,任务运行时没有大量动画、计数器或多agent展示,更多是一个简单的工作状态、计时器和任务输出。Theo-t3․gg称,Codex“没有试图让自己像老虎机一样令人上瘾”,而是更强调把事情做完。


他多次提到,OpenAI的Codex更关注真实工程问题,而不是社交媒体传播效果。例如,Codex支持在Mac锁屏状态下继续使用电脑、支持新的diff marker设置、支持通过快捷键把当前应用画面发送给Codex作为上下文。这些功能并不适合截图传播,但能切实提高工程效率。


Theo-t3․gg尤其强调Codex的computer use能力。随着模型能力提升,Codex可以修改代码后实际查看运行结果、验证修改是否成功,而不是单纯依赖模型“想象”代码是否正确。他认为,这代表了OpenAI的核心思路:不是用更多token反复检查,而是用更好的环境和验证方式,让模型以更少token得到更可靠结果。


对于Cursor,Theo-t3․gg认为,外界低估了它的真正强项。Cursor曾经是AI编程工具的第一心智,但随着Claude Code崛起,很多人把Cursor视为“退居第三”。他认为,这是因为很多人仍然只把Cursor当作IDE使用,而没有看到Cursor Cloud的能力。


在Theo-t3․gg看来,Cursor的云端agent是三者中最接近未来形态的方案。Cursor Cloud并不只是提供一个简单的headless Linux sandbox,而是可以启动完整的图形化Linux环境,运行真实应用,再通过computer use测试修改结果。


这使得Cursor能够承担更多团队级、企业级任务。例如,在Slack中有人提出一个产品问题,团队成员可以直接@Cursor bot,让它启动agent修复问题,并在同一thread中返回修复后的视频证明。他认为,这种“从协作工具发起任务,再返回可验证结果”的流程,是Claude Code和Codex当前都难以达到的。


因此,Theo-t3․gg将三者定位为三个不同时间尺度的押注:Codex押注当下,解决今天agent写代码如何更可靠的问题;Claude Code押注几个月后的模型能力,认为模型会聪明到不必总是运行代码;Cursor则押注更远未来,即开发者不再主要在本地电脑上运行agent,而是通过Slack、浏览器和云端环境触发任务。


此外,三家公司在开放性和生态策略上也存在明显差异:OpenAI更愿意提供可构建的底层能力。例如,Codex CLI中的app server为第三方agentic coding应用提供了构建基础,开发者可以在其上开发自己的工具。相比之下,Anthropic更希望用户留在Claude Code自身UI和CLI体验里,把集成深度嵌入Claude Code,而不是让外部工具以编程方式自由调用。Cursor则有意向开放SDK和agent能力,但相关优先级和成熟度仍有不足。


在产品选择上,Theo-t3․gg建议道,如果一个开发者讨厌写代码、缺乏动力,或者希望写代码过程更有趣、更有成就感,Claude Code是一个很好的选择。它通过终端、多agent、动画和强反馈机制,能让用户持续感受到“我正在高效推进”。


如果是经验丰富、对AI工具有怀疑精神的工程师,希望工具尽量少打扰自己,只在需要时可靠完成任务,那么Codex更合适。他认为,Codex更像“由工程师构建、为工程师构建”的工具,强调稳定、验证和融入已有工作流。


参考链接:


https://x.com/thsottiaux/status/2061106703446450392


https://www.reddit.com/r/codex/comments/1tsydiy/reset_just_happened/?utm_source=chatgpt.com


https://costhawk.ai/leaderboard


https://techforward.io/why-the-20-to-200-pricing-leap-in-claude-code-and-codex/?utm_source=chatgpt.com


https://www.youtube.com/watch?v=JMYspR42HFM


https://www.youtube.com/watch?v=dcrASucavMk

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定