本文来自微信公众号: APPSO ,作者: APPSO,题图来自:视觉中国
这两天 GPT-6 曝光的信息越来越多,而 Sam Altman 的焦虑也到了顶点。
虽然 OpenAI 进入 2026 以来没什么重磅产品发布,但奥特曼最近的行程依然爆炸:
把明星产品 Sora 砍了,给迪士尼 CEO 打电话道歉,跟 CFO 在上市时机上吵完架,就得穿上他这辈子穿得最多的西装去见某国元首谈芯片。回来发现,6 亿美元的 OpenAI 二级市场股票挂了好几周,没人接盘。
在内忧外患之下,GPT-6 是 OpenAI 不容有失的一张王牌。

这个内部代号“Spud”(土豆)的模型,历经两年秘密研发,3 月 24 日在德克萨斯的 Stargate 数据中心完成预训练,预计最快在 4 月发布。
OpenAI 总裁 Greg Brockman 最近在播客访谈上亲口确认了它的存在:“这不是增量改进,而是我们思考模型开发方式的重大改变。”
奥特曼同一天对全体员工的说法,再次拉高了预期:“一个非常强大的模型,可以真正加速经济发展。”
Open AI 憋了两年大招,现在要放了,却在 OpenAI 最危险的时候。
GPT-6这只“土豆”到底有多强
Brockman 在播客上没给跑分,没给发布日期,但他造了一个新词:“Big Model Smell”,大模型的气息。
当这些模型真正变得更聪明、更有能力时,它会主动对齐你的意图(bend to you)。你不需要反复解释你想要什么,它就是知道。
这话说得很玄,但信息量比任何 benchmark 都大。

循例看看曝光的参数。泄露文档显示,GPT-6 在编码、推理和 Agent 任务上比 GPT-5.4 高出 40% 以上。上下文窗口从 GPT-5.4 的 100 万 token 直接拉到 200 万,翻了一倍。
有传言称 Fields 奖得主陶哲轩据报道已经上手测过 GPT-6 的数学推理,这更令人期待了。
Brockman 原话是“用户不必为同一请求输入多个提示”。三年了,ChatGPT 用户被“如何跟 AI 说话”折磨得够呛。如果 GPT-6 真能解决提示工程这个痛点,光这一项更新就值回票价。

Agent 能力是另一个重头戏。更长程的自主运行,更少的人工确认循环。文本、图像、音频、视频原生统一处理,不是拼接,是同一个架构从底层就这么设计的。
爆料里还有一句更猛的,Brockman 私下说 AGI 已经实现了 70% 到 80%,内部认为 GPT-6 会弥合大部分剩余差距。这话不管你信不信,至少说明 OpenAI 内部的判断已经到了这一步。
GPT-5.4 已经把幻觉率比 GPT-5.2 降低了 33%。GPT-6 在这个基础上还要再降,具体数字还没出,但方向明确:让 AI 不再一本正经地胡说八道。
Brockman 反复强调一个关键定位:GPT-6 是全新的基础模型,会成为 OpenAI 未来所有模型的底座。
从 GPT-4 开始,OpenAI 花了两年多做渐进式更新(4o、4.5、5、5.2、5.4),但暗线上另一个团队在从零开始建新地基。
根据 OpenAI 历史定价模式,旗舰模型通常在发布时定价较高,参考 GPT-5 Reasoning 为$15/百万输入 token。
但目前爆料给出的数字是 2.5 美元输入、12 美元输出,跟 GPT-5.4 几乎持平。如果后者属实,OpenAI 等于也开始打价格战。
同级别的 Claude Mythos 传闻定价在每百万 token 100 美元,ChatGPT Plus 和 Pro 用户大概率优先尝鲜。
至于发布时间,多个爆料博主指出了 4 月 14 日 这个时间,但在官宣之前都不能确定,无论如何在 4 月发布的概率很大。
为了GPT-6,不惜杀死Sora
GPT-6 完成预训练后不到 24 小时,OpenAI 宣布关停 Sora。

同时被取消的还有与迪士尼价值 10 亿美元的角色授权协议。200 个迪士尼角色,Pixar、Marvel、Star Wars,一夜之间全没了。奥特曼亲自给迪士尼 CEO Bob Iger 打了电话。迪士尼新任 CEO Josh 的反应让他“感到非常糟糕”。
但奥特曼在最新长访谈也直接再次谈到关停 Sora:“核心在于算力,永远都是算力的问题。”
Sora 每天烧掉大约 100 万美元的算力资源。钱倒不是最大的问题,但同一块 GPU 不足以同时供给视频模型和旗舰大模型训练。
二选一,奥特曼选了 GPT-6。
Sora 团队没被裁,转去做“世界模拟”研究,长期目标指向机器人。OpenAI 正在从消费级创意工具全面收缩,转向企业级生产力 AI。
奥特曼还透露了一个更根本的原因。他发现如果 Sora 要在短视频领域取得成功,需要的产品逻辑会把公司拉向一条他不想走的路。
那种商业模式可能会提出什么要求,以及我们为了获胜而做出的决策,是我们不愿做的。
说白了,奥特曼不想让 OpenAI 变成另一个算法驱动的信息流工厂。这也相当于OpenAI 终于承认,自己摊子铺得太大了。
在经历了过去一年眼花缭乱的产品发布,从视频生成模型 Sora 到各式各样的独立硬件、应用尝试后,这家 AI 巨头正在调转船头的方向。
前段时间 APPSO 也介绍过,OpenAI 正在策划一场近年来最大的产品重组,GPT-6 就是关键的一环。
ChatGPT + Codex + 浏览器 = GPT-6超级应用
GPT-6 不是一个孤立的模型,它是 OpenAI“超级应用”战略的底层引擎。
OpenAI 目前的规划是让 GPT-6 同时驱动三个产品:ChatGPT 对话 AI、Codex 编程智能体、Atlas 内置浏览器。三者塞进一个桌面应用,对话、编程、上网、执行任务一键切换,预计 2026 年底前出预览版。

奥特曼自己是 Codex 的重度用户,“这是自 ChatGPT 发布以来,我第一次感到自己用上了未来科技。”他把攒了好几年的副业项目清单全部用 Codex 跑完了,然后遇到了一个“奇怪的问题”:想不出更多点子了。
一个让 CEO 跑完了 idea 清单的编程工具,接下来要接上一个更猛的模型。这就是 GPT-6 在产品层面的意思。
同步发生的组织架构变动更有意思。OpenAI 产品部门正式更名为“AGI Deployment”。这是 AGI 这个词第一次出现在公司官方架构中。奥特曼本人把日常产品工作全部甩出去了,自己只干三件事:筹钱、抢芯片、建数据中心。
他在访谈里承认自己现在“穿西装的次数比一生加起来还多”,而且“感觉更像一名政客,而非纯粹的创始人”。
OpenAI内讧?CEO要上市,CFO说没准备好
技术上 all in 了。财务上呢?先看一组让奥特曼晚上翻来覆去的数字。
据 Next Round 资本创始人透露,近几周约六家机构投资者想出手总计约 6 亿美元的 OpenAI 股票。
去年,这种量级的卖单通常几天内就被抢光。现在却几乎无人问津。二级市场给出的估值约 7650 亿美元,较峰值 8500 亿折价 10%。
而同一时间,Anthropic 的二级市场估值较上一轮融资溢价超过 50%。钱正在从 OpenAI 流向它最大的对手。
一级市场刚注入 1220 亿美元、估值 8520 亿的公司,二级市场打了九折。这种反差只说明一件事,聪明钱在犹豫了。
The Information 4 月 6 日的报道透露,OpenAI 的 CEO 和 CFO 在 IPO 时机上,吵起来了。
奥特曼想最早 2026 年 Q4 上市。理由?Anthropic 正在讨论同期 IPO,而奥特曼私下表态过,他要排在 Anthropic 前面。不是因为业务准备好了,是因为不能输。
CFO Sarah Friar 不同意。她今年早些时候对同事说,2026 年公司根本准备不好。她算了一笔账:未来五年 6000 亿美元服务器租赁承诺,到 2030 年的现金消耗将超出此前预测两倍以上,收入增长还在放缓。
Friar 是谁?高盛分析师出身,帮 Block(Square)操盘过 IPO,做了六年 Nextdoor CEO,被请来专门给 OpenAI 算账的人。结果她算完了,发现奥特曼压根不想听。
接下来的事情就更精彩了。
去年 8 月开始,Friar 不再直接向奥特曼汇报,改向应用业务负责人 Fidji Simo 报告。大公司里 CFO 不向 CEO 汇报这种事,翻遍硅谷历史几乎找不到先例。
多位知情人士说,奥特曼在好几个重大财务决策场合直接把 Friar 排除在外。有一次他跟一个重要投资者讨论服务器支出,没叫 Friar。上一次讨论同样的话题,Friar 是在场的。
有人这么评价她的处境:“她有一份艰难的工作。她为一位抱有远大抱负的创始人工作,这位创始人希望在开支上尽其所能地突破限制。”翻译一下就是——CFO 的职责是踩刹车,但创始人把刹车踏板卸了。
而 Friar 的直属上级 Simo,也在用自己的方式让人看不懂。她刚在全员会上警告“不能再开支线任务了”,转头就主导了一笔 2.5 亿美元的交易:收购一个开播 18 个月的科技播客 TBPN。

部分员工以为是迟到的愚人节玩笑。AI 研究员 Gary Marcus 在社交媒体上直接说:大概是为了控制舆论。
Simo 在内部备忘录里的说法是:“标准的传播手册对我们并不适用。我们不是一家普通公司。”没毛病,2.5 亿确实不普通。问题是,这家“不普通的公司”花 2.5 亿买播客的同一周,它的二级市场股票正在打折出售,无人接盘。
报道出来后,Friar 在 LinkedIn 发了张跟财务团队的合影,写“为 Sam 和 Greg 的远见干杯”。两人还发了联合声明说在算力战略上“完全一致”。
硅谷有一条不成文的规律,当 CEO 和 CFO 需要公开声明“完全一致”的时候,通常说明他们已经产生了分歧。
Anthropic CEO Dario Amodei 前段时间在播客上提出一个观点:“如果增长率是一年五倍而不是十倍,那么你就会破产。我有种感觉,有些公司还没有把电子表格算清楚。”
他在点谁呢?好难猜啊。
大模型即将迎来史上最残酷的一个月
即便 GPT-6 大概是 OpenAI 今年最重要的一个模型了,但在这个四月,它只是这场混战里其中一个选手,而且还没有十足胜算。
Anthropic 的 Claude Mythos 几乎同步完成预训练。泄露的内部文档用了一个极少出现的词:“step change”,跨越式升级。

具体来说,Mythos 在 Anthropic 产品线里新开了一个层级叫 Capybara(卡皮巴拉),定位居然在此前 Claude 最强的模型Opus 系列之上。
Mythos 能力强到 Anthropic 私下向政府官员发出了预警,内部评估写的是“前所未有的网络安全风险”。
它甚至还具备递归自我纠错能力,简单说就是模型自己发现自己错了能自己改回来,不需要人类介入。Anthropic 因此选择推迟发布,但考虑到 Claude Code 源码都被“开源”了,干脆豁出去 4 月发布也不奇怪。
DeepSeek V4 同样瞄准 4 月。万亿参数 MoE 架构,据悉这次主推的核心卖点是长期记忆,模型真的能“记住你”。更有意思的是硬件选择,V4 对昇腾芯片做了深度优化。
这次 DeepSeek V4 或许要证明 ,中国的算力栈,从芯片到框架到模型,能跑最前好的模型。
这不只是技术竞争了。
与此同时,阿里的千问 3.6 旗舰版 Qwen-3.6-Max 蓄势待发。林俊旸离职后,阿里急需证明通义千问不会因为灵魂人物出走而掉队。上周千问已经连发三个模型,憋着一口气。

姚顺雨入职腾讯后操刀的混元 3.0 此前也预告将在 4 月亮相。姚顺雨在内部要求团队“不以打榜为导向”,不刷排行榜,只看真实场景效果。这将是腾讯 AI 今年关键一役。
xAI 的 Grok 5 本来定在 Q1,延期后现在加班赶 Q2。背靠马斯克和 10 万张 H100 的 Colossus 集群,Grok 5 要证明的是“不跟着 OpenAI 的路子走也能做前沿模型”。
Gemini 3.2 也可能会在 Q2 登场。去年之前所有人一度都觉得 Google 在 AI 上掉队了,结果它在悄悄蚕食 ChatGPT 的份额。经历过逆风翻盘之后,没人再敢忽视。
七个重磅模型,挤进同一个月。似乎已经很久没出现过这种局面了。
奥特曼在访谈里说过一句话,大意是:我们距离数据中心内部的认知能力超过人类社会总和,可能只有两年了。
而眼下,对 OpenAI 来说可能连两周的窗口期都没有了。
AI 行业腥风血雨的一个月,已经开始了。
