OpenAI推出史上最强GPT-5.6系列模型,采用有限预览方式发布,安全管控和政府审核成为发布核心影响因素。 ## 1. GPT-5.6产品线分层梳理 OpenAI本次推出三款不同定位的模型,分别是旗舰级最强模型Sol、对标GPT-5.5且价格减半的日常平衡型Terra、主打低成本高速的Luna,同时重新梳理了命名体系,用数字标识代际、天体名称区分能力层级。价格按百万tokens计费:Sol输入5美元输出30美元,Terra输入2.5美元输出15美元,Luna输入1美元输出6美元,还新增了可预测的prompt缓存机制,Sol将于7月登陆Cerebras,初期仅面向部分客户开放。 ## 2. 核心能力全系升级,多场景霸榜基准测试 GPT-5.6核心升级方向是提升类智能体的复杂长链条任务能力,Sol Ultra在Terminal-Bench 2.1命令行工作流测试中得分91.9%,Sol得分88.8%,均高于GPT-5.5的88.0%及其他竞品模型,Ultra模式通过多子Agent拆分复杂任务提升完成效率。在GeneBench v1生物信息评测中,Sol用更少输出tokens取得了比GPT-5.5更强的结果,提升了科研场景成本效率;在网络安全评测中,Sol表现接近竞品顶级模型,仅使用约三分之一输出tokens,但OpenAI确认它尚未跨过网络安全关键风险阈值,无法生成完整自主攻击链。 ## 3. 配置多层分级安全体系,压制风险同时保留合法用途 GPT-5.6发布说明中大篇幅提及安全方案,搭建了涵盖模型拒答、实时检测、账号审查等环节的分层安全栈,能力越强防护越严格,针对高风险网络安全请求设置多层拦截机制。OpenAI投入超70万A100等效GPU小时进行自动化红队测试,搭配人工专家测试排查越狱风险,建立了漏洞快速响应修复机制。 ## 4. 前沿AI发布纳入国家安全框架,进入政策试探新阶段 本次GPT-5.6采用有限预览,发布前已向美国政府展示方案,仅对约20家经政府批准的可信合作伙伴开放,合作伙伴信息已共享给美国政府。OpenAI不认可政府长期参与模型访问审核是长期默认机制,但为争取后续更广泛开放,仍接受该安排以探索可复制的发布流程。当AI模型能力逼近关键能力阈值后,使用资格与管控将成为比性能更受关注的核心事项。
刚刚,GPT-5.6正式发布,史上最强但被自己坑惨了
2026-06-27 07:09

刚刚,GPT-5.6正式发布,史上最强但被自己坑惨了

本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《刚刚,GPT-5.6 正式发布,史上最强但被自己坑惨了》


就在刚刚,GPT-5.6系列正式发布,不过,它并没有直接全面开放,而是以「有限预览」的方式先行试水。



作为OpenAI最强的一代,GPT-5.6一口气端出三款型号,名字起得颇有诗意:


Sol(太阳)是旗舰模型,也是OpenAI口中目前最强的模型;


Terra(地球/大地)是面向日常工作的平衡型模型,性能可以与GPT-5.5竞争,同时价格便宜一半;


Luna(月亮)主打速度和低成本,是GPT-5.6系列中最便宜的模型。


从这命名方式来看,奥特曼私底下没少学习Anthropic营销的精髓。而借着GPT-5.6的发布,OpenAI也顺手把命名体系重新梳理了一遍:


数字表示代际,Sol、Terra、Luna对应不同能力层级,便于区分智能水平、速度与成本。产品定位上,Sol面向高难复杂任务,Terra覆盖日常工作流,Luna主打低成本调用。


换句话说,GPT-5.6不只是一次能力升级,也是OpenAI对模型产品线的一次重新分层。


🔗https://openai.com/index/previewing-gpt-5-6-sol/


GPT-5.6深夜突袭,能力全系霸榜


作为OpenAI迄今最强模型。GPT-5.6 Sol的能力展示,主要集中在编程、生物信息学和网络安全三个方向。


这三类场景有一个共同特征:


复杂、长链条、强依赖上下文。模型需要在任务中持续规划、推理、调用工具、修正错误,并不断推进流程。OpenAI把这种能力称为agentic capabilities——让模型更像一个能独立执行任务的agent。


在编程场景中,GPT-5.6 Sol已经不再停留在代码补全,而是深入到命令行环境中的复杂操作。


OpenAI称,Sol在Terminal-Bench 2.1上刷新了表现。Terminal-Bench 2.1测试的是命令行工作流,任务要求模型具备规划、迭代和工具协调能力。



基准测试成绩显示,GPT-5.6 Sol Ultra在Terminal-Bench 2.1上得分91.9%,GPT-5.6 Sol得分88.8%。作为对照,GPT-5.5为88.0%,GPT-5.6 Terra为82.5%,GPT-5.6 Luna为84.3%。


横向对比其它模型,Claude Mythos 5为84.3%,Claude Fable 5为83.4%,Claude Opus 4.8为78.9%,Gemini 3.1 Pro Preview为70.7%。



Sol Ultra的成绩,也对应GPT-5.6的核心功能。


一方面,max级别的推理强度让模型可以投入更多时间进行深度推理;另一方面,新增的Ultra模式会调度多个子Agent,把复杂任务拆分处理,再统一汇总结果。


在真实开发场景里,模型经常需要理解项目结构、读取文件、修改代码、运行命令、分析报错、继续修改。一个复杂任务通常无法靠一次回答完成。Ultra模式的方向,是让多个子Agent分别处理不同环节,再把结果汇总起来,从而提高复杂任务的完成效率。


生物方向上,GPT-5.6 Sol的提升体现在GeneBench v1上。这个评测主要面向长周期基因组学和定量生物分析任务。OpenAI称,Sol相比GPT-5.5取得了更强结果,而且使用的输出tokens更少。




向左滑动查看更多内容



这一点对科研场景尤为关键。生物信息学、基因组学和定量生物分析,经常需要模型持续分析数据、解释结果、选择方法、比较假设,并在多轮操作中保持上下文一致。模型能不能完成这类任务很重要,能不能用更低tokens成本完成长链条分析同样重要。


如果Sol能在更少输出tokens下取得更强结果,意味着它在专业科研工作流中有更好的成本效率。对实验室、企业研发团队和生物医药场景来说,tokens消耗直接影响调用成本,也影响模型能否进入大规模工作流。


网络安全则是GPT-5.6 Sol最敏感的能力方向。


OpenAI称,Sol是其迄今最强的网络安全模型,能够推进长周期安全任务的性能和效率边界,包括漏洞研究和exploitation相关任务。


在ExploitBench上,GPT-5.6 Sol的表现接近Mythos Preview,但只使用了大约三分之一的输出tokens。



同时,OpenAI还提到ExploitGym——一个由UC Berkeley联合多家前沿实验室打造的评测体系,用于衡量模型在安全任务中的能力。随着推理能力提升,Sol、Terra、Luna在这一领域都有明显进步。



不过,OpenAI对这部分表述明显踩了刹车。


官方强调,Sol更擅长发现和修复漏洞,还不能稳定完成端到端攻击。在涉及Chromium和Firefox的评估中,Sol可以识别bug和程序缺陷,也就是漏洞利用的基础组件,但在测试条件下没有自主生成可运行的完整攻击链。


基于这些结果,OpenAI判断GPT-5.6 Sol尚未跨过Preparedness Framework中的网络安全关键风险阈值。


System Card🔗:https://deploymentsafety.openai.com/gpt-5-6-preview/introduction


这种踩刹车的判断显然是为了避免重走「Mythos」的老路。


一方面,OpenAI要证明Sol在网络安全任务上确实强了很多;另一方面,它也要说明Sol还没有达到必须极端限制的风险级别。更讽刺的是,这种压力很大程度上来自OpenAI自己参与塑造的AI行业炒作叙事。


与此同时,OpenAI也承认,基准测试无法覆盖所有现实用法。没有任何评测可以代表所有产品配置、多步骤攻击和真实工作流。模型可能被接入其他工具,也可能被放进更复杂的攻击链条里。


正是这种不确定性,让GPT-5.6的发布方式变得格外谨慎。


性能最强,但戏份却给了AI安全


GPT-5.6的发布说明中,安全罕见地占据了较大篇幅。


OpenAI为Sol、Terra、Luna配置了分级防护体系,能力越强,防护越严,目标是在压制攻击性用途的同时保留代码审查、漏洞研究等合法场景。


模型层面,系统被训练为拒绝违规网络安全请求,即便用户尝试伪装或绕过。生成阶段引入实时分类器,对高风险内容进行检测与拦截,必要时交由更强模型复核。账号层面则结合跨对话行为与风险信号,识别持续性滥用。


这套机制被称为分层安全栈,涵盖模型拒答、实时检测、账号审查、差异化访问与持续测试。多层协同用于应对复杂滥用,同时尽量减少对正常工作的干扰。


面向企业客户,OpenAI还提出了隐私保护检测、自主安全控制以及风险分级访问等方案,试图在安全与数据保护之间找到平衡点。



为了避免重蹈覆辙,OpenAI在自动化红队测试上投入了超过70万A100等效GPU小时,重点寻找通用jailbreak(越狱),并辅以专家人工测试。OpenAI还建立快速响应流程,对新漏洞进行复现、评估与修复,并纳入持续评测体系。


可用性方面,GPT-5.6目前仍处于有限预览阶段。


OpenAI表示,模型将先通过API和Codex向一部分可信合作伙伴开放,随后再逐步扩展到ChatGPT、Codex和更广泛的API用户。


同时,OpenAI也强调,自己相信前沿模型应该尽可能广泛地开放,并计划在未来几周内,让GPT-5.6 Sol、Terra和Luna进入更普遍的可用状态。


看起来评价不太妙


价格体系也同步公布:


按每百万tokens计费,Sol输入5美元、输出30美元;Terra输入2.5美元、输出15美元;Luna输入1美元、输出6美元。



同时,GPT-5.6引入了更可预测的prompt caching机制,支持显式cache breakpoints,并提供至少30分钟缓存生命周期。缓存写入按未缓存输入价格的1.25倍计费,读取则享受90%折扣。


当然,想要用上还需要一些时日,OpenAI宣布GPT-5.6 Sol将在7月登陆Cerebras,最高速度可达每秒750 tokens。这个版本初期同样只面向部分客户开放,后续会随着容量扩展逐步放开。


换句话说,GPT-5.6的「有限预览」并不只是产品灰度发布,更是一套安全验证流程。OpenAI需要在能力、风险与开放之间,找到一个可控的平衡点。


前沿模型发布节奏,进入新周期


两周前,Anthropic停用了其最强模型之一Fable 5,因为美国政府要求该公司限制美国境内外外国公民使用相关模型,理由是国家安全。


而在GPT-5.6的发布流程中,第一批使用用户同样不完全由OpenAI自己决定。


OpenAI在官方博客中披露,在发布前已向美国政府展示GPT-5.6的能力与发布计划。根据美国政府要求,模型将以有限预览形式上线,仅向少数可信合作伙伴开放,并且这些合作伙伴的信息已与政府共享。



《华盛顿邮报》的报道提到,美国联邦政府将审核哪些公司可以访问OpenAI的最新技术。且目前只有获得美国政府批准的公司可以访问新模型,个人用户没有申请通道。


彭博社则报道称,GPT-5.6首批开放对象约为20家合作伙伴,其中一个入口可能是亚马逊的Bedrock平台。


对此,OpenAI的态度显然是有些模凌两可。OpenAI在博客中表示,不认为美国政府参与模型访问流程应当成为长期默认机制,因为这会让最好的工具远离用户、开发者、企业、网络防御者和全球合作伙伴。



但现实是,OpenAI仍选择接受这一安排,理由是希望争取更广泛开放,同时与美国政府共同制定一套可复制的模型发布流程。


这一变化背后,是前沿AI模型逐渐被纳入国家安全框架。


过去,新模型发布主要是公司产品节奏问题。现在,一旦模型在编程、网络安全、生物和代理式工作流上跨过新的能力区间,发布节奏就可能被纳入安全和出口控制讨论。


对OpenAI来说,GPT-5.6既是一次旗舰模型预览,也是一次政策试探。OpenAI需要证明Sol足够强,也需要证明安全体系足够严密,还要在美国政府审查和商业开放之间找到可执行路径。


如此复杂的发布流程,某种程度上也「剧透」了前沿AI未来的魔幻走向:当模型能力逼近关键阈值,使用资格与使用方式,将成为比性能更为关注的事项。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定