本文介绍GPT-5.6与Mythos 5被美国白宫限制部署的事件，分析美国AI监管新动向，以及其争议与未来走向。 ## 1. 事件背景：GPT-5.6与Mythos 5获白宫有限许可部署 OpenAI推出GPT-5.6系列（Sol、Terra、Luna）受限预览版，仅开放给提交给美国政府的一小部分“可信合作伙伴”。Anthropic的Mythos 5此前被突然叫停后，仅被允许重新部署给部分网络防御机构和关键基础设施运营商，通用场景的Fable 5仍在商谈重新开放。这一系列事件标志美国对前沿大模型的治理，从监管AI公司转向直接管理模型能力与部署。 ## 2. 美国政府重点管控的五类高敏感模型能力 ### 网络安全攻击能力前沿大模型已可参与长周期漏洞研究、生成利用链条、协助渗透测试，GPT-5.6三款模型都被列为网络安全高能力模型，目前尚未达到可自主完成针对加固目标端到端攻击的“Cyber Critical”最高风险等级。美国政府担忧模型结合工具、环境后可能越过现有评测边界，这类能力兼具防御加固和自动化攻击的双重属性。 ### 生物与化学风险能力 GPT-5.6被列为生物与化学领域高能力模型，其风险在于可能降低非专业人员开展危险实验的门槛，可将原本需要专业团队、大量试错的危险任务压缩为可复制操作流程。 ### 多工具自主智能体能力 GPT-5.6的“ultra”模式强调多子智能体协作，可连续数小时甚至数天执行接入工具、网络环境的长周期任务，会产生越界调用、意图误解、未经授权中间步骤的过程性风险。 ### AI自我改进能力 OpenAI称GPT-5.6尚未达到AI自我优化的高能力门槛，Anthropic也长期关注AI研发自动化与递归自我改进，核心担忧是模型若可显著加速AI研发本身，会成为不受控的下一代模型生产工具。 ### 敏感能力外流风险 Anthropic两款模型被叫停的核心原因是美国政府担忧能力被外国军方、情报机构利用，限制甚至延伸到美国境内的外籍员工，本质接近出口管制的“视同出口”逻辑。 ## 3. 美国当前前沿AI监管的六套敏捷拼接工具 ### 自愿框架转向事实上预审批特朗普政府此前建立的前沿模型自愿评测框架，经本次事件已经演变为事实上的发布前预审批机制。 ### 分阶段有限部署参考药品临床、军品许可的混合模式，先向小范围可信对象开放监控使用，再根据风险情况决定是否扩大开放范围。 ### 可信用户名单审查 OpenAI已向美国商务部、财政部、白宫相关部门共享预览参与者名单，政府通过审批可用用户控制模型扩散速度，无需出台全国性禁令。 ### 纳入出口管制管理美国商务部以出口管制权力要求限制外国国籍人士访问模型，将模型访问视为受控技术而非普通互联网服务，未来硅谷公司可能需要对前沿模型访问做外籍人员隔离。 ### 纳入关键供应链风险管控美国五角大楼已将不配合全用途要求的Anthropic列为供应链风险，未来官方采购AI时会额外审核供应商可靠性与配合度。 ### 可撤回的持续监控部署模型发布不再是监管终点，上线后仍可因风险被政府要求下架、限制或重新许可，美国已经形成“部署后监管”模式。 ## 4. OpenAI与Anthropic的不同监管待遇源于控制权分歧 OpenAI采取合作式治理路线，配合政府限制访问，接受政府作为最终合法性来源，仅反对长期永久审批制，是政府认可的可监管合作方。Anthropic坚持保留企业对模型用途的最终否决权，明确不支持完全自主武器、大规模国内监控，因此被美国政府视为不可靠的关键供应商。 ## 5. 前沿大模型是更难监管的新型军民两用技术相比传统军民两用技术（芯片、卫星等），前沿大模型监管难度更高：它是可云端调用的能力而非实物，能力可嵌入各类产品，全球可访问；军民边界高度模糊，同一能力无法简单二分，必须结合场景、用户判断；能力扩散速度快，几个月后高端能力就可能出现在更小更便宜的开源模型上，以单个模型为单位的监管很快会过时。**美国正在形成“能力型军民两用治理”：监管对象是模型的实际能力，而非单个产品，治理工具覆盖预评测、名单制、分层访问、持续监控等多环节。** ## 6. 当前监管机制的争议与改进方向特朗普政府的自愿框架已经演变为事实上的非自愿预审批制度，但目前没有清晰合规标准，存在严重政策不确定性：前沿模型训练成本极高，商业回报集中在发布后窗口期，临时审批延迟会冲击商业与投资逻辑，过严限制还会导致最强模型仅掌握在少数政府批准组织手中，削弱广泛防御能力。前白宫科技顾问鲍尔建议将治理制度化，以企业现有安全框架为基础联邦化要求，建立独立验证审计机制，政府认证审计机构后，给通过认证的企业提供责任安全港与采购资格。

2026-06-27 23:50

GPT-5.6与Mythos5，第一代白宫“许可”的模型

未尽研究

速览

本文来自微信公众号：未尽研究，作者：未尽研究，原文标题：《GPT-5.6与Mythos 5，第一代白宫“许可”的模型》

GPT-5.6系列模型刚刚发布，它自称是下一代模型，不过真正的意义，是美国政府对前沿大模型的监管，正在进入一个新阶段。

OpenAI这次推出的是一个受限预览版：GPT-5.6 Sol、Terra、Luna三款模型先只开放给一小部分“可信合作伙伴”，而这些参与者名单已经提交给美国政府。与此同时，Anthropic的Mythos 5在被突然叫停之后，又被允许重新部署给部分网络防御机构和关键基础设施运营商；更面向公众和企业通用场景的Fable 5，则仍在与政府商谈重新开放。

这几件事情放在一起看，意义远远超过一次模型发布受阻。美国政府对前沿AI的治理，正在从过去的监管AI公司，转向直接管理模型能力和模型部署，但这一做法也遭到AI治理专家的批评。

（GPT-5.6自称为下一代模型，在一些关键指标上超过Claude Mythos/Fable 5，来源：openai.com）

前沿大模型的战略能力

美国政府最在意的是网络安全能力，尤其是从发现漏洞转向利用漏洞的能力。过去，AI能够辅助写代码、审查代码、解释漏洞，更多被视为生产力工具。但当GPT-5.6、Mythos这类模型能够参与长周期漏洞研究、生成利用链条、协助渗透测试、自动修补或攻击软件系统时，事情性质就变了。对政府来说，这种能力具有天然的双重属性：它可以帮助防御者加速修补开源软件和关键基础设施，也可能帮助攻击者自动化网络攻击。

GPT-5.6的系统卡明确把Sol、Terra、Luna都列为网络安全高能力模型。OpenAI同时强调，它们还没有达到“Cyber Critical”的最高风险等级，因为在测试中模型尚未自主完成针对加固目标的端到端攻击。但政府并不只看当前基准测试，它担心的是，模型如果与工具、脚本、代理框架、浏览器、代码执行环境和外部情报结合，就可能越过单一评测所能覆盖的边界。

第二类能力是生物与化学风险。GPT-5.6同样被OpenAI列为生物与化学领域的高能力模型。这里的担忧是它是否降低非专业人员进入危险实验的门槛，例如帮助设计实验流程、排查湿实验失败、优化合成步骤，或者把分散知识组织成可执行方案。过去需要专业团队、实验经验和大量试错才能完成的危险任务，未来可能被模型压缩为可复制的操作流程。

第三类能力是智能体能力。GPT-5.6的“ultra”模式强调多子智能体协作，Sol在代码、网络安全和长周期任务上都有明显提升。一个接入工具、文件、代码库、网络环境和工作流的智能体，如果能连续数小时甚至数天执行任务，风险就变成了过程性风险。它可能越界调用工具，可能误解用户意图，也可能在复杂目标中采取未经授权的中间步骤。

第四类能力是AI自我改进。OpenAI称GPT-5.6尚未达到其AI自我优化的高能力门槛；Anthropic也长期关注AI研发自动化和递归自我改进。这说明政府和企业都在关注同一个问题：如果模型不仅能帮助人类写代码，还能显著加速AI研究本身，那么模型就可能成为下一代模型的生产工具。到那时，监管对象不再是一个静态产品，而是一个加速技术前沿移动的生产系统。

第五类风险是外国访问和模型能力外流。Anthropic的Fable 5和Mythos 5被叫停，关键不只是因为某个越狱技巧，而是因为政府把模型能力视为可能被外国军方、情报机构或网络攻击组织利用的能力。美国对“外国人访问”的限制，甚至延伸到了美国境内的外籍员工，这本质上已经接近出口管制中的“视同出口”逻辑：即使技术没有离开美国，只要外国国籍人士获得了访问，也可能被视作敏感能力外流。

从自愿评测，到准入名单，再到出口管制

美国政府目前还没有形成一套成熟、统一、可预测的前沿模型监管制度。它采取的是一组拼接式工具进行敏捷监管。

第一是政府评估正在向预审批演变。特朗普政府6月的AI与网络安全行政令建立了所谓自愿框架，要求前沿模型开发商在更广泛发布之前，把模型提前提供给政府进行能力和安全评估。名义上这是自愿机制，但GPT-5.6的发布显示，它正在迅速变成事实上的预审批机制。

第二是分阶段部署。GPT-5.6没有直接全面发布，而是先给一小部分可信伙伴；Mythos 5也不是恢复公开访问，而是恢复给网络防御组织和基础设施提供商。这种方式类似药品临床、军品许可和关键技术出口之间的混合体：先小范围、可信对象、可监控使用，再视风险扩大开放。

第三是用户名单审查。OpenAI称参与预览的可信伙伴名单已经与政府共享。媒体报道显示，相关部门并非只有一个，而是包括商务部、财政部、白宫国家网络主任办公室、白宫科技政策办公室等。用户名单成为模型治理的新工具：政府不必直接写一条全国性禁令，只要决定哪些客户能先用，哪些客户不能用，就可以控制模型扩散速度。

第四是出口管制。Anthropic事件最具标志性意义的地方，是美国商务部以国家安全和出口管制权力，要求停止外国国籍人士访问Fable 5和Mythos 5。这是把“模型访问”当成受控技术来处理，而不是把模型简单视为互联网服务。由于Anthropic无法实时按国籍筛选全球用户，结果只能关闭两个模型的全部访问。可以预见，今后硅谷的科技公司，可能会对外籍员工进行某种隔离，而外籍人士在硅谷的初创公司，也无法第一时间使用最前沿的大模型。

第五是供应链风险工具。在Anthropic与五角大楼围绕军事用途的争执中，五角大楼将Anthropic列为供应链风险。这说明在国家安全体系里，模型供应商正在被当作关键技术供应链的一环。未来军方、情报机构和关键基础设施运营商采购AI模型时，可能不仅看性能和价格，还要看供应商是否可靠、是否愿意支持“所有合法用途”、是否可能因伦理或政治理由中断服务。

第六是持续监控与可撤回部署。Fable和Mythos事件说明，模型发布不再是终点。模型即使已经上线，也可能因为越狱、能力外泄、外国访问或军事用途争议被政府要求下架、限制或重新许可。美国正在形成一种“部署后监管”模式：模型上线后依然处于政府可重新评估的状态。

OpenAI与Anthropic：同样被监管，不同的政治站位

从表面看，OpenAI和Anthropic都被限制了。GPT-5.6只能对政府认可的少数用户开放，Mythos 5也只能重新开放给少数可信伙伴。但两家公司与政府的关系非常不同。

OpenAI采取的是合作式治理路线。它强调广泛访问，但愿意在短期内配合政府要求，把GPT-5.6先限制在可信合作伙伴范围内。OpenAI的公开表态很微妙：它承认需要与政府合作、需要建立可重复的发布流程，也同时强调这种政府准入程序不应成为长期默认制度。它的基本立场是：企业负责测试、安全栈和分层访问，政府可以参与评估，但不能把前沿模型变成永久审批制产品。

OpenAI自己的安全治理依托就绪框架（Preparedness Framework）。这个框架把高风险能力分成网络安全、生物化学、AI自我改进等类别，用High、Critical等等级来决定是否需要更强安全措施。GPT-5.6认为网络和生物化学达到High，但未达到Critical；AI自我改进尚未达到High。因此可以发布，但必须采用更强的多层防护，包括模型内训练、实时分类器、账户级监控、差异化访问、使用限制和持续红队测试。

Anthropic则是更强的企业伦理边界路线。它的责任的扩展政策（Responsible Scaling Policy）从一开始就是行业里最系统的前沿模型风险框架之一，用AI安全水平（AI Safety Levels）来对应不同能力等级，并要求达到更高能力时升级部署和安全标准。Anthropic更强调公司自身对模型用途的责任，也更愿意设置不可逾越的用途红线。

这种差异在五角大楼争执中表现得最清楚。Anthropic并不否认自己为国防部门提供服务，它也强调Claude可以支持情报分析、模拟、作战规划、网络行动等任务。但它坚持两个例外：不支持完全自主武器，不支持大规模国内监控。Anthropic的说法是，军事作战决策当然应由军方负责，但公司有权对高层用途类别设置边界。

五角大楼和特朗普政府显然不接受这一点。它们更倾向于认为，只要用途合法，政府而不是企业应该拥有最后决定权。这就是OpenAI和Anthropic待遇差异背后的深层原因：OpenAI在政府框架中寻找合作空间，Anthropic试图保留企业对模型用途的最终否决权；前者更像可监管的合作方，后者则被政府视为可能不可靠的关键供应商。

这并不是说OpenAI没有安全政策，也不是说Anthropic反对国家安全。恰恰相反，两家公司都深度参与国家安全叙事。但它们对谁拥有最后控制权的理解不同：OpenAI更愿意接受政府作为最终合法性来源；Anthropic更坚持模型开发者也承担伦理责任。

智能体，一种新型军民两用技术

传统军民两用技术包括芯片、卫星、激光、加密、航空发动机、先进材料。它们的共同特点是民用价值巨大，同时也能增强军事能力。今天的前沿大模型正在进入同一类别，但它比传统军民两用技术更难管理。

原因有三点：

第一，大模型不是一个实物，而是一种可通过API调用的能力。过去出口管制管的是设备、软件包、图纸、芯片、设备和技术资料；现在监管者面对的是一个远程调用的模型服务。能力可以通过云端提供，用户可以在全球任何地方访问，模型还可以被嵌入其他产品和工作流。

第二，大模型的军民边界高度模糊。网络漏洞研究既是防御也是攻击；生物实验设计既可用于药物研发也可用于武器风险；代码智能体既能提升生产力，也能生成恶意工具；军事模拟既可用于防御，也可用于打击规划。同一个能力无法简单按“向善”和“做恶”二分，必须结合用户、场景、权限、工具链和监控体系判断。

第三，大模型能力会快速扩散。今天只有Sol或Mythos具备的能力，几个月后可能出现在更小、更便宜、更开源的模型上。前白宫科技顾问鲍尔（Dean Ball）一语中的：以模型为单位监管很困难，因为模型只是浮点数集合，实验室会不断发布新模型，能力门槛也会因为算法效率提升而迅速变化。监管一个具体模型，可能很快过时。

因此，美国正在形成的是一种“能力型军民两用治理”。监管对象不是某个产品，而是模型在网络、生物化学、自主智能体、AI研发、军事和关键基础设施中的实际能力。治理工具也不再只是出口许可证，而是预发布评测、可信用户名单、分层访问、政府采购标准、供应链风险认定、持续监控和事故后召回。

事实上的模型许可制

鲍尔撰文提出了一个很重要的判断：特朗普政府原本声称建立的是自愿测试框架，但现实中已经演变为事实上的非自愿许可或预审批制度。

鲍尔并不认为政府关注AI风险是错的。相反，他承认前沿AI的灾难性风险是真实的，尤其是在网络、生物安全和未来自主能力方面。但他批评当前机制最大的问题是：没有人知道怎样才能“合规”。政府自己似乎也没有清晰标准。实验室不知道什么样的防护足以让模型公开发布，企业也不知道政府下次会不会突然叫停某个模型。

这就产生了政策不确定性。前沿模型训练成本极高，商业回报往往集中在发布后的几个月窗口期。如果每个模型都要等政府临时判断，每周延迟都会影响实验室收入、基础设施回报和AI投资逻辑。更大的风险是，限制过严会让最强模型只掌握在极少数政府批准的组织手中，反而削弱民主社会的广泛扩散和防御能力。

鲍尔的建议不是取消治理，而是把治理制度化。他建议以各大实验室的安全框架为起点，把州级要求联邦化，要求前沿实验室公开并提交安全与安保框架；同时建立独立验证组织，对实验室是否遵守自己的安全计划、是否有效治理内部AI研发自动化和递归自我改进进行审计。政府可以认证这些独立审计机构，企业获得认证后可以得到责任安全港、采购资格或市场认可。

参考：

https://openai.com/index/previewing-gpt-5-6-sol/"Previewing GPT-5.6 Sol:a next-generation model|OpenAI"

https://www.anthropic.com/news/fable-mythos-access "Statement on the US government directive to suspend access to Fable 5 and Mythos 5\Anthropic"

https://www.hyperdimensional.co/p/what-should-be-done "What Should Be Done-by Dean W.Ball-Hyperdimensional"

AI原生产品日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定