本文来自微信公众号: 未尽研究 ,作者:未尽研究,原文标题:《Fable/Mythos 5全球下架,美国政府与Anthropic陷入监管困境》
美国政府与Anthropic又闹起来了,这次它们成了真正的AI供应链风险。
6月12日下午美东时间5时21分,Anthropic收到了美国商务部长卢特尼克的出口管制命令,要求它立即切断所有外国人访问Claude Fable/Mythos 5的权限,包括其公司内部的外籍员工。原因是已经出现了一种越狱方法,能破解这两个最前沿模型的安全措施。Anthropic不得不遵从,索性彻底关闭了这两个最新模型,Claude Opus 8等其他模型可以正常使用。
这里在半年之内,Anthropic与特朗普政府之间的第二场麻烦。3月份,因为Anthropic坚持美国国防部使用Claude模型不得用于自主武器系统,不得用于对国内公民大规模监控,而遭到国防部扣上一顶“供应链风险”的大帽子,封杀了它参与国防部和联邦政府其他部门项目资质。

但这一次,美国商务部的举动有些诡异。
据Anthropic的回应,任何一个大模型,都不可能做到完全抵御所有的越狱行为,如果政府因为发现了某种轻微的漏洞,这些漏洞并非是只有你商务部可以发现,而且所有的模型都会找到越狱漏洞——你这样对待我,是不是想整我。
来函没有具体说明其国家安全担忧的细节。我们的理解是,政府认为自己获知了一种绕过或“越狱”Fable 5的方法。我们查看了一个演示,在该演示中,这一特定技术被用于识别少量此前已知的轻微漏洞。这些漏洞看起来都相对简单,而且我们发现,其他公开可用的模型也能够发现这些漏洞,并不需要绕过安全机制。
Anthropic特意强调:在Fable发布前的几周里,Anthropic与美国政府、英国AISI、多家私营第三方组织以及内部团队合作,总计投入了数千小时,对Fable的安全防护进行红队测试。
你如果这样干成为先例的话,那以后美国整个AI行业谁也别再想部署前沿大模型了。
不仅如此,Anthropic最近还主动迎合6月2日发布的总统令《促进先进人工智能创新与安全》。这份总统令,很大程度上是对Mythos的回应——它发现网络破绽的能力太强大了,一旦落入敌手,将对美国政府网络造成重大威胁。
Anthropic CEO阿莫迪(Dario Amodei)亲自撰文《AI指数增长的对策》(Policy on AI Exponential),称如果第三方评估认定该模型存在不可接受的风险,政府应有权阻止或遏制该模型的部署。
现在商务部真的行使权力来阻止了,Anthropic却又以为对方在小题大做。
但Anthropic在硅谷,也一直被黄仁勋、安德森等批评在AI安全上小题大做,甚至不时放出“末日威胁”言论。
Anthropic在两个月前发布Mythos预览版时,称它太强大了,因为它太危险了,所以搞了个玻璃之翼计划(Project Glasswing),只给少数字信得过的大公司和大机构先使用。
前沿闭源AI惯常的叙事技巧是,你不直接说自己太强大,但你可以说自己太危险,这样所有的人才相信你太强大。
上周Anthropic正式发布了Claude Fable/Mythos 5。Mythos还是只能对少数俱乐部成员开放,而对于Fable的用户,则加入了限制使用条款,如果你想用来开发你的模型,我就自动把你降到更低一级的Claude模型去用,这一不透明的“闷骚”安全条款,遭到了业内和开发者的普遍指责,Anthropic不得不马上收回。
Anthropic围绕Mythos的危险性,也做足了功课。Anthropic研究所最近放出一篇文章《当AI构建自己》(When AI builds itself),称AI很快就要进入递归自我完善(RSI)的加速阶段,即将摆脱人类瓶颈,为了避免这种情况出现,让政府和社会有时间来做出调整和适配,他们建立中止前沿模型的研发。
阿莫迪在自己的文章里,为Mythos的出世,描绘了一幅潜在的反乌托邦图景:
它揭示了前沿模型对网络安全构成切实威胁,可能扰乱金融业、关键基础设施和国家安全。......彻底改变了全球网络安全格局。但其更广泛的意义在于,它无可辩驳地证明,人工智能模型如今已成为具有全球和国家战略意义的工具。......生物风险可能很快就会出现,而严重的人工智能自主性风险也可能紧随其后。
他还谈到了AI监管中的科林格里奇困境(Collingridge dilemma),在技术得到广泛发展和广泛应用之前,其影响难以预测;当技术根深蒂固时,控制或改变就变得困难。
公平地说,人工智能的颠覆性影响尚未显现,我们也不确切知道这些影响会以何种形式出现,这使得即使有行动的意愿,也很难制定出正确的政策。
一个可能的解释是,美国政府的各个部门,对于Fable/Mythos的发布,还没有做好准备,索性就先下达一个针对所有外国实体的禁令。
不管这次如何收场,从美国到全球的开发者,开始认真考虑美国政府的监管对于模型服务所造成的风险了。
他们所获取的第一个教训,是模型供应链的多元化,尤其是不能仅依赖单一的前沿闭源模型。
第二个教训,是实现自己的主权AI,通过部署本地模型,或者使用开源模型,获得模型使用的绝对可控。
对于企业来说,必须将系统设计成与模型无关的。通过构建智能路由层,能够在发生故障或监管禁令时,立即从前沿模型动态切换到开放权重回退方案或备用提供商的API。
在这样的情景下,开发者们很自然想到中国的开源模型,甚至对许多受影响的开发者来说,可能是必选项。
美国一家AI企业创始人/CEO费恩(Alex Finn)指出,这次商务部的禁令,仅仅是个开端,随着模型越来越接近AGI的实现,政府对前沿模型部署的干预会越来越频繁。
所以,最安全的做法是,在自家的GPU上运行Opus级别的模型,任何公司或政府,“永远都无法夺走你的本地模型。”
他预测,如果这个决定持续下去,股市真的有可能暴跌。如果AI公司不能从国际市场获利,它们就负担不起已经签下合同的数万亿美元芯片采购。而全球经济正在由这些合同支撑着。
所以,他认为特朗普政府会在周一之前撤回这一决定。
