本文来自微信公众号: 夕小瑶科技说 ,作者:未知艺术家
就在今天,财富杂志爆料,Anthropic因为内容管理系统CMS配置失误,导致近3000个未发布资产(包括草稿博客文章)被公开放置在一个可公开搜索的数据缓存中,意外泄露了尚未发布的新模型信息。
很快,Dario也承认了这个新模型的存在。
泄露的博客显示,这一新模型全面超越了Opus 4.6,堪称迄今为止Anthropic开发过的最强大AI模型。
Anthropic的一位发言人称,它代表了AI性能上的一次跃迁。
目前,Anthropic已经关闭了公众搜索和获取这些内容的权限。还好有大神眼疾手快,把这篇草稿保存了下来。
https://m1astra-mythos.pages.dev

草稿博客文章详细描述了新模型,有两个版本,分别是Mythos和Capybara两个全新的称呼,而描述的内容却是完全一致的。


Anthropic是故意的,还是不小心的?
Anthropic的王炸大模型还没捂热乎,就这么泄露了?!
事情的起因很有戏剧性。
官方在对fortune的回应中表示,这只是一次人为的操作失误。
他们用的第三方CMS工具,上传的文件默认就是公开的,除非手动改成私密。有人忘了改,于是包括这个重要的草稿在内,将近3000个内部资产就这么裸奔在公网上了。
偏偏《财富》杂志认真浏览了这批内部文件,就发现了这个惊天大瓜。
我暂且相信这次不是Anthropic的有意炒作。
因为同批泄露的,还有一名员工的育儿假文件,以及一场Dario Amodei将出席、在英国乡村庄园举行的欧洲CEO闭门峰会的详细信息。
这更像是官方无意放出的一个迷雾弹,还有很多人在猜,谁是代号,谁是“真名”。

目前主流的观点和网友M1比较类似,认为Claude Mythos才是新模型的名字,而Capybara则是内部的代号。
所以在下文,我们暂且将其称为Mythos。
更极致的性能提升
在这篇泄漏的草稿中,Anthropic将Mythos描述为一个全新的模型层级:
比Opus 4.6更大、更强,运行成本更高,同时订阅价格也更高昂。
不仅如此,与Opus 4.6相比,其在软件编程、学术推理以及网络安全等测试中的分数均有显著提高。
Anthropic内部说,这是迄今为止他们开发过的最强大的AI模型。
我们都知道,Anthropic Claude现有的模型产品线分为三档:
Haiku(最小最快),Sonnet(中间档),Opus(最大最强)
而Mythos将成为Opus之上的第四档。
目前Anthropic已经完成了对Claude Mythos的训练。
但是由于种种原因,只有少数早期接入客户在内测,暂时没有对公众开放。
巨大的安全隐患也在降临
那么话又说回来,为什么训练完了这么厉害的模型,Anthropic却不敢公开?
原因之一是——这个模型强大到连Anthropic自己都有点害怕。
泄露的草稿中说:
这一系统在网络能力方面目前远远领先于其他任何AI模型。
也就是说,Mythos能够以远超防御者应对能力的方式利用漏洞。
黑客拿到它,可能会发动规模远超以往的自动化网络攻击。
Anthropic也坦言,他们这次格外谨慎,希望能够全面理解Mythos带来的风险——
不仅仅是自身测试中发现的那些,还会重视在短期内在网络安全领域可能造成的真实威胁。
这个担忧不无道理。毕竟同期,Opus 4.6就已经能在生产代码库中发现此前从未被发现过的漏洞了。
当AI的攻击能力开始跑赢防御能力,网络安全防御将会面临更大的风险。
所以Anthropic这回的发布策略是,先向网络安全防御机构开放早期访问权限,让他们抢先用这个模型来加固自己的代码库。在黑客大规模利用之前,先把漏洞堵上。
可惜的是,我们与Mythos正式见面的时间,又要晚一些了。
