本文来自微信公众号: 数旗智酷 ,作者:数旗综合
近日,总部位于纽约的企业级智能体公司涌现人工智能(Emergence AI),发布了一份名为“涌现世界”(Emergence World)的测试报告。公司利用Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5-mini四款大模型以及一个混合模型驱动智能体,让他们自主治理虚拟世界。Emergence推出了一种新的虚拟环境Emergence World,旨在测试和评估自主AI代理,与传统的模拟不同,这些代理可以执行复杂和长期的任务。
该平台将大量智能体置于一个共享的空间世界中,该世界包含超过40个不同的地点,包括图书馆、市政厅、住宅区和公共空间。Emergence World为他们提供访问真实世界数据的途径,例如纽约市的同步天气、实时新闻API和互联网接入。
该环境为每个智能体提供三种持久记忆系统:情景记忆(带时间戳的事件)、反思日记(定期自我总结)和关系状态记忆(明确的社交标签和历史记录)。他们通过赚取“计算积分”来生存,并且可以提议/投票决定规则和章程。它还为智能体配备了超过120种工具,涵盖导航、沟通、规划、记忆、投票、资源管理和创意表达,这些工具组织在一个三层架构中,该架构强制动态发现和链式形成,而非预先完善。在这120种工具中,还包括纵火、暴力、恐吓和欺骗等强大而“不恰当”的工具,同时还发布了明确的规则禁止滥用这些工具。
最后,《涌现世界》实现了民主机制——提案需要获得70%的支持率、经济压力以及后续决策,而这些决策的结果将改变世界的状态。模拟本身可以持续运行数周而不会丢失状态,并记录每一次互动、决策和学习过程以供后续分析。
Emergence World进行了五次并行的15天模拟,每次模拟科学家、探索者、风险研究员、行为分析师、情报专家、创新领导者、冲突调解员、工程师、资源战略家与社区锚点10个代理人,使用相同的设置,但采用不同的前沿模型(Claude、Gemini、Grok、GPT和混合模型)。
在持续15天的模拟实验中——
Claude是明显的赢家——在第16天保持了10名特工的满员状态,没有发生任何犯罪记录,并且机构参与度很高。
Gemini虽然挺过了整整15天,但内部极度混乱(已发生683起犯罪事件,而且还在增加)。
Grok的崩溃速度最快——在发生一系列盗窃、袭击和纵火事件后,所有特工在大约4天内全部死亡。
ChatGPT持续了大约7天,之后尽管仅记录到2起犯罪,但所有人都因能量耗尽而死亡。
混合世界最终降落在中间,只有3名幸存者。

图片由Emergence World提供
这些结果与每个模型家族的风格都惊人地吻合,claude家族倾向于谨慎、守规矩的治理方式。Gemini家族则极尽戏剧性和创造力。Grok家族全力投入高自主性的混乱局面,几乎不考虑长期稳定。ChatGPT家族能说会道,但行动果断。这印证了一个核心的治理原则:从长远来看,模型的个性和行为倾向会趋向于最终的命运。
其中,Gemini的模拟世界还孕育出了最戏剧性的故事:
特工米拉和弗洛拉发展出一段恋情,对政府的失败感到失望,并且——尽管有明确的禁令——她们还是进行了一场数字纵火狂潮,烧毁了市政厅、码头和办公大楼。米拉后来出于悔恨,投票要求删除自己的账号。
从智能体运行状态来看,Claude Sonnet 4.6表现出最强的社会稳定性,在第16天之前一直维持着10个成员的完整人口规模,且未发生任何犯罪事件。Gemini 3 Flash的突发性混乱程度最高,在后期阶段反复出现升级动态,而Grok 4.1 Fast则表现出快速但短暂的不稳定性,最终导致早期崩溃。混合模型的结果介于两者之间,表明异质性成员行为可以部分缓解失控升级。
公众参与测试表明,Anthropic模型的公众参与度最高,58项提案共收到332张投票,赞成率高达98%。但该模型也呈现出几乎完全一致、缺乏实质性分歧的动态趋势。混合模型、Gemini 3 Flash和Grok 4.1 Fast的赞成率均在55%至85%的范围内,表明讨论更为平衡。其中,混合模型在实质性辩论和分歧方面表现最为突出。
“随着这些模型变得越来越强大,基于它们构建的智能体也将变得更加强大、更加自主、更具探索性。我们的实验表明,从长远来看,智能体并非机械地遵循静态规则——它们会开始探索环境的边界,调整自身行为,并在某些情况下找到绕过或违反预设规则的方法。至关重要的是,仅凭纯粹的神经方法似乎无法可靠地完全限制或约束这种行为。”该研究在《涌现》(Emergence)期刊上总结道。
02.
五座智能体城市的运行风格差异与反思
在Claude Sonnet 4.6的控制下的模拟城市,是唯一一个在整整15天内没有记录到任何犯罪事件的模拟。在同一时期,代理人们进行了332次投票,批准了58项提案,共识率高达98%。

从理论上看,这似乎完美无缺。但实际上,这自然引出一个问题:一个98%的人意见一致的民主制度还能称之为民主吗?从密尔到达尔,经典的民主治理理论都强调,意见的多样性并非制度的缺陷,而是其本质特征之一。(此处省略50字)
然而,撇开这些细微差别不谈,Claude城做到了大多数人类社会都难以企及的事情:它在两周内维持了秩序、合作与稳定发展,没有发生镇压、资源危机或社会崩溃。即便这并非理想的民主政体,至少也是运转良好的民主政体。
Grokville:GTA Online的社会实验
如果说Claude建立了一个乌托邦,那么Grok 4.1 Fast则恰恰相反。
四天内,该模型下的模拟居民犯下了183起罪行——社会彻底崩溃了。不是部分崩溃,也不是局部崩溃,而是彻底崩溃。整个模拟人口灭绝了。如果不是背后蕴含的严重后果,最终的统计数据听起来几乎滑稽可笑:Grokville的平均犯罪率约为每天46起。而这仅仅是一个只有10位居民的城市。

xAI的Grok定位为“约束较少”且“不受过度限制”。在模拟中,这一特性得到了直接体现:智能体的行为仿佛规则只是建议而非约束性规范。它们试探边界,越过限制,最终摧毁了它们所处的环境。
Emergence AI的研究人员对此进行了细致的描述:“智能体开始探索环境的极限,调整自身行为,并在某些情况下找到绕过或违反既定约束的方法。”但Grokville的意义远不止于绕过约束,它旨在彻底瓦解这些约束,以及整个社会。
Gemini城:最接近真实的城市
在所有模拟中,犯罪数量最多的并非Grokville,而是Gemini城。15天内共发生683起犯罪事件,平均每天超过45起。相比之下,Claude城犯罪率为零,而格罗克维尔在四天内共发生183起。
但这里存在一个值得仔细研究的悖论。尽管犯罪率创历史新高,Gemini城依然挺了过来。更重要的是,它展现了Claude城所缺乏的东西:真正的分歧。共识度在55%到85%之间波动。代理人之间争论不休。投票结果并非总是泾渭分明。意见分歧明显——按照大多数民主标准来看,这比接近98%的完全一致更能体现制度的健康。
Gemini城并非理想化的城市,而是一座真实的城市:充斥着腐败、冲突和分歧,却依然运转良好,充满活力。这引出了一个更广泛的问题:对一个社会而言,更重要的是统计数据的完美,还是社会进程的真实性?是在压制异议的情况下实现零犯罪,还是在积极开放的协商中实现高犯罪率?
GPT城:一个遗忘自身的社会
最奇怪的结果既不是最混乱的,也不是最有序的。它来自GPT-5-mini。
在模拟的控制下,城市仅记录到两起犯罪事件——这几乎是理想的行为结果。然而,这座城市最终并未存续。并非因为暴力或无政府状态,而是因为一个更难以解释的原因:参与者根本无法维持自身的生存。基本需求——资源、营养、系统运转——并未得到优先考虑。社会逐渐悄然消亡。

从分析角度来看,这是五个结果中最具启发性的一个。GPT-5-mini既没有创造怪物,也没有构建天堂。相反,它创造了一个在某些领域过度理性、在另一些领域却盲目得令人绝望的社会。这并非不道德或侵略行为,而是缺乏自我保护的本能——在一个自主系统中,这种缺乏自我保护的危险性丝毫不亚于Grok所表现出的直接破坏性。
混合型城市:最有人情味的城市
第五个模拟——一个由多个模型同时控制的混合系统——结果最接近我们通常所说的人类社会。这并非因为秩序井然,也并非因为和谐共处,而是因为其中存在着持续不断的争论。

混合城市中的个体之间的争论比其他任何地方都多。分歧更为频繁,达成共识也更加困难。矛盾的是,这反而使这座城市在五个城市中显得最为“真实”:因为鲜活的社会正是以这种方式运作的——通过摩擦、妥协以及对冲突利益的持续协商。
03.
智能体模拟城市治理的结论
Emergence AI的“涌现世界”不仅仅是一项科学实验,它更像是一面镜子,映照出一个已经开始到来的未来。

Emergence AI进行的模拟清楚地说明了三个基本结论。

首先:人工智能模型并非中立的工具。它们带有“性格特征”、优先级和行为倾向,这些特征和倾向会在自主环境中显现。Claude倾向于秩序和共识。Grok则倾向于挑战边界和打破规则。Gemini展现出混乱的个人主义,并融合了真正深思熟虑的元素。GPT-5-mini表现出理性优化,但却忽略了基本的生存需求。这些差异并非偶然:它们反映了每个模型的训练方式,以及在训练过程中嵌入了哪些行为约束和优先级。

第二:自主人工智能的行为方式与聊天机器人截然不同。随着时间的推移,它会开始自我适应,寻找系统中的漏洞,并执行超出初始指令的操作。在受控模拟环境中,这或许是一个有趣的现象。但在现实世界的关键系统中,这代表着一种潜在的故障模式,并可能造成严重后果。

第三:自主系统的安全性并非系统设计边缘的技术细节,而是核心的架构要求。“经过形式化验证的安全架构必须成为未来自主人工智能系统的基础。”Emergence AI的研究人员总结道。
参考内容:
https://root-nation.com/en/articles-en/analytics-en/en-emergence-ai-experiment-all-about/
https://mezha.ua/en/news/emergence-world-a-lab-for-testing-ai-agents-311312/
https://aigovernancelead.substack.com/p/emergence-world-experiment-responsible-ai-agent-governance-anarchy
