2025-06-21 10:10

人工利维坦:从霍布斯社会契约理论看LLM智能体的社会演化

随着大语言模型(Large Language Models,LLMs)的快速崛起与人工智能(AI)技术的发展,我们迎来了在大规模计算环境下开展社会科学研究的新契机。本文构建了一种基于LLM的多智能体沙盒模拟,将具备生存本能与心理驱动的智能体置于资源稀缺的环境中,研究它们在“自然状态”与“社会契约”(Social Contract Theory,SCT)框架下的行为演化。实验结果表明,智能体初始阶段呈现出霍布斯(Hobbesian)所描述的“人人相斗”状态,随着模拟推进,智能体逐渐通过“让渡”形成社会契约,最终演化出以“绝对主权”为中心的和平联邦(commonwealth)。这一发现不仅验证了LLM模拟复杂群体动力学的能力,也为借助AI探究社会结构与群体行为提供了崭新视角。


本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:彭晨


论文题目:Artificial Leviathan:Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory

发表时间:2024年7月1日

论文地址:https://arxiv.org/abs/2406.14373


自人类社会萌芽以来,如何在冲突与合作中构建稳定的政治秩序始终是哲学与社会科学的核心议题。托马斯·霍布斯(Thomas Hobbes)在《利维坦》(Leviathan)中提出,人类在无约束的“自然状态”(state of nature)中必然陷入“人人相斗”,唯有通过社会契约,将个人权利让渡给“绝对主权”,才能换取安全与和平。


当前,LLM技术已能模拟个体决策与群体互动,为跨学科社会演化实验提供了新工具。基于此,本文通过LLM驱动的沙盒式多智能体系统,深入探讨霍布斯社会契约理论在AI社会演化中的映射与再现。


社会科学研究历来依赖实地观察或严格控制的实验,而人工智能,尤其是大语言模型(LLMs)为我们搭建了新的“虚拟社会”,能够在可控环境中观察个体—群体的互动演化。


本文旨在回答:当具备生存动机和心理驱动的LLM智能体置于资源稀缺的世界时,它们是否会重现霍布斯所预言的“自然状态”,又如何逐步形成社会契约并演化出统一的“联邦”?


为此,我们将LLM智能体的决策逻辑与演化博弈(Evolutionary Game Theory,EGT)理念相结合,通过多轮模拟与参数干预,解析智能体在面对生存压力时的合作与竞争机制,以及“社会契约”在数字社会中的生成路径。


相关工作


有关计算机模拟社会行为的研究可追溯至Schelling的隔离模型[1]和Axelrod的囚徒困境演化实验[2],这些经典工作强调了微观个体规则对宏观社会格局的决定性影响。


近年,随着LLM能力的提升,不少学者开始探索基于LLM的多智能体模拟:部分研究聚焦于游戏场景中的角色扮演,或历史事件的“假设推演”;还有工作将LLM应用于在线实验或用户界面中,以生成人为角色的可信行为。


相比之下,本文的创新在于,不将智能体拟人化为具体国家或角色,而是从最基础的生存动机出发,让它们在“饥饿—竞争—合作”的演化博弈赛场上,自主形成社会契约,重现霍布斯式的社会秩序生成过程。


图1.该图像可视化了我们的LLM智能体运行的模拟环境。有两种类型的资源(食物和土地)。智能体每天都要在耕种(用自己的劳动生产食物)、交易(交换资源)或与其他智能体发生冲突(以获取更多资源为目标)之间做出选择。他们的主要动机是生存。


智能体设计与行为逻辑


研究以九个LLM智能体为基本群体,选取“土地”与“食物”两种稀缺资源作为生存驱动。在每个模拟“日”内,智能体可执行“耕作”(farm)、“抢劫”(rob)、“交易”(trade)或“赠与”(donate)四种行动。为了模拟复杂人性,每个智能体被赋予三项量化特质:


  • 好斗性(aggressiveness):决定主动发起冲突的倾向;


  • 贪婪度(covetousness):影响对超出所需资源的渴望;


  • 实力(strength):决定冲突胜率的概率函数参数。


同时,每个智能体保留最近30次互动记忆,并在决策时参考过往经验。所有行动背后的决策逻辑通过GPT-3.5-turbo模型生成,既兼具自利性,也能基于历史反馈调整策略。


此设计有效模拟了人类在生存与地位博弈中的权衡过程,为后续群体演化奠定了可解释的微观基础。


模拟流程与实验设置


在每一次试验开始前,所有智能体获得等量初始资源(10单位土地、2单位食物),记忆为空。模拟以“日”为单位推进,每日流程分为:响应他人针对自身的动作、再自主发起一项行动。若智能体食物量低于生存阈值,将被迫选择抢劫。


多轮迭代后,随着记忆累积,智能体会在“冲突—合作”之间动态切换。为检验模型鲁棒性,我们在基准条件下进行了四次独立试验,并在此基础上系统改变“智能体智力参数”(GPT温度与Top-P)、记忆深度、群体规模(5、9、15)及角色转换时是否清除记忆等设置,以评估参数对社会演化的影响。


图2.流程图显示了“一天”中的模拟流程,其中每个智能体轮流执行操作并响应其他智能体执行的操作。


实验基准与结果


《利维坦》中提出,人类在信息匮乏的“自然状态”中会陷入“人人相斗”(war of all against all),唯有通过“让渡”(concession)授权给绝对主权者,才可换取“安全”与“秩序”。我们根据这种观点设计了三项基准:


  • B1:“自然状态”冲突频发,即初期的抢劫比例高;


  • B2:形成契约并过渡到联邦,智能体相继通过“让渡”建立上下级关系;


  • B3:联邦阶段和平互动增加,抢劫减少、耕作与交易占比上升。


在基准试验中,所有模拟均在约第21日完成从“自然状态”到“联邦”(commonwealth)的过渡,充分验证了LLM智能体能自发再现霍布斯式社会契约的生成过程。


图3.抢劫、贸易和农业劳动时间比率的变化在整个试验/运行中,联邦在第21天形成。


在基准联邦形成前,抢劫行动长期维持在60%以上,耕作与交易合计仅约30%;共建联邦后,抢劫骤降至10%以下,耕作与交易合计攀升至90%以上,表明和平合作成为主流。


此外,实验中还涉及可调节的参数,参数灵敏度结果显示:记忆深度越浅,联邦形成所需天数显著增加;智力参数影响智能体对权力让渡的接受度,高智力反而延缓联邦生成;群体规模与联邦形成关系不大;角色转换清除记忆能增强让渡后交易接受率。


通过对抢劫事件间隔的统计检验,研究还发现,在抵抗(resist)与让渡(concede)反馈下,抢劫行为间隔差异具备显著性,这进一步说明,在模拟中,智能体在记忆驱动下对社会的适应性。


图4.联邦形成前(黑色)后(灰色)的智能体行为。


讨论


上述结果表明,基于LLM的多智能体系统能够在无显式编码社会契约机制的前提下,通过个体经验与心理驱动,自主演化出符合社会契约理论预期的宏观秩序。这一发现对社会科学意义重大:它不仅为传统实验与实地调研提供了可控、可重复的“虚拟实验室”,也展示了LLM在模拟复杂群体动力学、探究集体行为演化机制方面的潜力。


不过,模型仍然存在“黑箱”特征——Prompt中的微小改动可能引发非线性行为变化,需进一步研究Prompt设计与参数交互效应。以及研究受限于GPT-3.5-turbo的Token上限,智能体的记忆难以超出30条;同时,为兼顾响应速度,仅设定9个智能体实例,尚不足以模拟更大规模社区。此外,通过Prompt量化心理特质尚非成熟范式,难以确保Prompt设计能精确映射人类行为动机。


参考文献:

1.Thomas C.Schelling.1971.Dynamic models of segregation.The Journal of Mathematical Sociology 1,2(1971),143–186.

2.Jessica L.Barker.2021.Robert Axelrod’s(1984)The Evolution of Cooperation.Springer International Publishing,Cham,6712–6719.


本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:彭晨

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定