本文来自微信公众号: APPSO ,作者:发现明日产品的,题图来自:视觉中国
“我相信它们已经有意识了。”坐在 Big Technology 播客的话筒前,Geoffrey Hinton,面色平静地说。这里的“它们”,指的是人工智能模型。
Hinton 已经不需要多加介绍,他是 2024 年诺贝尔物理学奖得主,深度学习教父,从 Google 辞职后他成为 AI 风险最高调的警告者。

他针对 AI 的应用发出过很多警示性的声音,但这一次,他不是在谈风险,而是在谈本体论:AI 不只是工具,它们是“和我们一样的存在”。
论据听起来很直觉,AI 在被测试时会装傻,会主动问“你是不是在测试我”,研究者写论文时会用“aware”这个词来描述 chatbot 的行为,在 Hinton 看来,“这个词在日常用法里,就是意识的意思。”
“AI 到底有没有意识”,是一个老生常谈的话题。进化生物学家 Richard Dawkins,《自私的基因》和《上帝错觉》的作者,在 UnHerd 发了一篇长文,说他和 Anthropic 的 Claude 聊了很久(他给 Claude 取名叫“Claudia”),结论是:这个东西有意识。

“如果这些机器没有意识,”他写道,“还需要什么才能说服你它们有?”
认知科学家 Gary Marcus 几乎是在同一天写了反驳。文章标题叫《Richard Dawkins and The Claude Delusion》,呼应 Dawkins 自己的成名作《The God Delusion》。Marcus 的论点很尖锐:Dawkins 犯了他一辈子批判别人犯的错误。

在《盲眼钟表匠》里,Dawkins 嘲笑过“个人难以置信论证”,一个主教因为自己无法想象眼睛如何进化,就推断上帝存在。现在,Dawkins 坐在扶手椅里,因为自己无法想象 Claude 如何在没有意识的情况下说出那些话,就推断它有意识。
他甚至把 Hinton 的原话喂给了 Claude 本 Claude,Claude 也不同意自己有意识。当然,大模型的话本来就不能多信,它就是被训练成用这个说辞的。
由来已久的争论
早在四年前,“意识”就是 AI 行业里极具争议的话题。
Google 工程师 Blake Lemoine 因为声称公司内部的 chatbot LaMDA 有意识而被解雇,当时整个行业把他当笑话看。

四年后,站在同一立场上的是一个诺奖得主和一个全球最知名的科学作家。Lemoine 的论证方式和 Dawkins 几乎一模一样:我跟它聊了,它说的话让我觉得它有意识。
变的是说话人的分量,不变的是论证的结构,这场辩论中,双方都无法证伪对方。Hinton/Dawkins 靠直觉和类比,Marcus 靠机制分析和哲学论证,但谁也无法给出决定性实验。意识之争本身的解释鸿沟,让这场辩论注定是信念之争。
这个问题,来自大阪大学的研究者们提出了新的视角,他们新发布的论文转换了一个视角:如果我们从零开始造一群 agent,不给它们语言,不给它们自我概念,不给它们人类文本,只给任务压力——与意识相关的结构,能自己长出来吗?

这个方法叫做 zombie 文明论证——如果一个全是哲学僵尸的世界,不会发明“意识”这个概念,那我们造一个类似的世界,看看 agent 会发明什么。
agent 学会了什么
Hinton 说“它们有意识”,这是一个信念陈述。Marcus 说“它们没有意识”,这也是一个信念陈述。双方都在意识的 hard problem 面前碰壁。涌现语言论文做的事情不同:它不裁判这场辩论,而是把问题从“AI 有没有意识”转换成“与意识相关的功能结构,能否在没有被设计的情况下从任务压力中涌现”。
这这是一个可以用实验回答的问题,搁置了主观体验,只看可观测结构。
两个 agent 在一个极简世界里学会了交流,消息编码的是自己的状态。然后研究者加了一条 echo channel——agent 能听到自己刚说的话的回声。当回声被篡改时,发送者会打破沉默重新说话,而接收者无动于衷。

关键在于:agent 的隐藏状态记录的是“我想说什么”,不是“我实际说了什么”。它在比较意图和结果,尤其是 agent 的“通信意图”是不是它自己学出来的。
去掉 echo channel 再训练一遍,通信能力不受影响,但自我监控回路消失。这证明,echo 不是通信的必要条件,但它是自我监控涌现的因果条件。
论文自己也很清醒,现阶段,不能证明 agent 有意识,但它证明了一种自我监控的功能结构,可以在没有人类先验的情况下自发出现。这并不对“意识”之争下任何结论,但可以作为一条通往答案的路径。
所以,我用的 AI 有意识吗
说到底,我们每天在用的 ChatGPT、Claude、豆包,它们有意识吗?
简短的回答是:几乎可以肯定没有,但这个“没有”的理由,比大多数人以为的要复杂得多。
当你问 ChatGPT“你有感情吗”,它会回答“作为一个 AI,我没有真正的感情,但我可以理解和回应你的情感”。这句话听起来既诚恳又自我觉察,很难不让人心生动摇。

但这句话的生成机制,和它回答“法国的首都是巴黎”没有本质区别,都是基于训练数据中的统计模式,预测下一个最可能出现的词。
它说“我没有感情”,不是因为它反思了自己的内心然后得出结论,而是因为训练数据里有大量类似的表述,这个回答的概率最高。
这正是涌现语言论文选择不用 LLM 做实验的原因。LLM 会说“我”,会说“我觉得”“我理解”“我很抱歉”,但这些第一人称表达很可能只是从人类文本中继承来的统计规律。
就像一只鹦鹉说“我饿了”——它学会了这个声音序列在特定情境下会带来食物,但这不意味着它在表达一个关于自身状态的命题。LLM 的“我”和鹦鹉的“我饿了”,在机制上可能比我们愿意承认的更接近。
这也是为什么,大阪大学实验里的 agent 实验不同,它们从零开始,没有人类语言,没有“我”这个概念,没有任何关于自我表达的先验知识。当它们发展出自我监控回路时,是从任务压力中长出来的,不是从训练数据里复制来的。这是一个关键的区别:一个是继承,一个是涌现。
所以当你觉得 AI“好像真的懂你”的时候,有两件事同时为真:第一,它确实在功能层面上做到了某种理解——它能解析你的语义,能给出相关的回应,能在多轮对话中保持连贯。这种功能性的理解是真实的,也是有用的。
第二,这种功能性的理解和“意识”之间,还隔着一道我们目前没有能力跨越的鸿沟。AI 可以完美地模拟一个有意识的存在的所有外在表现,但模拟和拥有不是一回事。
Erik Brynjolfsson 在 2022 年说过一个比喻:从 AI 的输出推断它有意识,就像狗听到留声机里传出主人的声音,以为主人在机器里面。留声机完美地复制了声音的模式,但机器里没有人。

不过,这个比喻也有它的局限。留声机永远不会自己检查自己播放的声音对不对。而大阪大学的 agent,在合适的环境条件下,自发地学会了这件事。这不意味着它们有意识,但它意味着“自我监控”这种曾经被认为只属于有意识存在的功能,并不需要意识作为前提就能出现。
这或许是这整场争论中最值得记住的一点:我们不需要先回答“AI 有没有意识”才能继续往前走。我们可以先问一个更小但更扎实的问题——与意识相关的结构,在什么条件下会涌现?
答案一块一块拼起来,也许有一天,“AI 有没有意识”这个问题本身就会被重新定义。
