多巴胺并非传统认知的"快乐分子"，其核心功能正被神经科学界重新定义。经典奖赏预测误差理论面临挑战，新研究揭示多巴胺参与威胁响应、运动调控及回溯学习等复杂机制。 ## 1. 经典奖赏预测误差理论的统治与局限 - **30年主流理论**：多巴胺通过"奖赏预测误差"机制（如1997年猴子实验）指导学习行为，解释成瘾/心理疾病等现象 - **实用但简化**：该模型能统一解释从神经元放电到人类行为，但近年发现其无法涵盖负面刺激引发的多巴胺释放（如2021年小鼠电击实验） ## 2. 新发现颠覆多巴胺单一功能认知 - **响应范围扩大**：多巴胺不仅对奖赏有反应，对威胁、压力、新鲜事物同样敏感（范德堡大学电击实验） - **多功能调控**：参与运动协调（小鼠迷宫实验）、注意力、工作记忆等，更像神经系统"通用调度员"而非专属奖赏递质 ## 3. 回溯学习理论对经典模型的颠覆 - **反向作用机制**：加州大学研究显示多巴胺可能标记"有意义事件"并触发回溯学习（小鼠随机糖水实验） - **解释成瘾难题**：经典理论无法说明戒烟者复吸渴望，而回溯理论揭示多巴胺会持续强化行为-线索关联 ## 4. 学界争论与理论演化困境 - **补丁式修正**：经典理论通过修改前提（如多巴胺爬坡现象解释）保持解释力，已成"移动靶" - **根本性分歧**：部分学者主张完善现有模型，另一派要求重建底层逻辑（如卡利帕里提出的效率调节假说）

2026-03-29 09:10

多巴胺根本不是“快乐分子”

生态学时空©

本文来自微信公众号：生态学时空，作者：复旦赵斌，原文标题：《多巴胺根本不是“快乐分子” | 一起读顶刊-2026》

刷短视频停不下来的爽感、喝到奶茶的满足、打游戏赢了的兴奋、甚至抽烟喝酒的瘾，全都是大脑里的多巴胺在起作用。它被全网称作快乐化学物质，仿佛我们所有的愉悦和上瘾，都源于这小小的神经递质。

但你可能不知道，这个流传了几十年、甚至被写进很多科普书里的结论，如今正在被神经科学界全面挑战。今年5月，全球顶尖的神经科学家们将在西班牙召开多巴胺学会年会，其中一场核心辩论，就是要争论：我们对多巴胺的经典认知，是不是从根上就错了？

统治学界30年的多巴胺经典理论

大脑里的神经细胞之间，需要靠神经递质来传递信号，你可以把它理解成大脑里的信号快递员。多巴胺就是其中研究最深入、知名度最高的一种。

过去30年，整个神经科学界对多巴胺的核心认知，叫做奖赏预测误差（RPE）假说，用大白话讲，核心逻辑是这样的：多巴胺管的不是快乐本身，而是对奖赏的预期和预测。它就像大脑里的奖惩记分员，负责把外界的信号和奖赏绑定，教大脑学会做什么能获得好处。

这个理论，起源于1997年一项猴子实验。科学家给猴子喂果汁，意外发现：

当猴子毫无预兆地喝到果汁时，大脑里的多巴胺神经元会疯狂放电，释放大量多巴胺；
反复几次后，科学家会在给果汁前先开一盏灯，慢慢的，多巴胺的释放就从喝到果汁，提前到了灯亮的那一刻——因为灯已经成了马上有果汁的信号；
如果灯亮了，猴子却没等到果汁，多巴胺的释放会立刻出现一个明显的下降，也就是大脑产生了“预期落空”的负向信号。

这个发现完美契合了巴甫洛夫的经典条件反射，还给出了精准的数学模型，一下子轰动了整个学界。

我们用生活里的例子就能秒懂：小孩第一次听到冰淇淋车的铃声，吃到冰淇淋，意外的快乐让多巴胺飙升；反复几次后，只要听到铃声，多巴胺就会提前释放，让小孩产生期待；如果听到铃声却没买到冰淇淋，多巴胺就会骤降，让小孩觉得失落、难受。

这个理论为什么能统治学界几十年？因为它太好用了。它能从最微观的神经元放电，一直解释到我们日常的行为、甚至成瘾和心理疾病：

为什么刷短视频停不下来？因为你永远不知道下一个视频会不会更有趣，这种不确定的奖赏，会让多巴胺持续释放，推着你一直往下滑；
为什么戒烟这么难？因为抽烟的动作、场景、甚至看到别人抽烟，都成了“尼古丁奖赏”的信号，提前触发多巴胺释放，让你产生强烈的渴望；
甚至多动症（ADHD）、精神分裂症的很多症状，学界也都用多巴胺的奖赏预测误差模型来解释，很多治疗药物也是围绕调节多巴胺分泌设计的。

英国诺丁汉大学的神经科学家马克·汉弗莱斯就说：多巴胺曾是神经科学里，唯一一个能用计算模型解释清楚信号是什么、在计算什么的领域。哪怕大家知道这个模型有些简化，但它依然是我们理解大脑学习、行为、成瘾的核心框架。

越来越多的漏洞

转折发生在近十年。随着实验技术的进步，科学家能更精准地监测大脑里多巴胺的释放，结果发现了越来越多经典理论根本解释不了的现象——多巴胺的作用，远比奖赏预测要复杂得多。

第一，多巴胺不光对奖赏有反应，对威胁、压力、新鲜事也会有反应

经典理论里，多巴胺是和奖赏、好处绑定的，但越来越多的实验发现，负面刺激同样会触发多巴胺释放。

美国范德堡大学的药理学家艾琳·卡利帕里，在2021年做了一项实验：给小鼠的足部施加轻微电击，结果发现，面对这种纯粹的压力、厌恶刺激，小鼠大脑里的多巴胺依然会大量释放。

这个结果完全推翻了多巴胺=奖赏的核心逻辑，也让她的论文遭遇了前所未有的审稿阻力。审稿人逼着她补做各种和奖赏相关的实验，甚至有人因为这个结论大发雷霆，用她的话说，那简直是地狱般的审稿反驳。

除此之外，还有研究发现，多巴胺会对全新的、没见过的刺激有反应，会对危险的威胁信号有反应，这些都和奖赏预测没有任何关系。

第二，多巴胺还管运动、注意力、空间位置，功能远超奖赏

科学家在监测小鼠的多巴胺神经元时发现，很多多巴胺神经元根本不关心有没有奖赏，反而会对小鼠的身体状态做出反应：比如小鼠在迷宫里的位置、移动的速度，甚至它当前的动作离目标更近还是更远，都会触发多巴胺的变化。

还有研究证实，多巴胺和我们的注意力、工作记忆、社交行为都息息相关。这就意味着，多巴胺不是一个只管奖赏和快乐的专职快递员，更像是大脑里一个广泛参与信息处理、调节神经系统效率的通用调度员。

卡利帕里就提出了一个颠覆性的观点：追问多巴胺在大脑里负责哪一个单一功能，本身就是错的。它的核心作用，是让大脑里的其他神经系统工作得更高效，帮大脑强化和任务相关的活动，更快做出决策。所以无论你研究大脑的什么功能，多巴胺都在里面发挥了作用。

第三，最颠覆的挑战：多巴胺根本不是提前预测，而是事后回溯

如果说前面的发现只是给经典理论打补丁，那美国加州大学旧金山分校神经科学家维贾伊·莫汉·南布迪里的研究，就是直接把经典理论翻了个底朝天。

经典的奖赏预测误差理论认为，学习的过程是先看到线索，再得到奖赏，大脑把线索和奖赏绑定——也就是正向的、提前预测的学习。但南布迪里提出了完全相反的理论：大脑的学习逻辑是“先得到奖赏，再回头回溯，找是什么线索带来了这个奖赏”——也就是反向的、事后回溯的学习。

他用小鼠实验验证了这个理论：给完全没受过训练的小鼠，随机间隔喂糖水。按照经典理论，小鼠一开始多巴胺反应会很高，慢慢知道糖水会随机出现，反应就会下降；但实验结果恰恰相反，小鼠的多巴胺释放，随着反复喝到糖水变得越来越高。

南布迪里的解释是：多巴胺释放不是在预测奖赏，而是在告诉大脑这件事有意义，快回头找找是什么导致了它。小鼠反复喝到糖水，多巴胺就持续触发大脑的记忆搜索，让它去寻找和糖水相关的线索，这才是学习的本质。

这个理论最厉害的地方，是它能解释经典理论完全说不通的成瘾复吸难题。经典理论认为：戒烟的人看到别人抽烟，却没有自己抽，就会产生预期落空的负向误差，慢慢就会削弱看到别人抽烟=我要抽烟的联结，久而久之就不会想抽了。但现实里，所有戒过烟的人都知道，哪怕反复忍住不抽，只要看到别人抽烟，还是会产生强烈的复吸渴望，经典理论根本解释不了这个现象。

而回溯理论完美说通了这件事：多巴胺的作用，是让大脑在抽烟获得尼古丁这个有意义的事件发生后，回头找线索。而你早就记住了获得尼古丁前，会看到别人抽烟，这个反向联结是百分之百存在的。所以哪怕你反复戒烟，只要看到别人抽烟，大脑依然会回溯到抽烟这个行为，让你产生强烈的渴望。

为什么这个理论这么难推翻？

看到这里你可能会问：既然有这么多漏洞和反例，为什么经典的奖赏预测误差理论，依然是学界的主流？

核心原因是：在提出的30年里，这个理论一直在被修改、打补丁，已经从一个清晰的模型，分化成了无数个版本，变成了一个很难被证伪的移动靶。

最典型的例子，就是多巴胺爬坡现象。十几年前科学家就发现，哪怕小鼠已经学会了灯亮=有糖水，在它从听到铃声到走到糖水旁的过程中，多巴胺释放会一路稳步上升。但按照经典理论，多巴胺的释放应该完全转移到灯亮的那一刻，后续不该有上升，这和理论完全矛盾。

结果很快就有一大批论文出来，修改了经典模型的前提：只要把小鼠的认知，从灯亮到喝糖水是一个完整的步骤，改成灯亮到喝糖水是一连串连续的小步骤，那越靠近糖水，奖赏的价值越高，多巴胺自然会爬坡。

哈佛大学的神经科学家塞缪尔·格什曼，就是修改模型适配这个现象的学者之一。他说，这些修改不是为了凑数据的临时调整，但不可否认的是，经典理论已经变得越来越万能，无论出现什么新发现，都能通过修改前提来适配，很难被彻底推翻。

很多科学家都在这场争论里分成了两派：一派认为，我们只需要继续完善经典理论，不用全盘抛弃，也就是不能把孩子和洗澡水一起倒掉；另一派则认为，这个理论已经千疮百孔，我们应该彻底换一套全新的底层逻辑，重新理解多巴胺。

解读文献：

https://doi.org/10.1038/d41586-026-00836-x

频道: 健康

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP