本文来自微信公众号: 生态学时空 ,作者:复旦赵斌,原文标题:《多巴胺根本不是“快乐分子” | 一起读顶刊-2026》
刷短视频停不下来的爽感、喝到奶茶的满足、打游戏赢了的兴奋、甚至抽烟喝酒的瘾,全都是大脑里的多巴胺在起作用。它被全网称作快乐化学物质,仿佛我们所有的愉悦和上瘾,都源于这小小的神经递质。
但你可能不知道,这个流传了几十年、甚至被写进很多科普书里的结论,如今正在被神经科学界全面挑战。今年5月,全球顶尖的神经科学家们将在西班牙召开多巴胺学会年会,其中一场核心辩论,就是要争论:我们对多巴胺的经典认知,是不是从根上就错了?
统治学界30年的多巴胺经典理论
大脑里的神经细胞之间,需要靠神经递质来传递信号,你可以把它理解成大脑里的信号快递员。多巴胺就是其中研究最深入、知名度最高的一种。
过去30年,整个神经科学界对多巴胺的核心认知,叫做奖赏预测误差(RPE)假说,用大白话讲,核心逻辑是这样的:多巴胺管的不是快乐本身,而是对奖赏的预期和预测。它就像大脑里的奖惩记分员,负责把外界的信号和奖赏绑定,教大脑学会做什么能获得好处。
这个理论,起源于1997年一项猴子实验。科学家给猴子喂果汁,意外发现:
当猴子毫无预兆地喝到果汁时,大脑里的多巴胺神经元会疯狂放电,释放大量多巴胺;
反复几次后,科学家会在给果汁前先开一盏灯,慢慢的,多巴胺的释放就从喝到果汁,提前到了灯亮的那一刻——因为灯已经成了马上有果汁的信号;
如果灯亮了,猴子却没等到果汁,多巴胺的释放会立刻出现一个明显的下降,也就是大脑产生了“预期落空”的负向信号。
这个发现完美契合了巴甫洛夫的经典条件反射,还给出了精准的数学模型,一下子轰动了整个学界。
我们用生活里的例子就能秒懂:小孩第一次听到冰淇淋车的铃声,吃到冰淇淋,意外的快乐让多巴胺飙升;反复几次后,只要听到铃声,多巴胺就会提前释放,让小孩产生期待;如果听到铃声却没买到冰淇淋,多巴胺就会骤降,让小孩觉得失落、难受。
这个理论为什么能统治学界几十年?因为它太好用了。它能从最微观的神经元放电,一直解释到我们日常的行为、甚至成瘾和心理疾病:
为什么刷短视频停不下来?因为你永远不知道下一个视频会不会更有趣,这种不确定的奖赏,会让多巴胺持续释放,推着你一直往下滑;
为什么戒烟这么难?因为抽烟的动作、场景、甚至看到别人抽烟,都成了“尼古丁奖赏”的信号,提前触发多巴胺释放,让你产生强烈的渴望;
甚至多动症(ADHD)、精神分裂症的很多症状,学界也都用多巴胺的奖赏预测误差模型来解释,很多治疗药物也是围绕调节多巴胺分泌设计的。
英国诺丁汉大学的神经科学家马克·汉弗莱斯就说:多巴胺曾是神经科学里,唯一一个能用计算模型解释清楚信号是什么、在计算什么的领域。哪怕大家知道这个模型有些简化,但它依然是我们理解大脑学习、行为、成瘾的核心框架。
越来越多的漏洞
转折发生在近十年。随着实验技术的进步,科学家能更精准地监测大脑里多巴胺的释放,结果发现了越来越多经典理论根本解释不了的现象——多巴胺的作用,远比奖赏预测要复杂得多。
第一,多巴胺不光对奖赏有反应,对威胁、压力、新鲜事也会有反应
经典理论里,多巴胺是和奖赏、好处绑定的,但越来越多的实验发现,负面刺激同样会触发多巴胺释放。
美国范德堡大学的药理学家艾琳·卡利帕里,在2021年做了一项实验:给小鼠的足部施加轻微电击,结果发现,面对这种纯粹的压力、厌恶刺激,小鼠大脑里的多巴胺依然会大量释放。
这个结果完全推翻了多巴胺=奖赏的核心逻辑,也让她的论文遭遇了前所未有的审稿阻力。审稿人逼着她补做各种和奖赏相关的实验,甚至有人因为这个结论大发雷霆,用她的话说,那简直是地狱般的审稿反驳。
除此之外,还有研究发现,多巴胺会对全新的、没见过的刺激有反应,会对危险的威胁信号有反应,这些都和奖赏预测没有任何关系。
第二,多巴胺还管运动、注意力、空间位置,功能远超奖赏
科学家在监测小鼠的多巴胺神经元时发现,很多多巴胺神经元根本不关心有没有奖赏,反而会对小鼠的身体状态做出反应:比如小鼠在迷宫里的位置、移动的速度,甚至它当前的动作离目标更近还是更远,都会触发多巴胺的变化。
还有研究证实,多巴胺和我们的注意力、工作记忆、社交行为都息息相关。这就意味着,多巴胺不是一个只管奖赏和快乐的专职快递员,更像是大脑里一个广泛参与信息处理、调节神经系统效率的通用调度员。
卡利帕里就提出了一个颠覆性的观点:追问多巴胺在大脑里负责哪一个单一功能,本身就是错的。它的核心作用,是让大脑里的其他神经系统工作得更高效,帮大脑强化和任务相关的活动,更快做出决策。所以无论你研究大脑的什么功能,多巴胺都在里面发挥了作用。
第三,最颠覆的挑战:多巴胺根本不是提前预测,而是事后回溯
如果说前面的发现只是给经典理论打补丁,那美国加州大学旧金山分校神经科学家维贾伊·莫汉·南布迪里的研究,就是直接把经典理论翻了个底朝天。
经典的奖赏预测误差理论认为,学习的过程是先看到线索,再得到奖赏,大脑把线索和奖赏绑定——也就是正向的、提前预测的学习。但南布迪里提出了完全相反的理论:大脑的学习逻辑是“先得到奖赏,再回头回溯,找是什么线索带来了这个奖赏”——也就是反向的、事后回溯的学习。
他用小鼠实验验证了这个理论:给完全没受过训练的小鼠,随机间隔喂糖水。按照经典理论,小鼠一开始多巴胺反应会很高,慢慢知道糖水会随机出现,反应就会下降;但实验结果恰恰相反,小鼠的多巴胺释放,随着反复喝到糖水变得越来越高。
南布迪里的解释是:多巴胺释放不是在预测奖赏,而是在告诉大脑这件事有意义,快回头找找是什么导致了它。小鼠反复喝到糖水,多巴胺就持续触发大脑的记忆搜索,让它去寻找和糖水相关的线索,这才是学习的本质。
这个理论最厉害的地方,是它能解释经典理论完全说不通的成瘾复吸难题。经典理论认为:戒烟的人看到别人抽烟,却没有自己抽,就会产生预期落空的负向误差,慢慢就会削弱看到别人抽烟=我要抽烟的联结,久而久之就不会想抽了。但现实里,所有戒过烟的人都知道,哪怕反复忍住不抽,只要看到别人抽烟,还是会产生强烈的复吸渴望,经典理论根本解释不了这个现象。
而回溯理论完美说通了这件事:多巴胺的作用,是让大脑在抽烟获得尼古丁这个有意义的事件发生后,回头找线索。而你早就记住了获得尼古丁前,会看到别人抽烟,这个反向联结是百分之百存在的。所以哪怕你反复戒烟,只要看到别人抽烟,大脑依然会回溯到抽烟这个行为,让你产生强烈的渴望。
为什么这个理论这么难推翻?
看到这里你可能会问:既然有这么多漏洞和反例,为什么经典的奖赏预测误差理论,依然是学界的主流?
核心原因是:在提出的30年里,这个理论一直在被修改、打补丁,已经从一个清晰的模型,分化成了无数个版本,变成了一个很难被证伪的移动靶。
最典型的例子,就是多巴胺爬坡现象。十几年前科学家就发现,哪怕小鼠已经学会了灯亮=有糖水,在它从听到铃声到走到糖水旁的过程中,多巴胺释放会一路稳步上升。但按照经典理论,多巴胺的释放应该完全转移到灯亮的那一刻,后续不该有上升,这和理论完全矛盾。
结果很快就有一大批论文出来,修改了经典模型的前提:只要把小鼠的认知,从灯亮到喝糖水是一个完整的步骤,改成灯亮到喝糖水是一连串连续的小步骤,那越靠近糖水,奖赏的价值越高,多巴胺自然会爬坡。
哈佛大学的神经科学家塞缪尔·格什曼,就是修改模型适配这个现象的学者之一。他说,这些修改不是为了凑数据的临时调整,但不可否认的是,经典理论已经变得越来越万能,无论出现什么新发现,都能通过修改前提来适配,很难被彻底推翻。
很多科学家都在这场争论里分成了两派:一派认为,我们只需要继续完善经典理论,不用全盘抛弃,也就是不能把孩子和洗澡水一起倒掉;另一派则认为,这个理论已经千疮百孔,我们应该彻底换一套全新的底层逻辑,重新理解多巴胺。
解读文献:
https://doi.org/10.1038/d41586-026-00836-x
