2025年Neuron论文提出大脑存在类似AI的键值记忆架构,为理解人类与AI的记忆、遗忘提供了统一跨领域框架。 ## 1 键值记忆:AI与人类通用的记忆逻辑 键值记忆核心是“键负责定位、值负责存储”,分工明确,类似通讯录的姓名与电话号码、书籍的目录与正文。 相较于传统整体存储的自联想记忆,键值记忆只需轻量查询线索即可提取内容,能避免信息增多或相似时的混淆出错,写入和读取仅需两步完成。 Transformer、大模型RAG技术都采用该架构,研究发现人工与自然智能的记忆底层逻辑高度一致。 ## 2 大脑键值分工:海马体做索引,新皮层存内容 大脑天然符合键值记忆架构:海马体体积小,是记忆之门,负责编码充当“键”的检索索引;新皮层占大脑大部分体积,是记忆仓库,负责存储充当“值”的具体记忆内容。 情境恐惧实验显示:大鼠的恐惧记忆随时间泛化后,仅需简单环境线索即可恢复精确区分能力,证明记忆内容未消失,仅检索变得不稳定。 相似迷宫路线学习实验显示:海马体会主动拉开相似记忆的神经表征相似度降低混淆,新皮层则始终保持内容稳定,二者分工完全契合键值记忆的分离逻辑。 ## 3 键值框架下的遗忘:索引失效而非内容删除 从键值记忆视角看,遗忘并非记忆内容消失,而是海马体的“键”失效,无法匹配线索提取新皮层中存储的“值”,分为检索失败和提取不精确两类情况。 时间对记忆的影响实验显示:随时间延长回忆成功率下降,但成功回忆的内容精度和初始无差异,证明内容保存完整,仅索引能力减弱。 干扰实验显示,遗忘程度由记忆自身复杂度决定,和后续学习量无关,说明遗忘是相似记忆索引互相干扰导致的检索失败,并非新记忆覆盖旧记忆。 ## 4 AI的灾难性遗忘:内容仍在,检索竞争导致沉默 传统观点认为AI灾难性遗忘是旧知识被新知识覆盖删除,键值框架下,AI的遗忘和人类类似,是旧信息仍保留在参数空间,仅被后续学习的表征抑制了检索输出。 连续学习实验验证了该逻辑:先后学习两个任务后,第一个任务准确率从99%暴跌到9%,无需重新训练,仅放大对应任务的键值分量,准确率就能回升至99%,说明旧记忆只是被干扰成“沉默记忆”,可被重新唤醒。 ## 5 统一框架的跨领域价值 该框架核心贡献是提供了统一解释语言,将脑科学、认知心理学与机器学习的记忆机制放在同一抽象层面讨论。 框架仍为计算建模工具,并非大脑机制的最终定论,但既可以帮助加深对大脑记忆的理解,也能为AI设计提供启发:引入索引-内容分离结构或增强选择性激活,有望提升连续学习的稳定性。
当AI的键值记忆遇上大脑:原来我们和AI共享同一套记忆逻辑
2026-05-15 14:37

当AI的键值记忆遇上大脑:原来我们和AI共享同一套记忆逻辑

本文来自微信公众号: 集智俱乐部 ,作者:贾梓杏


刷短视频时,平台似乎总能“刚好知道你想看什么”;用AI写文案时,模型可以顺畅地接着你的思路往下生成;而当我们回忆童年趣事,一些零散的线索——一段旋律、一种气味——往往就能勾起完整的场景。


这些看似毫不相关的体验,其实都指向一个共同的问题:信息是如何被“存住”,又是如何被“找回”的?


在人工智能中,一个常见的解释是键值记忆(key–value memory):系统通过线索定位信息,再提取对应内容。近年来,神经科学研究也提出类似视角。2025年发表于Neuron的论文《Key-value memory in the brain》尝试用“索引—内容分工”来理解大脑:海马体更偏向提供检索线索,新皮层更多承担信息存储。


这并不意味着大脑就是一个简单的“键值系统”,但这个框架提供了一种有启发性的统一视角,让我们重新审视一个熟悉却复杂的问题:记忆是如何被组织的,又为什么会“遗忘”。


一、什么是键值记忆?AI的“记忆秘诀”很简单


键值记忆听起来专业,实则逻辑我们每天都在用:手机通讯录里,姓名是“键”(Key),电话号码是“值”(Value),找姓名就能快速查号码——这就是它的核心:“键”定位,“值”存储,分工明确。


AI领域里,键值记忆早已是标配:ChatGPT等大模型的Transformer架构、检索增强生成(RAG)技术,核心都是键值配对。它的优势,源于对传统记忆模型短板的突破。


传统自联想记忆(Auto-Associative Memory)(如图1左图所示),可以追溯到神经科学先驱约翰·霍普菲尔德在上世纪提出的Hopfield网络。在这个模型中,记忆以整体模式的形式被存储:只要给定一个不完整或带噪声的输入,网络就会自动“收敛”到最接近的完整记忆。这种机制就像把照片和名字写在同一张纸上——回忆时需要同时还原整个内容,因此一旦信息变多或彼此相似,就容易混淆或出错。


而键值记忆将“定位”和“存储”分开:“键”只负责找位置,“值”只负责存内容,像书的目录(键)和正文(值),各司其职、互不干扰。以回忆过程为例,只需要给模型一个轻量的Key,而不是一个全量的内容,就能实现Key到Value的查找。


键值记忆的流程只有两步,和查字典、找通讯录完全一致:


1.写入记忆:将“键”和“值”绑定存入系统(比如记单词时,拼写是键、中文意思是值);


2.读取记忆:用“查询线索”匹配键,提取对应的值(比如看到单词拼写,提取中文意思)。


图1:自联想记忆与键值记忆的结构对比(作者绘制),前者通过整体模式匹配进行记忆恢复,后者将记忆拆分为“键”(用于定位)与“值”(用于存储),实现解耦检索。


神奇的是,Transformer、多层感知机(MLP)乃至人类大脑,都是这套流程的不同实现——这正是论文最核心的发现:人工与自然智能,记忆底层逻辑高度一致。


二、大脑的“键值分工”:


海马体是“索引员”,新皮层是“仓库管理员”


人类大脑本身就是一套天然的键值记忆架构,论文通过大量实验,明确了两个核心脑区的分工:海马体负责“键”,新皮层负责“值”。


简单认识两个脑区:海马体是“记忆之门”,体积小但关键,受损会导致无法形成新记忆;新皮层是“记忆仓库”,占大脑大部分体积,存储常识、技能、感官体验等。


过去科学家只知两者分工不同,却不懂协同逻辑。直到1995年O’Reilly等人的工作[1]发表,人们才认识到:海马体不存具体内容,只编“索引”(键);新皮层不负责定位,只存“内容”(值)。


比如第一次去某一家特别的餐厅,海马体编码“键”——位置、装修、同行的人;新皮层存储“值”——味道、心情。后来看到相似装修(查询线索),海马体匹配键,从新皮层提取值,完整记忆就浮现了。


图2:大脑中海马体和皮层的位置示意图,蓝色弯曲状的区域即为海马体图源[1]


论文基于大量经典认知神经科学实验,建立了海马体编码键、新皮层存储值的分工框架。其中两组实验证据[2][3]最直接、可重复性最强:


实验1:记忆并未消失,而是会随时间发生泛化,并可被线索重新精确化


为了检验记忆是在消失,还是在变得难以精确提取,研究者设计了经典的情境恐惧实验。大鼠在环境A中经历电击后,会形成情境特异性恐惧记忆。


在短期测试中,这种记忆表现得非常精确:大鼠能区分高度相似的环境B和完全不同的环境C,只在A表现出明显恐惧反应。但随着时间推移,这种精确性下降——大鼠开始对相似环境B也产生恐惧反应,表现出明显的“记忆泛化”。


关键发现是,这种变模糊的记忆并非真正丢失。当研究者只提供一个简单线索(例如将大鼠短暂带回环境A进行提示)后,大鼠对A与B的区分能力可以恢复,重新表现出对A的特异性恐惧反应。


这一结果表明:记忆内容本身仍然存在,只是随着时间推移,检索过程变得不稳定,导致提取结果变得泛化;而合适的线索可以重新激活原本精确的记忆,使其“从模糊回到清晰”。


图3:小鼠情境恐惧实验流程图[4]。大鼠在环境A形成恐惧记忆,短期内可区分相似环境B与不同环境C,但随时间出现泛化;通过回到A进行提示后,记忆可重新恢复精确性。


实验2:海马体通过拉开相似记忆的表征来减少混淆,实现索引分离


为了理解大脑如何区分高度相似的记忆,研究者让大鼠学习两条高度重叠的迷宫路线(约80%路径相同),并要求它们准确区分不同路线以获得食物奖励。


在学习初期,由于两条路线高度相似,大鼠容易混淆,对应的神经活动模式也彼此接近。随着学习深入,海马体中的表征逐渐发生变化:即使在重叠路段,两条路线的神经活动模式也被明显拉开,相似度持续下降。这种变化与行为表现直接相关——表征分离越明显,大鼠的区分准确率也越高。


相比之下,新皮层中的表征始终保持较高相似性,更稳定地反映路线本身的视觉与空间特征,并不会主动放大差异。


这说明,在面对相似记忆时,大脑并不是单纯依赖存储内容来区分,而是通过海马体提高不同记忆之间的区分度,减少检索时的相互干扰。相对而言,新皮层更专注于保持内容本身的稳定与完整。


从这个角度看,两者形成了一种分工:一侧负责把相似记忆区分开,另一侧负责把内容尽可能准确地保留下来。这种分工方式,与键值记忆中定位与存储分离的思路是相契合的。


三、我们到底为什么会“遗忘”?


从键值记忆的视角来看,遗忘不再被简单理解为记忆内容的逐渐消失。相关研究(如Berens et al.[4]提出,记忆表现下降往往可以拆解为两个维度:能否被提取,以及提取是否精确。很多情况下,大脑记忆一旦存储,就长时间保存在新皮层,不会被擦除;遗忘本质是海马体的“键”失效,找不到索引,无法提取内容。


这一观点与“键值记忆”框架形成了直接对应关系:如果将记忆内容视为“值”,将检索线索视为“键”,那么遗忘更可能发生在“键”失效或匹配困难的环节,而不是“值”本身被删除。在这一假说下,一个自然的问题是:这种“检索失败”是否能够在行为实验中被观察到。为此,研究者设计了两类经典实验。


第一类实验关注时间对记忆表现的影响。受试者需要记忆屏幕上目标出现的位置,并在不同时间间隔后进行回忆测试。结果显示:随着时间延长,能够成功回忆的人数下降,但只要能够回忆,他们报告坐标的精度与第一天毫无差别。这说明记忆内容(值)始终清晰,变弱的是海马体的索引能力(键)——时间久了,线索匹配效率下降,导致“搜不到”而非“记错了”。


第二类实验则考察干扰的作用。受试者依次学习多组单词列表,并在最后回忆其中某一组。结果发现,被遗忘程度主要取决于该组内部信息的复杂度,而与后续学习内容的长度关系不大。这意味着遗忘并非“新记忆覆盖旧记忆”,而是相似记忆的索引互相竞争、互相干扰,导致检索失败。


四:AI的“遗忘”,能被“唤醒”


有趣的是,键值记忆框架也为理解AI的“灾难性遗忘”提供了新视角。


在传统机器学习的解释中,当模型先学习识别“猫”,再学习识别“狗”时,“猫”的知识被新任务“覆盖删除”了。但在这篇论文所提出的框架下,可以从另一种角度理解这一过程:模型并非完全“忘记”了猫的知识,而是在参数空间中仍然保留相关信息的情况下,后续学习的表征在推理时占据了更强的激活优势,从而在检索阶段抑制了旧任务的输出。这与键值记忆中“内容仍在,但索引竞争导致无法顺利提取”的机制具有一定形式上的相似性。


这种视角也与人类记忆中的一些现象形成呼应。例如,在日常体验中,我们常常会出现“明明知道但一时想不起来”的情况。这类现象通常被解释为信息并未丢失,而是在提取过程中受到干扰或索引路径暂时失效。不过需要强调的是,人类记忆系统依赖海马体与新皮层的协同结构,而当前人工神经网络是单一参数系统,两者在实现机制上并不相同。


尽管如此,这种“现象相似但机制不同”的对应关系,为理解不同智能系统中的记忆可及性问题提供了一种统一的描述语言。


在机器学习研究中,类似的现象也在标准的连续学习(continual learning)设置中被反复观察。例如多任务学习MLP实验:任务1识别MNIST手写数字(0和1),准确率达99%;任务2识别FashionMNIST服饰(T恤和裤子),准确率达95%,不做任何抗遗忘处理。结果表明:任务2训练后,任务1准确率从99%暴跌到9%,复现“灾难性遗忘”。但推理时放大任务1的“键值对”分量(模拟激光激活大脑沉默记忆),无需重新训练,准确率随放大系数回升,最终回到99%。这类现象进一步提示,“遗忘”在许多情况下更接近于检索竞争,而非信息彻底消失。


图4:连续学习中的遗忘与再激活[5]。模型在先后学习任务1(MNIST)与任务2(FashionMNIST)后,任务1性能显著下降,但通过增强对应任务的激活路径,可部分恢复其输出能力。


这证明:任务1的记忆没被擦掉,只是被干扰成“沉默记忆”,放大键值分量就能唤醒——和人类的遗忘与唤醒,逻辑完全一致。


五、结语:人工与自然智能的“记忆共鸣”


这篇论文的核心贡献,并不在于提出某种新的工程方法,而在于提供了一种统一的解释框架——用键值记忆的视角,将脑科学、认知心理学与机器学习中的记忆机制联系起来,使“信息如何被存储与检索”这一问题可以在同一抽象层面被讨论。


需要指出的是,键值记忆仍是一种计算层面的建模工具,更适合作为解释框架,而非对大脑机制的最终定论。大脑记忆系统涉及多脑区协同与多尺度动态过程,其复杂性远超过简单的“键—值”二分结构。因此,这一框架的意义不在于宣称“大脑等同于某种计算模型”,而在于提供了一种跨领域可对话的概念语言,使不同学科能够在同一抽象层面讨论记忆问题。


在这一框架下,一些现象获得了更统一的理解:无论是人类记忆中的“暂时想不起来”,还是机器学习中的灾难性遗忘,都可以被看作是检索过程受阻或竞争增强的结果,而非信息完全消失。这一视角也为人工智能提供了启发:通过引入类似“索引与内容分离”的结构设计,或增强特定路径的选择性激活,有望提升模型在连续学习中的稳定性。


从更宏观来看,这种跨领域对照并不是结论,而是一种起点。它提示我们,当人工智能与神经科学在同一概念框架下对齐时,既可能加深对大脑的理解,也可能推动更具持续学习能力的人工系统设计。


感兴趣可查看论文官方代码仓库(https://github.com/kazuki-irie/kv-memory-brain),亲身体验键值记忆的魅力——了解AI的记忆逻辑,也是在了解我们自己的大脑。


参考资料


[1]McClelland,J.L.,McNaughton,B.L.,and O’Reilly,R.C.(1995).Why there are complementary learning systems in the hippocampus and neocortex:insights from the successes and failures of connectionist models of learning and memory.Psychol.Rev.102,419–457.https://doi.org/10.1037/0033-295X.102.3.419.


[2]Wiltgen,B.J.,Zhou,M.,Cai,Y.,Balaji,J.,Karlsson,M.G.,Parivash,S.N.,Li,W.,and Silva,A.J.(2010).The hippocampus plays a selective role in the retrieval of detailed contextual memories.Curr.Biol.20,13361344.https://doi.org/10.1016/j.cub.2010.06.068


[3]Chanales,A.J.H.,Oza,A.,Favila,S.E.,and Kuhl,B.A.(2017).Overlap among spatial memories triggers repulsion of hippocampal representations.Curr.Biol.27,2307–2317.e5.https://doi.org/10.1016/j.cub.2017.06.057.


[4]Gutiérrez B J,Shu Y,Gu Y,et al.HippoRAG:Neurobiologically Inspired Long-Term Memory for Large Language Models[J].arXiv preprint arXiv:2405.14831,2025.


[5]Gershman et al.,Key-value memory in the brain,Neuron(2025),https://doi.org/10.1016/j.neuron.2025.02.029


[6]Berens,S.C.,Richards,B.A.,and Horner,A.J.(2020).Dissociating memory accessibility and precision in forgetting.Nat.Hum.Behav.4,866–877.https://doi.org/10.1038/s41562-020-0888-8.


[7]Wiltgen,B.J.,Zhou,M.,Cai,Y.,Balaji,J.,Karlsson,M.G.,Parivash,S.N.,Li,W.,and Silva,A.J.(2010).The hippocampus plays a selective role in the retrieval of detailed contextual memories.Curr.Biol.20,13361344.https://doi.org/10.1016/j.cub.2010.06.068


[8]Chanales,A.J.H.,Oza,A.,Favila,S.E.,and Kuhl,B.A.(2017).Overlap among spatial memories triggers repulsion of hippocampal representations.Curr.Biol.27,2307–2317.e5.https://doi.org/10.1016/j.cub.2017.06.057.


[9]Berens,S.C.,Richards,B.A.,and Horner,A.J.(2020).Dissociating memory accessibility and precision in forgetting.Nat.Hum.Behav.4,866–877.https://doi.org/10.1038/s41562-020-0888-8.

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定