本文是对冯建峰团队全球首个数字孪生脑项目的访谈,介绍研发逻辑、成果与未来方向,展现其对脑科学与人工智能的价值。 ## 1. 数字孪生脑的研发背景与核心逻辑 数字孪生脑是用计算机复现人脑运算方式的研究,项目7年前启动,源于计算机科学家复刻人脑运算的百年梦想,同时遵循「结构仿脑才能实现功能仿脑」的核心逻辑。 当前主流AI如反向传播、大模型并未从根本解决复杂非线性问题的线性可分难题,也没有最优层数标准,未达到人类智能水平,结构仿脑的研究有其独特价值。 ## 2. 实现数字孪生脑的三大核心难点 第一个难点是人脑神经元互联通信:人脑共约860亿神经元,每个神经元平均连接超1000个神经元,静息状态通信规模远超全球无线通信总流量,需要研发新的路由方法适配现有计算机架构。 第二个难点是突触权重的数学优化:人脑共有约100万亿个突触权重需要学习优化,需要通过自研的随机动力同化算法拟合参数。 第三个难点是生物层面的任务态拟合:目前数字孪生脑静息态时间序列与真实人脑的拟合度已达94%,但任务态仍需依托数据同化技术匹配真实脑活动,目前相似度仍有待提升。 ## 3. 数字孪生脑的研发进展与当前应用 冯建峰团队耗时七八年完成个人数字孪生脑研发,目前仅需数小时即可生成个人静息态数字孪生脑,相关成果2024年12月发表于《自然-计算科学》,被评价为里程碑式工作。 当前该技术已有三类落地方向:作为医学研究平台,用于脑肿瘤、抑郁症研究与脑机接口开发;作为生物学研究平台,可复现斑马鱼等模式生物的神经元活动与行为;推进神经元计算机研发,探索通用人工智能的实现路径。 团队同时已完成小鼠数字孪生脑研发,可控制机器鼠完成模拟行为,当前该项目的运行速度相比真实人脑约为70倍减速,目标是实现与人脑同步运行。 ## 4. 领域核心问题与未来发展方向 人工神经网络与生物神经网络存在本质区别:人工神经网络传递连续确定性信号,生物神经网络依托离散脉冲电信号传递,且生物神经元是随机输入输出系统,目前学界仍未破解大脑信息处理的底层规则。 冯建峰团队下一步将围绕脑疾病治疗「沿途下蛋」,终极目标是从数字孪生脑拓展到数字孪生人,实现对个体全状态的数字化复刻与预测。
你的数字孪生脑能告诉你什么?:冯建峰谈数字孪生脑的研发与应用
2026-06-18 18:13

你的数字孪生脑能告诉你什么?:冯建峰谈数字孪生脑的研发与应用

本文来自微信公众号: 世界科学 ,作者:世界科学等,原文标题:《你的数字孪生脑能告诉你什么?——冯建峰谈数字孪生脑的研发与应用 | 锚点》


Q:冯老师,您做出了全世界第一个数字孪生脑。这个数字孪生脑是什么?


A:


做数字孪生脑其实就是在研究怎样用计算机来复现人脑的运算方式。


做物理和做数学研究的人经常会有一种想法:“凡我不能创造的,我就不能理解。”这也是费曼的名言。所以我们一直在想,能否通过如今的计算机来实现对大脑运行情况的模拟。


大概在7年前,我们才真正启动这个项目。但是,从计算机的角度来看,数字孪生有着很早的渊源。


世界上第一位真正编写计算机程序的人是阿达·洛芙莱斯(Ada Lovelace)。


Q:您是说拜伦(George G.Byron)的女儿?


A:


是的。她应该是第一个把数学思维应用于编程开发的人,也是公认的计算机编程之母。实际上,包括图灵在内的许多科学家,最终的梦想都是用计算机来复现人脑的运算方式。这也是我们开展数字孪生脑研究的起源之一。


除此之外,这项研究还有另一层初衷。从某种意义上来说,如今的人工智能在部分功能层面已经实现了“仿脑”,比如在语言上。但我们认为,如果无法在结构上仿制脑,就永远不可能真正在功能上实现仿制脑。


Q:人工智能领域有很多学派,其中的符号主义学派认为,我们做到跟脑子有相似的功能就行了,根本不需要去模仿脑的结构。但是有没有这样一种可能——模仿脑的结构本身就有价值?


A:


在我看来,做人工智能做得最成功的两个人是2024年诺贝尔物理学奖得主杰弗里·辛顿(Geoffrey Hinton)和2024年诺贝尔化学奖得主德米斯·哈萨比斯(Demis Hassabis)。其实,看他们俩的背景就能明白。比如辛顿,我跟他很熟,他本科学的是剑桥大学的心理学专业,当时差点儿毕不了业,后来去了爱丁堡大学的信息学系攻读博士学位。但是,他本质上还是心理学背景,他几乎在每一篇论文里都强调要跟脑学习。


现在人工智能领域的一些概念,比如神经元(neuron)、神经计算(neural computation),命名都与心理学领域对人体生物神经元的英文称呼neuron有关。人工智能的发展也从人脑的运作机制里得到了很多启发,比如人工神经元的计算逻辑就借鉴了生物神经元的信息传递模式。但反观当下人工智能领域的一些主流技术——反向传播算法也好,大模型也好,到底有智能吗?把复杂非线性问题转化为线性可分问题是人工智能领域的核心难点,而反向传播算法并未从根本上攻克这一难题。同时,深度学习模型究竟设置多少层结构为最优,至今也没有标准答案。


或许如今人工智能的确可以帮助我们解决许多问题,但是还有许多问题是它解决不了的,它并没有真正达到人的智能水平。所以说,科学永远在路上。


Q:您做数字孪生脑的方法论是什么?存在哪些关键难点?


A:


从某种意义上来说,数字孪生脑的实现得益于交叉学科这一背景。其间,我们面临的第一个难点就是860亿神经元的互联通信。这些神经元并不是独立的、没有任何结构的,否则我们只要把计算机“堆叠”起来,让每个计算机模拟一个神经元,就能轻松实现。真正的问题在于,每个神经元平均要跟另外1000个甚至更多的神经元有连接、能通信。


我的脑子什么事都不干的时候,其通信规模就远超我国整体无线通信总量,甚至是全球无线通信流量总和。人脑的神经计算方式完全不同于传统电子设备的计算范式。所以,我们如何能在现有计算机的架构上复刻人脑的通信模式,是一个大问题。我们要有新的路由方法。


第二个是数学层面的问题,即神经元突触权重的学习优化。人工智能领域的“权重”概念也源自神经科学领域。两个神经元之间的连接强度即为突触权重。打个比方:我发送一个信号,你接收到的是这个信号乘以当前突触权重的结果。如果经过学习,权重变大了,那么我发送同样的信号,你接收到的数值就会变大。单个神经元平均至少可与1000个其他神经元建立连接。如此一来,我们就有100万亿左右的突触权重要去学习。我们花了很大的精力来运用数学方法学习这100万亿个参数。


第三个是生物层面的问题。比如,我们把人脑分成10万个模块,每个模块对应一条时间序列,这样就有10万条时间序列在运行。我们做出来的数字孪生脑在结构与规模上高度趋近真实人脑,也能计算出10万条时间序列。这两组时间序列的相似度有多高?我们能达到94%,拟合度很好。但是,这种在“静息态”(理论上就是指躺在那里什么都不做,尽可能地保持静止)下实现的高拟合度并没有直接用处,因为大脑要跟环境相互作用才有实际意义。


与静息态相对的就是“任务态”。以自动驾驶这类实际应用为例,若要让数字孪生脑去控制车怎么走,就需要依托数据同化技术让模型在任务态下也能与真实脑活动保持高度一致。


也就是说,我们做数字孪生脑需要克服计算机、数学、生物三大层面的难点。只有克服了这些,数字孪生脑才能真正被做出来并被用起来。


Q:“数据同化”这个概念很有趣,这是一个算法吗?是你们发明的?


A:


数据同化这一概念并不是我们的发明,但是我们在自己的系统中运用的同化算法是自己研发的。从某种意义上讲,它是一种随机动力系统:我先模拟真实大脑结构搭建一个数字孪生系统,然后让这个模型去学习、拟合有关真实大脑的观测数据,使得二者尽可能地相像、同化。


Q:具体来说,就是通过调整模型中的参数,使得它表现出来的那些可测量的行为跟物理观测到的行为尽可能地相似。


A:


没错,就是这个意思。这个系统要解决的就是怎么去拟合这100万亿个参数的问题。


Q:这里的核心就在于,您要拟合的参数比您的可测量值要多得多,所以这应该是一个多解的问题。


A:


对,因为它是一个很复杂的非线性系统,肯定是多解。我们虽然可以做足够长的时间观测,可以堆数据,但是永远无法保证是唯一解。我们做出来的数字孪生脑也许是“冯建峰A”,也许是另外100个、1000个版本的“冯建峰”。我只能说,在观测上它们俩一样。


Q:还有一个特别有趣的点——您做的这个数字孪生脑的样本其实就是自己的脑。听说您为此要做很多检测,这些检测做了多长时间?具体有哪些?


A:


现在我也记不清楚做了多长时间,反正只要有需要他们就“抓”着我去做检测。先是弥散张量成像,然后是结构、静息态、功能成像及其他各种各样的磁共振成像,还有脑磁图,等等,我都做过。


Q:静息态下测的主要是大脑感受到的内脏信号吗?


A:


我们称之为内感知。近些年,很多做脑科学研究的人认为大脑和身体没关系,我们可以脱离身体来研究大脑。但实际上,人的心脏、肺、肝等器官都跟脑子有着非常紧密的联系,人体是不可分割的整体。我记得初到复旦大学时,金力校长曾打趣说:“咱俩分工吧,你做脖子以上的,我做脖子以下的。”


如今看来,我们俩确实分不了工。没有内感知信号的输入,大脑无法维持正常运转。人脑跟心脏一样,只要生命存续,就永远处于活动状态。内感知是大脑主要的信号来源之一,尤其是在静息态下。


Q:您做的数字孪生脑有两个重要的参数,一个是多少万个体素,另一个是几百个脑区。这些参数是怎么来的?为什么体素的量级是十万,脑区的量级是几百?


A:


体素是由核磁共振仪的分辨率决定的。根据人脑的体积,可估算出人脑的体素为十万级。脑区则是一个功能或解剖单位,它的数量由脑的组织结构决定,可以达到几百。对于人脑的数字孪生,我们目前只能做到体素水平,但对于小鼠,我们可以做到神经元水平。


Q:也就是说,你们做出了小鼠的数字孪生脑。这让我想到之前访问过的黄铁军老师——北京智源人工智能研究院理事长。他的团队做了数字线虫的研究,模拟了线虫的整个神经系统,结果显示数字线虫的运动方式跟真实的线虫几乎一模一样。


A:


关于线虫,科学家已经做了很多年的研究。伦敦大学学院曾做出非常细致的线虫神经模型,黄铁军他们做的也是一个类似的模型。在我看来,他们最大的进步在于做了具身智能。他们把线虫的脑模型接入躯体控制系统,让它控制爬行,并与环境相互作用,这是他们的一个突破。当然,我们也做了类似的研究:我们做出小鼠的数字孪生脑,让它控制机器鼠的身体,模拟生物老鼠的运动,比如闻到某种气味就过去舔糖水。也是在此基础上,我们才想着能不能做某个人的数字孪生脑。


Q:您当初测了七八年才做出自己的数字孪生脑。现在可以飞快地做出来是吗?


A:


对,现在完全不一样,我们用几个小时就可以给你做一个数字孪生脑。当然,我说的是静息态,做任务态又是另外一回事。任务态下的数字孪生脑与真实人脑的相似度还没有那么高。


Q:也就是说,你们对于静息态模仿得很好,但是对于任务态模仿得还没有那么好。从这个角度来看,现在的数字孪生脑在具体功能上跟人脑可能就没有那么相似了,还有很大的进步空间。


A:


确实还有很大的进步空间。对我来说,真正的考验就在于怎样能把它用起来。将来数字孪生脑如何能通过大模型控制机器人、控制自动驾驶——这是我们真正要解决的问题。


Q:你们在数字孪生脑方面取得了哪些成果?


A:


2024年12月,《自然-计算科学》(Nature Computational Science)发表了我们的研究《数字孪生脑的模拟与同化》(Simulation and assimilation of the digital human brain)。该研究被评价为里程碑式的工作。与此同时,我们也在探索数字孪生脑各种各样的应用。


其一,它可以作为医学研究平台。比如,我们在跟复旦大学附属华山医院的毛颖团队合作做脑肿瘤研究——通过让肿瘤“长”在数字孪生脑上,观察其发生与发展的过程。除此之外,我们还做了抑郁症、脑机接口方面的研究。


其二,它可以作为生物学研究平台,用以探索生物体内的信息传递机制。例如,斑马鱼拥有约10万个神经元,中国科学院脑科学与智能技术卓越创新中心的杜久林研究员能检测到5万个神经元,我们可以依托实测大规模神经元活动数据,复现斑马鱼游动、捕食行为。


其三,对我来说,应用层面的终极目标就是打造神经元计算机,刚刚我们谈到的洛芙莱斯也有这个梦想。在探索如何用计算机实现人脑运算方式的过程中,我们可以知晓人工智能到底是怎么一回事、能不能真正实现通用人工智能、能不能打造神经元计算机。有人认为,人工智能的尽头是数字孪生。我们会在现阶段数字孪生脑的基础上,继续迭代升级,做出更精细的、仿真度更高的数字孪生脑。比如,我们现在做到了860亿神经元等效规模,日后能做到1000亿的规模吗?


Q:您给它起了个名字叫“超脑”。未来,“超脑”能实现吗?


A:


目前来说,我们研发的这个数字孪生脑的运行速度相比真实人脑是70倍左右的减速比。所以我有两个目标:一个是利用尺度定律来提升模拟效果,另一个就是不断优化,实现数字孪生脑与人脑的同步运行。


Q:现在“神经网络”这个词好像已经错位了。一提及神经网络,绝大多数人首先想到的是人工神经网络,而非生物学意义上的神经网络。您如何看二者的区别?


A:


人工神经网络和生物神经网络有着本质区别。人工神经网络传递的模拟信号是连续值,而生物神经网络是依托离散的脉冲电信号来完成信息传递的。除此之外,还有一个大家很少意识到的区别:人工神经元是确定性的,但在神经科学界,大部分学者都认为生物神经元是一个随机的输入输出系统。


Q:啊?不是确定性的吗,为什么变成随机的了?


A:


不是确定性的。当我们接收到同一个信号时,这一次和下一次的输出结果会存在差异——这一点早已是神经科学界的共识。神经元发放的两个脉冲之间会存在一个时间间隔,即“峰间期”。大量文献都表明,峰间期的变化是一个随机过程。这也意味着生物神经单元无法依靠简单取平均值的一阶矩方式完成运算,至少需要二阶矩。很多人没有意识到这一点。


Q:您刚才说的让我大吃一惊,就是人工神经网络和生物神经网络其实完全不一样。二者竟如此不同。


A:


时至今日,我们仍不知道大脑是在用什么规则处理信息。可以说,神经科学领域最基础的问题就是我们不知道大脑真正的工作机制。我们连自己是怎么看懂东西的都不知道。我们缺少的是“罗塞塔石碑”这个编解码体系。


Q:这太有趣了。是否可以理解为人工智能本身是成功了,但脑科学的那个基本问题还没搞清楚?


A:


关于人工智能是否成功,现在下结论还有点早。它是有用的,但是到底有多大用、能跟人类智能有多大程度的匹配,还有待研究。回望其发展路径不难发现:人工智能解决问题的逻辑很明确——依托大规模可量化数据,设定对应的误差函数,不断迭代,最终找到最优解。在不少场景中,人工智能的表现甚至优于人类,围棋博弈就是典型例子。所以,从这个角度来看,它本质上解决的是数学优化层面的问题。至于它究竟有多高的智能,现在看来还要打一个问号。


Q:很多人工智能专家都说现在的人工智能没有智能。


A:


学界确实这样认为。像迈克尔·乔丹(Michael I.Jordan)、杨立昆、李飞飞等学者,都有这样的观点。


Q:您还做了自动驾驶、智慧医疗等方面的研究,这方面的情况能介绍一下吗?


A:


从某种意义上来说,智慧医疗本身叫类脑智能。类脑智能怎么做?我们自己的处理方式就是去理解脑,所以我们跟医学有很多结合。人脑是一个复杂系统,要真正理解它,就得把它“掰坏了”,对吗?(对话双方哈哈大笑)


Q:也就是说,得给它一个扰动。


A:


对,所以我们比较了病人的脑和正常人的脑。在这个过程中,我们就对很多疾病有了理解。这些是最本质的基础科学问题。有了这些积累,我们才能去做更多的优化算法。


除此之外,我们也做了自动驾驶、智慧工地、智能制造领域的研究。


Q:这背后主要有两个关键词,一个是应用数学,另一个是数字孪生。我们本来谈的只是数字孪生脑,后来却发现数字孪生算法其实是一个更普适的东西。


A:


是的,我觉得数学最大的好处就是换个问题同样可以进行研究,只不过可能在这里需要处理神经元,在那里需要处理优化控制。脑科学是一个很令人惊喜的领域,跟所有人都息息相关,它对人工智能、大健康、智能制造等领域的发展都有很大的推进作用。


Q:您下一步有什么打算?


A:


针对目前的这几件事,我显然想从脑科学出发,“沿途下蛋”,看能不能对脑疾病的治疗有所帮助。当然,做数字孪生脑,最后打造神经元计算机是我的终极梦想。


Q:您觉得在数字孪生脑领域,下一个亟待攻克的核心问题,或者说锚点,是什么?


A:


就是Digital you(数字的你),即能不能通过数字化模拟,来复刻你的整个状态。


Q:不只是数字孪生脑,而是数字孪生人了,是吗?


A:


是的。我们做了多年的数字孪生脑之后,更深刻地意识到,身体和脑是分不开的,对脑的模拟离不开对身体的模拟。所以,将来如果能够实现Digital you,我们就可以做预测,把你的过去、将来都反映在计算机上。这就是我们的终极目标。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定