本文来自微信公众号: 深究科学 ,作者:深究科学
问:为什么科学对你如此重要?
哈萨比斯:我一直被一种强烈的愿望驱动,那就是更深入地理解我们周围的世界。我认为,科学方法也许是人类历史上最重要的思想,它使人类得以不断进步、拓展知识。对我而言,没有什么比站在人类知识最前沿更令人兴奋——推动边界、首次发现未知事物,那正是科学最精彩的时刻。
问:为什么你把自己视为科学家?你是如何走上科学道路的?
哈萨比斯:如今,我首先把自己看作一名科学家。但在职业生涯早期,当我为游戏开发AI、并在剑桥大学学习计算机科学时,我更多认为自己是工程师。后来,我开始进一步追随自己长期以来对大脑的兴趣,攻读认知神经科学博士,研究记忆与想象力。我逐渐意识到,自己最适合以科学家的方式工作:提出关于世界的假设,再设计实验去验证或证伪它们。
不过,我也非常务实,非常关注现实世界中的影响力。这也是我“工程师大脑”仍在发挥作用的地方。相比沉迷于纯理论争论,我更倾向于思考:如何构建工具或实验来验证一个假设。AlphaGo与AlphaFold就是这种思维方式的典型例子。
问:哪些科学成就最令你受到启发?
哈萨比斯:我非常崇拜文艺复兴时期和古希腊时期的“通才型”人物,比如亚里士多德(Aristotle)和达·芬奇(Leonardo da Vinci)。他们不会在人文学科与科学之间划出边界。我很喜欢这种思维方式,因为它能帮助人们在看似毫不相关的领域之间发现联系。我相信,未来十到二十年最大的突破,就会来自这些跨领域结合。而AI将帮助我们找到不同学科之间的共同性与交叉点。
此外,我也深受那些“想象力飞跃”所鼓舞。回望历史,爱因斯坦(Albert Einstein)、牛顿(Isaac Newton)、玻尔(Niels Bohr)、拉马努金(Srinivasa Ramanujan)与费曼(Richard Feynman)等科学家与数学家,似乎会突然间提出一种全新的世界理解方式。他们的大脑中同时存在各种思想、知识与兴趣,然后突然完成一次直觉性的飞跃。
问:你认为目前人类尚未解决的最重要科学问题有哪些?
哈萨比斯:我之所以进入科学与AI领域,是因为小时候我就对那些关于现实本质与意识本质的终极问题着迷,甚至某种意义上说,有些“挥之不去”。时间是什么?引力是什么?它如何与量子世界统一?令人惊讶的是,在过去五十多年里,这些根本性问题并没有取得太大进展,部分原因在于它们极其复杂。
我一直认为,AI有可能成为推进知识前沿的终极工具。无论是处理海量数据,还是辅助我们提出新的猜想,我都认为AI能帮助我们攻克这些根本问题。
问:你如何将这些关于现实本质的问题,与一种计算性的理解方式联系起来?
哈萨比斯:我一直着迷于这样的问题:经典计算机或图灵机(Turing Machine)究竟能模拟什么、不能模拟什么?答案也许能揭示现实的本质。自然界中的大多数事物都具有稳定结构——细胞行为、山脉形态、行星轨道等,它们经过演化与时间筛选而保留下来。这意味着,它们背后应该存在某种模式或过程,可以被神经网络学习。像AlphaFold这样的AI系统已经向我们展示:相比过去的认知,经典计算机其实能够模拟更加复杂的系统。
也许从极限意义上说,大多数自然系统都可以被经典系统模拟或“逆向工程化”。这也支持了我的一个猜想:信息可能才是物理学中最基础的单位,比物质和能量更根本。
问:为什么你认为信息可能是理解现实最根本的层面?
哈萨比斯:传统物理学中,能量与物质被视为基础。但后来,香农(Claude Shannon)、图灵(Alan Turing)和冯·诺依曼(John von Neumann)等计算机科学奠基者提出了信息熵、信息度量与互信息等概念。不过,他们是在既有物理学框架下发展信息理论。也许方向本应相反:物理学应该建立在信息之上。这也与图灵机以及“什么过程是可计算的”有关。物理学家通常认为宇宙是量子系统,而经典系统无法完整模拟量子系统,因为其复杂度过于庞大。但如果事实证明,自然界中远比我们想象更多的物理过程能够被经典系统准确模拟,那么这将对我们理解物理学产生重大影响。
从根本上说,我最关心的是现实本质。我怀疑,我们目前对量子系统的理解并非完整答案。未来,我们或许会发现一种更简单的底层描述方式,而这种方式更适合由经典系统建模。如果我们将宇宙理解为一个“计算宇宙”,我们可能更容易发现这一点。
问:如果采用一种“信息”或“可计算性”的视角,我们是否会遭遇科尔莫哥洛夫复杂度(Kolmogorov Complexity)、P=NP问题或停机问题等限制?
哈萨比斯:会的。而我认为,这些正是最值得探索的边界。
P=NP问题是科学中最重要的问题之一。我倾向于认为P不等于NP,也就是说,确实存在一些问题,在现实时间内无法被有效求解,除非借助量子计算机。
但我们还需要更深入理解,因为现实可能比传统理论更微妙。
在AlphaGo与AlphaFold的研究中,我们发现:如果进行大量“预计算”(precompute),一些原本极其复杂的问题,可以在多项式时间内近似最优地求解。
神经网络实际上是在利用海量预计算,将知识压缩进一种高效结构中。随后在测试阶段,它就能缩小搜索空间,而不必遍历所有可能性。
例如,一个普通蛋白质大约存在10的300次方种可能构象。如果穷举搜索,所需时间会超过宇宙年龄。
因此,你必须采取更聪明的方法:学习不同氨基酸序列中的规律,只搜索极小一部分可能性。
这正是AlphaFold所做到的事情。
围棋也是类似情况。围棋大约有10的170次方种局面。AlphaGo不可能靠暴力计算获胜,而是通过学习“合理棋步”的模型,只关注最有价值的路径。
这些AI系统成功驾驭巨大搜索空间的能力,非常值得深思。我怀疑其中蕴含着极其深刻的原理。
这一切都在告诉我们,AI不仅在改变技术,也在帮助我们重新理解现实本身。
问:AlphaFold似乎正好体现了你所说的“自然世界存在可被学习的结构”。能谈谈你们是如何做到的吗?
哈萨比斯:AlphaFold是我们对“蛋白质折叠问题”的解决方案。
蛋白质本质上由氨基酸序列组成,可以粗略理解为一串“一维字母”。但在自然界中,它会折叠成三维结构,而这种结构很大程度上决定了蛋白质功能。
这对药物研发和疾病研究至关重要。
预测蛋白质结构,是生物学五十年来最大的挑战之一。
我们利用AlphaFold实现了接近原子级精度的预测,这已经足够让实验科学家直接使用。
我们的方法建立在大约15万个已知蛋白结构数据之上。这些数据是结构生物学家过去三四十年使用电子显微镜等昂贵设备painstakingly获得的。
这些数据恰好足以让AI系统学习蛋白质的拓扑结构规律。
蛋白质当然不会随机折叠,它们受到各种约束,而AI学会了这些规律。
最终,系统能够在几秒钟内预测一个未知蛋白的合理结构。
随后,我们在一年内预测了科学界已知的两亿个蛋白质结构,并与欧洲生物信息学研究所(European Bioinformatics Institute)合作,将其免费开放给全球研究者。
问:你们已经将AlphaFold扩展到了AlphaFold 3,并开始研究蛋白质相互作用。那么下一步会是细胞吗?
哈萨比斯:AlphaFold 2预测的是蛋白质的静态结构快照。但生物系统本质上是动态的。我们需要理解蛋白质如何相互作用,以及它们如何改变形态与行为。AlphaFold 3是下一阶段。现在,我们已经能预测蛋白质与蛋白质、蛋白质与配体、蛋白质与RNA、蛋白质与DNA之间的相互作用。也就是说,生命中几乎所有关键分子的“两两相互作用”,AlphaFold 3都能建模。但若想进一步模拟整个细胞,我们还需要更大的突破。
因为细胞中存在级联反应,涉及远超两个分子的复杂网络。下一阶段可能是模拟某条生物通路,然后是酵母细胞等简单生命体。之后,也许是更复杂生物中的细胞器,最终甚至整个生物体。
这是我二十多年来一直怀抱的梦想。如果未来我们能建立足够真实的细胞模拟系统,那么大量实验就能在计算机中完成,速度可能比湿实验室快几个数量级。
实验室将主要负责验证,而非探索。这样的“虚拟细胞”将彻底改变基础生物学与药物研发。
问:你们还在研究物理、化学、天气、气候等领域。这些领域的共同点是什么?
哈萨比斯:我们通常会从三个方面判断一个问题是否适合当前AI方法。
第一,它是否可以被描述为一个巨大的组合空间问题?
第二,如果是,是否拥有足够的数据去学习这个空间的结构?或者至少能通过模拟器生成额外数据?
第三,是否存在明确的优化目标?
在游戏中,目标是获胜;在自然系统中,也许是最小化自由能。
如果这三个条件成立,就可以利用模型与目标函数共同搜索最优解。
令人惊讶的是,大量科学问题都符合这一结构。
此外,我们还会优先选择那些“根节点问题”——一旦解决,就能开启整个新研究领域。
蛋白质折叠就是这样的典型问题。
问:数学似乎并不天然具有结构,比如素数分布?
哈萨比斯:关于数字中究竟存在多少结构,这仍是开放问题。但我怀疑,结构其实相当丰富。数学本来就是为了描述现实世界而发展出来的,而现实世界本身具有结构。
像拉马努金(Srinivasa Ramanujan)这样的数学家,往往能跳过中间推导,直接给出惊人的结果,以至于他本人都觉得这些灵感来自神启。我们通常把这种能力称为“直觉”。
但直觉并不是魔法,而是大脑长期经验积累形成的隐性知识。那些在某领域极其擅长的人,比如音乐家,拥有高度抽象且高效的知识结构。我认为,这种过程最终也是可以被AI建模的。
问:你认为当前AI系统在科学能力方面有哪些局限?
哈萨比斯:当前AI缺少的关键能力之一是真正的创造力。我指的不是“解决难题”,而是像提出黎曼猜想(Riemann Hypothesis)或千禧年难题那样,创造出真正深刻而美丽的问题。提出正确的问题,往往才是科学中最困难的部分。我们至今并不真正理解人类专家级创造力是如何产生的。
另一个问题是一致性。今天的AI系统可能能解国际数学奥赛题,但换个提问方式,又可能在小学数学上犯错。真正的人类数学家不会这样。
问:你如何定义AGI(通用人工智能)?
哈萨比斯:我一直把AGI定义为:具备人类心智全部认知能力的系统。人脑是目前已知唯一能够证明“通用智能”可行性的存在。人类的大脑极其通用且适应性极强。我们原本只是为了狩猎采集而进化出的生物,却最终发明了科学方法、望远镜、飞机与计算机。历史上伟大艺术家、科学家与哲学家的创造力,都来自同一种脑结构。
因此,在我看来,只有当AI能够覆盖人脑所展现出的全部能力时,我们才真正构建出了AGI。例如,可以设想这样一个测试:给AI设定1910年的知识截止时间,看看它是否能够像爱因斯坦一样,在1915年独立提出广义相对论。目前答案显然是否定的。
不过,今天的基础模型已经极其惊人。我毫不怀疑,它们最终将成为未来AGI系统的核心骨架。但仅靠不断扩大规模,是否足以达到AGI,仍是一个开放问题。
也许我们还需要几个类似Transformer或深度强化学习级别的重大突破。
问:在评估我们是否已经实现AGI(通用人工智能)时,一方面,人们可以使用一整套测试;另一方面,也许会出现某种直觉性的飞跃或火花——就像AlphaGo的“第三十七手”那样(当时AlphaGo跳出了人类的策略与直觉,下出了一步极不可能的棋,并最终击败了围棋世界冠军李世石)。到那时,我们或许会说:“啊,我想我们已经实现了!”那么,这究竟需要两者兼具,还是只需要其中之一?
哈萨比斯:我认为两者都需要。这是人类历史上如此重要的时刻,因此我认为我们必须以非常科学、非常确定的方式来对待它。应该会出现大量显而易见的发明或创造性案例,比如某种新的物理理论被提出,或者某个新的数学猜想被提出,并且数学家们一致认为它极具意义。AlphaGo不只是提出了一种新的围棋策略;我更希望看到的是,它能否发明出一种像围棋一样优雅的游戏?我希望能看到多个这样的例子出现,那它才至少能够开始被视为AGI的候选者。
然后,我认为我们还需要一种穷尽式的科学方法,以确保系统中不存在任何缺陷或漏洞。今天的一个例子就是LLM(大型语言模型)。普通人其实很容易想到它们做不到的事情。例如,它们甚至无法以业余棋手的水平下国际象棋,也无法学习一种新游戏,而且它们不能持续学习。在推理、记忆和一致性方面也都存在问题。所有这些问题都需要被解决,系统才有可能通过我刚才提出的那种测试。
问:科学家应该如何看待AI?它是工具、合作伙伴,还是其他东西?
哈萨比斯:未来十年左右,我们应该首先把AI视为一种极其强大的工具。它能够帮助科学家处理数据、匹配模式、编写代码或完成工程任务。
作为工具,AI将推动科学与医学进入新的黄金时代。提出猜想与假设的,仍将是人类专家;但AI会让他们效率提升十倍甚至百倍。再往后,也许AI会逐渐变成真正的合作伙伴。
问:你一直非常重视AI的负责任使用。这具体意味着什么?
哈萨比斯:意味着坚持科学方法,对测试与结论保持严格与谨慎。也意味着认真思考AI被部署后的二阶影响。
我们当然不可能完全预测所有后果,因为AI发展速度太快,但必须尽一切努力。
此外,我们还应该利用科学方法本身来研究AI,它的局限、它的能力、它的风险,
并据此建立适当的安全护栏。
我认为,相比“先构建、后提问”的黑客文化,科学方法更适合应对AI这种深远而强大的技术。
问:你最希望自己的工作能够为人类带来哪些重大益处?
哈萨比斯:第一,是改善人类健康并治愈疾病,尤其是那些对世界较贫困地区影响尤为严重的疾病。我认为,我们完全可以比今天做得好得多。
其次,是帮助解决能源、气候和环境问题。这包括更快地开发新材料和新技术、优化现有基础设施与能源电网,以及对地球正在发生的变化以及人类如何影响生态系统进行建模和分析。在我看来,这些是在近期内我们最应该利用AI去做的事情。
问:如果2050年我们再次进行这场对话,会谈些什么?
哈萨比斯:按照如今的发展速度,到2050年,世界一定会截然不同。我希望,到那时,人类已经安全地将AGI引入世界,并让它造福全人类。我们或许会讨论:一个“后AGI时代”的社会、极大丰富的物质与知识资源、科学发现的新黄金时代、以及重新充满惊奇感的人类文明。
原文链接
https://www.amacad.org/publication/daedalus/ai-ultimate-tool-science-conversation-demis-hassabis
