在科学探索上,AI会比科学家走得更远吗?
2023-03-20 21:36

在科学探索上,AI会比科学家走得更远吗?

如今,AI 可以像科学家一样做出各种科学发现:预测天气和蛋白质结构、模拟星系碰撞、设计优化核聚变反应堆、自动化药物发现、识别物理系统中的对称性和守恒律……然而,科学的主要目标之一是科学理解(scientific understanding),随着可用计算能力的增加和人工智能的进步,一个自然的问题出现了:先进的计算系统,特别是人工智能,如何能够促进新的科学理解或自主地获得科学理解?


为了回答这个问题,近期发表于 Nature Reviews Physics 的一篇综述文章采用科学哲学中对“科学理解”的定义,绘制出计算机辅助科学理解的三个维度:计算显微镜、灵感来源、理解主体。


本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:Mario Krenn等,原文标题:《能够预测蛋白质结构、控制核聚变的AI,怎样促进科学理解?》,题图来自:视觉中国


论文题目:On scientific understanding with artificial intelligence


一、引言


人工智能(AI)被称为科学的革命性工具[1,2],并被预测将在未来的研究中发挥创造性作用[3]。例如,在理论化学的背景下,科学家认为人工智能可以以一种方式帮助解决问题,使得人类无法区分是这种[AI]还是与人类专家交流[4]。然而,并非所有科学家都认同人工智能带来的改变。有些人质疑先进的计算方法是否可以超越“数字”[5-9],并在根本层面上为获得新的科学理解(scientific understanding)做出贡献[10-12]


在本文中,我们将讨论先进的计算系统,尤其是人工智能,如何为科学理解做出贡献:我们概述了目前的可能性以及未来可能出现的情况。除了对文献的回顾,我们还调查了数十名在生物学、化学或物理学交叉领域工作的科学家。这些个人叙述(见补充资料)集中于思想的具体发现过程,是对科学文献的重要补充。


我们在 Dennis Dieks 和 Henk de Regt 最近提出的科学理解的哲学理论背景下讨论了文献概览和个人叙述[12,13]。然后,我们确定了人工智能有助于新的科学理解的三个基本层面(图1)。我们将所有先进的人工计算系统都囊括在人工智能这个术语之下,与它们的工作原理无关。这样一来,我们关注的是方法的目标,而不是方法论本身。


首先,人工智能可以作为工具揭示物理系统的属性,然后人类将这些洞察力提升到科学理解。


第二,人工智能可以作为新概念和想法的灵感来源,随后被人类科学家理解和概括。


第三,人工智能可以充当理解的媒介。人工智能达到了新的科学见解,而且重要的是,可以将其理解传递给人类研究人员。尽管还没有任何例子表明人工智能在科学中充当了真正的“理解主体”(agent of understanding),但我们概述了这样一个系统的重要特征,并讨论了实现它的可能途径。


在前两个方面,人工智能使人类获得新的科学理解,而在最后一个方面,机器自己获得理解。对这些类别的区分使我们能够描绘出一个充满活力且大多未被探索的研究领域,并希望能够为自然科学中未来的人工智能发展指引方向。


图1. 计算机辅助科学理解的三个维度。目前最先进的计算显微镜可以用更复杂的系统进一步发展,由于算法和硬件的进步,这些系统可以被模拟,并且有更先进的数据表示(左侧面板)。作为灵感的来源,计算系统可以通过识别数据中的异常(a),识别科学文献中出乎意料的发现(b),通过检查模型找到意外的概念(c),探索人工主体的行为(d),或者从可解释的解决方案中提取新概念(e)来帮助人类科学家。正文中讨论的科学理解测试在右边的面板上进行了说明。


本文的重点是先进的计算系统和人工智能如何具体促进新的科学理解。有许多相关的、有趣的话题,我们在这里无法涉及。例如,我们将不讨论科学理解与认知科学之间的关系,而是向读者推荐一个很好的概述[14]。此外,我们将只讨论自然科学背景下的“理解”,在自然科学中我们可以使用科学哲学中的具体标准,因此,我们不会触及更广泛背景下的“理解”(比如婴儿和动物的理解,人工智能中的语义理解以及相关话题)


许多其他作品对相关问题有所贡献,在此应该提及。人工智能的一个重要研究领域是可解释人工智能,其目的是解释和说明先进的人工智能算法如何得出它们的解决方案;例如,见参考文献[15-18]。虽然没有必要,而且我们认为也不足以解释人工智能的内部运作来获得新的科学理解,但许多这些工具和技术可能非常有用。我们将在下面用自然科学中的具体例子来简要解释它们。


人工智能先驱 Donald Michie 将机器学习(ML)分为三类:弱人工智能、强人工智能和超人工智能,其中超人工智能需要机器来教人[19]。超人工智能的机器学习与理解主体的概念有关,我们将在下文中进行定义和详细介绍。


一个非常有用的、可理解的科学计算和人工智能方法的集合可以在参考文献[20]中找到。参考文献[21]中描述了分子设计的不同自动化水平,最后一步是由计算机来选择最初的想法。其他作品研究了基于特定科学方法的完全自动化可能是什么样子,从而产生了“诺贝尔图灵挑战”[22]的想法,即开发一个能够做出诺贝尔奖级别科学发现的人工智能系统。


我们注意到,我们的观点有目的地不依赖于任何特定的科学方法(以避免基础层面的问题[23]。相反,我们专注于科学家如何获得“科学理解”,以及先进的人工智能如何帮助人类获得新的科学理解。


二、科学理解


想象一个先知可以提供永远正确的重要预测。尽管这样一个假设的存在会产生重大的科学影响,但科学家们并不满足。他们希望“能够掌握预测是如何产生的,并对具体情形下的后果产生感觉”[13]。通俗地说,我们把这个目标称为“理解”,但这到底是什么意思呢?


为了找到科学理解的标准,我们从科学哲学中寻求指导。尽管几乎没有科学家会反对将“理解”作为科学的基本目标(与解释、描述和预测并列[24],但这种观点并不总是被哲学家所接受。卡尔·亨普尔(Carl Hempel)对澄清“科学解释”的含义做出了基础性的贡献,他认为“理解”是主观的,只是科学活动的心理副产品,因此与科学哲学无关[25]


众多哲学家批评了这一结论,试图正式确定“科学理解”的实际含义。这些提议表明,“理解“与建立因果模型的能力有关(例如,开尔文勋爵说:“在我看来,‘我们是否理解物理学中的某一主题’的检验标准是,‘我们能否为它建立一个机械模型?’”[13]与提供可视化(或明确表达,正如其坚定的支持者埃尔温·薛定谔所称[26,27]有关或者理解对应于提供思想的统一性[28,29]


最近,Henk de Regt 和 Dennis Dieks 发展了一种新的科学理解理论,它既是背景性的,也是实用性的[12,13,24]。他们发现,诸如可视化或统一化的技术是“理解的工具”,从而将以前的想法连接到一个总体框架中。他们的理论对正在使用的具体“工具”是不可知的,这使得它在各种科学学科中的应用特别有用。


de Regt 和 Dieks 扩展了海森堡(Werner Heisenberg)的见解[30],他们的理论背后的主要动机是“令人满意的科学理解概念应该反映科学的实际(当代和历史)实践”,而不是仅仅引入理论或假设的想法。简单地说,他们认为“如果存在一个关于 P 的可理解的理论 T,使科学家能够在不进行精确计算的情况下认识到T的定性特征后果,那么一个现象 P 就可以被理解”[12,13]。de Regt 和 Dieks 定义了两个相互关联的标准。


  • 理解现象的标准:如果存在一个关于 P 的可理解的理论 T,那么现象 P 就可以被理解。


  • 理论的可理解性标准:一个科学理论 T 对科学家来说是可理解的(在背景 C 中),如果他们能够认识到T的定性特征后果而不进行精确计算。


我们决定使用这个具体的理论,因为它可以用来“实验”评估科学家是否“理解”了新的概念或想法,而不是通过检查他们的方法论,只看科学结果和后果。这种方法也与 Angelika Potochnik 的论点相吻合,即“理解需要在某种意义上成功掌握理解的目标”[11]


三、科学发现与科学理解


科学理解和科学发现都是科学的重要目标。两者的区别在于,没有新的科学理解,科学发现是可能的(我们在参考文献[12,13]中使用了精确的术语)


让我们来研究三个例子。第一,为了设计新的有机激光二极管的高效分子,利用机器学习和量子化学的见解[31]探索了160万的搜索空间。排名第一的候选分子被实验合成并进行了研究。因此,本研究的作者发现了具有非常高量子效率的新分子。尽管这些发现可能会产生重要的技术后果,但这些结果并没有提供新的科学认识。从结果本身来看,如果不进行进一步的详细计算,就不能得出定性的结果。


第二,最近在蛋白质折叠方面由机器学习促成的突破[32,33]无疑将改变生物化学的面貌。然而,到目前为止,AlphaFold一直是一个黑盒子:一个神谕,因此,它并没有直接提供 de Regt 和 Dieks 意义上的新的科学理解。


第三,物理学中的许多发现是在提供科学理解的理论或解释被发现之前(有时是很久之前)发生的。例子包括超导的发现(及其高温版本)、宇宙微波背景的发现、中微子振荡以及在夸克模型发明之前发现的粒子动物园。


这些例子表明,科学发现可以导致科学和技术的破坏,而不直接促进科学理解[11,24]


在过去的几年里,在人工智能和自然科学之间工作的科学家们一直试图用机器来重新发现物理规律或概念。例子包括日心世界观[34]、时间之箭[35]或运动的机械方程[36,37]。这些应用是很好的基准,表明这些算法在原则上是可行的。


然而,问题是,一个能够重新发现物理规律和概念的人工智能是否也能够为新的科学理解做出贡献。我们认为,这并不能保证。这些人工智能系统的人类创造者知道他们在这些案例研究中寻找的是什么。因此,目前还不清楚如何防止代码或数据中的有意识和无意识的偏见(在最广泛的意义上,例如,通过选择特定的代表)


因此,即使算法能够重新发现有趣的物理现象,也不清楚是否以及如何通过发现新的科学思想来推动科学发展。为了超越重新发现的任务,人们需要明确地关注如何获得“新的”科学理解的问题。


宽泛地说,从先进的计算系统中获得新的理解意味着发现新的想法、原则、概念甚至理论,科学家们可以在不同的情况下应用和使用这些想法、原则、概念或理论,而不需要(完整的)计算。在接下来的章节中,我们将概述如何做到这一点,以前的方法已经取得了哪些成果,以及我们如何能走得更远。


四、计算机辅助理解的三个维度


正如在引言中已经提到的,我们调查了科学文献并使用了几十位科学家的个人轶事。然后,在科学哲学提供的框架内,我们对人工智能对科学理解的贡献进行了新的分类,这有助于描绘出未来研究的不同方向。我们称这种分类为“维度”,因为它们是独立的、非排他的。


一个人工智能系统可以通过三种方式对新的科学理解做出贡献。第一,作为一个“计算显微镜”,它可以提供(尚)无法通过实验手段获得的信息。第二,作为一个“灵感来源”或人工缪斯,扩大人类想象力和创造力的范围。


在这两个方面,人类科学家对于识别和完善新的洞察力和灵感,并将其发展到充分理解是必不可少的。对于前者,机器创造了新的数据(并可能以先进的方式表示),从而,人类科学家从其中提取她的新理解。对于后者,机器明确地寻找令人惊讶或有趣的新想法或意想不到的联系,并将其呈现给人类科学家,后者利用它们来达到新的科学理解。即使没有先进的计算系统或人工智能,这两个层面也可以存在。然而,人工智能可以大大促进和扩展它们的机会。


第三个维度是人工智能作为“理解主体”,代替人类对观察结果进行归纳,并将这些新的科学概念转移到不同现象中,而且——重要的是——将这些见解传达给人类科学家。


由于本视角的重点是人工智能辅助的新的科学理解,我们强调这样一个理解主体必须能够将其见解传递给人类。我们将简要讨论一个不能传达其见解的主体的情况。


上述的三个维度不应该被教条式地理解,而是提供一个框架来指导未来的方向。在下面的章节中,基于具体的例子,我们更详细地讨论每个维度,并提出推动目前可能的边界的途径。


1. 计算显微镜


显微镜也许是最著名的仪器类型,它可以考查肉眼看不见的物体和现象。同样地,计算显微镜能够考查无法以任何其他方式可视化或探测的物体或过程,例如,在实验中无法获得的长度和时间尺度上发生的生物、化学或物理过程。


在“理解”的背景下,由计算显微镜产生的新的计算机数据需要在不完全计算的情况下被推广到其他环境中[13]。我们用两个具体的例子来说明这一点。


第一个例子是 SARS-CoV-2 的分子动力学模拟。参考文献[38]的作者发现了新的生物功能,这些功能在穗状蛋白的开放和封闭构象中表现出不同的行为。这一解释改变了人们对生物系统中糖类的看法,并启发了分析这些系统的新方法,而不需要进行全面计算。


在第二个例子中,参考文献[39]的作者描述了分子动力学模拟如何帮助他们发现称为糖块的基本模式。系统地使用糖块既可以用来理解生物大分子的序列-结构-属性关系,又可以为设计具有所需功能的合成结构提供信息,而不需要模拟整个系统。


计算显微镜可以进一步改进吗?我们讨论了两个充满活力的方向。第一,更先进的计算系统将允许对越来越复杂的物理系统进行分析。第二,以更可解释的方式表示信息将促进科学洞察力的提取。


①越来越复杂的系统


一个明显的,但也是重要的研究方向是提高计算机模拟的复杂性和准确性[40]。例如,增加模拟系统的规模、模拟的时间尺度和可模拟的相互作用的数量将大大增强研究复杂动态系统的能力。一般来说,这种进步可以通过算法或硬件的改进来实现,或者两者都有。在这方面,我们预计人工智能技术与先进的硬件,如 GPU、TPU 甚至 OPU [41,42]将产生巨大的影响。


此外,用于量子化学[43]和物理学[44-46]的实验性量子计算的进展表明,基于量子力学的全新算法将在这个领域发挥重要作用[47,48]。算法的改进可能涉及到模拟过程中的自适应和智能解析以及先进的可视化方法[13],这直接导致了未来发展的第二个方向。


②先进的数据表示


在计算机辅助理解的第一个维度中,人类科学家应该对来自计算显微镜的新数据进行概括。因此,我们认为数据表示的进步可以极大地帮助人类掌握基础结构,促进新的科学理解。科学家们目前主要是在(可能是动画的)二维图形表示中分析数据。我们相信,真正的 3D 环境(通过虚拟或增强现实眼镜或全息技术实现)将大大有助于对复杂系统或复杂数据的理解。这方面的初步进展已经在化学[49-51]和天体物理学[52]中得到证明,我们期望这将成为科学家的标准工具。


此外,时间维度可以用来表示更多的结构化数据;例如,通过视频(3D 视频)。另外,声音也可以作为一个额外的数据维度,因为人类的听觉在检测(周期性)时间相关数据的结构或对称性方面非常出色。这个机会已经在高能物理学[53]和天文学[54]的几十个项目中得到了探索。一个强大的算法也许能够识别基础数据中的对称性,并将其投射到带有声音的三维视频中,这可能有助于人类识别并随后理解计算显微镜所产生的数据中的新属性。


2. 灵感的来源


令人惊讶和有创意的想法是科学进步的基础。计算机算法可以系统地激发这种想法,从而大大加快科技进步。早在 70 年前,阿兰·图灵就指出:“机器让我吃惊的频率很高”[55]。最近的一项研究[56]收集了几十位人工生命和进化研究者的故事。这些轶事展示了计算机算法如何“产生令人惊讶和创造性的解决方案”。因此,我们认为人工智能在隐喻意义上可以成为科学的人工缪斯。接下来,我们将概述计算机算法可以为新的科学思想提供灵感来源的若干方式。


①识别数据中的异常


从实验或模拟中获得的特殊数据点或意外的规律性可以引发新的想法和概念。我们的调查显示,这些例外点通常是由人类来识别的,比如以下两个例子,它们使用的是化学[57]和量子光学[58,59]中的高通量计算。


第一个例子涉及到高压物理学中晶体结构的一个意外相。在参考文献[60]中,作者发现了一个意外的 NH2 和 NH4 层交替的稳定构型,而不是密集的 NH3 相。他们将这一现象概念化为自发电离,这是酸碱化学中的一个常见过程,现在在 NH3 的高压相图中是一个被广泛接受的现象。物质高压行为中的自发电离已经成为一个比较普遍的原则,不需要进行任何模拟就可以使用。


在第二个例子中,寻找新的量子实验发现了一个具有比预期大得多的量子纠缠的解决方案[58]。该研究的作者理解了基本原理,从而发现了纠缠产生的新概念[61,62]。该原理可以在没有任何计算的情况下使用,例如,现在作为更先进的人工智能系统中的量子物理学的新代表[63],证明了计算机启发的想法在更普遍的不同背景下的应用。


与这些例子相比,数据异常可能表现为更多的变量组合,这对人类来说可能是非常难以把握的。因此,将先进的统计方法和机器学习算法(例如,参考文献[64]应用于这种类型的问题将是未来的一个重要研究方向。在自主异常检测方向上令人振奋的工作已经被应用于欧洲核子研究中心的大型强子对撞机(LHC)的科学数据[65-67](见最近关于这个主题的评论[68]。这种技术有可能识别新的物理学特征,然后由人类物理学家进行概念化和理解[69,70]


一种有趣的检测异常值的技术,以前曾用于发现量子相,就是撇开一个(或一些)训练实例,观察神经网络的后果[71]。通过 Hessians 的计算,引入影响函数,是识别单个训练实例影响的一种计算效率高的方法[72]。自主发现对称性的神经网络可以成为科学数据中异常值的有效发现工具,因为其中的基本规则可能事先并不知道[73,74]


估计预测的置信度将是另一种直接搜索数据中异常点的方法[75]。揭开隐藏的规律性的能力在数学中得到了证明,其中一个人工智能暗示了纽结理论中以前没有联系的不变量之间的关系,这使得数学家能够猜想并证明新的定理[76]。另外,一个能够构建新的科学假设的人工智能可以发现标准统计方法无法辨别的异常值或意外模式。


看到人工智能发现以前被人类忽视的科学数据中隐藏的模式或不规则现象,这将是真正令人兴奋的,这可能导致新的想法,并最终导致新的概念理解。截至目前,我们还没有意识到这样的案例。


最后,我们注意到,这些分析的数据点可以从计算方法(涉及上一节所述的方法)中获得,这对数学或理论物理学来说是令人兴奋的机会[77]。或者,这些数据可以直接从实验中获得。在这里,我们可以想象一个闭环的方法,其中一个算法试图探索环境,并引导探索进入意外的区域。如果数据源是一个实验,未来的人工智能系统将需要进入复杂的实验室自动化,有大的参数空间可以探索,这在生物学[78]、化学[79-84]或物理学[85,86]中得到了证明。


②识别科学文献中的惊喜


基本上每个科学领域的科学论文数量都在大量增长[87,88]。因此,研究人员不得不专注于狭窄的子学科,这使得寻找新的跨学科思想变得困难。在未来,我们相信计算机将能够以自动化的方式使用科学文献[89-92],并识别出特殊和令人惊讶的现象,以便进一步调查。虽然据我们所知,对科学文献的大规模自动分析还不能诱发新的科学理解,但该领域有重大进展。


实现这一目标的一个有希望的方法是对大型科学论文语料库进行无监督的词嵌入。在该技术中,科学文献的内容被转化为一个高维矢量空间。这种方法已被用于材料科学领域[93],并重新发现了核心科学概念,如元素周期表。此外,这些结果还表明存在以前未发现的结构-性能关系。这方面的例子包括热电材料的新候选材料。


此外,材料科学领域正在开发其他一些先进的计算技术,以从科学文献中提取知识,并通过人工智能技术对其进行系统的研究[94],并且可以得出复杂的科学结论,例如,关于不同晶体结构之间的关系[95]


另一种方法旨在从大量的科学文献中建立语义知识网络。在这些网络中,科学概念是节点,而边则承载着关系信息。在最简单的情况下,这意味着两个科学概念在同一篇科学论文中被提及[96,97]。因此,科学知识被表示为一个不断发展的网络,它可以被用来识别科学文献中的岛屿和未开发的区域。这种类型的网络被用于生物化学,以确定有效的全球研究策略[96];并用于量子物理学,以预测和建议未来的研究方向[97]


人工智能技术的进步可以大大改善这种类型的系统。例如,自然语言处理架构,如 BERT[98],或 GPT-3(参考文献[99]可以帮助从研究论文中提取更多的科学知识,而大型基于图的神经网络可以改善从语义网络中预测新的研究主题[100]


③通过检查模型获得意外的概念


我们还期望通过合理化人工智能算法为解决特定问题而学到的东西以取得相当大的进展,换句话说,可解释的人工智能[101-103]


实现这一目标的一个想法是受到 DeepDreaming 的启发,这是一种首次用于计算机视觉的方法[104,105]。简单地说,这个想法是反转一个神经网络并探测其行为。这种方法已被应用于重新发现热力学特性[35]和功能分子的设计原则[106]


另一个显著的应用是神经网络中的“变量分解”[107]。其目的是了解神经网络已经学会的内部表征。以地心坐标表示的天文数据被用来训练一个神经网络,而变量的分离使得通过模型的内部表示重新发现了日心坐标[34]。对称性,或其守恒量,也可以通过使用一对神经网络[108,109]来自主提取。然后,这对神经网络被训练来识别两种不同的物理情况在某种未知的对称性下是否相等。最后一层是一个信息瓶颈,只由一个神经元组成。这样一来,神经网络就学会了识别保护属性,并将整个信息压缩到一个神经元的输出中。然后,输出可以很容易地被比较,而且,很容易被人类研究者解释。


参考文献[109]的作者展示了这一想法如何被用来重新发现经典力学(能量和角动量)或电磁学(如洛伦兹不变量)中的守恒属性。在一项相关的研究中,利用决策树的梯度提升,特征重要性被用来解释分子和量子光学电路的特性[110]。与此相关的一项研究检查了量子实验的无监督深度生成模型的内部表示,以了解该模型的内部世界观[111]


在化学中,机器学习模型的反事实解释已经被证明可以产生模型预测背后的原理。反事实的解释说明了事件或实例中的哪些差异会产生结果的变化。参考文献[112]展示了如何以独立于模型的方式实现这一点(它已被证明适用于随机森林、序列模型和图神经网络),表明未来在科学中打开人工智能黑箱的巨大潜力。


尽管不是在科学领域,一项研究调查了下棋的人工智能 AlphaZero 对国际象棋的了解,以及类似人类的知识是如何在内部表示中编码的[113]。所有这些作品中重新发现的概念都不是新的,因此,未来最重要的挑战是学习如何提取以前未知的概念。


④从可解释的解决方案中获得新概念


与其说从人工智能算法中获得灵感,不如说科学家们也能从他们提供的解决方案中获得惊喜。当解决方案以可解释的方式表示时,它们可以带来新的想法和概念。可解释性表示法的一个例子是数学公式。因此,科学家可以检查计算机算法得出的公式,直接解决数学问题,并得出更普遍的解决策略。


一些研究证明了从机械系统[36,114]、量子系统[115]和天文学[116]的实验数据中提取符号模型;也见文献[117]。这些方法,例如与因果推理[118]等方法相结合,可以改进为未知系统提出合理的物理模型,促进科学理解,这将是令人激动的。总的来说,数学领域已经取得了令人振奋的进展[119、120],我们可以预见类似的方法将对物理科学产生重大影响。


天文学中最近的一个具体例子是,从过去30年对太阳系行星和卫星的实际观测数据中重新发现了牛顿的引力定律(参考文献[37]。图神经网络的应用允许对物体的运动进行高质量的预测。


此外,一种称为 PySR 的符号回归技术(在参考文献[116]中介绍)能够为学习到的行为提取合理的数学表达式。有趣的是,除了运动方程,该方法还同时正确预测了行星物体的质量。该技术需要假设几个对称性和其他物理规律。这些先决条件是否可以进一步减少,以及相关方法如何应用于现代物理问题,还有待观察。


这种方法的另一个例子已经在量子光学领域展示出来了[63]。在那里,一个人工智能算法用图论表示量子光学设置,为以前未知的量子系统设计配置。最终的解决方案被表示在一个物理上可解释的图论表示中。从那里,人类科学家可以快速解释解决方案工作的根本原因,并将其应用于其他环境,而无需进一步计算。因此,开发可解释的表示和方法来提取其他领域的基本概念将是未来的一个重要研究方向。


⑤探测人工主体的行为


另一个很少被探索的机会是解释机器在被赋予解决科学问题的任务时的行为[121]。采取行动的算法,如遗传算法或强化学习主体采取政策来导航问题空间。人类科学家可以观察它们如何导航这个空间。与其遵循严格的外部奖励,例如最大化一个物理系统的特定属性,不如实施内在的奖励,如人工好奇心[122,123]。与其直接最大化某些功能,人工主体(artificial agent)试图学习和预测环境的行为。然后,它选择导致它不能很好预测的情况的行动,从而使它自己对环境的理解最大化。


在模拟的虚拟宇宙[124]中使用好奇心强的主体和在真实实验室[84]中使用机器人主体已经表明,好奇心是一种有效的探索策略。人工主体的其他内在奖励是“计算创造力”[125、126]和“惊喜”[127]。这些内在奖励可以产生特殊的和意想不到的解决方案和主体行为,最终激发人类科学家。


3. 理解主体


我们考虑的第三个也是最后一个维度,是能够自主地获得新的科学理解,并最终向人类解释这些见解的算法。我们调查的受访者和科学文献中都没有描述过这种壮举。因此,我们将通过列出这些主体的要求,提出检测其成功实现的测试,并推测这种系统可能是什么样子的来接近这一类。


唐纳德·米奇(Donald Michie)在 1988 年的开创性工作“未来五年的机器学习”[19,128,129]中已经讨论了机器向人类翻译见解的想法。Michie 将人工智能算法分为三类:弱机器学习、强机器学习和超强机器学习。


弱机器学习通过大量的训练数据实现了预测质量的提高。可以说,今天的大多数机器学习方法都属于这一类,其中的算法被当作一个黑盒子。强机器学习方法类需要提供其假设的符号表示,例如,通过布尔(逻辑)表达式或数学方程。最后,超强机器学习方法要求算法教给人类操作者,从而使人类的表现与人类单独从数据中学习相比得到改善。


有趣的是,关于某些逻辑任务的实验表明,超强机器学习算法可能已经存在,从而证明了“存在一类关系概念,这些概念对人类来说很难掌握,但在抽象的解释下很容易理解”[129]。超强机器学习的想法与我们的第三个维度,即理解主体有关。两者都要求机器获得新的洞察力,并将其传授给人类。


除了我们对自然科学的限制外,还有其他不同之处:Michie 要求以符号的方式传递见解,而理解主体则更加灵活,允许任何教学方法,例如,通过自然语言的讨论,如 GPT-3。此外,该主体需要提供新的科学理解(在 de Regt 的严格意义上),而不仅仅是解释或诠释。因此,理解主体在技术实现方面更加灵活,但在教给人类的东西方面更加严格。我们将在下文中更详细地讨论。


首先,重要的是要认识到,找到新的科学理解是取决于背景的。什么是新的取决于我们是否考虑一个科学家个人和他们的专业领域、一个科学领域、整个科学界甚至整个历史上的科学努力。因此,真正的理解者必须能够评估洞察力是否是新的,至少在需要获得该科学领域的知识的特定科学领域的背景下。


其次,de Regt 强调了基础科学理论的重要性,这些理论使我们能够认识到有质量特征的后果[12]。仅仅使用机器学习等高级统计方法对数据点进行插值或预测新的数据点是不够的。因此,即使这种方法可以近似于复杂而昂贵的计算,神经网络的天真应用也不能成为理解的媒介。科学理解需要的不仅仅是计算。


为了进一步说明这一点,让我们考虑文献中量子物理学的一个具体例子:一种计算方法解决了一个关于量子计算重要资源状态的生成的公开问题。然后,它以新的量子干涉效应的形式提取了解决方案的概念核心,这种方式使人类科学家既能理解结果,又能在不同的背景下应用获得的理解[63]。即使计算机本身能够将概念核心应用于其他情况,也不能先验地说明计算机是否真正获得了科学理解。现在还缺少的是在科学理论的背景下对所发现的技术的解释。


在这个特定的例子中,人工智能和人类科学家将需要在量子物理学理论的背景下认识到潜在的量子干扰。因此,我们可以提出理解主体的第一个充分条件。


科学理解的条件一


如果一个人工智能能够在不进行精确计算的情况下认识到一个理论的定性特征后果,并在新的背景下使用它们,那么它就获得了科学理解。


这个条件紧跟 de Regt 和 Dieks 的想法[13]。让我们再往前走一步,想象有一个人工智能能够在科学理论的背景下解释各种发现。人类科学家如何能认识到机器获得了新的科学理解?我们认为,人类科学家会以与认识其他人类科学家获得新的科学理解完全相同的方式来做这件事。也就是说,让其他人类科学家把新获得的理解传达给其他人。这就提出了理解主体的第二个充分条件。


科学理解的条件二


如果一个人工智能获得了科学理解,它可以把它的理解传递给人类专家。


我们认为,人们只能间接地识别计算机(或人类)是否获得了科学理解。因此,最后,我们提出了一个符合图灵测试[55]或费根鲍姆测试[130](或其在自然科学中的改编,如化学图灵测试或费曼测试[4]精神的测试。


科学理解测试


一个人(学生)与一个老师互动,这个老师可以是人,也可以是人工科学家。老师的目标是向学生解释一个科学理论及其定性的、特征性的后果。另一个人(裁判员)独立地测试学生和老师。如果裁判员不能区分他们在各种情况下的非琐碎解释的质量,我们就认为老师有科学理解力。


原则上,学生或裁判员没有理由不成为人工智能。然而,为了使测试尽可能的简单,我们限制了可能的变化数量。


该测试的表述意味着人类需要理解人工智能设计的新概念。如果一台机器真正理解了什么,它应该能够解释它并将理解转移给其他人。(我们撇开人工智能的解释是真的还是假的问题。有人认为,错误的理论也可以导致真正的理解。[131]我们认为,这应该总是可能的,即使理解远远超出了人类专家此时的认识。


请注意,随着人类和人工科学家的能力之间的差距越来越大,人工智能将其理解转移给人类将变得越来越有挑战性和耗时。我们设想,计算机将使用先进的人机交互技术与我们描述的下一级计算显微镜的工具一起。


此外,人和计算机之间的科学讨论可以使用自然语言处理工具中的高级查询来实现,如  BERT[98]或 GPT-3(参考文献[99]。这样一来,科学家就可以用科学问题来探测计算机。假设科学家通过与算法的交流获得了新的科学理解,正如我们的科学理解测试所判断的那样。在这种情况下,他们可以确认计算机真正获得了理解。


我们想指出,我们的测试,就像图灵和费根鲍姆发起的测试一样,并不是一目了然的,为不允许作出明确判断的情况留下了空间。我们乐观地认为,更多的努力将被用于开发必要的技术,这将导致未来人工科学家作为理解的真正主体的越来越有说服力的演示。


五、结语


毫无疑问,一般来说,先进的计算方法,特别是人工智能的计算方法,将进一步革新科学家研究我们世界的秘密的方式。我们概述了这些新方法如何能够直接有助于获得新的科学理解。我们猜想,未来在使用人工智能获得科学理解方面的重大进展将需要自然科学家、计算机科学家和科学哲学家之间的多学科合作。因此,我们坚信,这些研究工作可以——在我们的有生之年——将人工智能转变为真正的理解媒介,直接促进科学的主要目标之一,即科学理解。


原文:On scientific understanding with artificial intelligence


参考文献

1. Zdeborová, L. New tool in the box. Nat. Phys.13, 420–421 (2017).

2. Fösel, T., Tighineanu, P., Weiss, T. & Marquardt, F. Reinforcement learning with neural networks for quantum feedback. Phys. Rev. X8, 031084 (2018).

3. Melnikov, A. A. et al. Active learning machine learns to create new quantum experiments. Proc. Natl Acad. Sci. USA115, 1221–1226 (2018).

4. Aspuru-Guzik, A., Lindh, R. & Reiher, M. The matter simulation (r)evolution. ACS Cent. Sci.4, 144–152 (2018).

5. Hoffmann,  R. & Malrieu, J.-P. Simulation vs. understanding: a tension, in  quantum chemistry and beyond. Part A. Stage setting. Angew. Chem.132, 12690–12710 (2020).

6. Hoffmann,  R. & Malrieu, J.-P. Simulation vs. understanding: a tension, in  quantum chemistry and beyond. Part B. The march of simulation, for  better or worse. Angew. Chem. Int. Ed.59, 13156–13178 (2020).

7. Hoffmann,  R. & Malrieu, J.-P. Simulation vs. understanding: a tension, in  quantum chemistry and beyond. Part C. Toward consilience. Angew. Chem. Int. Ed.59, 13694–13710 (2020).

8. Marcus, G. The next decade in AI: four steps towards robust artificial intelligence. Preprint at arXiv 2002.06177 (2020).

9. Thaler, J. Designing an AI physicist. CERN Courier, https://cerncourier.com/a/designing-an-ai-physicist/ (2021).

10. Potochnik, A. The diverse aims of science. Stud. Hist. Philos. Sci. A53, 71–80 (2015).

11. Potochnik, A. Idealization and the Aims of Science (Univ. Chicago Press, 2017).

12. de Regt, H. W. Understanding Scientific Understanding (Oxford Univ. Press, 2017).

13. De Regt, H. W. & Dieks, D. A contextual approach to scientific understanding. Synthese144, 137–170 (2005).

14. Boden, M. A. Mind as Machine: A History of Cognitive Science (Oxford Univ. Press, 2008).

15. Doran,  D., Schulz, S. & Besold, T. R. What does explainable AI really  mean? A new conceptualization of perspectives. Preprint at arXiv 1710.00794 (2017).

16. Tjoa, E. & Guan, C. A survey on explainable artificial intelligence (XAI): toward medical XAI. IEEE Trans. Neural Netw. Learn. Syst.32, 4793–4813 (2020).

17. Burkart, N. & Huber, M. F. A survey on the explainability of supervised machine learning. J. Artif. Intell. Res.70, 245–317 (2021).

18. Samek, W., Montavon, G., Vedaldi, A., Hansen, L. K. & Müller, K.-R. Explainable AI: Interpreting, Explaining and Visualizing Deep Learning (Springer, 2019).

19. Michie, D. in Proc. 3rd European Conference on European Working Session on Learning, 107–122 (ACM, 1988).

20. Lavin, A. et al. Simulation intelligence: Towards a new generation of scientific methods. Preprint at arXiv 2112.03235 (2021).

21. Goldman, B., Kearnes, S., Kramer, T., Riley, P. & Walters, W. P. Defining levels of automated chemical design. J. Med. Chem.65, 7073–7087 (2022).

22. Kitano, H. Nobel Turing Challenge: creating the engine for scientific discovery. NPJ Syst. Biol. Appl.7, 29 (2021).

23. Feyerabend, P. Against Method (Verso, 1993).

24. De Regt, H. W. Understanding, values, and the aims of science. Philos. Sci.87, 921–932 (2020).

25. Hempel, C. G. Aspects of Scientific Explanation (Free Press, 1965).

26. Schrödinger, E. ‘Nature and the Greeks’ and ‘Science and Humanism’ (Cambridge Univ. Press, 1996).

27. De Regt, H. W. Visualization as a tool for understanding. Perspect. Sci.22, 377–396 (2014).

28. Friedman, M. Explanation and scientific understanding. J. Philos.71, 5–19 (1974).

29. Kitcher, P. Explanatory unification. Philos. Sci.48, 507–531 (1981).

30. Heisenberg, W. Über den anschaulichen Inhalt der quantentheoretischen Kinematik und Mechanik. Z. Phys.43, 172–198 (1927).

31. Gómez-Bombarelli,  R. et al. Design of efficient molecular organic light-emitting diodes  by a high-throughput virtual screening and experimental approach. Nat. Mater.15, 1120–1127 (2016).

32. Jumper, J. et al. Highly accurate protein structure prediction with AlphaFold. Nature596, 583–589 (2021).

33. Tunyasuvunakool, K. et al. Highly accurate protein structure prediction for the human proteome. Nature596, 590–596 (2021).

34. Iten, R., Metger, T., Wilming, H., Del Rio, L. & Renner, R. Discovering physical concepts with neural networks. Phys. Rev. Lett.124, 010508 (2020).

35. Seif, A., Hafezi, M. & Jarzynski, C. Machine learning the thermodynamic arrow of time. Nat. Phys.17, 105–113 (2021).

36. Udrescu, S.-M. & Tegmark, M. AI Feynman: A physics-inspired method for symbolic regression. Sci. Adv.6, eaay2631 (2020).

37. Lemos,  P., Jeffrey, N., Cranmer, M., Ho, S. & Battaglia, P. Rediscovering  orbital mechanics with machine learning. Preprint at arXiv 2202.02306 (2022).

38. Casalino, L. et al. Beyond shielding: the roles of glycans in the SARS-CoV-2 spike protein. ACS Cent. Sci.6, 1722–1734 (2020).

39. Fogarty,  C. A., Harbison, A. M., Dugdale, A. R. & Fadda, E. How and why  plants and human n-glycans are different: Insight from molecular  dynamics into the “glycoblocks” architecture of complex carbohydrates. Beilstein J. Org. Chem.16, 2046–2056 (2020).

40. Friederich, P., Häse, F., Proppe, J. & Aspuru-Guzik, A. Machine-learned potentials for next-generation matter simulations. Nat. Mater.20, 750–761 (2021).

41. Gigan, S., Krzakala, F., Daudet, L. & Carron, I. Artificial intelligence: from electronics to optics. Photoniques104, 49–52 (2020).

42. Xu, X. et al. 11 TOPS photonic convolutional accelerator for optical neural networks. Nature589, 44–51 (2021).

43. Quantum, G. A. et al. Hartree-Fock on a superconducting qubit quantum computer. Science369, 1084–1089 (2020).

44. Zhang, J. et al. Observation of a discrete time crystal. Nature543, 217–220 (2017).

45. Schweizer, C. et al. Floquet approach to Z2 lattice gauge theories with ultracold atoms in optical lattices. Nat. Phys.15, 1168–1173 (2019).

46. Martinez, E. A. et al. Real-time dynamics of lattice gauge theories with a few-qubit quantum computer. Nature534, 516–519 (2016).

47. Cao, Y. et al. Quantum chemistry in the age of quantum computing. Chem. Rev.119, 10856–10915 (2019).

48. Gross, C. & Bloch, I. Quantum simulations with ultracold atoms in optical lattices. Science357, 995–1001 (2017).

49. O’Connor, M. et al. Sampling molecular conformations and dynamics in a multiuser virtual reality framework. Sci. Adv.4, eaat2731 (2018).

50. Probst, D. & Reymond, J.-L. Exploring DrugBank in virtual reality chemical space. J. Chem. Inf. Model.58, 1731–1735 (2018).

51. Schmid, J. R., Ernst, M. J. & Thiele, G. Structural chemistry 2.0: combining augmented reality and 3D online models. J. Chem. Educ.97, 4515–4519 (2020).

52. Foley, M. et al. A 3D view of Orion: I. Barnard’s Loop. Authorea. https://doi.org/10.22541/au.165540488.82174026/v1 (2022).

53. Hill, E., Cherston, J., Goldfarb, S. & Paradiso, J. A. in Proc. 38th International Conference on High Energy Physics, 1042 (2016).

54. Zanella, A. et al. Sonification and sound design for astronomy research, education and public engagement. Nat. Astron.https://doi.org/10.1038/s41550-022-01721-z (2022).

55. Turing, A. M. Computing machinery and intelligence. Mind50, 433–460 (1950).

56. Lehman,  J. et al. The surprising creativity of digital evolution: a collection  of anecdotes from the evolutionary computation and artificial life  research communities. Artif. Life26, 274–306 (2020).

57. Pickard, C. J. & Needs, R. Ab initio random structure searching. J. Phys. Condens. Matter23, 053201 (2011).

58. Krenn, M., Malik, M., Fickler, R., Lapkiewicz, R. & Zeilinger, A. Automated search for new quantum experiments. Phys. Rev. Lett.116, 090405 (2016).

59. Krenn, M., Erhard, M. & Zeilinger, A. Computer-inspired quantum experiments. Nat. Rev. Phys.2, 649–661 (2020).

60. Pickard, C. J. & Needs, R. Highly compressed ammonia forms an ionic crystal. Nat. Mater.7, 775–779 (2008).

61. Krenn, M., Hochrainer, A., Lahiri, M. & Zeilinger, A. Entanglement by path identity. Phys. Rev. Lett.118, 080401 (2017).

62. Krenn,  M., Gu, X. & Zeilinger, A. Quantum experiments and graphs:  multiparty states as coherent superpositions of perfect matchings. Phys. Rev. Lett.119, 240403 (2017).

63. Krenn,  M., Kottmann, J., Tischler, N. & Aspuru-Guzik, A. Conceptual  understanding through efficient automated design of quantum optical  experiments. Phys. Rev. X11, 031044 (2021).

64. Malhotra, P., Vig, L., Shroff, G. & Agarwal, P. in Proc. European Symposium on Artificial Neural Networks (ESANN), 89–94 (2015).

65. Collaboration, A. Dijet resonance search with weak supervision using s√=13TeV pp collisions in the ATLAS detector. Phys. Rev. Lett.125, 131801 (2020).

66. Collaboration,  C. Probing effective field theory operators in the associated  production of top quarks with a Z boson in multilepton final states at s√=13TeV. J. High Energy Phys.2021, 83 (2021).

67. Park,  S. E., Rankin, D., Udrescu, S.-M., Yunus, M. & Harris, P. Quasi  anomalous knowledge: searching for new physics with embedded knowledge. J. High Energy Phys.2021, 30 (2021).

68. Karagiorgi,  G., Kasieczka, G., Kravitz, S., Nachman, B. & Shih, D. Machine  learning in the search for new fundamental physics. Nat. Rev. Phys.4, 399–412 (2022).

69. Schwartz, M. D. Modern machine learning and particle physics. Preprint at arXiv 2103.12226 (2021).

70. Kasieczka, G. et al. The LHC Olympics 2020: a community challenge for anomaly detection in high energy physics. Rep. Prog. Phys.84, 124201 (2021).

71. Dawid,  A., Huembeli, P., Tomza, M., Lewenstein, M. & Dauphin, A.  Hessian-based toolbox for reliable and interpretable machine learning in  physics. Mach. Learn. Sci. Technol.3, 015002 (2021).

72. Koh, P. W. & Liang, P. in Proc. 34th International Conference on Machine Learning, 1885–1894 (PMLR, 2017).

73. Yu,  H., Mineyev, I. & Varshney, L. R. A group-theoretic approach to  computational abstraction: Symmetry-driven hierarchical clustering.  Preprint at arXiv 1807.11167 (2018).

74. Dehmamy, N., Walters, R., Liu, Y., Wang, D. & Yu, R. Automatic symmetry discovery with lie algebra convolutional network. Adv. Neural Inf. Process. Syst.34, 2503–2515 (2021).

75. Nigam, A. et al. Assigning confidence to molecular property prediction. Expert Opin. Drug Discov.16, 1009–1023 (2021).

76. Davies, A. et al. Advancing mathematics by guiding human intuition with AI. Nature 600, 70–74 (2021).

77. Douglas, M. R. Machine learning as a tool in theoretical science. Nat. Rev. Phys.4, 145–146 (2022).

78. King, R. D. et al. The automation of science. Science324, 85–89 (2009).

79. Bédard, A.-C. et al. Reconfigurable system for automated optimization of diverse chemical reactions. Science361, 1220–1225 (2018).

80. Steiner, S. et al. Organic synthesis in a modular robotic system driven by a chemical programming language. Science363, eaav2211 (2019).

81. Coley, C. W. A robotic platform for flow synthesis of organic compounds informed by AI planning. Science365, eaax1566 (2019).

82. Burger, B. et al. A mobile robotic chemist. Nature583, 237–241 (2020).

83. Chatterjee, S., Guidi, M., Seeberger, P. H. & Gilmore, K. Automated radial synthesis of organic molecules. Nature579, 379–384 (2020).

84. Grizou,  J., Points, L. J., Sharma, A. & Cronin, L. A curious formulation  robot enables the discovery of a novel protocell behavior. Sci. Adv.6, eaay4237 (2020).

85. Moon, H. et al. Machine learning enables completely automatic tuning of a quantum device faster than human experts. Nat. Commun.11, 4161 (2020).

86. Dalgaard,  M., Motzoi, F., Sørensen, J. J. & Sherson, J. Global optimization  of quantum dynamics with AlphaZero deep exploration. NPJ Quantum Inf.6, 6 (2020).

87. Larsen,  P. & Von Ins, M. The rate of growth in scientific publication and  the decline in coverage provided by Science Citation Index. Scientometrics84, 575–603 (2010).

88. Reisz, N. et al. Loss of sustainability in scientific work. New J. Phys.24, 053041 (2022).

89. Evans, J. A. & Foster, J. G. Metaknowledge. Science331, 721–725 (2011).

90. Clauset, A., Larremore, D. B. & Sinatra, R. Data-driven predictions in the science of science. Science355, 477–480 (2017).

91. Fortunato, S. et al. Science of science. Science359, eaao0185 (2018).

92. Wang, D. & Barabási, A.-L. The Science of Science (Cambridge Univ. Press, 2021).

93. Tshitoyan, V. et al. Unsupervised word embeddings capture latent knowledge from materials science literature. Nature571, 95–98 (2019).

94. Olivetti, E. A. et al. Data-driven materials research enabled by natural language processing and information extraction. Appl. Phys. Rev.7, 041317 (2020).

95. Schwalbe-Koda,  D., Jensen, Z., Olivetti, E. & Gómez-Bombarelli, R. Graph  similarity drives zeolite diffusionless transformations and intergrowth.  Nat. Mater.18, 1177–1181 (2019).

96. Rzhetsky, A., Foster, J. G., Foster, I. T. & Evans, J. A. Choosing experiments to accelerate collective discovery. Proc. Natl Acad. Sci. USA112, 14569–14574 (2015).

97. Krenn,  M. & Zeilinger, A. Predicting research trends with semantic and  neural networks with an application in quantum physics. Proc. Natl Acad. Sci. USA117, 1910–1916 (2020).

98. Devlin,  J., Chang, M.-W., Lee, K. & Toutanova, K. Bert: Pre-training of  deep bidirectional transformers for language understanding. Preprint at arXiv 1810.04805 (2018).


99. Brown, T. B. et al. Language models are few-shot learners. Preprint at arXiv 2005.14165 (2020).

100. Hamilton, W. L., Ying, R. & Leskovec, J. in Proc. 31st International Conference on Neural Information Processing Systems (NIPS 2017), 1025–1035 (2017).

101. Montavon, G., Samek, W. & Müller, K.-R. Methods for interpreting and understanding deep neural networks. Digit. Signal Process.73, 1–15 (2018).

102. Roscher, R., Bohn, B., Duarte, M. F. & Garcke, J. Explainable machine learning for scientific insights and discoveries. IEEE Access8, 42200–42216 (2020).

103. Lundberg, S. M. et al. From local explanations to global understanding with explainable AI for trees. Nat. Mach. Intell.2, 56–67 (2020).

104. Mahendran, A. & Vedaldi, A. in Proc. IEEE Conference on Computer Vision and Pattern Recognition, 5188–5196 (2015).

105. Mordvintsev, A., Olah, C. & Tyka, M. Inceptionism: going deeper into neural networks. https://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html (2015).

106. Shen,  C., Krenn, M., Eppel, S. & Aspuru-Guzik, A. Deep molecular  dreaming: Inverse machine learning for de-novo molecular design and  interpretability with surjective representations. Mach. Learn. Sci. Technol.2, 03LT02 (2021).

107. Burgess, C. P. et al. Understanding disentangling in β-VAE. Preprint at arXiv 1804.03599 (2018).

108. Wetzel,  S. J. & Scherzer, M. Machine learning of explicit order parameters:  From the Ising model to SU (2) lattice gauge theory. Phys. Rev. B96, 184410 (2017).

109. Wetzel,  S. J., Melko, R. G., Scott, J., Panju, M. & Ganesh, V. Discovering  symmetry invariants and conserved quantities by interpreting siamese  neural networks. Phys. Rev. Res.2, 033499 (2020).

110. Friederich,  P., Krenn, M., Tamblyn, I. & Aspuru-Guzik, A. Scientific intuition  inspired by machine learning-generated hypotheses. Mach. Learn. Sci. Technol.2, 025027 (2021).

111. Flam-Shepherd,  D. et al. Learning interpretable representations of entanglement in  quantum optics experiments using deep generative models. Nat. Mach. Intell.4, 544–554 (2022).

112. Wellawatte, G. P., Seshadri, A. & White, A. D. Model agnostic generation of counterfactual explanations for molecules. Chem. Sci.13, 3697–3705 (2022).

113. McGrath, T. et al. Acquisition of chess knowledge in AlphaZero. Preprint at arXiv 2111.09259 (2021).

114. Schmidt, M. & Lipson, H. Distilling free-form natural laws from experimental data. Science324, 81–85 (2009).

115. Gentile, A. A. et al. Learning models of quantum systems from experiments. Nat. Phys.17, 837–843 (2021).

116. Cranmer, M. et al. Discovering symbolic models from deep learning with inductive biases. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020) (NeurIPS, 2020).

117. Georgescu, I. How machines could teach physicists new scientific concepts. Nat. Rev. Phys.https://doi.org/10.1038/s42254-022-00497-5 (2022).

118. Cranmer, K., Brehmer, J. & Louppe, G. The frontier of simulation-based inference. Proc. Natl Acad. Sci. USA117, 30055–30062 (2020).

119. Raayoni, G. et al. Generating conjectures on fundamental constants with the Ramanujan Machine. Nature590, 67–73 (2021).

120. Wagner, A. Z. Constructions in combinatorics via neural networks. Preprint at arXiv 2104.14516 (2021).

121. Rahwan, I. et al. Machine behaviour. Nature568, 477–486 (2019).

122. Schmidhuber, J. in Workshop on Anticipatory Behavior in Adaptive Learning Systems, 48–76 (Springer, 2008).

123. Pathak, D., Agrawal, P., Efros, A. A. & Darrell, T. in Proc. 34th International Conference on Machine Learning, 2778–2787 (PMLR, 2017).

124. Thiede,  L. A., Krenn, M., Nigam, A. & Aspuru-Guzik, A. Curiosity in  exploring chemical spaces: intrinsic rewards for molecular reinforcement  learning. Mach. Learn. Sci. Technol.3, 035008 (2022).

125. Varshney, L. R., Rajani, N. F. & Socher, R. Explaining creative artifacts. Preprint at arXiv 2010.07126 (2020).

126. Varshney, L. R. et al. A big data approach to computational creativity: The curious case of Chef Watson. IBM J. Res. Dev.63, 7:1–7:18 (2019).

127. Itti, L. & Baldi, P. Bayesian surprise attracts human attention. Vision Res.49, 1295–1306 (2009).

128. Schmid, U., Zeller, C., Besold, T., Tamaddoni-Nezhad, A. & Muggleton, S. in Proc. International Conference on Inductive Logic Programming, 52–67 (Springer, 2016).

129. Muggleton,  S. H., Schmid, U., Zeller, C., Tamaddoni-Nezhad, A. & Besold, T.  Ultra-strong machine learning: comprehensibility of programs learned  with ILP. Mach. Learn.107, 1119–1140 (2018).

130. Feigenbaum, E. A. Some challenges and grand challenges for computational intelligence. J. ACM50, 32–40 (2003).

131. de Regt, H. W. & Gijsbers, V. in Explaining Understanding: New Perspectives from Epistemology and Philosophy of Science (eds Grimm, S. R., Baumberger, C. & Ammon, S.) 50–75 (2017).


本文来自微信公众号:集智俱乐部 (ID:swarma_org),作者:Mario Krenn、Robert Pollice、Si Yue Guo、Matteo Aldeghi等,译者:刘志航,审校:梁金,编辑:邓一雪

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定