美国政府公布耗资1亿美元的“阿波罗大脑计划”-虎嗅网

智能工程旨在反向设计大脑，以开发出能让计算机更像人类一样思考的算法。本文选自科学美国人，作者Jordana Cepelewicz，机器之心编译出品，参与：孙闰松、柒柒。

三十年前，美国政府开启了人类基因组计划，然后经过十三年的努力，终于完成了人类这一物种的所有基因组测序，并绘制了人类基因图谱。尽管起初遭遇了怀疑甚至反对，但该计划自此改变了遗传学领域，而且如今仍被视为历史上最成功的科学事业之一。

现在高级智慧研究计划（ IARPA ）—— Intelligence Advanced Research Projects Activity，它在命名上模仿了国防部门下属的著名的美国国防部高级研究计划局（ DARPA ）——是一家针对智能社区而建立的研究机构，已投入一亿美元用于类似的雄伟计划。大脑皮层网络的机器智能（ MICrONS ）项目旨在反向设计一立方毫米的大脑，研究大脑的计算方式，并运用这些研究发现去更好地影响机器学习和人工智能算法。

IARPA 已经招募了三个团队，领头人分别是哈佛大学的生物学家、计算科学家 David Cox ，卡内基梅隆大学的计算科学家 Tai Sing Lee 和贝勒医学院的神经科学家 Andreas Tolias 。每个团队都为这个难题提出了自己的五年研究规划。

「这是一次巨大的投资，因为我们认为这是一个重要的挑战，它将对智能社区和整个世界产生非常广泛的革命性影响。」 IARPA的Jacob Vogelstein 是 MICrONS 项目的管理者，如此说到。

MICrONS 是奥巴马总统大脑计划（BRAIN Initiative）的一部分，试图将类脑计算的现状向前推进。很多技术如今都依赖于一套叫做人工神经网络的算法。人工神经网络，顾名思义，就是从大脑的组织结构（至少是我们已了解到的组织结构）受到启发而构建的。由于计算能力显著增长和网上的大量可用数据， Facebook 能识别面孔， Siri 能分辨声音，汽车可以自动驾驶，计算机可以在像象棋这样的游戏中击败人类（现在甚至是在围棋这种号称人类堡垒的游戏中也能击败人类了）。

然而，这些算法依赖于高度简化的模式分析信息过程，发展水平仍然很低。基于19世纪80年代的模型，神经网络在杂乱的环境中往往表现得很糟糕。在那种环境中，计算机试图辨别的物体隐藏在众多物体之中，而且许多物体是重叠的或模糊的。这些算法并不具备很好的概括能力，例如，计算机看到一两条狗，并不能教会计算机辨识所有的狗。

另一方面，人类似乎能毫不费力地应对这些挑战。我们可以在人群中找出朋友，可以在喧闹的环境中注意到熟悉的声音，还可以根据一个或少数几个例子推断出声音或图像的模式。我们不需要任何指导就能持续不断地学会归纳概括。所以， MICrONS 的研究转而求助大脑，以期发现计算机模型缺少什么。“那就是铁证。” Cox 说。

尽管神经网络是大脑组织结构中的基本要素，然而他们所使用的计算方法并没有直接模仿神经元用来处理信息的算法。换言之，当前各种算法描述、变换数据并从数据中学习的方法，在很大程度上是由试错决定的工程方案。神经网络能起作用，但科学家不是真的知道其中奥妙——当然也就不能很好地找到一条设计神经网络的途径。「所以，如果我们更进一步，从计算角度而不是组织结构角度理解大脑，我们就能改进那些算法，并让计算机的性能更接近人脑。」 Vogelstein 说。

不同团队将尽力绘制出啮齿动物一立方毫米大脑皮层中的所有神经回路

一立方毫米不足人脑的百万分之一，可能看上去太小了。但是迄今为止，科学家们只能在同一时间测量少数神经元的活动，或者用功能性核磁共振获得复合图片来观测数百万神经元。现在， MICrONS的成员打算在啮齿动物进行视觉感知和学习任务的过程中记录十万神经元的活动和连接，这是相当伟大的壮举，因为这需要具有纳米分辨率的成像技术，并且影像中曲折弯转的线全长只有几毫米。「这就像是一英寸一英寸地测量来绘制美国的公路交通图。」 Vogelstein 说。

然而， Vogelstein 是乐观的，因为最近的技术支持为大规模的神经科学研究提供了方便。「随着大脑计划的降临，大量的新工具出现在了网上，能够在重构详尽的神经回路图谱所要求的分辨率和尺度上探询大脑，」他说，「所以，这是历史上独一无二的时刻，我们拥有了恰当的工具、方法和技术，可以让我们第一次在单个神经元和单个突触水平上揭示大脑的线路图。」

每个团队打算分别记录大脑的路线图。 Cox 的团队将使用名为双光子显微技术（ two-photon microscopy ）的工具测量老鼠的大脑活动，这些老鼠被训练去辨识电脑屏幕上的物体。研究员们将一种改良过的对钙很敏感的荧光蛋白导入老鼠。当一个神经元兴奋时，钙离子就蜂拥进入细胞，引起荧光蛋白发光，因此研究员们使用激光扫描显微镜就能观看到神经元爆发动作电位。「这有点像电线轻敲大脑，」 Cox 说，「类似于你可能通过收听电话呼叫里的信息来弄明白发生了什么，我们也可以在动物活泼乱跳的时候收听到它们大脑内部的重要信息。」

然后，一立方毫米的老鼠大脑将被送到 Jeffrey Lichtman 手上，他是哈佛大学的一位生物学家和神经科学家。在他的实验室，大脑将被切成极其细薄的片，并在先进的具备足够分辨率的电子显微镜下成像，研究员们就能看到脑细胞彼此连接而形成的所有的线状延伸。 Tolia 的团队正采取相似的名叫三光子显微技术（ three-photon microscopy ）的方法，来深入窥探老鼠大脑中更深处的皮层，而不仅是 Cox 和他的同事们检测的顶部皮层。

与此同时， Lee 的团队打算走得更远，想寻找到描绘神经连接组的更根本的方法。他们与哈佛医学院的遗传学家 George Church 合作，打算使用DNA条形码：他们将用独特的核苷酸序列给每个神经元打上标签（条形码），并用化学方法连接突触之间的条形码来改造神经回路。尽管这种方法不能像显微技术那样提供同样水平的空间信息， Lee 希望它能更快，更准确——也就是说希望它在各方面发挥作用。这种方法在以前从未成功过。「但是，倘若这种条形码技术发挥了作用，就将革新神经科学和连接组学。」 Lee 说。

以上所说的一切仅仅构成 MICrONS 项目的前半部分。科学家们接下来必须找到一条路径让所有这些信息能够用于机器学习算法。他们大致上知道如何去做。比如说，许多研究员相信大脑是贝叶斯式的——神经元以概率分布的形式表征感官信息，基于先前的经验对事件计算得出最可能的解释。这种假设主要是基于大脑中的反馈回路这一想法，即信息不仅向前流动，还通过更多连接反向流动。

换言之，研究员们假设感知绝不是简单的从输入到输出的映射。更准确地说，存在一个「通过合成进行分析」的建设性过程，大脑维持并创造对世界的内部表征，产生期待和预测，这让它可以解释和计划如何使用输入的数据。「这是我们最近非常关注的指导性原则——是这个合成过程的标志，」 Cox 说，「在这里我们设想在这世界上什么是可能的，验证那些不符合我们实际所见的设想，并用那些设想驱动我们的认知。」

例如，视网膜对光做出反应，产生电脉冲，传递到视神经然后到大脑，实际上视网膜是二维结构。因此当人们看一个物体时，大脑可能使用了这样一个基于概率的模型从光刺激视网膜的二维平面去推导立体世界。仅以此为例，大脑已经找到一个更好的方法对环境中的变量进行估算和推论，超过了我们当前的数学模型所能做到的。毕竟，如果你观察一个有一百个物体的场景，仅仅考虑物体是向前还是向后，这仅仅是诸多因素中的两个因素，结果就有2100种可能的模式。计算出所有的可能情况来得到答案，不是切实可行的。然而大脑能轻松地做到，即使有无限多种可能的条件取向：不同的距离，不同的旋转角度，不同的光照条件等。「大脑要做的是显示数据点的汇集情况，并让混在一起的数据轻易的分隔开。」 Tolias 说。

这三个团队都各自招募了计算机科学家来将这些理论提炼成模型，然后他们将测试这些模型是否与反向设计的大脑数据相抵触。「对于任何给定描绘的算法，如基于概率的算法，你都有数百万种可以实施的选项将理论翻译成可执行的代码，」 Vogelstein 说，「在这些大约百万中的选项中，某些参数和特征的结合将形成好的算法，而另外一些结合将造成无效的或糟糕的算法。通过从大脑研究中提取这些参数设置，这与我们一直在做的那样在电脑软件上猜测那些参数相反，我们有希望将研究空间缩小到实现一小部分符合大脑实际情况。」

有了这些内部模型， MICrONS 打算让机器更自动化，尤其是当谈及训练机器去辨认物体并且不需要事先让机器通过成千上万的、物品被明确命名的例子进行学习。 Vogelstein 想要将无监督式学习技术应用于协助美国智能。「我们可能只有一张图片，或者一个我们想要阻止的网络攻击的例子，或者一份金融危机或灾害性天气的记录，」他说，「我们需要推广到更广泛的、相同模式可能出现的环境中去。所以这就是我们希望达到的：更好的概括推广，更强的抽象能力，更好的稀疏数据使用。」

研究员们认为从大脑推导这样的算法将是 MICrONS 面临的最困难的部分，他们将不得不确定一种方法去编译大脑是如何加工信息和形成新连接的。

然而，在这个研究项目的初期也存在一些挑战

举例来说，他们对大脑的测量将产生大约两千兆兆字节的数据，这个数量等于 250,000 台笔记本电脑的内存量，或者 250个 CD 的存储量。存储如此巨量的数据是困难的， IARPA 已经与 Amazon 合作寻找解决方案。

另外，数据全是图象式的。挖掘数据以得到有用信息将需要一个叫做分隔的过程，在这个过程中，研究员用不同的颜色区分神经元的结构基础和神经连接，这样计算机就可以更好地理解共同特征和模式。「即使对你来说全世界都是染有颜色的，」 Lichtman 说，「要为一立方米的大脑染色也需要耗费终生光阴。」相反，研究员们将致力于创造出更复杂巧妙的计算机视觉技术来划分数据。

Lichtman 已经懂得成功存储100万亿字节的数据（这是 MICrONS 计划收集的数据的二十分之一），这些数据产生于传递感官信息的中转站——丘脑。他的团队的成果将在3月发表在《 Cell 》上。「我们了解到有时候同一轴突会从一个细胞跳去另一个细胞来连接不同神经细胞的同一位置，这意味着丘脑的组织方式并不人们预料的那样。」 Lichtman 说。也许，这些成果将扩展至他们刚刚开始测评的一立方毫米的大脑皮层。「我们知道我们可以测评更大的体积，但是目前一立方毫米对我们来说就是巨大的体积，」他说，「这是一次巨大的飞跃。我们认为我们已经准备好走下一步了。」

David Mumford 是一位数学大师，菲尔兹奖得主，也是 Lee 的博士导师，却不是 MICrONS 的成员。他称赞这个项目。「这是真正的进步，」他说，「一旦这种数量级的数据集可供使用，我们能更深入地理解神经元彼此互动的方式，但是要弄清你能应用这些技术知识做什么将是巨大的挑战。我的梦想是这一巨量数据的记录在某一时刻能成为可能，而且我认为这个研究组可能是能很好地做成这件事的组。」

「但是我稍微有点怀疑将这些信息转换成人工神经网络的可能性，」他补充到，「那稍微有些不同寻常。」

即使这样，三个团队都信心满满，认为他们的工作将产生成果。 不管研究结果是什么，结果都不是失败，」 Lichtman 说，「结果可能并不符合你们的预期，但这是一个机会。我不会为我们的观点是否错误而失眠。还有我们未知的东西。事实是大脑是真实存在的，也确实是复杂的，从没有人看透大脑，所以让我们关注研究进展。研究中的风险是什么？」

他们还希望在耗资 20 亿美元的人脑计划陷入困境的地方取得胜利。 Cox 解释说他们的研究方法是与人脑计划有根本区别的，既体现在技术上也表现在逻辑上。事实上，首先从本质上看，在努力尝试模仿大脑之前，两者在本质上就相反。 MICrONS 的基于团队的方式将有望引起必要的合作与竞争，最终获得重大进展。 IARPA 意欲公布它收集的数据，以便其他科学家贡献思想观点和科研力量。「即使这就像是在看一粒沙子，」Lee 说，「就像我的大学教授告诉我的，你也可以在一粒沙子中看见上帝。」

转载请联系公众号：机器之心（almosthuman2014）获得授权