科大讯飞胡郁：产业界才不关心AI会不会毁灭人类，都是有钱有闲人的杞人忧天-虎嗅网

虎嗅注：科大讯飞副总裁、研究院院长胡郁在GMIC大会期间参加了闭门媒体见面会，这是胡郁首次公开面对媒体详细介绍科大讯飞和深入分析人工智能行业。本文作者机器之心参加了当日的媒体见面会，并根据胡郁的对话进行了整理、编辑。

一、人工智能再次火爆的原因

人工智能的研究历史可谓几经周折，经历了四次寒冬。而如今又再次变得异常火热，学术界、产业界和媒体界都对该领域表达了广泛关注。深度学习大师GeoffreyHinton、Yann LeCun和吴恩达分别被科技巨头谷歌、Facebook和百度招致麾下；高校研究机构纷纷推出自己的人工智能最新研究进展；众多以DeepMind、Vicarious 为代表的众多人工智能创业公司开始兴起，行业自身的发展加上媒体的大肆宣传使这个行业得到了前所未有的热度和关注。

胡郁认为，人工智能一下子火起来是有原因的，核心算法、数据量的增长和应用模式这三个方面的成熟为人工智能的发展提供了天时地利人和的环境，因此，人工智能开始从技术上突破了产业上大规模应用的瓶颈。同时，不管是语音识别，还是图像识别，这些人工智能技术基本都是在同一时间发生了大的变化和突破，这些都和以下三个要素有关，有共性的东西。

1）核心算法的提升

第一方面是深度神经学习为代表，基于统计模型的整体突破，这个方向被研究了几十年，只有在这方面真正掌握一流的人才才能抓住这样的机会。深度神经网络（DNN）和递归神经网络（RNN）就是可以很好提升图像识别和语音识别能力的核心算法。

2）大数据

现在人工智能在很多方面是基于统计模型，统计模型里非常重要的就是你要有足够多的能符合我们真实世界的数据样本。以前在实验室环境下很难收集足够多的样本，现在数据容量相对以前在数量、覆盖性和全面性方面都获得了大幅提升，现在所获得数据量更大，更加多维，同时覆盖更全面。因此，对这些海量数据的处理能力就非常重要，需要有超级计算机还有海量存储等工程技术体系的支撑。目前，科大讯飞和百度都拥有这样的数据收集和处理能力。

3）应用模式的建立

现在与以往实验室技术最大的不同在于，把研究技术、工程、产品、应用、最终用户整个链条打通，形成了大数据、移动互联网、云计算和智能化的整个循环。这是一个不断迭代优化的过程，让每个用户在使用这个技术同时也成为数据的贡献者和经验的分享者。他们在使用过程当中会碰到哪些问题，我们再改进。这种优化能力是一个系统化工程，是互联网公司和讯飞这样的公司，在互联网有很多方面的积累之后才能做到的。这也是为什么以前研究所和学校很难做到。

这三点具有普适性，用在图像、语音都可以，是一个把人才、计算能力以及整合链条建立起来，并将最终用户的数据不断优化的整套体系，这是工业界的人工智能，要想突破大规模应用就必须具备这三个天时地利人和基本要素。而且这三个要素也是互相补充，比如说有了移动互联网和物联网带来了大数据，还要有相应的算法和工程人员，这不是靠一个产品概念能解决的，这个部分需要科学家和工程师一起研究的。

二、对目前人工智能领域的评价

1）产业界关心现实问题，关心如何用现有技术解决用户需求

胡郁强调了产业界不关心那些虚无缥缈的问题，比如大家讨论人工智能是不是要毁灭人类，这在短期内不是产业上应该关心的重点。

大家都注意到了一些AI威胁论，那都是有钱有闲人的事情。即便把人工智能这个技术突破了，它不会有自己的意识情感，也不会考虑到危害还是不危害人的情况。我们现在连它最基本的认知、知识掌握还没解决。从科学家严谨的角度来看，十年之内能不能解决还不确定。因此，我们应逐步推进，根据现在的技术水平反过来设计我的产品，多去考虑一下在现在技术情况下，我们的产品可以解决大家什么问题。

比如在酒店里面，你们住一个酒店，你要操纵酒店里的灯和服务是在一个可控的受限环境中，现代技术通过某种工程的优化还有部分的自学习可以满足大家的需求，不要幻想它一定那么智能。从科学家的角度来讲，我们不停的研究新方法，从产品的角度来讲，你现在有什么技术，我如何避免它的缺点，如何利用它的优点做成用户可以接受的产品，这两条路要并行。

胡郁提倡关注人工智能的现实问题，这基本代表了产业界的共同心声。不论媒体多么喜欢追逐马斯克和霍金等人的夸张言论并大肆宣传，产业界依然在关注现实问题，关注现有技术进展，关注如何将现有技术转化成满足用户需求的具体产品。Jordan Pearson曾在文章中指出，马斯克科幻作品般的言论被大肆炒作和宣传，当这样的负面宣传涉及到具体的研究工作时，会产生非常消极和有害的后果。Facebook人工智能实验室的负责人YannLeCun去年在Google＋上总结到：「一些不实宣传对于人工智能是非常危险的。在过去的50年里，人工智能就先后因为不实宣传而沉沦了四次。关于人工智能的炒作必须停止。」

2）大脑模拟是一个值得严肃讨论的路径，但不适合产业界

通过模拟人脑的生理原理以实现人工智能是一个长期主题，控制论奠基人沃尔特·皮茨早在上世界四五十年代就进行这样的研究，用人造神经网络来模拟人类大脑，他的论文《逻辑演算》影响了冯诺依曼现代计算机架构的提出。但皮茨却在后续的研究中发现这条路根本走不通。

如今，这条通往人工智能的路径依然被学术界讨论，只是没有得到产业界的承认。Yann LeCun在接受IEEE采访时表示，他最不喜欢的对「深度学习」的描述就是「它像大脑一样工作」，虽然深度学习从生命的生物机理中获得灵感，但它与大脑的实际工作原理差别非常非常巨大。将它与大脑进行类比给它赋予了一些神奇的光环，这种描述是危险的，这将导致天花乱坠的宣传，大家在要求一些不切实际的事情。

胡郁也认为，对人脑进行模拟这条路径被国际很多人很严肃讨论，但现在不是产业界走的路，是研究界或者是科学界走的路，那条路有可能，但不适合当前产业界急需的人工智能突破。比如说HBP（欧盟人脑计划）和美国人脑计划，它们更多是研究脑生理，针对的是大脑疾病，顺带带个尾巴提出了人脑模拟这个角度，后来有人把它延伸出来说可以通过脑模拟的方法实现人工智能。

3）谷歌、百度和科大讯飞对人工智能研究的目标有所不同

胡郁表示，产业界对于人工智能的观点基本能够达成共识，就是他之前提出的三要素，算法、数据和应用。而区别在于将人工智能技术应用于何种方向，自身擅长哪些产品。

谷歌和美国其他大公司第一是基于以深度神经网络为代表的机器学习算法，基于数学这套东西。第二是基于大数据处理，第三就是基于产业一体化。以应用反过来对产品、技术、研究进行整体的迭代和优化。这个思路上我们跟百度大脑有共识，我们都遵循，包括跟谷歌做的整个一套体系都是一样。这是工业界实现人工智能的路径。但是真正你要讲从这路径出来真正攻克什么领域，大家的目标根据自己的产业优势就可能不一样。

谷歌和百度使用人工智能来解决的问题主要包括搜索、广告、推荐、地图和自动驾驶汽车等，他们有这样的资源。科大讯飞和他们在人工智能的实现路径一样，但目标不太一样，科大讯飞更多关注在感知智能和认知智能，想突破机器怎么掌握人类知识这一点，并将这些成果应用到智慧教育，政府智能信息化，智能家居，智能车载等等领域。

4）从感知智能到认知智能

胡郁在此前其他的演讲中就提到过，人工智能主要分为计算智能、感知智能、认知智能。感知智能方面包括语音识别、手写识别和图像识别等，认知智能的目标是需要在语言理解、知识表示、联想推理和自主学习四个方面实现突破。

此次胡郁又从技术角度对认知智能的实现进行了解释，感知智能是图象识别、语音识别，认知智能我们还有一段距离，学习能力还有对知识掌握的能力，是我们现在需要努力突破的地方。

5）人工智能新方法的优势

在传统人工智能方法下，我们首先要人工建立一个庞大的数据库，然后再进行推理。而随着大数据和神经网络的发展，现在尝试用新的方法做。解释的简单一点，就是用一些连续的概率统计，把词和词之间的关系用一种数学方法描述出来。

大家都知道给你们一组词，「男人」和「女人」，「国王」和「王后」，如果按传统的方法来看，「国王」是个男的，「王后」是女的。「国王」和「王后」的差别跟「男人」和「女人」的差别是一样。现在有一种新的方法，是看「国王」和「王后」这两个词语在所有文本中出现的情况，他跟谁比较接近，他干哪些事情，干了哪些动作，在所有文本描述里面周围的环境是不一样的。它能够用一种概率统计的方法对「国王」和「王后」这些词语周围环境进行概率描述，算出来之后发现跟「男人」和「女人」周围环境的概率是非常强的相关关系。这时候就可以推导出「「国王」减「王后」」等于「「男人」减「女人」」，并不是真正的建立那个体系，而是分析了「国王」和「王后」在各个地方出现的情况和「男人」和「女人」在各个地方出现的情况总结出来的。

这种新方法能否成功还不确定，但谷歌、Facebook、微软等都在做这方面的东西，想在新的体系下看能不能找到新的方式。也许两到三年内，知识表达解决了，自然理解也解决了，逻辑推理也完成了。形成这个东西之后，机器就可以自动去学习了。

还有一点是，原来我们传统的系统不是按照这种学习方式设计的。我们在实验室里编好程序，然后再放到真实环境中去用。用户怎么反馈我不管（也看不到），我们只按照实验室里一套去我行我素。比如说，春节期间网传的山东大汉与安吉星的对话视频，当司机纠正了所说号码后，安吉星依然在自说自话，没有根据用户的反馈进行相应调整。其实如果机器了解关于这个司机的反馈信息并进行模型思考的话，这样的错误就不会发生，但系统没有学习到这些信息。之前的系统建设缺乏这样的环境，而现在的思路是转变为，一开始这个系统是不聪明的，但用了之后可以观察用户的反馈，从用户反馈中提取信息，包括你系统的评价，告诉你哪个地方不好，系统学习这些东西从而逐步变得聪明，这需要新思路和新方法解决这些问题。以前我们没条件做这个事情，现在我们有条件了。比如说DeepMind发布的那个能够自动玩游戏的人工智能系统，它是自己去运行那个游戏，执行一些动作，再根据死的快不快、得多少分进行强化学习。研究这种方法是一个系统科学，每一个点的实现都需要一个团队。必须掌握最先进的技术，把一个问题定义成一个可解决工程和科学问题，还要想出算法优化它，这需要一个完整的团队，有学生做高风险尝试，还要有研究人员把可行的方案做起来。整个链条上需要这样的人来组合。如果能解决这些问题，让机器具有认知智能才有可能实现。

微信公众号：机器之心（ID：Almosthuman2014）。