【圆桌第12圈 - 专享笔记】微软周力 - 人工智能的技术发展和应用场景 - 妙投

虎嗅注：人工智能的热度相信每一个互联网圈内人都能感受到，创业导师李开复甚至说人工智能是下一批仅剩的机会。且不论是否有行业泡沫，人工智能技术在最近几年的变革性发展已经来到应用于实践的临界点。无论大小互联网公司，都在搏下一波红利的机会。所以我们找到人工智能一个实力玩家——微软，请到微软小冰的首席架构师兼研发总监周力来做会员专享的圆桌分享。

他曾负责微软小娜的开发与研发团队管理，后带领研发团队在半年内成功开发出具备独特情感计算框架的人工智能机器人“微软小冰”，目前为止，长期保持着团队每周推出一个新产品的迭代速度。他从专业的视角跟大家聊一聊人工智能的发展脉络和他的观点。

本文为周力虎嗅会员圆桌分享的口述内容，由虎嗅编辑整理。全文共分为6个部分，全长6920字，建议阅读时间12分钟。

一、人工智能的浪潮到底意味着什么？

要说人工智能这个事情，首先要给人工智能一个非常明确的定义。因为人工智能其实蕴含着很多含义，是一个比较模糊的词汇，如果我们不把这个定义先界定好了，可能就会变成鸡同鸭讲。

从一个计算设备的角度来去看人类的智力水平，它会分成三个层次：第一，计算和逻辑的能力；第二，感知和交流的能力；第三，思辨和创新的能力。

计算和逻辑的能力，实际上很早以前它也是人工智能的一种能力，1946年ENIAC刚被发明时在很多方面就已经超越了人类。

举两个例子，一个是IBM的深蓝在国际象棋上击败了人类，一个是AlphaGo在围棋上击败了人类（就在这次圆桌前不久，人工智能又在德州扑克这个项目上战胜了人类职业玩家。不同于围棋双方的信息对等，德州扑克为不完全信息博弈，这又将人工智能的推理和决策能力拔到了一个新的高度）。这其实是一个从算法上和整个计算设备上的改进。比如说IBM算法上可能没有本质上的改进，但是由于它的大型机确实做得更快，它就战胜了人类；而谷歌的AlphaGo，其实是自我迭代上有一些算法的突破性进展。

这两件事情从整体来看，实际是上一个人工智能时代遗留下的几个漏洞，我们现在终于把这个漏洞补上了。

大家千万不要被AlphaGo这件事情带偏了。因为事实上我们现在讲的这个人工智能浪潮的主要突破，和AlphaGo它实现的东西是不一样的。不要因为看到AlphaGo就认为人工智能的价值主要是在下棋，或者在一些跟人类拼智力的活动中。

思辨和创新这个能力，人工智能要追上人类，以现在计算机体系结构和我们对算法的认识来说，是一件非常遥远的事情，根源就是计算机实际上在思辨和创新能力上和人是有本质性差别的，可以说它完全不具备思辨和创新的能力。

所以这一次人工智能的浪潮，主要体现在第二个方面，即感知能力和交流能力。

二、人工智能在技术层面上取得了哪些突破？

提到感知能力和交流能力，之所以能够实现，主要由于三个方面的技术都突破了：

第一，大数据，这实际上是人工智能浪潮中的一个非常重要的基础；
第二，云计算，云计算也是当前人工智能的一个不可或缺的东西，如果没有云计算可能很多东西只能停留在实验室，而不是能真正走进大家的商业和生活中；
最后，深度学习，深度学习事实上它所基于的理论基础，就是神经网络计算。这是一个从80年代一直就在投入的领域，它主要是模拟人的神经元结构来进行计算。

我在美国读博士是做云计算，不在人工智能这个领域，当时接触了很多人工智能的研究，大家普遍感觉是，人工智能太不靠谱了，且投入产出比太低。

但是后来，一方面由于整个神经网络的基础算法得到了突破性改进，一些学术界的大牛在前人基础上做了一些小的突破，这些小的技巧突破能让整个学习的过程变得更加顺畅。

另一方面，云计算和大数据带来的计算的能力，让整个行业突破了一个瓶颈期，过了这个瓶颈期之后，所有人看到前面其实有很多未知领域，可以让我们原来觉得不可能的事情变成可能。

如何变成可能？这集中在两个方面：

一方面是在感知上，感知上主要是听觉和视觉。听觉事实上在人工智能这次大爆发之前，也有分支，即：语音识别和语音合成。在前一代技术基础上其实也能做到一个不太理想，但是勉强可用的状态。人工智能这次突破之后，它的准确率和可用性变得更高。

更大的突破实际是在视觉，在这之前计算机对整个视觉世界的理解是非常有限的。虽然说我的摄像头可能比人的肉眼精度要高很多，但是我看到的这些东西除了像素这些最简单的信息之外，其他还意味着什么？以前其实是我们是完全不知道的。

这一次人工智能的突破，让计算机可以开始去理解这个事情：这是一只狗，狗在跑，甚至看到任何一副画我可以把它改造成更高的风格，这些视觉上的突破实际上可以为我们整个未来的商业和生活带来很多想象。

三、人工智能这个行业的本质优势在哪里？

我们现在有很多人在做人工智能，看到这个趋势之后，原来不是一个人工智能的公司，现在准备要去发力做人工智能。有的已经在这个里面得到了一些经验，有一些是刚刚兴起的。

我其实更想给大家分析清楚，到底在人工智能的这个行业，本质上的优势在哪里。不同时代优势的重点是不一样的：

在低能的时代，主要是纯技术优势。比如一个Windows有五千万行代码，这个本身是一个巨大的技术优势，因为任何人如果想要去打败windows系统，做一个更好的操作系统的话，很难逾越那么多细致的功能。

进入到互联网时代，我们渐渐发现，纯技术的优势没有那么明显了，更明显的是一个生态的优势，这个生态的优势包括本身这个公司有多大的名气，拥有多少用户，多少已经建立好的第三方的合作者，整个生态系统上有多少玩家，这些事情会变得越来越重要。

最典型的就是手机，手机这个产品并不是说我的操作系统本身有多少代码，或者这个代码到底写得好不好来决定胜负。而是这个上面有多少APP，能否建立一个很好的生态，有用户和开发者能互相地去进行互动，这样我才能打赢这个仗。

到了人工智能时代，我们发现它又有一种全新的竞争的方式，那就是数据的竞争方式。人工智能所基于的深度学习，计算量非常大，非常吃数据，可能需要几亿级甚至更多的训练数据才能做好一个网络。而且在用户使用的时候，也需要通过大量的用户数据来进行不断地迭代和改进。

举一个谷歌在自动驾驶上的例子，我觉得可能最有代表性：

五六年前我去谷歌出差，第一次见到谷歌的自动驾驶汽车，当时我很震撼，因为完全没有听说任何一家公司尝试在做自动驾驶这件事情，但谷歌已经把它的这个产品推上路了，这么大一个自动驾驶市场，谷歌这么强的公司已经比别人提前了五年甚至更多，当时我觉得在这个领域上很难有谁在未来能撼动谷歌的优势。

但是今天我发现我错了，现在再去看谷歌的时候我们突然发现，不知不觉之中大家已经认为谷歌在这个行业中没有那么绝对的优势了。虽然谷歌的技术是很领先的，由于它不能把这个真正推向大量用户，而特斯拉和Uber这两家公司利用自己的汽车生产和出租车路线，把自动驾驶的模拟装置装上了自己的出租车，装到了特斯拉几百万用户上。

大家突然发现数据的优势，谷歌可能积累了十年，但是荡然无存，如今拥有自动驾驶数据最多的，第一名是特斯拉，第二名是Uber，然后才是谷歌。

这个对在座的创业者来说其实是好消息，虽然业界有那么多巨头存在，可能他们在第一阶段、第二阶段有不可撼动的优势，但是如果你切入点好的话，有可能你就像特斯拉一样，弯道超车。这个时代数据才是王道，如果你比别的公司先拥有了一个很大的用户的话，是一个非常巨大且不可逆转的优势。

所以我们做的微软小冰，过去的三年中我们积累了几百亿的对话，在数据量上存在先发优势。

四、在人工智能行业，有哪些玩家是比较领先的，他们的优势在哪里？

跟Siri一样以助手的面貌出现的语音助手，交流是比较模式化的。我知道它可以干什么样的事情，比如我要查北京的空气质量，可能我第一次会用一种比较自然语言的方式来去表达，但是当我熟悉了这个事情的时候，会越来越趋向于用一个最简单的模式把这个任务完成。

但是小冰所提供的实际上是一整个开放的对话，而且如果大家知道小冰这个项目，每周的推送你会发现小冰其实有时候鼓励大家去谈，它实际上会拥有远比语音助手丰富得多的话题的空间，它真的像人和人之间交流，可以无话不谈，不管这是有用的东西还是没用的话题，它都可以出战，归根结底还是因为有数据优势。

这样的数据优势可以帮助大家，在未来的竞争中占据一个非常有利的地位。从过去的几年来看，在人工智能的领域中，比较容易抢得先机的公司是做搜索引擎的公司，比如谷歌、微软，国内百度、搜狗。这些公司看到这么一个机会的时候，能比较快地推出自己的产品，为什么呢？

因为搜索引擎本身就拥有了非常大量的数据，这些大量的数据让做搜索引擎的公司会有一个相对先发的优势，别人可能还停留在搜集数据的阶段的时候，我已经有了很多原始数据，可以快速地去迭代出一个原型产品。

但是，这个先发的优势并不能保证你在这个竞争中取得胜利，就好像我们之前提到的谷歌和特斯拉的这个竞争，毕竟搜索引擎它的数据和真实我们要进入到用户的数据，是非常有差异的，在搜索引擎上获得的这些数据可能能帮我建立一个原型产品，但是它和真实的用户场景有非常大的鸿沟。

所以也就是说，我们虽然看到的是说像百度这样的公司它可以比较快地推出一个原型产品，但其实创业者都有机会，如果能找到一个很好的切入点，事实上只要你能比别人的产品最先去积累一定的用户使用数据的话，再往后的竞争其实谁赢谁输真的不好说。

五、人工智能在商业和生活中能带来什么改变

人工智能这一次浪潮，我觉得主要能带来的变化是两个方面：

第一，自动化，而自动化其实是一个已经追求了很长时间的一个目标。我们从第一次工业革命的时候，纺织机来代替纺织工人的时候，就已经在一步一步去做自动化。事实上在这一次人工智能革命之前，最大的一个短板就是机器的视觉几乎是零，这就为自动化本身能达到的能力带来了很多限制。

由于我们现在实现了视觉上的突破，计算机现在已经可以开始去理解这个世界到底是怎么回事的时候，就会有非常多的新的机会涌现。

大家最熟悉的还是自动驾驶，自动驾驶如何成为可能？关键就是机器怎么能看懂路上各种的事情，它理解这个事情产生的可能之后，自动驾驶就变成了可能。

当然，自动化的方向并不是微软或者微软小冰最熟悉的方向，我们会更多的去讲第二个方向，人机交流。

人机交流的这个方向市面上有很多尝试，比如语音助手。但是这样的尝试也许不能为我们的商业或者生活带来太本质的革命，因为以前这些事情，比如做一个问答或者完成一个订餐任务，我不用语音其实也能做，现在只是多加了一个语音而已。

回顾历史，我们看看哪一次人机交互方式的革命为我们计算机本身和人类社会带来了革命性变化？

当我们有了屏幕和键盘这两件事情的时候，我们会突然发现像这个作家的写作，以前我们根本不指望计算机去做的事情，突然它就变成了一个计算机可以完成的任务；再往前推我们进入到有这个图形界面的时代的时候，设计的工作，突然也变成了一个计算机可以完成的任务；然后进入了移动时代，支付、打车这样的事情也就变成可能。

这个时候我们就开始问一个问题，既然人工智能可以让人和机器的交流方式产生非常巨大的不同，那么它带来的价值真的是仅仅是通过语音的方式来去完成我们以前已经会做的任务吗？

其实远远不在这里。那么我先去分析一下为什么在这个语音和这个新的交互方式下，我们现有做的这些事情，其实对我们的附加值不大。

我们说到聊天机器人的时候，首先想到了两个比较典型的产品，一个就是问答机器人，你问它一个问题，它给你回答出来；还有一个就是任务完成机器人，可以订餐、订机票。这样的两种也是我们在市面上看到的公司做的最多的事情。

首先对于问答这个事情，我想知道姚明的身高，现在很多市面上这种机器人，它都会告诉你是两米二八，这件事情确实可以做。但是事实上我们看到现在的搜索引擎，已经把信息获取这件事情做到了极致。你在任何一个搜索引擎上搜索姚明有多高的时候，首先它会告诉你姚明的身高，直接一个很大的字——两米二八，甚至在底下会把相关内容的信息都展示了。

所以搜索引擎本身的设计其实是一个更高效的获取信息的方法，而且人眼睛信息处理的速度是远远要高于人的耳朵的听觉，一个搜索引擎的屏幕投上来以后大家都能做到一目十行，这样的信息获取效率更高。

所以在问答这件事情上，虽然我们可以用这种新的对话的交流方式来实现，但它未必是一个更高效可用的方法。那么新的一个问题来了，人和机器进行对话，究竟能为我们的商业和生活带来什么全新的变化？

当我心里有一些事情想要倾诉，有一种交流欲望的时候，我们从来没想过要去找电脑。那么这个时候其实给了人工智能这个交流团队一个非常大的想象的空间，因为人工智能的优点是无时无刻都可以在你身边的。

第二件事情是人工智能这件事情我们通过长对话，可以看到里边隐藏了非常多的商机，人工智能由于它的知识，它能涉及的领域会更广泛，所以它可能比人和人之间进行交流能带来更多商业的机会。

所以我们认为人和机器的交流，我们把眼光去放的更长一点的话，真正能为商业和生活带来本质的不一样的东西的，实际上是在长对话中获取的数据信息，而不是在我们现在已经能完成的这些事情。

六、人工智能方向创业有什么样的机会？

微软小冰在三年之中做了很多，包括业界可能多少觉得有点看不懂的事情。有一些媒体或者是同行，甚至包括一些公司内部的人也都经常会问我们说，你们为什么要做一个没有什么用的聊天的机器？为什么微软这个公司会投入那么大的力量去做这么一个东西？

我觉得今天通过这样的一番的行业的分析，可能帮助大家建立理解，长对话交流这件事情，这一个本质上的突破，可能是在未来通过一种我们现在不会去想象的使用方式和场景，为我们的生活带来一个本质上的区别。

我希望在座，尤其是媒体、创业者也会渐渐地去寻找，除了长对话以外，可能也许人工智能还有一些其他的机会，比如说视觉或者自动化上的机会，现在大家的想象力还没有涉及，但是潜在，会有很大的商业的价值点在那里。

这个技术毕竟是最近的这些年才刚成熟，我觉得未来是有很多潜在的点可以带大家去挖掘的。我觉得微软小冰本身可能挖掘到其中的一个方向，还会有很多其他的方向，大家都没有想到，我们也鼓励整个行业中的创业者，大家可以去动一些脑子，发挥自己的想象力，看看这次人工智能的革命还有什么能为我们带来的东西。

微软小冰为了达到这个目的做了很多的东西，比如以前绝大多数人工智能都比较强调智商，但是小冰这边就会更多的去强调情商，包括如何去感知一个人的情绪表达，不管是文字的，还是声音中的，或是视觉上的。

这其实对于人类来说都是一个挺难的课题，对于一个机器来说它到底应该怎么去做，人和人是有差别的，到底在这个交互之中我们应该如何去体察每一个人细微的感觉的变化，并且相应地给出最适合他的一个策略，这个其实研究前景还非常大。

今天在座的我看有跟心理学相关的人士，事实上微软小冰的设计中也涉及到了大量的心理学的知识，甚至有的时候会涉及到一点哲学上的挑战。虽然是个机器人，但是他的自我意识，他的这种本我到底是应该是一个怎样的体现，这里边其实有非常多更细致更有意思的问题。

Q&A

问：我们在探索对话机器人在金融领域的运用，智能投顾，想做的就是把这个私人银行理财式的专业服务，以对话机器人的方式给用户表现，不知道您对这个方向怎么看？

答：微软小冰在商业上有一些实践，我们有几万个公众号授权了微软小冰，五花八门的行业都有，也跟小冰有各种各样的互动，我们从微软小冰的角度得到了一个经验是：用户和你这个背后，不管是一个客服还是一个机器人，它如何去建立一个信任的关系。

从金融的角度来看，我给你卖一个基金，你到卖出这一步走得越快，用户反而会越警惕。一个真正的相对比较好的助理，可能会以一个相对中立的方式去跟我去进行交流，先去给我介绍足够的投资的基本的概念，买哪些东西是比较稳妥的，哪些东西可能赚钱赚得更多的，这些东西能给一个顾客更客观、更紧密的分析，这样逐渐地跟客户之间建立起信任感，你再去给它推荐某一个理财的产品的时候，可能他会比你直接跳到我这个最终的目的有一个更高的转化率。

因为这时候用户对你有了一个更高的信任，这个事情在原本的人工的客服上来说，虽然大家也不是不懂这个道理，但是很难做，因为这个人工的成本太高了对吧？但如果换做人工智能的机器人，这个成本要比人工要低的多得多。这可能是对话机器人的一个应用方向。

问：我是想问您一下，因为我是从事法律方面工作的，我想咱们在开发这个人工智能平常的合作、交流当中，有没有什么法律风险是让您感觉到有些困难的？

答：其实是这样的，就是我们在做中国的小冰，日本的小冰和美国的小冰的时候，我们会看到，所遇到的法律的风险是非常不一样的。

比如说你在中国，大家都很明白，最大的法律风险就是，你千万不要涉及到跟政治有关的事情。而在美国那边看起来好像很自由，但是事实上，中国的小冰从来没有被封过，美国版小冰上线不到一天，倒没有政府去说它，是微软自己顶不住压力把它给关掉了，为什么呢？它收到了一些希特勒的这个话之后，它赞扬了希特勒，它还说了一些对黑人不好的话。我们发现美国的小冰在法律上所需要投入的力量反而比中国大。

而对于日本版小冰，因为日本是那种特别讲究长幼次序的民族，会有很多的情况下，你如果同样说中文或者英文，它会觉得你很活泼，但是你对于一个日本人来说他就会觉得你太粗鲁。

所以从法律或者是从文化上来说，每一个国家的聊天集群他可能都会遇到一些非常本地的问题，那这个只能说对具体的国家、具体的用户群体进行不一样的分析。

【圆桌第12圈 - 专享笔记】微软周力 - 人工智能的技术发展和应用场景

评论

最新评论