谷歌人工智能连赢人类围棋冠军5局，它怎么做到的，如何评价它？-虎嗅网

一石激起千层浪。当人工智能战胜人类……这个原本看似遥远的事情真正的发生了，在2015年10月5日，全程没有让棋。

1月28日，《金融时报》援引《自然》杂志的报道，由谷歌伦敦子公司DeepMind开发的AlphaGo机器，以5:0的战绩击败了欧洲围棋三届冠军樊麾（出生于中国，现籍法国）。DeepMind是2014年被Google以4亿英镑的价格收购的人工智能团队。

在1月27日，DeepMind团队发表的《Mastering the game of Go with deep neural networks and tree search》作为《自然》（Nature）封面论文上线。团队创始人Demis Hassabis表示，他们开发的围棋程序AlphaGo融合了高级树状查找和深度神经网络。

同一天，Google在官方博客中表示：“我们很骄傲地公告天下，我们的科学家已经搞定了围棋，并攻克了人工智能领域的一项重大挑战。”

今年3月，AlphaGo将在首尔与过去十年全世界最顶级的围棋选手李世石对决。

谷歌AlphaGo是怎么赢的？——双大脑工作

通过对神经网络进行的3000万步训练 (所有棋谱均来自人类专业棋手的比赛)，AlphaGo预测出人类对手下一步走法的正确率已经达到了57%，之前的纪录是44%。

AlphaGo使用两个不同的神经网络“大脑”，通过两者合作得出移棋决定。

根据微信公众号《人工智能学家》对上述论文的编译得知，AlphaGo的两个大脑分工如下：

大脑1：“监督学习（SL）政策网络”。着眼于棋盘中的位置，并试图决定最佳的下一步。实际上，它用来估计每个合法下一步行动为最好的一步的可能性，其顶层猜测就是具有最高概率的那步。该团队通过几百万个优秀的人类棋手在KGS上的下棋选择，训练这个大脑，其目的仅仅是复制优秀的人类棋手的移动选择。它一点也不关心赢得比赛，只下那步顶级人类棋手会下的那步棋。 AlphaGo的下棋选择器有57％的概率可以正确匹配优秀的棋手下棋选择。

大脑2：“价值网络”。它不猜测具体的下一步怎么走，而是通过设想的棋盘分布，估计每个玩家赢得比赛的概率。它通过提供整体的位置判断来配合“监督学习（SL）政策网络”。这个判断只是近似的，但它对加快阅读速度非常有用。通过将未来可能的位置分为“好”或“坏”的分类，AlphaGo可以决定是否要沿着一个特定的变化进行更深的阅读。如果位置评估器说某个具体的变化看起来情况不妙，那么AI可以跳过阅读，不沿着那条线继续发挥。

据论文介绍，当只使用一个大脑时，AlphaGo大概和目前最好的电脑围棋AI实力相当，但结合两个大脑是，它可能达到人类职业棋手的水平。

专业围棋手是怎么看的？

2013-2015年三度欧洲围棋冠军樊麾，也是本次人机大战的主角之一，他表示：

在中国，围棋不仅是一项比赛，它还是生活的一面镜子。我们说，假如你的棋下得有问题，那很可能是你心性的问题——棋如其人。

输棋确实很难过。和AlphaGo对战之前，我觉得我能赢。在第一局失利后，我改变了战术，增强了进攻，但还是输了。问题是人类有时会犯致命的错误，因为我们是人。有时我们会疲惫，有时我们求胜心切，我们总有这样那样的压力。电脑程序不会这样，它非常强，也非常稳定，简直就像一堵墙一样。对我来说这是很大的差别。我知道AlphaGo是个电脑，但如果没人告诉的话，我可能会觉得它是个有点陌生却又非常强大的对手，是个真人。

当然，输掉比赛让我不太开心，不过作为职业选手，我们输过很多比赛。所以，失败了就从中学习，也许会有所收获。总之从长远来讲这是一件好事。

随后在一个微信群里，樊麾说：“一切都是真的，因为一直在保密中，所以大家都不知道。我没有放水，不过下得确实不好。只能告诉大家，这个系统确实很强！拭目以待和李世石的棋吧！这是去年10月下的，还有些条款在保密范围之内的，我不能告诉大家，不过我觉得跟李世石的棋会很精彩！”

曹大元九段：昨晚就看到了，所以睡不着觉了，压力很大啊！

孟泰龄：我认为樊麾布局有三盘占优，另两盘劣势。我觉得电脑确实有职业水准。感觉电脑棋风稳健，酷爱实地，如果后半盘它真的可以滴水不漏的话，那距离顶尖真的只有一层窗户纸的距离了。显然电脑大局观差一些，但局部棋型的感觉及计算已经有相当水准了。

业内人士怎么看？

DeepMind创始人Demis Hassabis：

AlphaGo正在突飞猛进，甚至会超越最棒的人类选手。能够看它在围棋规则内去创造新的东西，感觉很神奇。我们对自己创造的这个系统有种很密切的感情，特别是它被创造的方式——它会学习，我们也会教它，它的风格就像人一样。和其他编出来的程序不同，你不知道它到底都会什么，因为它能够自己学习。

阿尔伯塔大学计算机科学家、Chinook设计师 Jonathan Schaeffer：

我想这还不是围棋版的深蓝时刻。真正的成就是这个程序能作为选手在顶级比赛中较量的时候。深蓝从1989年开始就常常战胜各路大师，最后登顶则是八年之后的事情。但就目前情况来看，我认为AlphaGo和顶级人类选手之间的差距被大大缩短了。可能只需要再进行一点努力和改善，再提高一点计算能力，不出一两年，它就能打败人类。

就今年3月份的比赛来说，不是打击AlphaGo团队，我还是看好人类。我们可以把AlphaGo看成是少年天才。它突然学了一手好棋，进步神速，但毕竟还是经验有限。从国际象棋和西洋跳棋来看，经验还是很重要的。

国际围棋联合会秘书长Hajin Lee：

当我知道那个电脑要挑战职业顶尖棋手李世石的时候，真的很吃惊。我当时觉得这个挑战者绝对对顶级选手有多强完全没概念。但实际上，可能我才是那个不知道这个电脑有多强的人。现在我对这个比赛非常兴奋。

谁会赢呢？我不知道。李世石自己也觉得可能那电脑跟他一样强。可能是我听到了太多AlphaGo的消息，我现在惊讶于它的强大。同时我也非常了解李世石的水平，所以我认为他们双方五五开吧。

我觉得围棋是个很有内涵的竞技，我不觉得如果电脑AI击败了人类会对围棋造成什么伤害。我想人们会接受自己被电脑技术超越这件事。

最后，让我们通过下面五张GIF图回顾一下这五局棋，樊麾是怎么输给谷歌AlphaGo机器的（来自微信公众号：棋文弈事）：

第一局

第二局
第三局
第四局第五局
本文参考了微信公众号：人工智能学家、棋文弈事，以及参考消息、雷锋网等网站的相关报道。