2017-11-18 19:19

柯洁这次输给了人类，却赢了AI

周超臣

柯洁输了，柯洁又赢了。

排名第一的柯洁九段大意失荆州，在11月16日的第22届LG杯世界棋王赛半决赛上，意外输给日本七冠王井山裕太九段，再度无缘LG杯决赛。

不知道是不是受到了今年5月份在乌镇输给AlphaGo的“魔力”，今年以来，柯洁已经无缘春兰杯、三星杯、LG杯三大赛的冠军。

但这似乎并没有影响到柯洁的心情。

11月18日凌晨零点刚过，柯洁发了一条微博，称他终结了一个昵称叫“符合预期”的围棋AI的41连胜，“一度觉得没法继续了的棋，很艰苦赢了下来。”

柯洁认为“符合预期”的实力在去年战胜李世石的AlphaGo之上，显然是想说，我赢得没有水分。他还发出了一个世纪之问：“若是当初第一个与AlphaGo对弈的人是我？结果到底会是如何？今夜未成眠……”

显然，在柯洁眼里，战胜围棋AI“符合预期”是要比赢得LG杯冠军更值得庆祝的事，毕竟自从AlphaGo去年3月份赢了李世石后，人类就没有在这项古老的技艺上取胜过。

2017年1月初，披着Master马甲的AlphaGo一路过五关斩六将，干掉朴廷桓、元晟溱、柯洁、聂卫平等一众世界顶尖围棋高手，豪取59连胜后，在电脑上幽幽地飘出一句话：“我是AlphaGo的黄博士。”全世界都陷入了哀嚎。随后Master又毫无悬念地赢了古力，以60胜0负收场。

然后就是今年5月23日在乌镇举行的世纪之战，世界排名第一的柯洁对战AlphaGo。第一盘在耗时4小时25分后，柯洁以四分之一子败给了AlphaGo。

聂卫平表示这还是“AlphaGo一再退让的结果”，柯洁说：“我很早就知道自己要输1/4子，AlphaGo每步棋都是匀速，在最后单官阶段也是如此，所以我就有时间点目，看清自己输1/4子，所以只好苦笑。感觉AlphaGo和去年判若两人，当时觉得他的棋很接近人，现在感觉越来越像围棋上帝。”

5月25日，第二盘，柯洁执白再次输给了AlphaGo，盘面上大龙横死，只是这次输得快多了。

5月27日，柯洁在第三盘还是输了，他哭了。在认输之后，他起身走到宣传板后没有摄像机镜头的区域独自流泪，哭得像个孩子。

后来，AlphaGo获得了九段称号，但随后从世界排名中停留了一段时间后“被消失”了。

就在我们都以为AlphaGo就此收手时，10月19日，DeepMind团队在 Nature 上发表了题为 Mastering the game of Go without human knowledge 的重磅论文，称新一代的AlphaGo Zero，完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习（Reinforcement learning）和参悟，以100:0的成绩战胜了AlphaGo。

作为AlphaGo的主要设计者之一，也是AlphaGo的“人肉臂”，Deepmind资深研究员的黄士杰日前在台湾中研院举办的“2017年人工智慧年会”上谈到了AlphaGo的几次比赛，谈到AlphaGo Zero时，他说：“什么是AlphaGo Zero？我们拿掉所有人类对围棋的知识，只喂AlphaGo Zero围棋规则，让它自己学习下棋。”

“AlphaGo的成功就是深度学习与强化学习的胜利，因为两者结合在一起，建构判断形式的价值网络(Value Network)，后来也成为AlphaGo Zero的主要理论。”黄世杰说，“AlphaGo Zero是从乱下开始，找出围棋的下法，它只用了三天，走过了人类研究围棋的千年历程。”

据悉，只经过了40天的训练，AlphaGo Zero就超越了Master。

在人类已经绝无可能赢下围棋AI的时候，柯洁在前一天输掉LG杯、输给同类后，他反而赢了围棋AI“符合预期”，并终结了后者的41连胜，可以说非常戏剧性。

大概此时人们都在好奇这位“符合预期”是谁家的AI吧？

AI创投日报频道: 前沿科技

周超臣

猛兽总是独行

虎嗅团队

已在虎嗅发表 647 篇文章

本内容未经允许不得转载。授权事宜请联系 hezuo@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定