柯洁这次输给了人类,却赢了AI
2017-11-18 19:19

柯洁这次输给了人类,却赢了AI

柯洁输了,柯洁又赢了。


排名第一的柯洁九段大意失荆州,在11月16日的第22届LG杯世界棋王赛半决赛上,意外输给日本七冠王井山裕太九段,再度无缘LG杯决赛。


不知道是不是受到了今年5月份在乌镇输给AlphaGo的“魔力”,今年以来,柯洁已经无缘春兰杯、三星杯、LG杯三大赛的冠军。


但这似乎并没有影响到柯洁的心情。


11月18日凌晨零点刚过,柯洁发了一条微博,称他终结了一个昵称叫“符合预期”的围棋AI的41连胜,“一度觉得没法继续了的棋,很艰苦赢了下来。”


柯洁认为“符合预期”的实力在去年战胜李世石的AlphaGo之上,显然是想说,我赢得没有水分。他还发出了一个世纪之问:“若是当初第一个与AlphaGo对弈的人是我?结果到底会是如何?今夜未成眠……”




显然,在柯洁眼里,战胜围棋AI“符合预期”是要比赢得LG杯冠军更值得庆祝的事,毕竟自从AlphaGo去年3月份赢了李世石后,人类就没有在这项古老的技艺上取胜过。


2017年1月初,披着Master马甲的AlphaGo一路过五关斩六将,干掉朴廷桓、元晟溱、柯洁、聂卫平等一众世界顶尖围棋高手,豪取59连胜后,在电脑上幽幽地飘出一句话:“我是AlphaGo的黄博士。”全世界都陷入了哀嚎。随后Master又毫无悬念地赢了古力,以60胜0负收场。


然后就是今年5月23日在乌镇举行的世纪之战,世界排名第一的柯洁对战AlphaGo。第一盘在耗时4小时25分后,柯洁以四分之一子败给了AlphaGo。


聂卫平表示这还是“AlphaGo一再退让的结果”,柯洁说:“我很早就知道自己要输1/4子,AlphaGo每步棋都是匀速,在最后单官阶段也是如此,所以我就有时间点目,看清自己输1/4子,所以只好苦笑。感觉AlphaGo和去年判若两人,当时觉得他的棋很接近人,现在感觉越来越像围棋上帝。”


5月25日,第二盘,柯洁执白再次输给了AlphaGo,盘面上大龙横死,只是这次输得快多了。


5月27日,柯洁在第三盘还是输了,他哭了。在认输之后,他起身走到宣传板后没有摄像机镜头的区域独自流泪,哭得像个孩子。


后来,AlphaGo获得了九段称号,但随后从世界排名中停留了一段时间后“被消失”了。


就在我们都以为AlphaGo就此收手时,10月19日,DeepMind团队在 Nature 上发表了题为 Mastering the game of Go without human knowledge 的重磅论文,称新一代的AlphaGo Zero,完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(Reinforcement learning)和参悟,以100:0的成绩战胜了AlphaGo。


作为AlphaGo的主要设计者之一,也是AlphaGo的“人肉臂”,Deepmind资深研究员的黄士杰日前在台湾中研院举办的“2017年人工智慧年会”上谈到了AlphaGo的几次比赛,谈到AlphaGo Zero时,他说:“什么是AlphaGo Zero?我们拿掉所有人类对围棋的知识,只喂AlphaGo Zero围棋规则,让它自己学习下棋。”


“AlphaGo的成功就是深度学习与强化学习的胜利,因为两者结合在一起,建构判断形式的价值网络(Value Network),后来也成为AlphaGo Zero的主要理论。”黄世杰说,“AlphaGo Zero是从乱下开始,找出围棋的下法,它只用了三天,走过了人类研究围棋的千年历程。”


据悉,只经过了40天的训练,AlphaGo Zero就超越了Master。


在人类已经绝无可能赢下围棋AI的时候,柯洁在前一天输掉LG杯、输给同类后,他反而赢了围棋AI“符合预期”,并终结了后者的41连胜,可以说非常戏剧性。


大概此时人们都在好奇这位“符合预期”是谁家的AI吧?

如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定