本文来自微信公众号: 一席 ,作者:一席YiXi,原文标题:《AlphaGo战胜人类棋手十年后,它如何改变了围棋和这些下围棋的人?|贺久恒 一席第1151位讲者》
大家好,我是贺久恒。非常高兴有这个机会跟大家分享一下我自己的研究。
我是一名科学技术学的研究者。用通俗的话来说,科学技术学就是研究科技与社会之间的关系,特别是当一项技术或者一项科学发现已经非常深入地嵌入我们每一个人的生活之中,就像人工智能一样。
在我过去读博士的这些年,我其实一直在研究一个非常小众的话题,看起来似乎和科技没有任何关系,那就是围棋。
相传“尧造围棋,教子丹朱”,尧帝想要磨练一下儿子丹朱的性情,所以发明了围棋。我不知道几千年前的尧帝到底是怎么想的,但是我的父亲确实是这么想的。
我的父亲是一个非常狂热的围棋爱好者,他成长于上世纪80年代,当时聂卫平老师在中日围棋擂台赛上大杀四方。因此,我父亲非常希望把我培养成为一个围棋棋手。
但是小时候的我其实并不喜欢下棋,对于一个孩子而言,下围棋是一件太枯燥的事情。
真正让我把围棋重新捡起来并且热爱它的是一件众所周知的事情:2016年,谷歌DeepMind开发的人工智能系统AlphaGo在韩国以4:1的比分战胜了韩国职业九段棋手李世石。这是一个非常轰动的新闻,无论是对于围棋界还是对于整个世界关注这场比赛的人而言。
这场围棋挑战赛在我的心底埋下了一个种子:我希望做一些和围棋人工智能相关的研究。当一个超越人类能力的人工智能出现在某个领域的时候,当它挑战到所有人的知识和能力的时候,我们到底会经历怎样的一个变化?我相信围棋界会是一个非常好的案例。
为什么围棋很难被破解?
在这里我想给大家简要地介绍一下围棋的规则。这是一个空旷的围棋棋盘,它由19×19路、共计361个交叉点组成。
围棋是一个关于围空的游戏,棋手要占据或者围住这块棋盘上足够多的交叉点,你只要比你的对手围得更多,那你就赢了。
我们来看一局棋最终结束的画面,这时所有的交叉点要么被黑棋围住了,要么被白棋围住了。在这个终局的画面中,右侧中间位置的这一片区域被白棋控制了,而右下角的这一片区域被黑棋控制了。
那为什么围棋这么有魅力,又这么复杂呢?有一个很重要的原因是围棋棋盘太大了。我们可以想象一下,一个有361个交叉点的棋盘,就意味着在符合规则的情况下,每一手棋理论上有数百种选择。
在博弈论中,我们衡量一个游戏的复杂度通常会用“状态空间复杂度”,就是说从游戏开始的局面推算能够演化出多少种可能的、符合游戏规则的状态空间。围棋的状态空间复杂度是10的170次方,相比之下,国际象棋只有10的47次方。
这就意味着围棋的状态空间复杂度高到我们不可能通过暴力运算的方式,或者说只是加强电脑算力的方法来破解。
在2016年之前围棋界有一个共识,下好围棋需要的不只是计算力,还需要你的直觉、你的棋感、你的大局观。这些东西听起来玄而又玄,而电脑远远不能掌握这些东西。所以,在人机大战之前,人们相信距离人工智能攻破围棋这个难题至少还要10年。
但是在2016年,一切都突然改变了。
在这个事情发生之后,两个问题出现在了我的脑海之中:人工智能会怎样改变这个古老的游戏?人工智能战胜人类职业棋手之后,它又会如何改变这些下围棋的人?
创造围棋招法的权力只属于人类吗?
想要回答这两个问题,我们首先要回到2016年挑战赛的比赛现场。
当时AlphaGo在第一盘比赛中率先击败了李世石九段。但是大家很不服气,李世石九段也非常不服气,因为他犯下了一个很明显的失误,AlphaGo抓住了这个失误,最终取得了比赛的胜利。
但是在第二盘比赛中的这个瞬间,AlphaGo下出了非常有意思的一招棋——第37手棋,也就是人们口中AlphaGo的“神之一手”。

▲AlphaGo的第37手棋(红色数字标出)
这手棋用围棋的术语叫作“肩冲”,指的是本方的棋子和对方的另一枚棋子形成了对角线相邻的关系。AlphaGo把这手棋放在了棋盘的五路,在人类传统的围棋理论之中,五路上的肩冲是一手坏棋。因为它会为对手白白地送上很多边角的空,但自己又看不到很明确的、现实的利益。
当AlphaGo下出第37手棋的时候,李世石九段刚好在比赛场地的阳台上抽烟、休息。他回到比赛赛场就看到了这非常惊人的一手棋。我们可以关注一下李世石九段的表情变化:他露出了非常困惑的表情,然后又露出了一丝微笑。
我想那个困惑的表情代表着“为什么AlphaGo会往这里下”,而那个微笑的表情代表着“你居然下这么臭的棋,那我怎么可能无法战胜你呢”?当然,这是我的猜测。
不仅李世石九段非常惊愕,直播、评述这盘棋的评论员们也非常惊讶。我记得很清楚,其中一位棋手说:怎么会下在这里?是不是负责落子的黄博士把棋子放在了错误的地方?
另一位评论员马上附和道:如果单看这一手的话,我觉得AlphaGo大概也就是业余三四段的水平。
但是这盘棋的结果是李世石九段再一次输了,而且他这一次输得五体投地。在比赛结束的发布会上,李世石九段说:昨天我只是对于AlphaGo的水平感到很吃惊,但我今天完全说不出话了,因为今天我没有一刻感觉自己在这盘棋中处于领先地位。
在这场比赛结束之后,DeepMind发布了AlphaGo的后台数据。数据显示AlphaGo其实知道人类下出这一手棋的概率只有万分之一。与此同时,当时它还可以有另一个选位,那是一个人类棋手经常选择的位置,两个位置之间的胜率差距微乎其微。
AlphaGo固执地选择了违背人类上千年围棋理论的一手棋,击败了人类历史上最杰出的棋手之一——这就是为什么这手棋被我们称作“神之一手”,因为它打破了人类围棋的基本理论,让整个围棋界陷入了一场反思之中。
摆在所有人面前的是一个非常尖锐的问题:我们到底要不要承认这台机器也有资格创造围棋招法?我们到底要不要把“创造新棋”这件几千年来只属于人类的特权也分给机器一份、也分给人工智能一份?
AlphaGo改变了什么?
在这几年间,我进行了12个月的田野调查,也访谈了几十位人类职业棋手、业余棋手、围棋老师、围棋人工智能工程师、围棋赛事的组织者等等。
我今天想用三个关键词组织我的研究,分别是语言、风格和权威。
语言:从模糊到精确
在围棋人工智能出现之前,棋手们是如何讨论一盘棋的?
棋手会说在一个特定的局面下黑棋“稍稍主动”,意味着黑棋有一点点优势;也会说有一块棋“味道不好”,意味着这块棋可能有一点点危险;还会说一手棋显得有点“过分”,意味着这一手棋表现出了过多的攻击性,而暴露出了破绽。
可以发现我们谈论围棋的语言其实是非常模糊的、定性化的,甚至带有一点点哲学的意味。为什么呢?因为围棋的变化过于复杂,我们的大脑不可能支撑我们计算到终局,所以很多时候我们都是凭借直觉、感觉描述这盘棋的进程。
而这种模糊的、不精确的语言,恰恰是人类在几千年下围棋的经验中慢慢总结出来的,是在一代代围棋师徒之间口传心授的。一个棋手的判断为什么有价值?恰恰因为他能够动员这一整套关于围棋的模糊的、只可意会不可言传的语言。
但是现在围棋人工智能出现了,一切都改变了。

这是一个经过复杂计算得出的数学语言。如果是两个人工智能顺着当下的棋局继续进行比赛,最终黑棋取胜的概率就是49.5%。
但是49.5%对于人类而言意味着什么?我们其实并不能完全理解。
那种模糊的语言正在慢慢消退,重新出现的是一种精确的、基于统计学的数学的语言。
这组矛盾背后其实蕴含着人类思考围棋的思维方式和AI思考围棋的思维方式的矛盾。人类思考围棋,或者进行任何智力游戏的方式都是基于一个局部,或者基于一个目标。
比方说我想要围一块空、我想要攻击对方的一块棋、我想要保护自己的一块棋——虽然我们知道最终的目标是赢下这盘棋,但是我们必须把这样一个终极目标拆解成一个个小的目标和一个个局部来思考。
但是对于人工智能而言,它没有局部的概念。在人工智能的算法之中,它唯一的目标就是赢下这盘棋,对于它而言,衡量这个目标能否实现的唯一指标就是胜率。
这样一组根本矛盾永远横亘在人类与围棋人工智能之间。
风格:从个人特质到无限完美
对于围棋观众而言,棋手们非常重要的一个魅力就是个人风格。我们能够记住聂卫平九段、古力九段、李世石九段,其实不只是因为他们拿过多少世界冠军,不只是因为他们赢过多少盘棋,也是因为他们有个人的风格。你如果是一个资深棋迷的话,甚至不需要知道对局者是谁,只需要看几步棋就能大致猜出这盘棋是谁下的。
在我的访谈之中,有一位职业九段跟我讲了一段话,我觉得很有意思。他说:所谓棋风其实就是一个人不完美的地方。每个棋手都有他擅长的方面和他不擅长的方面,所以在比赛中他必须扬长避短,尽量把棋局导入一个他擅长的格局,这最后就变成了他的一种风格。
这种所谓风格、所谓不完美,其实是我们过去欣赏围棋时非常喜欢看到的一部分。
所以我们过去也能看到一幅很奇特的场景,面对着同样一盘棋,两个顶尖高手可能有着截然不同的判断:有的棋手喜欢实地(指当下已确定占有的区域),有的棋手喜欢外势(指在外围进行布局)。当他们面对同样一个棋局,执白的棋手可能认为自己是优势,执黑的棋手可能同样认为自己是优势。
所以,在过去的围棋对局之中不存在标准答案,存在的只是你喜不喜欢这盘棋、这盘棋适不适合你的风格。
但是人工智能出现之后,一切又改变了。
当我们将任何一个棋局输入到人工智能进行分析之后,它都会告诉你一个答案。这就让现在的围棋变成了另外一幅图景:所有人都想让自己的棋下到完美,所有人都在向AI学习,想要把自己变成一个“六边形的战士”。
当所有人都在追求完美的时候,风格和不完美就变成了我们必须摒弃的东西,当AI给出标准答案的时候,创造力就变成了我们不再需要的东西。
因为你冥思苦想得出的一步棋可能有两个结果:AI早就已经想到了,或者AI告诉你这是错的。下棋变成了人类棋手在获得AI许可的情况下,将他与AI共同分析的一套布局摆放在棋盘上的过程。
所以我们评价现在的世界围棋第一人申真谞九段时会说:申真谞可能是有史以来最强的棋手,他下棋像AI一样完美。我们给他的外号叫作“申工智能”。但是相比于过去的棋手,他似乎缺少了一点个人魅力。
权威:从人类棋手到人工智能
在围棋人工智能出现之前,其实围棋界的知识权威就是那么一小撮人——顶尖职业棋手。他说一手棋是好棋,这手棋应该就是好棋;他说一块棋危险,那我们所有人也会跟着紧张。因为他代表着人类围棋的最高水平。
但是围棋人工智能出现之后,它把所有棋手的权威都瓦解了。
这是我在田野调查中拍下的一幅图片。当时我去观战了一场人机联合的围棋比赛,比赛模式是一位围棋九段高手搭配一个围棋人工智能,和另外一组同样的搭档下连棋。
通常情况下棋手们会在比赛结束后进行复盘,但是在这场比赛结束之后,我没有看到人与人之间的讨论,我只看到了所有棋手围在一个笔记本电脑旁边。
我在访谈古力九段的时候,他给我讲过一个非常有趣的事情,他说现在在公开场合讲棋已经很少会贸然地对一手棋下结论了,他需要先看一看AI怎么想。
这是现在围棋比赛直播的一个场景,直播的两位棋手也都是职业棋手。与过去不同的是他们现在手里必须要拿着一个手机,只有这样他们才能实时掌握围棋人工智能对棋局的判断,他们才能够避免犯下所谓的“错误”。

故事的另一面
讲完这三个关键词,大家可能会觉得非常悲观。围棋界的权威消失了,棋手的风格也逐渐消失了,所有人只能对着AI学习所谓的正确答案,甚至连我们讨论围棋的语言都在被AI同化。
但这其实只是故事的一面,我们也不必过于悲观。
职业棋手:解读AI的“神谕”
故事的另一面是棋手们其实也还在寻找个人的自主性和能动性。比如说,在围棋人工智能出现之后,职业棋手已经寻找到了一种新的角色,就是成为围棋人工智能与人类世界之间的一个沟通的桥梁。
围棋人工智能只能输出胜率和招法,但这两件事情很难被大家理解,那么谁能作为一个最好的翻译者,把围棋人工智能的输出解释成人类能理解的语言?显然是职业棋手。
很多时候我在介绍我的研究时会进行这样一个比喻:在围棋人工智能出现之前,顶尖职业棋手就是这个领域中的神、上帝,没有人能够反驳他们;但是现在AI出现了,我们有了一个新的上帝,那怎么办?
职业棋手转型成了AI时代的牧师,他们掌握着解读“神谕”的权力,所谓的“神谕”,就是AI输出的那些结果。
但与其把他们称作是一个翻译者,我觉得很大程度上他们其实还是在进行创造。职业棋手在进行解读的过程,其实也在赋予这些招法新的意义,在赋予这些招法所谓的意图、所谓的策略、所谓的战术。
另一方面,围棋界对于胜率的理解也在逐渐变化。一开始,我们都要去学习最完美的招法,但现在职业棋手们逐渐都意识到这其实不是一个好的做法。
因为棋局并不是在下出这一步正确的棋之后就会立即结束、立即宣布胜利的。如果棋手选择了一个AI认为正确的招法,但是却没有掌握这套招法后续各种可能的变化,那他其实会更快地走向失败。
有一些职业棋手告诉我,他们对于10%以内的胜率变化其实没有太大的感知。如果两个点位之间相差的胜率是5%,但是胜率低的点位意味着棋局会导向一个更容易掌握、更符合自己围棋理解的局面,那么他们宁可选择那个胜率低的点位。也就是说,我们现在也在一定程度上逐渐接受了人的不完美。
在我的访谈之中,有一段对话让我特别感动,让我重拾了作为人的信心。这位职业棋手告诉我:其实我们根本没有必要追求完美,因为你的对手不是AI,你的对面坐着的是一个人。人会有心理的波动,人做不到完美,所以你也不需要做到完美。你需要做到的只是比他下得好一点点,甚至只是坚持到最后抓住他的失误,就足以获得这局棋的胜利。在这个过程中有很多心理博弈,这是AI没有办法算出来、没有办法告诉我们的。
女性棋手:突破权力结构
至于权威的消解其实也带来了另一方面的变化。过去的围棋界是一个权力结构分明的场所,大多数情况下围棋的招式都是最顶尖的棋手之间集体讨论出来的——这也是国家层面应对日韩竞争的一种方式,通过封闭的信息制造竞争优势。而围棋的传承也需要师徒关系。
很多情况下,女性棋手很难进入到这场讨论中,自然会带来竞技水平上的差别。但过去我们反而会说这种差距是因为女棋手不够理性,她们下不好围棋。
但是围棋人工智能出现之后,集体研讨已经不再有意义,师徒关系也被淡化,每个人都有了更好的老师、更好的研讨对象,而且因为围棋人工智能的成本相对很低,这个时候学习围棋变成了比谁更努力、更勤奋的过程。
最近十年,我们能够看到越来越多的女性棋手晋升职业九段。2022年,崔精九段更是成为了首位打入三星杯世界围棋大师赛的女棋手。
所以,围棋人工智能的出现带来了一场洗牌,依靠创造力的棋手很难适应这个时代,依靠努力、勤奋和领悟力的棋手得到了更多机会。
技术是不是对所有人都一样公平?
围棋的故事我们暂时先讲到这里。我想给大家讲一点点围棋以外的故事。
在围棋的故事中,我们看到围棋人工智能的出现几乎重组了整个围棋领域,它重新安排了我们的比赛,安排了我们学习围棋的方式,安排了我们每一个人的下棋的风格和围棋知识生产的方式。
一个技术进入到一个领域、重排一切的过程,其实就是科学技术学(STS)这个领域一直在研究的对象。科学技术学最常追问的一个问题是:技术是不是对所有人都一样公平?
在STS领域,技术哲学家兰登·温纳提出过一个非常有名的案例专门用来质疑技术中性论:在20世纪早期,纽约设计了一系列穿过长岛的高速公路,通往长岛最美丽、最宜人的海滩。
在这些高速公路上,有一些横跨高速公路的桥梁。这些桥梁被设计得非常低矮,以至于公交车、大巴车都没有办法穿越,只有私家车能够穿越。
我们可能会想建桥肯定是一个中立的事情,他们把桥梁建得太矮,可能只是工程设计上的失误。
但是兰登·温纳告诉我们不是这样的。因为在那个时候的纽约,真正有私家车的基本上都是中产阶级以上的白人,而有色人种和经济地位比较低的人们想要到沙滩上就必须搭乘公交车。但是公交车没有办法通过这些桥梁,就意味着他们完全被隔绝在那些沙滩之外。所以这些桥梁其实默默地排斥了社会的特定阶级,把沙滩变成了一个种族隔绝的场所。
这个案例试图告诉我们其实技术从来都不是中性的,在它的设计中往往已经写好了谁会受益、谁会出局。就像围棋人工智能带来的洗牌其实是基于人天生的特质,制定标准的权力则掌握在科技公司手里。
同样,在当下这个时代,每次一个新的AI产品出现,都会让我们在思考这两个问题:这个AI系统好不好用?这个AI会不会取代我?
这两个问题固然是有意义的,但是我更希望大家能够再深入地思考一下:这项技术究竟是谁做出来的?它在替谁服务?当所有人都在说“拥抱AI就会拥有未来”的时候,这句话真的对每一个人都成立吗,还是只对小小的一部分人成立?这座桥究竟把谁隔绝在了外面?
虽然说在围棋界棋子下在哪里已经由围棋AI决定了,但是在我们的生活中,我还是希望由我们自己决定落子在哪里。
谢谢大家。
