让人工智能玩《星际争霸2》，这帮缔造 Alpha Go 的人到底在想什么？-虎嗅网

2016暴雪嘉年华上有许多新消息。在那其中，最具革命性的消息反而最冷场。

《炉石传说》、《风暴英雄》、《守望先锋》和《暗黑破坏神3》的新内容收获了暴雪迷的欢呼。然而，当暴雪宣布《星际争霸2》的开发团队将和谷歌DeepMind共同开展AI研究时，观众的反应非常平淡，只有一些小声的嘟囔。

（译注：DeepMind是最强的人工智能公司之一，战胜李世石的Alpha Go就是他们的产品。AI，Artificial Intelligence的简写，意为人工智能，本文会根据需要混用“AI”和“人工智能”。）

也许观众的态度有些令人扫兴，但其实很容易理解：星际玩家为什么要对人工智能科学家的计划感兴趣？

进一步说，如果DeepMind和暴雪的这项研究成功了，星际玩家也得不到任何好处——从此以后最高水平的星际竞技就和人类没关系了。

长久以来，人工智能始终是游戏的组成部分。《星际争霸2》的执行制作人克里斯·西嘉德就指出，DeepMind希望开发的AI肯定不会是第一个玩暴雪RTS游戏的AI，因为《星际争霸》系列自带脚本AI。这些AI由游戏设计师和工程师共同开发，他们将之间对游戏的理解注入到脚本中。这些脚本是由“条件”驱动的。例如，假如满足“资源收集量达到X”条件，AI就会花费Y的资源，去购买Z单位。

“那些AI很精致，和它们对打也挺有趣。它们可以做一些随机和特殊的选择，可以根据地形发展，采集资源——你能做的事它们基本都能做。不过，那些AI的本质是脚本，它们是可预测并且有限的。除非它们作弊，否则不可能战胜人类玩家。”（译注：这里表达的意思当然是“有一定水平的人类玩家”。）

图为DeepMind团队科学家温亚尔斯

奥里奥尔·温亚尔斯是DeepMind团队的科学家之一。他认为，《星际争霸2》可能帮助人工智能研究前进一大步。像《星际争霸2》这种非静态、非回合制的游戏，对人工智能来说是一个更好的参照体系。

“我们认为，《星际争霸2》的复杂性能让我们测试一些新算法。在几年前，我们还没有准备好对付这些算法，现在是时候了。”他说。

为了赢下一局《星际争霸2》，玩家需要很多信息，而这些信息大多是隐藏的。玩家需要一边采矿，一边造建筑，一边探路。普通AI（即常见的脚本AI）可以通过数据直接获取信息，DeepMind则希望它们的AI能够用人类玩游戏的方式，挖掘出游戏中隐藏的信息。

“这是个复杂的过程。在游戏开局，玩家甚至不知道敌人在哪。他们需要运营，需要回想是否和这个对手打过，并利用这些经验打败他。”温亚尔斯说。

“这对AI来说是非常艰难的挑战，但我们会适应这种新环境的。关键点在于，即使它没有马上成功，我们也可以通过研究过程来建立一个新的标准。这个标准会超越目前的最高水平。另外，项目是开放的，任何人都可以提出他们的意见。”

暴雪和DeepMind的合作不是封闭性的。在暴雪嘉年华的发布会上，温亚尔斯表示“《星际争霸2》AI研究项目”将对所有人工智能开发者，业余爱好者和玩家开放。DeepMind之所以把这个项目提升到“全球合作”的高度，是因为他们确实需要这么多人的智慧来完成如此艰巨的挑战。项目API将以补丁的形式于2017年第一季度发布，玩家可以在免费的初始版中进行使用。当然，温亚尔斯指出，距离补丁上线还有一定距离，大量工作有待完成。

AI眼中的《星际争霸2》是这样的

“我们的合作刚开始不久。第一步，我们需要建立测试环境。这个环境的作用是让AI一边玩一边观察。我们目前主要集中在这个环境上，因为它将对公众开放。并且，它还有可能成为其他人工智能研究者的参照体系。”

“第二步就是引入AI了。这一步的完成度还不高，我们只能在很初级的水准上完成。”

DeepMind需要确保AI能够在测试环境中观察并作出行动。这是深度学习的基本原理，但《星际争霸2》让它变得更复杂。《星际争霸2》的复杂度可比左右摇晃Atari摇杆，或者在19乘19的矩阵上放旗子要难得多。

“以往的AI可以直接获取游戏中的所有数据。我们希望AI直接面对游戏画面（而不是数据），它将用人类的方式玩游戏。我们之所以如此激动，是因为这代表着神经网络和深度学习的下一个阶段。我们并不知道结果会如何。”西嘉德说。

“我们在搞的东西可不是什么脚本。它通过观察人类玩家来进行学习。有一点是我们想做到但暂时没做到的：我们希望AI能判断出一个操作是好操作还是烂操作。我们甚至希望它可以成为人类的教练，告诉人类‘现在是造某单位的好时机’。”

西嘉德认为，AI可以解决《星际争霸2》目前面对的一些问题。《星际争霸2》项目被韩国人统治，其重要原因是韩国人在家门口就能和世界最强的选手对战，而其他地区的选手只能碰到数量有限的高手。AI能帮助改善这个现状。

“如果这个项目成功了，选手水平将不再受到地域因素的限制。”西嘉德表示。

也许有一天，AI会教人类打游戏

DeepMind认为，这个项目之所以有潜力，是因为项目中的难题具有普遍性。它们不光存在于这个项目里，还广泛存在于其他技术领域。AI在游戏中做出最佳选择，正是在模拟AI在现实世界中做出选择。

“我们将在这个项目的同时，平行使用多个数据中心进行其他游戏的模拟。我们的算法将不断进化，一旦我们认为它完成了某种突破，我们就可以开始让AI解决现实世界中的问题。”

其实，AI已经开始解决现实世界的问题了。最新例子是，DeepMind的AI接手谷歌数据中心的制冷系统，成功降低了40%的制冷费用。Google原本希望通过新能源来解决数据中心的能耗问题，但AI提供了全新的解决思路。

温亚尔斯说：“AI观察房间里不同位置的温度，从全局的角度做出最佳选择，降低数据中心的温度。当然，实际过程要复杂得多。我们希望在不损伤服务器的情况下，尽可能地降低能耗。这同游戏有些类似。‘AI/环境’模式非常强大，具有很强的普适性。”

“游戏帮助算法变得更快。一旦算法可以处理数据以外的对象，它就能产生飞跃，那对人工智能研究和开发来说会是一个伟大的时刻。”

那么，在温亚尔斯眼中，《星际争霸》的下一步在哪里呢？

“我不知道！”他大笑，“如果能在太空船里玩星际，我肯定会试试。”

译注：本文发表于11月23日，采访时间应该还要更早，所以我们才能看到西嘉德的谈笑风生。事实上，今年韩国星际竞技界出现了极为强烈的震动，多个老牌赛事停办，职业战队纷纷解散。截至11月23日，韩国职业星际战队仅剩下一支。

原文发表于 arstechnica，作者为Nick Cowen，触乐编辑周思冲进行了编译。