OpenAI玩Dota2完胜人类最强选手，马斯克：这可比围棋难多了-虎嗅网

8 月 11 日，人工智能又给人类带来了惊喜，伊隆·马斯克（Elon Musk）旗下的人工智能研究机构 OpenAI 宣布他们所打造的一个 AI 机器人已经在电子竞技游戏 Dota 2 中击败了一个名为 Dendi 的人类职业玩家，而比赛所采取的形式也是很直接的 1v1。

双方约定好共进行三轮比赛，在第一场比赛中，人工智能在不到十分钟的时间内闪电击败对手；第二场比赛同样也是由人工智能取得了胜利；而这直接导致了 Dendi 放弃进行第三场比赛。

图丨被AI打败的Dota2最强人类选手Dendi

“这个家伙很可怕，”Dendi 在比赛中倒吸了一口冷气。

图丨马斯克第一时间转发了OpenAI获胜的消息

OpenAI 官方解释说，这款 AI 机器人是完全通过自我训练出来的，研究人员从零开始通过过往的比赛视频来对它进行训练。OpenAI 的 CTO 格雷格·布罗克曼（Greg Brockman）表示，训练仅仅花费了两周的时间，AI 就已经击败了包括世界排名第一在内的顶级 1v1 选手。

Brockman 补充道，“通过 1v1 这种形式的训练，我们已经针对 AI 的优势和劣势进行了针对性的训练。”接下来，OpenAI 将训练 AI 一次扮演 5 个选手，这样就可以组成一个完整的战队了。同时，他们还准备将这款 AI 对外开放，让所有人都有机会和人工智能进行对战。

而人工智能介入游戏领域也并非新鲜事，包括 DeepMind 和 Facebook 都已经针对即时战略游戏“星际争霸2”开展了探索之路，他们收集大量的人类玩家游戏比赛记录数据，并用这些数据来训练深度学习算法，最终可以做到在人机大战中击败人类选手。

就在 8 月 10 日，DeepMind 联合暴雪公司正式推出合作开发的星际争霸2机器学习工具组：SC2LE（星际2学习环境），双方希望通过这些工具，帮助研究人员加快星际争霸 2 AI 的开发速度。

SC2LE 包括：

一个由暴雪开发的机器学习API，为研究人员和开发者们提供接入游戏的端口。其中将首次完整包含为Linux系统开发的工具。

DeepMind的工具集PySC2的开源版，让研究人员可以轻松地在各自的模型中使用暴雪的特征层API。

一系列小游戏，让研究人员可以对自己系统的性能进行真实的测试。

一个含有6万5千局匿名游戏的数据集，并将在接下来的几周里扩展至50万局游戏以上。

一篇介绍整个环境并提供基线成绩的论文。基线成绩是由小游戏，从游戏回放进行的监督学习，以及与星际2 自带的电脑对手进行单挑的结果得出的。

当然，星际争霸 2 还有一些难题暂时没有技术手段解决，比如“战略”。作为一个战略游戏，很多时候，玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此，为了让 AI 学会“战略”，它必须拥有“计划”和“记忆”的能力。“存储是至关重要的”，DeepMind 星际争霸 2 项目的负责人Oriol Vinyals 说道。

而由于游戏的长度，DeepMind善用的加强学习却并不适合星际争霸 2，“我现在做出的操作可能在很久之后才有后果”，Vinyals说道。由于现有的技术手段无法攻克这一难题，DeepMind 希望降低开发星际争霸 2 AI 的门槛，集众人之力开发出新的技术手段，解决“战略”难题。

可以说，DeepMind 和暴雪联合开发的工具一举打开了通往终极星际争霸2 AI 的大门。目前，已经有数名世界顶级星际2选手表示，愿意与AI一战。

除了星际争霸2，更值得一提的就是在此之前火遍全球的“AlphaGo”热潮，在围棋这个最复杂的棋盘游戏中，人工智能已经将包括柯洁在内的人类最顶尖的棋手都一一击败，这甚至在当时还一度使“AI威胁”的论点甚嚣尘上。

图丨马斯克认为 Dota2 的难度比象棋和围棋大得多

虽然我们还无法评价 OpenAI 的这次实验与 Facebook 和 DeepMind 打造的“星际争霸II” AI 以及 DeepMind 的围棋 AI AlphaGo 孰优孰劣。但到目前为止，的确还没有人工智能研究团队可以击败人类游戏玩家，OpenAI 算是开了个先河。

不过，这对于人类来说可能就没有那么乐观了，“感觉它就像人类选手一样，但又有人类所不具备的优势，” Dendi 对 OpenAI 的人工智能做出了这样的评价。