OpenAI玩Dota2完胜人类最强选手,马斯克:这可比围棋难多了

OpenAI玩Dota2完胜人类最强选手,马斯克:这可比围棋难多了

8 月 11 日,人工智能又给人类带来了惊喜,伊隆·马斯克(Elon Musk)旗下的人工智能研究机构 OpenAI 宣布他们所打造的一个 AI 机器人已经在电子竞技游戏 Dota 2 中击败了一个名为 Dendi 的人类职业玩家,而比赛所采取的形式也是很直接的 1v1。

 


双方约定好共进行三轮比赛,在第一场比赛中,人工智能在不到十分钟的时间内闪电击败对手;第二场比赛同样也是由人工智能取得了胜利;而这直接导致了 Dendi 放弃进行第三场比赛。

 

图丨被AI打败的Dota2最强人类选手Dendi


“这个家伙很可怕,”Dendi 在比赛中倒吸了一口冷气。

 

图丨马斯克第一时间转发了OpenAI获胜的消息


OpenAI 官方解释说,这款 AI 机器人是完全通过自我训练出来的,研究人员从零开始通过过往的比赛视频来对它进行训练。OpenAI 的 CTO 格雷格·布罗克曼(Greg Brockman)表示,训练仅仅花费了两周的时间,AI 就已经击败了包括世界排名第一在内的顶级 1v1 选手。

 

Brockman 补充道,“通过 1v1 这种形式的训练,我们已经针对 AI 的优势和劣势进行了针对性的训练。”接下来,OpenAI 将训练 AI 一次扮演 5 个选手,这样就可以组成一个完整的战队了。同时,他们还准备将这款 AI 对外开放,让所有人都有机会和人工智能进行对战。


而人工智能介入游戏领域也并非新鲜事,包括 DeepMind 和 Facebook 都已经针对即时战略游戏“星际争霸2”开展了探索之路,他们收集大量的人类玩家游戏比赛记录数据,并用这些数据来训练深度学习算法,最终可以做到在人机大战中击败人类选手。


就在 8 月 10 日,DeepMind 联合暴雪公司正式推出合作开发的星际争霸2机器学习工具组:SC2LE(星际2学习环境),双方希望通过这些工具,帮助研究人员加快星际争霸 2 AI 的开发速度。


SC2LE 包括:


一个由暴雪开发的机器学习API,为研究人员和开发者们提供接入游戏的端口。其中将首次完整包含为Linux系统开发的工具。


DeepMind的工具集PySC2的开源版,让研究人员可以轻松地在各自的模型中使用暴雪的特征层API。


一系列小游戏,让研究人员可以对自己系统的性能进行真实的测试。


一个含有6万5千局匿名游戏的数据集,并将在接下来的几周里扩展至50万局游戏以上。


一篇介绍整个环境并提供基线成绩的论文。基线成绩是由小游戏,从游戏回放进行的监督学习,以及与星际2 自带的电脑对手进行单挑的结果得出的。



当然,星际争霸 2 还有一些难题暂时没有技术手段解决,比如“战略”。作为一个战略游戏,很多时候,玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此,为了让 AI 学会“战略”,它必须拥有“计划”和“记忆”的能力。“存储是至关重要的”,DeepMind 星际争霸 2 项目的负责人Oriol Vinyals 说道。


而由于游戏的长度,DeepMind善用的加强学习却并不适合星际争霸 2,“我现在做出的操作可能在很久之后才有后果”,Vinyals说道。由于现有的技术手段无法攻克这一难题,DeepMind 希望降低开发星际争霸 2 AI 的门槛,集众人之力开发出新的技术手段,解决“战略”难题。


可以说,DeepMind 和暴雪联合开发的工具一举打开了通往终极星际争霸2 AI 的大门。目前,已经有数名世界顶级星际2选手表示,愿意与AI一战。


除了星际争霸2,更值得一提的就是在此之前火遍全球的“AlphaGo”热潮,在围棋这个最复杂的棋盘游戏中,人工智能已经将包括柯洁在内的人类最顶尖的棋手都一一击败,这甚至在当时还一度使“AI威胁”的论点甚嚣尘上。


图丨马斯克认为 Dota2 的难度比象棋和围棋大得多


虽然我们还无法评价 OpenAI 的这次实验与 Facebook 和 DeepMind 打造的“星际争霸II” AI 以及 DeepMind 的围棋 AI AlphaGo 孰优孰劣。但到目前为止,的确还没有人工智能研究团队可以击败人类游戏玩家,OpenAI 算是开了个先河。

 

不过,这对于人类来说可能就没有那么乐观了,“感觉它就像人类选手一样,但又有人类所不具备的优势,” Dendi 对 OpenAI 的人工智能做出了这样的评价。

*文章为作者独立观点,不代表虎嗅网立场
本文由 DeepTech深科技 授权 虎嗅网 发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处(虎嗅网)及本页链接。原文链接https://www.huxiu.com/article/209815.html
未来面前,你我还都是孩子,还不去下载 虎嗅App 猛嗅创新!
+1
12
发表评论
默认评论 最新评论
杨晨下心 2017-08-12
然而dendi并不是最强
+1
+1
我要点评
嗅友dMqW0 6天前
赞同马斯克的ai 控制看法,从我自己做机器学习角度来看,目前机器学习就是数据抽象的过程,正确错误方式激励的学习过程,类似于幼儿的学习过程,是一种非智能的倒逼建模过程。但是这个量变我觉得要到了质变的边缘,我甚至赞同孙正义比马斯克都激进和哎批的观点:五年内ai 的奇点就要到来。我觉得人类的智能应该是有维度的,就像物理大统一模型如果建立和验证起来了,就意味着知识的大爆发,对于机器智能,我也有同感,各个维度的简单枯燥的学习倒逼模型,被整合称为一个智慧的大统一时,智慧就有了生态,就能够自举,那个时候确实就晚了;我们不会被造钉子的机器人毁灭,而是会被感知到宇宙更高意义的ai 智能否定存在的意义,所以如果我们注定无法超越机器智能,我们就应该成为他,或者说让他成为我们。
+1
+1
我要点评
winnow 2017-08-12
Dendi:有本事选屠夫
+1
+1
我要点评
Levense 5天前
确实蛮厉害,如果配合能打过人类就牛X了。AI缺乏意识是软肋,团战是抄袭先跳大,还是人马跳踩,这是个问题~
+1
+1
我要点评
你妹不是你妹 2017-08-12
总感觉马斯克是骗子,
+1
+1
我要点评
xd1546 5天前
纱布,有锤子意思,老子要的是和人对打~
+1
+1
我要点评
jdliu6 5天前
1v1与5v5不能相提并论
+1
+1
我要点评
自然醒2017 5天前
感觉马斯克随便说说的,不觉得真的比围棋难度高。。不过可喜的是技术进步,以后的类似咪咕灵犀的语音助手,ECHO的智能音箱应该会变得更加智能。
+1
+1
我要点评
RainQAQ 5天前
这个ai并不是最强
后面被50个现场观众虐了
+1
+1
我要点评
尸体在唱歌 6天前
20年前星际1困难模式的电脑就把我们普通玩家虐得不要不要的
+1
+1
我要点评
嗅友DZ5LO 6天前
需要操作手法的项目人类更不可能赢ai,人家一刀不漏,最大限度的反补你!经济人类已经输在起跑线上。
+1
+1
我要点评
dota2最强人类选手,小编何时能停止胡说八道
+1
+1
我要点评
嗅友BiBhU 2017-08-12
这个只是比操作,现在的人工智能就是算法的代名词,高级机器而已,55不可能赢人类。
+1
+1
我要点评
CypherLcj 2017-08-12
早上看直播了 LGD败的有点惨 看凌晨LFY能否守住液体 决赛又将怎样 不管如何 这届TI比预想的好多了
+1
+1
我要点评
ywrdefault 2017-08-12
难道要用星际争霸来捍卫人类的荣耀
+1
+1
我要点评