谷歌DeepMind开源其AI核心平台,让智能体自主学习并回馈信号
2016-12-06 15:23

谷歌DeepMind开源其AI核心平台,让智能体自主学习并回馈信号

来源:DeepMind 官方博客

编译:刘小芹  闻菲


DeepMind 的科学使命是扩大 AI 的边界,开发不需教导即能自己学习解决任何问题的系统。为了实现这个使命,我们要从 AI 所需的一般前提开始工作。智能体应该能够跨任务操作,同时能够自动适应变化的环境。


也就是说,智能体不应该被预编程,而是要让它们能够从原始输入(raw inputs)中自主学习,并且从环境中回馈信号。


这个研究计划包括两个部分:(1)设计具有更复杂的认知技巧的更智能的智能体,(2)建立用于智能体的训练和评估的更复杂的环境。


有新意的智能体的开发离不开精心的设计,以及合理选择的、灵活并且维护良好的环境的实现。为此,DeepMind 为建立模拟真切的环境投入了大量努力,这个环境即作为 AI 研究的“实验室”。


现在,我们宣布开源我们的平台 DeepMind Lab,以让更多研究团队利用。


DeepMind Lab 是一个专为基于智能体的 AI 研究设计的,完全像 3D 游戏般的平台。它从自己的视角,通过模拟智能体的眼睛进行观察。场景呈现的视觉效果是科幻风格。可用的操作能让智能体环顾四周,并且以3D的形式移动。


智能体的“身体”是一个悬浮的球体,通过激活与期望运动方向相反的推动器实现悬浮和移动,并且具有围绕其主体运动的,能够观察其旋转时动作的摄像头。示例任务包括收集水果、走迷宫、穿越危险的通道且要避免从悬崖上坠落、使用发射台在平台间穿越、玩激光笔、以及快速学习并记住随机生成的环境。下面是智能体在 DeepMind Lab 中如何感知并与世界交互的图示。



图说:智能体把对世界的观察视为一个以像素为单位的图像,并且以它们自己为第一视角呈现。它们也可能收到奖励(或惩罚)信号。智能体可以激活自己的推进器进行3D移动,并且可以沿水平或垂直轴改变视角。 


DeepMind Lab 的人工通用智能(artificial general intelligence)研究的主要任务是导航、记忆、第一视角的3D视觉、运动控制、规划、策略、时间观念,以及必须通过探索周围环境自主学习要执行什么任务。所有这些因素都使得学习非常困难。这里的每个任务都被认为是前沿的研究问题。我们把它们放在一个平台上,代表了这个领域重要的新挑战。


DeepMind Lab 是高度定制化并且可扩展的(customisable and extendable)。现有工具就可以直接使用来达到新的水平。


此外, DeepMind Lab 还包括一个可编程的级别生成(level-creation)界面,可以根据玩游戏的逻辑、拾起物体、特定观察、级别重启、奖励机制、在游戏内发信息等等生成定制化的级别。因此,智能体能得到更多更新的训练。用户能够经过GitHub.在我们的平台上增加定制化的级别,上不仅有代码、地图,还有级别脚本(level scripts)。


我们希望开发人员能帮我们一起塑造和进一步开发这个平台。


DeepMind Lab 在 DeepMind 内部也使用了一段时间。我们相信,它已经对我们关于人的智能和人工智能的很多方面的思考,都产生了重大影响。


但是,我们目前的努力还仅仅只发掘出DeepMind Lab 可能性的一点点。对于一些尚未涉及、但现在可以在DeepMind Lab有所作为的领域,仍然有很多重大发现的机遇,比如导航、记忆和探索。


除了有助于评估智能体,我们也有很大理由认为,在像DeepMind Lab一样的三维环境中,以第一视角更容易开发出智能。


毕竟,目前已知的唯一通用智能的例子就是动物,而动物是在自然环境中,在基于物理和感官的条件下,通过演化、发育、学习产生了智能。有可能人类和其他动物的智能在很大程度上是我们所处的丰富多样环境的结果,没有了这种环境,智能可能无法产生。


想想吧,要是你在Space Invaders 或 Pac-Man这样的环境中长大,你能产生通用智能的可能性也不大。


论文:DeepMind Lab


摘要


DeepMind Lab 是第一个第一人称三维游戏平台,用于研发通用人工智能和机器学习系统。 


DeepMind Lab可以用于研究自动代理如何在大型、不完全可视、视觉多样化的环境中如何学会复杂任务。 DeepMind Lab 有一个简单灵活的 API ,能快速迭代实现探索创造性的任务设计和全新 AI 设计。我们的环境由一个游戏引擎驱动,其速度和性能是有目共睹的,也为开发者社区做了定制。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定