Facebook AI 研究院负责人：相比百度和谷歌，我们有哪些优势？-虎嗅网

虎嗅注：SerkanPiantino是FacebookAI研究工程部主管，Facebook纽约部主任。他在 Quora 回答了一些关于 Facebook AI 研究院的问题，新智元整理编译了这些内容，虎嗅从中选取了一部分发布如下。

Q：FacebookAI研究院（FAIR）有哪些最有意思的项目？

有很多有趣的东西，但我会突出一些亮点，还有一些用途广泛的、令人兴奋的项目关键点。

首先，在感知方面，我们构建了能理解图片、视频、声音等等外界输入的系统。Facebook网站上也有一些示例，例如，我们构建了能够回答图片场景相关问题的系统，这里是我们近期在参加MSCOCO挑战赛时用于分割和标记物体的系统所生成的图片。

屏幕快照 2016-01-30 下午9.35.36.png

屏幕快照 2016-01-30 下午9.35.43.png

屏幕快照 2016-01-30 下午9.35.51.png

这类东西——完成了人类认知任务，如标记、对高维输入（像素、视频帧、音频样本等等）回答问题——近几年被广泛地使用，特别是使用了卷积神经网络这类技巧后。卷积神经网络是我的同事YannLeCun很早以前发明的，后来因为GPU处理海量数据的强大能力而变得很实用。这很令人兴奋，因为它的进步速度十分快，而且这也开辟了以往没有的新产品领域——能够在Facebook上理解文本和意图的产品领域。

我们也开始逆向应用这些网络，让它们从一段文字描述中想象场景或图片，而不是从图片中总结出文字。以下是FAIRySoumithChintala和波士顿的indicoResearch的一些合作成果，它生成了AI自己想象出的卧室场景。

屏幕快照 2016-01-30 下午9.37.45.png

而且这些网络也被用于生成面部图像、专辑封面、花、中国汉字甚至还有二次元角色图像。

下一件我想突出的事情是我们赋予这些网络类似于人类记忆和推理的能力。FacebookM项目中一些自动化部分是依靠记忆网络的，这一工作是被FAIRy的JasonWeston发表出来。为了处理长对话，我们不得不理解每段文本的意思，而且为了我们以后也能查询这些内容，我们也需要存储和访问它们。这些记忆网络是在时间中学习如何创造并查询既定事实的一系列网络构建方法的一部分。如果说我们传统而无状态（stateless）的方法看起来像是在时间的推移中学习构建简单电路的话，那么这些网络看起来就像是完全的自主布线处理器（full,self-wiringprocessors）。我们也有一些关于这种网络读故事并随后回答问题的网络示例。

最后，我们从Facebook本身也学到很多东西。Facebook有15.5亿用户，他们之间的相互联系和对外部世界的发掘给了我们绝佳机会来研究人类。作为一名工程师，将系统扩展到整个Facebook社交图上并从中学习让我非常兴奋，而全球唯一能够做到这一点的地方就在这里。我们还有很远的路要走，但我们希望在工作（预测和理解Facebook社交关系图）中学到更多关于人们的东西。

这无论如何都不是所有的有趣研究，但是它们是我个人喜欢的一些亮点。

Q：在接下来的5年里我们预期会看到哪些AI产品？

现在有很多神奇的产品，但现在大部分产品所具有的能力是很原始的。这些产品正用很多种方式转化为Facebook的产品，但是我们需要做更多才能将这些技术挖掘出来，进而将人们天马行空的想象转化为真实的产品。现在，一些AI公司太贪心科技研发以至于他们没有发布任何东西。

所以，接下来的5年里，很多我们在研究社区中讨论过的东西预计会变成更加普及和商品化的技术，也会有很多新初创公司（还有我们的团队）尽他们所能来用AI改善生活。

Q：相比百度AI或谷歌AI，FacebookAI有哪些优势？

我认为有一些结构方面的优势：

·我们已经特别擅长硬件、软件、开发平台和基础设施的建设来加速团队工作效率；

·我们有全球最大的跨文化、多模态、结构化、有组织的人们互动的数据库；

·我们100%承诺会用5到10年时间来开拓AI领域，而且开源并发表我们所有的技术以供行业使用。

Q：让一个远程团队变得积极、紧密联系并有高生产力有哦那些好方法？

这里是一些技巧：

团队结构很重要。分情况对待，远程团队中的单独个体感到受挫的频率以天为计算单位；需要远程管理的一小波人所组成的团队感到受挫的频率以周来计算；远离主管或其他机构领导的一个完整团队感到受挫的频率以月计算；一个完整的机构，还具有自主性、远见和决策制定有可能永远也不会感到受挫；

人们需要周期性“全面同步”，特别是在关键时期，例如做出了一些决定或某些计划被合并了。这些同步之间不能相隔太久，否则有可能存在风险，如团队成员做错事或没在相同的节奏上；

远程管理会感觉十分陌生而且具有强制性。你需要尝试拜访你的团队，再三确定他们是决定制定过程和组织变化过程的一部分，因为如果你不这样做，他们倾向于将这些看做是公司总部的强制命令（这会让人感受到封闭）；

雇员旅行订票时不要有冗长的条条框框，鼓励他们经常旅行。他们比你了解应该何时到目的地更好。

强调他们的自主性，并保护它。如果他们感受到你的信任的话，他们会给你惊喜的。

Q：如果让你告诉那些对AI十分感兴趣的初学者一件事情，它会是什么？

现在这一研究社群有很多兴奋的进展，因为一直有新的发现被公布，基准测试结果被不断刷新。但是你不需要发明一些新的东西来从事AI工作。你需要复制这些成功的工具都是开源的，而且很有可能你想要的网络在Github上是开放的，而且是预训练好并随时可用的。

查看一下代码；鼓捣一下模型看看会发生什么；在社群中问问题。这个领域需要更多的实践者，和更多的人来将这些发现变为有用的产品。

Q：今天最富有挑战性却最简单的AI问题？

非监督学习。

我们今天构建的几乎所有的东西都被我称为专业AI。我们有某个任务的足够样本，接着我们训练电脑在没有我们的情况下完成任务。在我们的AI示例中没有显示出来的一件事是我们在人力标记图片、标记视频数据集等等方面花费了多少精力才让机器得到了足够数据来学习完成某个任务。

人类真的不是这样学习的。我们能够通过看、感知和体验现实来理解世界并在世界中进行活动。如果我们想要造出类似通用AI的东西的话，我们要弄清楚如何从简单的观察中进行学习。换句话来说，我们要开发出一个不需要人类标记来“监督”的系统。

我不认为有人真正破解了这个问题，虽然有很多人尝试，而且我们的模型和电脑要想成功处理这类问题，有可能还要变强大10或100或1000倍。

Q：Facebook会开发和/或开源深度学习专业硬件吗？

我们最近的硬件设计就是这样做的，名为“BigSur”。