本文来自微信公众号: Fast Company中文版 ,作者:吴文卓,原文标题:《创新理事会|马拉比:从 DeepMind 到华为,还原真实的 AI 之路》
AI、AGI、ChatGPT、Gemini、DeepSeek、OpenClaw……这些概念和产品在进入大众视野之前,走了多远?又是哪些人和组织将其推向大众?这股科技革命浪潮的权力中心到底来自哪里、被谁推动、又将流向何方?是什么力量在驱动这些核心人物不断向前?
或许我们脑海中都曾闪现过这些问题,而科技史学家、金融史学家塞巴斯蒂安·马拉比找到了他的切入点。马拉比于2022年末争取到了DeepMind掌门人、诺贝尔奖得主德米斯·哈萨比斯前所未有的授权,并在而后的3年中与他进行了30多个小时的深度访谈,并采访了其身边的100多位相关人士,包括DeepMind内部员工和外部人员。这些对话和研究还原了AI这一“无限机器”背后的真实发展路径——从技术突破到产品迭代,从权利博弈到资本流动。
本月,《哈萨比斯:谷歌AI之脑》(英文书名:The Infinity Machine:Demis Hassabis,DeepMind and the Quest for Superintelligence)中英文版发布,它凝结了马拉比3年有余的深度调研和访谈。作为哈萨比斯全球唯一官方授权传记,该书不仅全面呈现了他作为AI顶尖科学家和创业者的成长轨迹、科研及创业历程,更生动还原了他每个重大决策背后的逻辑和情绪。借此书发布之际,马拉比到访了北京、深圳、杭州、上海等地,参观了华为、海康威视等中国科技企业。
在初春的上海,我们与马拉比进行了一次深度对话。在访谈中,他分享了作为记者和作者的不同工作方法,在与DeepMind相关的不同信息源交涉时的幕后故事,以及他在此次中国行尾声时关于AI发展方向的思考。他带有历史学的学术背景、拥有多年的财经报道经验以及多年工作中积累的、极其广泛的信息源网络,这些背景和资源让他得以查阅大量机密企业文件、口述史,并近距离观察前沿企业、资本的动向以及政策制定。
他置身事外,却又身处其中。
在转向长篇书籍写作之前,你曾在《金融时报》等媒体做了多年记者。从写作者的角度来看,报道商业新闻与撰写像《哈萨比斯:谷歌AI之脑》这样经过全面调研的叙事作品,有何不同?在思考方式、调查方式以及故事结构上,有哪些变化?
我曾在《金融时报》、《经济学人》和《华盛顿邮报》工作过。如果要比较(媒体报道和长篇写作),最大的不同是,书这种形式需要长篇叙事,因此你需要以非常细致的方式重建事情究竟是如何发生的。细节越多越好。
因此,当我为《金融时报》或其他媒体写评论专栏时,重点实际上在于找到观点。你可能会想要了解一些小的轶事;也许只需要一两段。而在我的书中,我试图讲述连续的故事,这些故事可能会贯穿整个章节,这就需要完全不同的报道方式。
我经常发现自己会说类似这样的话:“接下来发生了什么?”——试图让人们重建事情在当时是如何实时发生的。这是新闻报道中你并不会真正去做的一件事。另外,延展性的对话在书中非常有用,因为书很长,读者会感到疲劳,如果有一些时刻你可以通过对话来增强戏剧性,那是非常好的。所以我在写书时总是在寻找对话。
另一个差异是:在新闻报道中,我们并不是在试图穷尽性地记录所有事实,所以我以前并不是全都录音。现在,我是非常“虔诚”的——我记录一切。所有内容都会被精确地转录。
我再讲一个故事,我认为它很好地说明了这种差异。当我呈现DeepMind试图从谷歌分拆出来的内部视角时(这是一个此前未被讲述的故事),德米斯非常讨厌我要写这个,他的律师联系我,试图告诉我我不被允许这样做。但当然,我还是写了,我与很多消息源进行了交谈,他们给了我来自DeepMind内部的文件以及大量细节。
我的一位匿名消息源,是一个习惯于向《金融时报》匿名发声的人。通常,当他这样做时,他是唯一的匿名消息源,因此他基本上期待记者按照他讲述的内容原样写出来。但写书时,你有更多时间去做更多研究。因此,在同一个场景中(DeepMind讨论如何应对谷歌的内部会议),我有六位匿名消息源。
我经常会把我写的内容给消息源看,让他们发表评论。我会说:“这是独立写作,我不一定会改,但我会听你说什么。”这实际上是一种让他们说出更多内容的方法。所以我把写好的内容给这个人看,他非常生气,说:“我告诉过你事情是这样发生的。”我说:“是的,我知道你这么说,但另外五个人说的是不同的。”他说:“你是在说我撒谎吗?”我说:“不是,这件事情就像一头大象。你看到了大象的一部分,而另外五个消息源告诉我不同的角度。”
他从未与一个有另外五个消息源的作者打过交道,但这就是书与报纸文章之间的区别。你会花三到四年时间,真正尽你所能做到最好,并拥有更多的消息源以及更多的细节深度。写作本身并不会花我四年;写作可能只需要几个月。真正让书变好的,是获取消息源。我在一开始花了大量时间,仅仅是与那些认识其他人的人交谈,而这些人又认识真正的关键人物。这是一个建立关系网、进入核心圈子的过程。此前没有人能够接触到德米斯或穆斯塔法·苏莱曼,或者DeepMind的科学家,如戴维·西尔弗或约翰·江珀。
我对关于新闻报道的工作方法感同身受。当我阅读这本书时,我花了一些时间去理清这些人物之间非常复杂的关系,因为你的消息源中有很多名字,他们的存在确实构成了一个非常有吸引力且完整的叙事。
是的,如果你只看像戴维·西尔弗这样的人,他并不是主要人物。当然,他是重要人物,但不在前三之列。但我至少花了10个小时与他交谈,而且我做了大量的后续邮件沟通,他还阅读了书的部分章节并给我补充了更多信息。然后有一次他还把他关于AlphaGo的日记给了我。即便是这种“第二梯队”的人物——哪个记者有时间投入10个小时,然后再投入另外10个小时做后续追踪?但在写书时,我有这个时间。
你第一次见到德米斯时,他最让你印象深刻的是什么?随着你对他本人以及他身边人的深入采访,你对他的印象是否在某种意义上发生了变化?
首先,基于我之前描述的这种方法——长时间与人交谈,然后在保持独立性的前提下把我写的内容给他们看——我真的能够发掘人们的性格。有时候他们会崩溃,他们会非常愤怒。他们会对我大喊,会多次给我打电话。而我只能说:“抱歉,这是独立写作,我是在追求真相。我不是在做你希望我做的事情,我是在做真实的事情。”
因此,在与我交流的过程中,德米斯确实承担了风险,因为虽然他出现在很多媒体中,但他对大多数媒体的控制是相当严格的。例如,有两部关于他的纪录片。一部叫《思考之弈》(The Thinking Game),是比较新的,另一部较早的是关于AlphaGo的。这两部电影都是由DeepMind签约的电影制作人制作的,因此它们不是独立的。
我知道,当他们与记者打交道时,如果记者过于批判,他们会尝试停止与其交流。他们是具有控制性的,而我很难被控制,因为我经验丰富,而且我做了大量报道。他们无法控制我,所以他承担了风险。
因此,我当时进行了非常深入的挖掘,我确实发现了一些德米斯不希望我写出来的事情。有一次,他甚至让律师愤怒地来与我沟通。但关于我对他的印象是否有改变的问题,我的回答是并没有。尽管我挖掘了他不希望我找到的故事,他仍是那个我在项目一开始认识的那个开放、友善的人。我认为他确实有很好的价值观。他是一个好人。他关心AI对人类的影响。一些特别成功的人物过着疯狂的生活,而德米斯和他大学时的女友结婚。他们有两个孩子,仍然在婚姻中,住在12年前的同一所房子里。他的生活方式相当普通。他很接地气。
他绝对是一个天才,在努力程度、驱动力和竞争性方面都是非凡的,但他从未向我隐藏这一点。一开始,他就让我去读《安德的游戏》(Ender's Game)——关于一个拯救世界的孩子的故事。他说:“你应该读这本书,因为我认同这个角色。”对大多数人来说,这完全是疯狂的。你不会说:“我是救世主,正如这本书中的人物一样,我在拯救人类。你得去看看这本书!”即便你这么想,你也不会告诉记者,因为这听起来太傲慢了。所以他一开始就非常坦诚地展示了他是谁。而且他始终保持理性,并不疯狂,这其实很少见。
那么,基于你刚才的回答,你认为哪些核心价值或经历,最根本地塑造了他,不仅作为一名科学家,也作为一名领导者?
我认为他在很小的时候,大概六岁,就开始下国际象棋并参加比赛,这让他变得极其具有竞争性;另一个因素是他的母亲,她是有宗教信仰的人,她有一些理念,比如不应该控制他人,应该善待他人。当德米斯的DeepMind在早期招聘员工时,有一个测试就是:这个候选人是否对前台接待人员友善、礼貌?如果他们不友善,就不会雇用他们。
还有一点——也许是最重要的——因为他小时候非常与众不同,辍学、自学,比父母和同学都聪明得多。当他还是个孩子时,他看起来很像中国人。他有一半华人血统,头发又浓又黑。所以在学校里,他在种族上是不同的,在智力上也非常不同,再加上国际象棋这一点,也完全不同。他是一个“怪人”。他对我说:“我是个外星人。”
正因为他如此与众不同,他始终坚持开辟自己的道路。在他16岁时,在牛蛙公司编写《主题公园》(Theme Park)游戏,就是这种特质的极端体现。他当时住进了一个疯狂企业家彼得·莫利纽克斯的家里,和其他一些同样聪明的年轻人一起生活,16岁就在讨论AI。这让他在很年轻的时候就对构建AI产生了坚定信念。他同时也相信自己会选择自己的道路,而其他人在做什么并不重要。1997年他离开剑桥时,在英国成为一名企业家是非常罕见的。在剑桥,其他学生骑着自行车四处走,而他开着一辆保时捷。他早年的一切都如此“奇怪”,以至于他可以想到一种不寻常的想法,比如:“我要创办一家做AI的公司。”

说到DeepMind,书中也强调了DeepMind与OpenAI之间的不同发展路径和竞争。在你看来,二者最重要的战略差异是什么?
其中一部分差异在于,DeepMind成立于2010年,比OpenAI早五年。因此在2010年时,相关科学还没有发展成熟,DeepMind只能是一家“蓝天”科研性质的、以科学为先的公司。而到2015年,环境已经发生变化。OpenAI更强调工程。我认为部分原因是OpenAI成立时,一些基础科学已经完成,因此工程相对更重要。
不过,更大的差异在于,在硅谷与伦敦之间存在一种截然不同的心态。伦敦并不真正是一个创业生态系统。在当时,做一家初创公司意味着成为一个孤立的实验室,与其他公司几乎没有联系。伦敦的投资人?几乎没有。DeepMind能够吸引彼得·蒂尔和埃隆·马斯克这样的美国投资人,但彼时伦敦本地的投资人影响力微乎其微。不像在硅谷,一切都围绕关系网展开,DeepMind没有那样的关系网。他们当时非常孤立,自己钻研,而且也没有专注于产品。
但德米斯非常擅长讲故事,这对DeepMind的生存至关重要——比如把AlphaGo做成一部电影,或者让雅达利(Atari)登上《自然》杂志封面。但他讲故事的方式并不是硅谷那种“先造势再实现”(fake it till you make it)。萨姆·奥尔特曼经常在推特(X)上说他们有某个产品,但实际上那是他编出来、准备以后再实现的。如果你看ChatGPT里的购物功能,他五个月前宣布,后来又取消了。围绕未来的故事含有很多炒作成分,因为有助于融资。德米斯更多是围绕已经实现的成果来讲故事。
OpenAI更偏工程和产品导向;他们愿意在DeepMind还不愿发布Sparrow的时候就推出ChatGPT。在很长一段时间里,萨姆·奥尔特曼有一种“超能力”:他每发一条推特(X),硅谷所有人都会转发。当我问硅谷的AI从业者谁会赢,他们会说:“显然是OpenAI,已成定局。”我问他们的判断标准,他们说是“共识”——基本上就是话题度。人们讨论萨姆·奥尔特曼,是因为他处在硅谷关系网中。德米斯完全没有这种优势,而我认为从长期来看,这反而(对DeepMind而言)是一件好事;我认为OpenAI过度炒作,他们不能交付足以支持公司高估值的成果。
AI竞赛的决定性因素会是什么?算力、人才,还是其他不那么显而易见的因素?如果我们看未来十年,你认为最关键的是什么?
我认为决定性因素将是应用。AI科学和基础模型会不断进步,我们会有更好的智能体。我们已经拥有非常强大的基础模型。有人甚至可以说Gemini已经是AGI——它是人工的、通用的、智能的。那么接下来要做的是,让这种AGI对世界真正发挥作用,而不仅仅是像搜索引擎那样使用。
我这周在中国访问了华为,对他们的云服务印象非常深刻,他们正在把AI应用到从高铁维修到医疗的各个领域。我昨天还访问了海康威视,他们在做AIoT(人工智能物联网),即AI嵌入在传感器和视觉技术中,而不是运行在云端或是数据中心。他们在开发一些具体工具,比如测量水质或煤的成分。这让实体经济变得更加清洁、安全和高效。将AI嵌入工业将非常重要。谷歌规模更大,有更多机会去设想这些,比如他们在Waymo上的尝试。但我觉得,由于中国在高端制造方面非常强大,其中一些发展很可能会在中国走在前面。所以如果你问我未来十年,我会说机器人和嵌入式AI——这就是未来。
在今年年初接受CNBC的采访时,德米斯提到中国AI模型可能只落后西方几个月,但他认为前沿突破更多取决于思维方式,而不是技术限制。你是否认为前沿创新与单纯扩展现有技术之间存在真正区别?中国在其中处于什么位置?
德米斯一直相信,会有某种基础性的科学突破在等待发生,那才是让他兴奋的东西。当进展来自工程时,他会感到失望。他希望进展来自杰出的、天才级的科学,因为那正是他所擅长的领域。是否会出现类似2017年Transformer那样的算法突破?是的,可能会有。这种突破似乎每10年左右出现一次,所以也许我们正接近下一次。
所以在某种意义上,我认为德米斯并没有错——确实可能会有前沿突破。我也可能同意他,从历史上看,这些突破更多来自西方实验室。但我认为,前沿科学突破的可能性,并不否定工程和应用进展的极端重要性。在某些方面,DeepSeek确实有创新。我认识很多西方计算机科学家,他们都说这非常酷且具有创新性。
所以我认为德米斯有点夸大了这一点,一方面因为中国确实在创新,另一方面是因为(创新科学的)应用比他所相信的更重要。一个很好的例子是OpenAI更重工程、轻科学,而在一段时间内超过了DeepMind。为了追赶,DeepMind不得不加强工程能力。
你刚刚提到,在这次中国行中参观了华为。它的文化和整体氛围给你留下了什么印象?这是否改变了你之前对这家公司的看法?
我对他们的人和产品都印象深刻。在产品方面,我试乘的华为尊界的驾驶表现非常出色。它是完全无需手动操作的。有一次前方有一辆施工卡车挡在路中间,这辆车非常优雅地减速,然后绕开它继续前行。相比之下,在旧金山的Waymo出租车看起来有点笨重,而这辆车把激光雷达隐藏在内部,而且非常舒适。我也对他们的三折叠手机印象深刻。
我认为他们面向工业应用的云服务也非常出色。三十年前,人们认为管理咨询是工业经济的大脑;而现在,我认为工业的大脑正在转向通过云端提供的软件,我们可以非常清楚地看到华为在这方面的优势。
至于这是否改变了我的看法,我会非常坦诚地说。在华盛顿,我的一些朋友曾在拜登政府中负责半导体出口管制。起初,从美国国家安全的角度来看,我认为这可能是有效的。但我错了。当我来到这里,看到华为、海康威视以及蚂蚁集团,这些机构都传递出中国科技的深度与卓越。当你看到这一点时,你会觉得,试图阻止像中国这样的国家获得AI,是一个疯狂的想法。这些人实在太优秀了。如果我在2023年就来中国进行这次访问,我当时就不会支持半导体出口管制。
在一期播客中,你分享过你对商业决策背后的思维过程非常感兴趣。听说访问华为时,任正非亲自接待了你。见面之后,你会如何描述他作为一名企业家?
那是一场很长的会面,大概两个小时。有一件很有意思的事情是,他非常谦虚。如果你尊重地问他问题,邀请他谈谈自己的成就,他的回答会非常谦逊,甚至带点玩笑。比如当我欣赏着华为园区的欧式建筑,说道:“你显然对建筑非常了解,”他说:“我什么都不懂,那是某个日本建筑师的功劳。”后来我得知他大学主修的就是建筑。这就说明了他的谦逊。我认为他之所以如此成功,首先是因为他的思维非常开放,他愿意向所有人学习;其次,从个人魅力上来说,他很有吸引力,具有一种天然的感染力。
最近中国有很多关于OpenClaw的讨论。你认为这是否是一个类似ChatGPT的,可能重塑AI格局的时刻?
我认为OpenClaw在美国并不是ChatGPT(时刻),但在中国,它看起来更像ChatGPT(时刻)——在这里影响更大。也许在这里,它某种程度上是一个关于“智能体AI”的ChatGPT时刻。我确实认为智能体AI是下一个重要方向。不过,OpenClaw也说明了它具有十足的危险性。清华大学的一位教授曾对我说:“OpenClaw就像是让你的电脑变得赤裸。”我认为这是一个让我们直面AI的力量与风险的时刻,我希望大家能够更加认真地对待这些风险。
在地缘政治紧张加剧的背景下,你如何看待推动创新与管理其全球风险之间的悖论?
在冷战期间,1962年发生了古巴导弹危机,而1968年签署了《不扩散条约》。在六年的时间里,世界从激烈对抗转向了合作。我们必须希望这种转变会再次发生。
我这本关于德米斯的书表明,一个来自私营部门的AI领导者可以拥有非常好的意图,但最终他并没有足够的权力。如果他出于安全考虑对AI设限,还会有另外五个实验室不会这么做。因此,我们需要政府介入,而且需要美国和中国共同参与。
我希望中国能够利用接下来几年、直到我们迎来一位新美国总统的这段时间,为此做好准备。我对中国的印象已经发生了变化,尤其是对众多中国领导者与我讨论安全问题感到印象深刻——包括科学家、研究人员以及企业领袖。在来中国之前,我在美国的朋友认为中国还没有准备好讨论安全问题;而我现在的判断是,中国已经准备好了。我们需要的是,让这种在中国精英层面的讨论扩展到公共讨论和政治领导层。当关于AI《不扩散条约》的谈判开始时,我希望中国能够提出关于治理和安全的实际可行的方案。
