本文来自微信公众号: Web3天空之城 ,作者:Web3天空之城
全局摘要
本次李飞飞的最新对话深入探讨了人工智能(AI)对现代社会、职场及教育体系的深远影响。核心讨论围绕“能动性(Agency)”展开,认为在AI时代,人类的主体地位非但没有削弱,反而通过工具赋能得到了增强。专家们分析了AI讨论中的两极分化现状,提出了“空间智能”作为AI进化的下一阶段,并为个人和机构如何在变革中寻找机遇提供了具体建议。
核心观点
能动性是核心
:AI不是为了取代人类智能,而是作为一种工具赋能人类,提高效率并扩大劳动规模。
空间智能的崛起
:除了语言智能,包含理解、推理、生成和交互的空间智能是实现更高级别AI的关键拼图。
教育范式转移
:教育的目标应从标准化的工具使用转向人的塑造,AI有望实现大规模的个性化一对一指导。
拒绝二元论
:社会应超越“乌托邦”或“末日论”的极化讨论,关注如何利用AI解决实际问题并规避风险。
01
拒绝二元论:人工智能是工具而非替代者
面对人工智能带来的冲击,社会普遍表现出一种深刻的焦虑。李飞飞指出,这种焦虑源于对技术本质的误解。她认为,关于人工智能的讨论不应停留在“取代”或“毁灭”的层面上。“这一工具的本质应当是文明的延伸。我们必须学习如何使用它,从火到刀具,再到互联网,人类文明史就是一部学习掌握复杂工具的历史”。
大卫·罗杰观察到,职场中正在形成一种日益扩大的“能动性鸿沟”。那些已经开始将人工智能融入日常工作的人,其效率和产出正以几何倍数增长。“世界分裂成了两派,这种极化讨论并不健康。如果我们能发掘技术的最佳应用层面,思考如何利用它造福人类,就能实现双赢”。
李飞飞强调,所谓的“智能自动化”是一个极具误导性的词汇。回顾工业革命,技术并没有消灭体力劳动,而是提高了劳动效率并扩大了规模。“声称智慧的成本趋于零是不负责任的言论。人类智慧极其深奥,除了语言,还包括感知、空间、身体和情感智能,我们尚未掌握创造力的真正本质。”
02
空间智能:从文字处理到物理世界的交互
在李飞飞看来,目前大火的语言大模型仅仅是人工智能进化的起点,而非终点。她指出,你不可能通过阅读文字学会开车或投篮,因为人类智能的很大一部分植根于对三维物理空间的理解。这正是她目前致力于研究的领域——空间智能。
“空间智能包含四个核心维度:理解、推理、生成和交互。它不仅关乎看到世界,更关乎在四维时空(三维空间加时间)中进行逻辑推演与行动”。李飞飞解释道,空间智能是人类演化五亿年才趋于成熟的深层能力,而语言智能的形成时间要短得多。
这种智能的突破将直接影响机器人技术、建筑设计、医疗手术以及创意产业。当人工智能具备了理解和操作物理空间的能力,它将从一个屏幕后的聊天机器人,转变为能够在现实世界辅助人类折叠衣物、煎蛋卷或进行复杂手术的物理实体。“如果没有空间智能,人工智能的蓝图将是不完整的。它是实现真正通用人工智能的必经之路”。
03
职场重塑:从“指挥家”到“全能创作者”
技术变革正在从根本上改变职场的权力结构和工作流程。大卫·罗杰分享了他的个人经验:作为一家大型公司的首席执行官,他现在的工作流中充满了自己构建的定制化工具。“现在的核心问题在于:完成工作的动力是什么。开发一款应用程序的成本已从几个月缩短到了一个周末。你现在有能力根据自己的思维方式创建任何流程和工具”。
这种变化在产品经理等职位上表现得尤为明显。李飞飞指出,十年前的产品经理更像是一个协调各方的指挥家,而现在的优秀人才已经在利用工具直接编写代码、生成原型。“个人的主观能动性、创造力,以及能力边界的界限,都将变得更加模糊并随之降低。未来的工作将很大程度上依赖于那些知道如何高效使用这些工具的人”。
在这种背景下,职场将呈现出一种显著的“杠铃效应”。大卫·罗杰预测,市场将向两端分化:一端是极少数在特定工艺领域处于全球顶尖百分之一的专家,另一端则是拥有极高主观能动性的通才。“如果你只是水平平庸的文案撰稿人,那么你很快会被取代。但如果你是高能动性的通才,能够跨领域判断并驱动工具,你将获得前所未有的主导权”。
04
教育范式转移:人工智能时代的个性化革命
教育体系正面临着过去六十年未有之大变局。大卫·罗杰认为,传统的班级授课制本质上是为了降低教育成本的妥协产物,而人工智能可以打破这一僵局。“借助技术,我们现在能以极低的成本为每个人提供一对一的指导,这种学习效率比传统教室高出百分之六十”。
最大的阻碍往往来自于体制内部对变革的恐惧。李飞飞呼吁教育者重新审视教育的本质。“教育的目标并非工具,也不是标准化的考试分数,而是塑造人,使每个人都能成为社会中有意义的贡献者。闭卷考试或禁用技术并不是正确的发展方向”。
她认为,学校应当教会学生如何在人工智能的辅助下进行深度思考,而非简单的作弊。未来的教育应侧重于培养学生的自主意识、独立思考能力和韧性。“我们应该关注如何赋能教师和学生,重构课堂,利用这种能够降低门槛的技术,为资源匮乏的地区提供优质的教育资源”。
05
结语:重拾人类的主体性
在对话的最后,两位专家都强调了一个观点:人工智能时代,最强大的武器依然是人类的灵魂。
大卫·罗杰建议,那些渴望培养能动性的人应当主动置身于困难且新奇的环境中,摆脱“寻求他人赞美”的童年心理惯性。“要拥有自主权并成为创业者,你必须去追寻那些被别人认为是不可能的事情”。
李飞飞则给出了一个既简单又充满温情的建议:向身边的年轻人请教。“保持好奇心,让那些已经在生活中熟练使用技术的二十五岁以下的年轻人成为你的向导。不要担心技术门槛,只要你真正了解它,它就能赋予你更强大的能力。不要害怕,因为历史的车轮正朝着未来滚滚向前”。
在这个变革的时代,失去旧有的习惯和稳定感是痛苦的,但这同样是一个重新定义自我的机遇。正如李飞飞所言,“主观能动性是创业精神的同义词。无论你是医生、教师还是职场人,保持人类的主体性,去驾驭技术,而非被技术驾驭”。
完整访谈
天空之城全文整理|李飞飞:能动性、空间智能与人类赋能
变革时代的认知与挑战
Marina
Fei-Fei构建了使现代AI成为可能的数据。现在她已筹集了10亿美元,用于构建下一个时代。她正在她的全新大师课“AI的未来与你”中传授这一切。David Rogier将Masterclass打造成了一家价值27.5亿美元的公司,向人们传授来自全球顶尖人士的知识。今天,他们两人都在注视着同样的转变,并且对此有很多见解。
David
这是一个正在扩大且不断增加的鸿沟。如果有人正在使用AI,他们能够完成的工作量远超以往。我们以后将不再需要工作了。
Marina
全民基本收入。
David
我们以后只要休息就能拿到钱。
李飞飞
变革的时代也可能是一个充满损失的时代。
Marina
那会是什么样子呢?人们应该做什么?
硅谷的活力与业务重塑
李飞飞
为许多旧习惯和长久的稳定感做好准备,但这也是一个机遇的时代,这是一个机遇……
Marina
你们如今在经营公司,你们看到了什么?最大的转变是什么?
李飞飞
我的世界很大程度上围绕着AI,所以我认为我有幸能真正体验到技术推动的最前沿,我无法用言语形容这一刻有多令人兴奋,技术人员、企业家,包括产品人员和商务人员,大家都在意识到这一点,这是一场真正的翻天覆地的变化,关于如何利用AI来重塑业务、重塑应用程序。
而且,我已经在硅谷待了17年,这种感觉非常明显。这种活力,我从未见过。
李飞飞
即使是10年前,我也没感受到这种程度的兴奋。
Marina
那真是太令人惊叹了。而且我觉得每个人工作得都更卖力了。David,你同意这一点吗?你们公司正在发生什么?
David
这是一个正在扩大和加剧的鸿沟。如果有人正在使用AI,他们完成工作的效率会极大提升,并能感受到一种前所未有的主观能动性。如果他们仍然对此感到紧张或者尚未接受相关培训,你就会看到那种鸿沟在不断扩大。
我认为你探讨的话题中最有趣的一点是,世界似乎分裂成了两派:一派认为这一切如神迹般将拯救世界,而另一派则认为这是恶魔,注定要摧毁一切。当下的社会非常两极分化。我认为你所探讨并展示的一点是,这种态度并不健康,或许也不是一种最优的设计方案。事实上——这方面你应该比我更有发言权——如果我们尝试去发掘它的最佳应用层面,思考如何利用它真正造福于人,或许我们就能兼收并蓄,实现双赢?
CEO的个人AI技术栈
David
你之前问到了关于工具的问题。我当时正在思考这个问题。如果是在几个月前问我,可能会列举出Claude、ChatGPT以及所有那些大型工具。但我现在发现,我所使用的大多数应用程序都是我自己构建的。而且我是用Claude Code或Codex构建的。非常有道理的观点。首先,我认为这对我来说简直不可思议,因为现在我的“CEO技术栈”里全是我自己构建的应用程序。
Marina
这叫Davidify,我读到过一些内容,说你自己构建了定制化的工具。
David
我创建了一个David Phi。就是David Phi。我把它交给了我的团队,就像是说如果你想用我的口吻来写东西,这里有一些参考资料。包括我写过的邮件和我说过的话,这样你就可以照着做。甚至连我的生产力应用、我的待办事项列表应用,也是我亲手构建的。
我设定了一个规则:如果某项任务在列表上的时间超过了一天半,它就不能继续留在列表里。这迫使我必须做出决定:要么现在就去完成它,要么因为它实际上并不重要而将其剔除,又或者把它交给团队里的其他人去处理。而这恰恰允许了……你根据自己的思维和工作方式创建所有这些应用;回到我们之前提到的代理机构观点,你现在有能力去创建任何你想要的流程和工具。
所以现在的核心问题在于:完成这些工作的动力是什么,以及去实现它们所需的技能又是什么。但开发一款应用程序的成本从几个月缩短到了大概一个周末。
Marina
没错,确实如此。这是一个非常好的观点。如果有员工来找你说,他们真的想开始使用AI,你会告诉他们应该从哪里入手?应该从哪里开始,任务是什么?因为我听说有些企业家会要求员工用vibe code的方式来制作仪表板。你有什么推荐的起步做法吗?
David
我不喜欢用vibe code来做仪表板,因为当有人用vibe code制作仪表板时,它仅仅停留在前端界面上。它从来没有与实际的后端输入关联起来。所以它可能在一个小时内表现得很好,但大多数情况下,由于他们没有将其与所有数据关联,它很快就会停止工作。
当他们想要学习AI时,我发现如果他们问出这样的问题,说明他们自己在尝试时有所顾虑。有什么东西在阻碍着他们。所以在那种情况下,我会怎么做呢?有时候我会担心这是否在浪费我的时间,但我后来发现并非如此。我会坐下来和他们交流,或者以两三个人为一组,向他们展示一个基础任务,比如深入研究,我会一步步引导他们完成。在某些方面,我觉得这是在浪费我的时间,因为我觉得他们完全可以去看YouTube视频,那比我教的效果要好得多。
但我发现,当我与他们共同操作时,某种东西会被激活,这能让他们之后自主地去深入探索。所以我不知道是因为有人在旁引导,还是因为我是CEO,他们觉得被迫去做,或者其他原因,但经过我手把手的引导后,他们就能够独立开展工作,并完成更多的事情。
拒绝极端讨论:AI的中间地带
李飞飞
是的。谢谢你,David。感谢你真实地呈现了现实的复杂性。这也是我所观察到的情况。坦率地说,我很担忧,因为我认为关于AI的公众讨论已经过于两极分化了。我们必须看到其积极的一面。我们也必须看到其消极的一面。但目前的公众讨论并非如此。
要么认为它是彻底的乌托邦。认为它终将拯救世界。认为我们以后将不必再工作。即全民寻求保障。
David
没错,我们以后甚至能领着钱享受生活。
李飞飞
或者就是那种关于AI的论调,认为它极其糟糕。它将会取代所有的工作岗位。它将会剥夺人类所有的自主权。这两种极端观点都非常危险。我通常认为这是一种技术。这意味着它是一种工具。它是一种非常强大的工具。但它也是人类可以利用来改善事物的工具。
不过,我们也必须对如何使用这一工具保持高度警惕。我们教导孩子们如何使用从火到刀具,再到互联网等各种工具。现在,作为物种和整个社会,我们必须学习如何使用它。而最重要的论述却缺失了。那就是关于细微差别的中间地带的论述。这一工具的本质就是如此。我们该如何善用它?我们该如何规避其中的陷阱?作为文明,我们又该如何利用这一文明工具向前迈进?
协作瓶颈与智能自动化
Marina
那它就是一种革命性的工具。我觉得这是第一种工具,它实现了工业革命对体力劳动的自动化,而在这里,我们某种程度上是在实现智能的自动化。这就是为什么我认为很多人感到恐惧,因为他们会想,我本以为大学能保证,不说保证吧,至少是通向职业生涯的一条路径。现在,如果智能的成本降为零,我不知道会发生什么?你怎么看?
David
我从你那里学到的一点是,我们现在所谈论的AI,它是基于语言的。用你的话来说,这就像是有损的。你不可能通过文字学会开车。你也不可能通过文字学会投篮。
所以我认为我们仍然处于AI的1.0版本。而且我认为这种恐惧有点被过度炒作了,因为AI并没有自己的一套价值观。这是我们的价值所在。这是我们的价值观。所以我认为这意味着我们有机会去设计和塑造它。你想分享一下你的想法吗?我觉得你和医生们一起做的关于观察他们洗手的事情非常有意义。
李飞飞
是的。所以我同意David的观点。首先,工业革命并没有实现劳动力自动化。它提高了劳动效率。它扩大了劳动规模。它确实引起了劳动力市场的转变,但并没有实现劳动力自动化。
此外,我们不能暗示体力劳动不具备智慧。这确实是一个非常、非常错误的前提。要知道,体力劳动、认知劳动、情感劳动,人类活动与人类活动之间有着深刻的交织。智慧在本质上仍然是一个尚未被解开的谜。我们并不了解人类智慧的深度和细微之处。因此,声称智慧的成本趋于零——我知道你并没有这样说,但任何持这种观点的人——都是不负责任的言论。
正如David所言,人类智慧极其深奥,除了我们更为熟悉的语言智能外,我们还拥有感知智能、空间智能、身体智能和情感智能。我们尚未掌握创造力的本质,即它究竟源于何处;每个人的创造力不仅源于大脑的不同部分,更源于他们整体的生活经历。因此,我认为我们需要对这些还原论的断言保持高度谨慎。
我确实认同语言智能,即LLMs及其衍生模型,拥有令人难以置信的强大能力。它们正在助力商业智能,也在助力软件工程。它们正在辅助演绎推理、逻辑推理,甚至更深层次的任务。我们目前还没有看到语言智能和软件智能的通用化应用。这一切都很重要,但其内涵错综复杂。情况很复杂。它在很大程度上可以与人类智能进行强有力的协作,但我不会使用“自动化人类智能”或“智能归零”这类词汇。我对那种论调非常担忧。
Marina
正是这种论调导致人们对AI如此抵触,因为他们看到的都是大规模裁员之类的头条新闻,仿佛在说“我们不再需要你了”,正是这类言论引发了这种消极情绪。
适应技术变革:教育与就业
David
但在这些情况下,解决办法并不是去回避使用AI,也不是不去使用它。我认为解决办法是掌握这个工具,然后去思考如何更好地设计它,或者思考如何改进工具,就像你在医院所做的一些工作那样。
如果你拥有一份工作,工作实际上是由一系列任务组成的。我认为你的观点之一是,你在工作中可能有一些自己不喜欢的任务。我记得你举的例子是护士必须记录所有笔记,而我从未见过有哪个护士会说:“你知道吗,我工作中我最喜欢的部分就是写病历。”那并不是他们进入这个专业领域的原因。所以我认为回避是错误的路径,同时我也认同你的观点。
我认为,如果我们审视任何技术变革,它最终总是会带来更多的就业岗位净增长。问题仅仅在于谁能得到这些机会,究竟是谁真正获得了那些工作。但那些没有得到这些工作的人,往往是无法适应技术变革的人。没错,是吧?如果你不去适应,后果将非常严重。
回顾过去,随着计算机和电子表格的出现,如果你不适应,结果就是失去工作,终身收入下降超过五分之一,第一年的死亡率更是翻倍。这实际上会损害你的健康。因此,解决办法不是躲起来。而是要推动自己去探索并改进这些工具。
李飞飞
我完全同意David的观点。我认为我们讨论过的一些词汇值得特别强调。你提到了“能动性”这个词。我们讨论了协作与赋能。我想就是这样了。这就是任何技术的核心意义,包括像AI这种所谓的类神技术,它应当以人为本。那这意味着什么呢?以人为本仅仅是一个短语。对我而言,以人为本最简单却又最深刻的含义,实际上是赋能于人类:个人、社区和社会。
而这就是该技术的意义所在,正如David所提到的,这是一个变革的时代。变革的时代也可能是一个失去的时代。失去旧有的习惯,失去我们过去几十年所熟悉的舒适感,失去那种稳定感。但这也是一个充满机遇的时代。这是迎接下一个时代的机遇。这是我们通过努力让一切变得更好的机遇。
那么,你该如何跨越从困惑与失落时期到机遇时期的边界呢?作为个体,我们每个人都有责任去学习、去接纳、去提升技能、去保持理智。对这个机遇保持开放心态。这触及了每个人生旅程的核心,无论你是K-12学生还是职场专业人士。我们必须共同拥抱这一切。
Marina
没错,但就你提到的变革而言,它发生得如此迅速,比以往任何时候都快。你能以今天的AI为例,告诉我们它已经能完成哪些类型的任务了吗?什么是依然非常具有人性色彩的,以及未来一年会发生什么。那么它的发展速度有多快?
David
我认为在教育领域,它正在产生巨大的影响。我将分享最大的障碍。我们从过去60年的经验中得知,一个人最好的学习方式是一对一的指导。所以必须提出一个问题:为什么我们要坐在20人甚至300人的教室里?原因仅仅是成本。为世界上的每个人都提供一位Dr.Li是太昂贵了,尽管那会非常棒。那将是极好的。
因此,借助AI,根据过去几年所做的工作,我们现在知道AI可以提供那种几乎与之媲美的个人化指导水平。这比在教室里学习或仅仅阅读相关书籍要好得多。那么问题来了,现在你能够提供同样的教育了,那种你曾经每年花费12000美元上的小学,或者本科时每年花费80000美元的学校所提供的教育,现在你只需大约100美元就能提供。因此必须提出一个问题:我们何时才能看到自身教育体系发生这种变革?
我认为最大的障碍并非技术本身。最大的障碍是那些恐惧变革的教育机构。但我认为未来会发生的是,我们已知如果利用AI进行学习,你能够以缩减60%的时间学到同样的知识。所以,如果一所学校声称要禁止AI,禁止孩子们使用AI,而另一所学校允许他们在结构化的方式下使用AI,那么使用AI的那些孩子将会远远领先于不使用AI的孩子。
当然,这并不能替代一切。你仍然需要面对面的互动和所有的社会纽带,但我认为你将开始看到孩子之间的分化,其中拥抱AI的群体学习速度将远超其他人。而且我认为这是一件坏事。所以我认为这并非一个技术问题,但我认为未来会发生的是,那些在10年内无法适应的学校终将难以为继。它们将不复存在,因为它们会远远落后于时代。
重塑教育与职场模型
李飞飞
同时,由于AI的推动,世界将发生剧烈变革。正如David所言,在某种程度上,它们本就应该进行变革。我也坚决认为,每一所学校、每一间教室都应该拥抱AI。每一名学生都应该拥抱AI。但我也相信,我们负有共同的责任,将他们——特别是教师和教育管理者——纳入关于AI的探讨中,并向他们展示一条既能保持教育目标又切实可行的路径。
教育的目标并非工具。教育的目标并非闭卷或开卷考试。教育的目标并非标准化的考试分数。教育的目标是塑造人。从而使每个人都能成为社区和社会中有意义的贡献者,并过上有意义的生活。而AI不应该剥夺任何这些基本要素。相反,AI应该有助于更好、更有效地实现这一目标。
目前这种关于AI是否用于作弊的极化且过度简化的二元论讨论,其实是在回避核心问题。闭卷考试、禁用AI,这并不是我们应有的发展方向。我们应该关注如何赋能教师,如何赋能学生,如何重构课堂,如何重新思考考试、标准化测试、大学录取以及资源分配,因为这是一种能够降低成本和门槛的技术。所以,我们要思考如何为内城区、农村地区以及全球范围内的全球南方国家提供资源。这些关于AI与教育的议题确实非常重要,但我们却错失了对这些话题的探讨。
Marina
我认为,当我们思考孩子们的教育时,去构想他们未来将要面对的工作环境,会有助于推动这种讨论。在我成长的年代,职场环境意味着进入一家大公司,做着固定的工作。因此,为了实现这一目标,你需要研究这些、那个以及其他相关内容。你能为我描绘一下10年后的职场或公司是什么样子的吗?它看起来是什么样的?人们应该为之做些什么准备?
李飞飞
能动性。我认为AI将赋予人们更大的能动性。因此,我认为未来的工作将很大程度上依赖于那些知道如何使用这些工具的人。以非常高效的方式。让我给你举一个具体的例子。
在过去的20年里,硅谷最令人向往的工作之一就是产品经理。要知道,关于产品经理这一职位性质的转变,现在有很多讨论。在10年前,一个相当标准的产品经理的工作更多是充当用户、市场和工程师之间的纽带。他们更像是指挥家。他们不必亲自编写代码。他们通常也不是软件工程师出身。所以,如果他们想要一个原型,他们会找设计师或软件工程师制作,拿到原型后再发给用户,倾听用户的意见并总结反馈。
在企业中,这种产品管理的生命周期通常需要耗费数月时间。如今,如果你审视产品经理这份工作,会发现很多公司都在尝试不同的模式,但确实存在一些根本性的变化。现在很多产品经理自己就开始写代码了。他们不必再等待团队成员提供原型。他们可以使用AI来辅助设计一些非常简单的内容并编写代码。因此,这一部分缩短了生命周期。这并不意味着我们应该裁掉设计师或软件工程师,但这确实节省了时间。从而使软件工程师and设计师能够从事更复杂的工作。
此外,在用户端,情况也在发生转变。AI实际上可以模拟用户行为。并且有更加高效的方式来触达用户,与用户形成闭环。所以我关注那些年轻的产品经理,在招聘时,我会寻找那些能够顺应变革浪潮的人。我不会寻找那些还在谈论五年前教科书式工作流程的产品经理。
所以对于公司的未来,我有许多想象,具体取决于所处的行业,无论是医疗保健、教育还是其他任何领域。但我认为,在AI等强大工具的加持下,我们的劳动力将获得更大的赋能,甚至可以实现极大程度的赋能。因此,个人的主观能动性、创造力,以及人们能力边界的界限,都将变得更加模糊并随之降低。对我而言,这将从根本上改变美国企业界的结构,当今的每一位学生都应该设想自己想要在这种新结构中扮演什么样的角色。
杠铃效应:专家与通才的博弈
Marina
David
关于这一点我的假设是会出现一种杠铃效应,这正是我们在Masterclass所观察到的,即其中一群人正在成为专家。以前的情况是,我记得在学校时,我被告知要选择一个领域并深入钻研,那就是我建立长期职业生涯的方式。我认为这种模式正在瓦解,除非你处于顶尖行列,即你确实是行业内最顶尖的专家。
李飞飞
如果我是一名文案撰稿人,如果我只是水平一般,那么现在任何使用LLM的人都能做得相当不错。
David
但如果你是世界上最顶尖的人,或者处于前百分之一的位置,我就无法在这一点上胜过你。所以我们看到,首先,涌现出了一批在特定领域非常出色的专家。我认为这延伸到了顶级。大量的工艺领域。
我们看到的另一种角色是高能动性的通才,他们能够出色地完成许多不同的事情,并且在判断力和能动性方面拥有非常优秀的技能。当你看到这些人进行互动时,场面非常精彩,因为他们会与在各自领域处于前百分之一的专家进行交流。他们会说,哇,我可做不到那样。所以我的猜测是,这正呈现出一种分化,即专业人士与那些能够出色完成多种任务的人群之间的分化。
李飞飞
这很有趣。我也同意你的看法。我认为无论是站在专业人士的一边,还是通用型人才的一边,你们都拥有自主权。
David
正是如此。
李飞飞
而且你们都应该能够以独特、具有创造力且深刻的方式来使用工具,我已经看到这种情况了,不是吗?例如,设计师们带来了极其丰富的人类创造力,但我发现其中一些人使用各种AI工具的方式,是我个人无法想象的。所以我知道,这就是他们精湛技艺的体现。
还有“创业型”这个词,在硅谷,它几乎就像是在说:“我要创办一家在Delaware注册的初创公司”,这就是“创业者”这个标签的含义。我不同意这一点。我认为“创业型”这个词在很大程度上是“主体性”的同义词。是的。这并不重要。你可以是一名医生,一名专科医生。你可以是一名K-12教师。但主体性才是关键。
面对如此认知先进的技术,要勇敢。保持你的人类主体性,去驾驭那项技术,使用那项技术,熟悉那项技术。不要害怕。不要回避这一点,因为历史的车轮正朝着未来滚滚向前。而且我认为每个人,不一定非得是硅谷的创始人,每个人都可以在自己的手艺或任何他们想做的事情上展现出创业精神。
AI在生活中的应用与空间智能
Marina
你提到了很多工具,比如使用工具,多使用工具。你能给我举几个对你的工作产生变革性影响的工具例子吗?
李飞飞
显然,各种各样的工具,从ChatGPT到Gemini再到Claude,我都在以许多不同的方式使用它们。它们拥有非常多的功能,从帮助我研究一些深奥的课题到进行对话,应有尽有。
这里有一个有趣的例子。我负责处理家里的洗衣工作。所以每个周末,我都得洗上一大堆又一大堆的衣服。过去这通常是我听有声读物的时间,但有时我只是听有声读物会感到无聊。就在几个月前,我意识到自己可以在折叠衣服的时候与AI进行深度话题的交流。这真的非常有趣。不知为何,这让我在折衣服时更有动力了,因为我可以利用这段属于我自己的时间,通过AI学习任何我想学的东西。
当然,软件工程领域也已经发生了彻底的变革。此外,在艺术和设计领域,比如World Labs,我们正在开发模型来帮助创作者构想3D世界等等。所以,我们也看到了创意领域正在发生的变化。这再次成为了一个极具争议的领域,因为一些公司将AI创作工具定位为替代品。我对此类定位深表抗议。我认为人类的创造力,即便仅就视觉层面而言,也是极其广阔的;而视觉设计本身,就与我们的情感智能、我们所讲述的故事以及每位创作者所秉持的价值观深度交织在一起。我坚信AI是辅助他们的强大工具,旨在激发并表达他们的创造力,而不是去取代它。
David
完全同意。你觉得AI如果不具备空间智能,就永远无法变得真正聪明吗?
李飞飞
是的。这就是我目前在World Labs所从事的工作。那么什么是空间智能?空间智能是一个涵盖了人类在诸如当前这种三维环境中所展现出的多种能力的术语。如果我们观察运动,我们将其称为四维环境。我们可以理解正在发生的事情。我看到了人,看到了设备,看到了这个美丽的家。这就是空间智能中的理解部分。
我们能够进行推理。如果我想去冰箱拿一瓶水,我必须对空间进行推理,推理出我可以走上楼梯,我可以识别出冰箱,我还要推理我的动作,这就是推理。这是空间智能的另一个组成部分。空间智能的第三个部分是生成,即在我的脑海中,即使我没有看到你的客厅,我实际上也能构想出那间客厅的样子。如果我是一位更优秀的艺术家,我实际上可以生成大量的视觉二维、三维或四维视觉制品和作品。所以人类可以生成大量的空间。
第四个,也是同样重要的一部分,视觉智能是交互性,即我如何专注于与空间进行互动,比如折叠衣物,那是我最近周末最喜欢的活动。那具有深度的空间性。你如何折叠每一件衣物,以及你如何将它们挂在衣橱里等等,这都是高度交互性的。所以空间智能就是这四件事:理解、推理、生成和交互。
我们正在为此努力。我们已经取得了巨大的进步。我说的是作为一个集体,今天你使用比如nanobanana或者GPT image,这些工具确实可以帮助你生成大量的二维图像。它们甚至可以为你解释花园里那些未知的花卉是什么。这种理解能力已经相当先进了。它能够帮助你进行推理。现在我们实际上已经可以在AI工具中绘制图形了。目前的生成技术中,二维领域的产品已经比较成熟,而World Labs所做的是三维领域的工作。三维对于机器人交互以及实现真正可控的创造力至关重要,这正是我们所关注的领域。我们正在致力于此。
Marina
它是独立于LLMs之外的吗?LLMs是否存在局限性,然后需要world models来介入?
李飞飞
既是也不是。我认为它们是互补的。你可以以人类为例,正如你刚才所说,将篮球投入篮筐。首先,那是一个非常迅速的动作,人们不会坐在那里思考并进行内心对话。但我确实认为,即使是那个动作本身,也是一个高度复杂的智能时刻,其中涉及语言推理,因为作为一名运动员,你可能敏锐地意识到投中或投失这一球意味着什么,无论是对比赛还是对当前局势而言,其中部分过程可能正以语言方式进行。
但是观察球场、观察其他球员并瞄准球。那是非常深层的空间感知。而调整你的身体,比如知道如何做出那个动作,则是非常深层的生理过程。我们在生活中所做的许多事情,实际上都是语言智能、空间智能和身体智能的混合体。所以对我而言,它们是非常互补的。它们协同工作。
我深信空间智能是其中的重要组成部分。演化经历了5亿多年才使空间智能趋于成熟。而语言智能所耗费的时间要短得多。因此,这是一种动物和人类所具备的极其深奥、古老且根本性的智能能力。
通往通用人工智能的边界
Marina
那么我们距离完全理解它,即达到100%的程度还有多远?
李飞飞
作为一名科学家,我永远不知道什么是100%,因为科学本身就是在不断拓展未知的边界。如果目标是人类智能,挑战在于,我们甚至不知道人类智能的极限在哪里,我们永远无法预知。
但如果你考虑到人类的日常能力,那些平均水平的能力。比如煎蛋卷、叠衣服、打篮球。我们离那还有多远?我们还没达到那个水平。但这需要100年吗?我不这么认为。我的目标是在我有生之年实现这一目标。我认为很多人都在为此努力。所以这设定了一个界限,我不认为这需要100年。也许甚至不需要50年,但也不会只是一年。
Marina
那么,你的估计是什么?李飞飞博士何时会停止在周日折叠衣物?还需要多少年?
李飞飞
昨天吗?就像我说过的,我不知道。Laundry Fote本身也涉及物理实体化。所以这同时也涉及传感器技术和硬件技术。所以这会稍微复杂一些。但同样,我希望能在我们有生之年实现。
Marina
我也是。作为一名母亲,我心怀期待。
David
我知道由于各种原因,你可能会避开这个词。但我的假设是,除非我们实现空间智能,否则根本无法接近所谓的AGI,甚至连边都摸不到。因为那是关于感知人类,关于在现实世界中进行交互。
李飞飞
是的。听着,我并不打算去探究这个词的流行度。只是作为一名学者,学术界的这个领域一直以来就被称为人工智能。这里G的含义在科学上并不十分明确。不过无所谓了。那只是个词而已。我想那只是个绰号。我同意你的观点,David。我认为AI或智能是一个复杂的概念。我认为如果没有空间智能,AI的蓝图将是不完整的。
培养自主性:从追逐赞美到独立思考
Marina
所以,我们今天多次提到了主体性。David,作为一家教育公司的负责人,对于那些想要培养自己主体性的人,你有什么建议?你甚至该如何教导孩子们拥有主体性呢?
David
这是一个非常好的问题。我深入研究过相关课题,目前的进展还不够成熟。所以我们并不完全清楚该如何实现这一点。我们有一些假设;如果我们把主体性拆解为各个组成部分,那么就能从中找到线索。
例如,我们知道,能够感到安全从而真正去承担风险是其中的一个重要组成部分。我们知道,能够面对失败并从中学习是主体性的重要部分。我们知道,跌倒后重新站起来的韧性也是其中非常重要的一部分。我们知道,对世界保持好奇心也是其中极为重要的一部分。此外,还有一些根本性的需求,比如想要解决某个问题或给某人留下深刻印象——尽管这未必是最好的特质,但当你有解决问题或应对挑战的需求时,这些驱动力会促使你努力去寻找主体性。我认为我所见过的研究更多侧重于从定性层面探讨驱动主体性的因素。
人们会说的话。而且对此也有一些证据。这只是力度不够。你想要让自己置身于那些对你而言既困难又新奇的环境中。所以你想要获得这些,而这始于童年,你想要处在一个能够为你提供爱、食物、睡眠和心理健康等基本保障的世界里。我们也知道你可以通过激励手段来促进这一点。所以我认为,我们曾经做过一些事情,如果你做了这件事,就能获得额外的薪酬。薪酬确实会推动你去做这些事情。
但就我个人的经验而言,自主性本身,即社会生活中的很大一部分,是我们被教导要去寻求赞美。如果你回想一下童年时期,我们会得到父母的表扬。学校里有来自老师的表扬,工作中则有来自老板的表扬。而拥有自主权,正如你所提到的,那种创业精神不仅适用于创业者,它几乎是对那种被寻求表扬的社会价值观或推力的反叛。
我记得当我创办Masterclass时,每个人都告诉我这是一种对那种被寻求表扬的社会价值观或推力的反叛:一个可能的好主意和一个坏主意。这对我来说真的很难,因为我大半辈子都在寻求表扬。但后来我必须意识到并做出改变的是,如果你有一个大家都认为是好主意的主意,那它可能并不是一个好主意。实际上,为了拥有自主权并成为一名创业者,你必须去追寻那些被别人认为是不可能的事情。所以现在作为一名创业者,当有人说某件事是不可能的时候,我会想,那正是我要深入研究的事情,所以我认为这是一种根本性的转变。这源于很多因素,我真希望如果我教会你这四件事,你就立刻能拥有高能动性,但事情比这复杂得多。
李飞飞
完全如此。
Marina
我觉得你总结得非常好。你有这样一种特质,我觉得这是能动性中独立思考的一个方面。你写过那篇Substack文章,教导人们关掉一切干扰、做出自己的决策并产生自己的思想。但作为一个从小被教导要追逐赞美的人,这真的太可怕了。因为如果你的观点与大多数朋友相左,当你表达出这种观点而他们不同意你时,该如何锻炼这种心智肌肉呢?因为我觉得这对能动性也至关重要。
李飞飞
嗯,这个问题触及了家庭价值观的核心。至于我个人如何为自己、为我的孩子和学生训练这种心智肌肉,正如David所说的一切。那就是鼓励,简单来说就是不要懒惰。我知道我们这一代人常抱怨互联网太多、社交媒体太多,还有AI也太多了。实际上,我持有相反的观点。
我认为我们这一代以及下一代人,我其实还有点羡慕他们,因为我觉得他们的世界更加多元;如果你习惯了使用Twitter或者是X,习惯了使用Instagram或者是TikTok,你就会开始意识到这个世界充满了各种声音。而不是像世界更小、更狭窄时那样,只有某一位老师或某一位家长的声音。因此,我们的新一代年轻人天生就处在一个充满各种声音、各种观点和各种可能性的世界中。这可能会让人感到畏惧。
如果引导不当,这确实会带来问题,并不是说社交媒体等各方面不存在诸多弊端。但这也可以成为一个契机,因为你可以利用这种现实来提醒年轻一代:看,真正重要的是你自己的声音,因为这里没有权威的声音,也不是极少数人掌握着话语权,这可以用来鼓励年轻一代重新审视他们所处的这个世纪。生活在其中。这是一个拥有许多能赋予你自主权工具的世纪。如果你相信这一点,那么在这个世纪里,你的声音比任何其他人的声音都更重要。这与我们那一代人非常不同。
给AI探索者的建议
Marina
你有什么类似这样的建议吗?比如给那些对AI好奇、刚刚入门的人提供一些解锁思路?
李飞飞
首先,如果这仅限于我的员工,我是说,你看,我可能是在工作,如果他们不使用它的话。我知道的AI知识比我所做的还要多。
这对于像World Labs这样深耕AI技术的初创公司来说只是一个情绪化的问题。但我确实想借此机会,与那些更广泛的公众,特别是当下这一代已经步入职场的人们谈谈。你们是教师、护士、会计师,无论你们从事什么职业。正如我们之前所说,公众舆论变得极度两极分化,除了焦虑之外,人们真的不知道该如何接触AI。
我确实想鼓励那些有这种感觉的人,去寻找一个孩子,无论是你自己的孩子,还是你的侄子或侄女,他们通常都在25岁以下。几乎他们所有人都在以某种方式使用AI。保持好奇心,让他们为你展示他们是如何使用AI的。不要将其视为一种纯粹的技术,而要对他们即将身处、你的孩子即将身处、你的孙辈即将身处、你的学生即将身处的未来世界保持好奇,试着去想象你终将踏入那个世界。他们可以成为你的向导。
是的。不要担心自己从未学习过计算机科学,也不要纠结于不知道该打开哪个应用程序。就让你生活中那些你已经信任或关系亲近的年轻人,利用一个周末或一段时间,为你展示这个世界并没有那么可怕,只要你真正了解它,它其实可以赋予你更强大的能力。如果你确实觉得它很麻烦,如果你确实觉得它不够完美,那么通过了解它,通过了解这些问题所在,你的声音就能被更好地听见。绝对是这样。没错。
Marina
我认为这是一个很棒的结尾。非常感谢你。保持好奇心,培养你的自主意识,并为此努力。非常感谢你的投入和你的工作。谢谢。
