当前生成式AI不理解真实物理因果,本文指出物理AI发展核心是世界模型,原生赛道玩家更可能取得突破。 ## 1. 当前生成式AI的核心局限 当前生成式AI仅靠数据训练按概率生成结果,并不理解真实物理世界的物理因果,无法完成真正的推理与规划,这是它走向真实场景应用的核心短板。 图灵奖得主杨立昆明确提出,理解物理世界、具备推理规划能力才是智能行为的核心特征,当前AI距此还有很大差距。 ## 2. 物理AI的核心基座是世界模型 杨立昆、李飞飞等顶尖AI学者均认为,通用智能无法仅靠纯文本训练或大语言模型实现,AI必须通过感知互动学习物理世界规律。 世界模型能让AI通过观察互动学习,在内部模拟预测物理事件,它是物理AI时代的基座,如同大语言模型是生成式AI的基座一般,它压缩了物理世界的运行规律。 ## 3. 世界模型赛道发展现状 自2023年OpenAI发布Sora引爆世界模型概念后,该赛道发展加速:中国目前共有33家世界模型创业公司,85%成立于2023年后,累计融资超260亿元,海外谷歌、英伟达等巨头及多家创业团队也纷纷加码布局。 引爆概念的Sora已因精力不足、场景有限、资金短缺宣布停运,当前行业扎堆卷Coding,头部生成式AI公司缺乏世界模型原生布局。 ## 4. 世界模型突破更可能来自原生玩家 现有头部生成式AI公司的技术路线、盈利模式和商业规划都围绕生成式AI展开,不具备世界模型原生基因。 按照AI原生才能赢得未来的行业逻辑,从创立之初就聚焦AI与物理世界交互的原生世界模型公司,更可能在该赛道取得突破。
除了Coding,是时候多关注一下物理世界里的AI了
2026-06-24 20:02

除了Coding,是时候多关注一下物理世界里的AI了

本文来自微信公众号: 知危 ,编辑:大饼,作者:知危编辑部


前几天,知危让某国产文生图模型成一张“水杯倒了”的图片。拿到的结果“AI感”十足:一个表面凹凸不平的矮脚杯以一个“诡异”的姿态悬浮于桌面,杯子仅杯底与桌面接触,杯身却有点“似接触非接触”。杯中的水也以一种明显不符合杯中液位高度的状态汇成一注流出。


而这就是生成式AI的局限——它并不理解真实的物理因果,只是靠庞大的数据训练依据“概率”生成可能正确的结果,“假装懂物理”。


就像图灵奖得主杨立昆(Yann LeCun)在此前采访中提到的,“目前人工智能系统在很多方面还非常‘笨’,它们并不理解物理世界、也没有长期记忆,无法真正地进行推理或规划,而这些才是智能行为的关键特征。”


而如果希望AI能够真正识别、理解并作用于真实的物理世界,自主完成感知、交互、决策和执行,真正从互联网这个“虚拟世界”走向真实“物理世界”,从生成式AI走向物理AI,关键会是什么?



在杨立昆等科学家看来,首先可以排除的是纯文本训练。


杨立昆以婴儿认识物理世界过程为例,提到婴儿从刚刚出生到九个月的时候,并不具备重力、惯性等“物理直觉”。但是到九个月的时候,将一个放在平台上的小车推下去,小车如果悬浮在空中,九个月大的婴儿就会张大眼睛持续盯着看,表现出非常惊讶的样子。



这期间,婴儿并不是因为通读了《物理学入门》或者是被输入了大量文本作出的反应,而是通过感知和互动开始学习世界。进而,杨立昆提出真正的智能体需要一个“世界模型”,一个能让你通过观察与互动来学习,在‘脑里’里模拟事情、预测后果、想象未发生的事情的东西。


无独有偶。斯坦福大学知名教授、“AI教母”李飞飞也提到,真正的通用智能(AGI)无法仅靠语言模型实现,必须引入对物理世界的理解维度。“语言赋予了机器一种谈论世界的方式。世界模型,是机器最终得以理解、想象、推理并与世界互动的方式。”


不难看出,如果将“打造识别、理解、作用于现实世界的物理AI”比喻成“建盖一座摩天大楼”,那么摩天大楼的地基大概率就是“世界模型”。如同大语言模型是生成AI时代的基座,因为它压缩了人类文明的文本知识;那么世界模型是物理AI时代的基座模型,因为它压缩了物理世界的运行规律。



事实上,自2023年OpenAI Sora的发布引爆世界模型概念以来,该赛道发展就不断加速。从国内来看,据商业数据服务商IT桔子6月18日最新报告,中国共有33家世界模型创业公司,85%在2023年后成立,累计融资超260亿。海外巨头谷歌、英伟达、特斯拉等纷纷入局,World Labs、Meta JEPA等团队也正持续加码。


然而,理想虽丰满,现实却很骨感,做世界模型并不是一件容易坚持下去的事,比如引爆世界模型概念的Sora已经被OpenAI宣布全线停运了。



停运的理由也很简单:OpenAI暂时玩不转这件事儿。


他们没有足够的精力、没有足够多的场景,以及,他们没有足够的钱了。Anthropic带着Coding能力极强的Claude大杀四方,给包括OpenAI在内的所有AI公司都带来了巨大的压力:你必须去卷Coding,Coding就是一切,Coding就是未来。


所以或许,无论OpneAI也好、Anthropic也好、Meta也好,有没有那么一种可能:世界模型的突破不会在他们身上发生?


他们是生成式AI的簇拥者,他们的技术路线、盈利模式、商业规划,一直都是顺着生成式AI这条路来的,他们并没有世界模型的原生思想。


现在,行业总是讲AI-Native(AI原生)才会赢得未来,如果赞同这个逻辑,那么在世界模型这条路上,一定是“世界模型原生”也就是“从一开始就准备拿AI与物理世界做交互”的公司更容易赢得未来。


有好的技术架构,只是第一步,就像生成式AI一样,物理世界的AI也需要数据。


世界模型数据处理过程的简单示意|图源Nvidia

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定