本文整理自2026智源大会现场信息，展现当前AI仍在加速发展，正从数字世界向物理世界延伸，从“会聊天”转向“会干活”。 ## 1. Scaling Law未触顶，AI开启自进化趋势此前业界因高质量互联网数据消耗，担忧Scaling Law即将触顶，多位参会嘉宾否定了该说法。嘉宾指出Scaling Law未失效，仅变得更多样化，目前在大语言模型、多模态模型中仍稳定发挥作用，持续推高模型性能。随着AI Coding逐渐成熟、Agent加速落地，AI自进化趋势明显，已经可以从写代码升级到自行完成产品迭代更新，海内外已将该模式常态化。 ## 2. 世界模型成为大模型下一核心战场当前世界模型仍处于发展初期，技术路线未收敛，数据选择等核心问题仍悬而未决，智源研究院预判该领域至少需要3-5年的探索时间。智源研究院将现有世界模型分为四类，并正在探索“全模态潜空间”这第五类路径，同时研发全球首个通用世界基座模型悟界·Physis-v0.1，训练完成后将开源，下半年会公布阶段性进展。 ## 3. 智能体从可用迈向好用，进入落地加速阶段 Agent已经进入可用阶段，今年在医疗、科研、会议服务等多个垂直领域已经落地了代表性产品，能力较去年明显提升，可主动完成更复杂的任务。当前智能体仍有诸多待优化问题，围绕智能体搭建的工程化框架Harness决定了智能体能力的上限，需打磨细节做好问题澄清、验证与反馈，才能提升智能体执行效果。 ## 4. 软硬件协同支撑AI落地实体场景本次智源大会展台中，头部国产AI芯片厂商占据半壁江山，软硬件协同成为AI从可用走向好用、从数字走进物理世界的关键支撑。

2026-06-13 10:40

颤抖吧人类，AI仍在加速狂奔

光锥智能

速览

本文来自微信公众号：光锥智能，作者：关注前沿科技的

没错儿，AI仍然在加速狂奔。

2016年，深度学习爆发了仅一年，就几乎停滞不前。2026年，爆发了4年的大模型依然没有触及上限。

在智源大会2026现场，光锥智能看到，从模型、软硬件到产品，一切都在为了AI从数字世界“跑”进物理世界努力。

一方面，Scaling Law稳定发挥、推动大语言模型和多模态模型依然在发展发展，AI行业已经进入了追逐世界模型的阶段。只是当前技术路线、数据等问题悬而未决，还需要可能至少3-5年时间探索。

另一方面，Agent取得的突破加速了AI在现实场景中的落地。随着Agent达到了可用阶段，行业正在推进其在医疗、会议等场景的应用。为了让Agent从可用走向好用，软硬件协同也成了关键。在智源大会的展台现场，芯片厂商占据了“半壁江山”。几乎头部的国产AI芯片悉数到场。

“我们正站在一个新的历史临界点上。人工智能不再只是改造某个行业的工具，而是正在成为重构世界的底层力量。AI Coding、自主智能体、模型自进化，正在打开AI、创造AI的可能性。世界模型、具身智能和机器人，则让智能从数字世界延伸到物理世界。”智源研究院院长王仲远说。

这场底层力量重构'的浪潮里，到底在发生什么？

智源大会的第一天，在场嘉宾们给出了这个答案：AI正在从“会聊天”走向“会干活”。Scaling Law还在继续，技术方向尚未收敛的世界模型成为下一阶段的重心，而智能体已经从可用开始走向好用，也有诸多问题等待优化。

AI不仅技术没到天花板

还学会了自我进化

过去一年，随着高质量互联网文本数据被消耗殆尽，行业内弥漫着一种“Scaling Law（缩放定律）即将触顶”的悲观情绪。

在智源大会的多场论坛中，“Scaling Law的红利是否缩小”频繁被提及，多位嘉宾均否定了这一说法。

“我还是比较坚信Scaling还远没有到尽头。”银河通用创始人兼CTO王鹤说，“今天回过头来看，Scaling Law没有失效，只是它变得更加多样化。”

在一系列新发布的大语言模型上，Scaling仍然在继续发挥作用。以Anthropic最近发布的Fable 5分析，小米罗福莉表示，这个模型本身就是科学推进Scaling的产物。它是大模型在参数规模、合成数据和强化学习三个维度结合得到的扩展成果。

“我们猜测，Fable 5本身的参数规模应该是目前最大（规模）的开源模型的几倍，其次在Test-Time Scanning（推理时扩展）或强化学习上也投入了强大算力。此外，由人和Agent产生的合成数据，让数据规模达到了新量级。”罗福莉说。

于多模态领域，Scaling带来的模型性能提升同样效果显著。生数科技创始人兼首席科学家朱军表示，数据质量、模型尺寸还有大规模训练，都会给模型带来提升。在基础模型能力提升的基础上，模型学习物理规律、3D场景的理解也会更加高效。

Scaling持续生效的同时，伴随AI Coding逐渐成熟、Agent加速落地，AI自进化趋势明显，从写代码升级到自行完成产品的迭代更新。

“人类大量数字世界底层就是通过代码构成的，AI Coding有了真正实质上的进步并且成为主流，意味着所有在数字世界的东西，AI都有可能逐步接管。”王仲远说。

海内外，用AI完成产品更新已经成为常态。

“如果说模型决定了智能体的能力，那么Harness就决定了智能体能力的上限。”李景秋说。“它的难点在于需要在模型基础上进一步做好问题的澄清、验证和反馈。”

比如，如果只靠模型理解问题，它难免会有局限性。Harness需要做的就是完善和丰富用户简单的一句话指令，让模型能够更好地理解需求，这里面需要Harness发挥意图理解能力，并在拿到任务后，设计好接下来的任务流程，再调度模型执行。这个过程中可能需要结合人工干预和纠偏，再在任务完成前做好检查。

世界模型

大模型的下一个关键战场

沿着数字世界的边界向外突围，世界模型成为了大模型的下一个关键战场。

“当前还没有哪一个世界模型真正能够让人感觉特别惊艳，解决真实物理世界的各种问题。”王仲远说。

对于处在发展初期的世界模型来说，针对世界模型的技术，行业目前没有完全达成共识。且在技术路线尚未收敛的情况下，还有一系列亟待解决的问题。以数据为例，王仲远举例，到底是需要视频数据、仿真数据还是真实物理世界的数据，大家还没有找到方法路径。

以银河通用为例，王鹤在现场介绍了他们对合成数据的应用。

“在WAM（World Action Model，即世界动作模型）范式尚未出现前，我们在VLA范式里，先用合成数据，针对抓取这件事做了大量的尝试。”王鹤说，“我们用仿真数据10亿帧证明了：只要你把数据Scale到这个程度，你就可以完全实现zero-shot（零样本学习），在真实世界随便给我一个东西，就能搞定抓取。”

针对世界模型的发展情况，智源研究院预判“至少还需要好几年时间”，未来三到五年都会是世界模型持续演进和迭代的阶段。

几年内，行业里出现了多种不同技术路线的世界模型，且发展各有千秋。

以多模态世界模型为例，朱军表示，视频模型和世界模型关系紧密，因为世界模型需要具备看懂并理解状态、预测、行动三大能力。而在当前能够接触到的训练数据中，和世界模型最相关的就是视频数据。

在各类技术路线分化、行业尚未形成共识的情况下，智源研究院将世界模型分为四类：

第一类是以语言为中心的世界模型，把其它模态、其它能力映射到语言空间，包括大语言模型、VLM、VLA等；

第二类是以像素为中心的世界模型，视频生成本质上是预测下一个画面帧，但视频生成模型不等于世界模型，它和世界模型是相关的，今年可能会非常火的World Action Model（WAM）都是以像素为中心演进；

第三类是以三维结构为中心的世界模型，包括3D重建就是单纯的三维世界；

第四类是以视觉表征为轴心的世界模型。

目前，智源研究院正在探索“第五类”路径——以语言为中心和以视觉表征为中心的融合，即潜空间表征，相当于把文本、图像等一系列信息压缩到向量空间中，以表征各种真实物理世界的状态。

“将来统一的潜空间建模不仅仅是视觉空间，而是全模态潜空间，很有可能是世界模型真正下一个可能的路径。”王仲远说。

智源研究院在大会上介绍了正在研发中的世界模型——悟界·Physis-v0.1版本，它以物理空间建模，实现下一个物理状态的预测为中心。它的定位是全球首个通用世界基座模型，强调“物理正确、动作因果可溯、长时序一致、通用泛化”四项关键能力。

目前，该模型还在训练阶段，下半年智源将持续分享进展，在训练完成以后开源模型。

从“可用”迈向“好用”

智能体还有更多关要闯

模型侧，世界模型的进展推动物理AI的实现；产品侧，Agent（智能体）成为AI走进大众生活的关键落地产品。

从被称为“智能体元年”的2025年开始，Agent已经出现了一部分让人印象深刻的产品，有了爆发的苗头出现，但“龙虾们”今年的泼天热度，还是出乎意料。

比起去年智能体还处在执行状态，今年的智能体显然变得更主动、更会办事儿，可以帮助用户主动执行更复杂的任务。

今年的智源大会上，智源研究院也发布了四款偏向垂类的智能体：全球首个面向心脏磁共振的辅助诊断智能体BAAI Cardiac Agent，通过融合多模态能力和医生专业知识，辅助医生完成决策；自主研究智能体AREX应用于科研领域；帮助用户实时听会、捕捉要点的智能体SoulAgent；以及面向有害蛋白获取的风险发现智能体。

其中，以听会智能体为例，光锥智能测试了它总结不同会议内容的能力。SoulAgent确实对会议内容做出了简单的总结。虽然不及纪要完整，但核心观点无误。对于这种分论坛时间出现重合的情况比较适合。

不过，当前智能体在技术方面还存在诸多亟待进一步优化的问题。南洋理工大学校长讲席教授安洋提及，要维持智能体能力继续提升，目前最重要的还是和上下文工程相关的部分，比如Memory（记忆）、编排等等。

智能体分论坛现场，去年鲜少被关注、今年热度颇高的Harness（直译为马挽具，指围绕智能体搭建的一整套工程化框架或环境）成为了现场提及的高频关键词之一。

简而言之，如同一个真人助理，其中的每一步细节都需要产品针对Harness进行打磨，才能进一步提升Agent的执行效果。

当前，Agent还处在初期发展阶段，能够预见的是，这个行业的进步空间很大，无论是模型能力的提升，还是工程细节的夯实，都将为Agent办事能力进一步添砖加瓦。

AI原生产品日报频道: 前沿科技

光锥智能

前沿科技，数智经济

认证作者

已在虎嗅发表 159 篇文章

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定