本文来自微信公众号: 深响 ,作者:深响
2026年,具身智能迎来新一轮空前热潮。
春晚舞台上宇树“人机共武”、魔法原子“实景演出”相继出圈,荣耀“闪电”则在北京亦庄人形机器人半程马拉松刷新人类男子半马世界纪录,公众热情被一再点燃。资本侧同样反应积极,中国市场上估值超过100亿人民币的具身智能公司已超过20家。技术也在持续突破:从VLA到世界模型的迭代、到灵巧手的进展,具身智能逐步从Demo(演示)走向Deployment(实际部署)。
但不得不说的是,热闹背后,一个核心难题始终横亘在行业面前:高质量真机数据极度匮乏。
中国信通院报告明确指出,具身智能是一个“由数据驱动的智能系统”。对于具身智能而言,数据是决定行业发展上限的关键变量。如果缺乏高质量数据,机器人就无法实现精准操作和场景泛化。
国家发改委相关新闻发言人也在最近的发布会上表示,下一步将加快具身智能训练基础设施建设,更好地支撑数据采集和“大小脑”模型训练,以提升具身智能在不同场景的通用能力。
而且不同于大语言模型能规模化爬取文本数据,具身智能所需的描述人类运动、精细操作的真实数据少且难得。目前,全球文本数据早已达到万亿token级别,但高质量真机操作数据仍停留在百万小时规模。
具身智能的数据困局与
「不可能三角」
具身智能的数据困局由来已久,这是行业运行惯性、早期技术局限等一系列因素共同造成的。
目前,业内获取数据的方式主要有四种。
第一种是仿真数据,即在模拟环境中生成机器人操作数据。这种方式最大问题是“虚实鸿沟”,仿真环境就算再精细,也很难准确还原现实世界的各种物理细节,比如物体之间的摩擦力、传感器运行时的噪声等。这些细节误差,可能导致机器人无法适应真实工作环境。
第二种是人类行为数据,主要来源于视频,让机器人学习人类的操作动作。但人类的身体结构和机器人的机械结构存在差异,这就形成了“构型鸿沟”:人类的动作很难直接映射到机器人身上,比如手指灵活度、肢体协调性,数据实用性大打折扣。
第三种是人类示教数据,通过手持设备、动捕系统,或者拖动机械臂进行操作示教。这种方式更贴近机器人运动习性,但依然无法完全解决“构型鸿沟”,而且采集效率低,很难实现规模化。
第四种是真机遥操数据,由人类远程控制机器人完成任务,同时记录整个操作过程。这种方式优缺点都很明显:优势是更接近真实物理世界,获得更高质量、多模态、可泛化的数据;短板在于采集成本高。
市面上品质较高的真机遥操机器人售价普遍偏高,按照行业通用的一年使用期计算、加上各类杂项成本,单任务每次的数据成本大概在3-5元,这还没算大量设备、场地、操作人员开销。

面对数据困局,巨头与学术界的探索同样未能提供公用解法:
比如特斯拉采用的封闭生态模式,数据质量够硬,但仅供自身使用;斯坦福大学研发团队推出的ALOHA方案,借助远程操控系统,由用户同时控制底座和两个机器手臂来完成更多样的任务,数据精细,只可惜更偏向实验室场景,难以满足工业级需求;国内的本体厂商则大多采用重资产模式,自搭场地、系统,投入大、效率偏低。
上述种种数采模式的优劣,业内争议不断,但无论哪种路线,似乎都无法突破具身智能数据的“不可能三角”:高质、高效、高性价比。
比如受力监测,业内通常会给每个关节配备谐波减速器和六维力传感器,就像在机器人身上安装一个高精度“电子秤”,靠物理手段监测不同运动状态下的受力变化,数据极尽精细,但硬件成本很高。
此前业内很多公司都存在重复定位精度不足、不同设备采集数据不兼容、过于追求单一维度的精确度等问题。好不容易采集到数据,要么动作、受力存在偏差,要么精度达标但传感器数据不同步、信息残缺,以至于数据看起来丰富,但无法准确反映真实操作场景。
更重要的是,在传统操作思路里,数据采集、上传、清洗、标注、模型训练等环节容易出现脱节,低质量数据不仅无法提高训练质量,还会成为“负资产”。
从卷模型到卷数据
打破具身智能能力上限
随着具身智能逐步告别概念炒作和样机演示,进入规模化量产、商业化落地的关键阶段,行业也从“卷模型”转向“卷数据”。竞争重心正发生彻底改变,决定系统能力上限的,不再只是模型本身,而是它是否拥有足够丰富的真实场景数据。
这种产业演进轨迹,与自动驾驶行业高度重合。正如特斯拉的核心壁垒从来不只是自动驾驶算法,还有其庞大的车辆部署规模,持续采集海量、真实路况数据。这些数据,才是调优算法应对极端天气、突发路况等长尾问题的关键。
具身智能正走向类似的路径:机器人只有走进各种复杂环境,持续与真实世界交互,才能获得足够的数据。
未来,真正成熟的机器人,不会只存在于实验室和演示视频里,它们会走进餐厅、仓库、医院、工厂、商场,持续与真实世界发生交互;它们也会像今天的联网汽车一样,在工作过程中不断学习、不断进化;而每一次抓取、移动、任务失败与修正,都会成为下一轮模型迭代的养分。
届时,机器人产业真正重要的,可能不再是“制造机器人”,而是如何建立一张持续连接物理世界的数据网络。谁能率先建立数据基础设施,谁就更有机会找到这张数据网络的入口。
