万亿赛道从零起,人形机器人才是AI全村的希望?
2025-12-25 20:54

万亿赛道从零起,人形机器人才是AI全村的希望?

本文来自微信公众号: 海豚研究 ,作者:海豚君


站在25年OpenAI所代表的人工智能已有三年、产业风风火火投AI之际,海豚君通过最近几篇分析认为,26年AI关键是看算力降本、AI投入在软件和硬件两侧落地。且新硬件落地的机会才是真正的增量机会。


这边,特斯拉Optimus量产时间正越来越近,人形机器人有望成为承载AI智能的主要载体,并且深刻改变人类的交互和生产力方式。


基于此,海豚君启动了对机器人产业链的研究。本篇为第一篇,更多是从产业和基础研究视角,从上游开始,分析人形机器人在零部件生产和降本上的难度和机会,重点集中在以下几个问题:


一、人形机器人产业链是由哪些环节组成的?


二、这些硬件的产业化难点?


三、人形机器人硬件机会看什么?


以下是详细分析


一、人形机器人,生而AI


先说一个基础概念——人形机器人的两大核心特征,人的“形体”和人的“大脑”。因为是人形,基本对应有胳膊、腿、头,能直立行走等核心特征,基本要实现功能多样性。


而有人的“大脑”,核心是多模态感知能力、持续学习、和决策能力。人形+类人大脑合起来的目的就是通用性。简单来说,就是不能只会站着走路,要既会搬箱子,也会煮咖啡,既能搬运重物,也能进工厂打螺丝。


且这些技能不是事先设定好的程序,是可以在与各类外部信息的交互过程中,去持续学会的,而且在此基础上,可以独立作出决策。


要达到人形机器人所需的通用能力,算力、算法、数据、软硬耦合缺一不可。这两年的AI算法和GPU/ASIC腾飞,让算力和算法快速迭代有了可能,但硬件约束与过去截然不同。


手机智能和汽车智能化过程中,由于手机本身有通讯功能、汽车本身有交通功能,不用智能化就具备初始的规模化出货量。而人形机器人没有智能大脑,基本是人形铁块,出货必须以AI大脑为支撑,没有AI就无法有效出货。


这导致,人形机器人作为AI时代的全新品类,硬件本身是更大制约:


首先,人形机器人作为新兴品牌,硬件的要求与其他产业存在极大差异,一些硬件需要“无中生有”,从头做起。比如,人形机器人需要具备极其灵敏的“触觉”,但这块无论是触觉硬件还是触觉数据,基本空白。


其次,硬件成本要足够低,因为很大一部分目的是人力替代,外行所估计的2050年10亿人形机器人保有量,对应全球80亿总人口和50亿全球联网人口,没有买得起的价格,是无法完成类汽车的渗透率的。


二、产业链环节拆分:还在零部件“养成期”


按马斯克预期,单台机器人售价最好2万美金以内,和智能电动车的起价水平差不多。同样差不多地,是机器人高度复杂的产业链。


从产业链角度,可以大体上把行业分为上游、中游和下游。


1)上游:关注主机厂与上游供应商的合作模式


上游也就是中油玩家主机厂的各类供应商——执行器、传感器、编码器、控制器/驱动器,以及上述硬件的集成模块,同时也包括算力设施、算法、芯片等等。


这里想要强调的一点是,人形机器人涉及的硬件环节,与汽车产业,尤其是新能源汽车产业重合度较高。那么与新能源车产业链类似,人形机器人的主机厂(类比新能源车主机厂)与供应商的合作模式也是多样化的。


以特斯拉为例,它既可以直采零部件,自己做模组总成,并组装成品,也可以采购模组或总成(比如灵巧手、某些身体关机等)。但目前来看,与新能车一样,供应商提供模组和总成才是与机器人主机厂更主要的合作方式。


2)中游:车厂跨界+全新创业


主机厂厂商,可以直观理解为制造和销售人形机器人的公司。目前来看,主要人形机器人主机厂公司基本集中在中美两国。


从企业来看,除特斯拉、小鹏外,基本以创业公司为主。早期阶段,跨界选手不多,但带“资”进组,实力更强。


3)下游:终端需求,空间要看产品潜力


因当前通用能力不足,目前主要是科研、教育、参观导览等专用性场景。工业和家庭等通用场景潜力大,但目前产品不具备商业化落地条件。机器人通用化还要多久,是我们后续会探讨的问题,本篇重点通过拆解人形机器人的硬件环节来理解上游进展。


三、上游硬核拆解:到底谁是金矿?


马斯克曾豪言人形机器人是十万亿美金生意,最新透露公司Optimus人形机器人Gen 3会在26年一季度展示原型机,26年底启动量产(量产后初步年产量大约5万台),但配备的最终年产100万台的产线。Optimus第四代就会有1000万的产能,第五代可能就是五千万到1亿台产能。


如果最终特斯拉能攻克下来,机器人的空间很显然是比较大的。因此海豚君也进入本篇最为核心的上游硬件的价值链拆解。这里就以Optimus人形机器人为例。


从结构上,Optimus人形机器人可以大体分为头部、身体关节以及灵巧手。我们将特斯拉Optimus Gen2的主要部位、涉及到的零部件位置、以及我们估算的在单台人形机器人当中的成本列示在下图:



首先,从技术架构的角度,人形机器人可大致分为感知层、决策层和执行层三部分,与智能汽车类似,只是复杂度更高,具体来看:


1)感知层:主要包括各类传感器和大脑。


大脑主要指人工智能模型,这里先不进行探讨。传感器主要是视觉传感器、触觉传感器、力矩传感器、位置传感器等。


①视觉传感器:特斯拉采用纯2D视觉方案


什么是视觉传感器?简单可以理解为人类眼睛,主要用来光信号,实现环境感知、物体识别和导航定位。


什么方案?这里又有路线之争。特斯拉采用的是纯视觉方案,仅使用2D摄像头;但多数是多感知方案,包括使用3D相机(技术方案有结构光、TOF、双目等)、激光雷达,毫米波雷达等。


难在哪里?在人形机器人领域采用的视觉传感器与在消费电子、新能源车自动驾驶中采用的视觉传感器在技术路线上并无本质差别,主要是在性能上对动态性、实时性、集成化和低功耗方面要求较高。


目前,3D相机提供商主要是奥比中光,已与多家国内人形机器人主机厂合作;激光雷达与汽车复用,主要供应商禾赛科技和速腾聚创,海豚君对禾赛已有单独分析,这里不再赘述。


但在特斯拉机器人的价值构成中,由于只需要三个2D摄像头,一颗摄像头价值仅350元,在机器人出货量不大时,很难对供应商形成有效增量。


②触觉传感器:核心瓶颈,技术还未收敛


什么是触觉传感器?简单理解就是人类皮肤,主要用在手部,作用是感知和测量与外界物体进行接触时产生的相互作用力,包括压力、纹理、摩擦力、温度等,所以也被称为“电子皮肤”。目前是人形机器人硬件环节主要难点。


触觉传感器是机器人这一新品类下催生的全新领域,其他行业应用很小,对精度和灵敏度要求很高,还要有一致性、柔性、高可靠性、耐久性以及集成性等特性,目前人形机器人硬件领域需要重点攻克的难点。


比如,精度要求主要受物理原理、微型化集成及动态响应限制等因素的制约,精度不足可能会使得“信号失真”,导致导致大模型学习的是伪规律。


数据一致性主要受制于制造工艺:批量生产过程中,材料均匀性、工艺参数等的微小波动,都会导致同一批次传感器的输出特性存在显著差异。


此外,传感器长期使用后的性能漂移也会产生影响,这些因素会导致大模型在训练时,要么过度拟合,要么噪声过多,最终会导致泛化失败。


难在哪里?生产角度,触觉传感器壁垒在于材料选择(敏感材料、柔性电极等),结构设计,制造和封装工艺(光刻、3D打印等),信号处理算法(需要从单一物理信号解耦除多维要素)等,对生产企业综合实力要求较高。


什么方案?主要是压阻式、电容式等技术方案。压阻式主要是将电阻变化转化为电信号,结构相对简单,但动态性和一致性都相对较差;电容式主要是将电容量变化转化为电信号,动态性和一致性要好于压阻式,虽然技术成熟度还相对较低,但是预计是未来主要的发展方向。


目前价值量占比可能不高,但未来有增加可能性。根据我们的测算,Optimus手部需要使用10个及以上的触觉传感器,对应目前单台人形机器人价值量在3000元,产业成熟后降本到1500元,在整个人形机器人价值量中占比仅2%。


但这里需要注意的是,目前触觉传感器技术路线还未收敛,考虑到未来可能由电容式替代目前压阻式,且未来还需要满足阵列化以及多模态感知等需求,触觉传感器的价值量有进一步提升的可能性。


供应商格局:领先的主要是Novasentis、Tekscan、JDI、Baumer、Fraba等海外企业、分布在美国、日本等国家。


中国企业也在加速布局,进展较快的主要有:柯力传感,通过投资他山科技、猿声先达等触觉传感器的研发企业;


汉威科技,已经与多家人形机器人主机厂厂家展开合作,并且进行产线建设;


福莱新材,已经建成中试线,并已经为多家人形机器人主机厂厂家进行供货等。


③力矩传感器:六维力传感器是重点,需国产替代


什么是力矩传感器?主要是测量力和扭矩的传感器。直观理解可以想象一下拧瓶盖的场景:当你拧瓶盖的时候,会感受到需要多大的力才能把瓶盖拧开,力矩传感器就是用来感知它的。普通的一维力矩传感器的技术壁垒不高,所以这里重点讨论六维力传感器。


什么是六维力传感器?可以同时测量三个方向上的力和扭矩,在特斯拉Optimus Gen 2上,六维力传感器总共有4个,分别被放置在手腕和脚踝位置,它是人形机器人运动控制的核心传感器。


图:六维力传感器弹性体结构示意图


资料来源:海豚研究


难在哪里?人形机器人上的六维力传感器对集成化、动态性能、过载能力(应对瞬间冲击的能力)以及精度等都有较高要求。产品壁垒较高,主要难点主要是:


a.结构设计:在微小的形变下保持高灵敏度;


b.解耦算法:需要从原始信号中解耦出六个维度的力和力矩,并且要规避各个维度之间的串扰的影响;


c.贴片工艺:要克服传统工艺一致性差的问题;


d.标定工艺:通过测试和计算,以确定传感器输出信号和实际物理量的准确对应关系,标定维度远远多于普通的力矩传感器等。


价值量占比不高。根据我们的测算,Optimus需要使用4个六维力传感器,对应目前单台人形机器人价值量在5400元,产业成熟后降本到3200元,在人形机器人当中占比在3%。


供应商格局:六维力传感器本身海外是成熟品,但供应商主要是美国ATI,竞争壁垒较高;往后看,降本大概率依赖中国企业,中国进展较快的有柯力传感、安培龙、凌云股份等,都已经与主机厂合作,部分进入批量订单阶段。


替代风险:这个细分赛道投资的一个关键风险是,六维力传感器的技术难度和高成本,未来不排除可以通过算法升级取代这项传感器,这是六维力传感器这个环节的重要风险所在。


④定位传感器:用量可能大幅增加,高端产品需国产替代


什么是定位传感器?主要就是惯性测量单元(IMU)。力矩传感器主要是用来感受“力”,而IMU主要是用来感受“位置”。核心组件包括加速度计、陀螺仪等,用来测量加速度和角速度,服务于人形机器人的姿态估计、平衡控制和运动状态测量,同样是人形机器人进行运动控制的主要传感器。


目前特斯拉人形机器人可能采用2颗及以上IMU主控芯片,但未来可能更多,以通过冗余配置来提升容错能力。


图:加速度计和陀螺仪


资料来源:Innalabs公司,海豚研究


图:IMU结构示意图


资料来源:某IMU专利,来自株洲菲斯罗克光电科技股份有限公司,海豚研究


难在哪里?人形机器人需要的IMU同样对精度(加速度计的零偏稳定性,和陀螺仪的角度随机游走)有极高要求,标准远高于消费电子产品,并且对于制造工艺、融合算法也有较高要求。


国产化进展:IMU也是成熟产品,但高端IMU(工业级、车规级、战术级)由博世、霍尼韦尔等欧美企业把控,同样有比较好的竞争壁垒。同时国内企业也取得一定进展,主要企业包括芯动联科(已经具备工业级的成熟产品)、华依科技(已经向人形机器人主机厂厂商供货)等。


价值量有大幅提升可能性。根据我们的测算,Optimus目前方案仅使用2个主控IMU,对应目前单台人形机器人价值量在8400元,产业成熟后降本到4200元,在人形机器人当中占比在4%。但考虑到技术路线迭代,未来价值量有大提升的可能性。


2)决策层:主要指大脑人工智能模型,主要是AI半导体相关,这里暂不分析,未来做单独分析。


3)执行层:主要指小脑和执行器。


小脑主要是指运动控制系统,可以看作是大模型之下的小模型。


而执行器关键是在关节(包括线性关节和旋转关节)和灵巧手(可看作由更精密的关节构成)。其中,线性关节主要由电机和丝杠构成,旋转关节主要由电机和减速器构成。


①电机:价值量大,降本靠中国


无论身体关键还是手部关节,无论是旋转关节还是线性关节,都需要使用到电机。


为什么?目前,人形机器人都是电驱动。早年间,液压、气动等技术路线也被尝试采用过(比如当年很火的波士顿动力),但因精度不高,核心bug是难以与电控系统集成,与智能化冲突。


人形机器人电机特别在哪?电机的种类五花八门,目前特斯拉人形机器人的身体关节主要使用无框力矩电机,灵巧手主要使用空心杯电机,未来可能过渡到微型无框力矩电机。


无框力矩电机的优势是可以在受限空间内满足大扭矩、高精度、高功率密度、快速响应、高可靠性、轻量化、集成化、小型化以及相对较低成本等。而空心杯电机能够满足在灵巧手极小空间下满足性能要求。


拆解一下这两种电机的结构,以更直观地理解:



无框力矩电机,从名字上就可以简单理解它的结构:与传统电机的差异点在于,无框力矩电机取消了外壳、轴等机械机构,从外形来看,只有圆环状的转子和外部的定子。


其中,转子由环形磁铁和钢圈组成,可以直接跟关节的主轴集成在一起,定子由叠片和铜线圈等部件组成,可以直接与机器的外壳结合在一起。


这种结构取消了传统电机的冗余结构,不需要一系列的传统部件,因此具有集成化、高功率密度以及高响应速度的优势,可以满足人形机器人轻量化、高负载、高动态、高精度、轻量化和高可靠性等要求,因此成为目前人形机器人身体关节主流驱动方案。


图:空心杯电机结构


资料来源:鸣志电器官网,海豚研究


空心杯电机的名字来源于它的转子的特殊结构:与传统电机相比,空心杯电机的最大特点在于转子没有铁芯,而是由漆包线绕制成一个杯状的自支撑线圈,形状像水杯。而空心杯电机的定子则是由永磁体构成。


无铁芯的设计可以降低铁芯结构所带来的不稳定的问题(齿槽效应),同时可以消除铁芯所带来的各种损耗,并且可以大幅降低电机质量,因此具有结构紧凑、运行平稳(卡顿、震动以及有噪音的情况极少)、动态响应快、高效率低发热、高功率密度等优势。


应用在人形机器人灵巧手当中,可以满足灵巧手对于高集成度(因为空间极其狭小)、高精度和高稳定性(尤其是体现在抓取这个动作上)、高动态响应以及高可靠性的要求。


难点在哪里?传统电机技术已经极其成熟,但高端产品中国还不成熟。无框力矩电机的磁路设计、组装工艺、材料选择、结构设计等有难度;空心杯电机线圈设计、线圈绕制工艺有难度,但整体上,这种难度是可以攻克的。


价值量有多少?根据我们的测算,Optimus需要使用多达40个电机,对应目前单台人形机器人价值量在28800元,产业成熟后降本到14400元,在人形机器人当中占比达到14%,成本占比明显高于上述传感器。


行业格局:无框电机领域有美国的Kollmorgen、德国的TQ-RoboDrive、瑞士的Maxon等;空心杯电机领先企业主要有瑞士的Maxon、Portescap、德国的Faulhaber等。


目前中国公司有步科股份(无框力矩电机龙头,在工业和协作机器人领域已批量销售产品,并已经开始给人形机器人主机厂供货)、鸣志电器(空心杯电机技术领先)、伟创电气(空心杯电机已经具备量产能力,已与海外客户对接)、兆威机电(空心杯电机已经与海外客户开展前期合作)、卧龙电驱(无框力矩电机已经向国内主机厂厂商供货)、雷赛智能(已经具备成熟的无框力矩电机和空心杯电机产品)、三花智控(自主研发无框力矩电机)等技术已经较为成熟。


②丝杠:成为主流方案概率较大,是主要的需国产替代的环节


身体关节为什么要分线性关节和旋转关节?手腕、肩膀,还是膝盖、脚踝,它们的运动都可以类比为旋转运动,并且有些关节可以在好几个空间维度上进行旋转,因此机器人必备。


a.旋转关节的运动方式是围绕某个点进行旋转,


b.线性关节的运动方式是沿着某条直线进行线性运动。人形机器人的部分位置采用线性执行器,可以解决某些旋转执行器可能存在的弊端。


人在通过腿部进行跳跃的时候,肌肉的收缩更倾向于是一种线性运动,那么人形机器人也可以模拟这一运动过程;且相对旋转执行器,输出力矩更精确、更节能(不运动的时候电机不启动)、结构更具刚性(更抗冲击)等优势(尤其是行星滚柱丝杠),这几点待我们在下文将丝杠的结构拆解以后,可以更加直观地进行理解。


什么是丝杠?就是把电机旋转运动转化为直线运动的机械装置,主要的组成部件是中间的螺杆和外部的螺母。想象一下,用螺丝刀拧螺丝钉的过程:旋转螺丝刀,螺丝钉就会按直线钉入。


丝杠的工作模式也是类似的,电机带动外圈的螺母运动,而螺母通过滚柱,作用于螺杆上的螺旋槽,最终带来螺杆进行直线运动。


相对较为传统的滚珠丝杠而言,行星滚柱丝杠的优势在于承载力和刚度更高(因为由滚珠的点接触变成了滚柱的线接触),推力更大,且具备自锁性(不运动的时候电机不需要启动)匹配人形机器人需求。


但与此同时,行星滚柱丝杠的技术难度更高,主要是对精度要求更高,同时对合金材料性能要求更高,因此对热处理工艺、精密磨削工艺的要求极高,目前螺纹磨床设备完全依赖进口。


图:滚珠丝杠结构示意


资料来源:南京化纤公告,海豚研究


图:行星滚柱丝杠结构示意


应用在人形机器人上的丝杠是全新领域:应用端,之前行星滚柱丝杠主要应用于航空航天、军工以及某些重型工业领域。人形机器人上,产研要求侧重精度(要求在C5以上)、尺寸、功率密度、动态,同时对成本也更高敏感,更加剧了应用于人形机器人的行星滚柱丝杠产品的开发难度。


目前国内主机厂选丝杠路线的相对较少,仍然主要使用旋转关节,这主要基于控制难度等原因。但考虑到丝杠优势,长周期有采用趋势,而特斯拉身体关节当前采用行星滚柱丝杠,灵巧手采用滚珠丝杠,但不排除未来更换技术路线,另有部分国内企业身体关节也暂时采用滚珠丝杠。


价值量占比?单价2400元,但是用量较大,丝杠简直了占到了机器人总价值量的20%(考虑身体需要使用14个行星滚柱丝杠,手部需要使用12个微型滚珠丝杠)。这个也是单一零部件价值量最大的环节,而且本身从生产工艺和生产设备都有难度,是一个需要重点关注的细分赛道。


行业格局:目前在丝杠领域仍是日欧企业保持领先,主要是日本的THK、NSK、德国的舍弗勒(行星滚柱丝杠领先)、中国台湾的上银科技等。


中国进展较快的企业有恒立液压(能够生产行星滚柱丝杠,已与北美客户建立初步合作),新剑传动(与多家主机厂厂商开展合作)、五洲新春(主要提供前道工艺,是新剑科技及海外龙头的供应商)、浙江荣泰(并购KGG,其具备行星滚柱丝杠生产能力)、北特科技、震裕科技、双林科技、双环传动等。


除了本身工艺难,生产设备上需要磨床来生产螺杆上的螺纹,这个磨床设海外成熟,但中国生产有难度。国内有希望突破磨床生产技术的设备公司主要有秦川机床、华辰装备、浙海德曼等。


③减速器:价值量也大,国产替代不足


与线性关节不同,旋转关节主要使用减速器作为传动装置。减速器是通过齿轮等内部转动,将电机输出的高转速、低扭矩的动力转换为高精度、低转速、高扭矩(高负载)的动力。原理类似扳手拧螺丝的过程。从类型上看,应用在人形机器人上的减速器主要有行星减速器、谐波减速器、摆线减速器等。


图:行星减速器


资料来源:台湾普尼柯科技有限公司,海豚研究


行星减速器主要是通过行星齿轮进行传动,优势是重负载、高扭矩和抗冲击,因此比较多地应用在人形机器人的下肢。目前特斯拉人形机器人手部也暂用行星减速器,主要基于成本考量,未来不排除改变技术方案。


图:谐波减速器结构示意图


资料来源:机器人网,海豚研究


谐波减速器主要由波发生器、柔轮和钢轮组成。波发生器是让柔轮发生弹性形变,然后柔轮齿与外侧的钢轮齿会在不同位置持续发生啮合和分离。这个过程中,柔轮与钢轮的啮合位置会不断发生变化,最终导致柔轮相对于钢轮发生缓慢旋转。


谐波减速器的优势是极高传动比、精度高且体积小,但承载力和抗冲击力有限,因此较常用在上肢。


图:摆线减速器结构示意图


资料来源:国贸集团产品介绍,海豚研究


RV减速器是一种复合结构,传动结构分两级,一级是行星齿轮,一级是摆线针轮。摆线针轮减速,通过输入轴带动偏心轴(曲柄轴),使摆线轮在针齿轮内既公转又自转(自转转速即为输出转速),从而实现高传动比。


RV减速器的优势是同时具备高承载、高精度和高传动比的优势,但结构极其复杂,生产难度较高、成本较高。摆线减速器可以看作RV减速器的简化版本,具备RV减速器的部分优势,同时结构更加紧凑。目前特斯拉主要采用谐波减速器,未来可能在部分位置采用摆线减速器。


表主机厂公司身体关节使用减速器和丝杠的情况


价值量占比?目前谐波减速器在特斯拉Optimus中的价值量占比达到了16%,仅次于丝杠。而且技术难点也比较大,例如谐波减速器目前主要由日企哈默纳科掌握。


行业格局:目前高端行星减速器、谐波减速器和RV减速器均由日德企业主导,典型如日本的哈默纳科在谐波减速器领域占据全球一半以上市场,断层领先。减速器在性能上强调精度、承载力、一致性、寿命等,难点主要集中在材料(比如谐波减速器需要高性能的特殊合金钢以生产柔轮)、齿轮加工工艺(需达到极高精度)、高性能零部件(如轴承等,生产难点在热处理等环节)、设计仿真能力(齿形设计、力学模型等)等。


中国进展:高端品初步国产替代,国内绿的谐波(在谐波减速器领域已经与北美客户建立初步合作)、中大力德(具备行星、谐波、RV等生产能力)、双环传动(RV减速器龙头)等进展较快。


总结:难点在触觉,机会在丝杠和减速器


通过以上梳理,按照价值量占和行业进入壁垒两个维度来看的话,人形机器人最难的环节是机器人催生的全新产业需求——电子皮肤,也就是触觉传感器。


而价值量较大,且行业本身有工艺或者设备难度的,主要是两个关节部件,一个是线性关节需要的丝杠,另外一个是旋转关节所需的减速器。


海豚君整理如下:



此外,人形机器人并未进入产业化量产的阶段,技术路线并未收敛,以上分析主要基于当前主流技术路线,不排除未来技术路线发生变化,导致新的硬件的出现或者部分硬件被替代。


要注意的是,产业链环节的角度,总成也是硬件的一个核心环节。比如,灵巧手总成的产业化难度高于诸如丝杠、减速器等零部件,但灵巧手的壁垒不只是工业制造,同时还涉及软件和软硬件耦合,下篇会详细讨论。


-END-

AI创投日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定