本文拆解人形机器人核心硬件结构,分析量产难点,展现行业当前进化节奏与未来发展方向。 ## 1. 机器人骨架:轻量化与抗冲击的平衡 人形机器人空翻触地承受加速度可达几十个g,与汽车撞墙相当,骨架需要同时满足轻量化和高强度要求。 骨架材料从最早的钢材(初代WABOT-1重约160公斤),进化到主流铝合金,现在行业开始探索密度更低的镁合金,受力部位局部使用钛合金。 骨架加工门槛低,规模量产后加工费占比趋近于零,整体难以再降价,目前供应商仅能赚取微薄利润。 ## 2. 机器人关节:成本最高、技术难度最大的核心部件 执行器是机器人关节的核心,约占机器人整体成本的51%,是量产降本的关键,可分为旋转执行器和直线执行器两类: 旋转执行器由伺服电机+减速器组成,行业常用行星、谐波、RV三种减速器:行星减速器减速比小,多用于手部;谐波减速器减速比大精度高,多用于肘、肩关节;RV减速器刚性好抗冲击,多用于髋、膝、腰部。造单个减速器不难,难的是批量生产出性能一致、耐磨损抗冲击的低成本产品,这是行业公认的难点。 直线执行器由伺服电机+丝杠组成,类似人体肌肉做推拉运动,核心部件丝杠对加工精度和一致性要求极高;因动态性能差、制造成本高,当前不适合大规模商业化应用,仅在少部分场景使用。 机器人关节电机多采用无框力矩电机压缩体积,核心难点在于能效散热、体积控制和性能稳定:极限动作瞬时发热量是额定状态的9-25倍,早期样品极限动作做一次就需冷却;性能不稳定会导致扭矩偏差,直接影响机器人平衡与动作完成。 目前头部机器人企业多偏向自研关节,可适配自身算法需求提升性能;采购成品开发更快,但成本高且难定制。国内供应链已经逐步成熟,可提供减速器、电机等各类核心部件。 ## 3. 机器人传感器:感知环境与维持平衡的核心 惯性测量单元(IMU)相当于机器人的前庭,由加速度计、陀螺仪等组成,可实时感知机器人运动状态,辅助机器人调整平衡,技术已经成熟。 视觉避障常用摄像头+激光雷达+毫米波雷达融合方案,特斯拉Optimus坚持纯视觉方案;机器人激光雷达和车规产品需求差异明显:仅需10-20米测距,要求点云密度更高、体积更小、抗震性更强,目前这些需求还未被完全满足。 触觉传感器可感知压力和摩擦力,当前行业仍处于早期,材料精度、数据结合都存在难点,且难以满足耐久要求,2025年量产产品基本都不搭载,行业预计2026年有望实现规模化生产。 ## 4. 电气计算与量产:系统整合是核心难点 机器人采用“大脑+小脑”双芯片架构:大脑需要高算力,当前主流为英伟达Orin,未来Thor芯片将成主流,特斯拉采用自研双芯片方案;小脑负责实时身体控制,对响应速度要求达1K赫兹,目前多采用商用MCU,行业正在探索大小脑芯片一体化整合,可简化布线、提升通讯效率,仍处于早期阶段。 电池、线束等部件供应链成熟,核心供应商多来自成熟的汽车、电子行业。 理论上依托现有供应链可快速攒出一台能动的机器人,80%以上零部件可和汽车、电子供应链共享,这也是多家科技企业下场做机器人的原因;但“能动”和“好用”之间存在巨大鸿沟,需要在轻量化、力矩精度、稳定性之间做大量工程权衡,批量生产还要解决不同产品性能一致性的问题,系统整合才是真正的核心难点。 近两年机器人技术快速进化,核心原因是赛道升温后供应链逐步成熟,供应商愿意为机器人定制开发产品,行业进入正向循环。 目前机器人虽能完成空翻、武术等复杂动作,但距离人类的感知控制能力仍有较大差距,行业下一个里程碑是实现“接住一片落叶”这种自然的感控融合动作,这将标志着机器人真正走近日常生活。
拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶
2026-06-02 18:01

拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶

本文来自微信公众号: 硅谷101 ,作者:硅谷101,原文标题:《拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶|机器人特辑》


去年春晚,机器人还在转手绢、扭秧歌,今年就直接进阶到了高难度的空翻、武术。如今,甚至连手机厂商造的机器人,都能在半马上都打破人类记录了。为什么机器人本体这两年的进化能够如此之快?


为了进一步理解机器人的本体进化,我们走访了一些头部机器人企业,也和一些业内人士聊了聊:造机器人究竟有什么难点?机器人的制造门槛真的不高吗?机器人公司的护城河又究竟是什么呢?


这篇文章我们将详细拆解机器人身上的各个零件,相信完整看完之后,你也能自己拼出一台机器人。


(本文为视频改写,欢迎大家收看以下视频)


01


骨架材料


轻量化与抗冲击的平衡


机器人身上硬件种类繁多,我们可以粗略地划分为4个系统:撑起整个结构的骨架、驱动骨架运动的关节、感知环境的传感器、指挥身体的电气与计算系统。我们先从骨架开始说起。



如果一辆车以时速60公里撞向一个假人,由于巨大的冲击力,假人会飞出去,摔的七零八碎。而对人形机器人来说,承受这样的冲击力,已经成为了“日常”。


王闯

智元合伙人/高级副总裁/通用业务部总裁


机器人它每一次空翻触地,身上承受的加速度有几十个g,可能都比汽车和航天都要高,跟汽车撞到墙的加速度差不多。


这就对机器人的结构材料提出了挑战:要翻起来就得身体足够轻,承受如此大的冲击力还得强度大,否则可能一个空翻,零件就飞出来了。所以机器人的第一项挑战就是探索骨架材料。


世界上第一台全尺寸机器人WABOT-1,就是以钢材为主,体重达到了大约160公斤,可能它跳一下就得把地板砸个坑,就更别说翻跟头了。


后来,从本田的ASIMO、波士顿动力的早期液压版Atlas,到第一代特斯拉Optimus,铝合金成了主流,密度只有钢的三分之一。



现在行业已经开始探索更多材料,比如镁合金,它的密度比铝还低了三分之一,局部还会使用强度更高的钛合金,例如经常需要承受冲击的膝关节、脚踝等。


有意思的是,这些坚硬的骨架为机器人扛下了冲击,但供应商似乎赚的只是个“辛苦费”。


某机器人公司前采购总监


骨架最后的卖价,除掉本身金属的含量,再除掉抛掉的废料以外,ratio(比率)其实很低很低了。骨架最后还是卖金属费用+加工费用,大部分成本还是里面的metal(金属),没有办法降价了。它的加工费还是在合理区间的,如果量起来的之后,它的加工费就会趋近于很低,因为它没有什么太大门槛。


除了这些核心的骨架外,机器人的外观件,可以分为两类:


一类是装饰保护件,主要用在胸部、背部、头部,材料从塑料、仿皮TPU到织物,五花八门,主要是为了降低磨损、让触感更亲人。虽然有些机器人看上去是金属机身,实际上是塑料外壳做了一层金属喷漆。


另一类就是让机器人像真人的仿生皮肤,这些皮肤不仅触感要像人,还得在皮下植入触觉传感器。



在骨架和皮肤之外,真正让机器人实现各种超难度动作的,是关节,这也是整个机器人硬件里成本最高、技术最密集、故事也最多的部分。


02


拆解执行器


关节是最贵也最难的部分


大家肯定看过不少机器人跳舞、空翻的视频,这是先通过真人动作捕捉,再训练模型后映射到肢体动作上。



几年前,我们看波士顿动力的Atlas后空翻时,还觉得非常惊讶,但现在可能大家都觉得习以为常了,这背后的原因就在于,机器人的关节经历了从液压系统到电机的转变。


王闯


智元合伙人/高级副总裁/通用业务部总裁


以前我们造不出这么牛的关节,那时候的关节整个性能都很差,空翻是很难翻的起来的,最近这一两年关节的技术进步非常非常大。


关节在业内被称为执行器,主要分为旋转执行器与直线执行器,我们先以肩膀来举例,看看它们是怎么带动身体运动的。



肩膀有三个自由度:前后摆、上下抬、内外旋,被称为俯仰(pitch)、滚转(roll)、偏航(yaw),本质上这些运动方式都是旋转,所以通过三个旋转执行器的组合,手臂就能向X、Y、Z三个方向自由活动了。


到了膝关节上,一般只需要一个自由度,所以用一个旋转执行器或者直线执行器就可以了,直线执行器就像人体的肌肉一样,通过拉伸来带动上下的骨干运动。



而做一次极限动作,得靠全身几十个执行器紧密协同,任何一个地方反应没跟上,或者力量偏差了一点,后果就是摔倒。


这些执行器里面是什么结构呢?旋转执行器与直线执行器都有一套伺服系统,由电机、编码器、驱动器、传感器组成,两者最大的区别就在于,旋转执行器是伺服电机加减速器,而直线执行器是伺服电机加丝杠。


我们先从减速器开始说起。


Chapter 2.1旋转执行器与减速器


或许你听过这个装置,第一个齿轮转动10圈,第二个齿轮只转1圈,第三个则只有0.1圈,总共100个齿轮,以此类推,如果要让最后的齿轮转一圈,那么第一个需要转古戈尔(Googol)圈,也就是1的后面有100个0,所需能量超过了整个宇宙的能量总和。


这就是一个大型减速器,本质上是个巨大的杠杆,牺牲速度,换取力量。为什么机器人的关节需要减速器呢?



因为电机天生是“高转速、低扭矩”:转速可以轻松达到每分钟上万转,但输出的力矩却比较小。而机器人的关节需要精准控制,我们很难让电机只转几度的同时,还能搬动非常重的东西,所以需要减速来降低转数,提高扭矩,减速比(也就是齿轮比值)越大,速度降低越多,同时输出扭矩越高。


行业最常用的有三种减速器:行星减速器、谐波减速器、RV减速器。我们用模型来给大家解释下。



首先是行星减速器,它的名字很形象:电机连接中心齿轮,带动三个行星轮,行星轮再带动外圈的大齿轮旋转,就像行星围绕太阳一样。它结构小,成本低,但减速比较小,同样的电机转数下,输出扭矩较低,因此常用在手部关节。


需要输出更大的力时,就会用到谐波减速器了。它的最中心是波发生器,将夹层的柔轮撑成椭圆形,一般柔轮与外侧固定的钢轮之间只相差2齿,柔轮只有两个对称区域与刚轮啮合,这样最中心的波发生器旋转一周时,柔轮只转动了2齿,所以减速比可以做到非常大。


谐波减速器的输出扭矩强,且精度高,常用在机器人的肘关节、肩关节,来实现手臂的精准控制。



前文中提到,机器人后空翻时,承受的力相当于汽车撞击,这也对特定部位的减速器提出了很大挑战,但谐波减速器的柔性结构也意味着抗冲击力较差,这时就得用上RV减速器了。


RV减速器由第一级行星齿轮和第二级摆线针轮组成,第一级降速后,通过偏心凸轮带动摆线盘做偏心运动,摆线盘与外壳上的针齿啮合,推动外壳旋转。


这样一来不仅减速比大,由于摆线盘有多个齿同时啮合,所以刚性好、抗冲击更强,常用在机器人的髋关节、膝关节、腰部等需要抗冲击的部位。



减速器是非常精密部件的,加工难度高,而且面对长期的磨损,也很难保证稳定性,这是整个关节里最难的部分。


王闯


智元合伙人/高级副总裁/通用业务部总裁


当大批量地制造、使用的时候,齿轮的精度以及长时间运行的稳定性要求就很高。比如说用了1000个小时,它就发生了各种各样的异响,或者性能就下降了,这个时候运控的算法可能很难去调整,表现在机器人上就是可能走路没有以前那么好了,甚至开始走得逐渐变歪了。


机器人可能要做很多极限的动作,自己也会摔倒,这些冲击很有可能会损伤里面的这些小的齿轮。我们如何能做出性能又很好、成本又很低、长时间使用又没问题,同时摔倒之后它又能抗得了冲击、不会轻易的损坏的齿轮,这是一个非常有挑战的不可能三角。


换句话说,造一个减速器不难,难的是造出一万个性能一致、耐用的减速器。


Chapter 2.2直线执行器与丝杠


接下来我们看看直线执行器和它的核心部件——丝杠。


直线执行器可以说是最像人体肌肉的,当我们的手臂这样摆动时,并不是关节在主动旋转,而是连接两端骨骼的肌肉在收缩。所以直线执行器只做一种运动,那就是推拉。


有些机器人的膝关节,会采用直线执行器,通过推拉来模仿人类膝部肌肉的运动。当有多个直线执行器通过特定的结构组合后,还能实现关节的旋转。这样的运动方式会被应用到手腕、脚踝等部位。


要做出直线执行器,最简单的就是液压装置,之前波士顿动力的老版Atlas就是以直线液压缸为主,具有高爆发、抗冲击、功率密度大等优势。为什么是老版呢?因为新版他们也转向了电机驱动,主要是液压装置系统复杂,容易漏油,而且控制精度不如电机。


但电机只能旋转,要输出直线运动,还需要一个“转换器”,也就是丝杠。



丝杠轴上有螺纹,旋转时会带动螺母做直线运动,这个过程就像拧螺丝。为了减小摩擦,丝杠内部会加入滚珠,这就是滚珠丝杠。有的会将滚珠换成了滚柱,寿命更长、承载更高、刚性更好,这就是行星滚柱丝杠。此外还有的还会用到T型丝杠。


王闯


智元合伙人/高级副总裁/通用业务部总裁


现在用的可能比较多的就是滚柱丝杠,它对加工精度要求非常非常高,而且在一个很长的行程内,你的一致性要非常好,如果中间有一些不好的,它对于不同机器之间的控制算法就是一个很大的挑战。


有的直线执行器中也会配合上减速器,让电机输出更高扭矩。但目前行业中,直线执行器的应用比较少,主要有三个原因:动态性能差、制造难、成本高。


王闯

智元合伙人/高级副总裁/通用业务部总裁


目前整个行业量产最多的就是旋转关节。直线执行器在行业内也有一些应用,它的特点是载荷能做到更大,而且在一些状态下,如果不供电,也是能保持一个稳定的姿态,是能够自锁的。但是我们觉得它的缺点就是动态性能可能会稍微差一点,因为它的载荷大、减速比大,但动态性能差,所以没有那么敏捷的动作。还有一个比较大的难点是很难大批量地、低成本地制造,所以在当前,我们觉得还不适合做大规模的商业化。因为大家现在用的少,出货量也少,在客户场景中验证的也少,所以它整个成本都是现在居高不下的。


说完传动,我们再来说说动力本身,也就是电机与伺服系统。


Chapter 2.3电机与伺服系统


机器人身体中的常用的电机是无框力矩电机,相比传统电机,它没有了外壳和轴承,只保留了最核心的部件,这样做是为了尽可能缩小尺寸,可以直接嵌入关节内部。


灵巧手比较特殊,用的是体积更小的空心杯电机,当然输出功率也就没那么高了。灵巧手的难度甚至比整个机器人本体还高。


身体电机的难点主要在于三块:能效与散热、体积和性能稳定性。我们先来说下能效与散热。


电子产品都会不可避免的产生热量,当热量积压过多,超过了正常工作区间后,性能就会下降,所以电机的能效,也就是真正有多少能量被用在做功上,就格外重要,一旦过热,控制系统就只能降低功率,比如空翻到一半时,突然“腿软”了,就会啪一下倒地上。


王闯

智元合伙人/高级副总裁/通用业务部总裁


我们以前做的最早期的样品,可能10分钟之内,这些极限动作只能做一次。它的转速、转矩这些性能曲线做一次之后整个就变掉了,也有可能因为里面发热之类的原因,这个时候就需要先把它技能冷却一下,让它温度降下来之后才能继续做。再一个比较大的问题是它的能效,就是输入一定的能量有多少转化为了热量,比如说是5%,那就和3%就有巨大的差异。这些都会限制性能,哪怕我硬件能力再强,我都不敢再往上去抬性能了。


3%和5%之间看着也许没多大差别,但需要注意的是,电机的发热不是线性的。


当关节要做一次极限动作,瞬时电流可能是平时的3~5倍,发热量就是额定状态的9~25倍。这意味着热量的积累速度,远超关节被动散热的能力上限。做一次空翻,关节温度可能就从温升10度直接跳到50度。所以做完后电机需要冷却,机器人才能继续下一个动作。



要提升电机的能效,就得从电机材料、绕线工艺、结构设计上来下手,这里我们就不详细说明了。


目前很多关节的散热主要靠被动,因为机身采用了大量金属,可以想象成巨大的散热片,只有在功率非常大的关节才会额外加入风冷或液冷散热,比如腿部。


而且额外加入散热措施会带来第二个挑战,那就是体积限制。


工程师们正在想方设法尽可能缩小关节电机,一方面是为了减轻重量、降低成本,更重要的是体积越大,转动惯量也更大,改变运动状态就更难。


打个比方,当你旋转一根绳子的时候,绳子越短,转速就会更快,如果绳子变长了,转速不仅会变慢,当你想停下来时,需要的缓冲时间也会更长。


第三个难点是性能是否稳定,也就是在电机在输入多少电流时,转数是多少、能输出多大扭矩,业内称为TN曲线。这就会影响机器人的控制算法。



比如走过一段不平整的路面时,脚踝上的六维力矩传感器感受到了起伏,为了维持平衡,就需要动态调整电流,来控制电机扭矩。如果TN曲线不稳定,可能控制系统下达的还是同样的命令,但电机输出扭矩产生偏差,结果就是摔倒。


而且TN曲线还对算法的训练有着很大影响,因为机器人算法是先在仿真系统中训练,如果仿真系统中的TN曲线和现实相差太大,那实际表现也会产生偏差。


王闯


智元合伙人/高级副总裁/通用业务部总裁


我会输入给仿真系统一个曲线,实际中这个电机能达到甚至超越这个曲线,那它想要达到的性能、想做的动作就能做到。如果反过来在低转速下ok,但是转速一高它性能就下来了,这个时候就肯定有一些极限动作就做不了,因为有一些最难的动作,要求你在极高的速度下,又有极高的爆发力。


要精确控制电机转数,还需要一套伺服系统,主要由编码器、驱动器、传感器组成。


编码器用来测量电机转子的角度、速度、位置,让系统知道电机当前在什么状态。


王闯


智元合伙人/高级副总裁/通用业务部总裁


编码器其实很关键,机器人里面因为有减速器,所以必须用双编码器,才能知道输入端和输出端两个的位置都在哪里,才能更精确的控制。


驱动器会根据编码器的反馈,以及来自“小脑”的控制指令,调整给电机的电压、电流。



传感器的种类比较多,比如力矩传感器测输出扭矩,温度传感器测电机温度、防止过热等等。


以上就是执行器里的关键部件,接下来我们再说说执行器的整体,为什么它是降本的关键?自研和采购有多大区别呢?


Chapter 2.4研发路径与成本


根据美国银行的测算,执行器是机器人身上成本最高的部件,约占51%。


某机器人公司前采购总监


无论是手或是电机,motor(电机)和control(控制器),也就是你的肌肉(执行器)是比你的骨骼、比你的眼睛(传感器)、脑子(芯片),包括你的心脏(电池)都是要贵的。


所以执行器是未来量产降本的关键,最主要的因素就在于,中国供应链实在太卷了,此前不少需要其他国家工厂精加工的部件,现在国内都能找到替代。


比如做电机的卧龙电驱、做减速器的绿的谐波、双环传动、中大力德等等,甚至还有公司直接可以提供完整的执行器,比如三花智控、拓普等。


既然市面上可以买到现成的执行器,机器人公司为啥还要费时费力自己研发呢?我们对比下这两种模式。


如果采购成品,可以降低研发成本,提升开发效率,但相应的物料成本会更高,难以根据自己的需求去定制,性能也会有所不足。


王闯


智元合伙人/高级副总裁/通用业务部总裁


大部分(执行器)公司不会给你专门去设计你想要的东西,它卖给你的都是标准件,成本相对来说也比较高。如果一个公司它本身本体的团队人又少,关节的积累也不够,肯定是去买别人的会更好一点,会更快速地能把这个东西做出来。


如果自研的话,能更好的匹配需求和算法,性能更强,但相应地需要付出大量研发精力。


选择哪种路径更多的是公司规模与成本的考量,根据我们的调查,目前头部的机器人公司更多还是偏向自研,甚至会进驻供应商那边参与设计。



所以机器人的关节不仅仅是把零件装在一起,而是要在极小的体积内,实现力量、精度、耐久、成本、重量的平衡,可以说是整个身体中最难的部分,原因在于这是一个新兴的产业,此前供应链并不成熟,大家都是在探索阶段。


王闯


智元合伙人/高级副总裁/通用业务部总裁


(初期)很多的产线的设备都是行业内没有的,我们自己还要去设计(生产)设备。


光有强健的关节还不够,机器人又该怎么知道怎么站稳?如何感知世界?接下来我们聊聊传感器。


03


视觉系统


机器人如何感知世界


Chapter 3.1惯性测量单元(前庭)


现在的机器人在大部分情况下,不论人类怎么干预都很难摔倒。要实现这样的平衡,在硬件上得依靠身体中的各个传感器。


一方面是前面提到的电机伺服系统,它通过关节里的编码器和力矩传感器,实时感知每个关节的当前位置和受力情况,然后以每秒上千次的频率调整输出。


另一方面,光有“四肢的感觉”还不够,就像人类还需要靠内耳的前庭系统,来感知身体的倾斜与旋转,在机器人身上,这个部位就是惯性测量单元(IMU)。


IMU非常常见,比如当你把手机旋转时,画面也跟着旋转,就是靠IMU。


IMU是几个传感器的组合,最核心是两样东西:一个是加速度计,测量XYZ三轴的加速度,另一个是陀螺仪,测量俯仰、偏航、滚转三个轴的角速度。此外IMU还会加入磁力计,相当于是电子罗盘,用于校准。



把这几个数据融合起来,IMU就能实时感知机器人的运动状态,当我们踹他一脚时,身体会瞬间获得一个加速度,同时还会前后左右倒,IMU检测到这个变化后,会将数据传给“小脑”,计算出需要给各个关节增减多少扭矩,然后将身体拉回来。这个部件在手机、汽车等地方用得很多,所以技术和应用也相对成熟。


防摔倒靠的是IMU,而对日常行动来说,更重要的是防碰撞,避障最依赖的就是视觉系统。


Chapter 3.2摄像头与激光雷达(眼睛)


机器人的“眼睛”,和汽车的自动驾驶非常像,但又不完全一样。常见方案是摄像头+激光雷达+毫米波雷达多传感器融合。其中的例外就是特斯拉Optimus,众所周知马斯克是坚定的纯视觉党,只用摄像头。



在传感器的使用上,机器人几乎和汽车一样,许多供应商也都是从汽车供应链上迁移而来。不过虽然都是同一种传感器,但实际的规格大不相同,我们以比较贵的激光雷达来举例。


首先是测距要求不同。汽车要跑高速,激光雷达需要看到150-200米外的障碍物。机器人主要在室内活动,10~20米就够了。测距短了,意味着激光雷达的功率、体积、成本也可以更低。


第二是点云密度和扫描方式不同。汽车识别的是车、人、路障,这些都是大物体,点云密度可以低一些,但机器人需要在桌子上拿起螺丝刀、在地上捡起硬币,这些都是小物体,所以需要更高密度的点云。


王闯

智元合伙人/高级副总裁/通用业务部总裁


我们是希望点云要非常的密,像我们现在用的是非重复扫描,就是你在原地站一会之后,它的点云就会变得更密。这个对我们来说是非常好的,因为我们机器人很多时候并不是那么激烈地在做操作,它像人一样,人做很多事情都是慢慢地去做的,而汽车对稳定性、实时性以及重复性的要求非常高。


第三是安装位置和体积不同。车可以把激光雷达装在车顶、保险杠上,体积大一点没关系,但机器人身体较小,就必须使用更小的模组。



第四是可靠性要求不同。比如汽车常年在室外,对工作温度要求更高;而机器人受到的冲击力更大,对抗震性要求更高。


王闯


智元合伙人/高级副总裁/通用业务部总裁


我以前做车规的话,激光雷达最低的要求是-40度到85度,但在机器人上,至少现在是完全是不需要的。所以汽车上有很多专门为可靠性做的设计,在机器人看来就是冗余的。汽车出车祸的时候,可能加速度才能达到机器人日常做一次空翻的加速度,所以我们对这些震动状态下的稳定性的要求非常高。


虽然汽车的激光雷达已经非常成熟了,但机器人的激光雷达还处于行业早期状态。


王闯


智元合伙人/高级副总裁/通用业务部总裁


我们希望体积变得更小、点云更密、望距离短一点但是FOV(视场角)大一点,这些需求其实都是还没有被满足的。


在摄像头上,根据前特斯拉人工智能硬件负责人的透露,它们选择了车规摄像头,但内部研发时的路径也一再变化。


刘向科(Kerry)

前特斯拉人工智能硬件负责人


目前的方案应该是基于车上的摄像头,是500万像素。早期最早的方案是堆了很多摄像头的,像素都是有区别的,把帧率降低,把像素提高。为什么这么做,是因为当时Elon提了个要求,希望机器人能够做到穿针引线,当时我们算了,要做到这个要求,必须得要有超过1500万像素,才能看得见这个事情。


也是因为软件团队表示,这个事情如果要是连像素、摄像头都变了的话,对于重新训练这个模型的要求、时间的要求、还有工作量就都会大太多了。做不到怎么办呢?就考虑在摄像头上加自动对焦。但后来好像又说这个事情,也未必是一定需要的,所以反正就是一直在变。


Chapter 3.3触觉


接下来我们说说触觉,要实现触觉,主要分4种途径:


最常见的是压阻式,通过将压力转化为电阻,来改变电流信号,比如电子秤会用到。


第二种是电容式,用弹性介质隔开上下两层,当施加压力时电极距离变小,电容值发生变化。


第三种是压电式,只要材料受力,就会直接产生电压,比如打火机里放电的小玩意。


第四种是光学式,表面有弹性材料,受力后产生形变,由摄像头来捕捉,这是目前最热门的方式。



触觉最好是三维的,不仅可以感受到压力,还能感受到平面上的摩擦。比如当我们拿起可乐时,手会捏紧瓶子,向上抬起,如果手指感受到瓶子有下滑的摩擦力时,会加大捏的力度避免滑落。


但这也对材料和算法提出了很大的挑战。


王闯


智元合伙人/高级副总裁/通用业务部总裁


第一就是在传感器本身的层面,因为它其实本质上都是材料,任何的材料都很难在三个(XYZ)方向上很好的解耦开,所以精度就变得比一维的力难很多,怎么能把它弄准?其次是,这些三维的触觉这么复杂的数据,怎么跟操作模型结合起来,这也是非常难的,因为现在整个数据的量都非常少。


在这些挑战下,此前行业中的量产机器人,几乎不怎么搭载触觉。


王闯


智元合伙人/高级副总裁/通用业务部总裁


在整个2025年量产的产品里面,触觉用的非常少,几乎就没有,不只是我们,就整个行业都用的很少,因为这个东西不稳定。


需要考虑它长期抓东西的时候怎么能不变形,因为它稍微变形一点,可能输出的信号就完全不一样了。还有就是,不要发生性能的漂移,形状、位置这些都不能发生破损,材料又要稍微柔软一些,又要很耐磨,这本身也是很矛盾的事情。


但到了今年,情况似乎有点变化。我们的采访嘉宾表示,到了2026年,看到了规模化生产的希望,接下来就是如何在数据采集、训练中,让触觉系统更好的结合了。整体来说,触觉这个行业还非常早期,我们也期待看到未来更多进步。


除了前面提到的这些传感器外,机器人身上还需要温度、湿度、六维力矩传感器、UWB等等,这些都比较成熟,我们就不多赘述了。


传感器让机器人能感知世界,关节赋予了机器人活动的能力,但要让这两者结合,还需要一个“中枢”,接下来我们聊聊这个中枢——电气架构。


04


电气与计算


芯片整合与线束轻量化


Chapter 4.1芯片(大脑与小脑)


我们在之前讲机器人算法的文章中提到过,业界发展出了“System 1+System 2”这样的双系统架构,System 1负责操控四肢,System 2做复杂思考,在芯片上,也采用了“小脑+大脑”这样的组合。



为什么不用一个芯片干所有事?因为需求完全相反。


大脑芯片要思考“该怎么做事”,需要的是高算力、大内存,最好能在端侧跑大模型,延迟个几秒基本没啥影响。


目前绝大多数机器人大脑选用的是英伟达的Orin芯片,2025年英伟达还推出了性能更高、专为机器人和物理AI设计的Thor芯片,预计将成为未来主流。



特斯拉Optimus例外,它用的是自研的芯片,而且还是双芯片。


刘向科(Kerry)


前特斯拉人工智能硬件负责人


机器人因为不是自动驾驶,没有这种安全考量,Elon自己觉得,他说:不需要这个安全冗余的问题了,一个芯片就够了。做一个单芯片系统之后,他后来他一想不对,机器人的世界模型对算力的需求,是远高于自动驾驶的。自动驾驶两个都够呛,那机器人怎么可能一个能够?他自己又反应过来说:不对不对,改回两个芯片。


另外今年初的CES上,高通也发布了机器人大脑芯片Dragonwing IQ10,并且宣布了与Figure的合作。



而小脑芯片要“操控身体”,不需要特别高的算力,但实时性、稳定性、响应速度必须高,一旦延迟个几毫秒可能就会摔倒。


例如机器人空翻、跳舞时,基本是用提前录好的动作,但我们会发现它的脚还是会有一些碎步,这就是小脑在动态调节平衡,就像人类的“本能反应”一样。


小脑它要求速度非常快,所以小脑里面的频率可能是1K赫兹。


目前小脑芯片通常是MCU,主流选择是意法半导体的STM32系列、恩智浦的i.MX RT系列、瑞萨的RZ系列等。



现在我们也看到了一个新趋势,行业正在试图将大脑和小脑芯片整合在一起。这方面特斯拉比较前沿,一开始走的就是这条路线。


刘向科(Kerry)


前特斯拉人工智能硬件负责人


我们就先默认当时是用Hardware 4这个电脑的自研芯片。特斯拉的大脑小脑集中在同一个芯片上面,如何通过这一个芯片,用一个什么样的通讯架构来控制整身的行动?当时我们也是花了一些时间研究这种方案,一个SOC里面既有算力的ASIC,也有一个多核的CPU,这个多核的CPU可以用来处理小脑这些东西,这个频率很高的CPU的延迟也非常的低。


除了特斯拉外,也有其他公司在研究集成方案。


比如灵境智源在今年3月发布了德沃夏克架构,在一块芯片上集成了“大脑-小脑-皮层”三个功能。那统一成一块芯片,会带来哪些好处呢?


王闯

智元合伙人/高级副总裁/通用业务部总裁


首先我觉得最大的一个优势就是,因为现在做成一块板了,整个胸腔的体积和走线都会变得很简洁。然后其次是大脑和小脑,越往后,它之间的协调就越重要,举个例子,有人向你扔了一支飞镖,你去看以及预测飞镖的轨迹,这些东西可能都是用大脑,但是你手伸出去抓到它,这个是小脑,这两个东西之间通讯越快,越有利于完成非常高难度的动作。如果大脑、小脑做在一起的话,芯片之间的通讯会非常非常快,可能大脑能够实时的去控制小脑怎么动,并以非常高的速度去反馈。


不过根据行业内的看法,统一大小脑芯片还处于非常早期的阶段,需要等机器人出货足够多、市场足够大之后,机器人公司才会像现在的智能汽车公司一样,逐渐转向一体化的自研芯片。


Chapter 4.2电池与线束(心脏、神经、血管)


最后,还需要为全身提供能量的电池,就像机器人的心脏。核心需求是如何在更小的密度下,容量做到更高,主要供应商有宁德时代、LG、亿纬锂能等,


还有遍布全身的线束,就像神经与血管,用于设备之间的通信与供电。主要供应商有立讯精密、TE Connectivity、Amphenol等。


关于机器人的供应链种类繁多,我们就不一一介绍了,在这里放一张全景图,大家有兴趣可以放大研究。



看到这里,相信你已经学会了怎么造一台机器人,但先别急,如果你真的自己去做了,会发现哪哪都是问题,因为造机器人最大的难点,其实是各个工程之间的平衡。


最后我们再来聊聊,组装与量产的难题,以及这两年机器人突飞猛进的原因。


05


组装与量产


能动不等于好用


如果你看过前段时间的机器人马拉松,会发现现场有不少趣事。


有的随地大小坐,引来隔壁机器人拍手叫好;有的跑着跑着脚崴了、喝醉了、胳膊掉了、冲上绿化带了,或者被减速带绊倒后“粉身碎骨”了。


不过这也引发了一些讨论:连手机厂商做机器人都能表现这么好,是不是意味着这行业没什么门槛呢?


Chapter 5.1组装


业内人士的回答是:Yes,and,No。我们先说Yes的部分。


前文我们提到的各个零部件,供应商和手机、汽车行业高度重合,再往上,算法也有部分能和自动驾驶复用,这也是为什么荣耀、小米、特斯拉、小鹏会下场做机器人的原因。


某机器人公司前采购总监


Electrical&Power system(电气与计算)部分的供应商重合度能达到90%多,mechanical system(骨架结构)部分就算模具不一样,供应商也有很多类似的。电驱这一块是唯一可能和车相关性没有那么高的,因为车里面不需要有类似提供太多扭矩的东西。但是减速器、齿轮等零件在汽车里有非常多,包括sensor(传感器)也是。所以基本上80%以上的东西是可以同质的。


理论上,只要你认识这些供应商,就能自己搓出一台机器人。但“能动”和“好用”之间,却隔着一道巨大的鸿沟,这就是No的部分。


比如组装后重量分布不均,机器人的重心就偏,走路时为了保持平衡,某些关节要额外出力,功耗增加,续航减少,甚至影响步态稳定性。



又或者在实验室里跑1小时没问题,但放到真实环境跑100小时,各种毛病就出来了:比如某个螺丝松了、某根线磨损了、某个关节的润滑脂干了、某个传感器开始漂移了,这些都必须经过不断调试,才能找到平衡点。


某机器人公司前采购总监


每一个零部件,我把它拆成每个供应商,我觉得供应商的难度都不高的,我觉得最后是系统整合才是,比较难的东西。


更多是说你给了它上了constraint(约束),比方说你要把这个东西减重、轻量化做到什么(程度),但是你以人形把它框住了之后,它的力矩的大小以及它的精密度上,都要达到人类的高度,这才是难点,更多的是工程路径上的trade off(权衡)。


王闯


智元合伙人/高级副总裁/通用业务部总裁


往往市面上买到的标品,都是不能让人满意的,都离我们真正算法应用的要求来说有差距的,所以这些都是核心零部件,我们要自己动手去做。


Chapter 5.2量产


要做出可商业化、能量产的机器人,还会面临一致性的问题。


因为每台的关节背隙、传感器零点、电机参数都不一样,要让同一套算法能稳定应用在不同批次的本体上,还需要对各个细节做调整。


王闯


智元合伙人/高级副总裁/通用业务部总裁


你放10个机器人在那,给它发同样的参数(指令),它的手伸出去的位置是不一样的。


如果做操作,可能差个几毫米,就从能抓住它变成了把它撞倒,这时候怎么把所有机器人的传感器和执行器的标定方案做好,就非常难。还有在标定完了之后,能不能保证,在使用一年之后,它很多地方老化了、传感器也有畸变了的情况下,它还能保持稳定,这个时候可能还需要一些在线的标定,就是自己能把误差分析出来。这些东西都是看不见的功夫,但是如果不做的话,后面很多问题都解决不了。



所以真正的难点不是“拼起来”,而是系统级的整合。


我们回到机器人马拉松,今年不仅速度进步了不少,整体的完成度也提升了,再看这两年机器人动作的进化,从走路,到转手绢,再到跳舞、武术,为什么这两年进化如此快呢?最重要的原因就在于供应链的成熟。


王闯


智元合伙人/高级副总裁/通用业务部总裁


在过去一两年,机器人行业还不像现在这么的被大家看好,那时候大家不会为机器人去做激光雷达,大家只会说我这个是为物流车做的,你拿来直接用吧。那个时候是求着别人的,大家对机器人都是将信将疑的。


正如我们前面说的,机器人产业链很多环节都和汽车重合,此前对供应商来说,存在内部资源博弈的问题:在产量有限的情况下,是优先供给商业化成熟的行业?还是修改产线,去押注商业市场尚未成熟的机器人?


某机器人公司前采购总监


以前市场我觉得还没有到这个级别,跟真的跑量的手机、汽车等等还可能差一到两个数量级。所以供应商也是在博弈,因为它内部资源也有限。



现在随着机器人赛道越来越热,供应商开始愿意为机器人专门开模、定制产品,相信随着需求越来越大、商业化路径更加明确,供应链还会像滚雪球一样成长。


那下一个里程碑的动作,会是什么呢?


06


下一个里程碑


从空翻到接住一片落叶


王闯


智元合伙人/高级副总裁/通用业务部总裁


我前几天去了上海马戏城,我看了一场表演之后,我的感觉就是,机器人里还要进步的东西太多太多了。


那个蒙着眼睛在几十米高空走钢丝的演员,那个用一根筷子让几十只碗同时旋转的杂技师,他们展示的,是人类用了上百万年才进化出的东西:极致的感知、本能级的平衡、毫厘之间的触觉反馈。


虽然现在机器人能空翻、能武术,但它依然离人类遥远。


我问王闯,对机器人的下一个里程碑时刻是什么期待,他的回答其实有点让我惊讶。他的答案,不是什么更复杂更fancy的动作,而是一个非常非常基础、具备人类“感控融合”本能的“接住一片落叶”。


王闯


智元合伙人/高级副总裁/通用业务部总裁


有一片树叶,我能走过去,手伸起来正好就捏到那片树叶。



仅仅是一阵风飘过,穿过一片树林,而“它”走过去,伸出手,“恰好”接住了一片落叶。这一天到来的时候,机器人距离我们的生活,又近了一大步。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定