本文来自微信公众号: 懒熊体育 ,作者:魏江雷,原文标题:《人形机器人的“大脑”进化,需要一场格斗赛|魏江雷专栏》
人形机器人产业的快速发展正在催生一个新的命题:当人形机器人的运动能力日趋成熟,如何进一步激发其“大脑”的自主决策能力,成为决定产业能否真正落地的关键所在。
在这一背景下,人形机器人格斗赛的兴起引发了我持续的关注与思考。格斗对抗所要求的实时感知、动态平衡与自主决策,恰恰直指当前人形机器人最核心的技术短板。它究竟只是一场面向大众的技术展演,还是推动人形机器人能力跃升的有效路径?其赛事的组织形式应当如何设计,训练成果又将如何反哺更广泛的商业应用场景?
围绕上述问题,我想尝试从人形机器人的能力架构与核心痛点出发,对人形机器人格斗赛的意义、赛事组织构想以及应用场景价值,做一番梳理与探讨,也欢迎你提出意见。

人形机器人的能力和其应用场景

人形机器人(humanoid Robot)近期成了热门话题。从北京亦庄的人形机器人马拉松,到北京人形机器人运动会,再到深圳众擎举办的T800型人形机器人格斗赛,人形机器人从春晚现场走到百姓身边似乎指日可待了。纵观人形机器人的市场表现,动辄上千台的工业应用订单让每个机器人企业都在加速其研发和创新速度。但目前火热的人形机器人在工业化生产的应用方式(例如搬运)和人形机器人的典型市场应用场景的关系,人形机器人的运动能力,像跑步、跳跃、翻腾等和应用场景的关系,都值得我们深入思考和探讨。
而人形机器人格斗,似乎让人形机器人的能力有了质的飞跃,但其具体的意义价值又如何?解答上述问题,我们先要看一下人形机器人的操控系统——小脑、大脑,和人形机器人应用的关系。
人形机器人的小脑是其运动操控单元,负责“指挥”人形机器人肢体的各种运动、行走、跳跃、跑动等,是程序化的指令支配机器人的运动。春晚宇树机器人的表演都是其小脑高度发达的表现。
而人形机器人的大脑,是能使人形机器人实现“自主决策”的高级控制单元,能让人形机器人在复杂的运动交互环境中调整、控制其姿态,完成更高级的“自主”人机互动。
在北京亦庄的人形机器人马拉松赛上,比的是人形机器人的小脑控制能力,和机械关节的耐磨损性能、电池的续航能力。

人形机器人应用的核心痛点

当前人形机器人的核心痛点是“四肢发达(小脑),头脑简单(大脑)”,总结来说,有三大技术短板:
1,缺乏实时环境感知与自主决策能力,“大脑发育不全”
·依赖“遥控”:目前很多人形机器人的行动靠选手用手柄操控。机器人只负责执行动作(小脑功能),而分析战况、制定策略(大脑功能)还得靠人
·感知滞后:视觉和力觉传感器难以在毫秒级内处理对手的动作和冲击,导致常常“慢半拍”
·负责自主决策的人形机器人大脑发育不全,不具备自主决策和指挥小脑的能力
2,小脑“不稳”:动态平衡与抗冲击差
·虽然平衡算法已有突破,但在高强度对抗中依然脆弱。被击中后踉跄,或因出拳反作用力而摔倒,就是典型表现。近期很多人形机器人格斗视频中出现的人形机器人被人踢踹,在踉跄后迅速重新获得平衡,是小脑进化的成果。
·抗扰性弱:现有算法很难在受到重击时,实时抵消外部冲击力来维持重心,并作出相应的反应、反击
·材料局限:虽然使用了碳纤维等轻量化材料,但关节和骨架在反复重击下的抗疲劳、散热及瞬时功率输出,仍是巨大考验。而材料的重量也对电池的续航能力提出挑战。
3,人机“不合”,大小脑不合
·由于机器人复杂的关节传动,遥控指令存在物理延迟。这也是为什么操控者按下按键后,机器人动作会慢半拍。在奔跑行动中的慢半拍不会被关注,但在搏击对抗中,则成了致命的“软肋”。
·大脑自主决策能力不足,小脑在执行平衡和移动指令的同时,无法和大脑形成有效互动,大脑对小脑的管理失效,造成人形机器人队伍动作连贯性,对外界干扰队伍反应表现不佳。
·尽管机器人“耐造”的物理稳定性是亮点,经过深度训练的人形机器人能扛住重击,并在摔倒后数秒内自主爬起,这对小脑算法、大小脑协同和硬件来说是成功。
而三大技术短板之外,大脑的学习成本高,可供学习的“素材”有限,更加重了人形机器人目前“头脑简单”的困境。机器人大脑的训练,需要大量和其应用场景匹配的视频素材。在工厂环境中有大量的生产视频,马拉松和各类跑步赛事也有大量的比赛视频供机器人学习,自动驾驶训练也有海量交通视频素材满足需求。但格斗视频素材,尤其是高清比赛视频资源相对匮乏,高清素材集中在UFC、ONE等赛事,而这类赛事的素材都受严苛的版权保护,国内获取渠道不畅顺。而国内的赛事大多视频颗粒度粗,Token量少,无法成为高效的人形机器人格斗学习素材。
解决上述问题需要耐心,开发真正的空间智能大模型,提升“大脑”决策力;在算力保证前提下提供海量、高清的格斗比赛视频素材用于大脑训练;融合触觉等多模态感知,并优化高功率密度关节与散热技术,都能让机器人的大脑不再“简单”。
而训练大脑决策能力,海量的高清搏击赛事视频必不可少。一场搏击比赛在人眼里是一幕一幕的动作,在机器屏幕上的呈现是一帧一帧的精彩,但对机器人而言,是大量堆砌的视频数据Token。机器学习,Token越多,可以“学习”的内容越多,效果越好。而一个搏击比赛的Token量,取决于高清(4K&8K)的画面和3D成像数据量。在不同核心算法的加持下,通过对海量搏击比赛视频的处理,强化学习,可以帮助人形机器人快速开发大脑,让其具备自主决策,指挥小脑完成各种难度的任务。

人形机器人赛事种类
目前人形机器人格斗赛有三种比赛形式。
1,不同人形机器人品牌,在相同的比赛规则,近似的“学习”环境中,按照规定的时间完成赛前“学习”准备,随后上场按照竞赛规则比赛。
2,不同人形机器人品牌,在各自的学习环境中学习,然后按照统一的规则上场,各安天命,例如北京市举办的人形机器人运动会。
3,同一人形机器人品牌提供同一型号,或身高体重相近、自由度相近的人形机器人,交由不同团队在不同算法和学习环境中进行学习,然后进行比赛,例如深圳众擎的T800人形机器人赛事。

人形机器人应用场景及市场展望

在各品牌人形机器人的产线快速布局,BOM成本降至8万元人民币以内,加上核心大脑能力芯片的通用型人形机器人售价10万元人民币的基础上,人形机器人的年需求量如下:
1,人形机器人应用场景之一,交互式信息服务,年需求量5.6万台。应用场景包括商业地产服务领域,包括酒店,商场,写字楼服务。医疗机构接待和分诊,博物馆和其他公共机构信息服务等。
2,成长教育服务,年需求量66万台。包括K12教育的人型机器人老师和语言教学服务。
3,陪护服务,年需求量700万台。包括老年人亲情陪护,智力衰退病患的辅助治疗和康复治疗。
4,情感满足服务,年需求量100万台。包括人形机器人伴侣,人形机器人亲属等。
5,人形机器人的工业制造应用场景,年需求量200万台。包括搬运和分拣,设备操作和质量检验,与人员的工作衔接,高危工作环境应用,矿山,高压环境,辐射环境,灾难救护等。
面对人形机器人的海量应用和多种应用场景,人型机器人格斗赛便有了独特的意义和价值。在陪护和情感满足应用场景中,人形机器人与人的互动必不可少。例如在陪伴失能老人的应用场景里,搀扶老人起身上洗手间,或者对突然失去平衡即将摔倒的老人施以援手,都是人形机器人的基本能力。
通过格斗训练,促进人形机器人大脑和小脑的发展,让人形机器人具备格斗的基本技能,也具备与人互动、交互的能力,使其未来能胜任与机器、与生产环境、和与人类的接触、交互的多种应用场景和工作需求。
而格斗训练的终极成果,人形机器人大脑决策控制芯片,是整个格斗竞赛的终极价值所在。人形机器人如同我们日常使用的电脑,人形机器人的大脑控制芯片是操作系统。有了操作系统,电脑才能发挥其功能。而在操作系统之上,更多的应用让电脑能够几乎无所不能地存在于我们的生活和工作中。期待人形机器人格斗能加速人形机器人产业的发展和进步,让人形机器人能成为人类生活和工作的新帮手。
