具身智能奇点将至,人形机器人哪些要点值得关注丨调研笔记

人形机器人作为具身智能的优质载体,受益于AI(人工智能)技术的快速突破,拥有感知、思考、决策等能力不再遥不可及。这也加速了人形机器人逐步走向产业化阶段。

2024年世界机器人大会以“共育新质生产力,共享智能新未来”为主题,于8月底在北京开幕。本届大会共有27款人形机器人整机亮相,数量创历届之最。这些新品不仅在外观上更加接近人类,而且在功能上也实现了重大突破。

2024年被认为是人形机器人产业化“元年”,人形机器人已经从早期的简单模型发展到如今具有高度集成和智能化的阶段。未来,人形机器人将凭借其性能优势在工业、生活等各领域高速渗透,潜在市场空间达上百亿美元。

根据Stratistics Market Research Consulting数据,预计2022-2030年全球人形机器人市场CAGR有望达到63%,其中国市场规模从2022年的2.5亿美元增长至2030年的105亿美元,CAGR为59.4%。

第一财经深度调研此次参会人形机器人本体厂商和核心零部件公司,进一步了解人形机器人的产业化进程和行业投资机会。

1、多场景落地应用,小规模量产在即

人形机器人产业正在从概念走向实用化,多场景落地应用正逐步成为现实。人形机器人的产业投资也从关注概念走向关注企业量产情况。除了B端商业及工业场景的应用,C端人形陪伴服务机器人也逐渐走向现实。

在B端尤其是工业场景的应用,特斯拉、优必选等企业的人形机器人在大模型技术的加持下已经实现在智能生产线的应用落地;而C端场景的应用上,由于家务场景多达一千多项任务,目前家庭服务人形机器人能够实现的任务尚不足十分之一,走进千家万户仍需要时间。但家庭陪伴人形机器人有望在年内落地。优必选此前就预计,在2024年年底、2025年年初,会推出一款家庭陪伴功能的人形机器人。

需要注意的是,投资人在关注各大厂商小规模量产情况的同时,需格外注意各大厂商交付后在实际应用场景的性能情况。某头部机器人厂商表示,大规模量产在技术上并没有太大难度,主要难度是下游对产品的需求度,而这取决于目前小规模试点应用的情况。

2、“大脑+小脑”,大模型实现具身智能

2024年,人形机器人行业在具身智能领域取得了显著的突破,基于通用大模型、数据集、高效计算架构、多模态融合感知等关键技术,为人形机器人安上聪明的“大脑”,使得人形机器人具备认知和决策能力,推动人形机器人走向实用阶段。

国内人形机器人厂商主要采用分层端到端的方案,即通过“大脑大模型”和“小脑大模型”互相配合完成任务。“大脑大模型”大多基于多模态通用大模型,完成对任务的感知规划,再通过API调度“小脑大模型”驱动关节硬件完成执行。

例如优必选人形机器人Walker S接入百度文心大模型;智元机器人与科大讯飞签署合作战略协议,依托讯飞星火大模型进行联合开发;乐聚机器人夸父搭载的是华为盘古大模型。

在“小脑大模型”方面:

值得注意的是,特斯拉Optimus使用完全端到端的神经网络大模型,借助传感器和计算机视觉技术,利用海量数据不断优化训练过程,直接生成关节控制序列。按照智元机器人此前定义的G1至G5的具身智能技术演进路线,特斯拉目前进入G4阶段,国内大多人形机器人厂商目前仍在G3阶段。

在“小脑”操作大模型领域,各大厂商刚刚起步,多技术路径同步发展。操作大模型决定了人形机器人在任务执行侧的准确度,是大规模商业应用场景落地的前提,需关注各大厂商“小脑大模型”技术进展及落地应用情况。

3、具身智能训练数据仍较为短缺

由于训练机器人所需的物理数据不如文本数据量大且易获得,相较于图文大模型千亿规模的数据训练量,目前机器人数据集量远不能满足机器人达到通用大模型的需求。目前解决人形机器人训练数据短缺的问题,一方面通过强化学习算法提高模型训练效率,一方面则通过仿真平台合成数据,建立数据开放生态。

银河通用自研合成了千万级的场景数据以及十亿级的抓取数据,在合成数据的训练下,其盖博特人形机器人目前已实现抓取随机放置的透明、高光等物体成功率在95%以上,进一步掌握类似开柜子、开抽屉、晾衣服等灵巧手泛化操作技能。

智元机器人构建了一套完整、全流程的数据采集、应用的方案AIDEA,包含AIDEA ML机器学习平台和AIDEA Sim仿真平台。预计智元会有百台以上自由部署机器人专门用来做端到端的数据采集,也将于四季度开源基于AIDEA的百万条真机、千万条仿真数据集,以积极建设开放生态。

各地人形机器人创新中心也在积极建设人形机器人训练场。上海人形机器人制造业创新中心孵化的“开源道场“MiniGym”,2024 年计划上海打造100个人形训练场,2027 年计划在各个城市、各个场景打造 1000 个训练场,100台采集设备,构建 1PB 数据集(每周生产 5TB+)。北京创新中心自主研发的通用人形机器人母平台“天工”的训练基本都是在虚拟的世界完成的。

数据对于训练人形机器人具有至关重要的作用,它直接影响到机器人的感知能力、思考和决策能力以及行动执行能力。大模型通过大量数据学习,让机器人理解任务意图,并迁移到下游任务中,高质量训练数据能够有效提升人形机器人场景泛化能力。除了关注各大厂商训练数据获取方式,同时也可以关注与各大人形机器人创新中心合作生态共建情况。

4、触觉感知是人形机器人精准控制的关键

人形机器人的视觉和听觉在深度学习算法以及人工智能的支持,已经发展较为完善,但在触觉方向上的技术进展要落后于视觉及听觉,触觉传感器为人形机器人提供了与环境进行物理交互的能力,是实现高级机器人功能和应用的关键技术之一。

触觉传感器使机器人能够通过接触来感知周围环境,从而实现更精细和复杂的交互。同时借助触觉传感器,人形机器人能够进行精确的操作,如抓取易碎或形状不规则的物体,实现平稳且准确的握持,同时可以帮助机器人感知施加在物体上的力,这对于手术或精密装配等需要精确控制力度的场景中至关重要。

由于触觉涉及物理量过多难以解耦,触觉传感器研发难度大、精度提升困难,成为人形机器人急需突破的关键技术之一。

触觉传感器企业帕西尼感知科技称,该公司的核心产品已应用于国内外头部机器人企业,且在多维触觉传感器领域保持出货量、市占率领先。该公司在今年世界机器人大会上展示了其标杆性的第二代多维触觉人形机器人TORA-ONE,还推出了第二代多维触觉灵巧手DexH13以及多维度触觉传感器PX-6AX GEN2。

作为人形机器人精准控制的关键,触觉感知的相关发展与应用将进一步推动人形机器人商业化走深走实。目前国内柔性触觉传感器仍处于产业化早期阶段,受益于人形机器人的需求驱动,有望加速国产厂商技术更迭和市场空间提升。