人形机器人井喷前夜|星动纪元陈建宇:产业有可能以超预期速度发展
8月19日,星动纪元官宣发布新一代人形机器人——星动STAR 1。但这并非该团队第一代研发的机器人。
早在2022年,星动纪元团队完成了第一代人形机器人的研发,之后不到两年时间里,他们的人形机器人进行了6次迭代。
星动纪元创始人、清华大学交叉信息研究院助理教授陈建宇在机器人领域已经有10余年研发经验,曾经涉足四足机器人、机械臂、无人车等。
他在接受红星资本局等媒体采访时表示,未来人形机器人的具身智能如何去做,仍有最大的不确定性。如何实现通用的具身智能,目前最前沿的学术界都还很难回答这一问题。
但是他也指出,在数据驱动的时代,整个产业有了阶跃式发展的可能。人形机器人完全有可能以超出大家预期的速度发展。
他告诉红星资本局,去年国内布局人形机器人的企业并不多,但今年包括整机和零部件企业至少涌现了几十家,同时还带来了不少新品。可以看到整个行业都在快速发展着。
人形机器人最大瓶颈:
依然在具身智能
今年,人形机器人已经开始进入小批量量产阶段,部分企业还给出了下半年时间表以及产品售价。但对于量产一事,陈建宇认为当下还无需过于关注。
“现在人形机器人真正的问题不是量产。是否真的有这么大客户需求在,以及技术能否达到,这些才是规模化量产的前置条件。”陈建宇认为,现在的人形机器人还不足以能完成一些特别复杂的事情,这是它的最大卡点。
“人形机器人现在最大的技术瓶颈依然在具身智能。硬件决定了人形机器人应用落地能力的上限,但是目前人形机器人产业拥有的硬件基础支撑起来的应用上限,具身智能算法还暂时没有达到。”
他指出,人形机器人的硬件基础本身能够支撑它完成的一些任务,由于现有AI算法的能力不足,目前的人形机器人还无法真正实现这样的产品力。
在陈建宇看来,当前现状是大家还没有真正找到一个引爆需求点的场景,正在卖的人形机器人也并不是为了满足真实市场需求而做的,更多是为一些早期尝鲜者提供,由此产生的销量不会很大。一定要解决诸如工业场景这样足够大的场景中的某些需求、能够提供一个非常有价值的解决方案,才能推动人形机器人实现规模化量产。
在量产推进方面,特斯拉是否会先人一步?陈建宇认为,特斯拉的优势在于场景,自家的车厂可以完全开放去收集数据和训练,推进速度可能会快些。“马斯克的资源足够丰富,他可以做的更大胆。但一些技术难点还是需要有时间成本。”
对于星动纪元自己的商业计划,陈建宇表示会先从灵巧手开始商业化,会逐步根据市场需求进行后续的产品迭代。陈建宇强调了性能的重要性。“需要它真正能干活,甚至是人干不了的活,这对力量、效率都有比较高的要求。”
人形机器人迭代速度正越来越快
人形机器人的落地应用,到底是缺少刚需场景,还是技术不够成熟?陈建宇认为两者都存在。“人形机器人还是个全新的产品品类,需求虽然客观存在,但大家还要找到匹配的需求点,这个仍在探索。”而在技术方面,陈建宇认为还需要再有一定程度的发展,比如力量要做全,还包括执行能力、行走能力等。要让它逐步的“越走越快,越走越稳”。
不过陈建宇对整体产业发展是乐观的。“很多人看到的是人形机器人现在能做什么,这些能力距离他们心中理想的人形机器人形态还有多远,但我看到的是以后人形机器人会发展成什么样。”
陈建宇表示,现在人形机器人技术发展非常快,以往人形机器人的研究方法,是以线性增长的趋势推动整个产业发展,现在在数据驱动的时代,整个产业有了阶跃式发展的可能。是以超出大家预期的速度在发展着。
以星动纪元自己为例,陈建宇表示,在人形机器人研发过程中他们积累了很多通用的技术,将这些技术能力逐步进行模块化后,研发新产品时,很多模块是直接从之前产品中复用而来。“我们平均一代人形机器人产品几个月就能迭代完成,而且这个迭代速度还在越来越快。”
同时大模型的加持也在助力人形机器人的发展。陈建宇表示,用大语言模型、ChatGPT直接接入就可以在任务规划、感知识别、语音理解等方面直接帮助机器人,同时要做一款机器人大模型,也可以比较多去借鉴大语言模型的底层技术。
“我们研究了人形机器人的操作大模型,基于语言和视觉信号的输入,通过操作大模型让人形机器人直接输出动作,相较而言,这是一个端到端的语言-视觉-动作大模型。”
团队在实验中观察到,通过大量的数据训练,操作大模型具备较好的泛化性,这使得人形机器人有了举一反三的能力——在进入到一个新的任务场景中,人形机器人只需要少量数据就能学会相关技能。
“在一个新的任务场景中,只对人形机器人进行了几个简单物品的操作训练,之后我们发现,人形机器人在面对更复杂的环境和物体时,在没有进行针对性训练的情况下就能够准确地进行相应的操作,这就让人形机器人具备了泛化性。”
红星新闻记者 王田
编辑 杨程