人形机器人井喷前夜|优必选秦文龙:人形机器人大规模量产就看近2、3年

人形机器人发展到现在,进厂打工正在成为现实。优必选的Walker S已走进比亚迪(002594.SZ)、蔚来(09866.HK;NIO.US)、东风柳汽的汽车智能工厂,在流水线上与人类协作完成装配、质检等任务。

“人形机器人在快速发展阶段,从0到1是很快的,但它从实验室模型到工厂应用这一步必须走好。工厂需要的是成熟、稳定的产品,而非实验室级别的原型机。”优必选科技副总裁、研究院执行院长焦继超在接受媒体采访时如此表示。

优必选科技运动控制算法高级工程师秦文龙在接受红星资本局专访时谈到,数据积累在人形机器人发展上是一个重要共识。他认为人形机器人从小规模量产跨越到大规模的时间,或将发生在近2、3年里。

人形机器人更多聚焦于工业场景

仍需积累大量数据

红星资本局:优必选人形机器人的场景推进进展如何?

秦文龙:现在是POC(概念验证)阶段,所有机器人进入到真实的车厂,完成实训任务,为将来大规模落地做前期准备。这阶段我们会和客户一起商定一些场景,比如搬运、质检、分拣等,确定场景后我们在内部做技能开发与联合调试,测试通过后进入车厂完成POC。一轮结束后我们会评估实施效果,再判断下一轮POC的实施方向。我们POC的最终目的是积累实训技能,为批量落地交付进厂做准备。

现在我们更多聚焦工业,这种偏结构化的场景更适合于人形机器人现阶段落地,工作范围、任务内容都是相对确定的。家庭场景的环境还是相对复杂,不管是家务,还是跟家庭成员间互动,对机器人要求很高。

红星资本局:在技术上有哪些共识?大模型为人形机器人带来哪些变量?

秦文龙:人形机器人现在技术上基本有比较明确的路线,就是要积累大量数据,具身智能强调通用性。实现通用性就需要大量数据,要让人形机器人自己学会技能。

数据对于人工智能是重要的,对人形机器人也一样。我们将深度学习、模仿学习、强化学习这些方法,应用到人形机器人身上,已经展现出技能泛化的效果,比如抗干扰的能力、拆解任务的能力。但现在的机器人的技能学习还处于初级阶段,因为人类在做这件事情的时候还是很复杂的,所以后面还是需要继续积累大量数据,让人工智能的scaling-law也映射到人形机器人上面去,实现智能水平的显著提升。

大模型带来的变化一个是交互能力很明显,另外一个就是任务拆解。原先没有大模型的话,机器人每一步做什么需要预编程。现在大模型充当了一个很好的大脑的角色,做任务的拆解,去和人做一个交互。人形机器人智能水平的发展,将随着人工智能、大模型的技术发展同步前进,这两个技术是强相关的。

红星资本局:各个场景间的技术和经验是否是一通百通?

秦文龙:各个场景之间的转换,模型变化上没那么大,更多还是数据,比如工业场景,只采集了工业场景的相关数据,这时候训练出来的就是一个工人;如果需要家政服务人员,那“喂”的数据就是和那个场景相关的。数据相对于模型更关键,模型本身具有一定的通用性,通过同一个模型,可以既训练它成为一个会打螺丝的工人,又可以训练它成为会做家务的保姆角色。

数据本身采集的过程不会很困难,但数据量的积累是需要时间的。一线数据肯定是最好的,我们内部也会在简易场景、仿真场景去生成积累。但非常重要的一点是,你要很清楚人形机器人要用什么场景中,你才能知道现在要收集什么数据。

国内外人形机器人发展“齐头并进”

国内企业有应用场景的优势

红星资本局:在工业场景的机器人很多,人形机器人能做什么?

秦文龙:人形机器人区别于工业机械、协作臂的优势就是通用性。现在我们只让它打螺丝,或者只让它搬运、只让它质检,但是本质上是可以一台机器实现三个功能的。

我们去企业调研发现,汽车生产线有大量的焊接机器人、AGV(自动导引运输车),但依然有大量工位需要人工来做,特别是有一些工作甚至要长时间站立或等待,目前工业机器人没有办法很好地完成这些任务的自动化,可能涉及到对现场做一定的改造,比如说要实现整个物流的自动化,需要对整个车间做改造,对企业来说是巨大的成本投入,也有很大风险。

要满足通用性要求,要能快速部署对产线不做大量改造,这样的工位,人形机器人就有优势。人形机器人可以小规模先试点,快速看到效果。

人形机器人不是在跟现有的工业机器人、协作机器人去竞争,都有各自的适用范围。对人形机器人而言,它是初期进入到工业落地的阶段,还没有到要“卷”的阶段,大家还都在尝试。

红星资本局:我们看国内很多企业会对标特斯拉的擎天柱,在国际竞争上优必选有何优势?

秦文龙:国外也是一个初期、技术验证的阶段,应用端我们国内有应用场景的优势,我们有更多的制造企业。技术层面,我认为更多是“齐头并进”或者各有优势,也不存在技术代差。特斯拉擎天柱optimus也只是把机器人放到了车厂里面,做了一个分拣这样的单独动作。

人形机器人落地是很复杂的事,每家公司都是分阶段在做,先是几十台、几百台的小规模、小批量,再到成千上万台的大规模。

对我们来说,不会所有的技能都去训练。而是通过POC去了解客户、场景和需求,需要什么样的技能,就去对应训练。这样再进阶到下一个量产阶段,两个阶段时间跨度在我看来可能也就2、3年。

国外和我们在这方面也是你追我赶,距离完成高水平的多任务、完成客户的完整需求方面还有一定差距。

现阶段,大家在应用场景上还并没有完全聚焦,国内企业作为最接近应用场景的一方,我们更需要抓住自己的优势,更需要去聚焦找到场景。

红星新闻记者 王田

编辑 邓凌瑶