对话宇树科技王兴兴:人形机器人体量尚未成规模 5年内会出现“iPhone时刻”

《科创板日报》8月22日讯(记者 李明明)人形机器人被认为是最容易适应现实世界的机器人,其应用场景还在不断拓展。因此,人形机器人也逐渐成为创投领域的热门赛道。

作为业内头部独角兽,宇树科技越来越多地受到市场关注。近日,宇树科技人形机器人G1量产版发布。据介绍,G1量产版具备了大规模生产能力,性能和外观都得到升级,而它的售价仅9.9万元起。

在2024世界机器人大会期间,《科创板日报》记者专访了宇树科技创始人王兴兴,关于G1售价问题,他表示,“我们一直希望用更合理的价格提供产品给客户,产品有市场的前提是价格比较友好。” 但他也坦言,目前人形机器人的体量还没有完全起来,如果价格定得太低,可能对整个行业都不是好事,“一直不希望带头把行业做烂。”

(宇树科技创始人王兴兴)

王兴兴还表示,目前的大语言模型还是不能充分支持人形机器人大模型的发展,后者的技术路线各家也并不统一,现状很像ChatGPT出来的前一两年。

从人形机器人的“反对者”到“进场者”

《科创板日报》:在本届世界机器人大会上,宇树带来了哪些新品,有哪些想要重点展示的?

王兴兴:本次公司的展示场地比较大,我们带来了消费级四足机器人Go2和它的新型号Go2-W轮足版本,工业级四足机器人B2、B2-W,还有不断升级版的通用人形机器人H1,以及今年5月发布的G1人形智能体,仅仅3个月后又迎来了其量产版本,并在本次大会上首度亮相。

还有一些小的产品比如机械臂Z1也有展示。另外我们还带来了3D激光雷达升级版本,这款雷达此前还没有发布,可以让机器狗有更灵敏的感知、导航决策。

《科创板日报》:早期业界不那么看好人形机器人,请问宇树怎么看待外界的声音,公司在人形机器人上的发展战略是怎样的?

王兴兴:发展人形机器人基本上还是要追寻整个社会的共识节奏,因为雷军说过顺势而为,要追随社会潮流去做,如果做得太早或太晚,其实都是不好的。

像在2020年前,有很多投资人问我做不做人形机器人,当时我斩钉截铁地回答不做,主要由于当时全球范围内,在人形机器人的控制技术等方面,普遍发展的不理想,也看不到实用价值。

而近年,在马斯克的带领下,全球对人形机器人非常关注;同时,2022年底大语言模型的出现,使得AI技术产生了质变,让人们看到了AI在赋能机器人上的潜力。同年底,虽然宇树还没做人形机器人,但已经有一些客户找过来要购买。所以我们认为社会的共识、热度、客户的期待程度方面已经足够了,于是在2023年正式开始做人形机器人。(小K注:宇树科技成立于2016年8月,最早专注四足机器人的研发和销售。)

目前人形机器人体量尚未成规模,定价太低伤害行业

《科创板日报》:目前,宇树在机械和动力等方面的重要突破有哪些?外界评价宇树的硬件很厉害,对此你怎么看?

王兴兴:很多人对我们公司的印象是硬件公司,我个人还挺喜欢这个标签的,因为这也代表了大家认可公司的硬件。机器狗目前在全球范围内出货量一直较好,我们也在硬件上做了一部分软件升级。

比如去年的Go2机器狗,就集成了Open AI的大语言模型接口,人们可以跟它对话,它把识别的对话发送到Open AI的服务器上,然后把结果反馈给机器狗,让其去执行一些底层预设的功能,即把整个任务的编排和执行的操作权放在了Open AI的接口上。目前已经留了一些接口,授权给大语言模型接口,让它调用底层的一些功能,比如走路跳跃、拍照等。

此外,我们也做了机器人运动控制相关的强化学习。而对于让机器人“干活”这个重点,则需要用到一部分大语言模型的技术。比如采集图片的数据、机器人关节指令数据等,然后去做训练。

《科创板日报》:宇树和电动Atlas采用的都是三指方案,为何你们设计的是三指,而不是四指或者五指?

王兴兴:目前从全球来看,人形机器人技术方案尚未统一,最典型一个代表就是机器人到底有几个手指,到现在各家都没有统一的意见。

我们的G1人形机器人身高1.3米左右,如果给其装个五指,会导致手部较大,所以希望尽量减少手指。后来发现大部分产品上三指都能用,比如,抓取物品方面,三个手指可以抓得很牢,适用于超过90%的操作,在工厂的波士顿动力Atlas也是采用三指的方案。另外从实用性的角度,也希望其硬件越来越简单。

再分享一个观点:随着AI技术的成熟和进步,人形机器人对硬件的需求如自由度、数量、外观灵活度等将越来越低,甚至没有手指也能干活。

《科创板日报》: G1人形机器人的价格非常亲民,为何能够做到大幅度的降本?

王兴兴:我们一直希望用更合理的价格提供产品给客户,产品有市场的前提也是价格比较友好。G1价格目前比较有竞争力,是因为我们做四足机器人已经有不少年头,所以对机械方面,比如关节电机的生产、整体机械结构、传感器、整体电控系统芯片等,积累了较多的经验心得。

但是,哪怕公司目前已经有好几款产品的量产经验,在当下而言,我们量产一款产品还是较有压力,需要涉及和考虑的方面很多,在产品的设计阶段就要做好降成本的准备,每个零部件都要做的更加简化,比如每一个零部件细节的设置和精度要求、零部件之间的配合以及工艺要求、零部件的量产规划以及对生产工人的流程配合等都要考虑,所以对整体管理和成本管控的要求比较高。

目前人形机器人的体量还没有完全起来,如果我们把价格定得太低,可能对整个行业包括我们自身都不是好事,宇树一直不希望带头把行业做烂,如果把人形机器人定价为每台1万元,那会伤害整个行业。我们还是希望价格相对合理,如果后续整体产品体量和出货量提升的话,价格可以有一些更好的调整。

不超过5年 人形机器人领域将会出现“iPhone时刻”

《科创板日报》:目前大模型可重点解决哪些人形机器人研发的技术问题?可以满足后者的发展吗?

王兴兴:实际上,真正的人形机器人大模型再往下发展,目前的大语言模型还是不能充分支持的,个人认为,人形机器人大模型本质上和大语言模型有很大的区别。

举个最直观的例子,在工厂里工作的机器人,其完全可以不用讲话,给一张照片,或者敲一个指令过去,它就可以完成指派的任务,即“干活”。如果单纯需要人机对话的情景,那么可能一个手机就可以做好,所以我认为“干活”是最主要的点。

另外,在目前的人形机器人大模型领域,每家的想法、技术路线、包括共性都不太一样,比如机器人的相机应该装什么配置、装在什么部位、应该装几个相机、传感器数据应该怎么采、是否需要触觉传感器等。目前国外有些流派,连灵巧手都不想开发,就想开发机器人的爪子,而有些流派则希望手部更加灵活,即手指要更多,每个手指上有丰富的传感器。

所以,目前整体上,人形机器人大模型的技术路线尚未统一,因此很难评价每家路线是否正确,以及哪条路线推进到了什么节奏。现在人形机器人大模型的发展比较像ChatGPT出来的前一两年,大家已经发现了要往这个方向做,但实际上没有哪家敢打保票,保证自己的方向是绝对正确的。

《科创板日报》:近期,国内很多人形机器人厂商宣布其产品“进厂打工”,你如何看待这个现象?对此,宇树人形机器人未来规划是怎样的?

王兴兴:我认为“进厂打工”是一个趋势,但目前还处于试点阶段,过去几个月,我们与蔚来的汽车工厂有合作,部署了人形机器人去做现场搬运等服务,国内一些人形机器人厂商也和汽车工厂有类似合作。

我们目前更多还是售卖本体,但工业领域的应用场景也在推进中,比如部署人形机器人去工厂做一些简单的生产装配和搬运等工作,以及其他类型的支持,但并没有对此快速推进。原因是对行业比较有耐心,不打算近期在工厂里部署目标“XX台”的机器人,也没有给自己定很紧张的目标,还是尊重市场的反应,等到技术和产品、商业推广发展更好后,我们再去大规模的推进。

《科创板日报》: 人形机器人领域什么时候会出现一个iPhone时刻?AI大模型为机器人领域带来了哪些明显的能力的提升,目前还存在哪些挑战?

王兴兴:“iPhone时刻”也是市场非常关注的热点,而且是非常重要的一个时间节点。但是目前离“iPhone时刻”还有距离,因为其出现并不只是有一个特别的技术突破,实际上更多是一个综合性的突破。

只有在工业或服务业能真正出现终端产品,而且到达出货量暴增这个节点,才会产生“iPhone时刻”,所以它将会再远一点出现,可能要在未来3年或4年左右,但是不会超过5年

AI的技术进步很多情况下是阶梯性的进步,比如,在ChatGPT没有出现之前,大家一直认为大语言模型收效甚微,但出现ChatGPT之后,大家发现其很智能,在机器人的AI领域也非常重要。