对话宇树创始人兼CEO王兴兴:通用机器人的iPhone时刻还需要3-4年

出品|本站科技《态度AGI》对话栏目

作者|崔玉贤

编辑|丁广胜

“我认为,机器人目前最大的问题还是机器人AI没有突破一个临界点,所以现在的机器人看上去还是有点笨拙。”

宇树创始人兼CEO王兴兴接受本站科技等媒体采访时如此评价道。

2024世界机器人大会期间,宇树抛出一款炸裂的产品:人形机器人G1,售价仅为9.9万元,而且还是量产版。产品刚发布就引来了英伟达科学家Erwin Coumans的转发,并称迫不及待要整来一台做实验了。

宇树的人形机器人G1成功将双足人形机器人的价格卷到了10万元以内,要知道行业内其他企业的人形机器人售价还在15万-20万,或更高的价格。

对于G1的定价,王兴兴表示,宇树还是希望有更多的人能把(人形机器人)用起来,能够在全球范围内推动行业进步,让更多人参与到这个行业进来。

“我们还是希望价格相对合理些,不希望带头把行业做烂了,明后年如果整个出货量更加提升,机器人的能力也会越来越强,我觉得价格还有更好的调整。”王兴兴的言下之意,目前G1的定价并没有击穿行业底线。

对于机器人的判断,王兴兴思考的很务实。

他认为,机器人首要的是要能够干活。单纯的语言大模型还是不够的,而是需要机器人AI大模型。“比如把图像的数据,包括机器人的关节指令数据,激光雷达或者别的数据加在里面。大家最近应该也听到了,像特斯拉在招数据采集的工人,他们直接招人去采集数据去做训练。这部分训练其实跟大语音模型没多大关系,更多的是一些模仿学习,而且这个模型结构跟大语言模型结构也会偏差比较大。所以这个方向是目前大家已经看到了。”

王兴兴认为,这一点(机器人AI能力)恰恰是目前整个机器人行业最大的一个限制。他认为机器人AI与通用AI相比落后了差不多10年的时间,机器人AI的能力需要突破一个临界点,这个临界点有点像ChatGPT的出现。

王兴兴认为,今年年底之前,至少全球有一家公司或有个实验室能把通用型的机器人AI模型给做出来。

但这并不意味是机器人领域的iPhone时刻。“因为iPhone时刻大家还是希望在比如工业或服务业能真正有终端产品的出现,而且标志着行业出货量暴增的节点,我觉得iPhone时刻还需要再远一点,可能还是要在3年或4年的时间,但是不会超过5年。”王兴兴认为。

以下为本站科技整理的宇树创始人兼CEO王兴兴对话的部分内容:

具身智能最重要的事情是能干活

问题:今天向机器人疯狂涌来的关注,背后都带着AI带来的机器人进步的判断,但是其实忽视了机器人本身的技术进步,今天宇树在机械和动力等方面的重要突破有哪些?

王兴兴:目前这一波机器人的浪潮,最主要就是AI带来的,因为AI大语言模型出来以后,大家觉得在信息领域已经做得非常好了,可以对话,可以语音交互。但真正解放AI的能力,还需要物理的机器人让它真的去干活,干活是大家首要期待的一件事情,这带来了大家对机器人的想象空间提升。

所以现在阶段,我一直认为对机器人行业最大的一个限制,还是AI不太够——AI模型、AI的训练数据集、AI场景的落地部署,都完全远远不够。

从硬件的层面来说,目前也是不够的,但是它没有理论上的门槛,它是工程上的问题,就是工程上要把成本做得更低,可以做得更好,外观更加极致,功能更加丰富,它的时间是可以预估的,可以这么说,如果哪一天有人把AI机器人的模型做出来,找我们定制机器人,我们可以保证年底之前直接给他做10万个人形机器人。只要加大产能,或加大投入研发的效率,甚至可以通宵,这完全都没问题。所以,目前最大的问题还是机器人的AI能力还没有足够突破。

当然硬件要做得更好,比如说这个电机的扭矩做得更大,减速器的寿命可以做得更长,负载能力更好,灵巧操作精度更高,视觉感知的分辨率更高,执行速度可以更快,这些方面当然要继续完善,但硬件不是一个最大的限制。

很多人对我们公司的印象是硬件公司,我个人还挺喜欢这个标签的,因为这也是代表大家认可我们公司的硬件。我们的机器狗在全球范围内出货量一直还是挺不错的,再加上我们也在自己的硬件上做了一部分软件,大家可能想象不到,像我们去年的go2这款机器狗,就集成了Open AI的大语言模型接口,你可以跟它对话,它把识别的对话发送到Open AI的服务器上,然后把结果反馈给机器狗,让它去执行底层预设的功能,就是让整个任务的编排和执行的操作权放在了Open AI的接口上。

像比如说向前走、机器人拍个照是底层的一些硬件,已经留了一些接口,有点类似授权给大语言模型接口,让它调用底层的一些功能。去年差不多八九月份,这个功能我们就可以用了,包括我们还整合了Open AI的多模态接口,你甚至(可以)问他前面有什么东西,他都能给你回答出来。

这是用外部的一些接口,我们机器人本身的一些运动控制的强化学习也是我们自己搞的。我们在AI方面也做了不少的事情,当然我们肯定不是说跟一些纯粹的AI公司去比,我们的AI投入跟他们比起来肯定是比较少一些。

我们还是希望真正是能把产品做得更好,最终能在工厂里、服务业、家用等场景真正产生价值。

问题:从目前人形机器人研发的角度看,大模型可重点解决哪些技术问题?主要应用在哪些方向?还请问大模型和人工智能的应用有望降低研发成本吗?

王兴兴:目前大家说大模型的时候,一般在说大语言模型或者多模态模型,这些部分肯定是可以给机器人用的,但实际上真正的机器人大模型发展下去,单纯的大语言模型还是不够的。你可能会它是其中的一部分,比如说你要跟机器人去沟通的时候,肯定是要语言部分,但我个人认为机器人的AI模型,跟语言大模型还是会有很大的区别。语言模型是机器人模型的一部分,但它不是全部,举个最直观的例子,比如在工厂里做事的机器人,他完全可以不说话,比如说给他一个任务,给他看一张照片,或者敲一个数字进去,让他干活,他只要能干活就行了,我并不需要让他说话。

我觉得对于机器人或具生智能来说,最重要的还是让他能干活,这是我觉得最主要的一件事,而不是说在家里的时候听你的唠叨或者对话,因为如果单纯只是对话的话,可能一个手机就可以做得很好了,我觉得干活是最主要的点。

而对于干活这个点,目前大语言模型的技术肯定是要用一部分,所以更多的要做一个机器人的模型出来,比如把图像的数据,包括机器人的关节指令数据,激光雷达或者别的数据加在里面。大家最近应该也听到了,像特斯拉在招数据采集的工人,他们直接招人去采集数据去做训练。

这部分训练其实跟大语音模型没多大关系,更多的是一些模仿学习,而且这个模型结构跟大语言模型结构也会偏差比较大。所以这个方向是目前大家已经看到了。

但是目前整个体系没有那么成熟,不像大语言模型,整个的风格结构,数据应该怎么对齐或者做一些什么东西都是比较清晰的。

问题:除了大模型AI技术之外,今年相较于过去它在产研和销售一线与过去发生哪些改变?比如说去年可能行业里有一些裁员或者说规模缩量,但今年感觉在一线情况观察来看的话,相较于过去有哪一些不同?

王兴兴:我感觉最近一两年,新的AI和机器人浪潮跟过去几十年完全是两个世界,因为技术和整个的社会认可度、资本的热度跟以前是完全不一样的。现在机器人和AI已经变成全球公认的一个事情,包括美国的几家大公司,国内的大公司,包括中央企业,地方政府对这个事情都非常关注,我觉得跟上一个几十年已经完全一个新的时代。

目前机器人AI大家还是觉得不太满意,就只能做一些固定的事情,比如说做训练,在一些地方可以做,但如果换个场景他就做不了,发言权不太够。所以我认为机器人AI与通用AI的发展相比,落后了差不多有10年左右。

但是我觉得会赶上来,原因很简单,就是这个行业越来越热了,有更多的聪明人,更多的钱在这个行业,有更多人去参与了以后,这个行业就会越来越好。

早些年因为纯AI的门槛比较低,整个行业内有大量的搞纯AI和传统AI的,可能比搞机器人的至少多有100倍甚至1000倍的人,所以导致这个行业发展比较快。

但是现在机器人行业最近一两年热了非常多,大家有更多的人参与,整个行业都拉起来,所以我觉得未来整个机器人的发展速度会比较快,如果还是按过去的那种AI机器人AI的进度,我觉得十几年或二十年都等不到,现在大家参与的人更多了,聪明人也更多。

通用机器人的iPhone时刻可能还需要3-4年

问题:您判断通用机器人领域什么时候会出现一个iPhone时刻?AI大模型为机器人领域带来了哪些明显的能力的提升,然后目前还存在哪些挑战?

王兴兴:通用机器人的iPhone时刻是大家非常关注的点,也是非常重要的一个时间节点。但是离iPhone时刻我觉得其实还有距离。

目前在具身智能或者机器人AI领域,大家还觉得机器人有点笨拙,只能干一些固定的活。今年年初的时候,我个人相对还是比较乐观的。我觉得在今年年底之前,至少全球有一家公司或有个实验室能把通用型的机器人AI模型给做出来,但是这个时间点,我觉得可能也不是AI iPhone时刻,因为iPhone时刻大家还是希望在比如工业或服务业能真正有终端产品的出现,而且标志着行业出货量暴增的节点,我觉得iPhone时刻还需要再远一点,可能还是要在3年或4年的时间,但是不会超过5年。

问题:在您看来目前人形机器人发展最大的瓶颈是什么?您个人比较看好哪个应用领域?

王兴兴:我个人一直感觉当下的所有机器人最大的瓶颈,包括人形机器人和四足或者清洁机器人最大的瓶颈还是基层AI的能力,在全球范围内都没有达到一个像初代GPT或者初代通用AI的能力,这是目前整个行业最大的问题。

目前机器人本身比如双臂机器人或者一个工业机器人,如果加了AI以后,它产生的人效比人低,比如速度比较慢,精度比较差,能干的活比较少,它其实很难替代工业上面人的价值,整个商业闭环没办法跑通。

所以我一直感觉就是如果机器人AI的能力能突破一个临界点,工厂里基本上一些工序能跑起来了,而且它的效率是比较高的,机器人价格也比较便宜,无论本体还是算力比较便宜,真正能产生比人效率更高,可以商业闭环,可以大规模推广起来的时候,我觉得是最有价值的。

当然目前可能硬件还是有些问题,比如硬件的机械臂的负载能力不够,精度不太够,成本有点高,但实际上这只是说是工程上的问题。

刚才也提到过,如果现在机器人AI哪家公司能做一个突破,我们年底前在硬件上可以直接给推出10万个机器人。

所以最大的问题我觉得还是整个机器人AI还是没有突破一个临界点,就有点像ChatGPT出来前一两年,大家可能现在看上去的机器人AI还是有点笨拙。

问题:作为一个业界人士,对未来机器人真的能帮助人干活,这个事儿有没有什么具体的期待?包括您刚刚也提到说目前是 AI还不到这个临界点,您觉得让机器人真的能干活或者更像人,需要从比如说是软件AI大脑还是说在机械力度去发力?

王兴兴:确实干活这个也是分好几个阶段的,我觉得目前的AI,比如一些模仿学习,如果是固定工位的,这个技术目前全球其实很多公司都能基本都能做,而且成功率基本上可以接近100%,针对固定的一个工位的工序的特殊的大量的数据训练,这是完全能行。

但如果稍微换件事情,他就要有新的数据去做新的训练,这样的事情目前当下已经能做了,而且也能做一些简单的商业化,可能商业价值不是特别大,做的事情比较简单一点,然后更进一步的话还是希望他能在工厂里面做更复杂的事情。比如说把一些零部件更好的装在一起,或者把一些零部件给拆了,或者做一些农业上的事情,他能做的事情更复杂,而不是非常简单的抓取动作,我觉得是可能明、后年是基本可以做了。

更往前一步的话希望真的是非常通用,比如说我随便拿一个机器人,只要给他看一张照片或者给他说一下,他就可以把这个产品给装起来,或者把这个桌子给整理一下;或者把一个机器人带到你家里,他也不知道你家原本什么样子,他就知道把房间给整理好,洗衣做饭,这种我觉得是第三个级别的事情。

最主要的还是AI软件去发力。刚才说目前最大的卡点还是AI软件,这个卡点没有突破,你哪怕把硬件做得再好也不行,你如果硬件做得再好,就变成传统的自动化行业去了。

最近到自动化工厂里面,机械臂其实用了很多,我其实有个感觉,就是我们现在做新机器人的公司,大家克制一下,不要把自己做着变成一家传统自动化公司。因为如果AI目前临界点不够的话,就会用一些传统自动化的技术去做一些事情。大家还是希望能把AI做好以后,做一些更大的传统机器人做不到的事情,这样更有价值。不然的话如果去跟自动化行业卷效率真的是卷不过的,人形机器人跟自动化设备减效率完全卷不过,因为自动化设备很多时候真的是你一秒钟可以干几十次,所以说人形还是做更相对复杂一点,就传统自动化做不到的事情,更有价值点。

创业公司要保持对前沿技术的敏感度

问题:您如何看待现在智能机器人的行业的竞争格局?因为现在比如说像马斯克或者小米,他们其实都在这一块投入,同时他们在AI这一块的投入也是非常大的,在这种情况下,您觉得中小公司的机会在哪?

王兴兴:中小公司竞争这个问题也是我一直在考虑的问题。

我们公司也成立8年时间了,如果在2016、2017年的时候我可能没办法回答这个问题,回答的有点不够透彻,但是过去几年我们也跟大公司也接触过不少,包括国内的几家大公司,海外的几家大公司,我觉得中小公司目前最大的点就是得保持足够的前沿技术的敏感度,你得看到未来,你得足够灵活,如果能预估未来1年2年,甚至是5年以后的整个技术路线,产品格局,世界格局是什么样子的,你提前做布局去做,你肯定死不了,能不能做第一不太清楚,但至少可以做前期还是非常有可能的事。

而这方面的话其实大公司其实有点难,因为大公司内部的流程,内部团队的相互竞争,然后他的资源和沟通的顺畅性,哪怕甚至有时候大公司招人都没有小公司招人方便,因为它有内部的整个流程体系做限制,所以这方面其实要做的事情很多,而且另外一方面你得真正把握技术和产品的未来的路径方向,这样肯定是可以成功的。

问题:关于成本这个问题,其实G1这个价格,其实市场反应还是蛮大的,想问一下通过自研为什么能够做到一个这么大幅度的降本?现在很多公司的观点是觉得说现阶段可能降本并不是最重要的事情,随着供应链的进步,但您之前也说通过成本、通过量来降本,其实是一场巨大的幻觉,所以想请您还能不能具体讲一讲降本这个事情?

王兴兴:我们一直还是希望有更合理的架构提供产品给客户,因为大家也知道很多情况,产品有人买,前提是价格还是相对比较友好的,如果太贵了就买的人比较少。所以我们还是希望因为大家在全球范围内要推动整个行业进步,有好的硬件本体是非常重要的,就有更多的人参与进来这个行业里面。

我们一直希望有更多的人,哪怕现在功能不是特别多,有更多的人能用起来。我们的价格相对来说目前比较竞争力,原因也比较简单,因为大家也知道我们做四足机器人已经做了很多年了,所以我们对机械,比如说关节电机的生产,整体机械结构,传感器,整个电控系统芯片怎么用更便宜的芯片,有比较多的经验心得,四足机器人和人形机器人,它其实很多的设计都是非常类似的,大家也知道我们机器狗一台最便宜卖到9000多块钱人民币。

对比一下人形机器还是有点贵的,因为目前的量不够。目前人形机器人整个体量还没有完全起来,如果我们价格定的太低,可能对所有人都不是好事,对我们公司也不是好事,对整个行业不是好事,我们不希望带头把行业做烂了,还是希望价格相对合理,如果后续整个的体量,比如到明年后年整个出货量会更加提升,然后机器人的能力也会越来越强,我觉得价格还是可以有更好的一些调整。

降本的原因也比较多,把所有的零部件,哪怕一个螺丝钉各种方面设计的比较极致,然后生产上做到极致,这个是非常耗时间的。另外刚刚提到有量就降成本,确实量大了可以降成本,这是毋庸置疑的一件事情。

某种程度上大家公认的事情,不是最有竞争的点,其实最大的点是在设计阶段就要这样做降成本的准备,每个零部件要做的更加简化一点,要考虑一下能不能材料用成本更低的一些材料或者零部件能不能本来用两个零部件,能不能用一个零部件,这样的细节要考虑的东西还是非常多的一些事情。包括汽车也一样,大家像比亚迪成本管控比较好,基本上是公认的,目前新能源汽车里面成本管控最好,而且是利润比较好的,这是非常值得学习的地方。

问题:今年国内很多人形机器人宣布了进厂打工,虽然大多其实不具备一个实际操作,其实已经进入到工厂内去训练他的能力。目前您怎么看这个现象?然后宇树人形机器人的落地现状和未来规划是怎样的?

王兴兴:这是一个趋势,最早的话,像埃隆·马斯克最早提出的时候是需要他的汽车工厂有人去使用,所以这个也是目前像汽车工厂在这块是比较热衷的,像我们过去几个月跟比如蔚来的汽车工厂有合作,就现场部署了我们人形机器人去做现场的搬运,包括国内的别的一些人形机器人也跟汽车工厂有些合作。

目前基本上还是处于试点阶段,大家觉得这个方向有价值,共同推进一下去落地部署。但我觉得目前还没有到真正商业闭环,比如说一台机器人它产生的商业价值是正向的,就比人可能还更降低成本,我觉得目前还没有到这个阶段。

我们公司主要是卖本体,某种程度上并不是说我们一定要做工业,比如做科研教育、AI公司或者个人买来玩,我们也完全欢迎。

工业领域我们也在推进,比如说我们希望能不能去工厂里面去帮忙做一些简单的生产装配,或者做一些简单的搬运,我们也在推进这个事情,但可能推进的速度和效率没有那么快,我们公司对行业还是比较有耐心的,不是说一定要今年或者说明年一定要在工厂里要部署多少台,其实没有给自己定目标或者逼迫那么紧,我们还是尊重整个的市场反应。

问题:四足机器人在整个的品类当中,它的应用占比大概是什么样一个水平?随着人形机器人的快速发展,对于四足机器人来说是机遇还是挑战?这两个品类之间,您觉得可能会是一种什么样的促进作用?

王兴兴:对四足机器人的话像消费端、科研教育端还有行业端都有做。消费端的话,因为去年我们的产品单价更低了,所以今年的话整个消费端的增长速度还挺快的,因为有更多的客户使用,然后出货量其实增长速度还非常快,所以目前消费端可能占了大概整个机器狗里面的1/3左右,营收1/3左右,但具体的数据我也不太清楚。

但如果从出货的数量角度说,消费端的机器狗数量是最多的,因为它比较便宜,所以光淘宝上就卖了不少Go2。另外,你刚刚提到在人形机器人的加速下,四足机器人有哪些机遇,其实这也是非常有意思的点。

大家可能一直觉得我们公司做了人形机器人,会不会四足机器人顾不过来之类的问题,但实际上我们是整个团队,包括四足和人形机器人,其实很多人员是公用的,因为四足机器人以及它的硬件、电控系统、软件、OTA升级平台、后台 、AI算法等共用的地方非常多,所以我们一直坚持的观点是能共用的地方尽量共用了,包括整个AI体系,我们现在做的AI,不仅希望在人形上能用,机器狗上也能用。我觉得也正好就是通过人形机器人把四足机器人整个行业可以做得更好一点,因为原本我们没有足够的人力去把机器人的软件做得更好,但是现在为了给人形机器人做更好的软件,所以我们顺带把四足机器人软件也做好了。

还有包括比如说为什么我们人形机器人上有些方面,比如说我们现在人形机器人也支持远程升级,原因是什么,因为我把四足机器人系统远程升级的东西拿过来用了,所以这个也是现成的一些技术的共用。

关于《态度AGI》

本站科技重磅推出系列对话栏目《态度AGI》。过去三年,AI变革风起云涌,全球科技秩序正在重构,通往AGI的道路或许正在悄然临近。本栏目以AGI为题,将对话100位AI专家、企业家、投资人,试图拨开云雾,与大家一道见证AGI时代的到来。第十三期对话宇树创始人兼CEO王兴兴。

往期回顾:

《态度AGI》第一期:对话李开复:大模型创业狂奔一年 中美差距缩小 我十年不套现

《态度AGI》第二期:对话王小川:我们不跟进大模型价格战

《态度AGI》第三期:对话戴文渊:大模型价格战不解决核心问题

《态度AGI》第四期:智源研究院院长王仲远:GPT4不是国内大模型的尽头

《态度AGI》第五期:对话朱啸虎:5年后将没有独立的大模型公司存在,因为没有商业模式

《态度AGI》第六期:对话梅花创投吴世春:“中国大模型五虎”想要跑出来非常难

《态度AGI》第七期:对话跃然创新CEO李勇:做大模型应用 如何和巨头错位竞争

《态度AGI》第八期:对话智谱AI CEO张鹏:视频生成是AGI必经之路,超级App将在“不知不觉”中到来

《态度AGI》第九期:对话科大讯飞副总裁、研究院院长刘聪:中国大模型已从追赶对标走向自主原创

《态度AGI》第十期:对话360周鸿祎:魔法对付魔法,大模型安全问题得靠大模型

《态度AGI》第十一期:对话彩云科技CEO袁行远:超越ChatGPT,需要打开“黑盒”

《态度AGI》第十二期:对话傅盛:不看好双足机器人商业化,三五年都没戏