从地平线拆分后,「地瓜机器人」不做本体,想做具身智能“卖水人”丨早期项目
作者丨邱晓芬
编辑丨苏建勋
当AI掀起全新一波机器人热潮之时,恰恰也让机器人的研发变得更复杂了。
过去的机器人研发并不需要复杂的AI、数据工具,只需要潜心解决硬件控制的问题。而AI时代,行业对于机器人的新要求是,需要逐渐从专用走向通用。
但供应链本身似乎并未准备好迎接这种挑战。尤其是,当机器人领域的技术路线、数据标准、机械本体结构、算法路线都尚未收敛之时,「地瓜机器人」CEO王丛向36氪表示——机器人行业供应链,像是处于“鸡生蛋,蛋生鸡”的状态,种种难题还层层耦合。
于是,当从汽车芯片厂商地平线分拆、成为一家独立公司之后,「地瓜机器人」并非想涉足机器人本体,而是想从上游切入,通过提供机器人的核心计算平台(也就是机器人大脑的一部分),让机器人本体厂商们得以不再“重复造轮子”,减少不确定性。
王丛向36氪介绍,他们提供的机器人开发者套件产品,主要目的是,希望让机器人的开发,变得更智能、也更简单。
在9月20日,「地瓜机器人」发布了全新产品:号称“千元内最好的机器人开发套件”的RDK X5,这一套件主要面向广义的机器人产品,比如割草机、扫地机器人、四足狗等等;
此外,「地瓜机器人」还发布了专门面向具身智能的计算平台“RDK S100”,提供百TOPs级算力、并且功耗更低,能够支持大参数的Transformer模型,满足具身智能复杂的环境感知、理解和决策等任务需求。
对于做芯片的公司来说,出货量几乎是生命线,决定了未来的是否能降本,获得商业成长空间。王丛表示,「地瓜机器人」的商业战略是,通过覆盖广义的机器人产品,比如扫地机、割草机、陪伴机器人等等,来为公司贡献收入基本盘和影响力。
长远来看,从2024年起,「地瓜机器人」也开启了具身智能领域的布局。正像是当初地平线最初进入自动驾驶领域一样,“要投入,一定是在还没看清、但模模糊糊有趋势的时候,去加大投入”,王丛表示。
在商业化层面,「地瓜机器人」在具身智能领域,也已经和星动纪元、逐际动力、求之科技、清华大学AIR智能产业研究院、睿尔曼等厂商合作。
在王丛看来,很多机器人背景的人才,都会觉得具身智能的落地尚且遥远,恰恰是做大模型的人,对具身智能更有信心。如果能将两拨人凝聚到一起,或许就能把具身智能这件事做成。
从汽车领域切入机器人,这一赛道既新,也不算陌生,「地瓜机器人」有着一定的优势。目前,有不少的机器人厂商的打法是,尝试将自动驾驶领域的基础技术,复刻到机器人上。
比如,特斯拉正将汽车领域的Occupancy占据网络、Dojo的数据闭环系统、视觉感知的模块,用到他们的Optimus机器人领域的研究。机器人厂商Figure也在尝试用双目摄像头,来进行环境感知和捕捉。
王丛表示,自动驾驶本质正是个计算复杂度高度复杂的一种机器人,而地平线与「地瓜机器人」的技术架构上都是通用的。
对于机器人的未来,王丛判断,机器人领域会是一个开放性的市场,不同的机器人品类可能会有许多不同的玩家,并且只会在特定的品类下有特定的收敛。“而我们希望在成百上千的机器人企业中,成为那个底座”,王丛表示。
附:36氪与王丛的交流记录(略经摘编)
AI让机器人研发更复杂
36氪:地瓜机器人的定位是?后面会去慢慢涉及到机器人本体的研发吗?
王丛:地瓜机器人的定位是机器人软硬件通用底座,专注提供从端侧的旭日智能计算芯片和RDK机器人开发者套件,到广泛兼容的机器人操作系统,再到云侧的机器人云端开发环境和机器人算法中心。
我们不做本体,这是很明确的。当然我们会和很多的合作伙伴去一起发布一些本体,但凡是本体纯机械的部分,那都是由我们合作伙伴去做的。
36氪:随着AI出现,对机器人的研发提出了什么新的要求?
王丛:过去机器人研发不太需要AI、数据工具,但随着AI的兴起,机器人的研发日益复杂。芯片需要足够的算力,AI算法的选择也成为一大挑战,每年数百篇学术论文涌现,如何挑选最适合且与芯片高度兼容的算法,都是繁重的任务。
对于低阶机器人和高阶的具身智能,面临的困难各有差异。
低阶的机器人,功能和技术路线相对明确,困难在于要去追寻一个综合成本更低的方案,不是指售价成本,而是整个研发成本等等都是最低。所以数据的泛化就是降低成本的关键。
对此,我们做了很多双目的算法、SLAM、V-SLAM,希望用纯视觉的方式帮助客户减少其他传感器的使用,结合更好的工具,用更低的成本满足客户的诉求。
高阶的机器人面临的问题会更复杂,当前工具也比较短缺,技术路线、数据标准也尚未确立。这些难题都是耦合在一起的,当机械本体的结构不确定,本身就会导致数据很难标准化;当算法的路线不确定又使得数据采集方式难以统一。
机器人行业现在就有点鸡生蛋,蛋生鸡的状态。
36氪:那你们怎么从不确定中找到确定性?
王丛:整个行业都在探索这些问题,但我们更多站在服务商的角度上进行思考,我们在尝试把那些重复造轮子的部分,抽丝剥茧之后找到其中共性的要素,率先进行开发和解决。
比如,特斯拉在自动驾驶领域应用的Occupancy占据网络和Dojo数据闭环能力,也用在了他的人形机器人产品中,这其中有一些视觉感知的模块是共用的。Figure也是用好几对双目摄像头去捕捉周围的环境,双目扫地机、割草机同样如此。
针对这些共用的部分,我们就会先把这套系统给做好。
算法到最后是哪一个钥匙能够打开智能的那把锁,我们也不知道。很多个算法路线都在尝试的过程。
我们现在自己也搭了一个人形机器人,采用的是轮加臂的形态,它能从另外一个屋子拿个东西递给我,但这些方法到底是不是那把钥匙,现在还没有定论。所以先把确定性的做好,同时去尝试不同的技术路径,这就是我们当前的工作内容。
36氪:现在这些大模型对于机器人本身会有什么样的帮助?
王丛:high level的理解上,云端的大模型做的都很好,但很多的问题是,大模型结合到实际场景中的gap比较大。
36氪:中间这个gap是怎么产生的?
王丛:对于机器人来说,宏观的任务拆解很好理解,比如让一个机器人去帮我递一杯咖啡,它可能会把这个任务拆解成——推理咖啡在哪、打开咖啡机等等一系列子任务,然后本体就要开始去做执行了。
这当中会遇到很多挑战,比如,不同的咖啡机、杯子样子不同,杯子如果在洗碗机里也很难,很多洗碗机是一只手打不开的,一般是得扶着去打开。
虽然我们的技术确实还不错,很快能做一个原型出来,但真应用到现实各种各样的环境里去,还有很大挑战。
36氪:你们有大概算过机器人平台,在整个机器人里面占成本的百分之多少吗?
王丛:我觉得现阶段给答案都是不准确的。但凡在一个产业还没有定型的时候,它的成本结构都是不确定的。现在人形机器人的定价,最便宜的有5万块钱,甚至有卖100万的,价格空间这么大,很难说芯片在里面占比是多少。
早投入,才能更好地拥抱具身智能的未来
36氪:芯片行业的出货量是非常重要的,它决定了你后面的成本怎么去降下来。但是机器人行业的商业化还没有完全验证,那咱们后续有什么打算?
王丛:芯片确实要跑量,但地瓜机器人跑量不靠人形和具身智能,靠的是扫地机、割草机,这些产品可以帮助我们把机器人的基本盘、影响力建立起来。具身智能还处于早期阶段,我们希望通过我们推出的产品来支撑长线发展。
为什么定这样的战略?如果选择单一的长线战略,无法确定企业能否生存到那一刻,人形真的跑起量来,是5年还是10年还不好说,所以我们要去提前布局市场,但不能全部投入到这件事情上。
企业的战略是不能赌的,你无法判断行业的风口何时到来,唯一能做的就是不断前进。我觉得真正作为CEO,要控制节奏,要判断哪个时间点投入,投入多大的精力,怎么切入,这是非常重要的考验。
36氪:人形是什么时候开始布局的?
王丛:今年年初开始做的尝试,那会其实已经开始和一些客户沟通早期需求,我们自己这边也有一个小的team,去做一些这些算法的调研尝试。
36氪:人形机械领域对于咱们公司的意义是什么?
王丛:现在的机器人研发还是蛮难的,链条长,坑又多。一个创业公司没个大几十号人,没有一两个亿的资本根本做不出来。
我们最终是想让机器人变得更智能,开发变得更简单。一方面要让行业的门槛降下来,解决大家入门的问题,同时也要不断的去拉高智能的天花板,这样行业才能发展起来。
36氪:你信具身智能的什么?
王丛:我们从第一天开始就想做机器时代的Wintel,但是这条路确实很长。与其说我们信具身智能,其实信的就是我们想让更多有意思的智能的机器人做出来,不限制在具身智能这个字眼上。
36氪:什么叫有意思的机器人?
王丛:比如一个给你叠衬衫、熨衬衫的机器人,或者帮助养猫的家庭做清理。如果很多机器人能帮助我解决很多实在的问题,我们就会觉得有意思、很开心。
36氪:机器人这个timing你预期还要多久?
王丛:我觉得具身智能至少有个五年,大家会先会在一些行业的特定领域去看到一些应用,走进消费者这一端,可能会花更长的时间。
具身智能现在特别像地平线早期投入自动驾驶的时候,那时候很多人还会质疑自动驾驶的前景,但如果地平线没有在当时那会儿的投入,那也看不到现在。
投入一定是在还没看清,但模模糊糊有趋势的时候,去加大他的投入。
要做成具身智能,需要软硬兼施
36氪:国内的那几家比较知名的机器人厂商,计算平台用的是哪个厂商的?
王丛:国内普遍用的是英伟达Jetson。他们有两个型号,一个70T,一个100T。我们在计算性能上是差不多的,但是一些服务、平台会更有优势。
36氪:进入到具身智能领域后,你有没有感觉,泛机器人领域和机器人领域有一些不一样的地方?
王丛:我觉得现在有一个很有意思的现象,如果某一个人是机器人背景出身,都会觉得具身智能不落地。而且,但凡是做具身智能的人,过去都不是做机器人的,基本是原来做深度学习、纯AI的这波人,都没做过机器人。
很多时候,做机器人的人确实过去经历过很多的坑,知道做成一个机器人的量产有多难,所以会觉得还有很长的路要走,尤其又碰到硬件很复杂;
软件的人可能更多看到大模型等等的这些爆发之后会更有信心一些。我觉得每一个时代都是这样,都会有两拨人,如果两拨人最后能逐渐地聚合到一起,那事情就做成了。
36氪:您是属于哪一拨人?
王丛:地瓜机器人这边有过去很多做自动驾驶的、做算法的人、有在机器人公司做过完整闭环的人、芯片的人混合在一起。我觉得最好的状态是,让不同的人融合在一起去朝着一个目标去走。一个小团队的核心竞争力有多种维度,但本质上还是聚集了什么样的人。
36氪:地平线在汽车芯片领域拿走了英伟达的很多份额,现在机器人领域你们其实遇到的也是同一个对手,是不是也在逐渐复刻汽车领域的经验?
王丛:自动驾驶是计算复杂度最高的一种机器人,我们有很多过去很多在自动驾驶方面的经验,很多技术架构都是和机器人复用的,这是我们最擅长的点。
但是汽车和机器人天然的市场状态就很不一样。汽车的客户很收敛,最后需要一家公司提供更极致的一套解决方案,收敛的市场最终的竞争格局都是这样。
机器人未来是一个开放性的市场,只会在特定的品类下有特定的收敛——比如说,扫地机市场格局已经相对比较收敛了,但是五年前有二三十家,现在不到十家。机器人品类太多了,可能每一个品类都有那么十家。
我们更多希望帮他们解决底层通用性、重复造轮子的问题。地瓜机器人的定位就是软硬件通用底座,来支持成百上千的机器人企业。
36氪:地平线、余总对于咱们这家公司的这个要求是什么?
王丛:余凯希望看到当机器人这个行业真的发展起来的时候,地瓜机器人能够成为最核心的一环,在我们的眼里,只有终局那个局面是最重要的。
36氪:分拆是怎么考虑的?
王丛:这其实是一个很自然而然的事情。过去在地平线,机器人部门就已经是一个相对独立、闭环的业务单元,也在余凯的支持下获得了很大的发展空间。当下是我们看到机器人这个 timing 差不多要来了,因此选择独立出来,对于招人、服务客户都是一个更好的方式。
36氪:你过去的经历?
王丛:我在2018年加入地平线的AIoT部门,当时做了很多AI+行业,也给我很多积累,基本上没有我没跑过的行业,包括工地、零售店,医院等。因为这段经历,我把很多的商业逻辑、怎么做技术、怎么做客户都摸了一遍。
2020年开始,地平线成立机器人事业部,从那个时间点开始逐渐布局整个机器人业务。
36氪:这家公司为什么取名“地瓜”?
王丛:从含义上,地瓜被称为“末日粮食”,它的根茎发达,在各种环境下都生长,能够去养活所有的全人类。我们也希望这家公司能够像它一样,无论是在贫瘠的山地,还是肥沃的平原,都始终以顽强的生命力,用不断向下生长的根茎,加速机器人产业生态的繁荣。
36氪:你们现在海外和国内的占比大概是什么样?
王丛:当下还是以国内为主,今年一二月份定了出海的战略了,最近开始逐步经营起来了,完成了很多渠道搭建和法务法规等准备工作。
end
end