具身智能工业机器人,何必是人形?|甲子光年

一个柔性生产切线引发的难题与机会。

作者|赵健

2023年,微亿智造CEO张志琦在走访工厂的时候,经常看到这样令人困惑的一幕:一群工人在生产线上忙碌地工作,而工人不远处就是一台或者几台闲置的机械臂,在工厂的角落里安静地“吃灰”。

作为工厂自动化产线的重要一环,机械臂在焊接喷涂、装配搬运、机床上下料等环节发挥着重要的应用,理应在工厂有非常成熟的落地场景。为什么工厂不用这些花重金购买的机械臂上岗干活呢?

在与厂长交流后,张志琦恍然大悟,他将这一问题总结为“柔性生产的切线难题”。

柔性生产是指多品种、小批量的按需生产方式,以此适应多变市的场需求和激烈的市场竞争。在柔性生产模式下,长则几周,短则几天,工厂就会接到新产品的生产需求。当产品的大小、规格总是在变,工厂的生产线就需要重新排布——这一过程称之为“切线”。

如果采用机器人干活,每一次切线都需要重新将产线与机器人系统做适配。更要命的是,这周刚刚调试好的机械臂,很可能在下个月的切线中就不再适用了。对于工厂,尤其是中小型工厂来说,这是一笔不可承受之成本。

一来二去,这些工厂就干脆放弃机械臂,不如用人工来得灵活方便,很多机械臂也就落得个在工厂吃灰的下场。

张志琦看到的不是一家工厂的个例,而是大部分中小规模工厂正在经历的普遍状态。张志琦告诉「甲子光年」,直到今天,柔性生产的切线都是一个普遍的难题,没有通用的解决方案。

放眼全球,机器人装备的渗透率仍然较低。截止2022年,中国虽然已经是全球第一大的机器人市场,但每万名工人的工业机器人数量为392台,低于韩国(1012台)、新加坡(730台)、德国(415台)、日本(397台)等工业强国之后,还有很大的提升空间。

有市场需求的地方就会有市场机会。柔性生产的切线难题,正是微亿智造捕捉到的进入工业制造大市场的机会。

1.解决2000人工厂的生产力问题

江苏省常州市是重要的工业城市。在常州有一家“果链”公司,专门生产手机充电头。2017年时,这家果链公司一个3000多人的工厂里,有2000人专门做外观缺陷检测。

产品外观缺陷质检是3C、汽车等工业产品在出厂前必不可少的一道工序。在过去几十年,质检用到的工业视觉是今天看来非常简单的传统机器视觉算法,只能识别简单的长宽高、有或无等基本要素,如果涉及更多维度的外观检测,比如手机屏幕的表面缺陷检测,是碰伤、划伤还是裂纹,就只能依靠人类经验来识别了。

随着2015年后深度学习崛起,深度学习算法作为机器视觉领域中的主要算法,成为工业视觉技术迭代的的一大趋势。2018年,微亿智造正是抓住了深度学习算法在工业质检场景的落地机会而成立。

当时,常州这家“果链”公司的工厂每天出货200万件,每个质检员每天检测约10000片。长时间的工作往往给质检员的眼睛带来不可逆的损害,人员的流动性也非常高。因此,他们在市场上寻找能够用AI质检来替代人工的方式。微亿智造团队凭借更高效的混合视觉算法赢得了客户的青睐,双方就此展开了长时间的合作。

这家“果链“公司也是微亿智造的第一个种子客户,微亿智造为此定下了一个小目标:先用AI技术解放这个工厂2000人的生产力。

虽然微亿智造有很强的算法团队,但产品外观缺陷质检需要的不仅仅是一个算法,而是一整套包含了算法与硬件设备在内的完整解决方案。为此,微亿智造需要根据产品特质与质检需求,定制智能质检设备,完成不同场景的开发和应用。

这套复杂的解决方案在一开始的确解决了实际问题,一台机器最多能够代替16个人力。

但新的需求很快接踵而至。以最常见的消费电子产品手机为例,手机厂商每年会推出多款机型,尺寸、结构都有变化。如果产品型号要更换,生产线也需要重新切线,其中的光学设备、AI算法以及整台机器设备,都需要重新适配。

尤其是考虑到工厂越来越多的柔性生产需求,很多工厂可能长则几个星期,短则几天就要更换一次产线。如果每一次切线都要重新适配质检设备,成本将会无法控制。

在这样折腾过几次之后,张志琦意识到质检的方案亟需升级迭代了。

2.当算法公司开始玩机械臂

如何解决切线的问题?

第一个思路是,与自动化设备集成商合作,让这群“能工巧匠”研发一款更加灵活、适应性更强的设备,能够兼容更多的产品型号,来应对每一次切线带来的调试过程。但是,这不仅有很大的技术挑战,长期来看也只能是一个过渡方案。

思来想去,回到第一性原理,有什么自动化产品既可以满足质检场景的检测需求,又可以通过软件程序来灵活控制?在与一些机器人行业交流后,微亿智造团队把目光放在了机械臂上。

机械臂已经发展了近四十年的历史,是工厂自动化的重要一环,并且孕育了知名的工业机器人“四大家族”——ABB、库卡、发那科、安川。然而,在工业质检领域,却很少用到机械臂。

在传统3C产品或汽车行业中,机械臂被用于装配搬运、机床上下料等重复性强、但是运动并不复杂的场景,所以机械臂需要设定调整的点位并不多。然而,对于质检来说,即使是最简单的产品,各个边角拍下来也需要数十张照片,稍微复杂一点的产品可能要拍摄数百张照片,这些点位的数量与精细度可能是汽车、3C等产品的几十上百倍。

工厂对于生产效率有要求,如果要用机械臂,为了在更短时间内更快完成产品各个点位的检测,只有两个办法,要么就增加机械臂的数量并行处理,要么就提高单台机械臂的运动速度。

那时候机械臂的价格还没有现在这么低,当时一台工业机械臂可能要20万元。增加机械臂数量意味着成本的翻倍,对于工厂而言很难接受这一方案;如果想要提高机械臂的运动速度,就需要对于机械臂的进行更精细化的运动控制,告诉机械臂什么时候应该快,什么时候应该慢,什么时候飞行通过沿途点。这就需要进一步触及机械臂底层的运控算法,但传统的自动化设备厂商一般只会通过机械臂厂商提供的编程界面进行程序设定,而机械臂厂商也很少开放如此底层接口。

基于这两点原因,机械臂在工业质检领域的应用非常少。张志琦告诉「甲子光年」:“我们也是一头跳进这个坑里之后,才明白过来为什么过去没有人用机械臂。”

为了从定制化的陷阱走到标准化的交付,微亿智造决定把这些难点一一攻克。从技术视角来看,既然质检的难点在于机械臂自身的运动控制范围、精度无法匹配质检多点位的要求,那么能不能优化这套控制体系?

微亿智造想到了绕过机械臂的控制器,直接通过底层算法来精准控制机械臂的轴,形成微亿智造自主可控的机械臂体系。这件事的难度在于,控制器关乎机械臂核心的运动规控的核心算法,这些都是机械臂厂商的核心技术壁垒,怎么会轻易将核心算法对外开放呢?

张志琦半开玩笑地说:“运动控制背后的算法,都是四大家族的机密所在,不知道锁了多少层保险箱。”

最开始为了跨越机械臂预设的运动控制的算法限制,微亿智造找了很多家机械臂厂商谈算法的开放合作。经过很长时间的努力,发那科终于答应了。发那科向微亿智造授权了J519实时高速通讯协议,通过微亿运动规划算法,机械臂的各轴伺服机构能够精准、高速执行轨迹时序及IO信号触发。

微亿智造是发那科在国内最早获得该协议授权的公司之一。张志琦表示,很少会像微亿智造这样把机械臂用到了极致的状态。

在玩转机械臂之后,张志琦常被问到一个问题:“微亿智造到底是一家机器人公司还是AI公司?”张志琦一般会如此总结:“我们比AI公司更懂机器人,比机器人公司更懂AI。”

就这样,微亿智造的算法团队通过对机械臂的苦心钻研,最终解决了工业之间场景的定制化难题,进入了标准化产品的阶段。

3. 从“瞎子背着瘸子”,到具身智能

2021年,微亿智造将其技术栈沉淀、总结,逐渐形成了一套比较完整的技术方法论,微亿智造称之为“眼手脑”技术战略。

在这套解决方案中,微亿智造以视觉AI为技术基底,跨领域融合多种技术,从感知(眼)切入场景、沉淀数据,机器人智能控制(手)、AI算法和训练模型(脑),通过云端灵活算力的调用,实现对质检的统一工程化改造,以满足工厂现场应用点上的需求。

从这一年开始,微亿智造开始按照“眼手脑”的技术方向进行技术团队研发,有的专注于机器人控制,有的专注于光学系统,有的专注于AI算法,还有的专注于数据运营等平台化能力。

微亿智造的初衷,是看到了这套技术组合从单点的工业质检进入更广泛的工业制造场景的机会。比如,把工业质检的“手”(机械臂)上增加一个工具,类似磨刀,就可以用来打磨;换成用于抓取和组装零件的机械手,就可以用来装配。

微亿智造最开始提出“眼手脑”战略的时候,具身智能还没有作为一个正式的术语被工业界研究。但今天看来,“眼手脑”技术组合已经构成了具身智能的核心要素。

但是,早期的“眼手脑”彼此之间还是相对独立的系统。举个例子,假如把在质检中的工件拿掉,整套设备仍然还是会按照既定的路线去执行质检流程,只是拍出来的照片都是废片,因为这套系统本身是不知道检测对象被拿走的。

张志琦告诉「甲子光年」:“当时的视觉系统好比是眼睛,机械臂的运动机构像是一个人的手和腿脚。但两者的组合之间仍然存在隔阂,就好比是一个瞎子背着一个瘸子,瘸子在指挥瞎子前进和后退。但一个真正的具身智能系统,不应该是这样的,它应该是一个完整的体系,把感知、认知、规划、驱动、控制能力相融合。只有这样,才能真正在流程化的场景中落地。”

张志琦认为当时的微亿智造距离这样的目标还差一点。于是,在2023年底,微亿智造成立了专门的具身智能项目组,开始研发真正将感知、理解、规划和执行能力相融合的具身智能工业机器人EIIR(Embodied Intelligent Industrial Robots,EIIR)。

一个复杂的项目需要不同部门的协同,而将不同技术部门融合成一个项目是一件非常困难的事情,因为硬件的迭代的速度和软件的迭代速度有很多差异,决定项目进度的往往是最短的“木板”。为了解决团队协同问题,微亿智造不同于很多公司由CTO单独决策技术问题,而是摸索出了技术委员会的模式,通过科学化的决策机制来综合讨论与决策。

经过近一年的研发,微亿智造与国产机器人厂商捷勃特联合推出的新一代具身智能工业机器人——“创TRON”在工博会上首次亮相。这次与捷勃特战略级的合作比发那科的合作还要深入,直接深入到机械臂的驱动与控制层,得益于单芯片驱控一体的系统架构,控制延迟几近于0,从而使电机性能能得到最大限度的发挥。在考虑电机速度、加速和机动率限制情况下,轨迹速度再次提升了20%。

“创TRON”专为应对工业柔性智造场景而设计,具备抓取、放置、搬运、装配等多种能力,能够灵活应对各种生产需求。同时,结合不断积累的工业现场数据及工业垂类大模型,该机器人能够更好地理解复杂的工业环境,并快速调整动态变化的任务,有效解决了产线的灵活性和适应性问题。

以一个完整的柔性装备流程为例,用户只需要进行一次装配演示,该具身智能工业机器人就能在非常短的时间内自主理解任务并快速学会执行。

第一步是任务演示。用户在示范区向具身智能工业机器人演示一遍装配流程,具身智能工业机器人通过图像、视频对人体动作及装配体进行精准捕捉识别。

第二步是任务学习。具身智能工业机器人结合工业垂类大模型进行流程拆解和仿真环境模拟装配,将刚才的示范流程像人一样“消化学习”,这一步无需传统示教或编程。

第三步是产品试装。经过上一步的学习,学习区的具身智能工业机器人已经学会装配流程并开始试装产品。这一过程中,无序抓取精度达到1mm,双臂动态高精度2mm,即使人员在过程中进行环境干扰,机器人可以很好地完成实时避障并继续完成任务。在学习完成后,便可将任务实时下发给真正在产线上的执行区机器人。

第四步是量产执行。执行区的具身智能工业机器人接到任务,开始进行高速实时量产执行,并能快速实现柔性切线。

这款通用的具身智能工业机器人将在明年投入批量生产,有望开启一个新的千亿市场。

4.具身智能,何必是人形?

2024年,在微亿智造埋头研发具身智能工业机器人的同时,一股具身智能之风也已经吹遍了资本市场。无数机器人公司看到了这一新兴的潜力巨大的市场,并纷纷入局。

但是,业内对于具身智能的技术路线、产品形态的看法各有不同,每个企业都在按照自己的思考去实践。比如,具身智能是否要做成人形机器人,仍然是一个巨大的非共识。

人形机器人公司的观点是,具身智能的终极形态就是人形机器人,因为整个人类社会环境都是以人类为参照物去设计与构建的,人形机器人的概念也是由此产生,它可以无缝融合到人类环境中,替代人类完成具体的任务。因此,常见的人形机器人会被设计仿人的“双足+灵巧手”的形态。

但张志琦认为,机器人落地在工业场景可能是一个完全不同的思路。

工业生产的设计思路是,按照SOP(Standard of Procedure)——标准化流程来培训工人。无论是10人、20人还是30人,他们都需要以相同的方式完成同一项工作,把工作流程分割成多个部分形成生产流水线,以便更高效地衔接。可以说,工厂生产流程的设计原则,实际上是在有意削弱工人的个性。因此,如果今天有一个重复能力很强、同时也十分柔性化的机器来替代人工完成这些工作,这个机器是不是设计成“人形”其实是无所谓的。

比如,绝大多数工厂的地面环境都很平整,有阶梯的情况都很少,双足的人形机器人不一定是最优解,轮式机器人的效率反而效率更高,因为轮式比双足有更高的稳定性;人类只有一双手,但机器人却可以设计为1只手,或者4只手、8只手,来适应不同的生产节奏。

有一个企业案例可以佐证这一点,那就是波士顿动力。波士顿动力是人形机器人的鼻祖,早在2016年就发布了人形机器人Atlas,但是Atlas在商业化落地方面进展缓慢。2021年,波士顿动力公司专门推出Stretch,一款用于在仓库中移动箱子的新型机器人,进军物流领域。

波士顿动力推出的物流机器人Stretch,图片来自波士顿动力

Stretch并没有做成双足的人形,而是在方形移动底座上装上了一组轮子,上面是一个巨大的拥有7个自由度的机械臂,吸盘、以及摄像头和其他传感器。

张志琦表示,波士顿动力的案例表明,在工业环境中,应该根据效率来选择合适的工具,而不是凭借它的外观。

除了机器人的生产效率,工业场景最关注的另一大要素是成本。

当前阶段,人形机器人的成本仍然是限制其大规模普及的主要因素之一。比如,波士顿动力用于特种作业的人形机器人Atlas制造成本约200万美元;本田公司经过14年探索研发的人形机器人ASIMO,单台价值250万美元,在历经多次迭代后,不得不在2022年宣布“退役”。国内公司的人形机器人产品,单台售价也高达几十万到上百万元。

人形机器人的成本之所以高,首先是因为它需要较高的运动能力、环境感知能力、决策能力,导致其硬件成本居高不下,比如,工业机器人往往只需要六七个自由度的关节,而人形机器人动辄就是40多个关节。其次,由于处在行业发展早期,供应链也不够成熟,没有足够的出货量,供应链成本短期内很难打下来。

英伟达CEO黄仁勋就认为,人形机器人成为大众化设备的前提是售价与当前廉价汽车售价相当,A级车的价格大概就在1万到2万美元之间。

作为对比,今天一台工业机械臂的价格仅有五六万元左右,四轴的机械臂甚至只有两三万元。在人形机器人将成本打下来之前,它很难在工业这一价格敏感的场景替代价格低廉的机械臂,即使机械臂的灵活性要更差。

今天,随着微亿智造具身智能工业机器人的发布,工业场景有了一个新的选择。具身智能工业机器人不仅成本更低,而且还能快速实现柔性切线,满足工厂灵活多变的生产需求。

回到一年前张志琦在工厂看到的一幕。现在,微亿智造有一个小小的目标,就是通过最新发布的具身智能工业机器人,让工厂重新认识机械臂,真正将其用于更多的柔性环境,实现比以前机械臂更为广泛的应用价值。

2018年,微亿智造曾用智能质检设备解放了工厂2000多人的生产力。这一次,微亿智造的目标是解放其十倍、百倍甚至更多倍的生产力。

(封面图来 源:微亿智造)