用模仿学习赋予机器人新技能,斯坦福团队让机器人学会“系鞋带”

近年来,机器人正在深入各种应用场景。尤其是在家居场景中,AI机器人已经能够挑战一个又一个复杂且高难度的操作,例如叠衣服、扫地、逗猫、浇花,甚至是炒菜。

最近,斯坦福大学团队发布了全球首个AI机器人自主系鞋带演示视频,主角就是谷歌 DeepMind联合斯坦福推出的Mobile ALOHA 2(简称:ALOHA 2)机器人。

与一代相比,ALOHA 2在硬件和软件上都进行了显著升级,使其能够执行更加精细和复杂的操作。同时,采用人体工程学设计,使其更具稳健性。除了系鞋带,视频中的ALOHA 2机器人还会挂衣服、拧齿轮、收拾厨房,甚至是给其他机器人更换不同用途的配件。

同时,研究人员开源了ALOHA 2所有硬件设计,并提供了详细的教程,以及具有系统识别功能的ALOHA2MuJoCo 模型。

模拟学习过程中,研究人员利用扩散策略收集了共计2.6万个示范数据,使得机器人能够在没有强化学习干预的情况下,达到接近99%的任务成功率。这样的训练策略为未来机器人教导新技能提供了可行的路径,尤其是在复杂和多变的环境中。值得注意的是,Aloha2的神经网络架构借鉴了ACT模型,依托8,500万的Transformer编码器,使得机器人对操作的理解和执行更加精准。

ALOHA 2是由谷歌旗下DeepMind与斯坦福大学联合推出的第二代ALOHA机器人。今年1月,第一代ALOHA就熟练地完成备菜、翻炒、出锅,洗衣、逗猫、浇花等操作,引起业内高度关注。

此次ALOHA 2的系鞋带视频传递出的意义,就是AI机器人已经能够实现类似人的动作和行为。可以说是,预示着复杂的操作已经难不倒AI机器人,其已经能够胜任家居场景中的不少繁琐的操作。此外,模仿学习也将赋予AI机器人更多的新技能。