英伟达上线人形机器人开发工具包,黄仁勋为产业前景兴奋

当地时间7月29日,英伟达在美国丹佛的计算机图形技术大会SiGGRAPH上宣布,将为机器人厂商提供一系列开发套件,加速人形机器人的开发训练。

产品套件中,NIM微服务和框架用于机器人仿真学习——微服务(Microservices)是一种开发软件的架构和组织方法,可以使应用程序更易于扩展和更快开发。英伟达声称,NIM微服务提供了由NVIDIA推理软件提供支持的预构建容器,使开发者能够将部署时间从数周缩短到几分钟。

英伟达此次带来两款面向机器人厂商的新NIM微服务。MimicGen NIM微服务可根据Apple Vision Pro等头显设备采集的遥操作数据,生成合成运动数据;Robocasa NIM微服务则可生成机器人任务和准备就绪的仿真训练环境。

操作者戴着Apple Vision Pro遥操作采集数据。来源:英伟达官网

另一款产品为用于运行多阶段机器人工作负载的OSMO编排服务,开发者借此对包括合成数据生成、模型训练、强化学习以及大规模的人形机器人测试等任务,进行编排、可视化和管理。官方称,OSMO编排服务大大简化了机器人训练和仿真工作流程,将部署和开发周期从数月缩短到一周内。

NIM微服务和OSMO编排服务两款产品,被嵌入英伟达搭建的一套机器人基础模型训练数据捕捉的工作流(Workflows)。

人形机器人智能的提升,离不开用大量数据训练基础模型。但当前行业面临数据短缺的瓶颈,仅靠物理环境的遥操作去采集数据,成本昂贵且耗时长。英伟达称,其搭建的数据捕捉工作流(Workflows),使得开发者使用极少量遥操作采集的人类演示数据,即可生成大量合成的运动和感知数据。

据英伟达对这套工作流程的介绍,首先,开发者使用Apple Vision Pro捕获少量遥操作演示画面,进而在Isaac Sim计算平台中对这些录像进行仿真,并使用前述MimicGen NIM微服务生成合成数据集。

基于采集到的真实数据和合成数据,开发者再对英伟达自研的人形机器人基础模型Project GR00T展开训练。接着,开发者可以使用前述Robocasa NIM微服务来生成经验,以重新训练机器人模型。整个工作流程中,OSMO编排服务扮演分配运算任务的角色。

英伟达提供了三个计算平台来简化人形机器人的开发,包括用于训练模型的NVIDIA AI超级计算机;使机器人在仿真世界中学习和完善技能的Isaac Sim平台;以及用于模型运行的Jetson™ Thor人形机器人计算机。

加入英伟达旗下人形机器人开发者计划的公司,可以提前获取这些新产品和服务。据介绍,目前,字节跳动ByteDance Research、傅利叶、银河通用、逐际动力、星动纪元等中国大陆的人形机器人公司及开发机构已加入这项计划。

英伟达创始人兼CEO黄仁勋表示:“AI的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。我们正在推进整个英伟达机器人技术栈的发展。”

黄仁勋此前在诸多场合表达过对人形机器人产业的看好。今年6月接受采访时,他预测机器人技术将在未来两到三年内取得重大进展,未来人形机器人将像汽车般普及。

采写:南都见习记者 杨柳