元戎启行发布计算平台解决方案,功耗降至传统近九分之一
本站科技讯 拉斯维加斯时间1月8日消息 元戎启行发布计算平台解决方案——DeepRoute Tite,通过将L4级自动驾驶所需的算法移植到车规级计算平台Xavier,大幅降低了计算平台的成本和体积,并将整体功耗降到了45瓦。
元戎启行的计算平台解决方案,采用了一台英伟达的车规级计算平台Xavier,处理感知、预测、决策、规划与控制、导航定位等L4级自动驾驶模块。以往需要在庞大的计算平台上运行的算法,现在只要一个小小的盒子即可运行。让自动驾驶汽车的后备箱,也能和正常汽车一样,放置各类物品。
图注:元戎启行的计算平台解决方案VS. 传统的PC计算平台计解决方案
相比起来,传统的计算平台是PC机式的,不仅体积庞大,功耗也非常高,在400瓦左右。如今,即使是同为车规级计算平台的NVIDIA AGX Pegasus ||,其功耗也高达300瓦,还需要增加冷却系统对设备进行冷却。而使用Xavier,元戎启行计算平台解决方案的整体功耗,只有Pegasus的七分之一左右,在后备箱环境中,不需要额外增加冷却设备也能稳定工作。
虽然在性能上,Xavier 的32万亿次/秒的计算速度 ,只达到了Pegasus II的十分之一,但在成本上Xavier有更高的优势,更符合量产要求。
为了用低成本的车规级计算平台实现L4级的自动驾驶,元戎启行通过自主研发的推理引擎,将自动驾驶相关算法成功移植到Xavier,将计算平台整体解决方案的成本降到了传统解决方案的一半左右,同时将功耗缩小到传统方案的近九分之一。
“通过自主研发的推理引擎,我们在计算上做了很多优化,因此,不需要超高性能的计算平台,一台Xavier即可满足L4级自动驾驶的计算需求。打个比方,我们的解决方案效果,相当于让从前只能在PC机上运行的软件,在iPad上也能够运行了。”元戎启行推理引擎和硬件加速负责人庄奇说。
庄奇介绍道:“L4级的自动驾驶场景,需要处理大量的点云和图像的数据,需要使用复杂的融合的深度学习算法。而一般的深度学习框架和其他的推理引擎无法对我们的模型做优化。
他进一步解释:“我们自研的推理引擎,能够针对深度学习算法中的自定义算子和网络结构,做出更好的计算资源上的优化,让我们的自动驾驶算法能够高效和稳定地运行。既降低了成本,又保证了自动驾驶的安全性。”
通过使用这一计算引擎,45瓦的计算平台解决方案也能够满足L4级自动驾驶系统的所有计算需求,使得元戎启行的L4级自动驾驶汽车即使在复杂的城市道路中,也能如老司机般娴熟操作。
元戎启行将算法移植到Xavier后,仍能精确识别周围障碍物,以接近城市道路最高限速的速度行驶,灵活完成红绿灯识别、转弯,避障等操作。
除了能实现高效的计算,元戎启行自研的推理引擎还有易移植和易扩展的优点。该推理引擎不仅能够支持英伟达、英特尔、AMD等品牌的计算平台,还能很好地适配PyTorch、Caffe、TensorFlow等深度学习框架。有利于让算法研发成果快速投入到产品的工程应用中。
元戎启行硬件技术总监刘念邱表示,元戎启行的L4级自动驾驶解决方案,更多地是面向可大规模量产的前装市场。因此在硬件上尽量选择成本相对较低的符合车规的产品。
随着计算平台体积和功耗的大幅度缩小,元戎启行还可通过增加计算平台数量的方式来实现安全冗余,在一个平台发生故障时能转换到另一个平台,确保自动驾驶汽车的稳定与安全。与高算力的解决方案相比,这一方案在成本和功耗上仍然有很大的优势。
为了全面满足自动驾驶算法的需求,并进一步降低硬件产品的成本,元戎启行自研了一体化的传感解决方案DeepRoute-Sense。该传感解决方案在其与东风汽车集团技术中心的合作中,已经投入了使用。
该解决方案中的车载相机DeepRoute-Vision和同步控制器DeepRoute-Syntric均由元戎启行自主研发,也将在今年的CES中展出。
DeepRoute-Vision
与传统的车载相机相比,即使在强烈地阳光照射下,Vision也不会出现过曝现象。该相机还具有自动图像调节功能和良好的LED抗闪烁能力。
而同步控制器Synctric不仅可对传感器传来的信息进行时间和空间的同步、分发,还能对传感器数据进行实时监测。当其监测到传感器出现异常,影响安全时,可对车辆采取紧急刹车等措施。
DeepRoute-Syntric
目前,元戎启行已与东风汽车集团技术中心合作,研发Robo-Taxi, 并与国内的知名出行公司展开合作,在国内中部地区推广Robo-Taxi的试运营服务。随着其产品不断地车规化,L4级自动驾驶的量产也将指日可待。