倪凯:通过全场景量产路径实现最终的无人驾驶
本站汽车6月10日报道 6月10日,主题为“先手”的第十三届中国汽车蓝皮书论坛于合肥开幕。在为期三天的论坛中,将有超过40场演讲、17场议题讨论,预计超过150位中国汽车产业先锋思想碰撞,共话新汽车时代。
“我觉得有一点可能行业里面越来越形成共识的就是所谓的场景打通比级别更重要。只有通过把所有的这些场景打通,把体验提高,用户才会有动力去购买我们这样的智能汽车,用户才会有动力去使用这样的功能。”倪凯说。
他表示,“在乘用车市场上,我们认为,可量产一定是能够通过未来五到十年,实现百万台级别的交付,可覆盖百万平方公里级别全场景数据的回传。
这里面有两个关键点:第一个,需要有合理的商业模式,必须是赚钱的事;第二个是,这个系统必须为用户产生足够多的价值,这样你的车才能卖出去,我们希望通过全场景量产的路径实现最后的无人驾驶。”
以下是倪凯在此次蓝皮书上演讲内容:
大家好,我是禾多科技的创始人倪凯。今天我给大家分享的题目是“自动驾驶全场景的量产落地”。
我们先来看一下什么是全场景的自动驾驶,大家都知道,waymo是最早做城市无人驾驶的公司,去年晚些时候,特斯拉开始在城区释放FSD的功能。很多人都在问,waymo在城区做了十年的无人驾驶了,为什么特斯拉还要在这样一个时间点上去往城区的自动驾驶做?今天在我的汇报的前半部分,我来解释一下我们理解的未来自动驾驶的一些方向和背后的一些逻辑。
首先我觉得,行业里面越来越形成共识的就是所谓的场景打通比级别更重要。什么叫场景打通呢?大家都知道,过去的辅助驾驶,很多车上都有,ACC、LDW这样的功能,但是很多的功能都是非常割裂的,大家要去判断,我什么时候这个功能可以开始用,什么时候那个功能开始用,其实它的用户体验并不好。
我记得我第一次开特斯拉车的时候,有一点印象非常深刻,甭管是高速还是城区上,城区差一些,但是这个功能还可以开起来,当然这个背后是需要自动驾驶技术真正支撑全场景,但是反映用户体验上的一点非常关键,就是用户其实不喜欢一个割裂的自动驾驶的感受,所以我们认为全场景的打通非常重要。
第二点,我们认为,在现在这个阶段,广泛的运行比小范围的无人化运行,对于未来的自动驾驶迭代更重要。为什么呢?后面我会说到,我们认为更广泛的运行,才能够真正的有更多的数据迭代出真正逼近无人驾驶的算法。
可能大家要问,怎么去实现这样的广泛的运行?也就是所谓的大规模的搭载。优秀的体验其实非常重要,这样的体验体现在我们整个场景的打通,也体现在很多用户的一些痛点的场景的问题的解决。例如这边统计了一些消费者认为无人驾驶最需要攻克的一些场景,包括有一些泊车的场景,尤其在中国,包括一些城市,拥堵、高速这样的场景。只有通过去把所有的这些场景打通,去把体验提高,用户才会有动力去购买我们这样的智能汽车,用户才会有动力去使用这样的功能,不然的话,这个功能可能放在车上也是用户永远不会开启的功能。
所以可以简单来说,我认为有时候可能慢其实就是快,怎么说呢?因为通过数据迭代升级,其实是一种相对来说比较慢的过程,我如果用waymo的模式,装很多激光雷达。我记得当时2013年的时候,百度做自动驾驶也是装很多激光雷达,很快就可以把一个小样跑出来,但是如果要实现真正的广泛运行,其实你是需要用一个相对慢的方式去实现大规模的搭载,而且更难的地方是在大规模搭载的同时,又能够保证用户的安全。
所以我们看到特斯拉现在的数据在L4上领头的waymo的数据,不管是车的数量还是积累的里程数量,我们都看到了,通过这两年已经拉开了质的差距,这种差距最后会体现在所有自动驾驶演进的速度上。
做自动驾驶全场景量产落地,我认为还是非常有挑战的事情,尤其是大规模的运行。有几件事情是需要保证的:
第一件事情是怎么做一个安全可信任的系统?这个系统不是说自动驾驶厂商或者车厂来说就是安全可信的,整个市场端要反映你这个系统是一个安全的系统,可能政府也会有相应的对高阶自动驾驶的规定、政策出台,判断这样的系统是不是安全可信任的系统?
第二个是可量产。
第三个就是商业模式的成立,因为我们在讨论百万量级,甚至是全行业千万量级的交付,必须有一个可以交付的商业模式。
自动驾驶领域,我们认为可量产是什么?不同的领域,可量产不一样。我们认为在乘用车市场上,我们认为可量产一定是能够通过未来五到十年,实现百万台级别的交付,能够覆盖百万平方公里级别全场景数据的回传。
这里面有两个关键点:第一个,需要有合理的商业模式,必须是赚钱的事,或者不是大规模亏钱的事,才能支持大规模的交付;第二个是这个系统必须给用户产生足够多的价值,这样你的车才能卖出去,你也能够让用户支撑在大范围上开启功能。这两点都是非常重要的,对于可量产的定义。
禾多现在关注的就是全场景量产的自动驾驶企业,禾多的名字也是来自于移动的移,我们希望通过全场景量产的路径实现最后的无人驾驶。
打造本土数据驱动的自动驾驶量产解决方案,禾多是怎么思考的?我们会把我们的整个系统分成两部分。一部分是行车系统,还有一部分是专门解决停车场,或者最后一公里的系统。这边也有一些简单的视频来展示我们之前做的一些高速,包括城区以及泊车。我们想法是在相对量产的配置上,统一的配置上,给用户提供一个完整的,可以让绝大部分用户覆盖到的体验。
第一个方面:功能安全、预期功能安全。我们聚焦整个系统从整个系统最开始的功能安全。具体我们在很多的系统设计上,禾多也在不断的做这方面的思考,简单的说,从功能安全角度来说,我们更多的会从顶层设计实现各种安全状态的转移,包括失效状态我们如何进行降级,如何确保整个自动驾驶系统仍然处在安全的状态中。
第二个是预期功能安全,预期功能安全最核心的是建立整套的场景库。
第二个方面:车规级硬件配置。硬件方面,自动驾驶最关注的是两个方面:第1个是传感器,传感器像毫米波雷达、相机、GNSS、IMU、超声波雷达等等传感器;第2个是车规级域控,现在有两个方案:一个是几百T的大算力的方案;第二个是几十T算力的性价比方案,而且短时间内可以迅速扩大用户使用量的方案。尤其是在真正要走量的方案上,几十T的方案上,甚至10T以下方案上,很多时候针对像素优化变成关键的一点,从这一点上,硬件转向软件开发如何与之相对应。
第三个方面:多传感器融合算法。最核心的就是我们所说的狭义的感知。对于现阶段量产最关键的还是多源融合能力,因为我们现在传感器很多,如何把这些信息有效的结合起来?第个是算法能力边界,这可能又回到了刚才说的广泛运行的概念上,如果我们不能做广泛运行,不能明确知道算法能力的边界,简简单单跑几条街道,相对来说还是比较容易的。基于一个已有的硬件探索算法极限,是关系安全的长尾问题。第三个是新型硬件的适配,包括4G的毫米波雷达,激光雷达,包括相机阵列。新的传感器不仅仅是做加法,它可能会进入下一个阶段。
除了狭义的感知以外,更重要的是广义的感知。包括地图亦感知,如果你把车辆的位置信息和姿态信息也认为是感知信息的话,那定位也是感知。
再一个就是预测,尤其自动驾驶从停车场、城区进军整个城市以后,这种提前量也是衡量一个驾驶员是新司机还是老司机的核心的事情。
所以我认为自动驾驶的一切HACK,本质上都是广义的感知能力不足。
后面简单展示几个视频,刚才也提到整个嵌入式平台的重要,我们花了很多力气在车规级线路平台上布局自动驾驶的算法。(视频播放)这样一套系统能够在非常有竞争力的性价比方案上实现主机厂需要的自动驾驶功能。
第二个就是基于因子图的紧耦合定位方案。我们和Frank Dellaert合作,他刚获得世界级机器人顶会RSS颁发的首届时间检验奖。
第三个视频是我们关于整个泊车场景下的众包建图和动态更新。行业里面一个特点,就是泊车上的地图并不如高速公路或者城区道路的地图商业化做得那么快,在这样大的市场背景下,有非常好的众包建图能力在泊车场景上是优先于其他的场景。通过这样的建图,也能够实现我们停车场相对来说环境比较拥挤、比较复杂的地图更新的工作。
除此之外,我们现在跟清华大学在视觉感知领域也有非常深的合作,现在做的其中一个项目是我们用多孔径的相机阵列做下一代智能视觉雷达的工作,因为大家知道我们现在相机虽然在迭代,像素从100万到200万到800万,这样的迭代时间都是相对比较长的,我们希望通过多孔径相机阵列的工作,能够真正的将现有的相机技术进一步升级,让相机阵列能够传回非常稳定、高清的信息,进一步的增强我们整个的车辆的自动驾驶系统安全性。
最后一部分说一说我们在做的一些算法验证上的工作。我们自己的整个验证平台,我们称之为holoX,是我们自主研发的自动驾驶仿真验证平台,很多朋友会问我,为什么不买一个商业的仿真软件?原因很简单:第一个是商业仿真软件比较慢;第二个,大家可以从下面列的功能里面可以看到,仿真只是我们想做的这个平台里面非常小的一部分功能,具体包括高精度地图、可视化、场景库、随机交通流,所有的功能并不能被仿真平台所替代,所以我们必须要打造自有知识产权,或者快速迭代的holoX平台。
最核心的还是场景库验证这一块,我们基于不同的维度,包括天气、道路、交通参与者,驾驶行为,甚至包括我们的一些硬件的状态去建立我们整个的自动驾驶,仿真和测试的场景库,能够真正和路测数据匹配,一起共同服务一个高纬度(参数丨图片)的,覆盖尽可能多的场景。
除了刚才说的这种仿真、场景库以外,我们也通过不断的全国范围内的大规模的真实路测去积累这样的数据,当然我认为本质上这样的数据,在车辆的搭载能够进行百万辆级别的交付,这才是最后进入到真正的无人驾驶所必须的门槛,但是通过这样的门槛中,我相信每一步的自动驾驶的功能都是通过每一个阶段的自动驾驶的验证能够慢慢实现的。可能我们测一个ACC需要几十万公里,测一个更高级别功能需要几百万公里、甚至几千万公里这样的数据。
最后就是数据闭环。数据闭环的思考主要有两块:
第一个闭环是禾多现在主要以自己为主来做的,就是整个云端的模型到自动驾驶的模型更新、云端模型训练。
第二个闭环是右边的闭环,更多的是和行业合作伙伴一起来做的,更多的是包括众包地图、数据融合,这块可能又会从停车场地图开始,慢慢的延展到更多的场景,实现未来的全场景高精度地图,相对及时、实时、低成本的更新。
谢谢大家,这是我今天的演讲。