语音人车交互测试:与汽车无障碍对话难吗?

汽车无障碍对话难吗?

通过语音,控制导航、娱乐车机功能已经成为新车的“智能化”的主要呈现之一。一辆智能汽车是否名副其实,是初级智能还是中级智能,又或是高级智能,与通过语音可以实现的功能多与少有直接关系。必须承认,语音并不是人与车交互的唯一途径,现在的交互技术百花齐放,路径有多种多样。除了语音,还有视线聚焦操作、手势操作、脑电波操控等。但有一点可以肯定,语音是目前冲在最前面、普及最广的交互技术。语音交互技术迭代也非常快,新一代也已搭载在最新量产车型上。对于最新一代的语音交互,不同企业有不同命名,如“自然语音”“混合语音”“全场景语音”等。不管名字如何变,都需要技术上有进化,能够提高人与车之间交互的效率,最好能够实现“无障碍对话”。那么,最新一代的语音交互效果如何?是否已经达成“无障碍对话”?我们近日测试了一番。

自研的语音交互技术更实用

我们先后测试了两套新的语音交互系统,同时也是目前市面上截然不同的两种语音交互类型:第一套的技术支持来自科大讯飞,测试车型是雪佛兰新探界者参数丨图片)。第二套是小鹏汽车在供应商提供一定技术支持基础上,自己再进一步研发的一套语音交互系统,搭载在小鹏P7上。简而言之,一种是供应商提供,另外一种是自研。

相信很多人对科大讯飞这套系统并不陌生,除了新探界者之外,还出现在很多新车上。这套系统最大的优势在于,语音识别准确,语义执行相当迅速,能够智能识别断句,并具备学习功能。小鹏汽车的语音交互系统目前只在小鹏P7一款车型上使用,未来还会拓展到小鹏汽车旗下的更多车型上。小鹏汽车将这套语音交互命名为“全场景语音”,其优点在于可以控制许多不影响车辆安全的车机功能,比如底盘模式选择、关闭后排空调出风口、打开和关闭车窗等。

为什么小鹏汽车不直接采用科大讯飞,而要采取自研?小鹏汽车产品规划部副总经理江卫忠告诉我们,假如用挖矿比喻,如向铁匠铺购买铁锹,他们会卖给你,也可以卖给别人,那会造成所有人的效率都一致,没有不同。“我们选择不向铁匠铺买铁锹,选择自己造,造出来可能是一把铁锹,也可能是一台挖掘机”。

在测试之前,我们以为找供应商直接购买的系统,成本低、功能全、配套服务好。但在我们体验过自研的语音交互系统之后,发现自研系统似乎更贴近于日常使用习惯,能更高效率地与汽车的其他系统互动,进而发挥“1+1>2”的效果。当然,此次测试,自研系统的领先优势还不是那么明显。但假如自研系统能够继续保持迭代进化的速度,显然会进一步构建自己的核心竞争力

连续对话显著提升沟通效率

新一代语音交互都支持“连续对话”。所谓“连续对话”,就是激活系统之后,在一定时间范围内,可以连续下达指令,而不需要重新激活。不同车型有不同的时间设定,可延长30秒,也可3分钟。测试中,我们发现,此次测试的两套系统都支持“连续对话”,可以连续下达需要实现的功能指令,让系统连续识别并执行。

测试中,我们连续下达包括“导航”“美食点推荐”“天气查询”“听歌”和调试“空调”等一连串指令。两套系统都能够准确地执行,且堪称迅速。当然,在使用过程中虽不见卡顿感,但仍然没有完全达到“人与人”之间的即时互动的效果——还是要稍微有点耐心。

识别准确率取决于用户表述的“含金量”。“含金量”越大,表述清晰、准确,识别的准确率就越高。我们在测试小鹏P7的“全场景语音”系统时发现:语音交互过程中,首选用“短句”,“短句”的识别率更高;其次是尽量用普通话,系统识别普通话的速度要比方言高一些;再次,连续对话当中,如果发现错误,不用等待系统执行完毕,直接下达下一条指令;最后,不用担心其他人突然插话,系统会锁定激活时那个人的声音,全程只认这个人下达的指令。

需要指出的是,新一代语音交互系统还做不到100%识别率。有时候,要实现某一功能,要反复或者换着不同表述方式来下达指令。但有一点可以肯定,随着使用时间越长,随着你逐渐了解系统的“脾气”,你的命令被执行的效率也会越高。

试驾结束之后,我们还咨询了一下,旧车能否通过OTA升级搭载新一代的语音交互系统。得到的回复是:不可以。原因很简单,旧车没有允许新一代语音交互的“环境和土壤”,旧车的芯片算力可能不足以支撑复杂的计算。

小结

测试结束后,我们得出这样的结论:相比上一代,新一代的语音交互确实更加好用、高效和便捷。用户无需刻意地记关键词,可以用比较自然的对话与汽车实现交互。要下达不同的指令,也无需繁复的激活,可以连续下达。此外,我们还发现,新系统对于提升行车安全也有很大帮助:在行驶过程中,驾驶员无需再低头去点击大屏幕,也无需去找功能键——用语音下达命令的时候,视线不用离开前方,手也无需离开方向盘。在人与车交互的诸多技术路线当中,语音交互会不会成为最后的赢家,现在还不能下结论,但该技术的进化,确实让我们感受到科技的魔力