汽车小秘书 人车互动 语音助理是关键

背景图片◎图/美联社路透

背景图片◎图/美联社、路透

从目前各大厂发展布局来看,从语音、手势控制、驾驶意识侦测等各种新兴车用人机介面的发展来看,以语音控制的发展进程最快,各大车厂发展语音助理从早期语音指令,至近年逐渐发展出能自然对话的语音助理系统,如丰田Toyota、奥迪Audi、福特Ford,近年来已发表将语音助理或平台导入车载机内车款,其余车厂也陆续在后续相关车款中纳入相关技术

语音助理在各类的3C产品中已有相当高的普及度,以各类科技大厂主导相关技术发展,包含亚马逊、苹果和Google都是其中的佼佼者,为了延伸应用,科技大厂纷纷积极进入车用市场,必且将既有的语音平台重新调整为车用平台,同时为因应技术发展需求,而与软体厂商合作甚至并购,例如Google买下多伦多大学资工系所创办的DNNresearch,加强其语音搜寻引擎能力,亚马逊则为增强语意辨识,于2012年并购Evi等。

车用语音助理的关键为如何清楚地接驾驶者或乘客的语音指令,关键零组件声学元件楼氏电子Knowles、瑞声ACC、歌尔GoerTek等皆有发展车内专用声学元件,为目前市场主要领导者。车用语音助理相关业者可分为三类,包含车厂、语音平台以及语音技术/设备商,三方业者各有不同目标,呈现相互竞争又合作的态势。整体而言,可归类为三种合作模式

第一种模式为车厂直接采用语音平台服务。语音平台为提升其服务可及性以及取得更多使用者数据,多投入开发车用语音平台,例如Google的Android Auto、亚马逊的Echo Auto以及苹果的Carplay,同时开放开发者环境,强化与车上电子系统的整合,车厂为增加销售卖点为动机,将语音平台引入车内,借以增加服务体验。不过在增加车内服务项目和体验下,车厂对此合作方式亦有所顾虑,担心消费者体验倒向平台大厂,因此各大车厂也积极在相关平台的基础上发展自有的服务平台,以维持消费者的认同感满意度

第二种模式为车厂自行开发语音服务,部分车厂希望掌握车上相关联网服务广大商机,同时由于语音平台亦将连结车辆控制系统,因此部分车厂投入自有语音系统相关技术研发,此方式需投入大量成本和人力。

宾士为例,与各大语音平台皆有合作,但在2018年仍自行开发MBUX系统,可结合车机上座舱控制以及影音娱乐、导航等功能,亦可衔接各语音平台影音娱乐功能。

第三种合作模式为语音技术商结合平台导入车厂的车辆产品,语音技术软体/设备厂商如Nuance、SoundHound,皆有开发语音技术以及相关应用软体,ROAV和Chris则发展相关设备可介接至车内。此类业者可藉自行开发软体或硬体,将语音系统服务导入车载机系统,同时以API方式衔接各大语音平台相关服务,以此方式销售自家语音产品,同时亦可取得使用者数据提升技术。

语音助理在车用环境中以麦克风硬体设备收音,采用MEMS阵列式麦克风为主流,收声元件中振模采用矽材质,相较于早期电容式麦克风采用的聚合纤维更耐热、抗震,收音品质较不受温度及电压变化等影响,且金属外壳具有良好射线屏障,避免收取不必要杂讯

软体处理中主要为自然语言处理,其中包含到语音识别、语意理解,后续再回馈语音则有语言生成、语音合成,亦或是文字转换为语音等。

动作执行层面则分为属车辆控制的座舱调整、空调、启动引擎和车门,以及娱乐、导航、通讯等项目,除车辆控制外,剩余项目皆可在无需嵌入车电系统环境下进行,例如透过个人行动装置、后装设备等方式,对于语音平台或相关技术业者而言更多以此类服务渗入市场。

因车内收音并非直接对麦克风说话,属于远场收音形式,其效果不如对手机、话筒设备等近场收音,个人主声特征更不明显,噪音处理对于车内语音应用情境至为关键,背景噪音和发声回音更容易影响收音品质,且在车内有多人谈话须作考量,也有反应速度的要求,技术上需克服如何在多人谈话中辨识驾驶声音以及如何提升运算效能的需求。

不过整体来看,对于普罗大众而言,因语音技术使用情境更趋自然,同时学习的门槛更低,可以想见在车内的应用环境,语音将成为未来在智慧车辆中最具亲和力人车互动介面,亦将成为未来许多服务进入车用环境的大门,其中新品与应用情境势将百花齐放更为精彩。(本文作者为资策会MIC产业分析师官盛尧、产业顾问张家维)