「微软小冰」导入语音交互技术 比Google、Apple语音助理更人性化
微软宣布率先推出全双工语音交互感官(Full-duplex Voice Sense)新一代的语音交互技术,使用户与人工智慧之间的语音交互能更贴近人类自然的对话方式,就像是在与朋友打一通电话,自然地聊天,率先启用该技术的,就是已经拥有 2 亿中文用户的「微软小冰」。
微软小冰是微软公司在亚洲的研究单位于 2014 年 5 月 30 日,在中国大陆推出的第一个支援中文语音的「人工智慧聊天机器人」,相较于 Cortana这种以完成任务为导向的「智慧个人助理」,微软小冰以EQ情商发展为方向,能够与使用者进行更长时间、更自然的对话—兼具幽默感,可以与使用者闲聊、谈心、玩游戏,甚至可以记住使用者的资讯,像跟朋友聊天一样就某个有趣的话题展开对话,现在的微软小冰,不仅会唱歌、写诗,还会写新闻。
微软小冰全球研发负责人周力表示,到目前为止,大多数个人语音助理或聊天机器人的对话场景就像拿着对讲机或发简讯一样,一方先讲话或写下文字,另一方收听或阅读这些讯息后再做出回应,这并不是人们自然的交流方式。
他认为,人与人之间在打电话或面对面聊天时,都会边听边想,事先预测对方的这句话会说什么。还可能在适当的时候打断对方,或在双方都不说话时打破沉默,然后根据对方的反应展开新的话题,这才是自然的交流方式。
就实际应用来说,微软公开的全双工语音交互感官(Full-duplex Voice Sense)人机互动技术,使小冰能够以「全双工」模式传输数据,交流的双方可以同时说话,像在打电话一样,小冰预测人类即将说出的内容,生成回应并控制对话节奏。
微软表示,小冰丰富的技能,也让这一技术有了更大的发挥空间:例如,小冰能够暂停正在执行的任务(例如暂停为使用者讲故事),然后去执行其他任务(例如开灯),然后还能回来继续刚才的故事。就像一个人可以在对话中暂停话题,之后再回到原来的话题上。
此外,采用该技术的智慧硬体设备将不再需要使用者在每轮对话时都说出唤醒词(通常是人工智慧的名字)。仅需一次唤醒,就可以轻松达成连续对话,相较于 Apple 旗下的 Siri 聪明许多,支援语系也比 Google Assistant 还多。
微软表示,除了小冰,在美国开发的聊天机器人Zo导入这项技术,接下来微软在全球开发的其他人工智慧,如印度的Ruuh、日本的凛菜りんな和印度尼西亚的Rinna 。