科大讯飞申请多模态交互专利,能够实现多模态交互,提升用户体验

金融界2024年10月18日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“多模态交互方法、装置、电子设备和存储介质”的专利,公开号 CN 118782044 A,申请日期为2024年6月。

专利摘要显示,本发明涉及人机交互技术领域,提供一种多模态交互方法、装置、电子设备和存储介质,其中方法包括:接收车内的用户语音;对所述用户语音进行识别,得到识别文本,并对所述识别文本进行意图理解,获得意图信息;基于所述用户语音和/或所述意图信息,获取所述意图信息对应的图像,所述图像基于车内摄像头和/或车外摄像头采集得到;基于所述识别文本和所述图像,确定交互结果。本发明提供的方法、装置、电子设备和存储介质,通过将语音和视觉信息相融合,能够实现多模态交互,使得交互过程更加自然、准确、智能和灵活,从而大大提升用户的交互体验。

本文源自:金融界

作者:情报员