淘宝数字人专利可模拟用户声音

天眼查知识产权信息显示,3月15日,淘宝(中国)软件有限公司申请的“基于数字人的视频生成与交互方法、设备、存储介质与程序产品”专利公布。

摘要显示,本申请实施例基于用户的声音特征和情感标签进行文本转语音处理,以及基于用户的声音特征和表情系数之间的映射关系进行语音转表情处理,并基于语音信号和表情系数渲染数字人模型,以得到数字人模型的视频数据。该专利精准地模拟用户的声音特征,确保了数字人的语音输出不仅听起来自然,而且实现数字人的个性化驱动,提高数字人在声音和动态形象方面的逼真度,进而提高用户体验,提升了数字人的互动性、真实感和沉浸感。