工商银行申请语音转换专利,能生成带有语音风格的目标输出语音

金融界2024年5月29日消息,据国家知识产权局公告,中国工商银行股份有限公司申请一项名为“语音转换方法、装置、设备、存储介质和程序产品”,公开号CN202410404864.3,申请日期为2024年4月。

专利摘要显示,本公开提供了一种语音转换方法、装置、设备、存储介质和程序产品,可以应用于语音合成技术领域和金融领域。该方法包括:获取待转换文本;将待转换文本输入至上下文融合模型,输出包含有上下文信息的目标编码向量;利用语音风格处理模型处理目标编码向量,得到嵌入风格向量,其中,目标语音转换模型包括上下文融合模型和语音风格处理模型;根据目标编码向量和嵌入风格向量,生成带有语音风格的目标输出语音,其中,语音风格表征目标输出语音的情感变化特征。

本文源自:金融界

作者:情报员