平安科技申请语音合成专利,提高语音生成稳定性

金融界 2025 年 1 月 31 日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“语音合成方法装置设备及介质”的专利,公开号 CN 119380688 A,申请日期为 2024 年 11 月。

专利摘要显示,本发明涉及人工智能技术领域,公开了一种语音合成方法、装置、设备及介质,包括:获取待合成文本和参考音频;采用滑动窗口算法将待合成文本划分为多个文本段;基于参考音频和预训练的语音合成模型,生成每个文本段对应的音频波形;对每个文本段对应的音频波形进行语音合成,得到目标语音。通过上述方式,采用滑动窗口算法对输入文本进行分割,形成若干段更小、更易管理的文本段,将若干个文本段和参数音频输入语音合成模型,使得语音合成模型基于较短的文本段逐句生成音频,使得模型能够更加专注于每个片段的精确语音和语调细节,确保音频输出的准确性和自然流畅性,解决了由于文本长度超出典型长度参数引起的退化问题,提高语音生成的稳定性。

天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币,实缴资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目276次,知识产权方面有商标信息75条,专利信息5000条,此外企业还拥有行政许可19个。

本文源自:金融界

作者:情报员