☰

腾讯科技申请音频生成模型相关专利，使得训练得到准确性更高的音频生成模型

金融界2025年1月24日消息，国家知识产权局信息显示，腾讯科技（深圳）有限公司申请一项名为“音频生成模型的训练方法、装置及电子设备”的专利，公开号CN 119339732 A，申请日期为2024年12月。

专利摘要显示，本申请公开了一种音频生成模型的训练方法、装置及电子设备，属于人工智能技术领域。方法包括：通过神经网络模型编码样本音频得到至少两个第一样本特征，第i个第一样本特征表征按照第i个时间尺度切分样本音频后得到的各个音频段的特征信息；通过神经网络模型基于至少两个第一样本特征，生成重构音频；通过样本音频和重构音频训练神经网络模型，得到音频生成模型，音频生成模型用于基于第一音频生成第二音频。由于不同的第一样本特征反映样本音频在不同时间尺度上的信息，使得各个第一样本特征的表征能力更强，基于此，可以根据各个第一样本特征生成准确性较高的重构音频，使得基于重构音频可以训练得到准确性更高的音频生成模型。

天眼查资料显示，腾讯科技（深圳）有限公司，成立于2000年，位于深圳市，是一家以从事软件和信息技术服务业为主的企业。企业注册资本200万美元。通过天眼查大数据分析，腾讯科技（深圳）有限公司共对外投资了16家企业，参与招投标项目258次，知识产权方面有商标信息5000条，专利信息5000条，此外企业还拥有行政许可364个。

本文源自：金融界

作者：情报员

腾讯科技申请音频生成模型相关专利，使得训练得到准确性更高的音频生成模型

相关资讯