腾讯科技申请音频生成模型相关专利,使得训练得到准确性更高的音频生成模型
金融界2025年1月24日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“音频生成模型的训练方法、装置及电子设备”的专利,公开号CN 119339732 A,申请日期为2024年12月。
专利摘要显示,本申请公开了一种音频生成模型的训练方法、装置及电子设备,属于人工智能技术领域。方法包括:通过神经网络模型编码样本音频得到至少两个第一样本特征,第i个第一样本特征表征按照第i个时间尺度切分样本音频后得到的各个音频段的特征信息;通过神经网络模型基于至少两个第一样本特征,生成重构音频;通过样本音频和重构音频训练神经网络模型,得到音频生成模型,音频生成模型用于基于第一音频生成第二音频。由于不同的第一样本特征反映样本音频在不同时间尺度上的信息,使得各个第一样本特征的表征能力更强,基于此,可以根据各个第一样本特征生成准确性较高的重构音频,使得基于重构音频可以训练得到准确性更高的音频生成模型。
天眼查资料显示,腾讯科技(深圳)有限公司,成立于2000年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本200万美元。通过天眼查大数据分析,腾讯科技(深圳)有限公司共对外投资了16家企业,参与招投标项目258次,知识产权方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可364个。
本文源自:金融界
作者:情报员