浙江大学科大讯飞申请伪造语音声纹解混方法及系统专利,提高语音验证系统抗伪造能力
金融界2025年7月4日消息,国家知识产权局信息显示,浙江大学;科大讯飞股份有限公司申请一项名为“一种伪造语音声纹解混方法及系统”的专利,公开号CN120260575A,申请日期为2025年04月。
专利摘要显示,本发明公开了一种伪造语音声纹解混方法及系统,涉及语音处理和深度学习技术领域,包括以下步骤:基于Transformer模型对输入的伪造语音进行特征提取,得到包含源说话人声纹信息的粗略特征;采用残差正交化方法对粗略特征进行分解,恢复源说话人的声纹特征;对源说话人的声纹特征进行维度归一化,得到固定长度的声纹特征;使用加性角度边距损失增强源说话人与其他声纹之间的角度差异,输出解混后音频数据。本发明能够有效去除语音转换后目标说话人声纹的影响,恢复源说话人的真实声纹特征,从而提高语音验证系统的抗伪造能力。
本文源自:金融界
作者:情报员