☰

OpenAI推出语音克隆AI模型

据报道，据外电报道，OpenAI 刚刚宣布近期进行了小规模预演一个名为语音引擎的新工具的诞生。

这是一种声音克隆技术，可以通过分析 15 秒的音频样本来模仿任何说话者。该公司表示，它可以生成自然的语音和情感丰富且真实的声音。

该模型还可以执行语音克隆。它的工作原理是这样的：人类说话者通过手机或计算机麦克风录制 15 秒的语音片段，OpenAI 的语音引擎会生成与原始说话者非常相似的自然语音，并且可以在以后使用，大声说出人类用户输入的任何文本。

该技术基于本公司预先存在的文本转语音 API。自 2022 年以来，这项工作一直在进行中。OpenAI 已经在使用该工具集的一个版本来支持当前文本转语音 API 和 Read Aloud 功能中可用的预设语音。该公司的官方博客上有一堆样本，它们听起来非常接近真实的东西。（鞭牛士）

相关资讯