微软宣布Azure AI Speech"Avatar"智能语音服务上线

微软宣布Azure AI Speech"Avatar"智能语音服务全面上线,该服务允许开发人员构建支持自然语音的语音功能、多语种、生成式 AI 应用程序。Azure AI Speech服务中新的文本到语音头像功能可以将简单的文本转换为逼真的人以自然的声音说话的视频。开发人员可以使用作为该服务一部分的任何预建替身,也可以创建自己的自定义替身。

新功能使开发人员能够为其用户创建个性化和引人入胜的内容。这项服务的输出视频分辨率为 1920 x 1080,每秒 25 帧(FPS)。

下面是文字转语音"头像"服务的演示:

Azure Speech 文本转语音"Avatar"具有以下功能:

文字转语音"Avatar"服务的定价有点复杂。不出所料,收费将基于视频输出的长度,并按秒计费。此外,作为文本到语音头像服务解决方案一部分的文本到语音、语音到文本、Azure OpenAI 或其他 Azure 服务将单独收费。此外,该服务现在可在以下 Azure 地区使用:东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部。

您可以在这里了解更多有关文字转语音"Avatar"服务的信息。