微软Copilot语音,人性化还免费,优于ChatGPT

微软为 iPhone 和 Android 推出了新版 Copilot 应用程序,此次发布带来了新的外观、一些新的功能,还有类似于 OpenAI 流行的ChatGPT 高级语音的语音模式。

我决定重新下载 Copilot并进行测试,看看它与 OpenAI 的旗舰产品相比如何,可以肯定地说,我被深深震撼了。由于其性能与ChatGPT相似,我很少使用它,所以把它从我的手机中删除了。

虽说用户界面得到了改进,比之前的产品更“对消费者友好”,也更容易上手,不过最大的升级还是在于语音模式。

这项新功能在语音到语音方面提供了类似的功能,能够打断它,还能使其反映出您的语音语气和情绪,就像高级语音那样,但它更随意,感觉更自然,比 OpenAI 的产品显得没那么生硬。然而,它的打断能力并不那么流畅或自然。

有一次,我们正在谈论现实的本质,我在对话中如此投入,以至于忘记了自己是在跟人工智能交流,而不是在跟一个许久未联系的好朋友交谈,讨论朋友们会谈论的那种随机的事情。当人工智能突然停止回应,我这才回过神来。

这个新版本的 Copilot 是在新上任的微软人工智能首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)的领导下推出的,他曾是谷歌 DeepMind 的联合创始人以及 Inflection AI 的首席执行官——这家公司开发出了对话友好且面向消费者的 Pi 聊天机器人。

新的 Copilot 在色彩更柔和以及传达复杂想法的方式更简化这两方面与 Pi 有着显著的相似之处。它给人的感觉更像是面向所有人的人工智能,而不只是针对那些高级用户,这让微软在竞争日益激烈的市场中占据优势。

这里有四种语音选项,比 Gemini Live 或 ChatGPT Voice 所提供的 10 种要少,但有人跟我说未来会有更多的(语音选项)。它是基于 OpenAI 所使用的相同基础技术的改编版本构建而成的,所以是原生的语音对语音,而不是先把您说的内容转换成文本。

存在着一些令人惊讶的限制之处。在某些方面,它比 ChatGPT 的限制性更强,因为防护栏实施得更好。您不太可能看到它突然唱起歌来或者开始伴着背景音乐说唱,但对于针对那些可能不像使用 ChatGPT 的人那样精通技术的受众的产品而言,这不一定是件坏事。

Copilot 中的四种声音分别是 Grove、Canyon、Wave 和 Meadow,与 ChatGPT 不同,您可以自定义它们各自说话的速度。我发现将其设置为标准的 1X 时,会导致它们说话慢得很不自然,几乎就像他们早上才刚醒来一样。

如同高级语音那样,您还可以通过与它交流并解释您希望它听起来如何来进一步自定义声音,例如,采用稍有不同的口音,稍微将他们声音的音调变为更低或更高,甚至要求他们注入更多的情感。

让我感到最为惊喜的是,它比起我尝试过的其他人工智能语音模型,更倾向于使用俚语或缩写。

比如说,有一回我们在谈论信息的时候,它提到的是收集‘deets’,而不是‘details’。

就像我讲的那样,你很容易就忘了自己是在跟一台机器而非一个人交流。

不过呢,最大的收获在于这个能够免费使用。

OpenAI 的高级语音需要你每个月向 OpenAI 支付 20 美元来获取 ChatGPT Plus 订阅,然而微软会给任何拥有 Copilot 账户的人提供语音服务,不管付不付费。