ChatGPT 高级语音登 Mac 和 Windows,获取攻略速看
OpenAI 终于把高级语音模式引入了桌面端。它在 Windows 和 Mac 系统的ChatGPT 应用程序版本中均可使用,并且与移动版本的工作方式相同。
这意味着您终于能够和您的计算机进行对话了。不是像您与 Siri 或 Alexa 交流的那种方式(没错,我口述这段文字时,它们都被触发了),而是像您 与另一个人交谈 那样的完整对话。
高级语音属于原生的语音到语音模式。这意味着 OpenAI 的语音机器人可以理解您说的一切、您说话的方式,甚至您单词之间的停顿。它的回应同样自然,包括添加诸如“嗯”之类的口头习惯和每个句子之间的呼吸声。
我们仍然没有完全实现 OpenAI 春季更新中对 ChatGPT 做出的屏幕共享和实时视频的全部承诺,但它最终会到来,这对于其他语音模型而言,仍然是一次重大的升级。
您在台式机应用程序中访问高级语音的方式跟在 iOS 或 Android 中是相同的——点击聊天栏中的图标。一旦您点击这个按钮,它就会打开一个带有那个如今众人皆知的渐变蓝色圆圈的新视图。
您可以在继续进行其他任务的同时与 AI 交谈。虽然它看不到您在干啥,但它能够对任务的描述或者您的表现进行响应。因此,例如,如果您在玩《我的世界》时使用它,您可以描述场景,它可以提议使用的建筑或方块类型。
把先进的语音功能带到桌面是 OpenAI 合乎逻辑的下一步举措。能够与人工智能对话,能让您集思广益,或者完成您可能独自无法完成的任务。
未来,您还能跟高级语音共享您的屏幕,好让它能看到您正在做的事。有一天,随着人工智能代理的兴起,您甚至有可能让它控制您的屏幕,并且在这个过程中跟您交流。
虽说高级语音是个非常有用的工具,不过更强大的是底层的实时 API。这是开发人员用来构建自己的版本或者把它集成到自己工具中的高级语音后端。
在近期与 OpenAI 团队的一次情况通报会上,该公司的开发者联络负责人罗曼·休特(Romain Huet)展示了这一令人印象深刻的太阳系演示。您能够指示语音在行星之间移动,它能够实时就我们所访问的每个世界的性质提供见解,并以对话的方式回答问题。
在另一场演示中,他展示了把它用作虚拟旅行社,不仅帮助您预订航班,还能找到最佳交易。您可以向它表明您的明确要求,它能够依据可用内容进行提问或提供反馈,而不是像我们当下从自动电话中看到的那种逻辑树方法。
所有这些功能即将开始推出,不仅在 OpenAI 的应用程序中,而且在未来几个月和几年中其他开发者的应用程序中。我认为语音将成为我们与计算机交互的新方式。
现在我就只需要找一款更好的听写软件,别让我花上好几个小时去回顾用语音输入的所有内容来修正那些明显的错误。