ChatGPT「语音助理」来了! 少数Plus用户抢先试用

▲OpenAI预计8月初公布GPT-4o功能。(图/路透)

记者陈香菱/综合报导

美国人工智慧公司OpenAI推出「语音助理」,从29日起,将向部分付费的ChatGPT Plus客户推出语音功能,预计所有的ChatGPT Plus客户在今秋前就能使用。即将推出的视讯功能将可以直接「打断」它的回答,同时有更多「情绪化」的回复,「就像与人交谈一样」。

OpenAI在声明中指出,SearchGPT这是新搜寻功能的原型,希望将AI与网路最新资讯结合,透过搜索不同资料整合来提供快速、及时的答案,也会附上来源的连结,让用户能快速找出更多相关资讯,还可以透过问答对话进行交流,辨识使用者的语调,来产生不同的声音。

「透过逐步推出,我们可以密切监控使用情况,并基于真实世界的回馈,不断改良模型能力和安全性。」OpenAI表示,会持续推出更多新功能及产品,视讯与萤幕共享的功能还在研发中。

OpenAI在X上宣布,将开始向部分付费的ChatGPT Plus客户推出语音功能,语音模式将提供「更自然、即时的对话,允许你随时打断,并能感应并回应你的情绪」,被选到的用户会收到一封电子邮件,里面包含使用说明及相关资讯,预计让所有Plus用户在「今年秋季前」使用到新功能。

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

语音功能是5月发布GPT-4o时的核心项目,他们也计划在8月初发布GPT-4o的功能、限制和安全评估的详细报告,除了改善ChatGPT的体验模式,GPT-4o将更直觉化的让消费者可以透过这项服务完成各种任务,同时增加其运作效率,会比GPT-4-turbo快上约2倍以上,但价格只需要原先的一半。

在发表会的直播中,官方也直接示范当提出问题时,可以「打断」它的回答,同时将会有更多「情绪化」的回复,甚至可以透过辨识使用者的语调,来产生不同的声音。OpenAI指出,语音功能将支援45种语言,为了保护个人隐私,训练模板只会使用4种预设声音说话。

OpenAI研究人员在视讯活动中展示,新功能让使用者在与ChatGPT进行对话时,可以毫无延迟地获得即时回答,甚至能在ChatGPT讲话时打断它,这两项逼真对话的特点在聊天机器人上前所未见。

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqNText and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx