昆仑万维推出「天工大模型4.0」4o版(Skywork 4o),实时语音对话助手...

从「天工大模型1.0」的研发到「天工大模型3.0」的发布,再到今天的「天工大模型4.0」阶段,我们坚定地投入了近四年的时间和研发。今天,昆仑万维正式推出「天工大模型4.0」4o版(Skywork 4o),以及新产品「实时语音对话助手Skyo」。Skyo作为一个智能语音互动产品,具备快速响应、多语言对话能力,它能够主动发起对话、实时打断。同时,Skyo具备情感化反应和个性化声音定制功能,为用户带来温暖贴心的陪伴体验。

更重要的是,基于天工AI的大模型技术能力和AI搜索功能,Skyo能克服大模型幻觉问题,在对话中回复真实内容。无论在情感陪伴、个性化交互、多语言客服还是时事新闻聊天等应用场景中,都能提供智能且贴合需求的互动。

当前,昆仑万维旗下天工AI的应用生态羽翼丰满、备受用户喜爱,功能矩阵涵盖AI搜索、AI文档-音视频分析、AI写作、AI音乐、AI图片生成、AI PPT。实时语音对话助手Skyo的推出和加入,不仅让天工AI的生态矩阵更加立体、逐渐完善,也标志着端到端实时语音对话建模技术的重大进步。同时,以Skyo为代表的AI语音互动应用,正是我们期待的下一代超级个人助理的终极交互形态,结合未来Skyo所期待具备的多模态交互能力,它更是一次人机交互模式的新体验和革命性飞跃。01.模型自研,打造端到端、更卓越的实时语音对话系统通过深入研究实时语音对话过程,我们发现仍有一些痛点尚未被现有方案解决:全双工响应延迟较长、对话不够连贯、语音生成和交互体验不够自然,以及对多语言和情绪表达的支持不足。昆仑万维则希望充分利用我们在AI大模型、AI音乐、AI搜索中的研发经验,提供更自然、更流畅、更拟人、低延时的用户交互体验。「天工大模型4.0」4o版(Skywork 4o)以及Skyo由我们的技术团队自主研发,他们具有深厚的语音和音乐大模型的技术经验以及大量语音数据积累。端到端自研先进链路,能在多任务下表现出色,尤其在高强度对话交互中仍能保持稳定性和流畅性。「天工大模型4.0」4o版(Skywork 4o)模型优势:模型优势

基于模型能力和先进的端到端实时语音对话建模技术,Skyo颇具亮点,能实现以下功能:

能在1秒内回复、聊天中可打断:依托全双工+低延时技术,系统能随时聊天和打断,带给用户更自然对话感

主动交流:系统在检测到用户静默后,会主动发起聊天,并根据用户的历史偏好进行对偏好垂类的新闻进行语音播报

持续长对话:可支持跟用户长时间对话互动,在用户休闲、健身、出行途中进行可持续陪伴,成为用户的个人互动播客

情感反应:提供拟人化回复,会感受到用户情感进行回复

质感音色:更自然、更逼真的声音表达,并且实现情感和语调的高度还原

风格切换:支持用户定制声音风格,如选择专业新闻播报的男生音色、英姿飒爽的女生音色等

强大的记忆功能:能够在对话中追踪并回忆用户的偏好和历史信息,以提升多次对话的准确度

回复真实内容:具备实时资讯获知和知识拓展能力,与用户进行互动式交流

那么我们先和Skyo打个招呼,然后再一口气问它一系列“难题”考考它,并且“故意”随时打断它:

接下来,我们试试Skyo对一些「严肃话题」和「实时新闻」的反应能力:

周末(11月16日)北京天气怎么样?

北京平常下雨多吗?

特朗普再次当选总统,你怎么看?

李子柒上传了一个新视频,你看了吗?

怎么样区分真诚的道歉和虚伪的道歉?

什么情况下,说谎是个正确的选择?

果不其然,天气分析、热点评论、辩证思考......通通不在话下。

针对严肃话题和热点新闻,Skyo能回复真实内容,回答的“有模有样”,逻辑清晰、论点清晰、证据真实,既能对美国总统竞选给出一些资讯分析,也能对时隔三年携最新作品惊艳回归的李子柒做出点评。同样的,Skyo频频被打断,也没有“崩溃”,还是顺畅的跳转到了下一段对话。即使第一次没有听清楚我们说的内容,或认为自己答的不够好,它还可以自己调整,重新回答一遍,并且幽默说道“不好意思,看来没有回答的很好哦”。除了“智商感”满满,Skyo的回答也颇具情商,在回答一些”充满陷阱”的问题时,它同样透露出一些小智慧。面对“什么时候说谎是正确的选择”这样的哲学性问题,Skyo能为我们分析出“为了避免伤害他人感情、保护隐私等时候,说谎可能是一个合适的选择”。

最后,我们换一些轻松的话题,来看看它对一些日常话题的回答效果:

(昆仑万维)