讯飞星火语音大模型强悍升级!支持74个语种方言“自由对话”

(原标题:讯飞星火语音大模型强悍升级!支持74个语种方言“自由对话”)

6月27日,科大讯飞在北京发布讯飞星火大模型V4.0,七大核心能力全面提升,在8个国际主流测试集中排名第一,国内大模型全面领先。

基于星火大模型V4.0的强大性能,科大讯飞旗下包括医疗、教育、办公、智慧汽车等在内的若干智能应用也密集落地或升级。

讯飞星火APP、桌面端新增“个人空间”,打造更懂你的AI助手;讯飞晓医APP升级,上线个人数字健康空间,打造每个人的健康助手;业界首发星火智能批阅机,“AI助教”助力老师减负增效、因材施教;星火语音大模型支持74个语种/方言“自由对话”……

科大讯飞董事长刘庆峰在发布会上表示,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。

近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年我国人工智能领域的首个国家科学技术进步奖一等奖

基于科大讯飞全球领先的多语种语音技术,星火语音大模型迎来新突破。面向万物互联时代,新增多语种、多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。

其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率提高。

同时发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备,佩戴后即可实时收听多语种AI同声传译。

针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。

科大讯表示,未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。

赋能行业的同时,讯飞星火大模型也不忘助力开发者生态蓬勃发展。据公开数据显示,自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。

“今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的,在这个时代,做帝国注定要衰落,只有生态才能生生不息;必须是自主可控的繁荣生态,才有中国通用人工智能大未来。”谈到生态繁荣,刘庆峰表示。