☰

讯飞星火语音大模型强悍升级！支持74个语种方言“自由对话”

（原标题：讯飞星火语音大模型强悍升级！支持74个语种方言“自由对话”）

6月27日，科大讯飞在北京发布讯飞星火大模型V4.0，七大核心能力全面提升，在8个国际主流测试集中排名第一，国内大模型全面领先。

基于星火大模型V4.0的强大性能，科大讯飞旗下包括医疗、教育、办公、智慧汽车等在内的若干智能应用也密集落地或升级。

讯飞星火APP、桌面端新增“个人空间”，打造更懂你的AI助手；讯飞晓医APP升级，上线个人数字健康空间，打造每个人的健康助手；业界首发星火智能批阅机，“AI助教”助力老师减负增效、因材施教；星火语音大模型支持74个语种/方言“自由对话”……

科大讯飞董事长刘庆峰在发布会上表示，语音将成为万物互联时代人机交互的主要方式，人机交互最重要的场景是远场、噪声、多人说话、多语言，因此万物互联时代的AIUI（人工智能用户界面）要满足远场高噪声、多语言多方言、全双工、多模态等标准。

近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来，过去十年我国人工智能领域的首个国家科学技术进步奖一等奖

基于科大讯飞全球领先的多语种语音技术，星火语音大模型迎来新突破。面向万物互联时代，新增多语种、多方言免切换语音识别能力，可支持37个语种、37种方言“自由对话”。

其中，37个语种识别效果领先OpenAI whisper-V3，37个方言识别效果平均提升30%。现场，科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果，能让输入效率提高。

同时发布软硬件一体化讯飞同传系统，可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。本次参会的嘉宾座位上同样配备讯飞同传的收听设备，佩戴后即可实时收听多语种AI同声传译。

针对强干扰场景下的语音识别难题，科大讯飞突破了多人混叠场景下的极复杂场景语音转写，即使在三人混叠说话场景也能实现86%的语音识别准确率。

科大讯表示，未来基于多模态的声音识别技术，将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。

赋能行业的同时，讯飞星火大模型也不忘助力开发者生态蓬勃发展。据公开数据显示，自今年1月30日讯飞星火V3.5发布以来，短短5个月，星火开发者生态加速增长，开发者数从598万增长到702万，新增超104万；海外开发者数超40万；大模型开发者达57万。

“今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的，在这个时代，做帝国注定要衰落，只有生态才能生生不息；必须是自主可控的繁荣生态，才有中国通用人工智能大未来。”谈到生态繁荣，刘庆峰表示。

相关资讯