讯飞星火3.5死磕大模型的第二种可能
文/每日资本论
“这一年下来,星火大模型究竟跟国际最顶尖的技术相比,水平到底怎么样?”
2024年元月30日,科大讯飞董事长刘庆峰在讯飞星火认知大模型V3.5升级发布会上,大胆地提出了一个众多人想问又不好意思开口的问题。
答案令人惊喜——相较于讯飞星火V3.0,星火V3.5在逻辑推理、文本生成、代码、多模态等七大方面能力均有提升。其中,语言理解、数学能力超过GPT-4 Turbo,代码能力达到GPT-4 Turbo的96%,多模态理解能力达到GPT-4V的91%。
敲黑板!这是中国首个真正意义上自主可控的算力平台上训练出来的大模型,而非只是简单地在应用层面取得进步。这也意味着,中国企业有能力发展基于国产算力底层的大模型,维护算力安全和国家安全。
刘庆峰说:“在今天的大模型时代,我们绝不能只用开源模型做应用落地,在通用大模型的底座上一定要有国家队站出来。”
坦率地讲,能做到如此实属不易。谁都知道,做应用难,做算力更难。而且,在高科技领域美国正在对中国企业持续极限施压,而且势头越来越猛,华为手机被美国打压就是典型的警示案例。如今,中国企业连“阉割版”的芯片都不容易买到,而且美国商务部还企图从云计算领域,进一步阻止中国获得其想要用来训练本国人工智能模型的算力。
那么,中国的“算力荒”有多严重?
相关数据显示,中国目前的算力需求量约为每年1.5亿台的服务器,而中国的算力供给量仅为每年3000万台的服务器,缺口达到了1.2亿台,占到了全球算力缺口的80%。
这意味着,中国每年需要从美国进口价值约为600亿美元的服务器,而这些服务器都受到美国的出口管制和监控,随时可能被美国切断或植入后门。这对中国的算力安全和发展,构成了巨大的威胁和障碍。而快速成长的中国AI企业科大讯飞,早2019年就被美国拉入了“黑名单”。
庆幸的是,科大讯飞在技术层面实现了大部分的自主,有着大量的备胎选项,所以即便是被针对,也未就此一蹶不振。更为重要的是,科大讯飞得到了合肥市的全力支持。
早在4年前,合肥市数字经济规模就已超4000亿元,占GDP比重超4成。2021年、2022年连续入选数字经济发展新一线城市。为加快布局智能算力基础设施,合肥加快推进了合肥市通用人工智能算力数据中心项目、合肥城市云算力中心项目等大规模算力设施。
2023年6月,“巢湖明月”算力集群二期合肥人工智能计算中心开始试运行,该项目入选科技部“国家新一代人工智能公共算力开放创新平台建设名单”;10月24日,在第六届声博会暨2023科大讯飞全球1024开发者节上,科大讯飞联合华为在合肥发布“飞星一号”大模型算力平台;10月底,规模达3000P级(1P约等于每秒1000万亿次的计算速度)算力的合肥市通用人工智能算力集群项目正式投产。
毫无疑问,合肥在对高质量算力的布局很有远见。也正是这种远见与企业努力,才有了星火V3.5,才有了讯飞与华为在大模型算力底座上的深度共建,才有了维护算力国家安全的能力……如此,不仅走出一条自主创新的大模型之路,也为大模型的发展提供第二种选择,产业意义极其重大。
好了,星火V3.5到底带来了哪些亮点呢?
到底靓在哪儿?
“听说今年‘尔滨’特别火,作为南方小土豆还挺想去玩一下。要不,你用东北话介绍下有啥好玩的呗?”科大讯飞研究院院长刘聪操着一口安徽口音的普通话问星火V3.5。
很快,星火V3.5居然用一口地道的东北话,快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。
“每日资本论”最直观的感受是,“星火V3.5”更像一个人了。其不仅能够帮助用户带来解决方案,还能像“知冷知热”的朋友对话一般带入情绪互动,超高的拟人度口音,让大模型更具人情味。
用刘庆峰的话说:“这是科大讯飞从创业起就一直希望做到的人机自然对话,相信全语音的自然交互可以赋能整个万物互联时代,推动整个产业出现新的繁荣。”
而且其人机互动的内容创作能力令人眼前一亮。简单说,星火V3.5可以将一篇小短文迅速分层次提炼要点,并按照指令进行适度扩充内容,而且还能细化要点内容。这就让文案工作变得智能,极大提高工作效率。
最让打工人激动的或许是,讯飞星火V3.5对年终总结计划、述职PPT、活动策划、政策问答等任务“信手拈来”。基于此,科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文,可以一键快速自动生成文档和PPT的办公产品“讯飞智文”,主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、演讲备注等。
刘聪现场使用讯飞智文制作了“合肥市2024年春节旅游推广策略”PPT。短时间内,星火V3.5就制作了超20页内容丰富的PPT一气呵成。不仅如此,刘聪还演示了,提出指令将单页PPT细化的功能,让PPT变得更有个性化令人印象深刻。
如此“打工神器”自然获得线上线下掌声不断。据刘庆峰介绍,星火V3.5在要素抽取、问题生成等底层能力的进步,能够帮助知识学习和内容创作领域,产生更丰富更有用的智能体。同时,大模型能够结合外部知识进行合理拓展,做到“旁征博引”。在真实过程中让用户参与人机共创,既是人工智能时代技术追求的方向,也是将来的基本理念追求。
智慧黑板也是吸睛产品。其不仅能与老师的板书同步,而且能够将立体几何图形进行分拆、重新组合、色块区分等,这样让抽象的几何学习变得生动形象,更容易让学生掌握。
此外,对于学生们脑洞大开的问题,智慧黑板也能深入浅出地做出解答。比如,爱因斯坦出现在星火智慧黑板上,用“吸力巨大的吸尘器”来比喻黑洞,让学生们能快速理解“黑洞是什么”。
据悉,星火智慧黑板,具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享四大功能。讯飞对于智慧黑板定位是,不再是简单的板书工具,而是跃迁成为教师的AI助手。
为什么人工智能的每次进步都有对教育领域的赋能?刘庆峰解释称,通用人工智能作为能够改变世界生产生活方式的全新技术,可以推动人类进步。“而教育是人类进步的根本,关乎每一位个体,是真正的全民刚需。”
更像人的语音大模型
如果是说教育是人类进步的刚需,那么语音则是大模型发展的刚需中的刚需。恰巧,科大讯飞早在25年前就是这方面的翘楚。
众所周知,科大讯飞成立于1999年,而2000年前中国的语音产业全部控制在微软、IBM等国外巨头手上。科大讯飞通过努力,逐渐扭转了中文语音市场几乎全被国外IT巨头垄断的格局,打破“”,并成为国内最大智能语音技术厂商。
2008年,科大讯飞成功上市,成为中国语音产业界第一家上市公司。2006年到2019年,连续14年荣获国际语音合成大赛冠军。2016年到2023年,连续4届获得国际多通道语音分离和识别比赛CHiME冠军;2019年,科大讯飞新一代语音翻译关键技术及系统荣获世界人工智能大会最高荣誉SAIL应用奖。2021年到2023年,连续三年获得国际语音翻译比赛IWSLT冠军……
即便如此,或许所有人都未曾预见,语音技术的全新机遇出现在大模型时代。刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”
据悉,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
本次发布会上,刘庆峰又拿出一款重量级产品——搭载语音大模型的讯飞翻译机。
讯飞翻译机即将上线支持85个语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成升级。多语种自动识别让国际沟通更加便捷,增强式翻译技术让翻译机化身AI翻译助手。
很多人或许会问,手机上也自带翻译软件为何要使用独立的翻译机?
这恰恰是讯飞翻译机的卖点之一。首先独立翻译机自带的麦克风抗干扰能力不是手机麦克风可以比拟的。也就是说,前者在旅游、市场、机场、餐厅等复杂语音环境中更能准确分辨语音。其次,出国或在使用到翻译机时会经常遇到特殊环境。比如,遭遇无手机和网络信号以及无法使用通讯设备时,翻译机就会体现出强大的实用价值。
最让人惊讶的是,当用户通过语言向星火语言大模型提出理财等金融服务时,后者近乎完美的口语化表达、多意图理解、情感关怀,即便中途被用户语言打断,也会迅速根据用户要求回答相关问题,让用户压根没有意识到对方是AI智能人而非真正的客服人员。
这种功能看起来十分寻常,但就是这种“丝滑的客服对接”,让星火语言大模型可以“百搭”更多的应用场景——在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互变革。如赋能汽车,智能驾舱、智能座舱、智能导航、音乐控制等交互体验将进一步优化;陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。
可以这么说,大模型时代讯飞语言技术变得举足轻重,能够更好的拥抱万物互联时代,也会成为科大讯飞持续高速发展的强力引擎。
科大讯飞还下了一步雄心勃勃的大棋——开源。
很多企业在与科大讯飞合作中提出了一个想法,“讯飞能不能把星火做开源?”2023年5月6日,讯飞星火V1.0是13B的版本,推出来至少有不下5所学校测评,认为讯飞的大模型都比很多号称千亿的模型效果还好。彼时,就有部分企业希望讯飞能把模型开放出来。
如今,首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B也正式发布。而基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化,训练效率达A100的 90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
短短半年,星火大模型总开发者数量已达35万,其中有22万是企业开发者,占比最多的是企业服务,其次跟教育有关,然后是客服、医疗等,都是社会的刚需和痛点。星火大模型开发者数量在业内最高,且用户口碑极好。
目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索,必将推动国产大模型的自主创新。未来,开源必然会让更多的场景落地,星火的生态圈也必将越来越大。
懂了吧?形象点说,科大讯飞正在做“大模型时代的谷歌”。一旦生态圈打造成功,就等于再造一个甚至N个科大讯飞。
刘庆峰表示,要清醒理智看到差距。当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。他说:“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,但我们一定要有勇气、有期许走在最前列。”
【文章只供交流,并非投资建议,请注意投资风险。码字不易,若您手机还有电,请帮忙点赞、转发。非常感谢】