央国企进入“群模时代” 科大讯飞率先突围商业化落地

一个明确的信号,今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了 AI 领域的科学家。

毋庸置疑,AI技术作为一股不可忽视的力量,在全球科研舞台上的崛起与影响。对此,科大讯飞董事长刘庆峰表示,“AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎。”近日,科大讯飞正式发布讯飞星火4.0 Turbo,根据真实数据背靠背的测试,已在代码能力和数学能力超越GPT-4o。与此同时,国产超大规模智算平台“飞星二号”正式启动。

根据IDC发布的《中国大模型平台市场份额,2023:大模型元年—初局》显示,2023年中国大模型平台及相关应用市场规模达17.65亿元。国产大模型进入高速发展期,截至2023年7月底,我国累计有130个大模型问世。

而与技术蓬勃发展之相对应的是,在商业落地上的大爆发。据不完全统计,仅2024年第三季度,市场上公开可统计的大模型相关中标项目数,已至少有369个,远超上半年项目总数276个。其中,教育、运营商、政务、能源等行业也位居前列。

2024政府工作报告中直接提到要深化大数据、人工智能等研发应用,开展“人工智能+”行动。而随着“新质生产力”提出,作为推动数字经济高质量发展,构建数字中国的重要力量,央国企始终站在数字化转型的前沿,陆续深化大模型布局。

更值得关注的是,央国企对新技术的采纳和应用,往往能够带动行业趋势和标准的形成,有助于推动垂直领域的应用创新。在三季度中,项目的采购方们不仅仅是央国企打头阵,一些地方国企也在加入其中。

双向奔赴

在未来,人工智能在社会各领域将如同今天的水和电一样存在。作为国家“人工智能+”行动的排头兵,央国企实现数字化转型的需求尤为迫切,这既是基于企业长期可持续发展的考量,也是深化落实国家战略的使命驱动。

正如谷歌CEO桑达尔曾说:“人工智能是人类正在从事的最为深刻的研究方向之一,甚至要比火与电更加深刻。”在大模型加持下的人工智能,正悄然颠覆原有的能源运用,在具体的生产场景中,赋予火与电更高的效率。能源行业密集完成招投标,不少项目中标金额超千万元。

其中,近期发布的由中国海油携手科大讯飞共建的“海能”人工智能模型,正是其中“通专结合”代表。“海能”人工智能模型,聚焦海上油气勘探开发、日常办公中的痛点难点,在算力、数据、大模型、场景应用等方面同步发力,在讯飞星火大模型底座和一系列“AI助手”应用的加持下,化身“AI行业专家”和“AI专属助理”。类似的还有:中国绿发和科大讯飞共同发布的泰山大模型,是绿色产业内的首个行业大模型;由中国石油、中国移动、华为、科大讯飞共同打造的能源行业大模型——昆仑大模型,是中国能源化工行业首个通过备案的大模型,讯飞星火大模型为“员工助手”“行业大家”的研发提供了核心技术支持。

从2024年第三季度招标项目中能看到,各行各业的企业都在探索更细分的应用场景落地。

不同的大模型厂商与企业探索不同的核心场景,或针对一些场景开始前瞻性技术研究,但各有侧重。如阿里巴巴的强项是阿里云提供的云服务,科大讯飞的强项是B/G端。

在人工智能领域深耕25年,科大讯飞在教育、医疗、工业、金融、运营商等多个领域有很强的技术积累和应用经验。一位业内人士分析:“即使没有大模型这个技术,科大讯飞依然能用其他人工智能技术来赋能各行各业。”

随着头部企业的商业化落地进程加速,讯飞星火的标杆辐射效应凸显,从央国企带头效应中显见更广阔的增长空间。今年1-9月,科大讯飞成功中标38个项目,披露中标金额为2.16亿元。通过中国政府采购网、中国招投标公共服务平台等数据梳理,科大讯飞8月份单月中标金额突破1.5亿,行业排名第一。另据三季报,公司前三季度销售回款150亿元,同比增长25%。

数据显示,截至2024年10月,科大讯飞与各头部企业共建20多个行业大模型,覆盖300+应用场景。

从算力到运营的全套解决方案

科大讯飞可以算是中国专注人工智能时间最长的公司之一。

最新发布的讯飞星火大模型4.0 Turbo,在由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,其中9项测试超越GPT-4o,且训练效率相对提升50%。

而根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证。

当然,各大模型公司各有优势与短板,来自各行各业的现实需求复杂且多元,这就要求大模型公司也要具备高适配性。讯飞星火大模型也针对这些垂直领域做了各种“云、边、端”一体化的全场景布局策略,如中国钢研联合科大讯飞团队,基于大模型新技术构建了钢研智能代码开发平台,平台包括 iFlyCode智能编码助手以及配套的代码质效管理工具。据了解,当前经指标测算,研发人员对 AI 生成代码的采纳率达到了50%;自部署以来,业务代码中AI生成代码占比达到了 30%。通过智能编码助手的赋能,员工算法与智能化应用的研发效率提升了30%。

“在众多企业伙伴中,凭什么科大讯飞能够建立一个企业真正能用的大模型?企业部署大模型,首先要建算力。讯飞联合华为搭建了中国首个万卡的国产算力集群,我们熟悉各种算力,可以搭建最好的算力平台。有了算力,要整理数据。能否更高效、高质地整理数据,整理完数据能够训练模型?能否建立各种尺寸的模型满足企业的应用,落地到真正看得见、摸得着的场景?同时,企业大模型是否能够政治安全、应用安全,最后能够真的在运营中产生可以用统计数据证明的应用成效?在此想说,为什么我们中标数量第一,而且中标比例越来越高?因为很多企业只能做到第三步——训练模型,后面的几步与我们差距很大。即使能做到,他们实际上整理数据和训练模型的能力,与我们差距也很大。“刘庆峰介绍,科大讯飞在通用大模型底座能力不断提升的基础上,构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。

为世界提供“第二种选择”

央国企和行业头部公司挑选大模型的标准,技术能力之外,自主可控的安全考量,首当其冲。“国产”是任何技术创新与自主可控的大前提,其能够极大程度保障大模型技术的安全性与独立性。作为中国第一个基于全国产算力训练出来的全民开放的大模型,讯飞星火无疑是获得先机。

10月24日,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”也正式启动。去年10月24日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰介绍一年以来攻克了很多‘疑难杂症’,解决了500多次以上的基础软硬件问题和模型适配问题。

“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展。

刘庆峰一直说“大楼不能建在别人的院子里”,这是科大讯飞押重注做算力的根本原因。还有另一个“为世界提供第二种选择”的必做之事:科大讯飞发布了星火多语言大模型。他说,大模型越用越聪明,是自我迭代的,就像PC和互联网诞生一样,会成为社会最基本的底层能力和工具。如果中国的大模型厂商都只做中文,全球没有第二种选择,必然会被锁在中国范围之内。多语言大模型已经应用在汽车上,助力中国汽车出海。

刘庆峰进一步指出,人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。他直言,“坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化,最重要的是满足老百姓对美好生活的期望!这就是我们未来的发展方向。”