讯飞星火大模型“跑步”迭代,如何跑进我的生活?

作者|白芊芊

编辑 | 覃拓

运营| 陶子枫

生成式AI浪潮方兴未艾,“百模大战”愈演愈烈。

6月9日,恰逢24周岁生日的科大讯飞推出自研大模型升级版——星火认知大模型(下称“星火”)V1.5。经过一个多月的“快跑”,这款诞生于5月6日的大模型在开放式问答、多轮对话、逻辑和数学能力上迈进一步,其他能力也有明显提升。

与此同时,科大讯飞在大模型应用层交出答卷,6月9日一并发布星火在教育、医疗、工业、办公等四大领域的应用产品,并宣布开放讯飞星火开发接口,携手开发者探索星火更多的落地可能。

模型层、应用层双重发力,科大讯飞的打法也是国内科技巨头竞逐生成式AI的缩影。2023年初Chat-GPT引爆生成式AI浪潮以来,一众科技企业在竞相推出自研大模型的同时,也在上层应用领域探索大模型商业化落地。已经涌现出的玩法有哪些?大模型商业化还面临哪些困境?

一:讯飞 星火“1+N”征程:探索多元落地场景

星火此次迭代是科大讯飞大模型升级时间表上的首个里程碑。根据科大讯飞5月6日披露的计划,星火诞生一个月零三天后即6月9日,要实现星火开放式问答能力、多轮对话能力和数学能力升级。

上述三大能力升级的目标均如期达成。多轮对话是重要的升级能力项。据科大讯飞总裁吴晓如介绍,多轮对话能力的可以使星火未来可以完成特定复杂的任务,并且可以通过人机共创,在多轮交互的过程中不断激发灵感。

而在开放式问答方面,科大讯飞通过采用类搜索的插件从实时信息库和专业数据库搜索提取知识,弥补此前训练语料无法实时更新的缺陷,使得星火的语言理解能力和知识问答能力分别提升了8%和24%。

“一条船上有三个人,但是有两个父亲、两个儿子,这是怎么回事?”面对这道逻辑稍显复杂的题目,“升级版”星火也给出了正确答案。据科大讯飞方面披露,星火V1.5版的逻辑能力较初代提高了10%。除此,数学能力提升9%,可以综合应用应用方程、排列组合等方法解决数学问题。

而除围绕大模型本身进行迭代以外,在科大讯飞2022年12月启动的“1+N”认知大模型专项攻关计划中,大模型在教育、办公、汽车、人机交互等“N”个领域的落地也是攻关重点。

在大模型应用落地上,科大讯飞正基于既有的产品生态探索星火在to C、to B领域的应用潜能,继5月6日推出搭载了初代星火的讯飞AI学习机、讯飞听见APP、办公本和智能座舱之后,6月9日继续发布基于星火1.5版本的生成式AI产品应用。

C端产品上,科大讯飞6月9日亮相的应用包括支持多轮对话的星火App及小程序、具有口语陪练功能的星火语伴,以及不仅可以听音转写、生成字幕,还可以整理成稿、生成会议纪要的讯飞听见智慧屏。

B端产品则涉及工业和医疗场景。利用星火认知大模型优势,科大讯飞对既有的羚羊工业互联网和诊后康复管理平台进行迭代。大模型加持下的羚羊工业互联网可扫描各种网上或者企业自身的的产品文档、服务文档,从而可更好完成企业需求和供应的对接,提供需求解决方案和相应产品、专家。

医疗方面,接入星火的诊后康复管理平台可以帮助医生快速生成康复的计划,指导患者和医生快速连接,帮医生对诊后患者康复管理的效率和患者对医嘱的依从性分别提升10倍和2.4倍。

二:大模型商业化探索:应用层先行“开花”

如同开创智能手机时代的iPhone,ChatGPT已将AI圈卷入了大模型时代。

一众玩家之中,既有面对新机会摩拳擦掌的AI创业公司,也有积极拥抱新浪潮的大型科技公司。但高昂的算力和训练成本筑起了极高的资金门槛,目前率先交出大模型答卷以后者为主。除科大讯飞以外,2023年3月份以来,百度、本站有道、360、阿里、华为等科技企业均推出或“剧透”了各自的自研大模型。

但大模型研发、运用成本高昂,快速让市场看见大模型的颠覆性能力和商业价值对于研发企业而言至关重要。从各家“打法”来看,将大模型接入已有的成熟业务场景,借生成式AI之力提升现有产品竞争力成为一种常规选择。

譬如,以搜索引擎为关键业务的百度、360均将AI功能接入搜索场景,目前处于内测阶段;本站有道把“子曰”大模型嵌入有道翻译、有道词典笔、有道围棋课程等产品,推出开口说、语音复盘等AI功能;阿里宣布则计划未来为所有产品都所有接入,对现有产品生态进行全面改造。而在办公、教育领域深耕已久的科大讯飞也首先选择将星火接入讯飞AI学习机、讯飞听见等成熟产品中。

在C端市场,大模型给成熟产品带来的赋能作用已有迹可循。据科大讯飞披露,得益于星火带来的口语陪练、写作助手等个性化功能,6月1日至8日,学习机产品的激活数量比去年同期增长了214%;而通过提供语篇规整、意见成稿和会议纪要等功能,在月6号发布的讯飞办公本和听见产品用户激活度也分别提升了176%和205%。

C端应用之外,有企业服务经验在先的大公司也在开拓大模型在B端领域的应用。据华为人士在4月8日人工智能大模型技术高峰论坛上公开介绍,未来将重点发展煤矿、水泥、电力、金融、农业重点等细分场景的落地应用。科大讯飞亦计划在大模型to B应用上继续发力,按照星火认知大模型“1+N”攻关时间表,10月24日,星火大模型水平对齐ChatGPT的同时,要在包括医疗在内的应用领域做到业界领先。

而除自研自用、为自身产品赋能,面向开发者和企业用户开放AI能力也是科技公司正在推动的大模型落地模式。这意味着大模型有望以门槛更低的形式在更多细分场景落地有望实现。

拥有中国首批四大人工智能开放平台之一的科大讯飞也将对外开放大模型作为一种选择,意在打造“星火生态”。截至2023年5月,科大讯飞人工智能开放平台有400余万实名认证开发者和500余万合作伙伴。在星火正式发布前,已有36个行业、超3000家企业与讯飞达成了明确合作意向。

三:大模型多元应用:还要突破几重关?

多方竞逐态势下,短短半年内,国内生成式AI应用层产品层出不穷、百花齐放。紫金投资分析师陈大鹏观察到,目前AI在绘画、文字生成、教育等to C领域的商业化应用已见雏形, “基本能实现把人会做的事情用更快的方式做一遍”。

但对于C端应用的入局者来说,随着同类应用不断涌现,如何打出产品差异化至关重要。这既考验应用底层大模型的基础能力,也考验产品开发者的创新能力。另从商业模式持续性考虑,陈大鹏指出,当大模型在C端场景给用户带来的边际效益递减 ,用户为其付费意愿可能也会下降。因此,大语言模型更值得期待的商业化潜力或在金融、医疗等人力成本较高、对生产或服务提效有刚需的细分领域。

而从现有通用大模型的能力来看,其在深度专业问题的解答上还存在盲区。“比方说一个很简单的例子,你去问大模型工具关于销售策略、市场营销策略等商业基本问题,它可以答出很多点,回答得挺好。但如果涉及到冷链运输、养殖等非常细分的领域,它的回答可能就没那么精准。”陈大鹏举例道。

而要优化生成式AI在垂直领域的表现,解法又回归到底层大模型的能力提升上。这对人工智能三要素——算法、算力、数据无一不是一种考验。尤其在数据资产日益珍贵、数据应用监管渐趋完善的当下,如何确保“投喂”给大模型的数据全面、准确、实时,或是需要重点突破的问题。

而如火如荼的“百模大战”中,各大厂自研大模型也在朝优化能力和多元应用的方向迈进。按照科大讯飞的计划,8月15日,星火要实现代码能力升级和多模态交互能力提升;到了10月24日,要实现通用模型对标ChatGPT(中文超越、英文齐平),并在教、医疗等领域做到业界领先。星火下一份答卷,业内拭目以待。