大模型:从拼性能到拼赋能
(原标题:大模型:从拼性能到拼赋能)
在过去的两年中,以大模型为代表的通用人工智能开启了一个全新的时代。
从“百模大战”到“千模竞技”,各种文生文、文生图、图生视频、文生视频甚至多模态大模型层出不穷。
在经历了最初的繁荣生长后,行业发展逐渐进入理性期。落地应用,成为企业最基本的目标。
10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节在合肥开幕。
从拼性能到拼赋能。在寻找产业化发展的道路上,整个行业吹响了应用的“冲锋号”。
这也是今年的讯飞1024开发者节带给人们的最突出“观感”。
在这场盛会上,诸多基于AI大模型的应用产品得以发布展示,显示出星火大模型在教育、医疗、能源、汽车、工业、金融、法律等领域不断拓展的潜力。
而从普通市民角度来看,一场城市的“AI嘉年华”,又让人们直观感受到大模型正切入人们生活的方方面面,迎来规模化应用落地的新时代。
以技术创新为底座,解放生产力,释放想象力。
大模型将如何收获“产业果实”,赋能千行百业?
“超拟人”
在大会开幕式上,科大讯飞董事长刘庆峰首先公布了讯飞星火大模型应用成绩单,并正式发布讯飞星火4.0 Turbo。
与此同时,国产超大规模智算平台“飞星二号”正式启动。
大模型技术底座能力,是产业化应用最坚实的底气。但另一个层面,大模型狂飙2年,已经过了不断比拼技术数据的阶段,更多的是要从需求出发去做技术提升。
“万物智联”是未来社会的典型特征。刘庆峰说,在万物智能时代,不仅是语音,整个人机交互领域都将上一个全新的台阶。
科大讯飞定义了万物智能时代的人机交互(AIUI)标准,并且通过了国际组织的认定,已经在去年5月正式发布了国际标准,包括远场高噪、全双工、多语种多方言等多个方面,此次1024开发者节,标准再次升级,新增了多模态、超拟人、个性化。
多模态是指多种视觉、听觉等感官信息在一起协同作用的状态。开幕式上,科大讯飞超拟人数字人首次亮相。多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。
多模态视觉能力加持下的人机交互有多惊喜?
超拟人数字人不仅可以“角色扮演”,还能够模仿孙悟空、蜡笔小新、小猪佩奇等多种角色,音色、语气甚至人设都模仿得惟妙惟肖。
“原来是给一张照片就可以有嘴型;今天,我们把嘴型、表情、动作全部贯穿起来,所有的表情动作整体化地用我们的大模型技术自动生成,而且实现了表情动作的语义贯穿,统一文本、语音和表情,实现跨模态的语义的一致性。”刘庆峰解释道。
从语音交互拓展到音视频流的实时多模态互动,情境感知更全面。不光有语音,场景、文字、物体、姿态、着装都可以看到,任务理解就会更精准;因为有语音、有手势、有行为,还有情绪,就可以使游戏、学习、购物、美食、知识问答、绘本伴读更有趣;在具身智能机器人以及汽车等新终端越来越多的未来,可以实现全新的人机交互的升级,做很多原来做不成的事。
值得一提的是,科大讯飞还首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。
“武装”6000万辆汽车
“今天,大模型已经进入到关键应用落地、更复杂的深水区。”在开幕式上,刘庆峰感叹。
大模型发展到今天,靠继续提升通用大模型性能,能带来的行业进步十分有限。要想摘到“产业果实”,必须扎根产业场景。
汽车是大模型应用探索的绝佳载体。新能源汽车产业是安徽近年来发展最受瞩目的产业。AI上车不仅将提升驾驶的便捷性与智能性,更可重新定义人与车的关系,开启汽车智能化的新时代。
大会开幕式上,奇瑞控股集团有限公司党委书记董事长、总经理尹同跃也来到现场。奇瑞、江淮汽车等车企也都携多款明星产品亮相展会。这些产品均应用了科大讯飞的核心技术。
“目前,我们智能语音交互的装配量已经超过了6000万辆车。去年,中国汽车出海500多万辆,多语种技术几乎都由科大讯飞提供。”刘庆峰表示。
“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。此次1024科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。
在教育行业,首次发布了基于“问题链”的高中数学智能教师系统。在医疗行业,发布讯飞星火医疗大模型2.0和基于讯飞星火医学影像大模型打造的智能医学影像助手。在政务服务场景,政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料。
中国工业和信息化部赛迪研究院数据显示,2023年,中国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300多个应用场景,均为第一。今年1月至9月,大模型市场中标金额和中标数,科大讯飞也均是第一。
“大模型+大算力+大数据+大场景”
在安徽,一个以大模型为根基的产业森林正在生长。
十多年前,安徽依托中国声谷打造了合肥市智能语音集群,成为目前安徽唯一国家先进制造业集群。
如今,在新一轮科技革命和产业变革下,安徽正抢抓通用人工智能发展战略机遇,致力打造产业新高地。
以“声谷、视谷、传感谷”等品牌为引领,2023年,安徽全省559家纳统人工智能规上企业实现营收1327.7亿元。今年1月至6月,全省783家纳统人工智能规上企业营业收入同比增长9.1%,高于全省新兴产业平均水平0.6个百分点;人工智能产业投资同比增长30.7%,高19.7个百分点。
赛迪顾问报告显示,2023年全国31个省(自治区、直辖市)人工智能产业发展评价中,安徽排名第6位,其中产业未来潜力、企业成长潜力分别居第1位、第2位。
只有生态的繁荣,才有人工智能的大未来。
安徽省工信厅相关负责人表示,世界声博会暨科大讯飞全球1024开发者节亦是推动安徽省智能语音及人工智能产业发展的重要平台,对于安徽构建“大模型+大算力+大数据+大场景”的产业发展格局具有重要促进作用。
本届声博会系列活动中,还包括了2024科大讯飞AI开发者大赛。共有来自14个国家、348座城市的35268支团队参赛。科大讯飞联合30所科研院校、44家企业与机构共创赛题,最终评选出十佳团队。
这些团队都将成为安徽乃至全国人工智能产业不断生发的“种子”。
科大讯飞将牵头成立AI基金,用5亿元创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。
今年9月,作为安徽省重点打造的集科研、教育、产业化于一体的AI产业集聚区——讯飞小镇,正式投入使用,为安徽人工智能科技创新和产业发展提供了重要载体。
发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
科大讯飞表示,将开放全场景资源,进行线上线下渠道和资源共享,让更多开发者在拓展市场上取得更大成功。
一个顶天立地、自主可控、通专结合、端云联动、软硬一体的人工智能发展生态正在安徽不断汇聚。(记者 丰 静 通讯员 汪日贵)