BAT聚首通用大模型 首战是产业场景落地
来源:封面新闻
封面新闻记者 欧阳宏宇
继百度文心一言、阿里通义千问后,腾讯也正式拿出通用大模型产品。自此,BAT终于会师通用大模型赛道。
9月7日,腾讯正式推出混元大模型,并宣布通过腾讯云对外开放,并已接入腾讯广告、游戏、金融科技、会议等产品。据介绍,该大模型产品是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,将作为腾讯云MaaS服务的底座,支持API直接调用,以及专属大模型产品应用构建。
此前发布的《中国人工智能大模型地图研究报告》显示,国内已有79个大模型,包括盘古、文心一言、通义千问等,自然语言处理是目前研发最活跃的重点领域。据了解,混元大模型的主要能力仍然集中于这一领域。
当国产大模型进入长跑期,通义千问、星火认知等通用大模型产品和场景的结合已暗示,行业发展方向从参数至上转向实用优先。
通义千问发布的同时,阿里云智能CEO张勇就表示,阿里所有产品未来将接入该大模型。文心一言通过备案后,已可以在百度网页搜索中通过“ai对话”的方式使用。上月,星火认知迭代至V2.0,同时增加了教育一体机的场景。华为盘古已在矿山场景商用,商汤商量也落地了金融、医疗、工业制造等行业。此前,腾讯也发布了MaaS一站式服务平台,将大模型能力与行业结合。
上海财经大学校长刘元春指出,借助于全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和创新链,最终走出一条发展通用人工智能的中国路径。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也表示,大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值;腾讯研发大模型的目标是将技术应用到实际场景中。
不过,参与市场竞争的玩家们都在这么做。那么,什么样的通用大模型在产业场景更有优势?
复旦大学教授肖仰华表示,国内大模型应先解决各自为政,能力缺乏统一的规划和协调等问题,包括同质化严重,数据生态不完善,国产算力和持续创新不足等方面。360集团创始人周鸿祎则预测,各大互联网公司在C端都有各自的固定场景,比如腾讯在社交,百度在搜索等,未来还会有更多增量场景诞生。