恒小花:AI人工智能向多模态趋势进发

各类大模型层出不穷,但不断优化升级,推动行业进步仍是各大互联网公司的主攻方向。近期,大模型由单模态向多模态升级已成为行业热点,多家公司多模态AI走红。

OpenAI发布了GPT-4 Turbo并且开放了GPTs,再次颠覆行业,揭开AIGC应用生态序幕。《达摩院2023十大科技趋势》显示,建立统一的、跨场景、多任务的多模态基础模型会成为人工智能发展的主流趋势之一。

多模态是实现通用人工智能的必经之路。模态数据输入可帮助模型能力和用户体验提高,允许多模态数据输出也更符合真实世界需要。在数据、算法及算力上的要求都要高于单模态,这一波自然语言大模型发展为其他模态提供了技术参考,行业有望加速发展。

虽然大模型在今年引发互联网行业变革,但整个行业仍处于早期发展阶段,积累与沉淀尚有不足。对企业来说,如何在行业站稳脚跟,切实解决用户需求,以及商业化变现仍值得继续探索。

企业不能盲目跟风,需要解决自身已有的基础产品和用户群体在AI领域的诉求。而目前的大模型区别不大,用户难以区分与抉择找到适合自身的产品。在未来,企业只有通过优化大模型产品去提高用户工作效率,减少生产成本,切实地为客户解决问题,才能脱颖而出,这也是大模型真正的发展方向。

未来大模型的发展将有三大趋势,一是通用大模型性能提升和优化进一步深入,大模型将进入万亿参数,采用万卡以上集群进行训练,性能进一步提升,同时围绕不同应用场景进行模型调优;二是大模型的思考和探索能力将进一步提升,应用将从简单智能应用向复杂智能应用迈进;三是大模型的超级应用将出现,将整合内容生成、语义理解、推理、记忆、自主意识等能力,提供体验感极强的智能服务,智能数字人或机器人等将成为经济社会各领域的标配。

从通用大模型到垂直大模型,从单模态向多模态融合,AI生成技术不断迭代,加速应用落地和商业模式创新,已是大势所趋,未来已来。