AI「百模大战」带新风向 陆企先后出招视觉大模型

AI热潮下各国企业加速建置AI大模型,但近期新风向吹往「视觉大模型」,也有多家陆企先后出招。(shutterstock)

随着AI大模型研发应用热潮持续高涨,据《华夏时报》报导,竞逐赛道内的企业也开始将重心从语言大模型转向视觉大模型。近期如Adobe、Meta、360、美图等多家大型网路企业纷纷发表成果。例如日前美图就发布AI视觉大模型MiracleVision与AI视觉创作工具WHEE等7款产品,为本就火热的AI市场再添一把新火苗。

同时值得注意的是,近日在华为开发者联创日的深圳首站上,华为AI技术规划专家王琛表示,当前正处于第二代AI朝向第三代AI交替的阶段,现在的AI是「知识+数据驱动」,意味将使AI的系统具有常识经验推理等人类思考的能力。而从华为开发者联创日上了解到,在接下来的7月,华为云盘古大模型将有重大升级。

据《中国人工智慧大模型地图研究报告》显示,从全球已发布的大模型数量及分布来看,大陆和美国大幅领先,超过全球总数的80%。同时欧洲、俄罗斯、以色列等越来越多研发团队也投入研发。但大陆在电脑视觉等领域的大模型还较少。

目前除了美图跨入视觉大模型之外,另一家陆企360日前也正式发布「360智脑-视觉大模型」。360创始人周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助大语言模型的认知、推理、决策能力。同时视觉大模型也是「360智脑」的重要能力组成,能够看懂图片,未来还能看懂影片、听懂声音。

竞逐该赛道更不光只有大陆内部,跨国企业也同样进行布局。日前,社交媒体巨头Meta宣布,将向研究人员开放一个名为I-JEPA的「类人」AI模型的部分元件,可比现有模型更准确地分析与完成未完成的图像,而非像其他生成式AI模型只根据附近的图元进行推断。