阶跃星辰CEO 姜大昕:多模态大模型是通向 AGI 的必经之路

7月5日消息,2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)上,阶跃星辰首发了三款 Step 系列通用大模型新品:Step-2万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。

据悉,自今年三月正式公布以来,Step 系列通用大模型在短短100天左右实现了从千亿参数到万亿参数,从语言模型到多模态模型,从理解到生成的全面进步。

具体来说,最新发布的 Step-2万亿参数语言大模型正式版,采用了MoE 混合专家模型架构。同时,基于阶跃星辰的系统能力,Step-2大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近 GPT-4,企业和开发者可以通过阶跃星辰开放平台申请体验。

与此同时,新升级的 Step-1.5V 千亿参数多模态大模型,在图像感知和理解能力上全面提升,并具备出色的视频理解能力。它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。在 Step-2万亿参数大模型的加持下,Step-1.5V 推理能力大幅增强,能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务。

新发布的 Step-1X 图像生成大模型,则代表了阶跃星辰在推动多模态理解和生成统一的技术路线上取得重要进展。它采用全链路自研的 DiT(Diffusion Models with transformer)模型架构,支持600M、2B、8B 三种不同的参数量,能够满足不同场景的需求。Step-1X 具备更加强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,更具中国风格。

阶跃星辰创始人、CEO 姜大昕博士表示:“攀登 AGI 山峰,‘万亿参数’和‘多模融合’缺一不可。万亿参数规模,是实现 AGI 的基础门槛;多模态大模型,是通向 AGI 的必经之路。面向未来,我们会继续将模型做大做强,打造超级模型,同时让模型服务于工作和生活,十倍每个人的可能。”

现场,阶跃星辰还在 WAIC 展示了面向 C 端用户的自研产品,以及与行业头部公司在促进大模型生态应用方面的最新成果与计划。(定西)

本文来自本站科技报道,更多资讯和深度内容,关注我们。