阶跃星辰发布“万亿”和“多模态”大模型 与上海电影“大闹天宫”|2024WAIC

《科创板日报》7月6日讯(记者 黄心怡)在2024 世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)上,阶跃星辰发布了三款Step系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。

自今年三月公布以来,Step系列通用大模型实现了从千亿参数到万亿参数,从语言模型到多模态模型,从理解到生成的全面进步。

同时,阶跃星辰还重点展示了面向C端用户的自研大模型应用产品,并披露了在大模型生态合作领域的最新进展与计划。

阶跃星辰副总裁李璟在大会期间做客财联社直播间接受了《科创板日报》记者的专访。

他介绍,最新发布的Step-2万亿参数语言大模型正式版,采用了创新的MoE混合专家模型架构。新升级的Step-1.5V千亿参数多模态大模型具备出色的视频理解能力。它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪,甚至进行描述和互动问答。

此外,阶跃星辰还新发布了Step-1X图像生成大模型,并与上海电影开展合作,针对中国动画IP进行了视频生成能力的技术展示。

阶跃星辰也积极在C端发力大模型应用,智能助手——“跃问”和AI开放世界平台——“冒泡鸭”,是阶跃星辰面向C端用户推出的两款自研产品。李璟介绍,“跃问”定位为效率工具的角色,充分发挥了阶跃星辰大模型多模态的特点,准确地描述和理解图像中的文字、数据、图表等信息,完成内容创作、逻辑推理、数据分析等任务。“比如在景点拍的照片,可以向跃问提问获取这个景点的信息。”

“冒泡鸭”则打造了一个AI开放世界。在这里,用户可以探索故事、创作角色,沉浸属于自己的开放世界。“我们希望通过AI的无限扩展和个性化生成能力,帮助创作者创造出与用户互动的内容消费场景。目前,冒泡鸭正在以沉浸感与用户互动体验为核心在做迭代和优化。”

人工智能大模型经历了一年半“技术狂飙”。如今,大模型价格战又带来了商用竞争的提速。字节、阿里、百度、腾讯等国内多家大模型厂商近两个月来竞相降价。

对此,李璟称早对市场的激烈竞争有所预判,后续阶跃星辰将坚持在C端开展探索,同时也关注B端的高价值垂类领域。

7月5日,财跃星辰、阶跃星辰和国泰君安证券举行战略合作签约仪式。三方将从数据、算力、模型、应用等多方面努力,提升证券行业智能应用能力,打造最懂金融的大模型。其中,财跃星辰是由界面财联社与通用大模型公司阶跃星辰联合创办,专注于大模型在金融领域的科技研发和场景应用探索。

“这次的合作落地,是基于阶跃星辰的通用大模型底座,结合界面财联社积累的万亿级金融语料,在此基础之上又与国泰君安深度共创,面向智能投顾场景推动千亿参数大模型的更多实际落地。”李璟说,“大模型在金融领域的应用非常广泛的,这是由于金融是整个数字化和信息化最成熟、渗透率最高的行业,也是大模型需求最旺盛的行业,我们已经看到了大模型在综合分析、信息检索、信息呈现、文档撰写等一系列领域有非常多的应用。

此外,阶跃星辰联合上海电影在“AI+IP”领域进行创新探索。双方推出了一款《大闹天宫》AI互动体验——“测测你是哪路神仙”,调用了Step系列大模型,融合了图像理解、风格迁移、图像生成、剧情创作等多种能力。阶跃星辰还与上海电影结合《葫芦兄弟》的IP进行了视频生成能力的展示。

“今年是大闹天宫的60周年,作为陪伴了几代人成长的童年经典IP,如何与年轻人有更好地互动?所以我们把AI文生图、AI剧情生成、AI性格测试等进行融合,每个用户只要上传自己的照片就可以进入天宫的场景里。通过趣味性的AI互动,更大程度地激活经典IP,用科技致敬经典、讲好中国故事,是我们的愿景。”李璟强调。