小米進擊AI大模型
小米集团正加速对AI大模型大力投入。 (网路照片)
小米集团正加速对AI大模型大力投入,近期着手搭建自己的GPU「万卡集群」,且表明小米AI硬体布局方面最核心的是手机而不是眼镜,而小米大模型团队在成立时已有6,500张GPU资源。
万卡集群是指由一万张及以上的加速卡(如GPU、TPU或其他专用AI加速晶片)组成的高性能计算系统,主要用于加速人工智慧模型的训练和推理过程。
界面新闻报导,一名知情人士表示,该计划已经施行数月之久,小米集团董事长雷军在其中扮演重要的领导角色。「在AI硬体这件事情上,最核心的是手机而不是眼镜,小米在这个领域不『all in』是不可能的。」
小米对AI大模型的重视度提升,先前已有信号。第一财经此前报导,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,将加入小米,或任职于小米AI实验室,领导小米大模型团队。
先前DeepSeek-V2在模型架构上的重要创新在于对MLA的采用,这项技术在降低大模型使用成本上发挥了关键作用,而罗福莉是这项工作的核心人物之一。
小米于2023年4月组建AI实验室大模型团队,任命栾剑担任大模型团队负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。
同一时间,雷军发文谈论对大模型和生成式人工智慧(AIGC)的看法时表示,小米在AI领域已耕耘多年,有AI实验室、小爱同学、自动驾驶等团队。「对于大模型,我们当然会全力以赴,坚决拥抱。我们正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。」
随后,在小米2023周年演讲上,雷军再度谈及公司大模型业务进展。他称团队成立之后,小米大模型技术的主力突破方向为轻量化、本地部署。作为最新成果,小米已初步跑通手机端侧大模型(13亿参数级别),在部分场景效果接近云端60亿参数级别的大模型,将同步推送升级大模型版本的小爱同学。
此外,小米于2024年5月宣布,小米大语言模型MiLM通过大模型备案。小米表示,小米大模型将逐步应用于小米汽车、手机、智慧家居等产品中,透过端云结合,实现场景内和场景间多设备的协同,为「人车家全生态」战略赋能。