☰

小米進擊AI大模型

小米集团正加速对AI大模型大力投入。（网路照片）

小米集团正加速对AI大模型大力投入，近期着手搭建自己的GPU「万卡集群」，且表明小米AI硬体布局方面最核心的是手机而不是眼镜，而小米大模型团队在成立时已有6,500张GPU资源。

万卡集群是指由一万张及以上的加速卡（如GPU、TPU或其他专用AI加速晶片）组成的高性能计算系统，主要用于加速人工智慧模型的训练和推理过程。

界面新闻报导，一名知情人士表示，该计划已经施行数月之久，小米集团董事长雷军在其中扮演重要的领导角色。「在AI硬体这件事情上，最核心的是手机而不是眼镜，小米在这个领域不『all in』是不可能的。」

小米对AI大模型的重视度提升，先前已有信号。第一财经此前报导，DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉，将加入小米，或任职于小米AI实验室，领导小米大模型团队。

先前DeepSeek-V2在模型架构上的重要创新在于对MLA的采用，这项技术在降低大模型使用成本上发挥了关键作用，而罗福莉是这项工作的核心人物之一。

小米于2023年4月组建AI实验室大模型团队，任命栾剑担任大模型团队负责人，向小米技术委员会副主席、AI实验室主任王斌汇报。

同一时间，雷军发文谈论对大模型和生成式人工智慧（AIGC）的看法时表示，小米在AI领域已耕耘多年，有AI实验室、小爱同学、自动驾驶等团队。「对于大模型，我们当然会全力以赴，坚决拥抱。我们正在研发一些有趣的技术和产品，等我们打磨好了，再给大家展示。」

随后，在小米2023周年演讲上，雷军再度谈及公司大模型业务进展。他称团队成立之后，小米大模型技术的主力突破方向为轻量化、本地部署。作为最新成果，小米已初步跑通手机端侧大模型（13亿参数级别），在部分场景效果接近云端60亿参数级别的大模型，将同步推送升级大模型版本的小爱同学。

此外，小米于2024年5月宣布，小米大语言模型MiLM通过大模型备案。小米表示，小米大模型将逐步应用于小米汽车、手机、智慧家居等产品中，透过端云结合，实现场景内和场景间多设备的协同，为「人车家全生态」战略赋能。

相关资讯