☰

法国初创公司米斯特拉尔发布多模态 AI 模型

法国人工智能初创公司米斯特拉尔发布了其首个多模态模型，即 Pixtral 12B，能够处理图像和文本。

这个拥有 120 亿参数的模型是在米斯特拉尔现有的基于文本的模型 Nemo 12B 的基础上构建的，主要用于给图像添加标题、识别对象以及回答与图像相关的查询等这类任务。

其大小为 24GB，该模型在 Apache 2.0 许可证下可免费获取，这意味着任何人都可以不受限制地使用、修改或将其商业化。开发人员可以从 GitHub 和 Hugging Face 下载它，但功能性的网络演示目前还未推出。

据米斯特拉尔开发者关系负责人表示，Pixtral 12B 很快会被整合进该公司的聊天机器人 Le Chat 以及 API 平台 La Platforme 当中。

像 Pixtral 12B 这类多模态模型或许会成为生成式人工智能的下一个前沿阵地，紧跟OpenAI 的 GPT-4和 Anthropic 的 Claude 这类工具的步伐。然而，用于训练这些模型的数据源存在一些疑问。正如 Tech Crunch 所指出的，和许多人工智能公司类似，Mistral 或许使用了大量公开可用的网络数据来训练 Pixtral 12B——这种做法引发了版权所有者提起诉讼，他们对科技公司常提出的‘合理使用’这一论点表示质疑。

此次发布之前，Mistral 筹集了 6.45 亿美元资金，将其估值推高至 60 亿美元。有微软等投资方支持，Mistral 正将自己定位为欧洲对 OpenAI 的回应。

法国初创公司米斯特拉尔发布多模态 AI 模型

相关资讯