法国初创公司米斯特拉尔发布多模态 AI 模型

法国 人工智能 初创公司 米斯特拉尔 发布了 其首个多模态模型,即 Pixtral 12B,能够处理图像和文本。

这个拥有 120 亿参数的模型是在米斯特拉尔现有的基于文本的模型 Nemo 12B 的基础上构建的,主要用于给图像添加标题、识别对象以及回答与图像相关的查询等这类任务。

其大小为 24GB,该模型在 Apache 2.0 许可证下可免费获取,这意味着任何人都可以不受限制地使用、修改或将其商业化。开发人员可以从 GitHub 和 Hugging Face 下载它,但功能性的网络演示目前还未推出。

据米斯特拉尔开发者关系负责人表示,Pixtral 12B 很快会被整合进该公司的聊天机器人 Le Chat 以及 API 平台 La Platforme 当中。

像 Pixtral 12B 这类多模态模型或许会成为生成式人工智能的下一个前沿阵地,紧跟OpenAI 的 GPT-4和 Anthropic 的 Claude 这类工具的步伐。然而,用于训练这些模型的数据源存在一些疑问。正如 Tech Crunch 所指出的,和许多人工智能公司类似,Mistral 或许使用了大量公开可用的网络数据来训练 Pixtral 12B——这种做法引发了版权所有者提起诉讼,他们对科技公司常提出的‘合理使用’这一论点表示质疑。

此次发布之前,Mistral 筹集了 6.45 亿美元资金,将其估值推高至 60 亿美元。有微软等投资方支持,Mistral 正将自己定位为欧洲对 OpenAI 的回应。