☰

英伟达开源新模型，叫板 GPT-4 震撼发布！

Nvidia（英伟达），它在人工智能行业中制造了一些备受追捧的 GPU ，已宣布其发布了一个开源大型语言模型，据报道，该模型的性能和 OpenAI 、Anthropic 、Meta 和 Google 等领先的专有模型相当。

该公司在最近发布的白皮书中推出了其新的 NVLM 1.0 系列，并且它由参数为 720 亿的 NVLM-D-72B 模型引领。“我们推出 NVLM 1.0，这是一系列前沿的多模态大型语言模型，在视觉语言任务方面取得了最先进的成果，能够与领先的专有模型（比如 GPT-4o）和开放访问模型相媲美，”研究人员写道。

据报道，新的模型系列据称已能够达成“生产级多模态”，在各类视觉和语言任务中的表现都很出色，并且与 NVLM 系列所基于的基础 LLM 相较而言，其基于文本的响应也有所改进。“为了实现这一目标，我们在多模态训练中精心打造并整合了一个高质量的纯文本数据集，同时还存在大量的多模态数学和推理数据，进而提升了跨模态的数学和编码能力，”研究人员解释说。

其结果是得到了一个大型语言模型，它不仅能轻松解释一个梗有趣的原因，还能逐步解决复杂的数学方程。凭借其多模态训练方式，英伟达还成功地将该模型在常见行业基准中的纯文本准确率平均提高了 4.3 个百分点。

Nvidia 似乎下定决心要确保该模型符合开源倡议的最新“开源”定义，不仅将其训练权重公开以供公众审查，还承诺在不久的将来发布该模型的源代码。这与 OpenAI 和谷歌等竞争对手的做法大不相同，他们对其大型语言模型的权重和源代码细节小心翼翼地加以保护。通过此举，Nvidia 已把 NVLM 系列定位成不一定直接跟 ChatGPT-4o 和 Gemini 1.5 Pro 竞争，而是作为第三方开发者构建自己的聊天机器人和人工智能应用程序的基础。

英伟达开源新模型，叫板 GPT-4 震撼发布！

相关资讯