☰

NVIDIA AI Foundry服务加速企业生成式AI应用开发

NVIDIA AI Foundry 为全球企业打造客制化 Llama 3.1 生成式 AI 模型。图／辉达提供

NVIDIA今日宣布推出多项新服务和产品，旨在帮助企业更快速、更精准地开发和部署客制化生成式AI应用。其中，企业和国家可以透过 NVIDIA AI Foundry 使用自己的资料并搭配 Llama 3.1 405B 和 NVIDIA Nemotron 模型来建立「超级模型」。

NVIDIA AI Foundry 提供全面的生成式 AI 模型服务，涵盖集合管理、合成资料产生、微调、检索、防护和评估，并且协助企业使用最新的Llama 3.1开源模型系列，为特定领域创建客制化的「超级模型」。AI Foundry由NVIDIA DGX Cloud AI平台驱动，根据需求灵活扩展运算资源。

创始人兼CEO黄仁勋表示「Llama 3.1模型的开放发布代表着企业采用生成式AI的关键时刻。NVIDIA AI Foundry已全面整合Llama 3.1，准备协助企业建置和部署客制化的Llama超级模型。」

Llama 3.1模型的NIM（NVIDIA Inference Microservices）推论微服务，相比不使用NIM，可将推论吞吐量提高2.5倍。企业可通过ai.nvidia.com网站下载使用。

此外，NVIDIA还推出了NeMo Retriever NIM微服务，可与Llama 3.1 NIM配合使用，为AI应用提供高精度的检索增强生成（RAG）能力。NeMo Retriever包含最新的嵌入和重新排序模型，可显著提升AI回答的准确性。

NVIDIA表示，这些新服务和产品正被多家领先企业采用。例如，埃森哲率先使用AI Foundry为客户建构客制化Llama模型；沙特阿美、AT＆T、Uber等公司已开始使用Llama NIM微服务;DataStax、Cohesity、NetApp等公司则整合了NeMo Retriever微服务以提升其AI模型精确度。

Meta CEO马克·祖克伯指出，新的Llama 3.1系列模型是开源AI的重要一步。企业可通过NVIDIA AI Foundry轻松创建和客制化先进的AI服务，并通过NVIDIA NIM部署。

NVIDIA强调，这些新产品和服务旨在简化企业AI开发流程，加快产品上市时间，同时提高AI应用的准确性和效能。随着生成式AI在各行业的快速应用，NVIDIA正致力于为企业提供从开发到部署的全方位支持。

NVIDIA AI Foundry服务 加速企业生成式AI应用开发

相关资讯

NVIDIA AI Foundry服务加速企业生成式AI应用开发