NVIDIA AI Foundry服务 加速企业生成式AI应用开发

NVIDIA AI Foundry 为全球企业打造客制化 Llama 3.1 生成式 AI 模型。图/辉达提供

NVIDIA今日宣布推出多项新服务和产品,旨在帮助企业更快速、更精准地开发和部署客制化生成式AI应用。其中,企业和国家可以透过 NVIDIA AI Foundry 使用自己的资料并搭配 Llama 3.1 405B 和 NVIDIA Nemotron 模型来建立「超级模型」。

NVIDIA AI Foundry 提供全面的生成式 AI 模型服务,涵盖集合管理、合成资料产生、微调、检索、防护和评估,并且协助企业使用最新的Llama 3.1开源模型系列,为特定领域创建客制化的「超级模型」。AI Foundry由NVIDIA DGX Cloud AI平台驱动,根据需求灵活扩展运算资源。

创始人兼CEO黄仁勋表示「Llama 3.1模型的开放发布代表着企业采用生成式AI的关键时刻。NVIDIA AI Foundry已全面整合Llama 3.1,准备协助企业建置和部署客制化的Llama超级模型。」

Llama 3.1模型的NIM(NVIDIA Inference Microservices)推论微服务,相比不使用NIM,可将推论吞吐量提高2.5倍。企业可通过ai.nvidia.com网站下载使用。

此外,NVIDIA还推出了NeMo Retriever NIM微服务,可与Llama 3.1 NIM配合使用,为AI应用提供高精度的检索增强生成(RAG)能力。NeMo Retriever包含最新的嵌入和重新排序模型,可显著提升AI回答的准确性。

NVIDIA表示,这些新服务和产品正被多家领先企业采用。例如,埃森哲率先使用AI Foundry为客户建构客制化Llama模型;沙特阿美、AT&T、Uber等公司已开始使用Llama NIM微服务;DataStax、Cohesity、NetApp等公司则整合了NeMo Retriever微服务以提升其AI模型精确度。

Meta CEO马克·祖克伯指出,新的Llama 3.1系列模型是开源AI的重要一步。企业可通过NVIDIA AI Foundry轻松创建和客制化先进的AI服务,并通过NVIDIA NIM部署。

NVIDIA强调,这些新产品和服务旨在简化企业AI开发流程,加快产品上市时间,同时提高AI应用的准确性和效能。随着生成式AI在各行业的快速应用,NVIDIA正致力于为企业提供从开发到部署的全方位支持。