辉达生成式「AI微服务 」来了!助企业内部建置AI助理

NVIDIA AI Enterprise 5.0。图/辉达提供

辉达(NVIDIA)19日宣布,推出一系列新的生成式人工智慧(AI)微服务,让企业能够在内部的NVIDIA GPU硬体基础设施上,快速建置并部署自己的AI助理应用程式。

这款名为「NVIDIA NIM」的微服务,预先训练的人工智慧模型,在经过最佳化调整后便可在云端、资料中心、工作站及PC上数亿个支援CUDA的GPU上运行;数分钟之内便可内完成部署,而传统部署时间往往需数周之久。开发者只需调用标准化API,即可使用企业自有的数据与NIM整合,打造高度客制化且安全可控的生成式AI应用程式。

NVIDIA创办人暨执行长黄仁勋表示:「成熟企业坐拥庞大数据资产,这些资料可以帮助构建出AI助理。我们与合作伙伴生态系统共同制作的AI微服务,正是企」

NIM微服务涵盖20多种热门大型语言模型,包括来自NVIDIA、Anthropic、Google、Meta、Stability AI等公司的模型。它们经过NVIDIA的推理优化,可在亿级CUDA GPU上高效执行,为语音、文字、医疗等领域提供AI服务。

除NIM外,NVIDIA也推出一系列CUDA-X微服务,助力企业加速AI模型的资料处理、训练、部署等环节。其中的NeMo Retriever可帮助AI助理更好理解与企业业务相关的文字、图像等非结构化数据。

生态系统多家重量级企业已率先采用NVIDIA新微服务。包含Adobe、Cadence、ServiceNow等应用商将整合微服务增强自家平台的AI能力;云端厂商AWS、Google Cloud、Azure也将支援在其上部署NIM。基础设施厂商如Dell、Lenovo、HPE等也宣布推出相应的服务器产品。

数据公司如Snowflake、NetApp将协助客户优化NeMo Retriever的资料管线。众多安全、MLOps、向量检索厂商也将与NVIDIA微服务生态系统整合。

NVIDIA AI Enterprise 5.0产品中包含NIM、CUDA-X等微服务,可部署在云端或内部NVIDIA认证的GPU伺服器、工作站上。公有云平台将从今年稍晚开始提供支援。

业界人士表示,这是NVIDIA为企业级生成式AI做全方位准备,充分发挥GPU加速效能,同时赋予企业充分的自主权和控制权。通过调用云化微服务,企业无需自行开发AI能力,便可快速部署符合内部需求的定制AI助手,实现智能自动化。

NVIDIA微服务将结合内部资料与领先AI模型,对各行业带来颠覆性的生产力提升;这一创新代表NVIDIA加速运算平台向更广泛的企业级AI应用领域迈进之野心。