☰

辉达生成式「AI微服务」来了！助企业内部建置AI助理

NVIDIA AI Enterprise 5.0。图／辉达提供

辉达（NVIDIA）19日宣布，推出一系列新的生成式人工智慧（AI）微服务，让企业能够在内部的NVIDIA GPU硬体基础设施上，快速建置并部署自己的AI助理应用程式。

这款名为「NVIDIA NIM」的微服务，预先训练的人工智慧模型，在经过最佳化调整后便可在云端、资料中心、工作站及PC上数亿个支援CUDA的GPU上运行；数分钟之内便可内完成部署，而传统部署时间往往需数周之久。开发者只需调用标准化API，即可使用企业自有的数据与NIM整合，打造高度客制化且安全可控的生成式AI应用程式。

NVIDIA创办人暨执行长黄仁勋表示：「成熟企业坐拥庞大数据资产，这些资料可以帮助构建出AI助理。我们与合作伙伴生态系统共同制作的AI微服务，正是企」

NIM微服务涵盖20多种热门大型语言模型，包括来自NVIDIA、Anthropic、Google、Meta、Stability AI等公司的模型。它们经过NVIDIA的推理优化，可在亿级CUDA GPU上高效执行，为语音、文字、医疗等领域提供AI服务。

除NIM外，NVIDIA也推出一系列CUDA-X微服务，助力企业加速AI模型的资料处理、训练、部署等环节。其中的NeMo Retriever可帮助AI助理更好理解与企业业务相关的文字、图像等非结构化数据。

生态系统多家重量级企业已率先采用NVIDIA新微服务。包含Adobe、Cadence、ServiceNow等应用商将整合微服务增强自家平台的AI能力;云端厂商AWS、Google Cloud、Azure也将支援在其上部署NIM。基础设施厂商如Dell、Lenovo、HPE等也宣布推出相应的服务器产品。

数据公司如Snowflake、NetApp将协助客户优化NeMo Retriever的资料管线。众多安全、MLOps、向量检索厂商也将与NVIDIA微服务生态系统整合。

NVIDIA AI Enterprise 5.0产品中包含NIM、CUDA-X等微服务，可部署在云端或内部NVIDIA认证的GPU伺服器、工作站上。公有云平台将从今年稍晚开始提供支援。

业界人士表示，这是NVIDIA为企业级生成式AI做全方位准备，充分发挥GPU加速效能，同时赋予企业充分的自主权和控制权。通过调用云化微服务，企业无需自行开发AI能力，便可快速部署符合内部需求的定制AI助手，实现智能自动化。

NVIDIA微服务将结合内部资料与领先AI模型，对各行业带来颠覆性的生产力提升；这一创新代表NVIDIA加速运算平台向更广泛的企业级AI应用领域迈进之野心。

辉达生成式「AI微服务 」来了！助企业内部建置AI助理

相关资讯

辉达生成式「AI微服务」来了！助企业内部建置AI助理