NVIDIA和Google Cloud携手 加速生成式AI 创新
此次合作为帮助全球数以千计的新创企业更快地建立生成式人工智慧应用程序和服务。「我们的目标是消除新创企业开发生成式AI应用的成本障碍,让他们能够更快地为客户创造价值」NVIDIA创始人兼执行长黄仁勋表示。「通过与Google Cloud的合作,我们可以为新创企业提供强大的技术支援和资源,加快行业创新的步伐。」
此外,Google for Startups Cloud计划的成员也可加入NVIDIA Inception计划,获得技术培训、NVIDIA硬体和软体等福利。这些新创公司还可以参与NVIDIA Inception Capital Connect,让他们与感兴趣的投资者接洽。
为了进一步优化生成式AI模型在NVIDIA平台上的运行,NVIDIA与Google合作对DeepMind的Gemma模型进行了特定优化。NVIDIA TensorRT-LLM库可以显著提升Gemma在NVIDIA GPU上的效能。同时,NVIDIA的NIM微服务也能与Google Kubernetes Engine无缝整合,简化AI模型的部署。
为配合这些努力,Google Cloud还宣布将在下个月全面推出基于NVIDIA H100 GPU的A3 Mega虚拟机器。这些新实例将使A3系列的GPU间带宽提升一倍。此外,Google Cloud还将引入支援机密计算的新虚拟机器,帮助客户保护敏感数据。
未来,NVIDIA和Google Cloud还将于2025年在Google Cloud上推出搭载NVIDIA GB200 NVL72 GPU的DGX Cloud服务。该GPU基于NVIDIA最新的Blackwell架构,在生成式AI模型的训练和推理性能方面都有大幅提升。