NVIDIA携手Oracle 加速AI及处理庞大资料

在Oracle CloudWorld大会上,Oracle宣布推出全球首个zettascale(10的21次方)运算规模的OCI Supercluster。该系统由NVIDIA Blackwell平台加速运行,支持超过10万颗NVIDIA最新一代GPU,用于训练和部署下一代AI模型。OCI Supercluster系统将于2024年上半年推出,并可扩展至131,072颗Blackwell GPU,峰值AI运算能力达到2.4zettaflops。该系统还支援NVIDIA ConnectX-7NIC和Quantum-2InfiniBand网路,适用于内部部署、公有云和主权云环境,为企业提供灵活部署选项。

Oracle还宣布推出NVIDIA GB200NVL72液冷裸机执行个体,支援生成式AI应用的训练和推论。该执行个体利用Quantum-2InfiniBand,能够在72颗GPU的NVLink网域内运行,实现上兆个参数模型的即时推论。OCI也将于今年提供NVIDIA HGX H200GPU平台,透过NVLink和NVLink Switch连接8 颗H200Tensor核心GPU,并在RoCEv2网路上扩展至65,536颗GPU,支持大规模即时推论和训练工作负载。

此外,Oracle宣布推出针对中阶AI工作负载及NVIDIA Omniverse视觉化应用的L40S GPU加速执行个体,进一步扩展企业在边缘及云端环境中的AI运算能力。Oracle的Roving Edge Device v2边缘产品,现可支援最多三个NVIDIA L4Tensor核心GPU,帮助企业在远端环境中运行AI应用。

多家企业已利用NVIDIA加速的OCI Supercluster推动AI创新。AI新创公司Reka就在此丛集上开发了多模态AI模型,用于开发能听、说、读、看的企业代理。Reka共同创办人Dani Yogatama表示,该公司的多模态AI模型依赖于NVIDIA GPU加速基础设施,能够轻松处理大规模模型并高效扩展训练工作负载。

NVIDIA与Oracle也展示了三项基于GPU的功能,展示如何加速生成式AI应用的开发,包括向量嵌入加速、向量图索引加速以及推论微服务的应用,进一步提升企业资料处理效能。

透过这些创新,NVIDIA 与 Oracle 正协助全球企业和政府实现 AI 应用的突破,满足资料主权需求并加强经济韧性。