英特尔拟推中国版AI晶片

综合媒体报导,英特尔于近日推出新一代AI加速晶片Gaudi 3,据The register报导,英特尔在Gaudi 3白皮书上表示,正准备面向中国市场推出特供版Gaudi 3,包括名为HL-328的OAM兼容夹层卡(Mezzanine Card)和名为HL-388的PCle加速卡两种硬体形态。其中,HL-328将于6月24日推出,HL-388将于9月24日推出。

具体看规格,中国特供版与原版具有相同的96MB SRAM片上记忆体,128GB HBM2e高频宽记忆体,频宽为每秒3.7TB,拥有PCIe 5.0X16接口和解码标准。但由于美国对AI晶片的出口限制,这类高性能AI的综合运算性能(TPP)需要低于4,800才能出口至中国,意味中国特供版的16bit性能不能超过150 TFLOPS(每秒浮点运算次数)。

作为对比,原版Gaudi 3在FP16/BF16上可达到1,835 TFLOPS,相比辉达H100在大模型训练快40%、推理能效高50%。

因此中国特供版需要大幅削减核心数量(原版拥有8个矩阵数学引擎和64个张量内核)和工作频率,最终可能需要将其AI性能降低约92%才能符合美国的出口管制要求。

分析指出,英特尔推出中国特供版的AI性能,将会与辉达针对中国市场推出的AI加速卡H20相当。

英特尔中国特供版具有148 TFLOPS的FP16/BF16性能,略低于150 TFLOPS的限制。但在高频宽记忆体(HBM)容量及频宽上,中国特供版Gaudi 3将低于辉达H20,这也使其在与辉达H20的竞争当中或将处于劣势,不过也需看定价是否具优势。