继续狙击英伟达, AMD子弹已上膛丨焦点分析

作者丨邱晓芬

编辑丨苏建勋

10月10日,一年一度的Advancing AI大会上,美国芯片巨头AMD发布了一系列重磅的芯片产品更新,覆盖AI PC的处理器、EPYC处理器、DPU等等。

在英伟达最新的Blackwell芯片面临交付困境的当下,AMD最新的GPU产品系列(AMD Instinct MI325X)将如何出牌,直接关系到AMD的未来,自然成为各界的关注焦点。

在参数上猛追英伟达,是AMD MI系列一以贯之的打法,此次的AMD Instinct MI325X芯片也不例外,选择紧密对标英伟达上一代芯片产品H200。

不过,好消息是,从产品信息来看,AMD如今逐渐找到了差异化竞争的策略——AMD这款产品逐渐把精力都放在了提升内存、推理能力上。

AMD创始人苏姿丰发布AMD Instinct MI325X系列芯片

首先,AMD Instinct MI325X上配备了256GB的HBM3E高带宽内存,提供了6TB/s的内存带宽——参数上比英伟达H200大许多(H200分别是141G、4.8TB/s)。

其次,尽管AMD这款产品在FP16(16位浮点数)上的算力没有英伟达那么强,但推理能力却比英伟达H200整体高出20%-40%。

重仓推理,不失为一项明智之举。一位行业人士向36氪表示,今年算力中心的一大趋势是,随着部分大模型厂商逐渐放下预训练,推理和模型微调的诉求增加。

“某算力中心客户,去年预训练和推理的比例是7:3,今年完全反过来了”。下游大模型、应用厂商的需求变化,上游芯片厂商更需要及时做好策略转向。

不过,只有单芯片的差异化竞争是远远不够的。AMD此次也从体系化入手,弥补在连接、软件生态上的短板。而这也正是英伟达的壁垒最高处。

英伟达产品的一大优势是,依靠NV-Link,使得多个单芯片连接起来之后依旧强大,不因芯片互联传递而折损算力。而此次,AMD则依靠他们的Infinity Fabric互连技术,使得多卡的效果比单兵作战更强。

据介绍,当8张AMD Instinct MI325X搭配在一起时,相比于同样数量级的英伟达(即H200 HGX),内存是其1.8倍、内存带宽是其1.3倍、算力更是其1.3倍。

在软件生态方面,AMD也持续补短板。AMD的软件平台ROCm通过持续调教、以及与多个AI开发平台深度合作,不仅不会拖后腿,反而提升了整体效率。

经过AMD方面的实测,当跑Meta Llama-2模型时,AMD MI325X单卡在ROCm的加持下,训练效率超过了英伟达H200。而若用AMD的8卡集群跑,训练效率仍也与H200 HGX相当。

在此前的台北电脑展上,AMD创始人苏姿丰已经明确,GPU产品节奏向英伟达看齐,要“一年一更新”。AMD除了发布Instinct MI325X系列之外,也顺便透露了未来产品的情况——

据其介绍,AMD下一代芯片Instinct MI350系列将在明年下半年推出,同样延续了这一代的产品逻辑,推理性能将有35倍提升、提供288GB的HBM3E内存,峰值算力提升1.8倍,与英伟达B200的算力持平。

在逐渐明确了产品打法、发布节奏后,AMD 2024年在数据中心领域大有高歌猛进趋势。

苏姿丰此前透露,AMD已经拿下了上百家AI客户和OEM厂商的订单。其在数据中心服务器的份额,也从早前可怜的个位数,上升到如今的30%左右。

财报数据正是最好的说明。7月份,AMD方面公布的信息显示,今年第二季度的数据中心业务收入达到了28亿美元,虽然相比于英伟达,数据还有很大差距(226亿美元),但同比大增115%,也是AMD所有业务中增速最快的一项。

AMD在数据中心领域的突围,其实是多项因素的综合作用——除了AMD上一代产品(MI300系列)找对了打法,成为AMD有史以来的爆款产品之外,还要叠加智算中心市场整体的大爆发,以及一丝对手失误的因素。

在去年一整年,英伟达的GPU产品受困于产能,交货周期达到惊人的8-11个月。供应问题,直到2024年第一季度才有所缓解,但客户依旧需要等待漫长的3个月。

而好景不长,当英伟达的H系列今年终于顺利进入出货高峰后,其最新的Blackwell系列芯片产品又陷入新一轮交付难题。

综合多方信息显示,英伟达原定于今年三季度排产的全新Blackwell系列芯片,因为芯片设计缺陷,导致稳定性不足,又遇到供应链封装良率不高等原因,整体往后又推迟了一个季度。

当对手持续受困于生产、设计难题,AMD的产品自然成为弥补算力缺口的一项最佳选择。

不过,英伟达也担心错失市场机遇,把蛋糕拱手让人,也在努力摆脱延期的阴霾。

在AMD大会的同期,摩根士丹利为英伟达办了一场为期三天的非交易路演。路演上着重向投资人传递的信息是——Blackwell的难题已经解决, 需求大热,英伟达“已经把未来一年内的芯片全部卖光”。

黄仁勋此前也多次在公开场合暗示这一点,提示“这颗芯片正是每个客户都想拥有最多的产品,大家都想当第一个收到货的人”。

对于AMD来说,这可能算不上是好消息。随着对手产能的阴霾散去,幸运的是,AMD也逐渐找到适合自己的竞争节奏。2025年,两家芯片巨头,在GPU领域又再一次回归正面战场,这才是考验双方真正综合实力的关键一年。

《AMD发布锐龙AI PRO 300 系列移动商用处理器,为AI PC“再添把火” | 最前线》

end