AI之王就是狂!辉达新晶片惊动全球 哪几家台厂吞肥单?

辉达发布「地表最强」新款GPU产品L40S,可望带动台湾相关供应链。(示意图/达志影像/shutterstock)

辉达L40S迷人之处在哪?(图/先探投资周刊提供)

为了解决CoWoS产能不足使AI晶片缺货的景况,辉达于上个月宣布推出新款GPU产品L40S,可望带动台湾相关供应链。

今年以来,随着全球大语言模型训练和推理生成式AI(Generative AI)应用百花齐放,带动高阶AI伺服器和高效能运算(HPC)资料中心市场需求水涨船高,也因而使主要大厂辉达(Nvidia)推出的AI晶片A100及H100成为科技厂疯抢的主要产品。然由于A100和H100晶片均需采用台积电CoWoS先进封装,受限于产能不足,因此造成辉达AI晶片全面缺货。

L40S成辉达营运新利器

为了解决缺货窘境,辉达也在八月上旬宣布推出新款GPU产品L40S,其是前身L40的升级版,因此仍拥有L40的强项:渲染与3D设计绘图、串流影片处理、工业数位化等功能;此外,亮点在于,L40S从原先单纯影像处理型AI晶片,切入生成式AI领域;也就是说,L40S不但是一款专业影像处理GPU,同时也支援新一代数据中心工作负载,可执行生成式AI和大型语言模型LLM推理与训练。

然而,L40S并没有搭载HBM,也不支援NVLink,而是采用PCIe Gen 4传输介面,如果是多卡串联的情况,彼此无法分享记忆体,且传输速率只有三二GB/s,远低于A100、H100传输速率的九○○GB/s。因此,在大规模AI演算法训练,L40S的效能可能还是落后HGX A100、H100准系统,但应用在AI推论或小规模的AI演算法训练,都有优于A100成绩;与A100相比,L40S在AI训练效能提升七○%,在生成式AI效能提升二○%。

再者,L40S因采用PCIe Gen 4传输介面,与通用伺服器的相容性较高,故可在不更改设计的情况下直接加装;且其成本相对便宜,从零售价格来看,L40S单卡售价约一○○○○~一一○○○美元,较A100单卡售价约一二○○○~一五○○○美元来得更低。更重要的是,因无须采用CoWoS封装,故不会受到产能瓶颈的限制,上述优势都让市场乐观看待此产品或能有效填补低阶市场的空缺。

华硕推新AI伺服器抢市

而台厂中,L40S相关推理卡由鸿海独家代工OAM板。鸿海一直是辉达的长期合作伙伴,不论是AI晶片模组、基板、主机板、伺服器到机柜,鸿海可以说是一条龙服务,打造辉达AI伺服器供应链的完整解决方案。另外,除了其他伺服器厂商也可以自行采购L40S推理卡,并根据客户需求来设计伺服器外,辉达亦有推出自有品牌OVX伺服器,采用4U设计、搭载八张L40S推理卡,而首波通过认证的台湾供应商包括广达旗下的云达、技嘉及华硕。

其中,日前华硕宣布搭载最新Nvidia L40S GPU的ESC8000和ESC4000伺服器开始开放下单,不仅大幅加快AI伺服器供应速度,亦提供绝佳性价比。华硕此次以首度入列辉达伺服器新品首发伙伴引起市场关注,事实上,公司耕耘伺服器业务多年,近年业绩稳定增长,分为品牌及白牌两大事业体,其中自有品牌为台湾第三大,仅次于Dell及HPE;白牌则锁定中型资料中心,如VH、德国Hetzner等网路托管商皆为其客户。

随着近年力拱AI应用,华硕AI伺服器在市场上也顺利取得初步成果,而为冲刺AI伺服器业务,也积极招兵买马,先前也喊出力拚伺服器业绩五年成长十倍的目标,年复合成长率上看四○%。台系法人指出,华硕去年伺服器业务规模仅约百亿,占比约二%,但因其与辉达显卡长期合作,并在板卡市场上居龙头地位,GPU取得容易,目前已开始出货H100、L40S等AI伺服器,将带动整体伺服器业务在今、明两年均可望有四成的年增幅度,营收贡献明年将可望冲二○○亿大关。(全文未完)

全文及图表请见《先探投资周刊2264期精彩当期内文转载》

《先探投资周刊2264期》