辉达塞爆台积3、4奈米

AI年度盛事辉达GTC(GPU Technology Conference)大会于美西时间3月17日登场。图/美联社

辉达GPU设计蓝图

AI年度盛事辉达GTC(GPU Technology Conference)大会于美西时间3月17日登场,市场估H200及B100将提前发表抢市。据了解,H200及次世代B100将分别采台积电4奈米及3奈米制程,H200将于第二季上市,B100采Chiplet设计架构传已下单投片。法人指出辉达订单强强滚,台积电3、4奈米产能几近满载,首季营运淡季不淡。

针对辉达新世代晶片订单塞爆台积电先进制程一事,台积电表示,产能制程仍依照上次法说会所述内容,不再做说明。

辉达日前强调,生成式AI及大型语言模型计算非常密集,需要多个GPU组成,然从客户购买到推论模型上线,需要几个季度的时间;换言之,今年看到的推论应用,是来自去年购买的GPU,意味着随着模型参数成长,GPU需求势必延续跟着扩大。

除GPU数量增加外,辉达GPU效率也将在今年大幅提升,Blackwell系列的B100就是被市场视为下一世代辉达GPU利器,除了是首款采台积电3奈米打造外,更是第一款以Chiplet及CoWoS-L形式封装的辉达产品,解决高耗电量与散热问题,单卡效率及电晶体密度,预估又将超车AMD首季推出的MI300系列。

半导体业者指出,台积电2023年即提前因应产能吃紧的现象,尤其针对先进封装CoWoS产能,除移机挪出龙潭厂空间外,竹南AP6也如火如荼启用;据供应链透露,原本今年下半年动工之铜锣厂,已规划提早于第二季进行,目标就是力拚2027年上半年,能够提供月产11万片12吋晶圆的3D Fabric量能。

台积电先进制程也持续满载,台积电2月产能利用率持续超过9成,AI需求不减。供应链表示,AI、HPC等应用一片晶圆能产出之晶片仅为消费性产品的四分之一,生产制造难度更高、更复杂;台积电能达到稳定量产,对晶片业者来说,非常重要。

此外,在H200转向新记忆体HBM,也将面临产能限制。H200到B100积极与云端服务供应商(CSP)进行新平台衔接,辉达强调,数据中心功率密度是关键,多数CSP提前2~3年确保数据中心容量,必须提前规划。

除CSP业者外,较小型的语言模型开发商,因无法负担ASIC开案费用,多数将使用辉达解决方案,积少成多下,也将成订单主力,台积电目前HPC/AI应用平台占营收比重达43%,已与智慧型手机齐平。(相关新闻见A3)