OpenAI新模型给力 辉达GPU进补
GB200因零组件供货不顺出货递延,长线仍看好概念股业绩逐步加温。图/本报资料照片
法人比较B200、B300 GPU差异
OpenAI 20日公布新一代AI推理模型o3和o3-mini预计2025年1月推出,法人表示,辉达受惠最大,但近期GB200受美国连接器大厂关键零组件电缆盒(cable cartridge)产能不足卡关,出货速度递延,长线仍看好台积电、广达、鸿海及纬创等概念股业绩逐步加温。
OpenAI提出推理新模型o3、o3-mini,大幅拉近与人距离,破除外界对Scaling Law(AI摩尔定律)尽头疑虑,可望持续加大对GPU需求。OpenAI资料指出,o3为目前测试时计算成本最高之模型,可透过增加计算资源提升性能,对大模型业者而言,持续买入GPU、ASIC晶片才能在AGI(通用人工智慧)领域领先。
法人表示,辉达订单从不是问题,但GB系列的技术难度拉高,从水冷散热、Low DK玻纤布及连接器等频现供货不顺情况,拉货速度不如预期。
本报稍早率先揭露GB200供应瓶颈,尽管现已解决,惟生产时程受挤压,供应链业者说,今年GB200出货柜数仅约百柜规模,明年供货仍有限,主因美系连接器厂商产能不足;据悉,辉达已暂缓晶圆代工厂B200 GPU的新增投片、转规画增加B300投片量,法人推测部分CSP业者转移订单至下世代产品,GB200生命周期恐被GB300夹击。
科技业者指出,GB200递延主要受到零组件无法跟上辉达晶片迭代速度,设计难度高是其中原因;未来GB300首度导入插槽(Socket)设计,方便客户汰旧换新。另GB300 NVL72主板上不再强制搭配Grace CPU,可更换成英特尔、AMD之Server CPU,避免垄断议题。
法人推估,GB300为GB200改良版,HBM3e从8Hi增加至12Hi、容量增加至288GB,更受CSP(云端服务供应商)客户青睐,主要客户微软将GB200 NVL72目标调整为上半年1,500~2,000台之规模,较先前预期进一步下调。供应链透露,辉达已停止B200新增投片、转增加B300投片量,为明年中亮相的B300预做准备。