减少依赖英伟达,字节跳动据称联手台积电自研5nm AI芯片,到2026年量产
本文作者:李丹
来源:硬AI
人工智能(AI)领域的竞争如火如荼,提供大语言模型(LLM)算力的英伟达AI芯片又供不应求,字节跳动可能要推出自己的芯片,减少对英伟达产品的依赖。
据科技媒体 The Information报道援引知情者消息称,字节跳动在同英伟达高级芯片的重要代工伙伴台积电合作,计划到2026年联产两款基于5纳米(nm)工艺的自研AI芯片,目前处于设计阶段,未来字节的计划还可能有变。
报道称,5nam工艺仅比台积电最先进的3nm工艺落后一代,和英伟达将要出货的旗舰AI芯片——Blackwell架构芯片采用的是同一代工艺。自家芯片可能减少字节跳动在开发和运营AI模型方面对高价英伟达芯片的依赖。
在国内竞争激烈且美国加强出口限制之际,对字节跳动等推出LLM的中国科技企业来说,降低芯片成本变得至关重要。报道提到,今年字节跳动已订购了20余万块英伟达 H20 芯片,价值超过20亿美元,还在等待全部交货。字节计划让台积电代工数十万快自研的训练和推理芯片,成本将比从英伟达购买低数十亿美元。
至于为何字节跳动可能如此大幅降低成本,报道指出,H20的性能只有英伟达热销先进芯片H100的四分之一。美国目前的出口限制针对单个芯片的性能,但未这样限制芯片集群,国内厂商需要购买更多的H20达到和H100同等算力的单个集群效果。字节跳动希望,在成本大致相同的情况下,自有芯片驱动的集群能实现四倍于单个H100芯片的计算性能。
字节跳动和英伟达都未回应以上报道。此前消息显示,包括字节在内的中国互联网大厂今年都在大手笔订购英伟达的芯片,同时积极开发自研AI芯片。
上月金融时报报道称,百度、字节跳动、腾讯和阿里巴巴已向英伟达共订购价值10亿美元的A800处理器,这些中国企业还购买了价值40亿美元的GPU,均将今年交付。
字节跳动的发言人此后并未详细置评上述报道,而是表示:“消费互联网公司和云供应商每年在数据中心组件上投资数十亿美元,通常提前数月下订单。”
今年6月路透获悉,字节跳动在同博通合作开发5nm的先进AI芯片,它是一款ASIC 芯片,由台积电代工,符合美国的出口限制。当时路透报道称,博通至少2022年就是字节的商业合作伙伴,曾公开表示字节购买其5nm 高性能交换机芯片以及用于AI计算机集群的 Bailly 交换机。字节和博通的开发芯片合作将有助于降低采购产品,并保证高端芯片的稳定供应。
本周的 The Information报道还提到,百度在开发的新一代AI芯片昆仑芯3代目前处于设计阶段的最后阶段,即将在台积电开始生产。