Google宣布第6代 TPU「Trillium」 預計年底推出

Google。路透

Google长期推动自有晶片,为自身需求打造AI专用硬体Tensor Processing Unit(TPU),以推动AI在规模及效率的极限。Google I/O大会今日发表多项创新由TPU支援的创新AI产品,包括Gemini 1.5 Flash、Imagen 3和 Gemma 2等全新模型,以TPU训练打造并透过TPU提供服务。Google也宣布第6代TPU晶片Trillium,是迄今为止效能最高以及最节能的TPU,预计年底推出。

与TPU v5e相比,Trillium TPU每一晶片峰值计算效能提升4.7倍,并将高频宽记忆体(High Bandwidth Memory, HBM)的容量与频宽提升一倍,晶片间互连网路(Interchip Interconnect, ICI)频宽也提高了一倍。Trillium配备第三代SparseCore,这是处理超大嵌体的专用加速器,常用于处理进阶排名与推荐工作负载。Trillium TPU可以更快速地训练下一代基础模型,并以较短的延迟时间与较低成本提供模型服务。另外,与TPU v5e相比, Trillium TPU的能源效率高出67%,每个晶片尖峰效能提升了4.7 倍。Trillium TPU将是下一波AI模型和虚拟专员的推手。