英特爾發表新一代AI解決方案Xeon 6和Gaudi 3
英特尔发表次世代AI解决方案Xeon 6 伺服器晶片。图/英特尔提供
因应AI需求攀升,英特尔24日推出搭载效能核心(P-core)的Xeon 6和Gaudi 3 AI加速器,强化公司致力于提供具备每瓦最佳效能且降低总持有成本(TCO)的强大AI系统的承诺。
英特尔并宣布与领导OEM伙伴合作包括戴尔和美超微,开发共同设计的系统,以满足客户在有效AI布署的特定需求。戴尔与英特尔正共同设计适用于Gaudi 3和Xeon 6且以检索增强生成(RAG)为基础的解决方案。
英特尔执行副总裁暨资料中心与AI解决方案总经理Justin Hotard指出,AI需求带动资料中心大规模转型,产业因此开始在软硬体和开发工具上寻求更多选择。
英特尔发表全新Intel Xeon 6搭载效能核心(P-core),是款专为处理运算密集型的工作负载而设计,并兼顾优异效率的AI伺服器晶片。相较于上一代处理器,Xeon 6提供2倍的效能提升,不仅核心数增加、记忆体频宽加倍,更将AI加速功能嵌入每个核心。英特尔此款处理器,专为满足边缘到资料中心和云端环境的AI效能需求而打造。
至于新一代Intel Gaudi 3 AI加速器,特别为大规模生成式AI最佳化的设计,具备64个张量处理器核心(TPC)和8个矩阵乘法引擎(MME),能加速深度神经网路运算。此外,还包括用于训练与推论的128 GB HBM2e记忆体,以及用于可扩充网路的24个200 Gb乙太网路连接埠。Gaudi 3提供了与PyTorch框架、先进的Hugging Face Transformer模型和diffuser模型无缝的相容性。英特尔近期宣布与IBM合作,将英特尔Gaudi 3 AI加速器做为服务布署至IBM Cloud上,期待透过这项合作,客户在使用AI与扩充AI规模时,能同时强化效能与降低总持有成本(TCO)。
大规模部署AI涉及各种考量因素,包括灵活弹性布署的选项、具竞争力的价格效能比,以及可用的AI技术等。英特尔强大的x86架构与广泛的开放生态系,使其能够支援企业建构具备最佳化总持有成本(TCO)及每瓦效能的高价值AI系统。值得一提的是,市场上高达73%的GPU加速伺服器是使用Intel Xeon系列处理器作为伺服器处理器(host CPU)3。
英特尔发表次世代AI解决方案Gaudi 3 AI加速器。图/英特尔提供