☰

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%

英特尔，开始正面硬刚英伟达了。

就在深夜，英特尔CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3：

他为什么开心到现场直接蹦迪？

看下Gaudi 3的性能结果，就一目了然了：

不仅如此，虽然基辛格没有在现场给出直接的数据，但他还表示：

如此直面对标英伟达，到底效果如何，我们继续往下看。

英特尔表示，Gaudi 3已经在Llama上做了测试，可以有效地训练或部署AI大模型，包括文生图的Stable Diffusion和语音识别的Whisper等等。

在现场，基辛格也展示了集成最新英特尔芯片的AI PC，能够快速处理的多项任务，例如快速处理邮件：

再如语音处理：

以及图像渲染：

英特尔演示操作的同事还非常调皮地展示了用AI PC生成的卡通版基辛格：

据了解，Gaudi 3采用5纳米工艺制造，与历代Gaudi其它性能上的具体对比，如下表所示：

英特尔表示，Gaudi 3芯片将在今年的第三季度向客户大规模提供，包括戴尔、惠普和超微电脑在内的公司将使用该芯片。

至于具体的价格，目前英特尔方面还并未透露。

不过更令人意外的是，Gaudi 3还只是在这次英特尔Vision活动中发布的产品之一。

没错，去年年底英特尔刚刚上市第五代Xeon，仅时隔数个月，第六代Xeon又来了！

（英特尔这次还真没有挤牙膏）

在现场，基辛格还亲切地叫它“little baby”：

第六代Xeon包含两种架构，分别是Sierra Forest和Granite Rapids。

Sierra Forest基于英特尔更小、低功耗的E-cores，而Granite Rapids则由更大但性能更高的P-cores 组成。

基辛格在现场称二者像双胞胎：

更具体而言，Sierra Forest架构的英特尔Xeon 6处理器，其机架密度提高2.7倍。

客户能以近3:1的比例替换旧系统，大幅降低能耗，帮助其实现可持续发展目标。

而Sierra Forest架构的英特尔Xeon 6处理器包含了对MXFP4数据格式的软件支持。

与使用FP16的第四代Xeon处理器相比，可将下一个token的延迟时间最多缩短6.5倍，能够运行700亿参数的Llama-2模型。

至于英特尔Xeon 6处理大模型的速度到底有多快，基辛格做了更加直接的对比。

他将第四代、第五代和最新的第六代Xeon放到了一起，来了一个现场速度的大比拼。

从直观的生成速度来看，第六代Xeon明显要比“前任们”快上许多。

具体到精确的延时数值，第六代Xeon运行Llama 2 70B只有82ms。

同等条件下，第六代Xeon与“前任们”的延时数值对比如下：

据了解，Sierra Forest架构的第六代Xeon处理器将于今年第二季度推出。

这场硬刚英伟达的发布会，同样也激起了不少网友们的热议。

例如Gaudi 3封装的一处细节，即使用HBM2e存储芯片，有网友对此表示惊讶：

而最先进的HBM3e英特尔原本也计划采用，但很可能因为供应不足，这次没能抢到足够的订单。

对此，这位网友进一步表示：

实际上，制造优势也是英特尔在半导体领域的关键优势之一，作为半导体产业的开创者之一，英特尔几乎拥有芯片产业的所有资源和要素能力。

但何时能够和英伟达全面一较高下？这也是不少网友关注的问题：

或许答案只有交给时间来回答。

但无论如何，英特尔此次的发布，确实是给AIGC时代的算力，多提供了一项“快好省”的选择。

参考链接：[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/[3]https://news.ycombinator.com/item?id=39981032

英特尔突袭英伟达H100，新AI芯片训练快40%，推理快50%

相关资讯