AI PC时代来临|英特尔依旧是技术引领者

AI(人工智能)从诞生至今,经历了70年;但“AI PC”从提出概念到产品落地的过程,却如一夜春风来,至今也不到半年时间。

不到半年,AI PC完成从概念到产品落地的华丽演进

今年9月,英特尔CEO帕特•基辛格最早提出了这一概念,按英特尔的设想,AI PC将以空前的速度推进,2025年将有上亿台具备人工智能模块的PC问世。

紧接着,英特尔在新公布的处理器构架Meteor Lake明确加入了NPU(英特尔曾在今年6月间披露过这一信息,其AI模块当时还被称为VPU,号称拥有比基于神经网络计算的外接式Movidius计算棒算力更加强大)。

10月,联想等一系列OEM厂商纷纷跟进这一概念,提出了AI For ALL、AI is Everywhere等设想,紧接着开始布局2024年AI PC产品线,随着2024年越来越近,我们很快就会看到第一代AI PC产品的落地。

12月15日,英特尔Meteor Lake的第一代酷睿Ultra处理器就将发布,随之发布的还包含第五代英特尔至强可扩展处理器(Emerald Rapids),目前披露出的信息是新平台AI算力爆涨至前代的8倍。

伴着AI PC概念的发布,微软也在积极布局AI领域,新一代的Windows版本“Hudson Valley”(哈德逊河谷,正式版本极有可能会命名为Windows 12)将全面布署AI功能,其中大部分功能均需要NPU的支持才能完成。我们很久都没在PC上看到,由软件(操作系统)驱动硬件的飞跃式成长,而AI,极有可能带来下一波的换机潮。据IDC预测,从2024年诞生的全新品类,将在2027年占据81%的份额,没有更换PC的用户,便享受不到这一波AI带来的高效率“红利”。

之所以AI PC会拥有如此快的落地速度,得益于ChatGPT等大语言模型带来的AIGC浪潮,诸如数字人等AI应用快速得到推广……不论上至数据中心、下至PC、智能手机等终端,都在迅速推动AIGC的应用,前不久,OPEN AI、微软甚至推出了不需要编程能力的AI应用市场。

对于普通人来说,应用超算的大语言模型的训练离我们太远、太昂贵;而智能手机还不足以承担真正的生产力工具之能,综合来看,PC才是承载AI终端能力的最好平台,在AI PC概念的布局中,便是要让一台笔记本、甚至轻薄本也具备本地化的AI能力。所以帕特·基辛格明确提出:AI行业目前已经从训练阶段过渡到部署阶段,AI更是将成为PC行业的关键转折点,Intel有信心在未来两年内领先业界、并于2025年达成出货超过一亿台AI PC的目标。

在提出AI PC的概念同时,基辛格也同时展望了AI PC运行“个人大模型”的可能,在最大化激化PC的AI算力后,它完全可以将PC改造为无所不能的AI助手,实现更低延时,更使得,更佳可扩展性,以及更私密的本地化AI应用。

AI布局,英特尔领先一步,AMD快速跟进

作为PC处理器的两大厂商,英特尔和AMD均切入了AI PC市场,非常凑巧的是,两家均将处理器中的独立AI模块最终定名为NPU(在升级到锐龙8040系列处理器后,AMD将锐龙7040系列中的Ryzen AI引擎升级为NPU),看似殊途同归,但两者的处理器构架和AI布局方式上还是有一些不同的。

刚才我提及,帕特•基辛格是业界提出AI PC概念的第一人,其实英特尔早在12代、13代酷睿之上,便通过CPU、GPU、Arc独显以及指令集配合软件与模型的优化实现了不同AI负载的支持;而且通过外接Movidius,可以进一步在终端、边缘端布署AI加速能力。这其中,英特尔很早就提出的XPU战略占有了极大的先行优势,OPENVINO在软件端建立了一个出色的异构计算平台,能够让每一台PC最大化地利用其AI算力。

早在数月前,我们便看到英特尔在一台标配内存16GB的13代酷睿的轻薄本上通过Pytorch对指令集的加速和BigDL-LLM框架的优化,便可流畅运行160亿参数的大语言模型,并且当时便能基于Xe核芯显卡以每秒4~5步的高效率运行Stable Diffusion。

另外,英特尔早在第四代英特尔至强可扩展处理器(Sapphire rapids)和首个数据中心GPU Max系列(Ponte Vecchio)上集成了大规模算力,尤其是率先采用Chiplet(小芯片)设计的第四代Intel至强可扩展处理器,在一个封装上集成多达4个采用Intel 7制程工艺制造的单元(3D封装技术EMIB带来的),AI性能相对前代有10倍提升。在云、边、端的AI硬件布局上,英特尔拥有相当明确的前瞻性。

AMD的AI战略布局是在锐龙7040系列处理器发布开始,虽然处理器构架与英特尔不同,但也集成了非常类似的Ryzen AI独立引擎。两家虽然在市场竞争上一直对立,但对“AI PC”概念却是保持了高度的一致性。

AMD在12月7日Advancing AI大会上发布的锐龙8040系列处理器,出人意料地挤了“牙膏”,8040系列几乎可以视为7040系列的马甲,但在AI引擎上依旧提供了1.6倍的算力提升;据称,2024年的“Stirx Point”才是AMD真正提升性能的一代,NPU也会升级到第二代,AI性能预计超过3倍。

深耕PC市场,英特尔的号召力更胜一筹

当AI浪潮以无可阻挡的趋势到来时,更能看到产业链顶端厂商的底蕴所在。在英特尔发布“AI PC加速计划”之后,其深耕PC市场、软硬结合的优势便显露出来。在英特尔的技术实力驱动下,酷睿平台获得了更多合作伙伴的青睐。

在第一代发布前,英特尔这一计划的ISV合作伙伴已经迅速超过100家,已开发的AI加速功能更是超过了300项,绝大部分都是基于NPU开发的;从7040系列到8040系列处理器,AMD也在快速度推进AI功能的适配,据称其NPU目前已经拥有100多项软件特性的适配。考虑到英特尔的先发优势,AMD的速度也不算慢,但还是落后了不少。

AI算力布局与优化,英特尔构架上占有优势

为何更多ISV会优先选择英特尔,还是基于刚才提及的深耕市场和软硬结合的底蕴,还有一点,便是英特尔在构架上的优势。虽然英特尔的AMD都在最新处理器中植入了独立NPU,但刚才我已经提过,英特尔的XPU构架能够最大化整合整个处理器的AI能力,让NPU还可以和CPU、GPU配合,承担不同的AI负载。事实上,处理器的整体AI算力对未来操作系统来说是非常重要的,据称微软的下一代Windows CoPilot(AI助手)的系统性能设计就需要达到40 TOPS,这肯定不是目前单一NPU就能达到的。

在酷睿Ultra没有发布之前,虽然我们暂时不知道其NPU的算力多少,但之前披露的信息可知,NPU的效率可以做到CPU的5倍、GPU的近2倍。值得留意的是,AMD由于没有类似于“XPU”的异构计算布局,其AI更多通过NPU独立运行,所以在锐龙8040系列处理器上为NPU提供了16TOPS算力。

需要说明的是,硬件算力是AI应用的基础,但并不是决定性要素,PC上展示出的AI能力更多需要ISV和开发者们在软件端进行优化与适配。比如高通尽管在最新的骁龙X Elite中采用的Hexagon处理器单元中部署了高达45 TOPS的算力,如果ISV和相关开发者支持对其构架支持不够,但依旧会陷入此前支持不足的泥淖。刚才提到,英特尔在这方面同样拥有领先优势。

写到最后

AI PC虽然是一个新时代,但无处不考验处理器厂商的技术深度和创新能力。过去数十年,我们看到英特尔一直在未雨绸缪、提前布局,不断创造迅驰、上网本、超极本、Evo笔记本等PC新形态,所以才有能力在次世代来临时及时做出转变。