英特尔酷睿Ultra 200S双平台首测:“框框”少了、性能大涨

【【【前言:大家期待已久的英特尔全新桌面CPU测评,它来了】】】

2024年10月10日,英特尔方面正式公布了全新的、换用新架构的酷睿Ultra 200S系列桌面CPU产品线。

它的发布不仅意味着英特尔的整个主流家用CPU产品线,正式完成了从“酷睿i”系列到“酷睿Ultra”的品牌序列转变,同时也是继12代酷睿之后,英特尔主流桌面CPU久违地迎来了全新的架构和制程设计。

很显然,对于这一代的全新产品,无论是上游的各大板卡厂商、还是诸多消费者,都表现出了极高的期待和兴奋度。此前我们三易生活也已经用相关内容为大家带来了酷睿Ultra 200S系列新架构的技术分析《英特尔酷睿Ultra 200S系列解析:架构焕新,能效称王》,以及与之搭配的华硕ROG STRIX Z890-E GAMING WIFI主板图赏。

既然如此,那么今天的内容自然就是大家期盼已久的性能实测了。

【【【平台简介:Ultra9和Ultra5,我们组了两套不同定位的测试平台】】】

此次我们三易生活的测试对象,是英特尔酷睿Ultra 200S桌面处理器家族里,两款定位截然不同的成员。它们分别是作为本世代(到目前为止)旗舰的酷睿Ultra9 285K,以及明显更偏“大众化”的酷睿Ultra5 245K。

从具体参数上来看,酷睿Ultra9 285K拥有8P+16E的核心组合,总共24核心24线程。其中P核主频3.7GHz-5.7GHz、E核主频3.2GHz-4.6GHz,同时拥有40MB的L2缓存和36MB的L3缓存。

相比之下,酷睿Ultra5 245K则是6P+8E的核心配置,总共14核心14线程。P核主频为4.2GHz-5.2GHz,E核则是3.6GHz-4.6GHz,缓存方面配备了26MB的L2缓存以及24MB的L3缓存。

此外,酷睿Ultra 200S系列还全系标配具备13TOPs算力的英特尔第三代NPU,也就是之前移动版酷睿Ultra 100系列里相同架构的NPU,但主频应该有一定幅度的提升。

最后,无论酷睿Ultra9 285K、还是酷睿Ultra5 245K,都配备了一颗新的“Intel Graphics”核显。其架构同样源自初代酷睿Ultra移动版,也就是桌面版ARC独显去掉XMX单元之后的初代Xe架构。不过因为是桌面CPU,所以核显只保留了4组执行单元,总计64ALUs、32TMUs、16ROPs的配置。其中在Ultra9上,这颗新核显的峰值主频略高、可达2GHz,而在Ultra5版本中,它的峰值主频则降到1.9GHz,但基本上也可以认为没啥区别,主要还是提供一个附带的“亮机卡”,以及在部分场景作为视频编解码单元和AI协同加速单元使用。

当然,除了这两颗CPU,我们也为它们找了些适合各自定位的配件。其中,酷睿Ultra9搭配的是华硕ROG STRIX Z890-E GAMING WIFI。此外还包括DDR5-7600高频内存、PCIE5.0的英睿达T705 SSD、RTX4080S显卡,以及华硕ROG 龙神三代 Extreme 360水冷。

酷睿Ultra5这边,我们选择了七彩虹iGAME Z890 FLOW主板,搭配影驰名人堂DDR5-7600内存、PCIE4.0 2TB SSD,以及RTX4070S显卡,以及相对常规的风冷散热器。

有的朋友可能会说,这两套平台的外围配置并不统一,那不是没法对比了吗?请注意,虽然我们给两款CPU搭配了不同的SSD和独显,但内存规格却基本相同。因此涉及到纯粹CPU性能的考察项目,这两个平台之间依然具备可比性。同时,在游戏以及部分生产力项目上,我们并不会将两个平台进行直接比较,这是因为两者的市场定位其实有着很大差异,不考虑价格因素强行进行对比并无意义。

【【【内存和缓存测试:设计变化巨大,带宽敏感型应用大幅受益】】】

接下来,我们正式进入对酷睿 Ultra 200S系列的性能实测。

酷睿Ultra 5 245K 缓存性能

酷睿Ultra 9 285K 缓存性能

首先,我们测试了这两颗CPU分别搭配DDR5-7600内存时的内存和缓存性能。可以看到,作为新架构目前已经公布的高低“两端”,酷睿Ultra 9和酷睿Ultra5在搭配相同内存时,所发挥出的内存读写速度差异很小。这表明Ultra 5的内存控制器体质可能得到了提升,至少不会像过去那样、存在比较明显的频率限制了。

酷睿Ultra 5 245K 内存读取

酷睿Ultra 9 285K 内存读取

不过相比内存控制器性能的接近,酷睿Ultra 200S系列的不同定位处理器在缓存性能上,则体现出了巨大的差异。可以看到,Ultra 9 285K的L1缓存性能比Ultra 5 245K高出大约50%,同时L3缓存性能更是比Ultra 5有着翻倍级别的提升。但与此同时,两者的L2缓存性能差异则没有那么大。

从各项数据的比例来看,似乎说明在目前版本的AIDA64里,我们测得的L1和L2带宽更像是“仅有P核”的跑分结果,L3缓存的带宽测速才更好地体现了核心数量和主频上的差异。

那么如果与前代对比,酷睿Ultra 200S系列的缓存性能表现又会如何呢?

我们找来了前代旗舰、酷睿i9-14900K的内存和缓存测试成绩,来进行对比。此时可以很明显地看到,相比酷睿i9-14900K,酷睿Ultra9 285K采用了完全不同的缓存设计策略,其L1缓存写入带宽相比前代增加了50%,L3缓存的速度更是提升超过100%。但与此同时,后者的L2缓存读取带宽降低了大约60%,同时内存写入和读取速度也降低了大约10%。

这似乎说明新款处理器在整个数据处理的逻辑上,更着重于依赖L3缓存。其实这是一个很好理解的设计思路,因为相比于内存,L3缓存有着低得多的功耗。因此当英特尔方面为酷睿Ultra 200S系列赋予更大的缓存(特别是三缓)时,这本身其实就是一种“降功耗”的措施。

不过众所周知,对于日常使用场景来说,不同的用途往往对于缓存和内存性能会有不同的依赖程度。比如在多媒体创建场景,更高的内存带宽往往就会带来显著的性能增益。那么当英特尔在他们的新架构里针对缓存和内存性能进行了大幅调整后,又会带来怎样的影响呢?

酷睿Ultra 5 245K 照片编辑模拟

酷睿Ultra 9 285K 照片编辑模拟

从AIDA64的这两个测试项目中可以看到,虽然Ultra5和Ultra9这次由于核心数量、频率的差异,在指令分支预测性能上差异甚大,但它们在纯粹的浮点多媒体运算测试中,却有着十分相近的表现。而且两者的浮点多媒体模拟性能均比上代的24核酷睿i9提升了高达40%之多。换句话说,稍慢一点点的内存速度,完全没有成为新款处理器的性能瓶颈。

【【【并行性能测试:单核性能爆炸式提升,去掉超线程影响很小】】】

测完了缓存和内存设计的变化对于酷睿Ultra 200S系列带来的影响,我们接下来就来探究它这次新的核心设计。

酷睿Ultra 5 245K 分支预测

酷睿Ultra 9 285K 分支预测

首先,是AIDA64内置的分支预测评估项目。可以看到,此时Ultra 5和Ultra 9之间出现了很大的差异。当然这里面有个“幸存者偏差”的问题。因为AIDA64这个项目里的参考成绩全都是历代旗舰CPU,所以Ultra 5的成绩反而难以直接进行对比。如果拿Ultra9 285K去进行比对便不难发现,新架构的分支预测性能大抵比前代同样8P+16E规格的酷睿i9,提升了接近20%。

当然,大家都知道,在这次的新架构里英特尔为了提高能效比,不只是大幅修改了缓存架构,同时还取消了超线程。那么这对于新款处理器的多核性能,会带来怎样的影响呢?

酷睿Ultra 5 245K CPU-Z跑分

酷睿Ultra 9 285K CPU-Z跑分

在CPU-Z的测试中,由于酷睿Ultra 200S系列CPU取消了超线程,所以它们的成绩可能确实有一点点“吃亏”。特别是对于酷睿Ultra5 245K来说,可以看到它的表现基本上也就是12代酷睿i9的水平。

酷睿Ultra 5 245K CineBench R23

酷睿Ultra 9 285K CineBench R23

但如果换用负载更重、更接近实际工况的CineBench R23就会发现,新架构的性能提升实际意义要远远超过了表面上的“框框减少”。特别是对于专业生产力应用需求的用户来说,即便是14核的Ultra 5,实测渲染性能也超过了24核的旧款Xeon,而24核的Ultra9更是碾压竞品的32核线程撕裂者50%以上,这个吸引力就实在是太大了。

此外,无论从CINEBENCH的重负载渲染、还是7ZIP的解压缩测试数据来看,酷睿Ultra 9和酷睿Ultra 5之间的跑分成绩差异,基本符合它们的核心数量以及频率之间的对应关系。换句话说,在目前的操作系统和驱动环境下,新架构的酷睿Ultra 200S系列桌面处理器在大小核调度方面的效率已然不存在问题,所有核心在需要的时候都是可以“全力全开”。

最后,使用CrossMark对这两套平台的整机性能进行了大致的评估。需要注意的是,由于两个平台的SSD、显卡配置并不一样,整体细节成本也分别与它们的定位相对应。所以这里重要的并非整机成绩之间的对比,而是CPU在更多样化、并不见得满载的测试场景下的比较。

【【【AI体验与测试:给桌面处理器加NPU,并非为了抢显卡的饭碗】】】

接下来,我们来了解酷睿Ultra 200S系列此次的AI计算体系。

有看过我们此前架构分析内容的朋友可能还记得,酷睿Ultra 200S系列这次的AI计算体系是由三个计算部件和三种代码架构组成,即运行AVX-ANNI指令的CPU、运行DP4a指令的GPU,以及运行MAC阵列的NPU。

但与其他家类似“异构AI”体系的不同之处在于,英特尔是有一个自家的统一API,可将CPU、GPU、NPU的算力都统合在内。而通过这套OpenVINO框架,我们也就确实可以在GeekBench AI中,分别测得酷睿Ultra 200S系列里不同AI运算组件的相对性能等级。

酷睿Ultra 5 245K CPU AI性能

酷睿Ultra 5 245K GPU AI性能

酷睿Ultra 5 245K NPU AI性能

以酷睿Ultra 5 245K为例,通过GeekBench AI可以清楚地看到它在OpenVINO框架下有三个AI运算设备。从各自的性能等级来看,NPU在半精度推理场景中可以发挥出比CPU、GPU更好的性能,从这一点来说,其实酷睿Ultra 200S系列这次配备的NPU也没那么“小”。

除此之外通过安兔兔AI大模型评测可以看到,酷睿Ultra5 245K与酷睿Ultra9 285K的纯CPU AI性能差异。不难发现,前者大约有后者70%的CPU AI性能水平。稍加计算不难发现,在目前酷睿Ultra 200S系列里,单颗P核的AI性能大约相当于8颗E核的水平。当然,这仅仅是从单一测试结果倒推出的简单结论,大家姑妄听之就好。

那么可能有的朋友看到这里会有疑问,毕竟桌面版CPU和移动平台不一样,现在绝大多数的桌面PC用户往往都会搭配中高端、甚至是旗舰级显卡来使用,那么在这种情况下,强化CPU本身的AI算力、专门塞进一颗NPU又是否有意义呢?

纯CPU AVX指令驱动的340亿参数本地对话大模型

基于英特尔OpenVINO框架实现的本地AI绘图和本地AI对话助手

首先,哪怕是只从现有的PC端侧AI应用来看,也不是所有AI应用都只依赖于GPU。对于CPU、特别是对于英特尔的OpenVINO体系来说,它其实有不少支持的本地AI用例。比如部分多媒体爱好者可能会很熟悉的PhotoShop“神经网络滤镜”,就可以智能地调用GPU和CPU的算力去执行。所以不能说因为独立显卡的AI性能很强,其他计算部件的AI功能就没必要了。

况且从英特尔方面此前透露的一些信息来看,他们也很清楚桌面PC在AI算力方面主要还是依赖独立显卡,所以这也是为何酷睿Ultra 200S系列的NPU规格不很高的原因。因为这颗NPU未来主要的任务只是负责处理比如摄像头特效、麦克风消噪,以及语音助手这类,需要长时间运作、但AI运算压力又不是特别大的任务。在这种情况下,如果没有NPU、全靠独显去运算的话,就会带来大得多的功耗和发热,而且还可能会拖累电脑的游戏性能。

【【【游戏测试:网游和3A优化已经到位,Ultra5即可畅玩】】】

最后就该来看看可能很多玩家朋友都会关心的问题,也就是酷睿Ultra 200S系列的游戏性能了。

首先在3DMARK的CPU游戏测试项目中,考虑到目前绝大多数的3A大作也才不过6线程-8线程优化,所以即便是6P+8E的酷睿Ultra5 245K,其P核计算资源理论上也是完全够用的。更多并行线程的考察或许可以作为“战未来”的依据,但对于当前的游戏来说其实意义不大。

当然,这里作为参考,我们依然列出了之前酷睿i9-14900K的测试数据。可以明显看到,更高的单核效率让Ultra 9几乎在所有的线程并发场景下,表现都要优于上一代旗舰。

接下来是游戏加加的整机游戏性能测试。还是那句话,由于这两套平台在独显、内存等方面并不相同,所以两者之间不具备直接对比综合性能的意义。

酷睿Ultra 5 245K 《最终幻想》14 7.0 1080P最高画质

酷睿Ultra 9 285K 《最终幻想》14 7.0 1080P最高画质

不过这并不妨碍我们使用相同的游戏和画质设定,来对两套平台进行考验。在《最终幻想》14 7.0版本的Benchmark中,重点在于最后的得分是否有足够高的评价。从结果来说,两套平台应对这个堆特效的网游普遍都没啥压力。

酷睿Ultra 5 245K 《古墓丽影·暗影》4K高画质

酷睿Ultra 5 245K 《古墓丽影·暗影》4K最高画质

酷睿Ultra 9 285K 《古墓丽影·暗影》4K高画质

酷睿Ultra 9 285K 《古墓丽影·暗影》4K最高画质

然后我们进入单机游戏测试环节,第一个登场的游戏是《古墓丽影·暗影》。此时我们有意拉高了测试的画面分辨率,并使用高画质和最高画质两种模式,分别考察CPU性能差异,以及相应平台所能提供的游戏极限性能。可以看到,哪怕是酷睿Ultra5搭配RTX4070Ti,在《古墓丽影·暗影》里“拉满画质”都没什么问题,就别提定位更高的Ultra9+RTX4080S了。

酷睿Ultra 5 245K《装甲核心6》2K光追

酷睿Ultra 9 285K《装甲核心6》2K光追

《装甲核心6》的优化水准似乎更好一些,所以我们尝试开启了2K+光追的全最高画质模式。稍微令人感到意外的是,酷睿Ultra 5这套平台在游戏里与定位更高的Ultra 9平台完全没有拉开差距,甚至在开头部分的帧率更高、画面更稳定。看起来不仅GPU、就连6P+8E的CPU,对于这款画面相当绚丽的机战游戏来说,似乎都显得有点“过剩”了。

酷睿Ultra 5 245K《黑神话·悟空》4K 超高 光追中

酷睿Ultra 9 285K《黑神话·悟空》4K 超高 光追中

当然,也不能忘了我们国内游戏界引以为傲的《黑神话·悟空》。虽然此前我们三易生活已经测试过多个平台在这款游戏里的性能表现了,但在全新的酷睿Ultra 200S平台上,我们希望能够体验到更极致的画面享受。所以4K+超高画质+光追的设定也就顺理成章。从结果来说,不管Ultra 5、还是Ultra 9,都能很流畅地运行这款3A大作,即便是在开启光追的情况下,Benchmark的4K分辨率高画质成绩也没有低于60帧。

酷睿Ultra 5 245K 《赛博朋克2077》2K 超级光追

酷睿Ultra 5 245K 《赛博朋克2077》4K 超级光追

酷睿Ultra 9 285K 《赛博朋克2077》2K 超级光追

酷睿Ultra 9 285K 《赛博朋克2077》4K 超级光追

在最后一个游戏测试项目中,我们测试了2K和4K分辨率下这两个平台的帧率表现。有意思的是,酷睿Ultra5再一次出现了在游戏测试中帧率高于Ultra9平台的情况。不过在《赛博朋克2077》这个游戏里,不同显卡的自动DLSS等级其实是不一样的,所以这反而没什么好奇怪。毕竟帧率有这么高了,不管是哪个平台,流畅且高画质地游戏都毫无问题。

【【【总结:英特尔这次找对了方向,新平台表现靠谱】】】

说实在的,在此前对Arrow Lake进行架构解析之后,我们三易生活虽然对于新处理器大幅改进的核心设计很是好奇,同时也对英特尔敢于在酷睿Ultra 200S系列强调能效比的做法多有肯定。但对于变化如此之大的产品究竟在实际测试、使用中的性能,确实一开始谁也没个底。

但从此次的测试结果来看,一方面在全新的架构设计下,酷睿Ultra 200S系列表现出了大幅提升的单核性能,同时为了提高能效而设计的缓存系统,以及取消超线程的决定,哪怕是在强烈依赖多线程性能的渲染、多媒体编辑相关测试中,也没有表现出副作用。从某种程度上来说,这也间接证明了超线程这个古老的技术在现代处理器中,或许确实到了应该被改变的时刻。

另一方面,尽管目前在桌面CPU领域,直接集成NPU的产品确实还不多,但随着酷睿Ultra 200S系列此次的推进,它更大的意义在于填补了过去“主流桌面CPU”几乎完全没有NPU硬件的空白。换句话说,对于AIPC的软件适配、特别是面向NPU编程的生态推广,可能才是这一代酷睿桌面CPU在相关领域的意义所在。

最后从实际的游戏测试成绩来看,不管是相对老一点的游戏、还是最新大作,无论网游、还是单机游戏,酷睿Ultra 200S系列最令我们惊喜的一点,在于它目前已经可以表现出很好的优化状态。哪怕是Ultra 5,在所有的游戏项目中也没有因为6个P核的配置,而出现核心迁移相关的延迟、卡顿等问题。

事实上,根据英特尔此前透露的一些信息显示,桌面版的酷睿Ultra 200S系列尽管这次“能效比”是改进重点,但其线程调度逻辑还是会更偏向桌面PC的特征,也就是尽可能地使用P核去主动、更快地完成任务。或许正是靠着这样未雨绸缪的设计,酷睿Ultra 200S系列在表面上线程减少、峰值主频也降低了的情况下,游戏性能和游戏兼容性都完全没有“打折扣”。

再加上本身更高效的新架构,无论是对于追求效率的生产力用户,还是想要更快、更稳定平台的玩家朋友来说,英特尔全新的这一代桌面平台,可能都会是接下来最好的选择。