NPU 究竟是什么?一文让您全盘知晓

中央处理器(CPU)和图形处理器(GPU)已不是新鲜事物。如今,前沿领域全都聚焦于神经处理单元(NPU),硬件制造商们都在大力宣传 NPU 的性能。

NPU 是一种旨在以节能方式加速人工智能任务的计算机组件,为具备强大人工智能功能的新 Windows 桌面应用程序铺平了道路。总之,这便是计划。

所有个人电脑最终都会配备 NPU,但当下只有部分个人电脑有。以下是您需要了解的关于 NPU 的一切,以及为什么它们在当前计算机行业是如此热门的话题。

NPU 代表神经处理单元。它是一种专门为人工智能和机器学习任务优化的特殊处理器。

这个名称源自人工智能模型使用神经网络这一情况。用通俗的话来说,神经网络是一个由相互连接的节点组成的巨大网络,它们之间传递信息。(整个想法是模仿我们人类大脑的工作方式。)

NPU 不是您购买并插入的单独设备(例如像 GPU 那样)。相反,NPU 被“封装”为现代处理器平台的一部分——如英特尔的 Core Ultra、AMD 的 Ryzen AI 以及高通的 Snapdragon X Elite 和 Snapdragon X Plus。这些平台都有一个 CPU 以及集成的 GPU 和 NPU。

多年来,计算机一直在中央处理单元(CPU)或图形处理单元(GPU)上运行任务。在配备有 NPU 的人工智能个人电脑(AI PC)上,仍然是这种工作方式。

CPU 运行计算机上的大部分任务。但 GPU,尽管其名称如此,并不只是用于图形和游戏任务。GPU 实际上只是针对不同类型的计算任务进行了优化,这就是为什么 GPU 对于非游戏工作,如加密货币挖掘和高性能运行本地人工智能模型至关重要。事实上,GPU 在这类人工智能任务中表现非常出色——但 GPU 非常耗电。

这就是 NPU 发挥作用的地方。NPU 在计算人工智能任务时比 CPU 快,但与 GPU 相比则没那么快。权衡之处在于,NPU 在计算相同的人工智能任务时比 GPU 消耗的功率少得多。此外,当 NPU 处理与人工智能相关的任务时,CPU 和 GPU 都可以腾出来处理各自的任务,从而提高整体系统性能。

如果您在个人电脑硬件上运行像 Stable Diffusion 这样的 AI 图像生成软件(或其他一些 AI 模型)并且需要最大性能,GPU 将是您的最佳选择。这就是英伟达将其 GPU 宣传为“高级 AI”硬件而不是 NPU 的原因。

但有时您想要运行的 AI 功能,可能对于常规 CPU 来说负担过重,但又不一定需要 GPU 的顶级性能。或者您可能使用笔记本电脑,想要利用 AI 功能但又不想让 GPU 耗尽电池电量。

有了 NPU,笔记本电脑能够执行本地(设备上)的 AI 任务,既不会产生大量热量,也不会过度消耗电池寿命,而且执行这些 AI 任务时,不会占用 PC 正在进行的其他任务的 CPU 和 GPU 资源。

即使您本身对 AI 不感兴趣,您仍然可以将 NPU 用于其他用途。在 2024 年国际消费电子展上,惠普展示了使用 NPU 进行视频流任务的游戏流媒体软件,释放 GPU 来运行游戏本身。通过使用 NPU 的额外计算能力,流媒体软件不会占用任何 GPU 资源……并且比使用 CPU 执行相同类型的任务要快得多。

对于 AI 电脑,NPU 可以被操作系统和系统上的应用程序使用。

例如,如果您有英特尔 Meteor Lake 硬件的笔记本电脑,内置的 NPU 将允许您运行 Windows Studio Effects,这是由 AI 驱动的网络摄像头效果,在任何使用您网络摄像头的应用程序中提供背景模糊和强制眼神接触等功能。

微软

微软的 Copilot+ PC——首批由高通骁龙 X 芯片驱动——自身具有使用该平台内置 NPU 的 AI 驱动功能。

2024 年 11 月,AMD 和英特尔的个人电脑将能够获取此前仅高通个人电脑所独有的那些 Copilot+ 个人电脑功能,不过,只有配备了新的 AMD Ryzen AI 300 系列和英特尔酷睿 Ultra 系列 2(Lunar Lake)处理器的 AMD 和英特尔个人电脑才行。

而这些仅仅是内置在 Windows 里的功能;应用程序开发者也将能够通过各种方式使用 NPU。要是看到 Audacity 和 GIMP 的插件能提供由计算机 NPU 驱动的人工智能音频和照片编辑功能,您别感到惊讶。

可能性多得很,但硬件方面仍处于早期阶段,所以要把它的潜力完全发挥出来还得等上一阵子。

大多数当下具备人工智能功能的应用程序——包括微软的 Copilot 聊天机器人——都还没用到 NPU 呢。恰恰相反,它们是在老远的云服务器上运行其人工智能模型。

这就是为啥您能在任何设备上运行像微软 Copilot、ChatGPT、谷歌 Gemini、Adobe Firefly之类的人工智能解决方案,不管是旧的 Windows 个人电脑、Chromebook、Mac、Android 手机,还是别的啥设备。

Adobe

但是呢,这些服务在云端运行它们的人工智能模型成本可高啦。比如说,微软在数据中心处理 Copilot 人工智能任务花了好多钱。

当然啦,这不单单是节省成本的事儿。您还能得益于能在本地设备上运行计算量比较大的人工智能任务。

比如说,就算您处于离线状态,那些人工智能功能照样能工作,而且您能保住数据的私密性,用不着一直把它们全都上传到云服务器。

英特尔

NPU 的性能用 TOPS 来衡量,TOPS 指的是每秒万亿次运算。为了让您明白这是什么意思,低端的 NPU 或许只能处理 10 TOPS,而符合微软 Copilot+ PC 品牌要求的PC 则必须至少处理 40 TOPS。

截至 2024 年秋季,以下 NPU 可供选择:

・英特尔酷睿 Ultra 系列 1(流星湖):英特尔第一代酷睿 Ultra NPU 最多能提供 11 TOPS。对于微软的 Copilot+ PC 功能而言,速度太慢,但它确实能用于 Windows Studio Effects 以及一些第三方应用程序。

・英特尔酷睿 Ultra 系列 2(月球湖):英特尔的月球湖芯片将包含一个性能高达 48 TOPS 的 NPU,超过了 Copilot+ PC 的要求。

・AMD 锐龙 Pro 7000 和 8000 系列:AMD 比英特尔更早地在 PC 上提供 NPU,但是锐龙 7000 系列处理器中的 NPU 对于 Copilot+ PC 功能而言太慢,其性能最高可达 12 和 16 TOPS。

・AMD 锐龙 AI 300 系列:最新的AMD 锐龙 AI 300 系列处理器中的 NPU 性能最高能达到 50 TOPS,足以满足 Copilot+ PC 的需求。

・高通骁龙 X Elite 和骁龙 X Plus:高通基于 Arm 的硬件包含一个高通六边形 NPU,能够达到 45 TOPS。

值得注意的是,NPU 不仅仅在 PC 上。苹果的神经引擎硬件是最早引起市场关注的大型 NPU 之一。谷歌用于 Pixel 设备的 Tensor 平台也包括一个 NPU,三星 Galaxy 手机也有 NPU。

老实说,处于前沿是有风险的。

如果您特意去买流星湖笔记本电脑,希望为您的 PC 未来的 AI 功能做准备,当微软后来宣布流星湖 NPU 对于 Copilot+ PC 功能来说太慢时,您实际上会感到失落。(英特尔不同意,指出您仍然能够获得那些笔记本电脑最初附带的所有功能。)

那这其中的一线希望在哪呢?Copilot+ PC 的功能当下还没那么有趣。特别是由于 Windows Recall 的推迟,Copilot+ PC 没多少吸引人的亮点。大多数最大的 AI 工具——ChatGPT、Adobe Firefly 等——甚至根本不使用 NPU。

不过,要是我买新笔记本电脑,有可能的话,我还是想要个 NPU。实际上,您没必要特意去找一个;它只是现代硬件平台包含的东西罢了。而那些现代处理器平台还有其他重要的功能,比如电池续航能力的大幅提升。

另一方面,那些快速的 NPU 当下只在最新款的笔记本电脑里,您常常能在旧款笔记本电脑上找到很不错的优惠。如果您发现上一代笔记本电脑有很大的折扣,仅仅为了个 NPU 就多花钱可能不太明智,特别是如果您没有任何计划运行的 AI 工具。

在撰写本文时,大多数大型的 AI 工具还是在云端运行——或者至少提供了这类选项——所以您能在任何 Windows 笔记本电脑、Chromebook,甚至 Android 平板电脑和 iPad 上运行它们。

对于台式机,NPU 的情况则不同。英特尔的台式机 CPU 目前还没有 NPU。您可以找找带有 Ryzen AI NPU 的 AMD 台式机芯片,但 AMD 的 Ryzen 7000 和 8000 系列芯片反正都不支持 Copilot+ PC 功能。所以,如果您正在组装一台台式电脑,暂时先不考虑 NPU。它目前还不是那么重要。

正在找具有高性能 NPU 的电脑吗?可以考虑像 Surface Laptop 7 这种基于 Arm 的 Windows 笔记本电脑,还有像 Asus ProArt PX13 这类 AMD Ryzen AI 300 系列笔记本电脑。另外,请您关注我们对 Lunar Lake 驱动的英特尔笔记本电脑的评测。在这之前,请您了解所有您需要知道的关于 AI PC 的术语。