又要性能好,又要手机电不跑?
题图|视觉中国
你是否有过这样的体验,刚下班,想用手机打开一个王者或吃鸡,约上三五好友开黑,准备在刺激的战场上厮杀一番;但是到了推塔或吃鸡时刻,却发现手机不仅越来越发烫,而且的运行速度变得很慢,甚至出现卡顿、闪退的情况。
上述的情况之所以会发生,是因为手机性能不足,无法应付我们的日常需要。因此,手机厂商往往巴不得把芯片的性能调到最强。
然而,硬币的另一面是,性能拉满,手机功耗也随之加快。试想想:当我们午饭时间兴高采烈地玩了一小时原神,转头发现自己的手机被折腾得剩下 50% 电量;这时候我们就会不顾一切去找充电宝,在插上接线口的那一刻,内心顿时平静。在这个没有手机就活不了的年代,过快的功耗会让用户产生电量焦虑。
可见,用户一方面想要更快的手机、另一方面又想要手机能撑得更久,这使厂商在设计芯片时,陷于左右为难的困局。
能耗为先,场景为王
手机芯片,是手机可以进行运算的核心单元。它就好比汽车的发动机一样:汽车能跑多快、能拉多少货、能上多斜的山路,就看发动机(芯片)性能有多;但同样地,汽车发动机性能愈强,它的耗油(耗电量)量也会愈高。因此,如何在性能与功耗之间取得平衡,是现在科技产业的核心关注点所在。
当智能手机刚开始流行之时,大众尚不太熟悉这种新鲜的科技产品,所以使用场景也比较简单:用户往往就用来听听音乐、看看新闻等等,所以大众对手机芯片的性能要没有太大的要求。
随着智能手机日潮普及,一部分用户开始习惯在手机上玩游戏、看电影,这些应用场景往往需要高性能手机芯片的支持;因此,芯片公司不断开发新的芯片,提升芯片的性能,以满足这些用户的需要。
但尴尬的是,并不是所有用户也会玩手游、看电影;他们很可能仅在手机上刷微博、或发微信就可以了,所以对芯片能的要求并不那么高。在这情况下,厂商不可能光是手游玩家而开发高性能、高功耗的芯片,而忽视那些只会使用微博、微信等轻应用用户的长续航需要。
为了满足这种矛盾的场景,芯片设计公司 Arm想出一款诡异的架构:大、小核架构,big.LITTLE。这个架构由一组高性能但高功耗的“大核”、以及一组低性能但低功耗的“小核”所组成。
当用户在工作时发微信、或在洗手间里刷微博等轻应用时,手机就会调用省电的小核,让用户在厕所里蹲上一天也不致于没电;但当用户下班后想打怪升级?大核就会出场提供足够的性能,让你有能力“拯救世界”。
结果在这十年来,满大街的手机里采用的,都是这种由大小核构成的手机芯片,并暂时满足当时用户对于手机各种复杂场景的性能需要。
如何满足用户既要又要的需求?
可是,小核真的可以永远满足用户的复杂场景需求,达到一劳永逸?
NO,这仅仅是厂商的幻想而已。
当手机不断深入我们的生活,其多任务并行的需求越来越高:用户享受高清画质,高清屏幕就需要高GPU性能;用户拿手机拍照,强大的计算摄影就需要更高的算力。
结果,今天手机用户的日常应用场景,就连高性能、高功电的大核都满足不了;至于像微信之类的轻应用,也变得不那么简单:以往微信就只是收发信息,现在还要手机支付、看公众号、刷视频号、用小程序什么的,光靠小核真的能撑得住吗?
为了解决这个问题,一些芯片厂似乎逐渐变得偏执,变本加厉地把架构搞得异常复杂,变成“超大核+大核+小核”三丛架构。然而,也由于芯片公司愈来愈重视大核的研发工作,相对地就不太重视小核的研发。因此,近年小核技术迭代往往慢于大核;尽管小核整体仍然较为省电,但在同样功耗的环境下,大核不但性能更强,能源配置效率也在慢慢变好。
在这情况下,小核好比以往用小排量汽车拉货:虽然小车比较省油,但它拉货时跑得太慢、载货量少,不但影响了工作效果,也由于需要多次长时间来回,结果累计的耗油量,竟然比大核更大──换言之,小核从最初那个救世主,摇身一变成为拖旗舰手机大腿的软肋。
直至十年后的今天,联发科终于换了一种思路:化繁为简,把旗舰芯片上的小核全部砍掉,全变成大核;然后在大核身上做文章;进一步降低功耗,让人们看到芯片突破性能桎梏的可能。
性能提高了,更省电?
天玑 9300 芯片虽然沿用了以往的8 核心设计,但当中 4 个核心是超大核(编号 Cortex-X4),另外 4 个核心是大核(编号 Cortex-A720)的设计。而当中最特别是处,就是并没有像其他芯片公司一样,同时用上了性能低但较省电的小核心(编号 Cortex A520)。
你没看错,天玑旗舰非常果断地将小核一个不留地全部砍掉,只保留大核和超大核,并在这基础上进一步作出改良。对比只有 6 个高性能核心的同级对手来说,拥有 8 个高性能核心的天玑 9300,在性能上真的可算是遥遥领先。
从上图可见,它绝对是目前手机芯片里的性能天花板;但有趣的是,根据联发科公开的数据表示,尽管天玑 9300 性能比上一代快了 40%,但耗电量却少了 33%。性能提高了,反而更省电?这无疑颠覆了大众对手机芯片“性能愈强、功耗愈大”的传统认知。
到底天玑 9300 是怎样做到“性能愈强、功耗反而变小”?原理也很简单。我们刚才说过:现在即便是小型的手机任务,对性能也有较大的需求;旗舰芯片用小核跑这种“轻”任务,就像用小排量汽车去拉货一样没效率。但天玑 9300 却是选择用大货车去拉货,这其中的原理也比较好解释:尽管大货车比较耗油,但只要拉货拉得快,就可以更早回家休息。
对比以往,“小核”所代表的小车,由于在技术不及“大核”先进;它在拉货时往往是空车拉货、运到目的地后再空车回家,白白把汽油浪费在空载的路上。但大核有着“乱序执行”等更灵活、更先进的“货运”调度设计,要不就是一程车就完成任务,然后回家休息;要不就是来回都会带点私货,把每一口汽油都用在运货上,拉货变得更有效率,货车就更更快回家休息。
通过数据也可以看出,尽管这台“全大核”大货车单程的耗油量较高,但它也能能比“小核”这种低效的小车更快休息,累计耗油量反而比小车要低了(上图)。基于此,联发科才决定在旗舰上狠狠地对这枚欠缺效率的小核开刀,才能研发出天玑 9300 这枚颠覆传统性能和耗电量关系的手机芯片。
高能效比的另一关键:AI
所以砍掉旗舰芯片上的小核,就是手机产业的未来吗?是的,但也不全是。因为手机产业还要面对另一个很特殊的未来,就是人工智能。
众所周知,我们的手机里很早就引入了大量的人工智能应用,例如手机里的语音助手、相机里的高动态范围照片合成、各种应用里的推荐算法,也是人工智能技术在背后技撑着。因此,以往的手机芯片均加入了针对人工智能而设计人工智能处理器(APU),让用户可以更快、更省电地获得人工智能的服务。
然而在去年年底,ChatGPT成为科技产业的焦点所在,大众均预计未来我们将可用到用到用更聪明的语音助手、更聪明的文字生成图片/视频能力、以及各种通过 AI 来实现的新功能。
然而,以往手机采用的人工智能,其实是 “分辨式人工智能”(Discriminative AI),只能识别需求,却不能产出内容;但以 ChatGPT 为代表的新式人工智能,我们称之为“生成式人工智能”(Generative AI),不仅能够智能识别需求,还能产生图文甚至是视频内容,两者在技术路线和规模上完全不同。
这些能跑生成式人工智能的模型,我们一般称之为“语言大模型”(Large Language Model, LLM)。它的最大特征,是拥有海量的参数;为了载入这海量的参数,必然对内存有着极高的需求。偏偏手机内存本来远比电脑要少,面对语言大模型在内存上的巨大需求,显得捉襟见肘。
当我们通过传统的手机芯片跑语言大模型,执行效率难免极低,速度自然较慢、当然也更为耗电。
因此,天玑 9300 加入了针对生成式人工智能而设计的第七代人工智能处理器 AP790。针对较为重要的整数运算和浮点运算作出改良,提高了 2 倍的性能、降低了 45% 的功耗。它更内置了硬件级的生成式人工智能引擎,深度适配大模型进行算子加速,处理速度是上一代的 8 倍,1 秒内可让人工智能生成图片。
此外,我们需要知道,人工智能的参数愈大,语音助手的回应能力愈强,生成图画的速度也愈大。天玑 9300 更针对基于亿级参数大语言模型特性,开发了混合精度 INT4 量化技术,结合其内存硬件压缩技术,可以大幅减少大模型对终端内存的占用,支持最高可达 330 亿参数的 AI 大语言模型。
最后,人工智能可以在手机终端运行,不再经过云端传输信息,这实际上实现了从AI在云到AI在设备端的转变,人工智能能更便捷地响应用户的需求,而且隐私信息也不再上传云端,减少信息安全的风险。
所以,当天玑 9300 为生成式人工智能做了足够的优化,消费者才能在手机上体验到满血的ChatGPT,这样,我们就能在任何时候都有一个知心的语音助手,在任何地方也能让人工智能帮你发挥创意。
天玑 9300 的出现,证明了砍掉旗舰芯片上的小核是手机芯片的未来的一个方向,我们相信未来半导体产业,会逐渐朝着全大核方向发展,以往的大小核时代的市场格局或许会迎来改变。因为过去安卓手机阵营其中一个最大弱点,就是手机芯片性能比不上苹果。当未来安卓手机阵营的芯片获得巨大提升,在高端崛起的进程上,有了与苹果抗衡的基础。
在这基础下,当手机生态变得更丰富时,消费者自然是最终的受益者。可以预计未来消费者将可以享受到更好的手机服务,包括手机设备的效率提高,手机端的人工智能也将得到重大突破等,消费者既要又要的需求将会被满足。以至于,我们将不再需要对手机进行繁复的操作,单靠语音就能像科幻小说一样,进入科技世界之内。
而这一切的起点,可能就是从旗舰上砍掉这“小小小小”核开始。