华金证券:端侧AI蓄势待发,有望开启半导体新周期
21世纪经济报道记者王媛媛、孙燕 上海报道
从高通在骁龙芯片上推理stable diffusion模型,到华为推出基于手机算力的“智能搜图”功能,AI正持续向端侧靠近。
“端侧是AI模型应用不容忽视的重要场景。”6月20日,华金证券传媒首席分析师倪爽在华金证券AI产业2024全景论坛表示,越来越多的AI计算和推理工作负载在手机、笔记本电脑、XR头显、汽车和其他边缘终端上运行。
作为在终端设备上进行的轻型模型运用,端侧AI具有隐私和安全、低延时、可靠性、低成本等技术优势,但也面临着参数量小、功能相对有限等挑战。
“端侧AI趋势已定。”华金证券电子联席首席分析师王海维在论坛上表示,AI手机需要完成算力、带宽、内存等硬件升级以确保AI模型顺畅运行,一方面有望驱动新一轮换机周期,另一方面也有望带来半导体新周期。
端侧AI蓄势待发
今年以来,AI的一大焦点是落地手机端。从大模型、到操作系统、再到应用生态,各大厂商在AI层的竞争愈演愈烈,在大模型的基础上选择的路径也有所不同。
目前,三星、Vivo、华为等手机厂商已在端侧布局AI;苹果亦在WWDC2024宣布推出端侧Apple Intelligence,携手OpenAI接入GPT-4o,以多模态能力赋能复杂任务处理。
在此背后,轻量化模型的发展使得原本只能在云端运行的大型AI模型,如今可以在手机、PC等终端设备上高效运行,且保持了与云端相近的性能和精确度。
事实上,端侧AI不仅限于智能手机和PC,还逐渐渗透到AR眼镜、智能家居等领域。其火热,来源于终端的强需求。
倪爽指出,端侧应用的主要功能包括两类:一是内容生成,即借助浏览器AIGC插件总结文字、视频等内容,提升阅读效率等,并以标签形式提炼,助力工作提效;二是信息生成,即围绕工作场景,用户可借助AI生成所需的文本、图片等内容信息,也可生成办公文档等,提高效率。
在他看来,手机厂商先后入局端侧AI,有望双轮驱动长效赋能端侧“生产力”,加速AI应用落地。“2024年以后,更多AI产品逐步变现、AI能力下放至边缘侧与端侧之后的影响将更为明显。”
硬件待升级
从端侧看,消费者希望端侧大模型的响应速度可以达到几乎“实时” 效果。
一般而言,大模型拥有的参数越多、精度越高,实现的功能越强大。而在大模型裁剪技术以及终端算力制约下,端侧部署大模型参数量小,功能相对有限。
因而当前,芯片算力、内存容量、内存带宽构成了影响端侧AI性能的三大挑战。
王海维认为,为确保AI模型顺畅运行,AI手机需要进行高算力、高带宽、内存等硬件升级。而这一过程,有望驱动新一轮换机周期。“AI Intelligence换机周期更类似于4G到5G的换机周期。”
与此同时,端侧AI的渗透有望带来半导体新周期。王海维指出,当前半导体供应链整体库存逐渐恢复至常态,第三季度开始的传统旺季有望带来新一轮备货周期。
华金证券总裁助理、研究所所长、电子首席分析师孙远峰进一步表示,AI技术和应用创新,最终实现有时间关联度的“三维”处理能力。着眼硬科技产业链,产品层级将拉动底层先进技术的快速产品化;而更深层次的产业链升级,则是设计、制造、封测和设备材料等全产业链协同升级的过程。