国泰君安:LLM驱动的多模态人机交互方式引领新一轮生产力革命
智通财经APP获悉,国泰君安证券发布研究报告称,LLM驱动的多模态人机交互方式引领新一轮生产力革命。Agent或改变端侧操作系统的生态,重塑商业模式。苹果将受益于APPLE Intelligence支持的Siri带来的新生态,软件收入逻辑或迎来颠覆。谷歌将受益于Agent重塑人机交互模式后带来的搜索调用量增长,以及交互闭环中谷歌应用全家桶的流量增长。微软Copilot依托于Windows系统及Office套件,变现进度较快。
人机交互方式的变革,显著降低AI应用门槛,可能带来新一轮生产力革命。由LLM驱动的多模态交互方式,大幅提升了自然语言理解能力,加入视觉感知能力,是对人机交互方式的又一次颠覆。国泰君安证券认为,AI应用门槛将随着人机交互方式的简化而降低,从而引领新一轮生产力革命。
AI Agent是交互的载体和入口,Agent将集成、统一各类APP的入口,成为操作系统级别的“超级APP”。以Siri为代表的人机交互能力变革,将改变操作系统的生态,搜索及调用的流量入口从各应用程序回归到硬件端。Siri的屏幕感知、跨应用操作、行为智能能力,使其具备超级入口的潜质,未来Agent将成为操作系统的主导,而应用的形态和功能将被弱化乃至取代。1)安卓:谷歌推出Project Astra,具备Agent潜力。2)iOS:用Apple Intelligence重做系统,Siri成为人机交互的入口。推出iOS 18.1开发者测试版,Apple Intelligence开始落地。自研端侧模型+云侧模型,模型表现追平头部模型。3)Windows:Copilot+PC已率先落地PC端并开启变现。
人机交互变革带来新商业模式。1)苹果:Agent(Siri)带来新生态,苹果软件收入逻辑或迎来颠覆。Apple Intelligence的开放的API接口将吸引开发者加入,丰富苹果生态,提升苹果税收入;Apple Intelligence支持的原生应用可收取订阅费用;可向第三方应用收费,以提升Siri的调用量;云端模型可向用户收取调用费用。2)谷歌:Astra有望充分释放谷歌全家桶的潜力,复刻“Google Intelligence”。多模态输入、自然语言交互将大大降低软件应用门槛,谷歌应用全家桶的用户数有望突破性增长。相较于AI搜索,谷歌的优势在于具备流量入口(AI助手Project Astra)及全方位的应用生态,多模态交互式搜索将在谷歌生态圈内闭环完成。对于投资者担忧的AI搜索的冲击,我们认为因大模型幻觉导致的结果不可靠、用户粘性不强、成本高且变现率较低、无法建立用户反馈的循环机制等问题,AI搜索短期内仍难以撼动传统搜索引擎。3)微软:Copilot赋能Office,已率先实现变现落地。