解析商汤2024中期财报:被忽略的端侧AI 2B商业化,已服务多家知名手机和汽车品牌

本文来源:时代周报 作者:雨辰

近日,商汤(0020.HK)披露了2024年上半年业绩。报告期内,商汤实现营收17.4亿元人民币,同比增长21%,较去年同期,亏损减少21%。从三大业务来看,2024年上半年,商汤生成式AI业务实现收入近11亿元,同比增长256%,占集团总收入的60%,成为商汤的主导性业务。“绝影”智能汽车业务收入为人民币1.7亿元,同比增长100%;传统AI业务再次主动收缩压缩至集团整体收入占比至10%。

“三大业务的变化体现了我们发展策略的调整。”商汤集团董事长兼CEO徐立表示,生成式AI迎来黄金发展时期,商汤全面向生成式AI转型升级的战略目标已阶段性达成。

2023年被誉为“大模型元年”,而随着2024年的到来,大模型如何“落地”已成为推动整个产业链转型的关键。当下,各行各业均在加速探索如何利用大模型赋能自身产业发展。而面对这一趋势,作为全球领先的人工智能软件企业,商汤科技早年间布局现阶段开始收获商业化果实,保持了以互联网企业客户的领先优势,并站稳了机器人、新电动汽车、医疗、金融等新兴行业。

财报背后,我们发现商汤在端侧的成绩,斐然。

大模型厂商抢夺 “端侧”蓝海,商汤守擂优势凸显

作为抢占未来流量入口的关键,端侧AI俨然成为各大厂商争夺焦点。而端侧设备,以智能手机和智能汽车为代表,已经成为AI技术的重要应用阵地。

《2024年中国端侧大模型行业研究》报告指出,生成式AI市场的蓬勃兴起,正驱使大模型厂商积极探索端侧应用的新蓝海,以此作为增长的新引擎。端侧大模型通过在设备本地运行,有效降低了数据传输延迟,增强了隐私保护,拓宽了AI应用场景的广度与深度。

“与此同时,下游市场需求的强劲增长,特别是手机与自动驾驶行业的蓬勃发展,正强力拉动端侧大模型市场的扩张,2023年中国端侧大模型市场规模达 8亿元,预计2024年中国端侧大模型市场将达到21亿元。 ”上述报告表示。

近年来手机厂商们纷纷推出主打AI功能的手机,旨在通过AI拍照、智能交互、个性化推荐等功能提升用户体验。而汽车厂商则更加关注自动驾驶技术的实现,以及如何通过AI技术提升驾驶安全性、舒适性和智能化水平。通过商汤今年来财报发现,商汤分别在手机、汽车两项核心端侧领域,已形成稳固壁垒,处于守擂成功有利位置。

商汤在端侧AI积累了大量商业市场经验,并具备扎实的AI 2B能力。回溯发展历史我们发现,商汤一直在端侧“自卷”。早在2015年起商汤已和几乎所有全球主流安卓手机厂商,车企和APP厂商合作,是中国最早布局端侧的AI企业之一。商汤针对不同端侧设备的特点,持续进行端侧模型系列扩充,如7B、1.8B,并追求终端小模型性能与大模型媲美,推动边端运行——这是目前行业中鲜少完成在端侧商业落地应用完整布局的AI企业。

为何如此下重投入在端侧?“大模型的主要应用场景将集中在端侧”,这是商汤早于2023年的回答。2024上半年财报数据显示,报告期内,商汤“日日新”整体调用量实现了400%的增长,客户数和客户平均调用规模均大幅增长。

在汽车端,智慧汽车业务“绝影”依然保持稳健快速增长速度。2024年上半年财报显示,该业务实现了1.68亿元的收入,同比增长100%,累 计 交 付 车 辆 数 达 到 260 万 辆、覆 盖 104 个 车 型。上 半 年 新 增 定 点 车 型 15 个,新 增 定 点 车 辆 数 约 600 万 辆,其 中 包 括 福 士 华 根、凌 志 等 海 外 品 牌 的 定 点。此 外,绝 影 还 参 与 到 多 家 中 国 车 企 的 出 海 项 目 中,绝 影 的 全 球 影 响 力 日 益 凸 显。整体汽车端侧覆盖量依旧处于高速增长态势。

在前不久召开的WAIC 2024商汤人工智能论坛上,商汤“绝影”宣布在行业率先实现原生多模态大模型的车端部署,并现场演示了搭载在200 TOPS+平台上的8B模型(即80亿参数)车端部署方案。这一成果展示了商汤在多模态感知和交互能力上的强大实力,也为智能汽车的发展提供了新的可能性。相较于传统的云上部署方案,商汤“绝影”的车载端侧8B多模态模型在延迟和推理速度上均表现出色,能够满足智能汽车对于实时性和准确性的高要求。

在手机端,商汤的端侧小模型已经服务了小米、荣耀等主流安卓手机厂商客户。其推出的端侧小模型“日日新5.5lite”在推理速度和模型性能方面保持领先,其推理速度可达到每秒100字,延迟降至仅几十毫秒。与此同时,通过端云协同的推理架构,推理成本得以显著降低。据了解,接入商汤“日日新•商量”端侧大模型后,单台设备的成本可降至9.9元/年。

徐立指出,借助端云协同的新推理架构,成本降低也有助于大模型覆盖到更多IoT设备,不仅是高端手机,还可以应用于中端、低端手机,电视、音箱等设备,实现智能交互功能。

端侧两大技术根基——多模态能力、推理能力

值得注意的是,在AI的竞技场上,商汤科技之所以能在生成式人工智能的初期爆发阶段占据领先地位,这与其在端侧——“多模态能力”和“推理能力”的技术优势密不可分。

与文字输入相比,语音和视频等多模态输入方式提供了一种更为自然的交互体验。2024年7月,商汤推出了“日日新”大模型的5.5版本。相较于5.0版本,其综合能力提升了大约30%,并且在多模态能力方面得到了全面增强,可对标GPT-4o的实时交互体验,成为中国第一个多模态的实时交互大模型。

在过去,众多模型在处理不同模态信息时,通常会先将语音等输入转换为文字,然后将文字与图像结合起来进行分析。输出反馈的过程也是先生成文字,再根据这些文字生成语音输出,这一过程中伴随着大量信息的丢失和较高的延迟。

相比之下,多模态大模型能够高效且深入地融合语音、文字、图像、手势、视频等多种模态信息,从而提供更为丰富和自然的人机交互体验。与此同时,相较于以往的方案,多模态融合技术的难度也实现了几何级数的增长。

今年4月,商汤科技在上海发布行业领先的“云、端、边”全栈大模型产品矩阵,并与小米、阅文、华为等多位生态伙伴共同探讨和交流大模型在办公、金融、出行等不同领域的应用及前景,加速生成式AI向产业落地的全面跃迁。在两个月后的WAIC 2024期间,商汤科技再次发布国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,可实现实时的流式多模态交互。

在历次的发布会上,商汤科技一直强调其对端侧推理效率提升的重视。也正是得益于中国市场上对大型模型和智能计算服务的强劲需求,以及“日日新SenseNova”大型模型能力的增强和推理成本的迅速降低,商汤的生成式人工智能业务在2024年上半年实现了显著的增长。

在应用层面,商汤“日日新”端侧模型已深入各个行业,与超过150+客户启动商业对接,覆盖智能手机、平板电脑、VR一体机、车载电脑、智能台灯等诸多IoT设备部署应用。报告期内,已有3000多家行业头部企业使用商汤的大模型及智算服务。

随着端侧大模型技术的不断进步,未来中国端侧大模型行业的竞争格局将展现出技术深度整合与创新驱动的新趋势。在生成式人工智能的关键发展时期,商汤科技凭借其在端侧大模型领域的深厚底蕴和创新能力,未来有望进一步增强其企业价值,成为人工智能领域的领头羊。