AI下一个风口在千行百业,私有部署普惠算力成热点

(原标题:AI下一个风口在千行百业,私有部署普惠算力成热点)

人工智能无疑是当今资本市场关注热度最高的赛道。从英伟达(NVDA.US)、谷歌(GOOG.US)、博通(AVGO.US),到商汤(00020.HK)、百度(09888.HK)、科大讯飞(002230.SZ),今年以来股价连创新高的背后,都离不开AI带来的无上限增长预期。

然而在业务端,随着“百模大战”尘埃落定,即便是在市场供需两旺的强力推动下,由高门槛大模型主导的AI上半场似乎已经见顶。AI的下一个风口将转向何方? AI下半场,谁又会成为真正的“头号玩家”?

就算跑车买得起,皮卡更有性价比

即便在“百模大战”猛卷降价潮的今天,对于企业、研究机构、千千万万的AI个人用户来说,门槛焦虑依然普遍存在:大模型浪潮B端用户应该怎么跟?哪些业务环节可以接入、如何提升?最关键的是,对普通的算力需求而言,动辄百万级投入还难采购的GPU资源实在过于昂贵。

正如无论跑车买不买得起,有时皮卡更有性价比一样,大模型的高高在上,反而推动参数更少、应用更好的小模型一路狂奔,成为AI大厂的新战场。2024至今,从国外的微软、谷歌、Meata、OpenAI,到国内的猎豹、面壁智能,10余家科技巨头纷纷布局小模型,瞄准企业私有化落地场景发力。

可以看到,AI生态正朝着大小模型分化共生的方向变化:大模型将继续在精尖领域中发挥高端价值,小模型则将在成本敏感、对快速响应有刚需的场景中大放异彩。

OpenAI 创始成员 Andrej Karpathy近日也向投资人坦承:小模型未来会有巨大潜力,“尤其是考虑到它可以部署在边缘设备上,而不是依赖云计算,这很激动人心。”

AI应用改变生活,更在重塑产业生态

使用AI视频翻译软件,玩转内容创作和业务出海;将一摞文档交给AI助手,即可秒级检索出特定答案;以前人工绘制一周的美工作品,AI绘画在几分钟内就能完成……“小模型+AI应用”正在开启一个新时代,作为AI“三驾马车”之一的算力,也在市场需求进化的同时迎来生态的重塑。

“AI正在从云端向终端逐步演化,泛行业、小场景、长尾用户必将占据主流,反过来推动智能算力向普惠化、低门槛的方式发展,未来智能算力一定会成为像水和电一样低价便捷、随取随用的基础设施。”东方材料(603110.SH)董事长许广彬说,该公司依托全资子公司东方超算,长期为中国移动、商汤等头部客户提供一体化智算服务。

东方超算刚刚发布了一款低门槛、高性价比的普惠型智算产品——CalcDone E800智算一体机,专门面向中小微型B端用户,依托全球领先的虚拟化技术,全栈交付5.2PFlops(FP16)智能算力,在算力规模、性价比、性能、扩容性、运维便捷度等多方面极具竞争力。

据介绍,AI应用部署到一体机终端后,不仅减少了对网络带宽的需求和数据传输成本,更可实现更快的响应速度,私有化部署也保障了数据隐私与安全,全面满足教育、医疗、制造等行业用户(尤其是中小微B端用户)对智算设施的需求。

IDC报告显示,2023年中国智算服务市场体规模达194.2亿元,同比增长72.5%。在小模型+AI应用跑出商业化加速度的新大陆面前,高举高打的旧地图已经失效,供需两端都必须依靠新的战略眼光和工具去解题——

从前行者的经验看,用普惠算力破解成本焦虑已成最优解,率先抢占数量庞大的中小微用户就等于预订了未来市场头部坐席的入场券。在AI技术作为牵引力、算力基石作为推动力的双重作用下,可以断言,AI下半场仍旧“速”不可挡。