搞AI,这些龙头和上市公司花了多少钱和人?
今年2月中旬,OpenAI发布了人工智能文生视频大模型Sora。从2月中旬到现在,可以说是人工智能领域动态发布最密集的一个时期:英伟达跃升全球市值第三大科技公司并在GTC大会上发布了令人瞩目的突破性成果,Groq、Cerebras发布了最新的AI芯片,谷歌、苹果等大厂和Anthropic、Mistral、Inflection等独角兽也在这个时间内发布了最新的大模型。
图片来源:NVIDIA GTC 2024 主题演讲,NVIDIA官网
无论是从AI芯片、AI“三算”,还是从AI模型看,似乎美国的这些进展都让人不得不感慨它相较于中国在人工智能领域的先发优势。AI产业链中游主要包括基于各类识别技术构建的软件产品、解决方案和技术平台,是产业链中创新价值、产业价值最高的环节,而其中的大模型板块,是最受大众关注和中美AI领域竞争的焦点。
2023年9月,钛媒体国际智库发布了产生一定行业影响力的《2023 AI大模型应用中美比较研究》报告。报告指出,中美在AI大模型方向领先其他各国,双方竞争在各方面各有优势,美国科技巨头长期投身基础理论研究,使美国得以引领全球人工智能发展,在基础大模型上能够保持领先优势。同时,大额投资也为美国研发工作提供了有力支撑。而中国由于人才、资本和技术的制约,更倾向于利用龙头企业的开源模型来做应用落地的创业。
不过,虽然国内大模型一直扮演着追随者的角色,但在基础模型方面,中美之间的差距并不大,国内“重应用轻基础”的研发理念以及庞大的下游需求,让国内机构更加专注于落地应用的研究,可以说在AI大模型应用方面更胜一筹。
当前,国内研发基础大模型的企业较少,仅有百度、华为、腾讯、阿里等,同时,有许多企业依托在各自行业的深耕,或外接基础模型,或利用开源模型自研模型,来研发应用于所处行业的AI大模型。
据不完全统计,国内已发布大模型近190个,涵盖盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,也包括“轩辕”金融大模型、“知海图AI”中文大模型、“言犀”产业大模型、WorkMagic Copilot、WPS AI等应用于垂直领域的行业大模型。
科技竞争最终比拼的是人才密度和行业积累,我们试着从AI大模型相关的比较突出的概念股入手,由研发数据管窥国内相关上市企业的竞争优势。目前,国内AI大模型上市公司生态包含百度生态、腾讯生态、华为生态、阿里生态、小米生态等,同时有三六零、昆仑万维等自研大模型公司。
总的来说,研发投入的巨大差异,不仅体现在基础大模型研发公司与垂直行业的应用层研发公司之间,也体现在应用层研发公司所属的不同行业和主营业务之间。例如,聚焦数字阅读和出版的中文在线、垂直于数字营销的浙文互联、更注重法院诉讼服务的金桥信息等,明显研发投入远小于绝大多数AI大模型应用层研发公司。
注:根据能够找到的最新数据,上表中百度、腾讯、华为、小米为2023年数据,阿里巴巴为2023财年数据,字节跳动为2022年数据。澜舟科技未上市,未能找到相关数据。
注:根据能够找到的最新数据,上表中百度、华为、小米为2023年数据,腾讯为2022年数据,阿里巴巴为2021年数据,字节跳动未披露相关数据。澜舟科技未上市,未能找到相关数据。
部分AI大模型应用层研发公司研发费用及人员数据(根据最新披露数据)
01百度生态
据财报数据,2023年全年,百度研发投入高达242亿元,同比增加4%,占全年营收比例约18%,主要由于支持生成式AI研发投入开支增加。百度在过去十年中,累计研发投入超过1000亿元,研发强度始终位于中国大型科技互联网公司前列。然而,由于百度这几年进行的本地生活、电商、游戏等业务探索的结果并不尽如人意,员工数量也在不断变化中,研发人员数量自2021年的27500人下降至2023年的21800人,减少了5700人。
百度对竞争趋势的判断是,短期的竞争围绕基础大模型展开,长期的竞争则会围绕AI原生应用展开。因此,百度在研发自有大模型的同时,成为了推动大模型加速进入应用侧速度最快的厂商之一。
百度直接持股【每日互动】【汉得信息】【中文在线】等公司,这些公司在百度文心一言大模型的基础上,研发了自己的AI大模型或AI产品。
1. 每日互动
每日互动是国内专业的数据智能服务商,2023年年底发布了公司在品牌营销领域的大模型应用创新成果——AITA智选人群工具。该产品将大模型的强大能力和公司的数智能力深度融合,实现了用AI定向TA(AI-Targeting Audience),能够通过简单的自然语言对话,快速为品牌广告主生成符合需求的目标投放人群。
据2023年三季度数据,每日互动研发投入1.1亿元,占营收的35.48%;2021年每日互动研发人员数量为459人,占员工人数的60.08%。
2. 中文在线
中文在线是中国数字出版的开创者之一,也是全球最大的中文数字出版机构之一。2023年10月,中文在线发布了AI大模型“中文逍遥”,首席技术官吴疆将它的技术优势总结为“三个一”:一键生成万字小说,一张图片写一部小说,和一次读懂一百万字小说。
2023年前三季度,中文在线的研发费用为6764万元,同比下降32%,占营收的6.67%。中文在线解释为合并范围变更所致。截至2022年底,中文在线共有研发人员189名,占员工人数的29.1%。
3. 汉得信息
汉得信息是业务流程管理软件供应商,打造了“汉得AIGC中台”,致力于帮助企业快速落地AI,提供多模型对接能力,内置智能对话应用、可自配置的多分类智能知识问答应用等,帮助企业高效自定义实现各种业务流程+AI能力。
虽然没有推出大模型,但在研发上,汉得信息的投入比较大,2023年三季度报告披露的研发费用达2.04亿元,占营收的9.06%;据2019年的数据,汉得研发人员数量为7918人,占员工人数的82.74%。
02腾讯生态
2023年9月,腾讯自研的混元大模型发布,通过腾讯云的API向国内企业正式开放。腾讯大模型支持广泛功能,包括图片生成、文案创作、文字辨识以及客户服务等。2023年6月,腾讯推出的模型即服务(MaaS)让企业可以训练自己独有的大模型,而混元让企业有能力打造出功能强大的工具。
自2018年至2023年六年期间,腾讯的累计研发投入超过了2696.54亿元人民币,2023年全年研发投入达到640.78亿元;2022年(没有2023年数据),腾讯员工超10万人,而研发人员占比达到了74%,这意味着平均每四个腾讯员工中,就有三个人从事研发工作。
腾讯概念股包括浙文互联、博思软件、泛微网络、常山北明、长亮科技等。
1. 浙文互联
浙文互联主营业务为数字营销,形成了以汽车广告和效果营销业务为主、积极拓展其他利润增长点的业务格局。在创新业务方面,浙文互联搭建了图片及场景等多模态的AIGC数字工具矩阵,完成了虚拟人、虚拟空间、虚拟物等元宇宙创新业务基建,推出AIGC绘画工具“米画”、元宇宙场景生成工具“数字战士”等工具应用。
2022年,浙文互联研发投入为5402万元;2023年前三季度研发投入2604万元,同比增长5.17%。至2022年底,研发人员191人,占员工总数的16.3%。
2. 博思软件
博思软件聚焦数字票证、智慧财政财务、数字采购三大领域,提供财政信息化管理及互联网相关软件产品及服务。
根据3月4日投资者平台官方回复,博思软件已经将AI赋能于AI+财税服务、AI+非税票据、AI+商保、AI+采购、AI+绩效,创新应用“数据+算法+AI”打造的“采购机器人”在国内人工智能价格监测领域处于行业领先。
2023年前三季度,博思软件研发费用为3.1亿元,同比增长42.41%,占营收的28.16%。截至2022年,员工总数逾6000人,其中70%以上为研发技术人员。
3. 泛微网络
泛微网络专注于协同管理软件领域,为客户提供数字化场景应用软件,如人事管理、知识管理和营销管理等。
泛微网络推出了智能小e中间件平台,利用泛微的千里聆模型与大语言模型分工合作,主要有AI问答、AI办公、AI工具等功能。去年10月,泛微网络还发布了e-builder低代码平台,客户能够通过拖拉拽组合,像积木一样搭建应用。
泛微产品生态体系
2023年,泛微网络研发投入3.54亿元,同比增长4.23%,占营收的14.8%。公司的研发人员由2017年的387人增长至2022年的1075人,占员工总数比例由40.27%增长至55.38%,但2023年研发人员数量下降,剩余880人,占员工总数的52.63%。
4. 常山北明
常山北明是智慧城市、平安城市的解决方案及运营服务提供商。腾讯持有常山北明全资子公司北明软件的股份,同时,北明软件与腾讯云签署了框架合作协议书,在云计算、大数据、人工智能等领域开展产品与技术的全方位合作,共同推动在线矛盾纠纷多元化解平台运营。北明软件还是华为鲲鹏生态的深度参与者及鲲鹏计算产业首批认证伙伴之一。
常山北明2023年前三季度研发投入为1.3亿元,同比减少3.69%,占营收的2.8%。2022年研发人员为2117人,同比减少12.41%,占员工总数的46.29%。
5. 长亮科技
长亮科技专注金融科技领域,提供咨询、金融科技产品、金融IT服务,以及覆盖数字金融、智慧金融、智慧财务等业务的全栈领先解决方案。截至23年三季度,腾讯为长亮科技第二大股东,占流通股比2.29%。
公司在核心系统上云方面与华为云、阿里云、腾讯云等均有合作,并已经在涉及金融科技行业的人工智能领域成立了相关的研究机构,开展了部分产品的研发与基础应用工作,如智能客服。
2023年前三季度,长亮科技在业绩承压之下仍旧加强了对于研发投入力度,报告期内公司的研发费用为1.1亿元,占营收的9.34%。但从历年数据上来看,2020年至2022年,长亮科技研发投入金额逐年下滑,分别为17984.17万元、14801.47万元和14779.74万元,在营业收入中的占比从11.60%下滑至7.83%。2022年,长亮科技的研发人员数量出现大幅变动,由2021年的977人下降至772人,变动比例达-20.98%,占员工总数的11.22%。长亮科技回复投资人称,其中,主要是学历为本科、30岁以下的研发人员减少的幅度较大。
03华为生态
华为长期致力于人工智能核心技术的研发,去年推出了盘古大模型3.0,坚持“AI for Industries”理念,将人工智能技术深度融合至各个行业。作为中国首个全栈自主、安全可靠的AI大模型,盘古大模型包括 “5+N+X”三层架构,采用完全的分层解耦设计,企业用户可以基于自己的业务需要选择适合的大模型开发、升级或精调,从而适配千行万业多变的需求。
根据公开数据,华为在2023年的研发投入达到了1615亿元人民币,研发费用率为25.1%。近十年来,华为累计投入的研发费用超过9773亿元。截至2023年底,华为有20.7万名员工,其中研发员工约11.4万名,约占员工总数的55%。
目前,盘古大模型已经在10多个行业得到应用,并与多家公司产品和业务深入绑定。
1. 拓维信息
拓维信息是软硬一体化产品及解决方案提供商,也是华为云首批同舟共济合作伙伴、华为“大模型+鲲鹏+昇腾AI+开源鸿蒙”全方位战略合作伙伴,
拓维信息推出垂直行业大模型——交通CV大模型,根据公司介绍,交通CV大模型在盘古大模型的基础上进行适配开发,使得模型精度提升了 6.21%,开发时间节约了24倍左右,大大降低了开发成本和难度,目前已在高速公路稽核等场景得到了正式应用。
2023年前三季度,拓维信息研发费用1.46亿元,同比增加36.45%,占营收的7.79%。根据年度数据,拓维信息研发费用率从2018年开始呈现出逐年下降的趋势,2018年为11%,到2023年,预计占总营收比例不足9%。2022年公司研发人员数量1122人,占总员工数的27.9%。
2. 神州数码
神州数码主营业务为云计算和数字化转型、信息技术应用创新、信息技术应用创新,深度绑定华为,基于“鲲鹏+昇腾”生态打造神州鲲泰产品体系。
神州数码推出了人工智能产品——“神州问学”平台产品,该产品不是一款大模型,而是大模型集成和运营平台,从模型、数据、算力、应用四个角度打通各项资源,协助企业投产和运营自己的大模型应用。
2019年至2023年,神州数码研发费用分别为1.46亿元、1.82亿元、2.40亿元、2.91亿元、3.44亿元,同比增长幅度分别为50.37%、24.92%、32.21%、21.15%、18.21%,近5年累计投入12.03亿元研发费用。截至2022年底,公司研发人员数量为791人,占员工总数的14.98%。
3. 赛意信息
赛意信息面向通信、电子、家电、家居等23个重点行业提供产品及解决方案,携手华为云联合创新,基于盘古大模型的自然语言大模型和视觉大模型,共建盘古制造行业大模型。
去年10月,赛意信息发布业界首个聚焦企业服务大模型的AIGC中台(善谋GPT),能够为企业提供多模型对接、向量管理、私有模型预训练与应用等能力,有多种应用场景,包括数字员工(智能引导)、智能单据(智能辅助)、企业知识库(智能问答)、AI自动报价(智能报价)等。
根据公开信息,2018-2022年,赛意信息研发投入稳步增加,2022年研发费用达到2.69亿,同比增长35.37%,研发费用率达11.84%;23年前三季度研发费用2.3亿,同比增长27.21%,占营收的13.67%。研发团队人员数量从2017年末的412人增加到2022年末的2927人,研发人员占比也突飞猛进,从2018年末的15.11%增加到2022年末的47.49%。
4. 超图软件
超图软件是聚焦地理信息软件与空间智能领域的基础软件与应用软件厂商,与华为合作十分紧密,公司GIS基础软件全面支持鲲鹏、openguass、欧拉、鸿蒙、昇腾及AI等方面的技术。
在2023地理信息软件技术大会上,超图正式发布SuperMapGIS系列产品的最新版本——SuperMapGIS2023,同时发布了多个产品,包括跨平台遥感影像处理桌面软件、跨平台电子海图生产桌面软件、Web端三维地理设计App、三维WebGPU客户端等。
超图软件近年来研发投入逐年提高,2020年、2021年、2022年的研发投入金额分别为2.53亿元、2.68亿元和3.12亿元,分别占营业收入比例15.7%、14.28%和19.53%;23年前三季度研发投入为1.72亿元,同比增长2.21%,占营收的13.53%。2022年,研发人员数量1568人,占员工总数的37.1%,同比增加21.55%。
04阿里生态
阿里巴巴聚焦于做好“AI时代的云”,为国内大模型提供AI算力底座。国内目前有超过一半的AI大模型公司跑在阿里云上。同时,为推动大模型在千行百业落地,阿里云发布了8大行业模型——通义听悟、通义晓蜜、通义智文、通义星辰、通义灵码、通义法睿、通义仁心、通义点金,让大模型在金融、医疗、法律、编程、个性化创作等行业和场景中更易被集成。
阿里新发布的千亿级参数规模的自研基础大模型通义千问2.0,性能明显提升,在10个权威测评中全面超越GPT-3.5和Llama2,加速追赶GPT-4。
2022年,阿里巴巴的技术相关成本费用超过了1200亿元人民币。这笔费用用于增强阿里云在中国云市场的领先地位,支撑消费者业务的先进技术需求,并推进对下一代技术的探索。近几年,阿里巴巴每年在技术和研发上的投入都超过人民币1000亿元。仅就研发费用而言,阿里巴巴2023财年(2022年二季度-2023年一季度)研发费用567.44亿元,占营收的7%。
截至2023年一季度,阿里巴巴拥有23.5万名员工。2021年7月,时任阿里云智能总裁、达摩院院长张建锋在钛媒体峰会,谈到阿里巴巴开发人员为5至6万人;按此计算,阿里巴巴研发人员占比约25%。
1. 卫宁健康
卫宁健康专注于医疗健康和卫生领域整体数字化解决方案与服务,与蚂蚁集团、阿里体系各公司已经开展了多项合作。
去年年底,卫宁健康发布了医疗垂直领域大模型WiNGPT,基于通用大模型的技术,结合高质量医疗数据,针对医疗场景优化和定制,为医疗行业各个场景提供智能知识服务。此外,卫宁健康还发布了基于WiNGPT的医护智能助手 WiNEX Copilot,以及迭代升级后的WiNEX 产品与解决方案。
卫宁健康2023年前三季度研发投入2.23亿元,同比增加5.18%,占营业收入的11.73%。2022年,公司研发人员2487人,同比增长9.9%,占员工总数的36.03%。
2. 金桥信息
金桥信息面向政务、司法、教育、医疗健康、金融等国计民生行业,为客户打造智慧空间信息化解决方案。金桥司法Saas业务目前全国3500家法院全覆盖,与蚂蚁集团已在执行、诉讼服务和智能庭审三大业务方向上拥有人工智能的行业解决方案。
金桥信息2023年3月在互动平台表示,公司专注于政法行业的数字化转型,积极布局智慧法院尤其是人工智能方向的创新应用,目前主要是基于主流的大模型结合OCR、NLP、知识图谱、语义分析、机器学习等人工智能技术,为法院的数字化改革提供具有开创性、引领性的整体解决方案。
2023年前三季度,金桥信息研发费用2464万,同比减少1.31%,占营收的4.15%;2022年全年研发费用3990万,同比增加14.26%。根据2022年年报数据,金桥信息研发人员数量273人,占员工总数的35.18%。
3. 恒生电子
恒生电子聚焦金融行业,为证券、基金、银行等客户提供金融科技解决方案。恒生电子已与阿里通义千问大模型在财富管理领域进行深度合作,双方未来将在包括智能问答、智能外呼、智能助手等业务应用场景进行合作测试,将通义千问强大的自然语言理解和生成能力与恒生电子财富管理域的数据、场景、服务相结合,助力客户服务体验提升。
恒生电子自2014年正式启动AI研究工作,目前已发布20多款人工智能产品,打造了NLP、OCR、CV、知识图谱等能力,同时将AI技术能力赋能到智能客服、智能投研、智能运营、智能营销、智能投顾以及数据与风险相关的业务系统。
2023年,恒生电子研发费用为26.61亿元,同比增长13.42%,占营收的36.55%;研发人员7,191人,占员工总数的54.52%。
05澜舟科技
澜舟科技成立于2021年6月,是国内最早一批下场进行大模型创业的团队。去年3月,澜舟发布了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。
近期,澜舟团队完成了Mengzi3-13B的大模型训练,并公布了自己的“一横N纵”体系。“一横”是模型层,是孟子大模型技术基础上研发的各个模型;“N纵”则是基于孟子大模型的面向ToB应用最重要的技术和产品。目前,澜舟科技重点投入到了金融行业,辅助编程等领域,旨在通过更加全面、专业、优质的领域数据,打造更加贴近行业场景的垂直大模型。
澜舟科技尚未公布具体的研发费用数据,然而,从2021年成立以来,澜舟科技一直致力于预训练模型的研发与应用,并且在不到一年的时间里完成了数亿元人民币的融资,这些融资主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。由于澜舟科技与上市公司云从科技、创新奇智达成战略合作,市场上经常将云从科技、创新奇智归为澜舟科技孟子大模型相关概念股,不过,这两家公司也同时拥有自研的通用或行业大模型。
1. 云从科技
云从科技孵化于中国科学院,围绕AIGC、智慧金融、智慧治理、智慧出行及智慧商业等四大业务领域,是首家在科创板上市的人工智能平台企业。伴随着AI大模型时代来临,云从科技依托自主的预训练大模型和在预训练层调优模型的能力,于去年5月正式推出自研多模态大模型——“从容大模型”,成为“百模大战”中的一员。
从容大模型包含但不限于语言大模型、视觉大模型、语音大模型、代码生成大模型以及图像生成大模型等,它通过实时学习并同步反馈结果,可以解决诸多AI应用的痛点,从而有利于快速普及个性化应用。上个月,云从科技还发布了3D行为识别基础大模型。
云从科技和澜舟科技已经在文档自动化分析和理解领域开展联合开发,针对银行、保险等金融行业、房地产等行业的应用场景,通过OCR和多模态的NLP技术,对合同、文书等类型的文档进行自动化的分析和理解,旨在提高相应领域的自动化程度,帮助传统行业进行数字化转型,提高生产力和企业运行效率。
2019年至2021年,云从科技研发费为4.54亿元、5.78亿元、5.34亿元,同比增速206.47%、27.29%、-7.60%,占当期总营收比56.25%、76.59%、49.67%;23年前三季度,云从科技的研发费用为3.15亿元,虽然同比下降了26.74%,但营收占比高达91%。
历史数据显示,云从科技研发人员在逐年减少,2020年至2022年云从科技研发人员分别为997名、575名、552名;2023年上半年,研发人员522名,较2022年同期减少87名,但占员工总数比例升至60.42%。
2. 创新奇智
创新奇智是国内最早一批投入工业制造数智化转型的人工智能创新企业,不断探索用前沿AI技术解决工业生产难题。依托在AI制造业的多年积累,在对开源免费大模型进行知识蒸馏的基础上,创新奇智设计了适合工业场景的大模型神经网络结构,推出了面向工业制造领域的百亿参数量级行业大模型“奇智孔明AInnoGC工业大模型”。
上个月,创新奇智发布了升级后的奇智孔明工业大模型2.0版本(AInno-75B)及多款大模型原生应用。本次升级后的奇智孔明工业大模型在参数量级上实现了新突破,达到750亿以上,同时增强了海量知识管理、复杂逻辑推理、长流程任务编排、Agent智能体以及更多工业模态的生成能力。
去年3月,澜舟科技与创新奇智携手,发挥各自在计算机视觉、机器学习和自然语言处理技术领域的优势,构建完整AI2.0技术版图,共同探索类ChatGpt、AIGC等前沿技术在制造和金融等领域的技术创新并进行商业化落地尝试。
2023年,创新奇智的研发投入为4.5亿元,同比下降8.17%,占营收的25.7%;2022年,其研发投入同比增长27%至4.16亿元,研发费用率由2021年的38.1%降至26.7%。截至2021年底,公司共拥有259名技术人员,占公司员工数量的56.7%。
06字节跳动生态
与其他国内自研大模型相比,字节跳动的大语言模型云雀大模型有些姗姗来迟,在2023年8月首发。这是一个基于字节跳动机器学习平台开发的自然语言内容生成和内容理解的AI大模型。今年4月,云雀大模型将发布重要版本的升级更新。
与国内外大模型公司“先通用大模型,后产品应用”的思路不同,素有“应用工厂”之称的字节跳动选择在云雀大模型的基础上,打造十几款AI原生应用,包括AI对话产品“豆包”、AI应用平台“扣子”、AI角色互动产品“小悟空”等,目前主要应用于字节跳动旗下产品中。
据界面报道,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。
字节跳动在2022年的研发支出为87亿美元(约629亿人民币),这一数字低于2021年的146亿美元(约1039亿人民币),占2022年营收的10.21%。目前,字节跳动的员工已超10万人,研发人员数量暂未披露。
截至去年9月,字节跳动持有掌阅科技股份比例为7.29%。前不久,掌阅宣布正式接入市场上的主流AI大模型,将其运用于内容生成的Prompt Engineering工作,进一步提高了内容创作的效率和质量。目前,相关产品仍处于小范围用户测试阶段,推广时间尚不确定。
2023年前三季度,掌阅科技研发费用1.78亿,同比增加17.9%,占营收的9.07%;2022年全年研发费用为2.19亿,同比增加28.6%。据2022年数据,公司研发人员293人,占员工人数的35%。
07小米生态
2023年4月,由小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌牵头负责,小米技术委员会AI实验室大模型团队负责人栾剑带队,在小米内部正式成立了一支自研大模型团队。2023年8月,雷军在年度演讲中透露,小米大模型的主力方向是轻量化和本地部署,让大模型在手机端就可以应用落地。在团队成立到年度演讲的四个月中,小米大模型团队迭代了13亿参数和60亿参数两代产品,截至2023年8月14日,小米60亿参数的自研大模型在C-EVAL权威榜单上取得同参数量级排名第一,在CMMLU中文向大模型取得排名第一。
不同于百度的文心一言、科大讯飞星火等通用大模型,小米自研大模型更强调跟产品的结合和场景的驱动,更多地考虑大模型和小米应用场景的结合,当前主要应用于小米手机、小米汽车、小米智能家居等公司内部业务场景。“人车家全生态”是小米全新升级的未来战略,小米希望通过大模型这样的基础设施,支撑未来智能生活场景服务。
其实在2016年AlphaGo发布后,小米就开始大力投入AI视觉领域,后来逐渐拓展到其他领域。小米有3000多人在做AI相关的研发工作,在视觉、声学语音、NLP、知识图谱、机器学习等方向都有技术积累。目前,小米正在和芯片公司合作,共同推动端侧大模型的落地。
同时,小米也与金山办公密切合作。去年10月,WPS AI在小米14系列手机新品发布会上亮相,展示了WPS 的“随手拍”和“一键生成PPT”两项AI 功能。小米与WPS邀请用户申请体验移动智能办公,小米14系列手机用户可通过小米社区下载搭载WPS AI功能的专属版WPS。
2023年,小米研发费用191亿元,同比增长19.2% ,占营收的7.05%;研发人员总计达17800人,涉及多个部门,占员工总数的52.93%。
从大模型技术外输上看,此前有消息称,小米AI大模型的“AI+智能家居”将在趣睡科技实现首个商用落地。小米旗下的顺为科技,是趣睡科技的第二大股东,截至2024年2月8日,持有趣睡科技7.65%的股权。2024年1月,小米与趣睡科技聚焦床上用品品类达成战略合作协议。
然而,主打坚持“科技提高体验”产品观念的趣睡科技,却一直因科技含量低饱受诟病。2022年,公司研发人员仅42人,占员工总数的28.38%,研发人员数量较少、整体学历不高、流动性大。从研发费用来看,趣睡科技与同行相比也是垫底。2021年、2022年及2023年前三季度,趣睡科技研发费用分别为804.4万元、683.61万元及478.57万元,分别同比减少30.83%、15.02%及6.46%,研发投入占营业收入比例分别为1.7%、2.12%及2.44%。
08自研大模型1. 昆仑万维昆仑万维是集精品自研游戏研发、全球精品游戏发行商、平台和软件商店三者为一体的综合性互联网平台公司,与奇点智源合作自研“天工”大模型。
“天工”具备强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景。基于“天工”,昆仑万维已构建起AI大模型、AI搜索、AI音乐、AI Story、AI游戏等AI业务矩阵。
为全面落实公司“All in”AGI与AIGC的战略布局,昆仑万维2023年前三季度研发费用提升至6.2亿元,创上市以来同期新高,占营收的16.85%;2022年,研发投入金额为7.36亿元,较2021年的6.8亿元增长约17.2%。昆仑万维的研发人员2022年数量为1266人,占员工总数的72.55%。
2. 三六零
作为国内唯一兼具数字安全和人工智能双重能力的企业,三六零基于近二十年在安全和AI领域的技术积累,总结出新一代安全大模型核心战法,3月20日正式推出360安全大模型3.0。
三六零称,基于类脑分区协同设计的安全大模型框架,三六零安全大模型3.0不仅可以解决任务冲突问题,达到多任务最优性能,而且实现了能力突破,在多个专业任务效果上超过了GPT4。
2023年前三季度,三六零研发费用为23.14亿元,同比下滑8.25%,占营收的34.34%,继续保持研发投入高占比。截至2022年底,公司研发人员数量为3602人,占员工人数的55.58%。
3. 科大讯飞
科大讯飞作为国内知名的智能语音技术提供商,发布了“星火认知大模型”,对标ChatGPT,具备跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。科大讯飞布局“1+N”战略体系,“1”是通用认知智能大模型,“N”则是应用于教育、办公、汽车、数字员工、医疗等多个行业的应用成果。
2023年前三季度,科大讯飞研发费用为24.98亿元,较去年同期增长超过1亿元,占营收的19.8%;22年全年研发费用31.11亿元,同比增长9.95%。2022年,研发人员9,281人,同比增长10.92%,在整体员工中的占比提升至61.68%。
4. 金山办公
2023年初,金山办公宣布All in AI,将LLM能力全面引入产品,发布基于大语言模型的智能办公助手WPS AI。2023年9月,在每年一度的技术开放日上,金山办公首次对外展示了自研模型的最新进展。该模型基于开源底座,进行参数量为7B、13B的小模型训练调优,以满足应用端的细分化场景需求。
据金山办公高级副总裁毕晓存介绍,在与国产大模型平台合作的过程中,由于各家API(应用程序编程接口)不同,金山办公做了一个统一的接入层,去调用不同的大模型,而基于大模型的介入成本考虑,小众场景则需要金山办公的自研模型补充满足需求。
目前金山办公合作的通用大模型平台包括MiniMax、百度文心一言、智谱AI,基于大语言模型的智能办公助手WPS AI已接入金山办公全线产品,辅助WPS实现覆盖文档、PPT、表格等形式的内容生成能力。
2024年3月底,金山办公联合华科大推出文字多模态大模型TextMonkey,在多项文档理解任务上取得国际领先,向通用文字识别迈出坚实的一步。金山办公CEO章庆元曾表示,未来金山办公一定会解决大模型自主可控的问题。未来金山办公是否会推出全自研的大模型,值得我们期待。
2023年,金山办公研发费用14.72亿元,同比增长14.72%,占营收的32.3%;研发人员3087人,占总员工数比例约68%。
09总结
技术创新高度依赖研发投入。根据上文中的数据,我们可以发现,在AI大模型行业,相关上市公司的研发投入有巨大差异,季度研发费用支出从百万级至破数百亿,研发人员数量从数百至上万,这与公司规模、市场定位、模型特点、业务需求以及企业战略规划等多种因素有关。纵观AI大模型相关上市企业,基础大模型研发企业、尤其是多模态企业研发投入巨量,而站在基础大模型肩膀上研发应用端大模型的企业,研发投入相比之下有断层式的距离。不同行业的AI应用层企业,也因主营业务的不同,研发投入大相径庭。
放眼全球范围,从研发支出总额看,国内企业和国际相比,不仅差距仍大且还在拉开差距。例如,亚马逊在2021年的研发支出为560亿美元,而华为、阿里、腾讯、百度、中兴、美团、京东、快手、本站、小米10家企业2021年研发支出总和为575亿美元,仅比亚马逊高15亿美元。
在经济波动的逆流中,稳定而有效地平衡研发投资及其成果产出,是各个企业确保在未来经济周期中保持竞争优势、追赶国际先进水平的关键策略。