21 深度丨量化巨头幻方搅局AI大模型:首期投入自有资金30亿元

21世纪经济报道记者李域 深圳报道

量化私募巨头幻方成为了AI大模型市场中的“鲶鱼”。

7月4日,AI公司深度求索(DeepSeek)发文称,DeepSeek API已经上线128K上下文长度,价格保持不变,还在大家熟悉的,即“每百万tokens输入1元、输出2元”。

两个月之前,在5月6日,DeepSeek发布DeepSeek-V2,其API的定价为,每百万tokens输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。

价格战的第一张多米诺骨牌倒下后,字节、阿里、科大讯飞、腾讯等纷纷跟进,宣布了降价策略。国内大模型厂商,迎来对B端和C端的全面降价甚至免费。

公开资料显示,深度求索成立于2023年7月,由知名量化资管巨头幻方创立,其推出的DeepSeek-V2在众多开源模型中将价格“卷”到了业内最低,被AI圈称作“价格屠夫”。

在量化交易备受争议的当下,幻方量化发力探索 AGI(人工通用智能),令市场不禁疑惑,公司是否是因市场变化,缩减资管业务,进行战略调整?

“幻方还是那个幻方,DeepSeek是DeepSeek。”7月17日,幻方量化的创始合伙人徐进对21世纪经济报道记者表示,量化交易是幻方过去以及以后的核心业务。

据悉,依托幻方的资金、技术和硬件设备,深度求索第一期研发投入为幻方自主出资30亿元,同时有 “萤火超算”万卡级别的算力支持。

AI圈 “价格屠夫”

AI大模型价格战打响。5月初,DeepSeek宣布开源第二代MoE大模型DeepSeek-V2。DeepSeek-V2没有沿用主流的“类LLaMA的Dense结构”和“类Mistral的Sparse结构”,而是对模型框架进行了全方位的创新,提出MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步将计算量降低到极致,两者结合最终实现模型性能跨级别的提升。

据介绍,该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的仅百分之一。

其API的定价为,每百万tokens输入1元、输出2元(32K上下文)。作为对比,GPT-4 Turbo每百万tokens的输入、输出价格,分别为72元、217元。

此后,智谱AI、火山引擎、阿里云、百度、腾讯等都宣布了降价策略。

智谱AI最先出招,2024年5月11日,智谱AI宣布入门级大模型GLM-3-Turbo(上下文长度128k)的价格从0.005元/千tokens降低到0.001元/千tokens,降幅高达80%。

字节跳动也加入战局。5月15日,字节跳动在火山引擎原动力大会上宣布,豆包主力模型(小于等于32K)在企业市场的定价为0.0008元/千Tokens,号称比行业价格便宜99.3%。128k的豆包通用模型定价为0.005元/千Tokens,号称比行业价格低95.8%。

据了解,市场对字节跳动的这一降价策略反应热烈,中小企业和个人开发者纷纷涌入。

5月21日,阿里云的通义千问大模型加入了这场降价风暴,宣布其GPT-4级主力模型Qwen-Long的API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。

面对各方的出击,百度则直接祭出大招。5月21日,百度宣布,文心大模型两大主力模型ERNIE Speed和ERNIE Lite全面免费,立即生效。

德邦证券分析师陈涵泊表示,在应用开发阶段,模型的使用成本是开发者和企业的重要考量因素,价格的降低有利于吸引更多的开发者和企业的入局,或加速AIGC应用的开发节奏与商业化成型;在应用推广阶段,价格走低将大幅降低应用的推理成本与用户的使用门槛,促使AIGC应用规模化推广与普惠化落地。

银河证券分析师吴砚靖也持有相同观点,在她看来,大模型圈价格战进入白热化阶段,推理成本的下降将持续推动AI应用加速落地。

AGI探索之路

深度求索引发关注的同时,市场将目光投向背后的量化巨头幻方量化。创立于2015年的幻方量化,是借助AI等技术手段进行投资的对冲基金,当前管理规模逾100亿。幻方旗下的浙江九章资产管理有限公司和宁波幻方量化投资管理合伙企业(有限合伙)均是在基金业协会备案的证券类私募机构。

据记者了解,国内第一批晋升百亿规模的量化私募机构中,有多名有着华尔街巨头千禧年基金任职背景的管理人,包括九坤投资的王琛、明汯投资的裘慧明等。

深圳百亿量化私募诚奇资产的创始人何文奇,也曾任职于这家华尔街巨头机构。

而幻方量化是为数不多的量化“本土派”的代表,创始合伙人之一徐进是浙江大学信号与信息处理博士,曾任职于华为技术有限公司上海研究所,现任宁波幻方量化投资管理合伙企业(有限合伙)执行事务合伙人、浙江九章资产管理有限公司法定代表人,目前两家幻方量化实际控制人均为梁文锋。

2019年,私募的量化策略产品发行火热,引发市场关注,幻方也同时出现在佳力图等20余家上市公司的十大流通股东名单中,这段时期还一度出现产品备案速度抵不过客户打款速度的现象,此时,幻方量化已晋升百亿量化私募之列。

同年,致力于 AI 的算法与基础应用研究幻方 AI(幻方人工智能基础研究有限公司)注册成立。AI 软硬件研发团队自研幻方“萤火一号”AI 集群。

2020年开始,幻方累计投资超亿元、占地面积相当于一个篮球场的AI超级计算机“萤火一号”正式投入运作,号称可以匹敌4万台个人电脑的超级算力。

此后,“萤火二号”的投入增加到10亿元,算力约为“萤火一号”的18倍,搭载了约1万张英伟达A100显卡。

按此前媒体报道,目前持有量超过1万枚GPU的中国企业不超过5家,即使规模最大的企业也不超万枚。

在AI超级计算机的加持之下,幻方管理规模持续上升,曾一度突破千亿大关。

有论文称,ChatGPT能有效判断文本情感倾向,且经过微调后的大语言模型能有效助力量化投资, 为投资者带来超额收益。

“未来AI 大模型可以助力量化投资,但是现在还用不上。”上海某头部量化人士指出,主要还是数据不够,特别是高质量的数据不够,“数据量不够模型还非常复杂,可能导致高方差或过拟合”。

幻方量化多位人士也在不同场合重申,AGI不是用来炒股的,有着更多的用处和价值。幻方量化创始人梁文锋也曾在接受媒体采访时表示,公司不会过早地设计基于模型的一些应用,而是会专注在大模型上。幻方的目标是探索 AGI,语言大模型可能是通往AGI的必经之路,并且初步具备了AGI的特征,所以会从大模型开始。

量化交易是核心业务

即便跨界到了AI,量化交易依旧是幻方过去以及以后的核心业务。

私募排排网数据显示,截至2023年12月31日,有业绩展示的85家百亿私募2023年度收益均值为-0.77%。百亿量化私募表现抢眼,2023年逆势实现正收益。有业绩展示的32家百亿量化私募2023年度整体收益为6.43%,其中31家实现正收益。

其中,九章资产和宁波幻方量化均实现正收益,分别为4.86%和3.71%。

不过,在2024年上半年,幻方量化也遭遇了业绩回撤。一份头部券商重点私募业绩数据显示,截至2024年6月28日,量化机构的核心即策略中证500指数增强策略中,幻方500年内收益为-8.96%。具体来看,该策略1月和2月的收益分别为-3.76% 和-9.24%。

幻方在其产品运作说明中称,幻方产品超额回撤较大主要原因是面对不同环境策略应对不理想,在面对短期极端市场未表现出较好的适应性,基于全市场选股构造的投资组合与指数差距较大,形成了明显的超额回撤。回撤暴露出策略在因子迭代、风控管理等方面尚需优化。

为此,幻方在今年2月初已收紧了整体风控,防止小市值股票出现极端流动性危机时对于投资组合的冲击,并在每个交易日分析模型表现,持续进行优化,相信市场会逐步回到正常的轨道,策略模型也会恢复正常。

“量化投资,是依托海量数据和科学的模型,去做出胜率更高的投资预判。”深圳某私募人士表示,主观和量化没有孰优孰劣,任何策略都有周期性,市场上没有常胜将军,量化投资想要长期稳健的投资收益需要管理人强大的策略升级迭代的能力,这离不开管理人对更高的算力、更精细化的模型和更强的投研团队的投入。

对于当前市场上的一些争议,包括有观点认为“市场高开低走,是量化高抛低吸;市场上涨或下跌,则是量化追涨杀跌”等,7月17日,幻方量化发布公告称,这存在很大误解。幻方量化表示,目前A股的市场有效性已经比较高,短线追涨杀跌很难赚钱。量化作为一个整体,大部分情况下是抑制了市场波动,少部分情况会加大市场波动。量化参与者的专业程度普遍比较高,专业参与者更倾向于逢低买入、逢高卖出,而不是追涨杀跌。同时,在内外部情况发生改变的时候,专业参与者能更快速地推动市场到达新的平衡位置,减少多余的震荡,增加定价的效率。量化策略整体是收敛和理性的,对波动起到了阻尼的作用。

量化投资与机器学习最新统计显示,截至2024年二季度末,百亿级量化私募的管理规模普遍缩水,幻方目前依旧位于第一梯队,管理规模在500亿元到600亿元区间。