陆版AI模型DeepSeek暴红 辗压ChatGPT震撼矽谷
历史性一刻,DeepSeek超越ChatGPT,登顶美区苹果应用榜。(图:shutterstock)
据观察者网报导,由陆企研发的DeepSeek-V3模型发布后,在美国热度持续飙升。截至台北时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。
而就在昨天早上,DeepSeek还没有挤进榜单前五,显示出过去24小时发酵速度之快。对于一款中国大模型来说,能够在美国力压ChatGPT,也是历史性一刻。
除了C端用户的喜爱,DeepSeek也持续引发行业内的高度重视。
1月25日,超微半导体(AMD)在其X帐号上宣布,已将中国人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上,以在SGLang技术支持下,实现极致性能。选择将DeepSeek大模型集成至自家AI晶片产品上,AMD或重塑全球AI晶片竞争格局。
AMD表示,DeepSeek-V3作为强大的混合专家(MoE)语言模型。为实现高效推理与经济性训练,该模型延续了前代产品DeepSeek-V2的核心架构——多头潜在注意力机制(MLA)和DeepSeekMoE架构。在多数基准测试中,特别是数学与代码任务领域,DeepSeek-V3均展现出业界领先性能。
在通常情况下,像DeepSeek-V3这种语言大模型推理过程中,普遍都需要大量的计算资源和记忆体频宽来处理文本和视觉数据,AMD则认为自家Instinct GPU系列AI晶片可以为运行此类大模型,提供出色性能。
公开信息显示,MI300X是 AMD于2023 年底推出的旗舰级AI晶片,专为大语言模型和高性能计算设计,旨在挑战竞争对手辉达(Nvidia)在AI计算领域的主导地位。其基于CDNA 3架构,采用混合5奈米和6奈米制程工艺,集成1530亿晶体管,配备192GB记忆体,拥有5300GB/s的频宽。在不考虑软体层面问题,仅从硬体规格上看,MI300X远超辉达的H100甚至H200。
AMD称,深度求索团队在DeepSeek-V3的开发过程的关键阶段,采用了AMD ROCm 软体和AMD Instinct GPU加速器。ROCm对FP8格式的广泛支持,能显著提升AI模型的运行效率,特别是在推理环节。该技术可以解决内存瓶颈及高读写格式相关的高延迟问题,而FP8低精度计算还能减少数据传输与计算过程中的延迟。因此,通过与深度求索的合作,AMD也为用户提供了更丰富的GPU硬体选择。
另一方面,随着AI浪潮对高算力晶片的需求,辉达的股价水涨船高,如今已超越苹果公司登顶全球市值最高宝座,而同期的AMD不论市占率和产品性能,相对于辉达都全面处于明显劣势。受此影响,虽然AMD也享受了AI爆发带来的红利,但股价自去年10月的172.8美元以来已下跌近30%,与同年3月创下的211.38美元最高点相比更是跌幅超40%。
不过,转机或已出现。2024年底,深度求索发布DeepSeek-v3时,技术报告中称正式训练成本仅为550万美元成本,使用的也是辉达H800晶片(美出口管制下,针对中国市场特供版H100),这和美国OpenAI以及Meta公司动辄上亿美元的大模型相比,便宜到令美国人自我怀疑。前几天,深度求索又发布了DeepSeek-R1模型,作为开源软体直接比肩闭源的OpenAI的o1大模型,一度引发市场关注。
越来越多的投资者开始反思,AI计算对辉达GPU的需求是否被资本人为夸大了?因为深度求索团队已经展示了如何通过超低成本,以及使用「不那么先进的晶片」,同样可以构建出高品质AI模型。倘若如此,这意味着训练大模型也不用一味去追求辉达那「一卡难求」的旗舰晶片,这时「不那么能打」但在硬体方面性价比更高的AMD产品,则看上去更「Yes」了。
目前,华尔街分析师普遍看好AMD。包括花旗集团、路通资本等近30名分析师都给出了「买入」意见,这些预测将AMD未来一年平均目标价推上了182.7美元,出现了48.73%的上涨空间。还有更激进的预测认为,若AMD的PEG比率回归行业中枢(科技行业在3倍上下),其估值可能进一步提升130%以上,达到265美元。
与此同时,辉达股价则出现下跌。1月24日,辉达收报142.62点,跌幅3.12%,盘后又下跌0.42%,反映出投资者对其市场主导地位的担忧。