☰

陆版AI模型DeepSeek暴红辗压ChatGPT震撼矽谷

历史性一刻，DeepSeek超越ChatGPT，登顶美区苹果应用榜。（图：shutterstock）

据观察者网报导，由陆企研发的DeepSeek-V3模型发布后，在美国热度持续飙升。截至台北时间今早，DeepSeek在美区苹果App Store免费榜上已经排在第一位，力压此前霸榜的ChatGPT，而排在第三的则是Meta旗下的Threads。

而就在昨天早上，DeepSeek还没有挤进榜单前五，显示出过去24小时发酵速度之快。对于一款中国大模型来说，能够在美国力压ChatGPT，也是历史性一刻。

除了C端用户的喜爱，DeepSeek也持续引发行业内的高度重视。

1月25日，超微半导体（AMD）在其X帐号上宣布，已将中国人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上，以在SGLang技术支持下，实现极致性能。选择将DeepSeek大模型集成至自家AI晶片产品上，AMD或重塑全球AI晶片竞争格局。

AMD表示，DeepSeek-V3作为强大的混合专家（MoE）语言模型。为实现高效推理与经济性训练，该模型延续了前代产品DeepSeek-V2的核心架构——多头潜在注意力机制（MLA）和DeepSeekMoE架构。在多数基准测试中，特别是数学与代码任务领域，DeepSeek-V3均展现出业界领先性能。

在通常情况下，像DeepSeek-V3这种语言大模型推理过程中，普遍都需要大量的计算资源和记忆体频宽来处理文本和视觉数据，AMD则认为自家Instinct GPU系列AI晶片可以为运行此类大模型，提供出色性能。

公开信息显示，MI300X是 AMD于2023 年底推出的旗舰级AI晶片，专为大语言模型和高性能计算设计，旨在挑战竞争对手辉达（Nvidia）在AI计算领域的主导地位。其基于CDNA 3架构，采用混合5奈米和6奈米制程工艺，集成1530亿晶体管，配备192GB记忆体，拥有5300GB／s的频宽。在不考虑软体层面问题，仅从硬体规格上看，MI300X远超辉达的H100甚至H200。

AMD称，深度求索团队在DeepSeek-V3的开发过程的关键阶段，采用了AMD ROCm 软体和AMD Instinct GPU加速器。ROCm对FP8格式的广泛支持，能显著提升AI模型的运行效率，特别是在推理环节。该技术可以解决内存瓶颈及高读写格式相关的高延迟问题，而FP8低精度计算还能减少数据传输与计算过程中的延迟。因此，通过与深度求索的合作，AMD也为用户提供了更丰富的GPU硬体选择。

另一方面，随着AI浪潮对高算力晶片的需求，辉达的股价水涨船高，如今已超越苹果公司登顶全球市值最高宝座，而同期的AMD不论市占率和产品性能，相对于辉达都全面处于明显劣势。受此影响，虽然AMD也享受了AI爆发带来的红利，但股价自去年10月的172.8美元以来已下跌近30％，与同年3月创下的211.38美元最高点相比更是跌幅超40％。

不过，转机或已出现。2024年底，深度求索发布DeepSeek-v3时，技术报告中称正式训练成本仅为550万美元成本，使用的也是辉达H800晶片（美出口管制下，针对中国市场特供版H100），这和美国OpenAI以及Meta公司动辄上亿美元的大模型相比，便宜到令美国人自我怀疑。前几天，深度求索又发布了DeepSeek-R1模型，作为开源软体直接比肩闭源的OpenAI的o1大模型，一度引发市场关注。

越来越多的投资者开始反思，AI计算对辉达GPU的需求是否被资本人为夸大了？因为深度求索团队已经展示了如何通过超低成本，以及使用「不那么先进的晶片」，同样可以构建出高品质AI模型。倘若如此，这意味着训练大模型也不用一味去追求辉达那「一卡难求」的旗舰晶片，这时「不那么能打」但在硬体方面性价比更高的AMD产品，则看上去更「Yes」了。

目前，华尔街分析师普遍看好AMD。包括花旗集团、路通资本等近30名分析师都给出了「买入」意见，这些预测将AMD未来一年平均目标价推上了182.7美元，出现了48.73％的上涨空间。还有更激进的预测认为，若AMD的PEG比率回归行业中枢（科技行业在3倍上下），其估值可能进一步提升130％以上，达到265美元。

与此同时，辉达股价则出现下跌。1月24日，辉达收报142.62点，跌幅3.12％，盘后又下跌0.42％，反映出投资者对其市场主导地位的担忧。

陆版AI模型DeepSeek暴红 辗压ChatGPT震撼矽谷

相关资讯

陆版AI模型DeepSeek暴红辗压ChatGPT震撼矽谷