☰

中國發展AI模型「幾個月就搞定」美專家驚呆了

中国因为美国的制裁措施在购买先进晶片方面受限，不过美媒引述美国AI专家指出，中国的AI新创公司追赶美国领先的人工智慧模型仍是速度极快，已超出许多业内人士的预期，中国「在几个月内就搞定了，我的许多同事对此感到惊讶」，这些公司推出的AI模型进展「令人印象深刻」。报导认为，这显示中国开发者们已经找到了变通途径，正快速追赶美国同行。

据华尔街日报报导，有迹象表明，中国初创企业追赶美国领先的AI模型的速度要比业内许多人预期的更快。以中国最成功的避险基金经理人之一投资的新创公司DeepSeek为例，该公司于11月发布其最新大型语言模型的预览版，该公司称这款大型语言模型能力与OpenAI名为o1的推理模型相比毫不逊色。

近几周，其他中国公司也作出了类似的表态。由中国互联网巨头阿里巴巴和腾讯支持的初创公司月之暗面表示，该公司开发了一种专门研究数学的模型，其能力接近「o1」；阿里巴巴也表示，自己的一个实验性研究模型在数学方面优于o1模型的预览版。

报导指出，这些公司尚未发表描述其模型的论文，但一些美国专家对这些模型印象深刻。OpenAI前研究员、现任AI企业家创业者安德鲁·卡尔（Andrew Carr）表示，「中国正在加速迎头赶上」，试图复制OpenAI推理模型的DeepSeek研究人员「在几个月内就搞定了」，他坦言「我的许多同事对此感到惊讶」。

其中一项用于比较的测试是美国数学邀请赛（AIME）。月之暗面创始人杨植麟曾表示，该公司模型在AIME测试中胜过了OpenAI的模型。但华尔街日报利用今年AIME的15道题进行的一项实验则发现，OpenAI的「o1」预览版模型得出答案的速度比DeepSeek、月之暗面和阿里巴巴的实验模型更快。

报导指出，自2022年以来，中国AI开发者面临美国对其获得全球最先进制程AI晶片的限制，但开发者们已经找到了变通途径。

「中国绕过出口管制的一种方式将是：利用其能够获得的硬件，构建极其优秀的软件和硬件训练体系」，AI初创公司Anthropic的联合创始人Jack Clark在他的博客中写道，他指的是DeepSeek的集群。他并指「『中国制造』将成为AI模型领域的一股潮流，就像电动汽车、无人机和其他技术一样」。

报导称，许多中国AI开发者已经找到了途径去获得受限的辉达晶片，包括通过与中间商交易以及利用海外数据中心。尽管如此，据中国企业高管称，缺乏尖端晶片对中国初创公司来说是痛苦的，而且这种差距还可能扩大。

中國發展AI模型「幾個月就搞定」 美專家驚呆了

相关资讯

中國發展AI模型「幾個月就搞定」美專家驚呆了