中國發展AI模型「幾個月就搞定」 美專家驚呆了

中国因为美国的制裁措施在购买先进晶片方面受限,不过美媒引述美国AI专家指出,中国的AI新创公司追赶美国领先的人工智慧模型仍是速度极快,已超出许多业内人士的预期,中国「在几个月内就搞定了,我的许多同事对此感到惊讶」,这些公司推出的AI模型进展「令人印象深刻」。报导认为,这显示中国开发者们已经找到了变通途径,正快速追赶美国同行。

据华尔街日报报导,有迹象表明,中国初创企业追赶美国领先的AI模型的速度要比业内许多人预期的更快。以中国最成功的避险基金经理人之一投资的新创公司DeepSeek为例,该公司于11月发布其最新大型语言模型的预览版,该公司称这款大型语言模型能力与OpenAI名为o1的推理模型相比毫不逊色。

近几周,其他中国公司也作出了类似的表态。由中国互联网巨头阿里巴巴和腾讯支持的初创公司月之暗面表示,该公司开发了一种专门研究数学的模型,其能力接近「o1」;阿里巴巴也表示,自己的一个实验性研究模型在数学方面优于o1模型的预览版。

报导指出,这些公司尚未发表描述其模型的论文,但一些美国专家对这些模型印象深刻。OpenAI前研究员、现任AI企业家创业者安德鲁·卡尔(Andrew Carr)表示,「中国正在加速迎头赶上」,试图复制OpenAI推理模型的DeepSeek研究人员「在几个月内就搞定了」,他坦言「我的许多同事对此感到惊讶」。

其中一项用于比较的测试是美国数学邀请赛(AIME)。月之暗面创始人杨植麟曾表示,该公司模型在AIME测试中胜过了OpenAI的模型。但华尔街日报利用今年AIME的15道题进行的一项实验则发现,OpenAI的「o1」预览版模型得出答案的速度比DeepSeek、月之暗面和阿里巴巴的实验模型更快。

报导指出,自2022年以来,中国AI开发者面临美国对其获得全球最先进制程AI晶片的限制,但开发者们已经找到了变通途径。

「中国绕过出口管制的一种方式将是:利用其能够获得的硬件,构建极其优秀的软件和硬件训练体系」,AI初创公司Anthropic的联合创始人Jack Clark在他的博客中写道,他指的是DeepSeek的集群。他并指「『中国制造』将成为AI模型领域的一股潮流,就像电动汽车、无人机和其他技术一样」。

报导称,许多中国AI开发者已经找到了途径去获得受限的辉达晶片,包括通过与中间商交易以及利用海外数据中心。尽管如此,据中国企业高管称,缺乏尖端晶片对中国初创公司来说是痛苦的,而且这种差距还可能扩大。