半导体弯道上如何超车?陆缺最先进晶片照样开发尖端人工智慧

中国科技公司正在加快研究,寻求在不依赖最先进晶片的情况下开发尖端AI技术,而且已经获得了相当的成果。(图/Shutterstock)

美国对中国的半导体限制措施似乎未能抑制大陆科技公司参与尖端人工智慧(AI)研发,据研究人员分析,中国科技公司正在加快研究,寻求在不依赖最先进晶片的情况下开发尖端AI。其中有些相关实验已经看到了前景,或许能让中国科技界克服美国半导体制裁带来的困境。

《华尔街日报》报导说,目前华为、百度、阿里巴巴等多家公司都在设法更有效利用现有电脑设备上的晶片。虽然利用这些变通方法来追赶美国顶尖AI公司仍是一个重大挑战,但是有些实验已让他们看到了前景。

目前类似ChatGPT模型商业化的竞赛日益升温,全球各地的公司都急需更强大的晶片,并在想方设法更有效地利用晶片的运算能力,以压低激增的AI开发成本。行业分析师表示,关键在于美国的制裁已令陆企难以获取英伟达(Nvidia)等公司制造的最先进制程晶片,而且为了打造类似ChatGPT的产品,这些中国公司正在迅速消耗现有的美国晶片库存。

报导说,几年下来,美国的半导体限制政策导致大陆企业无法获得最先进晶片,例如AI开发行业最受欢迎的英伟达A100晶片,以及今年3月份发布的新一代版本H100,后者可以提供更强大运算能力。英伟达为了晶片限制规定,特意设计了降级版晶片专供中国市场,分别为A800和H800。这2种修改后的晶片都降低了晶片之间通信的能力。

这些产品为开发小型AI模型提供了有效的替代方案,例如字节跳动旗下短视频应用TikTok进行推荐的算法,但这种障碍会扼杀较大型AI模型开发。

美国祭出对华晶片制裁一个月后,OpenAI发布ChatGPT,在全球引发了一波生成式AI的开发热潮。瑞银分析师估计,训练这种大型AI模型需要5000至10000块A100晶片。

一位出席AI行业会议的人士透露,一家与中国政府有关联的半导体行业协会发布的调查报告显示,发现中国大约有4万至5万枚A100晶片可用于训练大型AI模型在美国颁布制裁令之前储备了A100的阿里巴巴和百度等中国公司,已在内部严格限制使用库存的先进制程晶片,将它们留给计算最密集的任务使用。

据开源研究论文和知情人士的说法,百度近年来一直在寻求将国产晶片纳入其AI开发,然而,许多国产晶片对于训练大模型来说仍然不可靠,因为它们非常容易崩溃。

新加坡国立大学教授尤洋表示,许多中国公司现在正在研究组合3、4枚性能相对较差的晶片来替代英伟达最先进的处理器。但这种组合低性能晶片的成本很高,如果一家美国公司需要1000个H100晶片来训练一个大语言模型,那么一家中国公司可能需要至少3000个H800晶片才能实现同样的结果。

尤洋说,这正促使一些公司加速开发技术,使用不同类型的晶片来训练大规模AI模型。此前这一研究领域在硬体资源有限、渴望降低成本的中国公司中已经很普遍。

与此同时,中国公司也正在研究使用各种软件技术来降低训练大规模AI模型的计算强度,这种方法已在全球范围内加速推广。虽然其中许多方法在全球研究界仍处于不断完善的过程中,但中国研究人员已取得了一些成果。