《国际产业》字节跳动训练新AI模型 传采华为晶片

自从美国在2022年开始限制辉达(Nvidia)晶片的出口,字节跳动已经对国内人工智慧晶片供应商进行了多元化发展,并加快自己的研发。

知情人士表示,字节跳动在人工智慧竞赛中的下一步,是利用华为的Ascend 910B晶片来训练大语言AI模型。

另一位消息人士说,字节跳动正计划推出新的AI模型,但他无法说出,是否会使用华为晶片。

字节跳动已将Ascend 910B用于计算强度较低的推理工作,这些工作主要涉及让预先训练好的AI模型做出预测。

而去训练AI模型,要求则高得多,而且需要大量资料,因此需要使用超高效能晶片,例如辉达的高阶图形处理器。

其中一名知情人士表示,依照计算参数来衡量,新模型的效能和复杂性将低于字节跳动现有的AI模型豆包(Doubao)。

TikTok在华盛顿的发言人Michael Hughes代表字节跳动表示:「这里整个前提都是错误的,没有开发任何新模型」。

一位消息人士说,字节跳动今年订购了超过10万颗Ascend 910B晶片,但截至7月,收到的还不到3万颗,速度太慢,无法满足公司需求。

两名知情人士表示,与辉达在中国销售的晶片相比,华为供应受限、运算能力有限,已使字节跳动无法为款模型设定时间表。

字节跳动目前的AI技术为2023年8月启动的大语言模型,并被更名为「聊天机器人豆包」,以及其它应用程式,包括文字转视讯工具「即梦」(jimeng)。

此外在六月有新闻报导传出,字节跳动正在与博通合作,开发5奈米AI晶片,制造工作将交给台积电进行。