☰

《国际产业》字节跳动训练新AI模型传采华为晶片

自从美国在2022年开始限制辉达(Nvidia)晶片的出口，字节跳动已经对国内人工智慧晶片供应商进行了多元化发展，并加快自己的研发。

知情人士表示，字节跳动在人工智慧竞赛中的下一步，是利用华为的Ascend 910B晶片来训练大语言AI模型。

另一位消息人士说，字节跳动正计划推出新的AI模型，但他无法说出，是否会使用华为晶片。

字节跳动已将Ascend 910B用于计算强度较低的推理工作，这些工作主要涉及让预先训练好的AI模型做出预测。

而去训练AI模型，要求则高得多，而且需要大量资料，因此需要使用超高效能晶片，例如辉达的高阶图形处理器。

其中一名知情人士表示，依照计算参数来衡量，新模型的效能和复杂性将低于字节跳动现有的AI模型豆包(Doubao)。

TikTok在华盛顿的发言人Michael Hughes代表字节跳动表示：「这里整个前提都是错误的，没有开发任何新模型」。

一位消息人士说，字节跳动今年订购了超过10万颗Ascend 910B晶片，但截至7月，收到的还不到3万颗，速度太慢，无法满足公司需求。

两名知情人士表示，与辉达在中国销售的晶片相比，华为供应受限、运算能力有限，已使字节跳动无法为款模型设定时间表。

字节跳动目前的AI技术为2023年8月启动的大语言模型，并被更名为「聊天机器人豆包」，以及其它应用程式，包括文字转视讯工具「即梦」(jimeng)。

此外在六月有新闻报导传出，字节跳动正在与博通合作，开发5奈米AI晶片，制造工作将交给台积电进行。

《国际产业》字节跳动训练新AI模型 传采华为晶片