《路透》:字节跳动计划使用华为升腾晶片训练新AI模型

知情人士声称字节跳动计划使用华为升腾910B晶片训练新的AI大模型,但是这款晶片供货速度太慢,尚无法满足其需求。(图/搜狐网)

据外媒引述知情人士消息称,大陆短视频抖音母公司字节跳动正计划为其热门的国际版短视频TikTok开发一种新的AI模型,受到外界格外瞩目的是,这款AI模型将主要用华为的晶片进行训练。

《路透》报导称,字节跳动已将目光转向中国大陆的AI 晶片供应商,同时也加快自主研发的步伐。在这场AI竞赛中,字节跳动的下一步动作是使用华为升腾910B晶片来训练AI大模型。

第4位知情人士也称,字节跳动计划建设一个新的AI模型,但「不能透露」是否会使用华为晶片。

前述3位知情人士表示,字节跳动已经开始使用升腾910B晶片,主要用于计算强度较低的推理任务,即利用预先训练好的AI模型进行预测。

但是,训练AI模型对算力的要求要高得多,需要海量资料,因此必须使用超高性能晶片。上述的其中一位知情人士表示,从计算参数来看,新模型的能力和复杂程度将低于字节跳动现有的AI模型「豆包」。

报导说,字节跳动没有回复置评请求,TikTok 华盛顿特区发言人休斯(Michael Hughes)否认了这一消息。他说,「这里的整个前提都是错误的,没有开发新的模式。」华为则没有回复《路透》的置评请求。

知情人士还表示,字节跳动今年订购了 10 万多块升腾910B晶片,但截至今年 7 月,收到的不足3万片,供货速度太慢,因此无法满足公司的需求。