☰

科技創新轉捩點

【文．洪宝山】

OpenAI凭借ChatGPT爆红辉达订单满手席卷AI晶片市场

2023年的人工智慧，可以说是OpenAI的天下，凭借ChatGPT的爆红，这家初创企业一跃成为最具价值的AI初创公司，最新估值达到860亿美元，半年翻了三倍。

在AI晶片领域，辉达的H100+CUDA软体几乎垄断了今年AI晶片市场，H100晶片市价四万美元左右，使得辉达前三季营收翻两倍到181亿美元，而且订单满手中。

微软率先发难自研AI晶片，以求降低成本的同时，发展更贴近自家企业所需的AI晶片，Meta、OpenAI和微软在12/6举行的AMD投资者大会上，表示将使用AMD最新的人工智慧晶片Instinct MI300X。可预见2024年是反辉达联盟集结的一年，但辉达领先十多年建立的CUDA软体可不是吃素的，CUDA软体一直是AI开发者目前青睐辉达GPU的主要原因之一，到时候还有得瞧。

2024年各方势力集结对抗辉达AI晶片一家独大

AMD的MI300X最大特点是拥有192GB的HBM3，这种记忆体传输资料的速度更快，可以容纳更大的人工智慧模型。AMD将MI300X及其构建的系统与辉达的H100进行了比较，晚了半年问世的MI300X的浮点运算速度比H100高30%，记忆体频宽比H100高60%，记忆体容量更是H100的两倍以上。

但MI300X对辉达最新的旗舰H200的优势就没那么明显了，记忆体频宽仅比后者多出个位数，容量比后者大近40%。光有强而有力的晶片并不足以扳倒辉达的领先地位，因为辉达配合ChatGPT-3、4模型运作的效果最好，如果没有其他LLM大模型配合运作，证实AMD搭配新的大模型的效能足以取代H100+ChatGPT的话，买家不会轻易舍弃辉达、选择AMD的。

相较于简单将纯文字、纯视觉和纯音讯模型拼接在一起的传统模型，12/7谷歌至今最强大的大模型Gemini上线，Gemini在开发之初就在不同模态上进行了训练，根据谷歌内部消息，Gemini有万亿参数，训练所用的算力甚至达到GPT-4的五倍，从自然图像、音讯、视频理解到数学推理，Gemini Ultra在32个常用的学术基准的30个上，已经超越GPT-4！值得一提的是，Gemini并没有依赖辉达晶片算力，是由Google自研TPU v4和TPU v5e训练出来的大模型。

另外不让谷歌专美于前，不同于谷歌的封闭式LLM大模型，Meta和IBM选择走类似Android系统的开放式竞争路线，联合成立了AI联盟。Meta计划把MI300X GPU用于人工智慧推理任务，微软表示会把MI300X部署在云端运算服务Azure中，甲骨文的云端运算服务也会使用MI300X。OpenAI也会在一款叫做Triton的软体产品中使用AMD GPU，可预见2024年将是各方势力集结对抗辉达在AI晶片的一家独大垄断。

云端AI基建使GPU大缺货边缘AI算力攸关生成式AI扩展

云端AI的基础建设使得GPU大缺货，但个人消费者并非所有的应用都要上传到云端AI去运算，AI的边缘运算正在擡头。未来AI推理的规模将远高于AI训练，推理成本将随着日活使用者数量及使用频率的增加而增加，而云端推理的成本掌握在云企业手中，这将导致规模化扩展难以持续，因此布局边缘AI算力是生成式AI规模化扩展的重要一步。

通过压缩AI大模型和终端软硬体的配合，企图做到在PC与手机上运行AI模型跟云端GPU运算一样快，但成本更低、回应速度更快、服务效率更高等目标。生成式AI与边缘AI走在前面，倒逼PC与手机硬体性能大升级。苹果的新一代M3系列晶片中，M3Max支援开发数十亿参数AI模型。苹果与Meta等在XR眼镜中也有望逐步接入AI。

明年期待边缘AI应用先落地后年迎接AI终端硬体创新升级

谷歌大模型Gemini家族中专门为移动装置训练模型的Nano版本将配备在谷歌最新一代旗舰机Pixel 8 Pro，Gemini大模型最核心亮点在于对视频多模态的理解能力。华为Mate60、小米14、vivoX100发布会中，都重点介绍了AI功能。三星2024年Galaxy S24手机发布会中，预期高斯AI模型将是主打功能。

联想首款AI PC已面世，2024年CES展上，华硕将展示AI PC，考虑到AI算力由云端向边缘装置端延伸，硬体升级趋势可望推动换机潮加速，边缘AI的大模型具备GPT3.5至GPT4水准能力，可望从PC与手机端开始渗透，然后逐步延伸到MR、穿戴式电子、汽车、智慧家庭、机器人等各类终端设备，2024年是个期待边缘AI应用落地的一年，2025年或将迎来全面一轮的AI终端硬体创新升级趋势。

【全文未完，详细内容请参阅最新一期《理财周刊》1216期。尊重智慧财产权，如需转载请注明出处来源；订阅理财周刊电子杂志或免费下载APP】

科技創新轉捩點

相关资讯