科技創新轉捩點
【文.洪宝山】
OpenAI凭借ChatGPT爆红 辉达订单满手席卷AI晶片市场
2023年的人工智慧,可以说是OpenAI的天下,凭借ChatGPT的爆红,这家初创企业一跃成为最具价值的AI初创公司,最新估值达到860亿美元,半年翻了三倍。
在AI晶片领域,辉达的H100+CUDA软体几乎垄断了今年AI晶片市场,H100晶片市价四万美元左右,使得辉达前三季营收翻两倍到181亿美元,而且订单满手中。
微软率先发难自研AI晶片,以求降低成本的同时,发展更贴近自家企业所需的AI晶片,Meta、OpenAI和微软在12/6举行的AMD投资者大会上,表示将使用AMD最新的人工智慧晶片Instinct MI300X。可预见2024年是反辉达联盟集结的一年,但辉达领先十多年建立的CUDA软体可不是吃素的,CUDA软体一直是AI开发者目前青睐辉达GPU的主要原因之一,到时候还有得瞧。
2024年各方势力集结 对抗辉达AI晶片一家独大
AMD的MI300X最大特点是拥有192GB的HBM3,这种记忆体传输资料的速度更快,可以容纳更大的人工智慧模型。AMD将MI300X及其构建的系统与辉达的H100进行了比较,晚了半年问世的MI300X的浮点运算速度比H100高30%,记忆体频宽比H100高60%,记忆体容量更是H100的两倍以上。
但MI300X对辉达最新的旗舰H200的优势就没那么明显了,记忆体频宽仅比后者多出个位数,容量比后者大近40%。光有强而有力的晶片并不足以扳倒辉达的领先地位,因为辉达配合ChatGPT-3、4模型运作的效果最好,如果没有其他LLM大模型配合运作,证实AMD搭配新的大模型的效能足以取代H100+ChatGPT的话,买家不会轻易舍弃辉达、选择AMD的。
相较于简单将纯文字、纯视觉和纯音讯模型拼接在一起的传统模型,12/7谷歌至今最强大的大模型Gemini上线,Gemini在开发之初就在不同模态上进行了训练,根据谷歌内部消息,Gemini有万亿参数,训练所用的算力甚至达到GPT-4的五倍,从自然图像、音讯、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上,已经超越GPT-4!值得一提的是,Gemini并没有依赖辉达晶片算力,是由Google自研TPU v4和TPU v5e训练出来的大模型。
另外不让谷歌专美于前,不同于谷歌的封闭式LLM大模型,Meta和IBM选择走类似Android系统的开放式竞争路线,联合成立了AI联盟。Meta计划把MI300X GPU用于人工智慧推理任务,微软表示会把MI300X部署在云端运算服务Azure中,甲骨文的云端运算服务也会使用MI300X。OpenAI也会在一款叫做Triton的软体产品中使用AMD GPU,可预见2024年将是各方势力集结对抗辉达在AI晶片的一家独大垄断。
云端AI基建使GPU大缺货 边缘AI算力攸关生成式AI扩展
云端AI的基础建设使得GPU大缺货,但个人消费者并非所有的应用都要上传到云端AI去运算,AI的边缘运算正在擡头。未来AI推理的规模将远高于AI训练,推理成本将随着日活使用者数量及使用频率的增加而增加,而云端推理的成本掌握在云企业手中,这将导致规模化扩展难以持续,因此布局边缘AI算力是生成式AI规模化扩展的重要一步。
通过压缩AI大模型和终端软硬体的配合,企图做到在PC与手机上运行AI模型跟云端GPU运算一样快,但成本更低、回应速度更快、服务效率更高等目标。生成式AI与边缘AI走在前面,倒逼PC与手机硬体性能大升级。苹果的新一代M3系列晶片中,M3Max支援开发数十亿参数AI模型。苹果与Meta等在XR眼镜中也有望逐步接入AI。
明年期待边缘AI应用先落地 后年迎接AI终端硬体创新升级
谷歌大模型Gemini家族中专门为移动装置训练模型的Nano版本将配备在谷歌最新一代旗舰机Pixel 8 Pro,Gemini大模型最核心亮点在于对视频多模态的理解能力。华为Mate60、小米14、vivoX100发布会中,都重点介绍了AI功能。三星2024年Galaxy S24手机发布会中,预期高斯AI模型将是主打功能。
联想首款AI PC已面世,2024年CES展上,华硕将展示AI PC,考虑到AI算力由云端向边缘装置端延伸,硬体升级趋势可望推动换机潮加速,边缘AI的大模型具备GPT3.5至GPT4水准能力,可望从PC与手机端开始渗透,然后逐步延伸到MR、穿戴式电子、汽车、智慧家庭、机器人等各类终端设备,2024年是个期待边缘AI应用落地的一年,2025年或将迎来全面一轮的AI终端硬体创新升级趋势。
【全文未完,详细内容请参阅最新一期《理财周刊》1216期。尊重智慧财产权,如需转载请注明出处来源;订阅理财周刊电子杂志或免费下载APP】