陆DeepSeek爆红 重挫辉达股价
DeepSeek V3以及DeepSeek R1等大型语言模型(LLM),迅速在美国走红,27日更一举超越ChatGpt登上美国区苹果App Store免费榜上首位。(中新社)
大陆人工智慧(AI)新创日前发布DeepSeek V3以及DeepSeek R1等大型语言模型(LLM),迅速在美国走红,27日更一举超越ChatGPT登上美国区苹果App Store免费榜上首位。而由于其成本低,效能更媲美Open AI ChatGPT o1,宛如一只「黑天鹅」,撼动美国矽谷科技界,美股开盘,辉达(Nvidia)下跌约12%,其他AI相关科技股,如美光和台积电ADR下跌8%至9%。
人工智慧热的最大受益者之一、晶片设计公司辉达(Nvidia)的股票,在美股27日盘前股价下跌14%,台积电ADR盘前股价下跌逾9%,荷兰晶片公司艾司摩尔(ASML),在欧股市场下跌10%。
仅24小时 力压ChatGPT
而亚洲盘27日,日本晶片相关股普遍下跌,日股收盘辉达的半导体测试设备供应商爱德万测试股价下跌8.61%,而软银则下跌8.32%、东京威力科创(Tokyo Electron)下跌4.9%。
DeepSeek堪称「一夕爆红」。事实上,就在26日时DeepSeek都还未能挤进美国区苹果App Store免费榜前五,然而仅仅24小时后,DeepSeek在美国却上演力压ChatGPT的历史性戏码。
据了解,DeepSeek仅用2048片H800的晶片、历经两个月,就训练出一个6710亿参数的DeepSeek V3。对比Meta训练参数量4050亿的Llama 3,运用16384片更强的H100晶片,花了54天。DeepSeek训练效率显然提升11倍。
成本仅GPT-4 Turbo 1.4%
DeepSeek震撼美国科技界后,其背后研发团队也成为外界焦点。综合陆媒、香港01报导,DeepSeek的创始人是梁文锋,他是浙江大学资讯与通信工程专业的硕士,年纪不到40岁。
梁文锋于2015年创立幻方量化,2018年幻方正式确立以AI为核心的发展战略。梁文锋曾公开表明,幻方量化进入AI领域并非为复制另一个ChatGPT,而是希望解开AGI更多未知之谜,打算从LLM入手,致力于打造真正人类级别的AI。
DeekSeek去年5月宣布,其DeepSeek V2的推理成本被降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一,经此一役,DeepSeek就以「AI界的拼多多」打响名号。
85后创办人 撼动矽谷
值得一提得是,DeepSeek V2关键开发者之一就是AI「天才少女」罗福莉,2024年底小米创办人雷军传出以千万人民币薪水招募罗福莉,担任AI实验室的大模型团队负责人。8年级生的罗福莉是在2022年跳槽到DeepSeek参与研发DeepSeek V2。
而大陆总理李强今年1月20日主持召开专家、企业家和教科文卫体等领域代表座谈会,期间梁文锋在会上发言,而大陆央视《新闻联播》播出该画面,也让不少人第一次见识到梁文锋。