DeepSeek震撼美国AI科技圈 神秘老板梁文锋新闻联播低调亮相
梁文锋(前左)最近在大陆《央视》新闻联播上亮相时说,中国发展AI,必然需要有人站到技术的前沿。(图/快科技)
最近一周,中国的神秘AI公司、被称为「AI界拼多多」的人工智慧初创企业深度求索(DeepSeek)刷屏全球各大主流媒体和社交网站,尤其让美国AI科技圈极为震撼。该公司创办人梁文锋首次在大陆《央视》新闻联播亮相时表示,DeepSeek之所以震撼美国,是因为它来自中国公司,中国AI要发展,必然需要有人站到技术的前沿。
据《快科技》报导,DeepSeek最新发布的R1模型不仅在性能上比肩甚至超越了OpenAI的o1,并完全开源,更以极低的成本实现了这一突破。一向极为低调的DeepSeek老板梁文锋日前首次亮相新闻联播时表示,「在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯 follow,而不是创新。」
目前AI科技界有些人认为,DeepSeek可能会颠覆辉达(NVIDIA)在AI硬体领域的主导地位。在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第3,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第1。
Arena放榜之后,全球关于DeepSeek的讨论再次升级。辉达的高级研究科学家范麟熙(Jim Fan)评价道:「我们生活在这样一个时代:一家非美国公司正在让OpenAI的初衷得以延续──真正开放、为所有人赋能的前沿研究。」
美国私募基金Noah's Arc Capital Management认为,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比NVIDIA更具有成本效益的替代品,增强了AMD的市场地位。
报导指出,DeepSeek-R1让美国乃至全球的AI圈有如此大的反应,主要因为它突破了由美国和OpenAI建立起的规则。以往由OpenAI引领的AI路线是以规模制胜,但这种发展模式也将AI发展带入了一个怪圈,为追求更高的性能,大模型的体积只能不断膨胀,参数数量呈现指数级增长,同时带来了惊人的能源消耗和训练成本。而一家公司想发展AI,就必须投入高昂的成本向辉达买GPU晶片训练,绝大多数公司根本难以为继。
而DeepSeek的诞生,让低成本、高性能的AI成为可能。大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而辉达等硬体商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。
美股大V「THE SHORT BEAR」在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬体费用,现在这种冒险行为变得越来越无利可图,也因此造成辉达股价大跌。
梁文锋说,中国AI不可能永远处在跟随的位置,经常有人说中国AI和美国有1、2年差距,但真实的落差是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。辉达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态,所以中国必然需要有人站到技术的前沿。