号称「全面超越DeepSeek」 阿里巴巴新一代AI模型登场
阿里巴巴官方表示,旗下的的通义千问旗舰版模型Qwen 2.5-Max在多项测试中得分超越了DeepSeek的V3。(图/新浪人工智慧微博)
在大陆人工智慧公司深度求索(DeepSeek)引发华尔街震荡之际,阿里巴巴旗下的「阿里云」宣布推出新一代AI模型「通义千问 Qwen 2.5-Max」,这项超大规模 MoE 语言模型立刻引发业界关注。阿里云宣称,此模型在多项权威基准测试中表现优异,甚至超越了声名大噪的 DeepSeek V3。
据阿里云微信公众号消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20兆tokens。目前,开发者可在Qwen Chat平台免费体验模型,企业和机构也可透过阿里云百炼平台直接调用新模型API服务。
通义模型介面。(翻摄自通义官网)
通义千问旗舰版模型Qwen 2.5-Max与其它人工智慧在各领域的表现分数比较。(图/阿里通义官方微博)
阿里云表示,新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。
通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行评估测试发现,Qwen2.5-Max在前者比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。而在后者11项基准测试中,Qwen2.5-Max全部超越了对比模型,包括GPT-4o、DeepSeek-V3及Llama-3.1-405B。