☰

通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o

《科创板日报》9日讯，阿里通义团队开源新一代数学模型Qwen2-Math，包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发，旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等，以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。（记者黄心怡）

相关资讯

▣ 阿里发布Qwen2-Math：数学推理全球第一，超越GPT-4o和Claude-3.5
▣ 通义千问开源视觉语言模型Qwen2-VL
▣ 阿里发布开源多模态模型Qwen2-VL，多项性能超越GPT-4o
▣ 阿里通义千问Qwen2大模型发布并同步开源
▣ 通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜超GPT-4o等
▣ 通义千问开源千亿级参数模型
▣ 通义千问开源320亿参数模型
▣ 阿里云发布通义千问2.5，开源通义千问1100亿参数模型
▣ 通义千问发布首个千亿级参数开源模型
▣ Nvidia的新开源AI模型在基准测试中击败了GPT-4o
▣ 阿里云正式发布通义千问2.5，开源通义千问1100亿参数模型
▣ 数智早参｜快手可灵AI全面开放内测；Meta最强大模型超越GPT-4o
▣ 阿里通义千问开源首个MoE模型
▣ 开源视觉大模型黑马Molmo AI 来袭！超越GPT-4o 和 Claude 3.5
▣ 刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错
▣ AI早知道｜B 站开源轻量级 AI 语言模型；阿里通义Qwen2成最强开源大模型
▣ Anthropic大模型测评首超GPT-4
▣ 通义千问开源模型下载量突破2000万
▣ 阿里云发布开源模型Qwen2
▣ 数智早参｜OpenAI官宣推出新的大语言模型GPT-4o；腾讯混元文生图大模型开源
▣ 通义千问开源Qwen2.5开源模型，累计下载量突破4000万
▣ 阿里云发布通义千问2.0千亿参数模型与通义千问App
性能超越GPT-4Turbo 通义千问2.5问世
▣ 国内首个官方大模型评测结果出炉阿里云通义千问首批通过评测
▣ OpenAI开战小模型，GPT-4o mini成本再降60%
▣ 智谱「超大杯」模型全家桶亮相KDD，部分任务超越GPT-4o
▣ 百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4
▣ 87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发布自动评估模型FLAMe

DMCA | PRIVACY | s@bg3.co