通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
《科创板日报》9日讯,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。(记者 黄心怡)
相关资讯
- ▣ 阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o和Claude-3.5
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- ▣ 阿里发布开源多模态模型Qwen2-VL,多项性能超越GPT-4o
- ▣ 阿里通义千问Qwen2大模型发布并同步开源
- ▣ 通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
- ▣ 智源最新模型评测:百度文心大模型4.0登顶闭源榜 超GPT-4o等
- ▣ 通义千问开源千亿级参数模型
- ▣ 通义千问开源320亿参数模型
- ▣ 阿里云发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 通义千问发布首个千亿级参数开源模型
- ▣ Nvidia的新开源AI模型在基准测试中击败了GPT-4o
- ▣ 阿里云正式发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 数智早参|快手可灵AI全面开放内测;Meta最强大模型超越GPT-4o
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 开源视觉大模型黑马Molmo AI 来袭!超越GPT-4o 和 Claude 3.5
- ▣ 刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错
- ▣ AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型
- ▣ Anthropic大模型测评首超GPT-4
- ▣ 通义千问开源模型下载量突破2000万
- ▣ 阿里云发布开源模型Qwen2
- ▣ 数智早参|OpenAI官宣推出新的大语言模型GPT-4o;腾讯混元文生图大模型开源
- ▣ 通义千问开源Qwen2.5开源模型,累计下载量突破4000万
- ▣ 阿里云发布通义千问2.0千亿参数模型与通义千问App
- 性能超越GPT-4Turbo 通义千问2.5问世
- ▣ 国内首个官方大模型评测结果出炉 阿里云通义千问首批通过评测
- ▣ OpenAI开战小模型,GPT-4o mini成本再降60%
- ▣ 智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o
- ▣ 百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4
- ▣ 87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe