阿里云发布开源模型Qwen2
北京商报讯(记者 魏蔚)6月7日,阿里云发布开源模型Qwen2-72B。通义千问团队披露,Qwen2系列包含5个尺寸的预训练和指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为混合专家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分组查询注意力)机制。在中英文之外,模型训练数据中增加了27种语言相关的高质量数据。Qwen2还增大了上下文长度支持,Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务。
相关资讯
- ▣ AI早知道|阿里云发布全球最强开源模型Qwen2;快手发布可灵大模型
- ▣ 阿里通义千问Qwen2大模型发布并同步开源
- ▣ 阿里发布开源多模态模型Qwen2-VL,多项性能超越GPT-4o
- ▣ AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型
- ▣ 阿里国际发布最新开源多模态模型Ovis
- ▣ 阿里云发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ AI早知道|阿里通义将发布视频大模型;元象发布MoE开源大模型
- ▣ 阿里云正式发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- ▣ 数智早参|苹果推出开源大模型OpenELM;阿里云宣布EMO模型上线通义APP
- ▣ AI早知道|阿里云发布音频模型;OpenAI发布新技术PVG
- ▣ 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
- ▣ 阿里云CTO谈大模型开闭源之争:模型应用不能只对接一个形式
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 谷歌发布 Gemma 2 开源 AI 模型
- ▣ 阿里云CTO周靖人:通义千问开源模型下载量突破2000万次
- ▣ 阿里云财报:AI收入三位数增长 开源模型下载量破2000万
- ▣ 阿里云发布通义千问2.0千亿参数模型与通义千问App
- ▣ 阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o和Claude-3.5
- ▣ 阿里云魔搭发起“ModelScope-Sora开源计划”
- ▣ 阿里通义将发布视频生成大模型
- ▣ 阿里云的开源算盘
- ▣ AI早知道|Anthropic发布Claude 3.5 Sonnet模型;阿里云推出首个AI程序员
- ▣ Meta发布LLAMA 3.1开源人工智能模型
- ▣ 阿里云通义千问开源
- ▣ 大模型上终端,阿里云找“队友”
- ▣ Meta发布LLAMA 3.1 405B开源人工智能模型
- ▣ 开源模型Llama3发布,原来Meta才是真OpenAI?
- ▣ 中国科学院地化所与阿里云联合发布首个月球专业大模型