通义千问发布首个千亿级参数开源模型
观点网讯:4月28日,通义千问宣布推出1100亿参数模型Qwen1.5-110B,标志着其成为全系列中首个达到千亿级参数的开源模型。该模型继续沿用了Qwen1.5系列的Transformer解码器架构,并采纳了分组查询注意力方法,显著提高了模型在推理过程中的效率。
此110B模型的一大亮点在于其能够支持长达32K的上下文长度,并且拥有卓越的多语言处理能力。它能够兼容包括中文、英语、法语、德语、西班牙语、俄语、日语、韩语、越南语以及阿拉伯语在内的多种语言,这一特性使其在全球化的应用场景中具有显著优势。
相关资讯
- ▣ 通义千问开源千亿级参数模型
- ▣ 阿里云发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 阿里云正式发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 通义千问开源320亿参数模型
- ▣ 阿里云发布通义千问2.0千亿参数模型与通义千问App
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 阿里云通义千问发布业界首个开源多模态推理模型
- ▣ 阿里通义千问Qwen2大模型发布并同步开源
- ▣ 夸克发布自研千亿级参数大模型
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- ▣ 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
- ▣ 百川智能发布千亿级参数的大语言模型Baichuan3
- ▣ 通义千问开源模型下载量突破2000万
- ▣ 阿里云通义千问推出开源Qwen2.5-1M模型
- ▣ 国产大模型又有重磅!阿里发布通义千问旗舰版模型,采用开源策略
- ▣ 通义千问开源Qwen2.5开源模型,累计下载量突破4000万
- ▣ 阿里云通义千问旗舰版模型Qwen2.5-Max发布
- ▣ 阿里云发布通义千问旗舰版模型Qwen2.5-Max
- ▣ 全球首个百亿参数级遥感解译基础模型发布
- ▣ 全球首个亿级参数量地震波大模型“谛听”发布
- ▣ 通义千问开源Qwen2.5
- ▣ 阿里通义千问代码模型Qwen2.5-Coder全系列正式开源
- ▣ 国家电网发布国内首个千亿级多模态电力行业大模型
- ▣ AI早知道|国内首个千亿級多模态电力行业大模型;谷歌发布首个通用推理模型
- ▣ AI早知道|微软发布首个大气AI基础模型Aurora;昆仑万维开源2千亿稀疏大模型
- ▣ AI早知道|零一万物发布千亿参数模型;智谱AI上线大模型开放平台
- ▣ 阿里云通义千问开源
- ▣ AI早知道|全球首个亿级参数量地震波大模型;面壁智能发布首个“端侧GPT-4o”模型
- ▣ 无问芯穹发布首个端侧全模态理解开源模型