稀宇科技推出万亿MoE模型abab 6.5

4月17日,稀宇科技MiniMax正式推出abab 6.5系列模型。abab 6.5系列包含两个模型:abab 6.5和abab 6.5s。据介绍,abab 6.5包含万亿参数,支持200k tokens的上下文长度;abab 6.5s跟abab 6.5使用了同样的训练技术和数据,但是更高效,支持200k tokens的上下文长度,可以1秒内处理近3万字的文本。在各类核心能力测试中,abab 6.5开始接近GPT-4、Claude-3、Gemini-1.5等大语言模型。