稀宇科技推出万亿MoE模型abab 6.5
4月17日,稀宇科技MiniMax正式推出abab 6.5系列模型。abab 6.5系列包含两个模型:abab 6.5和abab 6.5s。据介绍,abab 6.5包含万亿参数,支持200k tokens的上下文长度;abab 6.5s跟abab 6.5使用了同样的训练技术和数据,但是更高效,支持200k tokens的上下文长度,可以1秒内处理近3万字的文本。在各类核心能力测试中,abab 6.5开始接近GPT-4、Claude-3、Gemini-1.5等大语言模型。
相关资讯
- ▣ 将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B
- ▣ 阶跃星辰发布Step-2万亿参数MoE语言大模型预览版
- ▣ 北京深度求索公司推出首个国产开源MoE大模型
- ▣ MiniMax发布abab大模型:6.51秒内可处理近3万字文本
- ▣ 通用大模型创业硬核选手亮相 阶跃星辰发布万亿参数MoE大模型预览版
- ▣ 最神秘国产大模型团队冒泡,出手就是万亿参数MoE,2款应用敞开玩
- ▣ 全球科技早参丨微软推出轻量级AI模型
- ▣ 生数科技与清华联合推出视频大模型Vidu
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 「天工大模型3.0」4月17日正式发布——同步开源4000亿参数MoE超级模型,性能超Grok1.0
- ▣ 蚂蚁百灵大模型推出20亿参数遥感模型
- ▣ 商湯科技推出新版AI模型 股價暴漲一度暫停交易
- ▣ 5年巨亏438亿元,商汤科技“押注”大模型
- ▣ 永太科技:2023年预亏4.5亿元—6.5亿元 同比转亏
- ▣ 光迅科技联合思科推出1.6T硅光模块
- ▣ 联发科 推繁中大型语言模型
- 陸反擊美國科技戰 限制稀土技術出口
- ▣ 生数科技完成“多模态大模型”备案
- ▣ 科技早报|字节跳动推出视频模型Boximator;淘宝成立直播电商公司
- ▣ 2024年1月社会融资规模增量为6.5万亿元
- ▣ 世迈科技推出新型EDSFF E1.S企业级SSD
- 科技检测抓缺点 陈冠宇大推
- ▣ 只用0.5天,训练一个15亿参数小模型;谷歌推出新型Transformer架构|大模型周报
- ▣ 郭峰:36亿定增"腰斩",云从科技大模型研发是否受影响?
- ▣ “量子科技”横空出世,助推“万亿市场”!这5家企业迎来春天!
- 陆科技巨头华为入局AI 即将公布千亿级大模型盘古Chat
- 瑟镁科技 推仿真外科模拟训练平台
- ▣ MiniMax 国内首个 MoE 大语言模型上线 拥有处理复杂任务能力
- 聯發科推出BreeXe大型語言模型與「達哥」自動生成式AI平台