☰

百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

1月29日，基础大模型初创公司百川智能发布了超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan 3在中文任务上都超越了GPT-4。此外，在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上，Baichuan 3的中文效果同样超过了GPT-4，是目前中文医疗任务表现最佳的大模型。

Baichuan 3本次进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面表现比前任更好。

相关资讯

▣ Anthropic大模型测评首超GPT-4
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜超GPT-4o等
▣ 百川智能发布Baichuan 4及首款AI智能助手百小应
▣ 超越GPT-4，OpenAI前高管发布"最强"大模型
▣ 百川智能发布2代开源大模型，王小川：已超越LLaMA 2
▣ 科大讯飞新模型水平超越GPT-4 Turbo，还发布了一款智能批阅机
▣ 百川智能发布千亿级参数的大语言模型Baichuan3
▣ 科大讯飞宣布星火大模型4.0发布，整体性能超GPT-4 Turbo
▣ 阿里发布开源多模态模型Qwen2-VL，多项性能超越GPT-4o
▣ 百度李彦宏：文心大模型4.0在中文上已经超过了GPT-4
▣ 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
李彦宏：文心大模型4.0在中文已超过GPT-4
▣ 性能超越 GPT-4 Turbo！「商汤日日新」大升级，国产大模型超市开张了
▣ 超越GPT-4V，苹果多模态大模型上新！
▣ 智谱「超大杯」模型全家桶亮相KDD，部分任务超越GPT-4o
百度創辦人李彥宏：文心4.0中文超越GPT-4
超越华为盘古千亿模型，搜狗搜索再创中文语言理解评测CLUE世界第一
▣ OpenAI宣布发布GPT-4 Turbo模型
▣ 李彦宏：文心大模型4.0在中文上已经超过了GPT-4
▣ 数智早参｜快手可灵AI全面开放内测；Meta最强大模型超越GPT-4o
▣ 百度智能云：千帆大模型平台日均调用量超7亿次
▣ 科大讯飞星火 4.0 Turbo 发布：七大能力全面超越 GPT-4 Turbo
▣ 百度、英伟达举办智能体大赛，阿里云、中科院发布月球大模型 | 蓝媒GPT
▣ 开源大模型分水岭：Meta发布Llama 3 对标GPT-4
▣ 87 GB 大模型种子，GPT-4 缩小版，超越GPT3.5，在线体验
▣ 百度智能云发布3款轻量级大模型+2款场景大模型
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜
▣ 快手：快意通用大语言模型能力已超GPT-3.5 营销能力齐平GPT-4
▣ 中国移动千亿多模态大模型发布，「九天-九九」风趣畅聊堪比GPT-4o

DMCA | PRIVACY | s@bg3.co