百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

1月29日,基础大模型初创公司百川智能发布了超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3在中文任务上都超越了GPT-4。此外,在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上,Baichuan 3的中文效果同样超过了GPT-4,是目前中文医疗任务表现最佳的大模型。

Baichuan 3本次进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现比前任更好。