☰

性能超越GPT-4Turbo 通义千问2.5问世

阿里云日前正式发表「通义千问2.5版」，声称模型效能将全面赶超GPT-4-Turbo，成为「地表最强」中文大模型。（中新社）

大陆阿里巴巴旗下阿里云通义家族再添新成员！阿里云日前正式发表「通义千问2.5版」，同时开源通义千问1100亿参数模型，声称模型效能将全面赶超GPT-4-Turbo，成为「地表最强」中文大模型。通义千问APP也宣布更名为「通义APP」，致力于成为通情达义的人工智慧（AI）助手。

综合陆媒报导，阿里云日前举行高峰会，公布最新数据显示，通义大模型透过阿里云服务企业已超过9万家、透过钉钉服务企业超过220万家，且截至目前通义开源模型累计下载量突破700万。这也显示通义落实应用，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

阿里云指出，相比「通义千问2.1」版本，「通义千问2.5」的理解能力、逻辑推理、指令遵循、代码能力分别提升9％、16％、19％、10％。其中，在权威基准OpenCompass上，「通义千问2.5」的得分追平GPT-4 Turbo，是该基准首次录得大陆国产大模型取得该成绩。

「模型效能全面追赶GPT-4 Turbo，在中文大模型方面领先业界」，阿里云同时强调，通义千问最新开源的1100亿参数模型在多个基准评估中收获最高得分，超越Meta的Llama-3-70B，成为开源领域中表现最佳的模型之一。小米旗下AI助理「小爱同学」也已与通义大模型达成合作。

阿里云CTO周靖人介绍，当下企业应用大模型有3种模式，一是对大模型开箱即用，二是对大模型进行微调和持续训练，三是基于模型开发应用，其中最典型的需求是RAG，以企业数据对大模型进行知识增强。他强调，开发者的回馈与开源社群的生态支持，是通义大模式技术进步的重要助力。

公开资料显示，通义大模型2023年4月问世以来，目前发展出文生图、智慧编码、文件解析、音视频理解等能力。企业客户和开发者可以透过API呼叫、模型下载等方式接入；个人用户可从通义APP、官网和小程式免费使用通义家族全端服务。

相关资讯