性能超越GPT-4Turbo 通义千问2.5问世

阿里云日前正式发表「通义千问2.5版」,声称模型效能将全面赶超GPT-4-Turbo,成为「地表最强」中文大模型。(中新社)

大陆阿里巴巴旗下阿里云通义家族再添新成员!阿里云日前正式发表「通义千问2.5版」,同时开源通义千问1100亿参数模型,声称模型效能将全面赶超GPT-4-Turbo,成为「地表最强」中文大模型。通义千问APP也宣布更名为「通义APP」,致力于成为通情达义的人工智慧(AI)助手。

综合陆媒报导,阿里云日前举行高峰会,公布最新数据显示,通义大模型透过阿里云服务企业已超过9万家、透过钉钉服务企业超过220万家,且截至目前通义开源模型累计下载量突破700万。这也显示通义落实应用,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

阿里云指出,相比「通义千问2.1」版本,「通义千问2.5」的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。其中,在权威基准OpenCompass上,「通义千问2.5」的得分追平GPT-4 Turbo,是该基准首次录得大陆国产大模型取得该成绩。

「模型效能全面追赶GPT-4 Turbo,在中文大模型方面领先业界」,阿里云同时强调,通义千问最新开源的1100亿参数模型在多个基准评估中收获最高得分,超越Meta的Llama-3-70B,成为开源领域中表现最佳的模型之一。小米旗下AI助理「小爱同学」也已与通义大模型达成合作。

阿里云CTO周靖人介绍,当下企业应用大模型有3种模式,一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。他强调,开发者的回馈与开源社群的生态支持,是通义大模式技术进步的重要助力。

公开资料显示,通义大模型2023年4月问世以来,目前发展出文生图、智慧编码、文件解析、音视频理解等能力。企业客户和开发者可以透过API呼叫、模型下载等方式接入;个人用户可从通义APP、官网和小程式免费使用通义家族全端服务。