通義千問2.5版問市 阿里雲自信:全面趕超GPT-4Turbo

阿里云9日发布通义千问2.5版本,并称第三方平台评测分数显示其已追平GPT-4 Turbo。(取材自澎湃号)

阿里巴巴旗下阿里云通义家族再添新成员,9日,阿里云正式发布「通义千问2.5版」,并称该模型的性能将全面赶超GPT-4 Turbo。

综合上海证券报、新华财经指出,9日,「通义千问2.5」版本在阿里云AI高峰会上正式发布。同时,阿里云公布最新数据显示,通义大模型透过阿里云服务企业已超过9万家、透过钉钉服务企业超过220万家,且截至目前通义开源模型累计下载量突破700万。

阿里云指出,相比「通义千问2.1」版本,「通义千问2.5」的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。其中,在权威基准OpenCompass上,「通义千问2.5」的得分追平GPT-4 Turbo,是该基准首次录得中国国产大模型取得该成绩。

阿里云强调,「模型效能全面追赶GPT-4 Turbo,在中文大模型方面领先业界」。同时,通义千问最新开源的1100亿参数模型在多个基准评估中收获最高得分,超越Meta的Llama-3-70B,成为开源领域中表现最佳的模型之一。

同日,在阿里云峰会上还透露,小米旗下人工智慧助理「小爱同学」已与阿里云通义大模型达成合作,要强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落实。

另外,在微博、完美世界游戏、众安保险等企业也宣布接入通义大模型,将大模型应用于社群媒体、保险、游戏等领域。据悉,此前新东方、同程旅行、长安汽车、西部机场集团、亲宝宝等企业也都与通义大模型合作。这也显示通义落实应用的进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

公开资料显示,通义大模型问世一年多以来,目前发展出文生图、智慧编码、文件解析、音视频理解等能力,企业客户和开发者可以透过API呼叫、模型下载等方式接入义,个人用户可从通义APP、官网和小程式免费使用通义家族全端服务。