阿里云通义开源视觉理解模型Qwen2.5-VL
北京商报讯(记者 魏蔚)1月28日,阿里云宣布,通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。
相关资讯
- ▣ 阿里云通义开源视觉模型Qwen2.5-VL
- ▣ 阿里云通义千问推出开源Qwen2.5-1M模型
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- 阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1
- ▣ 阿里云发布通义千问旗舰版模型Qwen2.5-Max
- ▣ 阿里云通义千问旗舰版模型Qwen2.5-Max发布
- ▣ 阿里通义千问代码模型Qwen2.5-Coder全系列正式开源
- ▣ 阿里云宣布大模型降价 通义千问视觉理解模型全线降价超80%
- ▣ 阿里云通义开源首个多模态推理模型QVQ
- ▣ 第三轮大降价 阿里云通义千问视觉理解模型降价超80%
- ▣ 阿里通义千问推出开源Qwen2.5-1M模型,长上下文处理能力显著提升
- ▣ 阿里云宣布本年度第三轮大模型降价 通义千问视觉理解模型全线降价超80%
- ▣ 阿里云通义千问发布业界首个开源多模态推理模型
- ▣ 阿里云通义开源多模态推理模型QVQ在多领域表现突出
- ▣ 通义千问开源Qwen2.5开源模型,累计下载量突破4000万
- ▣ 阿里云发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 阿里发布开源多模态模型Qwen2-VL,多项性能超越GPT-4o
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 阿里云通义开源首个多模态推理模型,OpenAI入局人形机器人 | 蓝媒GPT
- ▣ 阿里云正式发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 通义千问开源Qwen2.5
- ▣ 美股异动|阿里巴巴涨近1% 通义千问视觉理解模型全线降价超80%
- ▣ 阿里云通义千问开源
- ▣ 阿里云发布开源模型Qwen2
- ▣ AI早知道|阿里通义将发布视频大模型;元象发布MoE开源大模型
- ▣ 阿里云通义开源长文本模型及推理框架 百万Tokens处理速度提升近7倍
- ▣ 全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1
- ▣ 数智早参|苹果推出开源大模型OpenELM;阿里云宣布EMO模型上线通义APP
- 阿里开源Qwen2.5-Coder全系列模型 助力编程新手开发各类应用