☰

通义千问开源Qwen2.5开源模型，累计下载量突破4000万

9月19日，阿里云CTO周靖人在云栖大会上发布了新一代开源模型Qwen2.5，该模型包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型。据报道，截至2024年9月，通义千问开源大模型在全球累计下载超过4000万次，成为仅次于Llama的开源大模型群。

针对这一事件，快递100作为大模型落地应用新范式的践行者，提出了三点观察：

第一点观察：大模型的开源和闭源并驾齐驱。自2023年8月以来，阿里千问大模型坚持走开源路线，成为目前中国开发者首选的开源模型，性能直逼Llama3。另一方面，像百度这样坚持闭源路线的公司，其百度文心大模型4.0已经在多个商业化场景中落地应用，例如快递100的AI寄快递功能就是调用了文心大模型4.0的能力。快递100认为，开源和闭源都是大模型值得探索的方向，就像iOS和安卓操作系统一样，大模型的未来走向还处于探索阶段，两种技术路线都值得探索。

第二点观察：AI仍在加速发展。上期百递观察提到，Open AI发布了o1，该模型通过优化算法引入强化学习，提升了慢思考的能力，尽管反应速度有所下降，但逻辑推理质量得到了极大提升。云栖大会上，阶跃星辰的创始人姜大昕特别提出o1的推理能力令人惊艳，月之暗面创始人杨植麟也指出o1提升了AI的上限。这些中国大模型六小虎的创业者对o1的一致肯定和认可表明，基础大模型无论在训练阶段还是在推理阶段，Scaling Law仍在发挥引领作用，大模型仍在加速发展。

第三点观察：基础大模型和大模型应用同等重要。一方面，基础大模型不断升级和提升能力，特别是o1的推出，为中国的基础大模型树立了新的标杆和能力基准，加速了国内基础大模型向o1靠拢的步伐，同时提升了基础大模型的通用能力。另一方面，行业共识认为，大模型如果不与应用结合就没有价值，因此大模型的通用能力必须与具体的商业化场景相结合，才能释放大模型的价值。从去年到今年，可以明显感受到变化，去年大家更多讨论的是大模型的基础能力，而今年则更多关注大模型的应用。随着o1的推出，基础模型能力又引发了新一波的讨论热潮。

快递100作为中国快递物流信息云服务的领导品牌，其优势在于将大模型的基础能力与快递物流信息的基础场景相结合，具体包括查快递、寄快递和管快递的场景，从而更好地赋能消费者，在真实的商业场景中体验到大模型带来的价值。

通义千问开源Qwen2.5开源模型，累计下载量突破4000万

相关资讯