专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
今天看啥  ›  专栏  ›  智东西

全球开源大模型新王!阿里Qwen2.5来了,性能跨量级超Llama3.1

智东西  · 公众号  · 科技媒体  · 2024-09-19 18:56
    

主要观点总结

本文主要介绍了阿里云推出的全球最强开源大模型Qwen2.5,其性能跨量级超越Llama3.1-405B,成为新的全球开源大模型王座。文章详细描述了Qwen2.5系列模型的特点和优势,包括语言模型、视觉语言模型、编程模型和数学模型等,并且衍生大模型超过5万个。文章还提到了阿里云CTO周靖人公布的最新数据,证实了通义千问大模型的受欢迎程度和影响力。最后,文章指出开源模型正在赶超闭源模型,行业正进入新的分水岭时刻。

关键观点总结

关键观点1: Qwen2.5性能跨量级超越Llama3.1-405B,成为全球最强开源大模型。

Qwen2.5系列模型包括语言模型、视觉语言模型、编程模型和数学模型等,超过100个新上架开源模型。Qwen2.5支持高达128K的上下文长度,可生成最多8K内容,支持超29种语言。基于18T token数据预训练,Qwen2.5整体性能提升18%以上。旗舰模型Qwen2.5-72B在MMLU-rudex基准、MBPP基准和MATH基准的得分高达86.8、88.2、83.1。

关键观点2: 通义千问大模型累计下载量突破4000万,衍生大模型超过5万个。

通义千问已成为仅次于Llama的世界级模型群。截至9月初,通义原生模型和衍生模型总数超过5万个。通义大模型在服务各行各业的30多万客户中表现出色,实现了AI规模化落地。

关键观点3: 阿里云是国内唯一坚定明确模型开源开放的云巨头。

阿里云在模型突破、生态兼容、开发者服务等方面做出了巨大投入。通义大模型的开源开放策略促进了全球AI产业的发展,让众多行业和企业实现更低成本AI规模化落地。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照