专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
今天看啥  ›  专栏  ›  智东西

阿里Qwen3深夜开源!8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星

智东西  · 公众号  · 科技媒体  · 2025-04-29 06:51
    

文章预览

开源大模型新王! Qwen3连发8种规格支持119种语言。 作者 |   程茜 编辑 |   心缘 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源 Qwen3系列模型 , 包含 2个MoE模型、6个稠密模型 。发布2小时,Qwen3模型在GitHub上的star数已超过 16.9k 。 其中旗舰模型 Qwen3-235B-A22B ,在编程、数学、通用能力等基准评估中的表现优于DeepSeek-R1、OpenAI o1、OpenAI o3-mini、Grok-3和Gemini-2.5-Pro等业界知名模型。 此次全新升级的Qwen3系列有以下5大关键特性: 8种参数大小的稠密与MoE模型 :0.6B、1.7B、4B、8B、14B、32B和Qwen3-235B-A22B(2350亿总参数和220亿激活参数)、Qwen3-30B-A3B(300亿总参数和30亿激活参数); 引入混合思考模式 : 用户可切换“思考模式、“非思考模式”,自己控制思考程度; 推理能力提升 :在数学、代码生成和常识逻辑 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览