专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
今天看啥  ›  专栏  ›  极客公园

阿里开源新一代通义千问模型 Qwen3;传刘强东曾和王兴共聚晚餐;马斯克:5 年内机器人将超越外科医...

极客公园  · 公众号  · 科技媒体  · 2025-04-29 08:36
    

文章预览

阿里开源新一代通义千问模型 Qwen3 4 月 29 日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3(简称千问 3),参数量为 DeepSeek-R1 的 1/3,成本大幅下降。千问 3 是「混合推理模型」,「快思考」与「慢思考」集成进同一个模型,对简单需求可低算力「秒回」答案,对复杂问题可多步骤「深度思考」,节省算力消耗。 千问 3 总参数量 235B,激活仅需 22B。阿里称仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。 千问 3 模型版本包含 2 款 30B、235B 的 MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等 6 款密集模型。API 可按需设置「思考预算」(即预期最大深度思考的 tokens 数量),进行不同程度的思考,满足 AI 应用和不同场景对性能和成本的多样需求。比如,4B 模型面向手机端,8B 可在电脑和汽车端侧部署应用等。(来源:第一财经 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览