今天看啥  ›  专栏  ›  阿里巴巴

登顶知识、数学、编程等权威评测全球冠军!千问最强模型发布

阿里巴巴  · 公众号  · 互联网安全 科技自媒体  · 2026-01-26 23:36
    

主要观点总结

文章介绍了千问旗舰推理模型Qwen3-Max-Thinking的发布及其创新特点。

关键观点总结

关键观点1: 创下数项权威评测全球新纪录

千问新模型Qwen3-Max-Thinking在涵盖事实知识、复杂推理、指令遵循等19个公认的大模型基准测试中刷新了数项最佳表现纪录,特别在关键性能基准测试中表现优异,达到国际领先水平。

关键观点2: 通过强化学习与推理技术创新实现性能飞跃

千问新模型Qwen3-Max-Thinking进行了更大规模的强化学习后训练,并通过推理技术的系列创新,实现了性能的大幅飞跃。

关键观点3: 增强自主调用工具的原生Agent能力

Qwen3-Max-Thinking在完成初步的工具使用微调后,通过基于规则奖励与模型奖励的联合强化学习训练,拥有更智能结合工具进行思考的能力。模型可像专业人士一样边用工具边思考,提供更高水平的回答。同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

关键观点4: 用户可多渠道体验新模型服务

开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务。普通用户可通过千问PC端和网页端体验,千问APP也即将接入。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照