今天看啥  ›  专栏  ›  DASOU

思考:Qwen3是如何实现混合推理(快慢思考)的?

DASOU  · 公众号  ·  · 2025-05-07 14:00
    

文章预览

作者:Xode https://zhuanlan.zhihu.com/p/1900555481715570305 编辑:青稞AI 仅仅用于学术分享       一、实现原理 其实混合推理模型已经有不少了,例如 Claude 3.7 Sonnet 和 Gemini 2.5 Flash,但 Qwen3 应该是开源且效果好的典例。未来这可能也是一个趋势,不需要特意区分普通模型和思考模型,而是同一个模型按需使用。 那么 Qwen3 是如何实现混合推理(Hybrid Reasoning,或者说“快/慢思考”,我们这里统一称为混合推理)的呢? 在 Qwen3 的 官方博客 [1] 中有提到,这次 Qwen3 提供了一个参数 enable_thinking,当将其设置为 True 的时候,模型就会像一般的思考模型那样开启深度思考;而将其设置为 False 的时候,模型就会像一般的模型那样快速回复。 这个 enable_thinking 的参数是在哪里作用的呢?根据官方代码示例,我们可以看到它是在 tokenizer.apply_chat_template() 这个方法中传递的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览