注册登录

专栏名称: DASOU

一名算法工程师，分享工作日常和AI干货，专注深度学习。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

目录

相关文章推荐

银行螺丝钉 · 每日钉一下（存款利率下降，对股市是利好吗？） · 昨天

中国基金报 · 不要买！不要买！戴一天辐射量相当于拍117次 ... · 2 天前

中国基金报 · 德邦基金：深耕数字金融篇章，打造高质量发展新引擎 · 2 天前

银行螺丝钉 · 【干货】一图看懂2025年1季报，投顾组合基 ... · 3 天前

今天看啥 › 专栏 › DASOU

思考：Qwen3是如何实现混合推理（快慢思考）的？

DASOU · 公众号 · · 2025-05-07 14:00

文章预览

作者：Xode https://zhuanlan.zhihu.com/p/1900555481715570305 编辑：青稞AI 仅仅用于学术分享一、实现原理其实混合推理模型已经有不少了，例如 Claude 3.7 Sonnet 和 Gemini 2.5 Flash，但 Qwen3 应该是开源且效果好的典例。未来这可能也是一个趋势，不需要特意区分普通模型和思考模型，而是同一个模型按需使用。那么 Qwen3 是如何实现混合推理（Hybrid Reasoning，或者说“快/慢思考”，我们这里统一称为混合推理）的呢？在 Qwen3 的官方博客 [1] 中有提到，这次 Qwen3 提供了一个参数 enable_thinking，当将其设置为 True 的时候，模型就会像一般的思考模型那样开启深度思考；而将其设置为 False 的时候，模型就会像一般的模型那样快速回复。这个 enable_thinking 的参数是在哪里作用的呢？根据官方代码示例，我们可以看到它是在 tokenizer.apply_chat_template() 这个方法中传递的 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

银行螺丝钉 · 每日钉一下（存款利率下降，对股市是利好吗？）

昨天

中国基金报 · 不要买！不要买！戴一天辐射量相当于拍117次胸片，赶紧提醒家人...

2 天前

中国基金报 · 德邦基金：深耕数字金融篇章，打造高质量发展新引擎

2 天前

银行螺丝钉 · 【干货】一图看懂2025年1季报，投顾组合基金背后的投资秘诀

3 天前

泡泡玛特 POPMART · CRYBABY｜哭吧，放情绪自由！

8 月前

简单心理 · 「他是一个巨婴」

7 月前

澎湃新闻 · 84%！全球珊瑚正经历最严重最大范围白化现象

1 月前

新浪科技 · 【#nova14价格##nova14定价#】今天下午，nova -20250519133249

6 天前

关于移动版 · RSS之家 · 卧龙AI搜索 · 更多产品 ·

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号