今天看啥  ›  专栏  ›  Dots机构投资者社区

腾讯押注非Transformer!推理模型混合Mamba也能搞,深度思考也能秒回

Dots机构投资者社区  · 公众号  ·  · 2025-03-24 08:15
    

文章预览

本文转自微信公众号“量子位”,作者:关注前沿科技。 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 首个基于 混合Mamba架构 的超大型推理模型来了! 就在刚刚,腾讯宣布推出 自研深度思考模型混元T1正式版 ,并同步在腾讯云官网上线。 对标o1、DeepSeek R1之外,值得关注的是,混元T1正式版采用的是Hybrid-Mamba-Transformer融合模式—— 这是工业界首次将混合Mamba架构应用于超大型推理模型。 根据腾讯官方介绍,通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力,与此前已上线腾讯元宝的混元T1-preview相比,综合效果明显提升。 在MMLU-pro、CEval、AIME、Zebra Logic等中英文知识、竞赛级数学,以及逻辑推理公开基准测试中,混元T1均有比肩DeepSeek R1和OpenAI o1的分数。 (表格中,其它模型评测指标 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览