今天看啥  ›  专栏  ›  机器学习研究组订阅

谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini

机器学习研究组订阅  · 公众号  · AI  · 2025-04-18 19:02
    

文章预览

刚刚,谷歌重磅发布首个混合推理模型——Gemini 2.5 Flash。 与Claude类似,新模型的「思考预算」可以自定义,即可开启/关闭Gemini 2.5的思考模式。 值得一提的是,关闭思考的成本直接暴降600%,而且性能还不输Gemini 2.0 Flash。 具体来说,Gemini 2.5 Flash关闭思考输出价格0.6美元/百万token,开启思考输出价格3.5美元/百万token。 当然了,思考越久,模型性能也会随之提升。 在GPQA知识问答中,新模型24k思考预算,性能提升了6%;对于代码任务(LiveCodeBench),16k思考预算性能最佳。 在多项基准测试中,Gemini 2.5 Flash再次刷新SOTA。在大模型排行榜中,Flash预览版以1392 ELO高分位居第二,与GPT-4.5-preview、Grok 3并驾齐驱。 在数学(AIME 2025/2024)、多模态推理(MMMU)、知识问答(GPQA)等基准上,Gemini 2.5 Flash完全碾压Claude 3.7 Sonnet,足以与最新o4-mini相媲美。 就模型每百 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览