用了推理价格要贵6倍！谷歌“炒作最少但最有性价比”的Gemini Flash，狠刷网友好感度

InfoQ · 公众号 · 科技媒体 · 2025-04-18 11:33

文章预览

今天，谷歌通过 Gemini API，在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 早期版本。 Gemini 2.5 Flash 是谷歌首个完全混合式推理模型，用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”，用户可以精细控制模型在思考阶段最多可生成的 token 数量，找到质量、成本与延迟之间的最佳平衡。 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万token，而输出费用则根据是否启用推理差异显著： · 关闭推理时，0.60 美元/百万 token； · 启用推理时，上升至3.50 美元/百万token。推理输出的近六倍价格差异反映了“思考”过程的计算强度，其中模型在生成响应之前会评估多种潜在路径和考虑因素。而“思考预算”可以在 0 到 24,576 个 token 之间调整，其作用是设置上限，而非固定分配。模型会根据任务复杂程度智能决定使用多少预 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博