今天看啥  ›  专栏  ›  InfoQ

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

InfoQ  · 公众号  · 科技媒体  · 2025-04-18 11:33
    

文章预览

今天,谷歌通过 Gemini API,在 Google AI Studio 和 Vertex AI 预览中上线了 Gemini 2.5 Flash 早期版本。 Gemini 2.5 Flash 是谷歌首个完全混合式推理模型,用户可以根据需求选择是否开启“思考”功能。该模型还支持开发者设置“思考预算”,用户可以精细控制模型在思考阶段最多可生成的 token 数量,找到质量、成本与延迟之间的最佳平衡。 Gemini 2.5 Flash 的输入费用是 0.15 美元/百万token,而输出费用则根据是否启用推理差异显著: · 关闭推理时,0.60 美元/百万 token; · 启用推理时,上升至3.50 美元/百万token。 推理输出的近六倍价格差异反映了“思考”过程的计算强度,其中模型在生成响应之前会评估多种潜在路径和考虑因素。 而“思考预算”可以在 0 到 24,576 个 token 之间调整,其作用是设置上限,而非固定分配。模型会根据任务复杂程度智能决定使用多少预 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览