文章预览
2025年3月1日,DeepSeek发布《One More Thing, DeepSeek-V3/R1 Inference System Overview》,其中提到通过大模型跨节点专家并行,DeepSeek实现了$87,072/天的低成本推理,有效算力得到显著提升。我们认为,随着国产算力硬件逐步适配DeepEP体系,DeepSeek模型或通过性价比优势带动推理需求释放,国产算力有望加速成长。 点击小程序查看研报原文 核心观点 核心亮点:推理成本大幅降低,理想状态下15%付费率即可盈亏平衡 据DeepSeek,V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点,DeepSeek假定GPU租赁成本为2美金/小时,总成本为$87,072/天。此外,在2025/02/27 12:00 PM至2025/02/28 12:00 PM,V3和R1模型推理消耗Token 776B(输入608B+输出168B),平均每百万Token处理成本为0.11美元。DeepSeek假设如果所有Tokens全部按照DeepSeekR1的定价计算,理论上一天的总收入为$562,027
………………………………