今天看啥  ›  专栏  ›  国泰海通证券研究

国君计算机|DeepSeek开源技术提高硬件利用率

国泰海通证券研究  · 公众号  · 证券  · 2025-03-03 22:00
    

文章预览

投资建议: DeepSeek连续开源的FlashMLA和DeepEP技术显著提升了现有GPU利用效率,降低了AI应用开发和部署成本。技术开源将使提供GPU云服务的厂商将直接受益,其服务器利用率和单位算力产出有望提升;专注于AI应用开发的公司也将受益于开发成本降低和应用场景拓展;同时,国产大模型厂商有机会借鉴这些优化思路,加速自身技术迭代,缩小与国际领先水平的差距。 FlashMLA和DeepEP展现了对硬件资源的极致利用。 FlashMLA针对Hopper架构深度优化,在H800 SXM5实现3000 GB/s内存带宽和580 TFLOPS计算能力。DeepEP则是为混合专家模型(MoE)和专家并行(EP)设计的通信库,支持高吞吐量且低延迟的all-to-all GPU内核。软件优先的思路在高端AI芯片供应受限环境下尤为重要,通过算法和软件优化提升现有硬件效能,为国内AI基础设施建设提供了可行的替代路径,展示了资源约束下 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览