DeepSeek走红致算力“饥荒”

CDCC · 公众号 · · 2025-03-04 12:29

主要观点总结

DeepSeek的出现对云计算行业产生了重大影响，基本清空了各大云厂商的闲置算力。其开源且高效的大模型推动了AI在国内的渗透率提高，并促进了云计算厂商对基础设施的投资。DeepSeek采用的开源策略也降低了使用门槛和成本，吸引了大量企业和开发者的关注。这一现象对云计算产业产生了深远变革，提升了资源利用率和云服务商的毛利率。同时，这也引发了科技行业的投资热潮，云和AI基础设施得到了更多的投资。此外，DeepSeek的影响也延伸到了相关产业链，为其他企业创造了发展机遇。

关键观点总结

关键观点1: DeepSeek基本清空主要云厂商的云端算力库存。

DeepSeek的大模型开源且高效，推动了AI在国内的普及，提高了资源利用率。

关键观点2: DeepSeek采用了开源策略，降低了使用门槛和成本，促进了云计算厂商对基础设施的投资。

开源策略吸引了企业和开发者的关注，推动了云计算行业的发展。

关键观点3: DeepSeek的出现引发了科技行业的投资热潮。

云和AI基础设施得到了更多的投资，国产算力得到了发展机遇。

关键观点4: DeepSeek对云计算产业产生了深远变革。

提升了资源利用率和云服务商的毛利率中枢，优化了产业生态。

关键观点5: 第三届数据中心液冷大会将在杭州召开。

大会将集结数据中心领域的专家、技术大牛和学术研究者，探讨创新趋势和合作机遇。

文章预览

“DeepSeek基本上把各家主要云厂商，包括运营商的云端算力库存清空了。”一家大模型研究机构的研究员对记者表示。这家机构调研国内云厂商后得出这一结论。 2024年底，DeepSeek发布了新一代大语言模型V3，并宣布开源，测试结果显示其在多项评测中表现优于主流开源模型，且具有成本优势。随后，在2025年1月20日DeepSeek发布了最新开源模型R1，再次引发全球关注。 DeepSeek-R1大模型发布后各家云计算厂商纷纷上线其满血版或者蒸馏版模型。它开源且相对高效，推动了人工智能在国内渗透率进一步提高，并促进云计算厂商加大对基础设施的投资。为什么是 DeepSeek “吃光” 算力强大性能与开源策略以DeepSeek-V3和DeepSeek-R1为例，前者是一个拥有6710亿参数的混合专家（MoE）模型，采用了多头潜在注意力（MLA）机制和DeepSeekMoE架构，在14.8万亿tokens上完成训练 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博