专栏名称: CDCC
数据中心标准、技术沟通交流平台
今天看啥  ›  专栏  ›  CDCC

DeepSeek走红致算力“饥荒”

CDCC  · 公众号  ·  · 2025-03-04 12:29
    

主要观点总结

DeepSeek的出现对云计算行业产生了重大影响,基本清空了各大云厂商的闲置算力。其开源且高效的大模型推动了AI在国内的渗透率提高,并促进了云计算厂商对基础设施的投资。DeepSeek采用的开源策略也降低了使用门槛和成本,吸引了大量企业和开发者的关注。这一现象对云计算产业产生了深远变革,提升了资源利用率和云服务商的毛利率。同时,这也引发了科技行业的投资热潮,云和AI基础设施得到了更多的投资。此外,DeepSeek的影响也延伸到了相关产业链,为其他企业创造了发展机遇。

关键观点总结

关键观点1: DeepSeek基本清空主要云厂商的云端算力库存。

DeepSeek的大模型开源且高效,推动了AI在国内的普及,提高了资源利用率。

关键观点2: DeepSeek采用了开源策略,降低了使用门槛和成本,促进了云计算厂商对基础设施的投资。

开源策略吸引了企业和开发者的关注,推动了云计算行业的发展。

关键观点3: DeepSeek的出现引发了科技行业的投资热潮。

云和AI基础设施得到了更多的投资,国产算力得到了发展机遇。

关键观点4: DeepSeek对云计算产业产生了深远变革。

提升了资源利用率和云服务商的毛利率中枢,优化了产业生态。

关键观点5: 第三届数据中心液冷大会将在杭州召开。

大会将集结数据中心领域的专家、技术大牛和学术研究者,探讨创新趋势和合作机遇。


文章预览

“DeepSeek基本上把各家主要云厂商,包括运营商的云端算力库存清空了。”一家大模型研究机构的研究员对记者表示。这家机构调研国内云厂商后得出这一结论。 2024年底,DeepSeek发布了新一代大语言模型V3,并宣布开源,测试结果显示其在多项评测中表现优于主流开源模型,且具有成本优势。随后,在2025年1月20日DeepSeek发布了最新开源模型R1,再次引发全球关注。 DeepSeek-R1大模型发布后 各家云计算厂商纷纷上线其满血版或者蒸馏版模型。它开源且相对高效,推动了人工智能在国内渗透率进一步提高,并促进云计算厂商加大对基础设施的投资。 为什么是 DeepSeek “吃光” 算力 强大性能与开源策略 以DeepSeek-V3和DeepSeek-R1为例,前者是一个拥有6710亿参数的混合专家(MoE)模型 ,采用了多头潜在注意力(MLA)机制和DeepSeekMoE架构,在14.8万亿tokens上完成训练 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览