4W搞定DeepSeek-R1-671B私有化部署方案！

Hacking黑白红 · 公众号 · 科技自媒体 · 2025-03-25 17:32

主要观点总结

本文主要介绍了腾讯玄武实验室发布的DeepSeek-R1 671B私有化部署方案，包括其使用的开源模型DeepSeek-R1 671B版本以及典型的硬件部署配置。同时，文章还介绍了大内存页技术的核心原理及其在DeepSeek部署中的意义。此外，文章还强调了CPU、内存和SSD在CPU推理方案中的重要性，并提到DeepSeek模型的特点和个人/小团队使用场景的限制。

关键观点总结

关键观点1: DeepSeek-R1 671B私有化部署方案介绍

文章介绍了腾讯玄武实验室发布的DeepSeek-R1 671B私有化部署方案，包括硬件部署配置和开源模型的使用。该方案具有成本效益，适合个人和小团队使用。

关键观点2: 大内存页技术介绍

文章详细解释了什么是大内存页技术及其核心原理，包括减少页表开销、提高TLB命中率、降低内存碎片化等。同时，文章还介绍了大内存页技术在DeepSeek部署中的意义，能够优化性能，提高内存访问效率。

关键观点3: CPU推理方案中的关键因素

文章强调了内存带宽、CPU核心数、SSD读写速度等因素在CPU推理方案中的重要性。同时，文章还介绍了玄武实验室在硬件选型中的预算分配优先级，并解释了为什么选择使用AMD EPYC 9005系列处理器。

关键观点4: DeepSeek模型的特点和使用场景

文章介绍了DeepSeek模型的特点，包括高稀疏度的MoE模型和“按需激活”机制。这种机制使得模型在实际推理时能够大幅降低对计算资源的需求，纯CPU部署成为可能。同时，文章还指出了该方案主要适用于个人和小团队使用，高并发大量用户使用场景需要高性能GPU。

文章预览

直接上干货，“腾讯玄武实验室”发布文章，不到 4 万元的 DeepSeek-R1-671B-Q8 部署方案按照开源模型 DeepSeek-R1 671B版本,B- billion(十亿），代表6710亿，典型的私有化部署方案需要 8 张 141G 的 H20，成本超过 150 万元。而该文中给出的 DeepSeek-R1 671B部署配置 MZ33-AR1（ 5950 元） EPYC 9115（5400 元）或者 EPYC 9135（7900 元） DDR5 5600MHz 64GB x 12（22800 元） 1TB SSD（338 元） 850W 电源（349 元） CPU 散热器（294 元）内存散热器（368 元）机箱（187 元）总计：35686 元（选择 EPYC 9135 则为 38186 元号主研究了下，该文部署使用了 “大内存页技术” 何为 “大内存页技术”？大内存页技术（Huge Pages）是优化计算机内存管理的核心机制，主要用于解决传统小内存页（如4KB）带来的性能瓶颈问题，在部署DeepSeek等大语言模型时能显著提升效率。 ‌一、大内存页技术的核心原 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博