文章预览
编译| 机器之心(ID:almosthuman2014) 过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经有了,但 把模型部署到本地,才能真正实现独家定制 ,让 DeepSeek R1 的深度思考「 以你为主,为你所用 」。 关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。 然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。 那么,如何在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?最近一篇在海外热度很高的简明教程阐述了相关过程,原文是纯英文的文章(snowkylin.github.io/blogs/a-note-on-deepseek-r1.html),这里翻译成了中文,同时也分享给大家。 本地部署后,让DeepSeek R1「数
………………………………