专栏名称: 码小辫
给程序员和编程爱好者分享计算机编程电子书以及相关的学习资源
目录
今天看啥  ›  专栏  ›  码小辫

一本书读懂 DeepSeek 全家桶核心技术

码小辫  · 公众号  ·  · 2025-05-16 17:10
    

文章预览

码小辫  百 万 粉 丝认证 号 点击关注后,你不仅获得一个找资源的工具,更获得一个有趣的灵魂  ▶  ▶   ▶ 文末送书 2025 年年初, DeepSeek  成为全球人工智能( AI )领域的焦点,其 DeepSeek-V3  和DeepSeek-R1  版本在行业内引发了结构性震动。 DeepSeek-V3  是一个拥有  6710  亿个参数的混合专家模型( MoE ) ,每个 token (模型处理文本的基本单位)激活  370  亿个参数。该模型在  14.8  万亿个高质量  token上进行预训练,采用  MLA  和  MoE  架构。 DeepSeek-V3  的发布几乎没有预热和炒作,仅凭借其出色的效果和超低的成本迅速走红。 DeepSeek-R1  则是在  DeepSeek-V3  的基础上构建的推理模型,它在后训练阶段大规模使用 强化学习 技术,仅凭极少标注数据便大幅提升了模型的推理能力。在数学、代码、自然语言推理等任务上, DeepSeek-R1  的效果已可比 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览