|
开源中文DeepSeek-R1(满血)蒸馏数据集-110K 大模型智能 · 公众号 · · 2 月前 · 访问文章快照 |
|
从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO 大模型智能 · 公众号 · · 2 月前 · 访问文章快照 |
|
突发!o3-mini思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅 大模型智能 · 公众号 · · 2 月前 · 访问文章快照 |
|
TinyZero:首个DeepSeek R1-Zero超低成本复现,不到30刀! 大模型智能 · 公众号 · · 2 月前 · 访问文章快照 |
|
吴恩达力荐LangChain经典课程-《LangChain大型语言模型(LLM)应用开发》免费分享 大模型智能 · 公众号 · · 2 月前 · 访问文章快照 |