专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
今天看啥  ›  专栏  ›  黄建同学

如何训练领域特定模型……使用 GRPO 微调 qwen2.5-c-20250504144312

黄建同学  · 微博  · AI  · 2025-05-04 14:43
    

文章预览

2025-05-04 14:43 本条微博链接 如何训练领域特定模型……使用 GRPO 微调 qwen2.5-coder-7B 看到一个如何训练领域特定模型的文章写得非常好,作者使用 GRPO 微调了 qwen2.5-coder-7B, 实现了一个生成日程表的大模型。并且不光有教程,还有代码,模型。感兴趣的同学可以参考这个学习 教程地址:huggingface.co/blog/anakin87/qwen-s ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览