Open R1 项目进展第三期

Hugging Face · 公众号 · · 2025-04-03 10:30

文章预览

原文发布于 2025 年 3 月 11 日本次更新带来三大突破性进展: CodeForces-CoTs 数据集 : 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本，同时包含 C++ 和 Python 双语言解题方案 IOI 基准测试 : 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准 OlympicCoder 模型 : 7B/32B 双版本代码模型，在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能，其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型) 🤯 模型性能对比图下文将深度解析数据集构建、基准测试设计及模型训练的全过程。 🔗 核心资源链接 CodeForces 相关题库数据集 : open-r1/codeforces https://hf.co/datasets/open-r1/codeforces DeepSeek-R1 思维链数据集 : open-r1/code ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博