文章预览
原文发布于 2025 年 3 月 11 日 本次更新带来三大突破性进展: CodeForces-CoTs 数据集 : 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案 IOI 基准测试 : 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准 OlympicCoder 模型 : 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型 下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型) 🤯 模型性能对比图 下文将深度解析数据集构建、基准测试设计及模型训练的全过程。 🔗 核心资源链接 CodeForces 相关 题库数据集 : open-r1/codeforces https://hf.co/datasets/open-r1/codeforces DeepSeek-R1 思维链数据集 : open-r1/code
………………………………