文章预览
新智元报道 编辑:编辑部 JZH 【新智元导读】 就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径! 就在刚刚,DeepSeek-Prover-V2正式发布。 此次DeepSeek-Prover-V2提供了两种模型尺寸:7B和671B参数。 DeepSeek-Prover-V2-671B: 在DeepSeek-V3-Base基础上训练,推理性能最强。 DeepSeek-Prover-V2-7B: 基于DeepSeek-Prover-V1.5-Base构建,上下文长度扩展至高达32Ktoken。 Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B GitHub:https://github.com/deepseek-ai/DeepSeek-Prover-V2/tree/main 同时,技术报告也放出了。 论文链接:https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/DeepSeek_Prover_V2.pdf 昨天,DeepSeek突然在Hugging Face上开源了671B模型,果然很快就有后续了。 数学证明大提升 此次Dee
………………………………