专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小

量子位  · 公众号  · AI  · 2025-05-29 09:08
    

文章预览

鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek终于还是在端午节前来炸场了: R1更新新版本 DeepSeek-R1-0528 ,看名字你可能以为是个小版本更新,但实际上—— “在LiveCodeBench上几乎与OpenAI o3-high相当!” “讲真这其实就是R2吧。” 不怪网友们惊呼声一片,看第一波实测结果,就知道事情并不简单。 新版R1的小球弹跳实验,与旧版对比结果如下: △ 图源:𝕏@flavioAd 也能做对难倒o3、Gemini 2.5 pro、Claude 4等一众顶流大模型的数字新难题“ 9.9-9.11=? ”了。 新模型已经在HuggingFace上释出,依然是MIT协议。 官方还没有更新模型卡,不过网友们已经迅速整理出了更新亮点: 能够像Google模型一样进行深入推理 改进了写作任务——更自然、格式更好 独特的推理风格——快速且深思熟虑 长时间思考——每个任务最长能思考30-60分钟 总而言之—— 一手实测 根据Dee ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览