专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
今天看啥  ›  专栏  ›  极客公园

DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议

极客公园  · 公众号  · 科技媒体  · 2025-03-24 21:36
    

主要观点总结

文章介绍了DeepSeek的新版V3模型的更新情况,包括模型参数、更新内容、能力提升等方面。

关键观点总结

关键观点1: DeepSeek发布了V3模型的更新

文章介绍了DeepSeek在3月24日发布了其开源版本的新版V3模型,目前该模型已经上架开源网站,其开源许可更新为MIT开源许可。

关键观点2: 新版V3模型的能力提升

新版V3模型前端编码能力的提升是最显著的部分,据专业用户综合体验判断,其提升幅度相当于Sonnet 3.5到Sonnet 3.6的提升。同时,用户在多轮对话中也体现出了更强的上下文理解能力。

关键观点3: 新版V3模型的对比测试

用户按照提示词对新版V3与R1下达任务,实际产出的效果已经出现巨大差异。同时,与Claude 3.5/3.7的对比测试也显示了新版V3在编程能力上的优秀表现。

关键观点4: 新版V3模型的开源许可变更

新版V3的开源许可更新为MIT开源许可,这意味着新版V3有着更宽松的开源使用条件,对于希望在商业项目中使用新版V3模型的开发者来说,这是本次更新最重要的改变。


文章预览

编程能力更强了,还有呢? 作者|张勇毅 和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。 初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。 截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览