主要观点总结
文章介绍了DeepSeek的新版V3模型的更新情况,包括模型参数、更新内容、能力提升等方面。
关键观点总结
关键观点1: DeepSeek发布了V3模型的更新
文章介绍了DeepSeek在3月24日发布了其开源版本的新版V3模型,目前该模型已经上架开源网站,其开源许可更新为MIT开源许可。
关键观点2: 新版V3模型的能力提升
新版V3模型前端编码能力的提升是最显著的部分,据专业用户综合体验判断,其提升幅度相当于Sonnet 3.5到Sonnet 3.6的提升。同时,用户在多轮对话中也体现出了更强的上下文理解能力。
关键观点3: 新版V3模型的对比测试
用户按照提示词对新版V3与R1下达任务,实际产出的效果已经出现巨大差异。同时,与Claude 3.5/3.7的对比测试也显示了新版V3在编程能力上的优秀表现。
关键观点4: 新版V3模型的开源许可变更
新版V3的开源许可更新为MIT开源许可,这意味着新版V3有着更宽松的开源使用条件,对于希望在商业项目中使用新版V3模型的开发者来说,这是本次更新最重要的改变。
文章预览
编程能力更强了,还有呢? 作者|张勇毅 和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。 初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。 截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体
………………………………