专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

巧妙!一个传统技术让国产视觉基础模型直接上大分

量子位  · 公众号  · AI  · 2025-05-23 14:14
    

文章预览

金磊 发自 凹非寺 量子位 | 公众号 QbitAI 咱就是说啊, 视觉基础模型 这块儿,国产AI真就是上了个大分—— Glint-MVT ,来自格灵深瞳的最新成果。 先来看下成绩—— 线性探测 (LinearProbing): 简单来说,线性探测是一种测试预训练模型效果的小技巧,测的就是基本功扎不扎实。它的做法是: 把模型最后一部分换成简单的线性层,其他部分全部保持原样不动;然后只训练这个新加的线性层,通过它的表现来判断模型之前学到的特征好不好用。 这个测试是在26个分类测试集中跟CLIP和OpenCLIP做了对比,结果显示,国产视觉基础模型平均准确率比OpenCLIP高2.3%,比CLIP高1.1%。 再来看应用效果。 如果说视觉基础模型是一个底座,那么它的下游任务,像 “图像理解+分割一切” ,便是更为直观的效果展现。 例如下面这张图片,然后我们可以问一下AI: 你能提供 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览