今天看啥  ›  专栏  ›  CVHub

精度最高降幅60%!SOTA只是假象?CVPR2024 Highlight为你揭示CLIP和LLaVA-Next等模型“骗局”

CVHub  · 公众号  ·  · 2024-04-13 21:05
标题:《ImageNet-D: Benchmarking Neural Network Robustness on Diffusion Synthetic Object》论文:https://arxiv.org/pdf/2403.18775.pdf主页:https://chenshuang-zhang.github.io/imagenet_d/源码:https://github.com/chenshuang-zhang/imagenet_d数据:https://drive.google.com/file/d/11zTXmg5yNjZwi8bwc541M1h5tPAVGeQc/view导读本文作为被CVPR 2024接收的论文,幸运地成为324篇Highlight之一。这篇论文提出了利用diffusion model作为data source来测评模型鲁棒性。提出的ImageNet-D数据集有效地降低state-of-art模型的测试准确率,降低幅度最高达60%,其中便包括了 CLIP,MiniGPT-4和LLaVa-NeXT等主流模型。ImageNet-D从新的角度揭露了当前模型的failure case,启发未来模型升级。同时,ImageNet-D对于未来如何利用diffusion model生成更多的测试基准提供了参考。本文第一作者Chenshuang Zhang和通讯作者Chengzhi Mao为清华大学校友,欢迎访问论文github。如果本工作 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照