精度最高降幅60%！SOTA只是假象？CVPR2024 Highlight为你揭示CLIP和LLaVA-Next等模型“骗局”

CVHub · 公众号 · · 2024-04-13 21:05

标题：《ImageNet-D: Benchmarking Neural Network Robustness on Diffusion Synthetic Object》论文：https://arxiv.org/pdf/2403.18775.pdf主页：https://chenshuang-zhang.github.io/imagenet_d/源码：https://github.com/chenshuang-zhang/imagenet_d数据：https://drive.google.com/file/d/11zTXmg5yNjZwi8bwc541M1h5tPAVGeQc/view导读本文作为被CVPR 2024接收的论文，幸运地成为324篇Highlight之一。这篇论文提出了利用diffusion model作为data source来测评模型鲁棒性。提出的ImageNet-D数据集有效地降低state-of-art模型的测试准确率，降低幅度最高达60%，其中便包括了 CLIP，MiniGPT-4和LLaVa-NeXT等主流模型。ImageNet-D从新的角度揭露了当前模型的failure case，启发未来模型升级。同时，ImageNet-D对于未来如何利用diffusion model生成更多的测试基准提供了参考。本文第一作者Chenshuang Zhang和通讯作者Chengzhi Mao为清华大学校友，欢迎访问论文github。如果本工作 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博