文章预览
前言 最近,研究人员提出了一个更实用的问题,即开放式对象检测,该任务在没有任何对象类别输入的情况下发现未见过的对象。在本文中,作者提出了VL-SAM,一个无需额外训练的框架,结合了广义对象识别模型(即视觉-语言模型)和广义对象定位模型(即Segment-Anything模型),以解决开放式对象检测和分割任务。作者通过注意力图作为提示,将这两个广义模型连接起来。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! 来源 :计算机书童 仅用于学术分享,若侵权请联系删除 1 论文信息 题目:Training-Free Open-Ended Object Detection and Segmentation via Attention as Prompts 基于注意力作为提示的无训练开放式对象检测与分割 作者:Zhiwei Lin, Yongtao Wang, Zhi Tang 2 论文创新
………………………………