专栏名称: CV技术指南
长期更新:深度学习、计算机视觉相关技术的总结;图像处理相关知识;最新论文;经典论文;论文综述、tensorflow和pytorch等内容总结。涉及领域 :神经网络模型、transformer模型、目标检测、语义分割、目标跟踪、视频理解等。
今天看啥  ›  专栏  ›  CV技术指南

华中科技提出 PersonViT | 利用 Mask 图像建模的视觉 Transformer 提升人重识别性能 !

CV技术指南  · 公众号  · 科技自媒体 科技媒体  · 2024-08-25 11:35
    

主要观点总结

本文提出了基于ViT的Mask图像建模方法(PersonViT),通过将Mask图像建模和判别对比学习相结合的大规模无监督预训练,提取高质量的全局和局部特征,并进行有监督微调训练,以实现行人重识别。PersonViT在多个数据集上获得了最先进的结果,显著优于以前的方法。本文还介绍了PersonViT方法的代码和预训练模型,以促进人重识别领域的研究。同时,提供了论文指导班信息,以帮助没有导师指导的学员完成相关方向的研究和论文写作。

关键观点总结

关键观点1: PersonViT方法

提出了基于ViT的Mask图像建模方法(PersonViT),通过大规模无监督预训练提取高质量的全局和局部特征,并进行有监督微调训练,以实现行人重识别。

关键观点2: 最先进的结果

PersonViT在多个数据集上获得了最先进的结果,显著优于以前的方法。

关键观点3: 代码和预训练模型

PersonViT方法的代码和预训练模型已发布,以促进人重识别领域的研究。

关键观点4: 论文指导班信息

提供了论文指导班信息,帮助没有导师指导的学员完成相关方向的研究和论文写作。


文章预览

前言   本文将最近兴起的 Mask 图像建模(MIM)自监督学习方法引入人重识别,通过将 Mask 图像建模和判别对比学习相结合的大规模无监督预训练来有效提取高质量的全局和局部特征,然后对人称重识别任务进行有监督微调训练,提出了基于ViT的 Mask 图像建模方法(PersonViT)。 Pytorch训练营,花两个星期彻底掌握代码实现 CV各大方向专栏与各个部署框架最全教程整理 CV全栈指导班、基础入门班、论文指导班 全面上线!! PersonViT方法的代码和预训练模型已在 https://github.com/hustvl/PersonViT 发布,以促进人重识别领域的研究。 1 Introduction 人重识别(ReID)旨在从人类图像中学习视觉特征,能够区分不同的个体身份。这是一个重要且具有挑战性的计算机视觉问题,需要克服严重的遮挡、外观变化、形状变化和视点变化。人重识别技术能够在无接触和不合作的情况 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览