看啥推荐读物
专栏名称: FightingCV
一个专注于分享计算机视觉、多模态机器学习方向前沿论文,解答常见科研问题,分享好用科研工具的公众号。努力努力再努力,瑞思拜!
目录
相关文章推荐
今天看啥  ›  专栏  ›  FightingCV

南大王利民团队新作 | MixFormerV2: 首个基于ViT并在CPU设备实时运行的目标跟踪器!

FightingCV  · 公众号  ·  · 2023-05-31 09:00
关注“FightingCV”公众号回复“AI”即可获得超100G人工智能的教程点击进入→ FightingCV交流群Title: MixFormerV2: Efficient Fully Transformer TrackingPaper: https://arxiv.org/pdf/2305.15896.pdfCode: https://github.com/MCG-NJU/MixFormerV2导读本文主要介绍了一种基于Transformer的目标跟踪框架。传统的三阶段模型范式,即特征提取、信息交互和位置估计。这些方法大都采用了更统一的单流模型结构来同时进行特征提取和交互,这对于建模视觉目标跟踪任务非常有效。然而,一些现代的跟踪架构过于庞大和计算昂贵,难以在实际应用中部署。为了解决这个问题,作者提出了一种名为MixFormerV2的完全Transformer跟踪框架,该框架不需要密集卷积运算和复杂的分数预测模块。该框架的设计关键是引入四个特殊的预测标记,并将它们与目标模板和搜索区域的标记连接起来。随后,作者在这些混合标 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照