专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
今天看啥  ›  专栏  ›  数据派THU

【CVPR2025】超图视觉Transformer:图像不仅仅是节点,也不仅仅是边

数据派THU  · 公众号  · 大数据  · 2025-05-01 17:00
    

文章预览

来源:专知 本文 约1000字 ,建议阅读 5 分钟 HgVT在图像分类与检索任务中均表现出色,展示了其作为高效语义视觉任务框架的潜力。 近年来,计算机视觉领域的发展凸显了视觉Transformer(ViT)在多种任务中的可扩展性,然而在适应性、计算效率以及建模高阶关系的能力之间,仍存在权衡挑战。视觉图神经网络(ViG)作为一种替代方案,通过图结构方法进行建模,但其在边生成过程中依赖的聚类算法带来了计算瓶颈。 为了解决上述问题,我们提出了一种 超图视觉Transformer(Hypergraph Vision Transformer, HgVT) ,该方法将层次化的二分超图结构引入视觉Transformer框架中,从而在保持计算效率的同时捕捉高阶语义关系。HgVT利用种群与多样性正则化动态构建超图,无需依赖聚类操作,并引入专家边池化机制以增强语义信息提取能力,并促进基于图的图像检索。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览