专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
InfoTech  ·  团队准备解散了 ·  2 天前  
今天看啥  ›  专栏  ›  数据派THU

用离散标记重塑人体姿态:VQ-VAE实现关键点组合关系编码

数据派THU  · 公众号  · 大数据  · 2025-05-09 17:00
    

文章预览

来源 : Deephub Imba 本文 共5500字 ,建议阅读 6 分钟 本文介绍了使用离散标记重塑人体姿态的过程。 在人体姿态估计领域,传统方法通常将关键点作为基本处理单元,这些关键点在人体骨架结构上代表关节位置(如肘部、膝盖和头部)的空间坐标。现有模型对这些关键点的预测主要采用两种范式:直接通过坐标回归或间接通过热图(heat map,即图像空间中的密集概率分布)进行估计。尽管这些方法在实际应用中取得了显著效果,但它们往往将每个关键点作为独立单元处理,未能充分利用人体骨架结构中固有的关键点间组合关系。 如果我们转换思路,将姿态表示为一组学习到的、离散的标记(token)组合,这些标记不仅仅编码原始坐标或热图信息,而是捕获关键点之间的共享模式、对称性和结构化关系,会带来怎样的优势? 受2023年发表的研究论文《H ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览