看啥推荐读物
专栏名称: 计算机视觉life
兼具系统性、严谨性、易读性,分享计算机视觉、机器学习、人工智能及相关领域前沿资讯、技术干货、产业理解。
今天看啥  ›  专栏  ›  计算机视觉life

强的离谱,Transformer 杀疯了!

计算机视觉life  · 公众号  ·  · 2022-03-30 11:30
前段时间 Transformer 已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等Transformer为什么这么有实力?因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer 更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研究生的强烈兴趣。但要想啃透 CV Transformer 难度不小:一方面,Transformer 本是应用于 NLP的论文,其中很多内容都形成了共识,在论文中并不会去详细介绍这些共识内容,例如 QKV是什么,embedding 是什么等,对于其他方向的人看到这些就很难理解。尽管已经引起了极大的关注,但将其应用于其他领域时仍面临许多挑战,包括从方法论 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照