讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
今天看啥  ›  专栏  ›  大语言模型和具身智体及自动驾驶

[VIT中真正有效的是什么]MetaFormer Is Actually What You Need for Vision

大语言模型和具身智体及自动驾驶  · 公众号  ·  · 2024-06-29 00:23
    

文章预览

大家早上中午晚上好,我是冯诺依0,我不得劲。 上一句话就是普普通通的打个招呼并且强化一下我的id,相比较来说,最近还是比较得劲的。 无非就是中午出去转了一圈发现周边基本上不能堂食所以只能点外卖,北京疫情越来越严重从而耽误了我去成都看live的计划,并且盼望已久的居家办公一直没有到来罢了。 接下来看一下今天这篇论文: 论文标题:MetaFormer Is Actually What You Need for Vision,很好,四舍五入也属于是*** is all you need系列。颜水成组做的一篇工作。发布于CVPR2022,目前引用量97. 颜水成也属于是深度学习这个方向的著名狠人了,代表作包括但不限于T2T和NIN。 那么这篇文章做了什么呢。 众所都周知啊,Dosovitskiy一声炮响,为CV送来了VIT。从那以后就有很多研究员努力尝试为VIT加入各种各样的空间位置先验,尝试在VIT中引入CNN中的先验。实 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览