注册登录

看啥推荐读物

专栏名称: 机器学习研究组订阅

连接人工智能技术人才和产业人才的交流平台

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

黄建同学 · AI在人类基因中的应用↓Profluent ...· 昨天

宝玉xp · 回复@grafiks://@grafiks: ...· 昨天

深度学习与NLP · 如何看待王健林旗下万达网络科技集团大裁员，裁 ...· 2 天前

黄建同学 · //@夏一平_Joe:百度地图V20版本很快 ...· 4 天前

量子位 · 黑照变废为宝！超能AI一句话修出创意大片，亲 ...· 5 天前

今天看啥 › 专栏 › 机器学习研究组订阅

复旦邱锡鹏组最新综述：A Survey of Transformers！

机器学习研究组订阅 · 公众号 · AI · 2021-06-13 18:12

作者丨TniL@知乎来源丨https://zhuanlan.zhihu.com/p/379057424转眼Transformer模型被提出了4年了。依靠弱归纳偏置、易于并行的结构，Transformer已经成为了NLP领域的宠儿，并且最近在CV等领域的潜能也在逐渐被挖掘。尽管Transformer已经被证明有很好的通用性，但它也存在一些明显的问题，例如：1、核心模块自注意力对输入序列长度有平方级别的复杂度，这使得Transformer对长序列应用不友好。例如一个简单的32x32图像展开就会包括1024个输入元素，一个长文档文本序列可能有成千上万个字，因此有大量现有工作提出了轻量化的注意力变体（例如稀疏注意力），或者采用“分而治之”的思路（例如引入recurrence）；2、与卷积网络和循环网络不同，Transformer结构几乎没有什么归纳偏置。这个性 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

黄建同学 · AI在人类基因中的应用↓Profluent (profluent-20240427220426

昨天

宝玉xp · 回复@grafiks://@grafiks:征求别人意见的时候不-20240427130355

昨天

深度学习与NLP · 如何看待王健林旗下万达网络科技集团大裁员，裁员超过 95%？

2 天前

黄建同学 · //@夏一平_Joe:百度地图V20版本很快就在极越01上线了#-20240424172530

4 天前

量子位 · 黑照变废为宝！超能AI一句话修出创意大片，亲妈看了都说真

5 天前

业谈债市 · 从融资看信用债市场变化—年初以来回顾与未来展望 | 国盛固收杨业伟团队

1 年前

北美学霸君 · 那个GPA跌到3.9的留学生：“我感觉自己的生活彻底完蛋了....”

2 年前

河北皇冠梨产地供应 · （2020年7.21日）各地梨区收购价格、供求信息汇总；每日更新！

3 年前

中欧商业评论 · 直播预告 | 疫情过境，房地产行业的灾后修复

4 年前

练瑜伽 · 这些公众号，比《都挺好》好看10倍，却很少人知道！

5 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号