看啥推荐读物
专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
目录
相关文章推荐
今天看啥  ›  专栏  ›  极市平台

RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

极市平台  · 公众号  ·  · 2024-03-03 22:00
↑ 点击蓝字 关注极市平台来源丨机器之心极市导读 去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。 >>加入极市CV技术交流群,走在计算机视觉的最前沿这一次,谷歌 DeepMind 在基础模型方面又有了新动作。我们知道,循环神经网络(RNN)在深度学习和自然语言处理研究的早期发挥了核心作用,并在许多应用中取得了实功,包括谷歌第一个端到端机器翻译系统。不过近年来,深度学习和 NLP 都以 Transformer 架构为主,该架构融合了多层感知器(MLP)和多头注意力(MHA)。Transformer 已经在实践中实现了比 RNN 更好的性能,并且在利用现代硬件方面也非常高效。基于 Transformer 的大语言模型在从网络收集的海量数据集上进行训练,取得了显著的成功。纵然 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照