看啥推荐读物
专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
新智元  ·  震撼!GPT-4 ...·  14 小时前  
宝玉xp  ·  转译:rabbit tech ...·  2 天前  
爱可可-爱生活  ·  【Qwen1.5 ...·  6 天前  
今天看啥  ›  专栏  ›  机器之心

解密:OpenAI和DeepMind都用的Transformer是如何工作的

机器之心  · 公众号  · AI  · 2019-04-07 11:30
选自towardsdatascience作者:Giuliano Giacaglia机器之心编译参与:Geek AI、张倩Transformer 是一种越来越流行的神经网络架构。最近,OpenAI 将 Transformer 用到了他们的语言模型中, DeepMind 也将其用到了他们为击败顶级职业玩家所设计的 AlphaStar 程序中。本文将详解这一架构的工作原理。Transformer 是为解决序列转换或神经机器翻译问题而设计的架构,该任务将一个输入序列转化为一个输出序列。 语音识别、文本转语音等问题都属于这类任务。序列转换。绿色方框代表输入,蓝色矩形代表模型,紫色方框代表输出。对于执行序列转换任务的模型来说,它们需要某种记忆能力。例如,让我们将下面的句子翻译成另一种语言:“The Transformers” are a Japanese [[hardcore punk]] band. The band was formed ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照