吴恩达深度学习-序列模型 3.1 基础模型

prophet__ · 简书 · · 2020-02-13 16:27

本节基本上是对前两个单元的一个回顾，我们记得之前介绍RNN基础模型的时候，假设输入与输出的对象个数不等时，会使用一个先输入，后输出的模型。

模型的前半部分用于解码，后半部分用于编码。这个模型在大部分的机器翻译当中运作的效果都不错，但是可能没有办法达到最精准的效果。

RNN还经常会被用于图像的描述，此时输入的变量就变成了一个图像。我们在图像输入端后面建立一个Alexnet，然后在最后保留一个4096的全展开层，把这个4096维的向量输入到一个RNN模型里，然后逐个得出图像的语言描述。

这两个模型在生成Y的时候，有一个注意点是，要把前面生成的Y值输入到下一个生成单元当中，这样才能让他受到前面一个词的影响。

这些基础模型的效果都还不错，但是没有办法达到非常地精准，如果需要进一步的改善模型，要做一些其他的工作。

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

IT桔子 · 百度旗下昆仑芯获得新融资；边缘计算领域软硬件开发商获战略融资300万元 | 投资速递

21 小时前

基少成多 · 新债来啦！

2 天前

中国基金报 · 恒大汽车，突发！

2 天前

中国基金报 · 俄乌突发！白宫发声！

3 天前

中国基金报 · 大消息！昔日500亿独角兽，破产清算获受理！

5 天前

佰傲谷BioValley · IL-13单抗获得欧盟批准，成全球首款治疗特应性皮炎新药

6 月前

兴业研究 · 【今日推荐】保持量和价的合理适度—货币政策执行报告解读

1 年前

东方富海 · 富海系企业灵犀微光夺冠阿里全球最大规模创业大赛JUMPSTARTER｜【富海动态】

3 年前

安全客 · 2020年安卓源码编译指南及FART脱壳机谷歌全设备镜像发布

4 年前

砺石商业评论 · 中国企业互撕简史

4 年前