今天看啥  ›  专栏  ›  prophet__

吴恩达深度学习-序列模型 3.1 基础模型

prophet__  · 简书  ·  · 2020-02-13 16:27

本节基本上是对前两个单元的一个回顾,我们记得之前介绍RNN基础模型的时候,假设输入与输出的对象个数不等时,会使用一个先输入,后输出的模型。

模型的前半部分用于解码,后半部分用于编码。这个模型在大部分的机器翻译当中运作的效果都不错,但是可能没有办法达到最精准的效果。

RNN还经常会被用于图像的描述,此时输入的变量就变成了一个图像。我们在图像输入端后面建立一个Alexnet,然后在最后保留一个4096的全展开层,把这个4096维的向量输入到一个RNN模型里,然后逐个得出图像的语言描述。

这两个模型在生成Y的时候,有一个注意点是,要把前面生成的Y值输入到下一个生成单元当中,这样才能让他受到前面一个词的影响。

这些基础模型的效果都还不错,但是没有办法达到非常地精准,如果需要进一步的改善模型,要做一些其他的工作。




原文地址:访问原文地址
快照地址: 访问文章快照