吴恩达深度学习-序列模型 2.4 嵌入矩阵

prophet__ · 简书 · · 2020-02-06 23:27

这节课讲的是一个很巧妙的运算方法，用到了我们之前通过大量文本对单词进行特征提取训练后的值，把它变成一个矩阵，然后如何把它们再一个个提取出来的过程。

假设我们有10000个单词，总共有300个特征，那么我们会得到一个10000*300的特征矩阵，我们把它称之为E，然后我们把它跟一个one-hot矩阵相乘，你需要哪个单词，就把这个单词的值置位1，其他都置位0。

通过矩阵相乘之后，我们就可以得到这个单词的特征矩阵了，我们用e_xx来代表第xx个单词的特征矩阵，用o_xx来代表第xx个单词的one-hot矩阵。

总之，这是一个 E X o_j = e_j 的过程，也就是从嵌入矩阵当中提取某个单词的特征向量的过程。

在实际使用过程当中，我们会直接使用一个寻找某一列向量的函数来提取这个单词的特征向量，这样更快。

比如keras当中就有一个embedding layer，可以很快地从嵌入矩阵当中提取特征向量。

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

余杭发布 · 文旅何以硬核“出圈”？余杭的答案是→

2 小时前

新北方 · 大学生请5天假跨省奔丧被砍掉2天，校方回应

2 天前

新北方 · 百日咳“卷土重来”，如何有效预防？

2 天前

新北方 · 女子报警称被骗10万元，破案后送锦旗时反被抓，警察：准备买40万假币

3 天前

新北方 · 状态良好！“福宝”6月能与公众见面

4 天前

大公馆 · 什么人更容易当秘书？

2 年前

召见军 · 张作相，海航，楚天龙，万科，四方精创，2030

3 年前

中信建投证券研究 · Book Recommendations by China Securities Research

4 年前

哈希派 · 有多少比特币被「黑洞」吸走了？ | 比特币秘史

4 年前

收获 · 学习者，斜行线 ——我所认识的王安忆 | 张新颖

5 年前