注册登录

专栏名称: 桃子说产品

AI产品专家个人网站：https://ww...

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

纪念币预约信息 · 京剧币稳步上扬，今年还能预约！· 昨天

小易说钱 · 仅30枚！峨眉山银币！市场价最高1550元， ...· 昨天

小易说钱 · 莘莘学子的那些梦中情校，纪念币上也有！· 2 天前

纪念币预约信息 · 开始预约！2024飞龙在天纪念金券发行！· 4 天前

小易说钱 · 官方公告！24年英镑新钞6月5日正式发行！伊 ...· 4 天前

今天看啥 › 专栏 › 桃子说产品

BERT 详解（二）

桃子说产品 · 简书 · · 2019-12-27 22:34

1. BERT 结构

BERT是以 Transformer 为基础的，目前有两种变体：

BERT Base：12层(指transformer blocks)，12个 attention head，以及 1.1 亿个参数；
BERT Large：24层(指transformer blocks)，16个attention head，以及 3.4 亿个参数。

bert_01.png

2. 文本处理

BERT 加入了一组特定规则来代表模型的输入文本，每个输入的表示由三种 Embedding 求和而成， ## 表示分词：

bert_02.png

标记嵌入 (Token Embeddings) ：词向量，第一个单词是 CLS 标志，可以用于之后的分类任务，从 WordPiece 标记词汇表中学习特定标记的嵌入。
片段嵌入 (Segment Embeddings) ：用来区别两种句子，BERT 还可以将句子对作为任务的输入。这就是为什么它学习了第一个和第二个句子的嵌入，以帮助模型区分二者。在上面的例子中，所有标记为 EA 的标记都属于句 A（EB同理）。
位置嵌入 (Position Embeddings) ：BERT 学习并使用位置嵌入来表达词在句子中的位置，这些为了克服 Transformer 的限制而添加的。与 RNN 不同，Transformer 不能捕获“序列”或“顺序”信息。

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

纪念币预约信息 · 京剧币稳步上扬，今年还能预约！

昨天

小易说钱 · 仅30枚！峨眉山银币！市场价最高1550元，今晚特价798元抢！

昨天

小易说钱 · 莘莘学子的那些梦中情校，纪念币上也有！

2 天前

纪念币预约信息 · 开始预约！2024飞龙在天纪念金券发行！

4 天前

小易说钱 · 官方公告！24年英镑新钞6月5日正式发行！伊丽莎白女王改印查尔斯国王！

4 天前

菜鸟学Python · Python 实用技：将 Office 文件转为 PDF

3 年前

财闻要参 · 人生最好的投资：选对妻子

3 年前

深圳特区报 · 中国共产党深圳市第六届委员会第十一次全体会议决议

5 年前

设计邦 · 美醉了的中国风设计，每一寸空间都美得像幅画！

6 年前

超级数学建模 · 2017年数模国赛（河北赛区）成绩实时报道

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号