看啥推荐读物
专栏名称: 中国人工智能学会
关注中国人工智能学会官方公共账号,收取学会的科普信息、新闻动态、活动预告及人工智能领域科技前沿信息。
目录
今天看啥  ›  专栏  ›  中国人工智能学会

分享丨集合啦,NLP数据增强技术!超全资源汇总

中国人工智能学会  · 公众号  · AI  · 2020-06-29 17:04
转自 量子位白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI数据增强技术已经是CV领域的标配,比如对图像的旋转、镜像、高斯白噪声等等。但在NLP领域,针对文本的数据增强,却是不那么多见。于是,就有一位机器学习T型工程师,在现有的文献中,汇总一些NLP数据增强技术。妥妥干货,在此放送。文本替代文本替代主要是针对在不改变句子含义的情况下,替换文本中的单词,比如,同义词替换、词嵌入替换等等。接着,我们就来好好介绍一下。同义词替换顾名思义,就是在文本中随机抽取一个单词,然后再同义词库里将其替换为同义词。比如,使用WordNet数据库,将「awesome」替换为「amazing」。这个技术比较常见,在以往的论文中有很多都使用了这个技术,比如,Zhang ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照