今天看啥  ›  专栏  ›  赛尔实验室

赛尔原创|EMNLP 2020 融合自训练和自监督方法的无监督文本顺滑研究

赛尔实验室  · 公众号  · 程序员  · 2020-10-15 12:12
论文名称:Combining Self-Training and Self-Supervised Learningfor Unsupervised Disfluency Detection论文作者:王少磊,王重元,车万翔,刘挺原创作者:王少磊论文链接:http://ir.hit.edu.cn/~slwang/emnlp2020.pdf转载须标注出处:哈工大SCIR摘要:文本顺滑(Disfluency Detection)的目的是删除自动语音识别(ASR)结果中的不顺滑的词,从而得到更自然和通顺的句子。目前大部分在文本顺滑(Disfluency Detection)任务上的工作都严重依赖人工标注数据。在本工作中,我们首次尝试用无监督的方法来解决文本顺滑问题。我们通过结合自训练(self-training)和自监督(self-supervised)两种方法,在不采用任何有标注训练数据的情况下,取得了跟目前最好的有监督方法接近的效果。1. 任务简介及动机自动语音识别( ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照