专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
今天看啥  ›  专栏  ›  PaperWeekly

COLING 2022 | CPSUM:低资源场景下的半监督文本摘要抽取式模型

PaperWeekly  · 公众号  · 科研  · 2022-10-12 13:32
©作者 | 毛乾任等单位 | 北京航空航天大学本文主要介绍我们在自然语言处理领域被 COLING 2022 接收的工作。我们提出了CPSUM,一种解决低资源场景的半监督文本摘要抽取式模型。该模型引入了数据加噪增强的一致性学习方法与熵约束伪标签学习方法,仅需要极小规模的有标签数据,结合大规模的无标签数据进行训练,较好利用了低熵分布的无标签数据来提高摘要模型决策边界的精准性,获得比有监督学习更强的泛化性能,并且极大地减少了自动摘要模型对标注数据的依赖。论文标题:Noise-injected Consistency Training and Entropy-constrained Pseudo Labeling for Semi-supervised Extractive Summarization收录会议:COLING 2022代码链接:https://github.com/OpenSUM/CPSUM背景与挑战当前比较主流的摘要任务数据集,例如 CNN/DailyMail、BBC XSUM 等,都需要大量的有标签训练数据,无论是生成式的 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照