看啥推荐读物
专栏名称: 赛尔实验室
哈尔滨工业大学社会计算与信息检索研究中心
今天看啥  ›  专栏  ›  赛尔实验室

赛尔原创@COLING2024 | LM-Combiner:通过模型改写实现更精准的语法纠错

赛尔实验室  · 公众号  · 程序员  · 2024-03-10 15:41
论文名称:LM-Combiner: A Contextual Rewriting Model for Chinese Grammatical Error Correction论文作者:王一轩,王宝鑫,刘议骏,伍大勇,车万翔*原创作者:王一轩转载须标注出处:哈工大SCIR1.背景语法纠错(GEC)是一个形式简单但充满挑战的任务[1],旨在识别并纠正输入文本中的常见语法错误。作为一个基础自然语言处理任务,语法纠错相关技术具有广泛的应用场景,如:写作助手[2]、语音识别(ASR)后处理、搜索引擎等。现有的校对模型通过基于神经翻译的序列到序列建模技术,已经能够解决一些常见的语法错误。然而受到语料匮乏、暴露偏差等因素影响[3],仍然会做出许多过度纠正。如图1所示,过度纠正即模型将原本正确的段落修改为其他正确的段落,大量过度纠正会严重影响校对系统的精确率以及用户的使用体验。图1 校对系统过度纠正的例子(其中红 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照