专栏名称: AINLP
关注AI、NLP相关技术,关注算法研发职位和课程;回复"文章"获取历史信息;双语聊天机器人"无名";中英翻译请输入:翻译 翻译内容;自动对联,请输入:上联 上联内容;调戏夸夸聊天机器人,请求夸、求赞;查询相似词,请输入: 相似词 词条
今天看啥  ›  专栏  ›  AINLP

ner自动化打标方法

AINLP  · 公众号  ·  · 2021-02-22 12:10

文章预览

命名实体识别是文本分类的升级版,文本分类是对一整段文本进行分类,而命名实体识别则是对整段文字里所有位置的词都进行分类,我们都能体会到人工打标文本分类的痛苦,对于命名实体识别,那就可谓是有过之而无不及了,而命名实体识别本身由于泛化能力的需求,需要的数据会比文本分类更多,所以还是要多思考用尽可能少的人工,来完成标注任务,以便我们学习模型。 这里给大家介绍一种方法-词典+最大逆向匹配。这个方法不是个新玩意,在机器学习出现之前的传统方法用的就是他,词典的越是完整,召回率就会越高,至于正类的准确率,一直处于一个较高的水平,所以用这个来制作标注样本。 具体流程 首先是词典挖掘,根据具体ner任务的需求,整理出一 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览