看啥推荐读物
专栏名称: PaperWeekly
PaperWeekly是一个分享知识和交流学问的学术组织,关注的领域是自然语言处理的各个方向。我们热爱知识,分享知识,希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。
今天看啥  ›  专栏  ›  PaperWeekly

Byte Cup 2018国际机器学习竞赛夺冠记

PaperWeekly  · 公众号  · 科研  · 2019-02-14 08:54
9 月份,我们两位同学一起组队,参加 Byte Cup 2018 机器学习比赛。本次比赛由中国人工智能学会和字节跳动主办,IEEE 中国代表处联合组织。比赛的任务是文章标题自动生成。最终,我们队伍获得了第一名。比赛介绍本次比赛的任务是给定文章文本内容,自动生成标题。本质上和文本摘要任务比较类似。本次比赛有 100 多万篇文章的训练数据。 数据介绍 详细参见:http://biendata.com/competition/bytecup2018/data/本次竞赛使用的训练集包括了约 130 万篇文本的信息,验证集 1000 篇文章, 测试集 800 篇文章。 数据处理 文章去重,训练数据中包含一些重复数据,清洗,去重; 清洗非英文文章。 评价指标 本次比赛将使用 Rouge(Recall-Oriented Understudy for Gisting Evaluation)作为模型评估 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照