一个有情怀的公众号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~
今天看啥  ›  专栏  ›  机器学习算法与自然语言处理

fastText:性能比肩深度学习而且速度更快

机器学习算法与自然语言处理  · 公众号  ·  · 2019-08-10 00:00
选自 arXiv.org作者:Armand Joulin, Edouard Grave, Piotr Bojanowski, Tomas Mikolov机器之心编译参与:黄清纬、吴攀摘要本论文提出了一个简单而高效的文本分类和表征学习的方法。我们的实验证明我们的快速文本分类器 fastText 在准确度上的表现与深度学习分类器相当,并且在训练和评估上要比深度学习分类器快好几个数量级。我们可以通过使用一个标准多核 CPU 在十分钟完成对 fastText 的 10 亿多个词的训练,并在一分钟内将 50 万个句子分成 31.2 万个类别。1. 导言为文本分类构建准确的表征是一项重要的任务,具有广泛的应用场景,例如网页搜索、信息检索、排名和文档分类(Deerwester et al., 1990; Pang and Lee, 2008)。最近,基于神经网络的模型在计算句子的表征上越来越流行(Bengio et a ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照