看啥推荐读物
专栏名称: 程序员的那些事
最有影响力的程序员自媒体,关注程序员相关话题:IT技术、IT职场、在线课程、学习资源等。
今天看啥  ›  专栏  ›  程序员的那些事

用神经网络训练一个文本分类器

程序员的那些事  · 公众号  · 程序员  · 2017-09-18 19:37
(点击上方蓝字,快速关注我们)编译:伯乐在线 - Anne90 如有好文章投稿,请点击 → 这里了解详情理解聊天机器人的工作原理是非常重要的。聊天机器人内部一个非常重要的组件就是文本分类器。我们看一下文本分类器的神经网络(ANN)的内部工作原理。多层神经网络我们将会使用2层网络(1个隐层)和一个“词包”的方法来组织我们的训练数据。文本分类有3个特点:模式匹配、算法、神经网络。虽然使用多项朴素贝叶斯算法的方法非常有效,但是它有3个致命的缺陷:这个算法输出一个分数而不是一个概率。我们可以使用概率来忽略特定阈值以下的预测结果。这类似于忽略收音机中的噪声。这个算法从一个样本中学习一个分类中包含什么,而不是一个分类中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照