专栏名称: 玉树芝兰
思考教育、写作和互联网。 我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动。
今天看啥  ›  专栏  ›  玉树芝兰

如何用Python和机器学习训练中文文本情感分类模型?

玉树芝兰  · 公众号  · 大数据  · 2018-03-13 07:24
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析。其中还会介绍中文停用词的处理方法。(由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有需要,请点击文末的“阅读原文”按钮,访问可以正常显示外链的版本。)疑惑前些日子,我在微信后台收到了一则读者的留言。我一下子有些懵——这怎么还带点播了呢?但是旋即我醒悟过来,好像是我自己之前挖了个坑。之前我写过《 如何用Python从海量文本抽取主题? 》一文,其中有这么一段:为了演示的流畅,我们这里忽略了许多细节。很多内容使用的是预置默认参数,而且完全忽略了中文停用词设置环节,因此“这个”、“如果”、“可能”、“就 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照