看啥推荐读物
专栏名称: 数盟
数盟(数据科学家联盟)隶属于北京数盟科技有限公司,数盟致力于成为培养与发现“数据科学家”的黄埔军校。 数盟服务包括:线下活动、大数据培训。 官网:http://dataunion.org,合作:contact@dataunion.org
今天看啥  ›  专栏  ›  数盟

R 和 Python 中的文本挖掘:8 个入门小贴士

数盟  · 公众号  · 大数据  · 2017-05-19 22:17
你希望学习文本挖掘,却发现大多数教程难度跨度很大?或者说你找不到心仪的数据集?本文将会通过 8 个小贴士帮助你走进文本挖掘之门。对文本保持好奇在数据科学世界中,凡事的第一步都是“感到好奇”,文本挖掘也不例外。就像 StackOverflow 的数据科学家 David Robinson 在他的博客中说的那样,“当我看到一个假设 […] 我就迫不及待地想要用数据验证它”。你也应该像他那样对文本保持好奇心。David Robinson 看到的假设是:即使你并不打算真的去验证它,你也应该对自己看到的词云图感到好奇,并且有想要自己动手复现一遍的想法。如果你还未能感受到文本挖掘的魅力,那就来看看这些最近在媒体上广受关注的文本挖掘应用案例吧,比如 South Park dialogue, film dialogue ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照