今天看啥  ›  专栏  ›  进击的Hunter

学点NLP-Twitter舆情构建LDA模型

进击的Hunter  · 公众号  ·  · 2020-04-07 12:58
点击上方蓝色字体,关注我们2020年的开局确实比较悲惨,特别是在这几天,全球convid-19患者已超百万。那么现在。我们就通过推特抓取了350万条与virus相关的推文,看看墙外人民怎么看。🍺本篇文章大约需要3分钟来阅读,届时你或许将学到:如何善用强大的ColabTwitter API流式过滤器的使用方法部分数据清洗的方法NormalizationTokenizationStop wordsLemmatization快速生成LDA主题模型的方法在处理时我们该如何节约资源首先我们来看看社交媒体对于病毒有着怎么样的描述🤔嗯,长得真可怕。。0x01 Colab改变生活和以往的不同,为什么这次的任务推荐使用Colab呢。理由如下:我们将使用到一个Jupyter般的友好编写环境它本身拥有国外的IP,抓取Twitter数据会更省力云端跑脚本可以节省你本地 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照