专栏名称: 程序员大咖
为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源;提供最新最全的编程学习资料:PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。
目录
今天看啥  ›  专栏  ›  程序员大咖

Python爬虫实战:《战狼2》豆瓣影评分析

程序员大咖  · 公众号  · 程序员  · 2018-04-23 10:24
    

文章预览

点击上方“ 程序员大咖 ”,选择“置顶公众号” 关键时刻,第一时间送达! 刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在最新上映的电影里面是排行第一的,如下图所示。准备把豆瓣上对它的影评做一个分析。 目标总览 主要做了三件事: 抓取网页数据 清理数据 用词云进行展示  使用的python版本是3.5. 一、抓取网页数据 第一步要对网页进行访问,python中使用的是urllib库。代码如下: from urllib import request resp = request . urlopen ( 'https://movie.douban.com/nowplaying/hangzhou/' ) html_data = resp . read (). decode ( 'utf-8' ) 其中https://movie.douban.com/nowp...是豆瓣最新上映的电影页面,可以在浏览器中输入该网址进行查看。 html_data是字符串类型的变量,里 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览