看啥推荐读物
专栏名称: AIGC开发者
致力于成为国内最好的Python开发者学习交流平台,这里有关于Python的国内外最新消息,每日推送有趣有料的技术干货和社区动态。 官方网站:www.python-cn.com
今天看啥  ›  专栏  ›  AIGC开发者

Python拉勾网数据采集与可视化

AIGC开发者  · 公众号  · Python  · 2018-03-06 20:59
Python中文社区Python中文开发者的精神部落全文简介本文是先采集拉勾网上面的数据,采集的是Python岗位的数据,然后用Python进行可视化。主要涉及的是爬虫&数据可视化的知识。爬虫部分先用Python来抓取拉勾网上面的数据,采用的是简单好用的requests模块。主要注意的地方是,拉勾网属于动态网页,所以会用到浏览器的F12开发者工具进行抓包。抓包以后会发现,其实网页是一个POST的形式,所以要提交数据,提交的数据如下图:真实网址是:https://www.lagou.com/jobs/positionAjax.jsonneedAddtionalResult=false&isSchoolJob=0在上图也可以轻松发现:kd是查询关键词,pn是页数,可以实现翻页。代码实现import requests # 网络请求import reimport timeimport random# post的网址url = 'https://www.lagou.com/jobs/posit ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照