看啥推荐读物
专栏名称: 程序IT圈
一个学习编程技术和读者福利共存的公众号,每天推送高质量的优秀博文和原创文章,开源项目,实用工具,面试技巧等 。公众号每月至少一次读者送书福利! 关注置顶,不错过精彩推送!
今天看啥  ›  专栏  ›  程序IT圈

Python爬取拉勾网python职位数据

程序IT圈  · 公众号  · 程序员  · 2020-02-11 13:30
爬虫目的本文想通过爬取拉勾网Python相关岗位数据,简单梳理Requests和xpath的使用方法。代码部分并没有做封装,数据请求也比较简单,所以该项目只是为了熟悉requests爬虫的基本原理,无法用于稳定的爬虫项目。爬虫工具这次使用Requests库发送http请求,然后用lxml.etree解析HTML文档对象,并使用xpath提取职位信息。Requests简介Requests是一款目前非常流行的http请求库,使用python编写,能非常方便的对网页Requests进行爬取。官网里介绍说:Requests is an elegant and simple HTTP library for Python, built for human beings.Requests优雅、简易,专为人类打造!总而言之,Requests用起来简单顺手。Requests库可以使用pip或者conda安装,本文python环境为py3.6。试试对百度首页进行数据请求:# 导入requests模块import ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照