看啥推荐读物

专栏名称: 程序IT圈

一个学习编程技术和读者福利共存的公众号，每天推送高质量的优秀博文和原创文章，开源项目，实用工具，面试技巧等。公众号每月至少一次读者送书福利！关注置顶，不错过精彩推送！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

Python爬取拉勾网python职位数据

程序IT圈 · 公众号 · 程序员 · 2020-02-11 13:30

爬虫目的本文想通过爬取拉勾网Python相关岗位数据，简单梳理Requests和xpath的使用方法。代码部分并没有做封装，数据请求也比较简单，所以该项目只是为了熟悉requests爬虫的基本原理，无法用于稳定的爬虫项目。爬虫工具这次使用Requests库发送http请求，然后用lxml.etree解析HTML文档对象，并使用xpath提取职位信息。Requests简介Requests是一款目前非常流行的http请求库，使用python编写，能非常方便的对网页Requests进行爬取。官网里介绍说：Requests is an elegant and simple HTTP library for Python, built for human beings.Requests优雅、简易，专为人类打造！总而言之，Requests用起来简单顺手。Requests库可以使用pip或者conda安装，本文python环境为py3.6。试试对百度首页进行数据请求：# 导入requests模块import ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博