看啥推荐读物
专栏名称: AIGC开发者
致力于成为国内最好的Python开发者学习交流平台,这里有关于Python的国内外最新消息,每日推送有趣有料的技术干货和社区动态。 官方网站:www.python-cn.com
今天看啥  ›  专栏  ›  AIGC开发者

Python爬虫大战京东商城

AIGC开发者  · 公众号  · Python  · 2017-06-20 22:29
專 欄❈爱撒谎的男孩,Python中文社区专栏作者博客:https://chenjiabing666.github.io❈主要工具scrapy BeautifulSoup requests分析步骤打开京东首页,输入裤子将会看到页面跳转到了这里,这就是我们要分析的起点我们可以看到这个页面并不是完全的,当我们往下拉的时候将会看到图片在不停的加载,这就是ajax,但是当我们下拉到底的时候就会看到整个页面加载了60条裤子的信息,我们打开chrome的调试工具,查找页面元素时可以看到每条裤子的信息都在这个标签中,如下图:接着我们打开网页源码就会发现其实网页源码只有前30条的数据,后面30条的数据找不到,因此这里就会想到ajax,一种异步加载的方式,于是我们就要开始抓包了,我们打开chrome按F12,点击上面的NetWork,然后 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照