专栏名称: Python开发者
人生苦短,我用 Python。伯乐在线旗下账号「Python开发者」分享 Python 相关的技术文章、工具资源、精选课程、热点资讯等。
目录
相关文章推荐
今天看啥  ›  专栏  ›  Python开发者

pyspider 爬虫教程 (2):AJAX 和 HTTP

Python开发者  · 公众号  · Python  · 2017-05-11 21:35
    

文章预览

(点击 上方蓝字 ,快速关注我们) 编译:足兆叉虫,英文:pyspider segmentfault.com/a/1190000002477870 如有好文章投稿,请点击 → 这里了解详情 在上一篇教程《 pyspider 爬虫教程 (1):HTML 和 CSS 选择 》中,我们使用 self.crawl API 抓取豆瓣电影的 HTML 内容,并使用 CSS 选择器解析了一些内容。不过,现在的网站通过使用 AJAX 等技术,在你与服务器交互的同时,不用重新加载整个页面。但是,这些交互手段,让抓取变得稍微难了一些:你会发现,这些网页在抓回来后,和浏览器中的并不相同。你需要的信息并不在返回 HTML 代码中。 在这一篇教程中,我们会讨论这些技术 和 抓取他们的方法。 AJAX AJAX 是 Asynchronous JavaScript and XML(异步的 JavaScript 和 XML)的缩写。AJAX 通过使用原 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览