专栏名称: 编程狗
编程狗,编程大牛技术分享平台。面向编程学习者,分享各类干货教程,技术大牛直播教学。
今天看啥  ›  专栏  ›  编程狗

分布式爬虫的构建方法

编程狗  · 公众号  ·  · 2018-04-10 22:29
前言 本系列文章计划分三个章节进行讲述,分别是理论篇、基础篇和实战篇。理论篇主要为构建分布式爬虫而储备的理论知识,基础篇会基于理论篇的知识写一个简易的分布式爬虫,实战篇则会以微博为例,教大家做一个比较完整且足够健壮的分布式微博爬虫。通过这三篇文章,希望大家能掌握如何构建一个分布式爬虫的方法;能举一反三,将celery用于除爬虫外的其它场景。目前基本上的博客都是教大家使用scrapyd或者scrapy-redis构建分布式爬虫,本系列文章会从另外一个角度讲述如何用requests+celery构建一个健壮的、可伸缩并且可扩展的分布式爬虫。本系列文章属于爬虫进阶文章,期望受众是具有一定Python基础知识和编程能力、有爬虫经验并且希望提升自己的同学 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照