专栏名称: Python学习交流
每天更新,更新python相关的知识。希望诸君有所收获!
今天看啥  ›  专栏  ›  Python学习交流

如何快速入门Python爬虫

Python学习交流  · 公众号  · Python  · 2017-12-08 19:18
网络爬虫简介网络爬虫,也叫网络蜘蛛(Web Spider)。它根据网页地址(URL)爬取网页内容,而网页地址(URL)就是我们在浏览器中输入的网站链接。比如:https://www.baidu.com/,它就是一个URL。在讲解爬虫内容之前,我们需要先学习一项写爬虫的必备技能:审查元素(如果已掌握,可跳过此部分内容)。1. 审查元素在浏览器的地址栏输入URL地址,在网页处右键单击,找到检查,如下图所示:(不同浏览器的叫法不同,Chrome浏览器叫做检查,Firefox浏览器叫做查看元素,但是功能都是相同的)我们可以看到,右侧出现了一大推代码,这些代码就叫做HTML。什么是HTML?举个容易理解的例子:我们的基因决定了我们的原始容貌,服务器返回的HTML决定了网站的原始容貌。为啥 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照