看啥推荐读物
专栏名称: python
隔天更新python文章,我希望用我的努力换来劳动的成果帮助更多的人掌握一门技术,因此我要更加努力。
今天看啥  ›  专栏  ›  python

Python爬虫学习笔记总结(一)

python  · 公众号  · Python  · 2018-10-17 18:59
〇. python 基础先放上python 3 的官方文档:https://docs.python.org/3/ (看文档是个好习惯)关于python 3 基础语法方面的东西,网上有很多,大家可以自行查找.一. 最简单的爬取程序爬取百度首页源代码:来看上面的代码:对于python 3来说,urllib是一个非常重要的一个模块 ,可以非常方便的模拟浏览器访问互联网,对于python 3 爬虫来说, urllib更是一个必不可少的模块,它可以帮助我们方便地处理URL.urllib.request是urllib的一个子模块,可以打开和处理一些复杂的网址The urllib.request module defines functions and classes which help in opening URLs (mostly HTTP) in a complex world — basic and digest authentication, redirections, cookies and more.urllib.request.urlopen()方法实现了打开url,并返回一个 http.client.HTTPResponse对象,通过http.client.HTTPResponse ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照