专栏名称: python
隔天更新python文章,我希望用我的努力换来劳动的成果帮助更多的人掌握一门技术,因此我要更加努力。
目录
今天看啥  ›  专栏  ›  python

Python爬虫经典案例详解:爬取豆瓣电影top250写入Excel表格

python  · 公众号  · Python  · 2021-02-24 21:11
    

文章预览

解析数据 我们需要使用BeautifulSoup这个功能模块来把充满尖括号的html数据变为更好用的格式。 from bs4 import BeautifulSoup这个是说从(from)bs4这个功能模块中导入BeautifulSoup,是的,因为bs4中包含了多个模块,BeautifulSoup只是其中一个。 soup = BeautifulSoup(html.text, 'html.parser')这句代码就是说用html解析器(parser)来分析我们requests得到的html文字内容,soup就是我们解析出来的结果。 For循环 豆瓣页面上有25部电影,而我们需要抓取每部电影的标题、导演、年份等等信息。就是说我们要循环25次,操作每一部电影。for item in soup.find_all('div',"info"):就是这个意思。 首先我们在豆瓣电影页面任意电影标题【右键-检查】(比如“肖申克的救赎”),打开Elements元素查看器。 有需要Python学习资料的小 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览