Python爬虫经典案例详解：爬取豆瓣电影top250写入Excel表格

python · 公众号 · Python · 2021-02-24 21:11

文章预览

解析数据我们需要使用BeautifulSoup这个功能模块来把充满尖括号的html数据变为更好用的格式。 from bs4 import BeautifulSoup这个是说从(from)bs4这个功能模块中导入BeautifulSoup，是的，因为bs4中包含了多个模块，BeautifulSoup只是其中一个。 soup = BeautifulSoup(html.text, 'html.parser')这句代码就是说用html解析器(parser)来分析我们requests得到的html文字内容，soup就是我们解析出来的结果。 For循环豆瓣页面上有25部电影，而我们需要抓取每部电影的标题、导演、年份等等信息。就是说我们要循环25次，操作每一部电影。for item in soup.find_all('div',"info"):就是这个意思。首先我们在豆瓣电影页面任意电影标题【右键-检查】（比如“肖申克的救赎”），打开Elements元素查看器。有需要Python学习资料的小 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

Python爱好者社区 · 生成式AI，彻底爆了！

昨天

Python爱好者社区 · 公司Rust团队全员被裁，只因把服务写得「太稳定」：“项目0故障、0报警，那养着3个Rust工程师没用啊”

昨天

槽值 · 马丽与内娱，开战

9 月前

DESAY德赛电池 · 【喜报】德赛电池荣获第23批广东省级企业技术中心认定

4 月前

福建司法 · 跨境电诈犯罪集团首要分子，顶格判处！最高法发布典型案例

3 月前