看啥推荐读物
专栏名称: Python开发者
人生苦短,我用 Python。伯乐在线旗下账号「Python开发者」分享 Python 相关的技术文章、工具资源、精选课程、热点资讯等。
今天看啥  ›  专栏  ›  Python开发者

Python 爬虫:字体反爬处理

Python开发者  · 公众号  · Python  · 2018-10-13 19:50
(点击上方公众号,可快速关注)来源:老王的小船(本文来自作者的投稿,其简介见末尾)环境:Win7 +Python3.6+Pycharm2017目标:猫眼电影票房、汽车之家字体反爬的处理前言:字体反爬,也是一种常见的反爬技术,例如猫眼电影票房,汽车之家,天眼查等网站。这些网站采用了自定义的字体文件,在浏览器上正常显示,但是爬虫抓取下来的数据要么就是乱码,要么就是变成其他字符。采用自定义字体文件是CSS3的新特性,详情参考: http://www.w3school.com.cn/css3/css3_font.asp一、猫眼电影打开猫眼电影票房 https://piaofang.maoyan.com/?ver=normal ,打开浏览器开发者模式,可以看到这些票房数据在HTML代码中是显示不了的。点击上图右上角的Sources,把这个html文档下载下来,在编辑器打开 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照