专栏名称: python
隔天更新python文章,我希望用我的努力换来劳动的成果帮助更多的人掌握一门技术,因此我要更加努力。
目录
相关文章推荐
今天看啥  ›  专栏  ›  python

Python爬取B站,咸鱼的正确 GET 姿势

python  · 公众号  · Python  · 2017-09-22 21:12
    

文章预览

分析目标 我们选定 B站的 动画区 进行测试,打开后我们发现有好多好多图.... 但当我们使用 F12 查看这些图片的时候,发现并没有图片的地址...        这就是目前大多网站使用的 Ajax 技术动态加载数据的锅,可遇到这种情况这么办呢?别急别急,我们知道这些图片的地址一定是需要加载的,而目前常见WEB传输数据的基本就是方式 XML 和 Json (其实是我就知道这两种...),那好我们去看看请求的 XML 和 Json 文件。 以下省略查找过程....     我们发现 B站的图片地址是保存在 Json 里面的,ok,我们保存好这个 json 地址: https://api.bilibili.com/x/web-interface/dynamic/region?callback=jQuery172071087417824369_1505783866149 =jsonp =15 =24 & _=1505783866453     这个是 MAD·AMV 最新动态的 Json 文件,利用上 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览