今天看啥  ›  专栏  ›  AI开发者

马蜂窝数据被扒光, 用 Python 爬取网页信息 4 分钟就能搞定

AI开发者  · 公众号  · AI  · 2018-10-23 18:24
本文为 AI 研习社编译的技术博客,原标题 :How to Web Scrape with Python in 4 Minutes翻译 |  M.Y. Li     校对 | 就2      整理 | 菠萝妹原文链接:https://towardsdatascience.com/how-to-web-scrape-with-python-in-4-minutes-bc49186a8460图片来自https://www.freestock.com/free-photos/illustration-english-window-blue-sky-clouds-41409346网页抓取是一种自动访问网站并提取大量信息的技术,这可以节省大量的时间和精力。在本文中我们将通过一个简单的示例来说明如何自动从New York MTA下载数百个文件。对于希望了解如何进行网页抓取的初学者来说,这是一个很好的练习。网页抓取可能会有点复杂,因此本教程将分解步骤进行教学。  New York MTA 数据我们将从这个网站下载有关纽约公共交通地铁站旋转门的数据:http://web.mta.info ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照