今天看啥  ›  专栏  ›  大数据文摘

维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

大数据文摘  · 公众号  · 大数据  · 2018-10-19 12:01
大数据文摘出品编译:狗小白、李佳、张弛、魏子敏没人否认,维基百科是现代最令人惊叹的人类发明之一。几年前谁能想到,匿名贡献者们的义务工作竟创造出前所未有的巨大在线知识库?维基百科不仅是你写大学论文时最好的信息渠道,也是一个极其丰富的数据源。从自然语言处理到监督式机器学习,维基百科助力了无数的数据科学项目。维基百科的规模之大,可称为世上最大的百科全书,但也因此稍让数据工程师们感到头疼。当然,有合适的工具的话,数据量的规模就不是那么大的问题了。本文将介绍“如何编程下载和解析英文版维基百科”。在介绍过程中,我们也会提及以下几个数据科学中重要的问题:1、从网络中搜索和编程下载数据2、运用Python库解析网络 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照