注册登录

看啥推荐读物

专栏名称: Python学习交流

每天更新，更新python相关的知识。希望诸君有所收获！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

菜鸟学Python · 为Python应用选择最好的Docker镜像· 昨天

Python爱好者社区 · 一个悄然崛起的国产工具，低调又强大！· 4 天前

Python开发者 · 68个Python内置函数，你不会不知道吧？· 3 天前

Python爱好者社区 · LLM RAG 杀疯了· 5 天前

AIGC开发者 · 英伟达股价暴跌！或与 Llama 3 发布有关？· 6 天前

今天看啥 › 专栏 › Python学习交流

Python的scrapy之爬取6毛小说网的圣墟！

Python学习交流 · 公众号 · Python · 2018-10-26 20:30

闲来无事想看个小说，打算下载到电脑上看，找了半天，没找到可以下载的网站，于是就想自己爬取一下小说内容并保存到本地圣墟第一章沙漠中的彼岸花 - 辰东 - 6毛小说网 http://www.6mao.com/html/40/40184/12601161.html这是要爬取的网页观察结构私信小编01 02 03 04 05 即可获取数十套PDF哦！下一章然后开始创建scrapy项目：其中sixmaospider.py:# -*- coding: utf-8 -*-import scrapyfrom ..items import SixmaoItemclass SixmaospiderSpider(scrapy.Spider): name = 'sixmaospider' #allowed_domains = ['http://www.6mao.com'] start_urls = ['http://www.6mao.com/html/40/40184/12601161.html'] #圣墟 def parse(self, response): novel_biaoti = response.xpath('//div[@id="content"]/h1/text()').extract() #print(novel_biaoti) novel_neirong=response.xpath('//div[@id="neirong"]/text()').extract() print(novel_neirong) ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

菜鸟学Python · 为Python应用选择最好的Docker镜像

昨天

Python爱好者社区 · 一个悄然崛起的国产工具，低调又强大！

4 天前

Python开发者 · 68个Python内置函数，你不会不知道吧？

3 天前

Python爱好者社区 · LLM RAG 杀疯了

5 天前

AIGC开发者 · 英伟达股价暴跌！或与 Llama 3 发布有关？

6 天前

转债君午盘纪要 · 吃肉机会又来了！

6 月前

车买买 · 大众又出了一款轿跑SUV 配R-Line套件比途观L好看10倍

3 年前

新闻晨报 · 5.5亿都在这里，看你能抢到多少

3 年前

HRunion · 7年换了13份工作的人，你敢要吗？

5 年前

剽悍晨读 · 声音好听的人，一开口就赢了

6 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号