注册
登录
看啥推荐读物
专栏名称:
CSDN
CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
知乎回答RSS订阅方法
知乎专栏 RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
新浪科技
·
【#特斯拉今年将在AI方面投入100亿美元# ...
·
2 天前
爱范儿
·
看完北京车展,我感到了一股巨大的「推背感」
·
2 天前
36氪
·
对话王田苗:万亿市场之下,大模型+机器人还有 ...
·
3 天前
新浪科技
·
【腾讯自研视景加持,#我国首台国产全动飞行模 ...
·
4 天前
新浪科技
·
【#字节跳动称没有出售TikTok计划#】 ...
·
5 天前
今天看啥
›
专栏
›
CSDN
用 Python 分析《斗破苍穹》,分析其究竟是烂片无疑还是沧海遗珠?
CSDN
·
公众号
·
科技媒体
· 2018-09-26 10:57
作者 | 量化小白H责编 | 郭芮近期根据小说《斗破苍穹》改编的同名电视剧正在热映,本文对《斗破苍穹》进行文本分析,分为两部分。首先爬取豆瓣影评进行简单分析,随后对于原创小说文本中的人物进行详细分析。影评分析爬取影评使用的也是之前《用 Python 爬取 500 条豆瓣影评,看看《蚁人2》是否有看点?》一文的代码,共爬到影评数据500条。简要概述下爬取过程,首先说明一下工具:软件 Python3.6;Packages 包括 selenium、jieba、snownlp、wordcloud。豆瓣上的影评分为两种,一种是长篇大论的影评,还有一种是短评——本文爬虫的目标就是短评,包括用户名、星级评价、日期、有用数、评论正文。主页显示45576条,但其实可见的只有500条,每页是20条短评。第一遍直接用S ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
分享到微博
推荐文章
新浪科技
·
【#特斯拉今年将在AI方面投入100亿美元#】马斯克:特斯拉今年-20240428222000
2 天前
爱范儿
·
看完北京车展,我感到了一股巨大的「推背感」
2 天前
36氪
·
对话王田苗:万亿市场之下,大模型+机器人还有四大问题未解决|36氪专访
3 天前
新浪科技
·
【腾讯自研视景加持,#我国首台国产全动飞行模拟机通过最高等级鉴定-20240426223000
4 天前
新浪科技
·
【#字节跳动称没有出售TikTok计划#】 字节跳动25日晚发文-20240425223828
5 天前
广州微博房产
·
#网友拍下夜晚还在训练的龙舟队#【感叹:#一生要强的房东为了划龙-20230506154123
12 月前
思宇MedTech
·
神经介入创业新秀!看血栓抽吸术
1 年前
文化纵横
·
章开沅: 一个中国学者对南京大屠杀的认识过程 | 文化纵横
2 年前
格斗迷
·
嚣张“小流氓”看不起老拳王,台下大打出手,台上被彻底教做人!
2 年前
勤奋的小蚁
·
醉一回
4 年前