看啥推荐读物
实战数据资源提供。数据实力派社区,手把手带你玩各种数据分析,涵盖数据分析工具使用,数据挖掘算法原理与案例,机器学习,R语言,Python编程,爬虫。如需发布广告请联系: hai299014
今天看啥  ›  专栏  ›  大数据挖掘DT数据分析

Python文本挖掘:基于共现提取《釜山行》人物关系

大数据挖掘DT数据分析  · 公众号  · 大数据  · 2017-09-15 19:04
大数据挖掘DT数据分析  公众号: datadw《釜山行》是一部丧尸灾难片,其人物少、关系简单,非常适合我们学习文本处理。这个项目将介绍共现在关系中的提取,使用python编写代码实现对《釜山行》文本的人物关系提取,最终利用Gephi软件对提取的人物关系绘制人物关系图。实体间的共现是一种基于统计的信息提取。关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的实体(人名),计算不同实体共同出现的次数和比率。当比率大于某一阈值,我们认为两个实体间存在某种联系。这种联系可以具体细化,但提取过程也更加复杂。因此在此课程只介绍最基础的共现网络。 1.开发环境 剧本 http://7xktmz.com1.z0.glb.clouddn.com/Train%20to%20Busan.txt字典 ht ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照