今天看啥  ›  专栏  ›  大数据学习笔记

以大数据眼光欣赏唐人文墨(一)

大数据学习笔记  · 知乎专栏  ·  · 2017-03-18 21:54
Begin上次用C#把《全唐诗》和《唐诗三百首》整理成为QData格式之后,就开始进行各种分析…详细内容可以看看上次这篇文章,《用C#来学习唐诗三百首和全唐诗》接下来讲一下分析的内容,由于笔者不是很懂文学和大数据统计什么的,所以只好随便分析一通,首先分析的有:标题、作者、单字分析、还有诗句字数(也就是“五言”、“七言”)标题分析标题分析就是分析有多少首诗采用了某一个标题啦~首先是《唐诗三百首》从统计可以看到《子夜四时歌》出现的次数是最多的= =.. 虽然不懂是什么,但觉得蛮厉害的接下来看看《全唐诗》的分析结果哇,这下可就厉害了,我的《全唐诗》数据文件中共有42904首诗,虽然不全,不足以称之为“全”唐诗,但是也胜在基数之大。从分析结果看到,排名第一的标题是《句》,共有437首诗采用这个标题,看起 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照