主要观点总结
本文主要讨论了关于中文互联网内容占比低、迅速衰退的说法,以及互联网语言多样性的数据存在不完善的问题。皮米恩塔及其合作者的研究表明,互联网的发展可以划分为几个阶段,目前英文内容占比实际上在下降,而中文内容在持续增长。此外,文章还讨论了互联网内容的衰退现象,包括网页的消失、搜索引擎质量的下降以及高质量信息的缺失等问题。最后,文章提到了互联网上的垃圾信息和机器人流量的增长,对信息公开和获取也产生了一定影响。
关键观点总结
关键观点1: 中文互联网内容占比低的说法存在争议,皮米恩塔的研究表明中文内容的比例并非如普遍认为的那样少。
皮米恩塔及其合作者通过新的统计方法研究了互联网语言的多样性,发现过去被广泛引用的W3Techs数据存在偏见。根据他们的研究,中文内容并没有减少,反而持续增长。
关键观点2: 互联网内容的衰退现象普遍存在,包括网页的消失和搜索引擎质量的下降。
研究发现,政府网站、新闻网站等领域存在大量无法访问的网页。此外,搜索引擎优化(SEO)业务的商业模式导致了搜索结果中充斥着大量重复、低质量的内容。
关键观点3: 高质量信息的获取变得困难,信息公开也存在下降趋势。
随着互联网的膨胀和垃圾信息的增长,搜索引擎在寻找高质量信息方面逐渐迷失。对于公开数据的透明度也出现下降,特别是科技创新方面的信息公开比例更低。
关键观点4: 机器人流量在互联网上占据越来越大的比例,给信息公开和获取带来影响。
网络安全公司的报告指出,不良机器人现在占所有流量的三分之一,它们可能干扰人类用户对信息的获取。
文章预览
6.19 知识分子 The Intellectual 图源:pixabay ● ● ● 撰文丨张天祁 “全球前100万网站中,中文网站的比例只占1.3%,英文占59.3%”; “中文网页数量仅仅略高于印尼语和越南语”; “中文网页的数量十年间下降了70%”…… 这类关于中文互联网内容占比低、迅速衰退的说法,在互联网上已经流行了很长时间。中国有超过10亿的网民,却连互联网内容的一角都占据不了,甚至还在继续倒退,这种反差感不能不让人印象深刻。这是真的吗? 有缺陷的数据 这些说法的数据都有同一个来源,监测网站W3Techs,它通过分析访问量最高的1000万个网站来确定互联网内容的语言分布。现在网上很多关于互联网语言多样性的讨论,就建立在W3Techs的数据之上。按照W3Techs的数据,英文内容始终是
………………………………