今天看啥  ›  专栏  ›  大数据文摘

迷人又诡异的辛普森悖论:同一个数据集是如何证明两个完全相反的观点的?

大数据文摘  · 公众号  · 大数据  · 2018-10-25 12:01
大数据文摘出品编译:胡笳、狗小白、张弛、钱天培想象一下下面这个场景。你和你的小伙伴准备找个地方搓一顿,但在两家餐厅的选择上争执不休。于是乎,秉持“数据驱动人生”的你俩搬出了小众点评网的评分数据。你发现,你想去的这家餐厅的评分果然比另一家高。正当你得意不已的时候,你的小伙伴宣布了TA的发现:另一家餐厅的评分更高。这是咋回事呢?莫非评论网站的数据还出错了不成?事实上,你和你的小伙伴都是对的,你们只是在不知不觉中掉进了辛普森悖论的诡计。在辛普森悖论中,餐馆可以同时比竞争对手更好或更差,锻炼可以降低和增加疾病的风险,同样的数据集能够用于证明两个完全相反的论点。相比于晚上出去大餐,你和小伙伴也许更值得 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照