看啥推荐读物
专栏名称: Python程序员
最专业的Python社区,有每日推送,免费电子书,真人辅导,资源下载,各类工具。我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动
今天看啥  ›  专栏  ›  Python程序员

使用Pandas qcut 和cut分箱数据

Python程序员  · 公众号  · Python  · 2019-11-28 08:10
介绍在处理连续的数值数据时,将数据分箱成多个桶进行进一步分析通常是很有帮助的。这里有几个不同的术语,包括装桶、离散分箱、离散化或量子化。Pandas使用cut和qcut函数支持这些方法。本文将简要描述为什么要分箱数据,以及如何使用Pandas函数将连续数据转换为一组离散的桶(bucket)。与许多Pandas函数一样,cut和qcut看起来很简单,但是这些函数包含了很多功能。即使对于更有经验的用户,我认为您也会学到一些对您自己的分析有用的技巧。分箱最常见的分箱实例之一就是在创建直方图时系统在幕后为您完成的东西。下面的客户销售数据直方图显示了如何将连续的销售数据分成离散的桶(例如:$60,000 - $70,000),然后用于对账户实例进行分组和计数。下面的代码展示了 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照