来源:趣味大数据本文约1400字,建议阅读12分钟本文为你介绍根据不同业务需求的数据清洗方法。数据清洗(Data cleaning)即对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。可以理解为所谓的数据清洗,也就是ELT处理,包含抽取Extract、转换Transform、加载Load这三大法宝。根据不同业务的需求,数据清洗主要包括这几种应用方法。数据清洗的8大类方法01 处理缺失值02 删除重复项03 处理离群值04 转换格式和类型05 归一化数据06 集成数据07 转换数据08 简化数据01 处理缺失值处理缺失值: 指的是在数据分析过程中处理缺失值(即数据集中缺少的数据)的方法。常通过以下几种方式完成(选择哪种方法取决于缺少的数据量和手头的具体问题),包括:删除:删除行/列中缺失的值归纳:用统计数据(均值
………………………………