长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态,分享Python、机器学习等技术文章。回复机器学习有惊喜资料。
目录
相关文章推荐
今天看啥  ›  专栏  ›  机器学习算法与Python实战

一个超强的Python库,数据可视化、数据清洗神器!

机器学习算法与Python实战  · 公众号  ·  · 2024-02-17 10:17
klib提供了一系列非常易于应用的函数,具有合理的默认值,几乎可以用在任何DataFrame上,用于评估数据质量、获得灵感、执行数据清洗和可视化,从而更轻便、更高效的处理Python Pandas DataFrame数据。klib可视化数据-klib.cat_plot(df)  # 展示分类特征数量和频率-klib.corr_mat(df)  # 相关性矩阵-klib.corr_plot(df)  # 热力图,适用于展示相关性-klib.corr_interactive_plot(df, split="neg").show()  # 交互式相关性图表-klib.dist_plot(df)  # 每个数值特征的分布-klib.missingval_plot(df)  # 缺失值信息图例如,cat_plot,import klibimport plotlyimport pandas as pddf = pd.read_csv("./NFL_DATASET.csv").iloc[:, 10:]df_cleaned = klib.data_cleaning(df) #清洗klib.cat_plot(df_cleaned.iloc[:, 10:28], figsize=(24, 15)) #cat_plot可视化例如,展示缺省值,klib.missingval_plot(df_cleaned)再例如,corr_interactive_plot基于plotly构建交互式相关 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照