看啥推荐读物
专栏名称: 菜鸟学Python
简简单单的Python教程,从入门,进阶技巧,爬虫数据分析,数据可视化等,以及经验和技巧的总结,趣味原创文章:破解九宫格,破解Google面试题,情人节选对象,微软面试题,弹球游戏,聊天机器人等,欢迎关注
今天看啥  ›  专栏  ›  菜鸟学Python

60个“特征工程”计算函数(Python代码)

菜鸟学Python  · 公众号  · Python  · 2024-05-12 18:51
转自:coggle数据科学近期一些朋友询问我关于如何做特征工程的问题,有没有什么适合初学者的有效操作。特征工程的问题往往需要具体问题具体分析,当然也有一些暴力的策略,可以在竞赛初赛前期可以带来较大提升,而很多竞赛往往依赖这些信息就可以拿到非常好的效果,剩余的则需要结合业务逻辑以及很多其他的技巧,此处我们将平时用得最多的聚合操作罗列在下方。最近刚好看到一篇文章汇总了非常多的聚合函数,就摘录在下方,供许多初入竞赛的朋友参考。聚合特征汇总pandas自带的聚合函数mean(): Compute mean of groupssum(): Compute sum of group valuessize(): Compute group sizescount(): Compute count of groupstd(): Standard deviation of groupsvar(): Compute variance of groupssem(): Standard error of the mean of groupsfirst(): Compute first of group valueslast(): Compute last of group valuesnth() : Take nth value, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照