今天看啥  ›  专栏  ›  金科应用研院

万变不离其宗,用这招足以筛选模型特征(附代码)

金科应用研院  · 公众号  ·  · 2020-11-30 08:31
关注“金科应用研院”,回复“礼包”领取风控资料合集文末有惊喜小福利,记得看到底呦模型开发中,特征工程占用了模型开发者接近60%-70%的工作量,同样,模型效果好与坏60%-70%与特征工程质量相关。这也是为什么有经验的模型开发人员做模型又快又好。模型特征工程中,通过业务经验变量交叉或者GBDT等算法可能衍生出成百上千个特征变量,然而最终入模的往往只有十几到几十个。那么这些入模变量是如何经过层层筛选“出人头地”的呢?这其中往往有很多可能考量:特征变量缺失率特征变量区分能力特征变量相关性/共线性特征变量是否考虑业务逻辑...其中,特征变量的区分能力这一项是百试不爽的好方法。一般情况下,如果模型中加入过多的特征往往会比较冗 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照