今天看啥  ›  专栏  ›  大数据风控联盟

SAS最优特征分析

大数据风控联盟  · 公众号  · 大数据  · 2018-05-07 22:41
第二篇文章,做评分卡模型时要做特征分析,小编一般都是等频分箱。但是做一些策略时,小编经常要找出极端好和极端坏的客户所在的特征分组,于是经常要用到最优分箱来进行特征分析,以下是代码:%macro num_iv(data=,dvar=,splitsize=,maxbranch=,nsurrs=,method=,maxdepth=,dir=);*1. splitsize : 指定一个节点分割的最小观测数2. maxbranch:指定一个节点的最大分枝数 3. nsurrs :指定替代规则数4. maxdepth:指定最大的数深度5. criteion:指定决策树分割标准6. assess:指定模型评估方法;proc datasets lib=work nodetails;  delete  varname_total;run;/*建立数值型建模变量数据集*/proc sql noprint ;  select distinct name into : var_analy separated by ' ' from woe_score;  select count(*) into : var_num  from woe_score;quit;%put &var_analy.;%let var_list = &va ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照