摘要随机森林模型是以Bagging并行方法集成决策树而得到的强分类器 随机森林(Random Forest)是近年来备受青睐的机器学习方法之一。随机森林是以Bagging并行方法集成一系列决策树而训练出的强分类器,可以较好地应用于分类和回归的不同场景下。本篇报告我们将对随机森林模型进行系统性的测试,并分析它们应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。随机森林模型的构建:7阶段样本内训练与交叉验证、样本外测试 随机森林的构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期上涨概率的预测值,然后根据正确率、AUC等指标以及策略回测
………………………………