今天看啥  ›  专栏  ›  机器之心

每个Kaggle冠军的获胜法门:揭秘Python中的模型集成

机器之心  · 公众号  · AI  · 2018-01-13 13:43
选自Dataquest作者:Sebastian Flennerhag机器之心编译集成方法可将多种机器学习模型的预测结果结合在一起,获得单个模型无法匹敌的精确结果,它已成为几乎所有 Kaggle 竞赛冠军的必选方案。那么,我们该如何使用 Python 集成各类模型呢?本文作者,曼彻斯特大学计算机科学与社会统计学院的在读博士 Sebastian Flennerhag 对此进行了一番简述。在 Python 中高效堆叠模型集成(ensemble)正在迅速成为应用机器学习最热门和流行的方法。目前,几乎每一个 Kaggle 冠军的解决方案都使用了集成,很多数据科学 pipeline 也使用集成。简单来说,集成把不同模型的预测结果结合起来,生成最终预测,集成的模型越多,效果就越好。另外,由于集成结合了不同的基线预测,它们的性能至 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照