看啥推荐读物
专栏名称: 机器学习初学者
号主黄博Github全球排名前90,3.6万Star!致力于为初学者提供学习路线和基础资料,公众号可以当作随身小抄,文章很全,建议收藏!点击菜单可以进入学习!
今天看啥  ›  专栏  ›  机器学习初学者

【机器学习】经典!10大数据挖掘算法!

机器学习初学者  · 公众号  ·  · 2024-03-26 08:40
国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART。在此,花哥我深入介绍下这些算法的原理及实践经验,并补充介绍下当下热门的集成学习与神经网络模型。1. C4.5模型原理: C4.5 是决策树算法的一个扩展,它使用信息增益率来选择分裂属性。C4.5 可以处理连续和离散属性,并能处理具有缺失值的数据集。训练过程:从根节点开始,使用信息增益率选择最佳属性进行分裂。递归地对每个分支的子集重复上述过程,直到满足停止条件(如所有实例都属于同一类,或没有剩余属性可用)。优点:易于理解和解释。能够处理具有缺失值的数据。缺点:容易过拟合。对属性的顺序敏感。适用场景: 适用于处理连续和离散特征的分类任务, ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照