看啥推荐读物
专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
今天看啥  ›  专栏  ›  生信宝典

机器学习算法-随机森林之决策树R 代码从头暴力实现(3)

生信宝典  · 公众号  · 生物  · 2021-01-13 21:41
前文 (机器学习算法 - 随机森林之决策树初探(1)) 讲述了决策树的基本概念、决策评价标准并手算了单个变量、单个分组的Gini impurity。是一个基本概念学习的过程,如果不了解,建议先读一下再继续。机器学习算法-随机森林之决策树R 代码从头暴力实现(2)通过 R 代码从头暴力方式自写函数训练决策树,已决策出第一个节点。后续......再决策第二个节点、第三个节点第一个决策节点找好了,后续再找其它决策节点。如果某个分支的点从属于多个class,则递归决策。递归决策终止的条件是:再添加分支不会降低Gini impurity某个分支的数据点属于同一分类组 (Gini impurity = 0)定义函数如下:brute_descition_tree_result brute_descition_tree_result_index # 递归分支决策brute_descition_tree # 计算 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照