今天看啥  ›  专栏  ›  生信人

三行代码get随机森林

生信人  · 公众号  · 生物  · 2021-04-06 07:40
假期结束要开始充电学习了,今天给大家分享随机森林算法。随机森林是当下非常受欢迎的机器学习算法之一,鲁棒性好且易于使用。在数据挖掘中,我们常用它来构建分类模型,今天就来看看它在科研中的实际应用。比如我们拿到了一些基因在某个疾病中的的表达谱,也有对应的样本分类,如control vs case,我们可以利用R包randomForest构建随机森林分类器,通过特征基因预测疾病分类。现在我准备了一个基因在行、样本在列的表达谱:还有对应的表型分类:为了适用于随机森林函数,我们先将表达谱和表型样本取交集,并将表达谱转置成基因在列样本在行的表达谱:sam expr expr pheno FALSE]接着设置随机种子,并构建随机森林分类模型:set.seed(111)rf TRUE, proximity = TRUE, nt ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照