看啥推荐读物
专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
今天看啥  ›  专栏  ›  生信宝典

PCA主成分分析实战和可视化 | 附R代码和测试数据

生信宝典  · 公众号  · 生物  · 2020-11-18 22:05
一文看懂PCA主成分分析中介绍了PCA分析的原理和分析的意义(基本简介如下,更多见博客),今天就用数据来实际操练一下。(注意:用了这么多年的PCA可视化竟然是错的!!!)在公众号后台回复“PCA实战”,获取测试数据。一、PCA应用# 加载需要用到的R包library(psych)library(reshape2)library(ggplot2)library(factoextra)1. 数据初始化# 基因表达数据exprData "ehbio_salmon.DESeq2.normalized.symbol.txt"# 非必须sampleFile "sampleFile"2. 数据读入# 为了保证文章的使用,文末附有数据的新下载链接,以防原链接失效data "\t")# 处理重复名字,谨慎处理,先找到名字重复的原因再决定是否需要按一下方式都保留rownames_data 1],unique=T)data 1,drop=F]rownames(data) data 0,]# 去掉方差为0 的行,这些本身没有意义,也妨碍后续 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照