专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
目录
今天看啥  ›  专栏  ›  生信百科

R绘图之主成分分析3d

生信百科  · 公众号  · 医学  · 2017-09-04 10:23
    

主要观点总结

文章介绍了使用主成分分析(PCA)进行数据分析的过程。包括数据的来源、PCA分析的具体步骤和可视化方法。此外,文章还提到了如何处理异常数据,并分享了相关的R语言代码和包的使用。

关键观点总结

关键观点1: PCA分析的数据来源多样性

PCA分析可以用于不同类型的数据,如群体SNP数据、不同国家不同行业的经济总值、基因在多样本中的表达水平等。

关键观点2: PCA分析的结果解读

通过PCA分析,可以获得样本在实验组和对照组之间的直观分布情况,或者获得相似国家的聚类结果,或者是不同群体的相似程度等信息。

关键观点3: 异常数据对差异基因鉴定的影响

异常数据的存在会对差异基因的鉴定造成不利影响,因此在进行PCA分析之前,需要处理异常样品。

关键观点4: R语言在PCA分析中的应用

文章介绍了使用R语言进行PCA分析的具体步骤,包括建立模拟的芯片数据矩阵、进行PCA分析、可视化结果等。

关键观点5: 分享生信培训班报名信息和福利

文章还分享了生信培训班报名信息和相关福利,如生信学习资料和优惠报名等。


文章预览

我们先来看几张3d主成分分析图片: 主成分分析数据 数据来源多样化,可以是群体SNP数据、可以是不同国家不同行业经济总值、可以是基因在多样本中的表达水平。结果呢,我们可以直接获得样本在实验组和对照组之间的直观分布情况,或者获得相似国家的聚类结果,或者是不同群体的相似程度。以便于我们对数据整体进行把握,去除异常样品,否则异常数据的存在会对差异基因的鉴定造成不利影响。 软件和数据 我们先造点数据以供使用,首先用在R中建立一个模拟的芯片数据矩阵,该矩阵为10000行(10000个基因),60列(60个样本): chip.dat 这样通过正态分布函数生成随机的数据; 我把60个样本分为两组,前30列和后30列各为一组,给它们定义不同的颜色: colour ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览