看啥推荐读物
专栏名称: 弗雷赛斯
Freescience由浙江大学医学院几个硕博士发起创建,旨在最广泛分享有价值的科研技能和知识;FreeScience的宗旨:“科学自由分享、人人平等,共求真理”。
今天看啥  ›  专栏  ›  弗雷赛斯

“0代码”玩转TCGA,GEO数据库

弗雷赛斯  · 公众号  · 科研  · 2021-03-01 12:00
没有样本,没钱测序,如何拿别人的数据来发自己的文章呢?公共数据库挖掘呀!众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据,后者GEO数据库全称Gene Expression Omnibus database,是由美国NCBI创建并维护的基因表达数据库。它创建于2000年,论文中涉及到的基因表达检测的数据几乎都提交到了这个数据库。GEO除了二代测序数据,还包含芯片测序、单细胞测序数据,样本数据也不限于肿瘤。不同于TCGA的规整数据,GEO芯片数据由于芯片平台(公司)不同,需要进行ID转换(芯片ID对应基因)、数据标准化、去批次效应后,才能进行数据分析,这也是GEO数据挖掘的难点,很多科研萌新一看到眼花缭乱的数据,瞬间懵逼了。不过 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照