专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
目录
今天看啥  ›  专栏  ›  生信技能树

最讨厌这样的样品命名体系

生信技能树  · 公众号  ·  · 2025-05-30 11:50
    

文章预览

最近看到了一个转录组-时间序列的实验设计,数据分析环节开创了TrendCatcher这个分析方法, 就安排我们马拉松授课的学员们试试看,复现一下。 结果学员在第一步就卡住了,但是并不是学员本身编程能力的问题,是数据集自己的bug。在GEO界面就可以下载到表达量矩阵文件,然后简单的读取即可: data "GSE211266_raw_count.csv.gz" ,                         data.table =  F ) data=data[!duplicated(data$V1),] mat 2 :ncol(data))] rownames(mat)=data[, 1 ] mat[ 1 : 4 , 1 : 4 ] keep_feature   1 ) >  1  ;table(keep_feature) ensembl_matrix rownames(ensembl_matrix)=rownames(mat)[keep_feature] ensembl_matrix[ 1 : 4 , 1 : 4 ] 可以看到,是一个很正常的转录组测序后的表达量count矩阵:                    JR-10S-RK-01 JR-10S-RK-010 JR-10S-RK-02 JR-10S-RK-03 ENSMUSG00000051951            0            18            0            9 ENSMUSG ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览