文章预览
最近看到了一个转录组-时间序列的实验设计,数据分析环节开创了TrendCatcher这个分析方法, 就安排我们马拉松授课的学员们试试看,复现一下。 结果学员在第一步就卡住了,但是并不是学员本身编程能力的问题,是数据集自己的bug。在GEO界面就可以下载到表达量矩阵文件,然后简单的读取即可: data "GSE211266_raw_count.csv.gz" , data.table = F ) data=data[!duplicated(data$V1),] mat 2 :ncol(data))] rownames(mat)=data[, 1 ] mat[ 1 : 4 , 1 : 4 ] keep_feature 1 ) > 1 ;table(keep_feature) ensembl_matrix rownames(ensembl_matrix)=rownames(mat)[keep_feature] ensembl_matrix[ 1 : 4 , 1 : 4 ] 可以看到,是一个很正常的转录组测序后的表达量count矩阵: JR-10S-RK-01 JR-10S-RK-010 JR-10S-RK-02 JR-10S-RK-03 ENSMUSG00000051951 0 18 0 9 ENSMUSG
………………………………