专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
目录
今天看啥  ›  专栏  ›  生信技能树

如何从ENA数据库批量下载fq数据与表达矩阵(代码版)?

生信技能树  · 公众号  ·  · 2025-05-29 21:46
    

文章预览

❝ 大家知道的最多的公共数据库除了TCGA,GEO, 还有一个超大的数据库 ENA数据库 ,下面来看看如何使用代码从里面下载数据! ❞ ENA数据库官方网址: https://www.ebi.ac.uk/ FASTQ下载 下面以这个数据为例进行下载: E-MTAB-7918 ,搜索框输入项目编号: 其他信息见页面:https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-7918,可以知道这个项目是 T细胞免疫组库数据,4个样本,物种为小鼠。 选择如下: 可以得到样本的ID编号,保存到ID.txt文件中: ERR3304809 ERR3304807 ERR3304810 ERR3304808 fq的 ftp下载链接 如下,多看几个链接得到链接的规律: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/007/ERR3304807/ERR3304807_1.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/007/ERR3304807/ERR3304807_2.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/008/ERR3304808/ERR3304808_1.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/008/ERR3304808/ERR3304808_2.fa ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览