文章预览
❝ 大家知道的最多的公共数据库除了TCGA,GEO, 还有一个超大的数据库 ENA数据库 ,下面来看看如何使用代码从里面下载数据! ❞ ENA数据库官方网址: https://www.ebi.ac.uk/ FASTQ下载 下面以这个数据为例进行下载: E-MTAB-7918 ,搜索框输入项目编号: 其他信息见页面:https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-7918,可以知道这个项目是 T细胞免疫组库数据,4个样本,物种为小鼠。 选择如下: 可以得到样本的ID编号,保存到ID.txt文件中: ERR3304809 ERR3304807 ERR3304810 ERR3304808 fq的 ftp下载链接 如下,多看几个链接得到链接的规律: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/007/ERR3304807/ERR3304807_1.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/007/ERR3304807/ERR3304807_2.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/008/ERR3304808/ERR3304808_1.fastq.gz ftp://ftp.sra.ebi.ac.uk/vol1/fastq/ERR330/008/ERR3304808/ERR3304808_2.fa
………………………………