PyEnsembl 为用户访问 Ensembl(http://www.ensembl.org/)参考基因组数据提供了一个很好的接口。可以直接从Ensembl FTP服务器下载参考基因组的GTF和FASTA文件,并且解析文件;Ensembl 并且提供了一些方法,用户可以通过基因组上位置提取对应的注释信息以及对基因组特征进行各种操作。安装pyensembl安装pip install pyensemblEnsembl数据下载#命令pyensembl install --release --species #实例pyensembl install --release 75 76 --species human使用from pyensembl import EnsemblRelease# release 77 uses human reference genome GRCh38data = EnsemblRelease(77)# will return ['HLA-A']gene_names = data.gene_names_at_locus(contig=6, position=29945884)# get all exons associated with HLA-Aexon_ids = data.exon_ids_of_gene_name('HLA-A')缓存位置设置默认缓存到目录pyense
………………………………