阅读文献或查询数据库的时候,经常遇到各种各样的Gene Symbol、ID、name,一个基因在不同数据库中往往有不同的名字,马甲太多,尤其是ensembl这个数据库。举例说明,非编码基因DDX11L1,它在ensembl中的名字是ENSG00000223972,但,有时候在文献中它还叫ENSG00000223972.5或ENSG00000223972.4。其实有规律可循,DDX11L1在ensembl中的ID是ENSG00000223972,在GRCh38中叫ENSG00000223972.5,而在GRCh37中叫ENSG00000223972.4。也就是说ID小数点后面数字代表ensembl版本号。在转换ID的时候要把小数点及后面的数字去掉,以免有些数据库不识别。因为NCBI不支持ensembl的基因ID,因此本文介绍一下Ensembl与NCBI Gene ID的转换工具。 1. DAVID:https://david.ncifcrf.gov/conversion.jspDAVID主要用于基因功能富集分析,它支持多种gene I
………………………………