看啥推荐读物
专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
生物探索  ·  Nature Medicine | ...·  昨天  
BioArt  ·  Dev Cell | ...·  2 天前  
BioArt  ·  Cell | ...·  3 天前  
BioArt  ·  Cell | ...·  3 天前  
BioArt  ·  Cell | ...·  6 天前  
今天看啥  ›  专栏  ›  生信媛

使用Biopython批量运行EMBOSS的needle

生信媛  · 公众号  · 生物  · 2021-04-14 20:52
最近有一个需求,计算250条序列两两之间的相似度,之后根据相似度继续进行序列过滤,即A和B如果相似度高于一个阈值,那么就把B去掉。我最初想到的就是在Python里面调用EMBOSS的needle,准备使用Python的os或者subprocess模块,但是突然想到之前看WGDI源代码时,发现作者时通过biopython的API进行MAFFT的调用,于是就决定改用Biopython.通过查找文档,我找到了Biopython对这部分内容的介绍,见 http://biopython.org/DIST/docs/tutorial/Tutorial.html#sec97,示例代码如下from Bio.Emboss.Applications import NeedleCommandlineneedle_cline = NeedleCommandline(asequence="alpha.faa",                                  bsequence="beta.faa",                                  gapopen=10, gapextend=0.5,       ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照