看啥推荐读物
专栏名称: DumplingLucky
学习笔记<br>研究方向: 植物群体基因组学...
今天看啥  ›  专栏  ›  DumplingLucky

PHYLONET构建网状系统进化树

DumplingLucky  · 简书  ·  · 2021-04-29 12:02

发表文章: PhyloNet: a software package for analyzing and reconstructing reticulate evolutionary relationships
不同于生命之树(tree of life)理论, 生命之网(web of life)理论认为生物的演化过程是一个由遗传交换构成的网状模式, 系统发育网络允许节点(系统进化中的祖先种)间的网状连接, 体现杂交或其他网状进化的存在, 它在更普遍的意义上概括了遗传交换对生物多样性产生和维持的重要作用。
分析案例:

1. 软件特点

PhyloNet ( http://bioinfo . cs.rice.edu/phylonet/ )是这类方法的一个重要软件工具,它利用最大似然算法, 基于一系列基因位点信息,同时考虑了杂交和不完全谱系分选,也被称为 多物种网络溯祖 ,估算系统发育网络。它的计算量很大, 对超过10个分类群或4次潜在杂交事件的分析工作就不适用了。SNaQ (species networks applying quartets)算法通过计算假似然性(pseudolikelihood)极大提高了计算效能, 可以应用于有数十分类单位、数千位点的项目, 并且可以估算出大量的潜在杂交事件, 同时应对不完全谱系分选的存在。该方法对应的软件包叫做PhyloNetworks ( https://github.com/crsl4/PhyloNetworks.jl/ )。

2. 软件下载安装

PhyloNet需要在Java 1.8.0或更高版本下运行。

#下载jar包
wget https://bioinfocs.rice.edu/sites/g/files/bxs266/f/kcfinder/files/PhyloNet_3.8.2.jar
#基本使用方法:script.nex是包含要执行的命令的NEXUS文件。
java -jar $PHYLONET_DIRECTORY/PhyloNet_X.Y.Z.jar script.nex

3. 软件运行

(1)为候选的物种进化树打分,主要介绍似然法,链接里面提供了使用方法,参数设置等。

简约法
Scoring a species tree (ILS): DeepCoalCount_tree
Scoring a species tree/network (ILS+introgression): DeepCoalCount_network
似然法
Scoring a species tree/network (ILS+introgression): CalGTProb

#用法
CalGTProb network_ident geneTreeList [-a taxa map] [-b threshold] [-bl] [-o] [-p (rel,abs)] [-r maxRounds] [-t maxTryPerBr] [-i improveThreshold] [-l maxBL] [-x numRuns] [-pl numProcessors] [-m ac|mul] [resultOutputFile]

参数解读

network_ident: 网络的名称。(必须参数)
geneTreeList: 基因树标识符的逗号分隔列表或基因树标识符集的逗号分隔列表。(必须参数)
-m: ac或mul指定用于计算的算法。默认值为ac。
-a: 基因树/物种树类群。
-b: 指定基因树引导阈值。支持率低于阈值的基因树中的边缘将收缩。可选的
-bl: 在可选的计算中需要考虑输入基因树的分支长度
-o: 网络只有拓扑,因此需要优化其分支长度和继承概率。最佳
-p(rel,abs)布伦特算法的原始停止准则。默认值为(0.01,0.001)。
-r maxRound: 用于优化网络拓扑的分支长度的最大回合数。预设值为100。
-t maxTryPerBr: 一轮中每个分支的最大尝试次数,以优化网络拓扑的分支长度。预设值为100。
-i: 改善阈值,继续进行下一轮分支长度优化的最小改进阈值。默认值为0.001。
-l maxBL: 考虑的最大分支长度。预设值为6。
-x numRuns: 优化分支长度和继承概率的运行次数。预设值为5。
-pl numProcessors: 如果要并行执行计算,则为处理器数量。预设值为1。

例子

#NEXUS
 
BEGIN NETWORKS;
 
Network net = ((((B)#H1,E),(C,A)),(#H1,D));
 
END;
 
 
BEGIN TREES;
 
Tree geneTree1 = ((C:3,((B:1,D:1):1,A:2):1):1,E:4);
Tree geneTree2 = (B:4,(D:3,(C:2,(A:1,E:1):1):1):1);
Tree geneTree3 = (D:4,(B:3,((C:1,E:1):1,A:2):1):1);
Tree geneTree4 = (D:3,((B:1,E:1):1,(C:1,A:1):1):1);
 
END;
 
 
BEGIN PHYLONET;
 
CalGTProb net (geneTree1,geneTree2,geneTree3,geneTree4) -bl -o;
 
END;

(2)推断物种进化树,链接里面提供了使用方法,参数设置等。

最大简约法
Inferring a species tree (ILS): Infer_ST_MDC , Infer_ST_MDC_UR
Inferring a species tree/network (ILS+introgression): InferNetwork_MP
最大似然法
Inferring a species tree/network (ILS+introgression): InferNetwork_ML
inferring a species tree/network (ILS+introgression) with cross-validation: InferNetwork_ML_CV
最大伪似然法
Inferring a species tree/network (ILS+introgression): InferNetwork_MPL
贝叶斯法
Inferring a species tree/network (ILS+introgression): MCMC_GT
Inferring a species tree/network (ILS+introgression) from multilocus data: MCMC_SEQ
Inferring a species tree/network (ILS+introgression) from bi-allelic marker data: MCMC_BiMarkers
最大数据集法
Inferring a species tree/network (ILS+introgression) by divide-and-conquer: NetMerger
Inferring a species tree/network (ILS+introgression) while fixing the start tree topology: InferNetwork_MPL (-fs) and InferNetwork_MP (-fs)

(3)比较和总结

Summarizing networks: SummarizeNetworks

4. Phylonet结果可视化

系统发生网络可以在Dendroscope或icytree中可视化。 前者需要下载到本地,后者是在线软件。 但是,Dendroscope无法识别inheritance probabilities,可以识别枝长,而icytree有时可以,有时不能。 需要从Newick文件中手动删除这些概率,或者使用选项“ -di”,以便PhyloNet返回Dendroscope直接采用的网络。
例如,PhyloNet返回以下网络:

((F:12.842,((L:5.576504712905155,((O:1.2260000000000002,P:1.2260000000000002)I6:0.8559999999999997,K:2.082)I2:3.4945047129051554)I0:0.08027116443257487)I8#H1:7.18522412266227::0.4334172270375128)I1:19.128,(I8#H1:1.81722412266227::0.5665827729624873,C:7.474)I4:24.496000000000002)I7;

删除“ ::”及其后的数字后,就可以在两个工具中可视化。

((F:12.842,((L:5.576504712905155,((O:1.2260000000000002,P:1.2260000000000002)I6:0.8559999999999997,K:2.082)I2:3.4945047129051554)I0:0.08027116443257487)I8#H1:7.18522412266227)I1:19.128,(I8#H1:1.81722412266227,C:7.474)I4:24.496000000000002)I7;

参考:
https://bioinfocs.rice.edu/phylonet
https://www.biodiversity-science.net/EN/lexeme/showArticleByLexeme.do?articleID=8999
https://wiki.rice.edu/confluence/pages/viewpage.action?pageId=39500205




原文地址:访问原文地址
快照地址: 访问文章快照