看啥推荐读物
专栏名称: Bioinfor生信云
本人为在读硕士研究生,此公共号只为分享各种测序数据的处理方法。欢迎各位老师、同学投稿。
今天看啥  ›  专栏  ›  Bioinfor生信云

宏基因组测序分析(十四) 分箱结果评估

Bioinfor生信云  · 公众号  ·  · 2023-09-05 17:05
分箱结果可以使用 checkM 检查完整性和污染度。checkM基于数据库中构建好的单拷贝基因集和进化树,将bin定位到进化树中找到参考物种,基于谱系特异的marker gene(单拷贝),进行完整性和污染度进行评估。数据准备:上一步的分箱结果参考脚本# 运行checkMcheckm lineage_wf \--threads 5 \ # 线程--tmpdir ./ \ # tmp目录路径--extension fa \ # 序列文件后缀bins \ # 输入,分箱结果目录checkm \ # 输出目录> checkM.sh.log 2>&1 # 存储日志分箱结果去冗余计算资源充足的情况下,可以将所有测序数据一起进行组装,然后分箱。但实际操作中,由于内存限制,一般会分样品或者将生物学重复放在一起进行拼接。这样就会存在多个组装和分箱结果,需要对其中重复的 bin去冗余。这个操作可以使用 dRep 实现。# 将所有分箱fasta文件存放在bin目录下# 运行dRep去冗余dereplicate  ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照