看啥推荐读物
专栏名称: 高通量测序技术
主要介绍以下内容: 传统生信技术,如序列比对,进化树构建,基因结构预测等; 常用数据库教程,如PubMed,NCBI中的序列信息,Ensembl,UCSC Genome Browser,Uniport 等等; 高通量测序技术,如测序方法,比对算法,软件用法,分析流程详解,数据格式等等; Python编程,对于常见生信数据的处理方法; R可视化,将分析好的数据进行可视化,前期主要介绍R的基本用法,后期结合实际例子进行常用的R可视化专题,如手把手教你写自己的heatmap函数分析差异基因等等; Deep Learning部分,介绍Deep Learning在生信中的应用; 癌症基因组学部分。
今天看啥  ›  专栏  ›  高通量测序技术

生物信息学100个基础问题 —— 第12题 trim与cutadapt 先用哪个?

高通量测序技术  · 知乎专栏  · 生物  · 2018-03-29 09:21
Hello大家好!我们又见面了!上一次我们说到了cutadapt软件的使用问题,其中我们着重强调了1个参数-m,不知道大家还有没有印象。今天我们问题就是要使用-m参数和另一个工具联合的一个妙用。不过在这之前,我们还得先介绍1个工具箱叫fastx_toolkit.fastx_toolkit是一个系列内容的软件包,其中主要的内容是对比对前的fastq文件做质控。比如切掉一些不要的内容(fastx_trimmer),比如FASTQ与FASTA格式的转换(fastq_to_fasta),比如分单链测序的index(fastx_barcode_splitter)等等。我们今天主要是给大家说一下fastx_trimmer的用处。fastx_trimmer主要是切掉一些fastq中你不想要的序列,比如有些序列5'端有若干bp的质量不好的或者碱基不稳定的部分;或者是5'端有一些用来去重复(duplicate)的random barcode(如图1所示);还可能是3'端一些质量不好的碱基。图1 前面10bp序列含有ran ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照