生信入门(四) trim-galore

当质控报告不合格时,我们就需要对reads进行修剪,修剪的工具有很多,今天简单介绍一下trim galore。

下图是fastqc生成的html文件

可以看到per base sequence content是错误的,并且Adapter Content也是错误的,说明需要对reads进行修剪处理。

 

理论上来说,A和T应该相等,C和G应该相等,且相互平行,但一开始不稳定,所以会出现一开始的情况。所以需要对该条reads进行修剪。

trim_galore --phred33 --paired --fastqc --clip_R1 5 --three_prime_clip_R1 15 --clip_R2 5 --three_prime_clip_R2 15 输入fastqc文件一 输入fastqc文件二 -o 输出文件路径

输入trim_galore -help就可以看到trim_galore所有的参数了,下面只截取了上述代码包含的参数

 从html文件中的per base sequence content中可以看到,前面15个bp需要被修剪掉,后面5个bp需要被修剪掉(不用太严格,删减太多也不好)。所以设置参数为

--clip_R1 5 --three_prime_clip_R1 15 --clip_R2 5 --three_prime_clip_R2 15

同学们可以自己查查各参数代表什么意思。运行代码后,将会产生新的html文件,我们打开进行对比。

 

可以看到两个需要改善的地方都合格了,先来看看per base sequence content

 

可以明显观察到比之前好多了,前端还是有一些不正常但也无妨。

同时我们发现Adapter Content也显示正常了,这是因为trim galore会自动去除Adapter。 

感谢观看!

 


版权声明:本文为weixin_50869371原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。