#下载最新版本$ wget http://opengene.org/fastplong/fastplong$ chmod a+x . /fastplong/fastplong.0.2.2$ mv fastplong.0.2.2 fastplong #修改软件名称$ chmod a+x . 默认情况下,HTML 报告会保存为 fastplong.html(可以通过 -h 选项指定),JSON 报告会保存为fastplong.json(可以通过 -j 选项指定)$ fastplong -i 建立2_fastplong文件夹,fastplong的结果文件放在2_fastplong下。参数根据质控结果和实际情况进行调整就行。 $ fastplong -i 1_raw_fastq/sample.fastq.gz -o 2_fastplong/sample..fastq.gz \ -h 2_fastplong/sample.report.html
fastplong:长读长时代的“神器”新星 “如果你用过二代数据质控的经典神器fastp,那么fastplong你完全可以‘闭眼入坑’了!”李博士强烈推荐道。 功能全面: fastplong不仅能提供详尽的数据统计报告,还具备对序列进行过滤和修剪的功能,帮助用户去除低质量或短小的reads,为后续分析“净化”数据。 因此,李博士建议,在进行任何下游分析之前,首先运行一下fastplong,对PacBio数据进行初步的质量评估和预处理,这将为后续的分析奠定坚实的基础。
fastplong:长读长通用质控新星 在上一期我们推荐过、由开发二代数据质控神器fastp的OpenGene团队推出的fastplong工具,同样适用于纳米孔测序数据。 “对于追求高效便捷的老师和同学们,fastplong绝对是值得信赖的‘一站式解决方案’。”李博士表示。
Fastplong过滤:去除平均碱基质量<10、长度<1000bp的reads,确保后续组装的高质量输入。 Canu组装:利用长读长优势进行基因组组装,生成初始contigs。
当然,正如我们之前介绍过的fastp的“长读长兄弟”——fastplong,也可以在这里一步完成质量评估和过滤,为追求效率的研究者提供了便利。
对于三代纳米孔测序平台,查看数据统计信息和质量最常用的就针对牛津纳米孔(ONT)数据开发的Nanopack分析套装,如NanoPlot,NanoComp和NanoQC,以及老牌质控软件fastp针对三代长度长数据优化的fastplong