MaSuRCA: 混合组装工具
适用于二代和三代混合组装,也可以就只装二代数据。
官方提示:使用原始数据,不做任何的预处理,任何trimming, cleaning和error correction操作都会影响组装的结果。
这估计是软件本身会做上面这一步吧。
软件使用分为三步:
- 创建配置文件
~/opt/biosoft/MaSuRCA-3.2.4/bin/masurca -g config.txt
- 按照需求修改配置文件
主要分为DATA和PARAMETERS,DATA部分用来指定PE(双端illumina普通文库), JUMP(illumina大片段文库), OTHER(其他平台的测序结果)
PE = aa 180 20 /data/fwd_reads.fastq /data/rev_reads.fastq
# 两个字符作为前缀,文库插入平均大小,标准差(如果不清楚,约等于文库插入平均大小X0.15)
- 产生组装程序并运行
~/opt/biosoft/MaSuRCA-3.2.4/bin/masurca config.txt
./assemble.sh
最后的组装结果为genome.ctg.fasta
,genome.scf.fasta