1

我使用以下代码将 52G fastq 文件拆分为 10G 块:

split -b 10G /home/bilalm/H_glaber_quality_filtering/AfterQC/good_reads/SRR530529.good.fq outputfile

这产生了以下文件:

-rw-rw-r-- 1 bilalm bilalm  10G Aug 11 13:48 outputfileaa
-rw-rw-r-- 1 bilalm bilalm  10G Aug 11 13:49 outputfileab
-rw-rw-r-- 1 bilalm bilalm  10G Aug 11 13:50 outputfileac
-rw-rw-r-- 1 bilalm bilalm  10G Aug 11 13:51 outputfilead
-rw-rw-r-- 1 bilalm bilalm  10G Aug 11 13:52 outputfileae
-rw-rw-r-- 1 bilalm bilalm 1.6G Aug 11 13:53 outputfileaf

当我尝试使用 Velvet 组装“outputfileab”时,我收到以下错误消息:

velveth: /home/bilalm/H_glaber_quality_filtering/AfterQC/good_reads/split_SRR530529_file/outputfileab does not seem to be in FastQ format

奇怪的是,velveth 和 velvetg 都正常用于组装第一个 10G 读取,即“outputfileaa”。

有人知道发生了什么吗?

4

1 回答 1

3

split按文件大小而不是行数就是这样做的,如果达到字节限制,它将在一行中间分割。velvet 有一个检查来断言每四行是否以 开头@,因此考虑到 split 方法,此检查将失败,这就是为什么我们看到这种情况发生在第二个文件而不是第一个文件上的原因。我会建议你split这个文件的行数通过-l xxxx标志。

于 2020-08-21T17:47:20.513 回答