使用 GFF.write() 创建文件时,我得到一个新行,其中包含“annotation remark”作为源,然后是序列区域的 ASCII 编码:
##gff-version 3
##sequence-region NC_011594.1 1 16779
NC_011594.1 annotation remark 1 16779 . . . gff-version=3;sequence-region=%28%27NC_011594.1%27%2C 0%2C 16971%29,%28%27NC_042493.1%27%2C 0%2C 132544852%29, (continues on and on)
NC_011594.1 RefSeq gene 1 1531 . + . Dbxref=GeneID:7055888;ID=gene-COX1;Name=COX1;gbkey=Gene;gene=COX1;gene_biotype=protein_coding
知道它为什么在这里,它的用途以及我如何避免它?我担心在第三方软件中使用它可能会成为问题。
我只导入了 bcbio-gff 包,但我相信它是 Biopython 的一部分,链接:https ://biopython.org/wiki/GFF_Parsing