0

我正在尝试使用awk跳过包括特定模式在内的所有行/^#CHROM/并在下面的行上开始处理。确实执行但当前awk返回tab-delimited file. 谢谢 :)。

文件

##INFO=<ID=ANN,Number=1,Type=Integer,Description="My custom annotation">
##source_20170530.1=vcf-annotate(r953) -d key=INFO,ID=ANN,Number=1,Type=Integer,Description=My custom annotation -c CHROM,FROM,TO,INFO/ANN
##INFO=<ID=,Number=A,Type=Float,Description="Variant quality">
#CHROM  POS ID  REF ALT
chr1    948846  .   T   TA  NA  NA
chr2    948852  .   T   TA  NA  NA
chr3    948888  .   T   TA  NA  NA

awk

awk -F'\t' -v OFS="\t" 'NR>/^#CHROM/ {print $1,$2,$3,$4,$5,"ID=1"$6,"ID=2"$7}' file

期望的输出

chr1    948846  .   T   TA  ID1=NA  ID2=NA
chr2    948852  .   T   TA  ID1=NA  ID2=NA
chr3    948888  .   T   TA  ID1=NA  ID2=NA
4

2 回答 2

2

使用以下awk方法:

awk -v OFS="\t" '/^#CHROM/{ r=NR }r && NR>r{ $6="ID=1"$6; $7="ID=2"$7; print }' file

输出:

chr1    948846  .   T   TA  ID=1NA  ID=2NA
chr2    948852  .   T   TA  ID=1NA  ID=2NA
chr3    948888  .   T   TA  ID=1NA  ID=2NA

  • /^#CHROM/{ r=NR }- 捕获模式行号

替代方法如下所示:

awk -v OFS="\t" '/^#CHROM/{ f=1; next }f{ $6="ID=1"$6; $7="ID=2"$7; print }' file
于 2017-06-14T15:58:19.647 回答
2
awk 'BEGIN{FS=OFS="\t"} f{print $1,$2,$3,$4,$5,"ID1="$6,"ID2="$7} /^#CHROM/{f=1}' file

有关此和其他 awk 搜索习惯用法的详细信息,请参阅https://stackoverflow.com/a/17914105/1745001。您的是该页面上“b”的变体。

于 2017-06-14T16:37:26.953 回答