unix - 如何使用unix逐行打印特定列？

Question

我有一个输入文件，如下所示。

Values,series,setupresultcode,nameofresultcode,resultcode
2,9184200,,serviceSetupResultempty,2001
11,9184200,0,successfulReleasedByService,2001
194,9184200,1,successfulDisconnectedByCallingParty,2001
101,9184200,2,successfulDisconnectByCalledParty,2001
2,9184201,0,successfulReleasedByService,2001
78,9184201,1,successfulDisconnectedByCallingParty,2001
32,9184201,2,successfulDisconnectByCalledParty,2001
4,9184202,0,successfulReleasedByService,2001
63,9184202,1,successfulDisconnectedByCallingParty,2001
37,9184202,2,successfulDisconnectByCalledParty,2001

我想要如下所示的输出：

Series,successfulReleasedByService,successfulDisconnectedByCallingParty,successfulDisconnectByCalledParty,serviceSetupResultempty
9184200,11,194,101,2
9184202,4,63,37,

将系列保留为系列的常见打印值。即相对于结果代码的第一列。即输入文件中的第三（整数）或第四（字符串）列。

例如：数据的第二列有n个系列；取 9184200。该系列有 4 个设置结果代码（空、0、1、2）。每个结果代码的名称在第 4 列中给出。如果 resultcode 为 0，我想打印；即，successfulReleasedByService 然后打印值 11 相对于系列 9184200。

score 1 · Accepted Answer

虽然我没有测试过，但这样的东西可能会起作用，将其视为某种伪代码。

#!/bin/awk -f
BEGIN
{
  number_of_series=0;
}
{
  #This part will be executed for every line
  if ($3 =="0" || $3 == "1" || $3 == "2")
  {
    for (i=1; i<=number_of_series; i++)
    {
      #If the series has already been added
      if(seriesarray[i] == $2)
      {
        #Concat the results
        seriesarray[$2]=seriesarray[$2]","$1;
      }
      #If it's a new series
      else
      {
        number_of_series++;
        seriesarray[$2]=$1;
      }
    }
  }
}
END
{
  #Iterate over the series and print the series id and the concatenated results
  for (series in seriesarray)
  {
    print series, seriesarray[series];
  }
}

这会产生类似

9184200,11,194,101

9184201,2,78,32

9184202,4,63,37

unix - 如何使用unix逐行打印特定列？

1 回答 1

Related

Reference