0

我有一个如下所示的数据文件 (.csv):(仅值)

| First Column | Second Column | Third Column | Fourth Column |
---------------------------------------------------------------
| Yes          |            20 |              |          0.35 |
| No           |             6 | happy        |          4.01 |
| Yes          |            13 | Okay         |           3.1 |
|              |             2 |              |             1 |
| No           |             9 | Hello world  |           0.5 |
| Yes          |            50 | Puppies      |               |

现在我想将第二列、第三列和第四列中的数据值附加到第一列,以便最终输出如下所示:(基本上只是将每列的值叠加起来。请注意,有 NULL 和应该保留它们。)

| First Column |
----------------
| Yes          |
| No           | 
| Yes          |
|              |
| No           |  
| Yes          | 
|           20 | 
|            6 | 
|           13 | 
|            2 | 
|            9 | 
|           50 |
|              |
| happy        |
| Okay         |
|              |
| Hello world  |
| Puppies      |        
|         0.35 |
|         4.01 |
|          3.1 |
|            1 |
|          0.5 |
|              |

我想用 Python 编写迭代中的 Pandas 数据框,因为数据文件有几百列。我对逻辑的初步想法是:

  1. 计算总列数N
  2. 计算总行数R
  3. R从第[a + 1]-th 列复制值的行,其中a最初为 1 并以 1 递增。
  4. 将复制的值附加到第一列的末尾。
  5. 迭代这[N - 1]一次。
  6. 删除除第一列之外的所有列。

如果您可以帮助我完成核心编码部分,或者您有任何更好的建议,我们将不胜感激。

4

0 回答 0