我有一个如下所示的数据文件 (.csv):(仅值)
| First Column | Second Column | Third Column | Fourth Column |
---------------------------------------------------------------
| Yes | 20 | | 0.35 |
| No | 6 | happy | 4.01 |
| Yes | 13 | Okay | 3.1 |
| | 2 | | 1 |
| No | 9 | Hello world | 0.5 |
| Yes | 50 | Puppies | |
现在我想将第二列、第三列和第四列中的数据值附加到第一列,以便最终输出如下所示:(基本上只是将每列的值叠加起来。请注意,有 NULL 和应该保留它们。)
| First Column |
----------------
| Yes |
| No |
| Yes |
| |
| No |
| Yes |
| 20 |
| 6 |
| 13 |
| 2 |
| 9 |
| 50 |
| |
| happy |
| Okay |
| |
| Hello world |
| Puppies |
| 0.35 |
| 4.01 |
| 3.1 |
| 1 |
| 0.5 |
| |
我想用 Python 编写迭代中的 Pandas 数据框,因为数据文件有几百列。我对逻辑的初步想法是:
- 计算总列数
N。 - 计算总行数
R。 R从第[a + 1]-th 列复制值的行,其中a最初为 1 并以 1 递增。- 将复制的值附加到第一列的末尾。
- 迭代这
[N - 1]一次。 - 删除除第一列之外的所有列。
如果您可以帮助我完成核心编码部分,或者您有任何更好的建议,我们将不胜感激。