0
{origin:

2018-06-01T09:30:00.000+00:00   BID 30415.000       4   
2018-06-01T09:30:00.000+00:00   BID 30415.000       3   
2018-06-01T09:30:01.000+00:00   BID 30415.000       2   
2018-06-01T09:30:01.000+00:00   BID 30414.000       4   
2018-06-01T09:30:01.000+00:00   ASK 30416.000       1   
2018-06-01T09:30:01.000+00:00   ASK 30416.000       2   
2018-06-01T09:30:01.000+00:00   TRADE 30415.000     1
}

我想将数据重新格式化为:

时间戳 bid_size ask ask_size 交易 trade_size

{2018-06-01T09:30:00.000+00:00  30415  4 nan nan nan nan

2018-06-01T09:30:00.000+00:00  30415  3 nan nan nan nan

2018-06-01T09:30:01.000+00:00  30415  2 30416 1 nan nan

2018-06-01T09:30:01.000+00:00  30415  4 30416 2 30415 1
}

你能帮忙使用Python吗?我也遇到了一个问题,即重复的时间戳问题,我认为这是因为它的刻度数据导致相同的时间戳与不同的出价大小/要价大小,而且我也不知道如何正确地将它们放在同一行中。

4

1 回答 1

0

从您的示例中并不完全清楚,但首先要做的是将数据加载到名为 eg 的 pandas DataFrame 中df,而不是现在的字典。确保此 DataFrame 具有清晰的标头名称。

如果您在 panda DataFrame 中有数据,则可以使用,请参阅此链接DataFrame.pivot()以获取更多说明。

在你的情况下,你最终会得到类似的东西:

df.pivot(index=<Column1>, columns=<Column2>, values=<Column3>)

您需要<ColumnX>用您提供的适当标题替换的地方。

希望这可以帮助!

于 2018-06-20T14:51:48.297 回答