我有一系列约 30 个数据集,所有这些数据集都需要连接在一起才能形成一个宽泛的决赛桌。这个最终表需要大约 5 年的单个表(每年一个表)并将它们联合在一起,然后将这个完整的历史与其他表的完整历史(类似地联合)加入一个大的、历史的、宽的表。
这些第一个每年表的布局如下:
table_type_1:
| primary_key | year |
|-------------|------|
| key_1 | 0 |
| key_2 | 0 |
| key_3 | 0 |
与像这样的其他年份表:
table_type_1:
| primary_key | year |
|-------------|------|
| key_1 | 1 |
| key_2 | 1 |
然后将它们联合在一起以创建:
table_type_1:
| primary_key | year |
|-------------|------|
| key_1 | 0 |
| key_2 | 0 |
| key_3 | 0 |
| key_1 | 1 |
| key_2 | 1 |
同样,合并后的第二种类型的表会导致以下结果:
table_type_2:
| primary_key | year |
|-------------|------|
| key_1 | 0 |
| key_2 | 0 |
| key_3 | 0 |
| key_1 | 1 |
| key_2 | 1 |
我现在想加入table_type_1
ontable_type_2
并primary_key
产生year
一个更宽的表。我注意到这个最终的连接需要很长时间并且打乱了很多数据。
我怎样才能让它更快?