我有一张带有 ID 和年龄的表。让它成为表 1。表 1 中的行是 1000。我有表 2 有 10000 行。我需要从表 2 中选择 1000 行,以便 table2.age 与 table1.age 具有相同的概率分布。有没有办法在python中做到这一点?我不知道从哪里开始。换句话说,让我们估计最适合表 1 中的 1000 个样本的概率分布,然后从另一个表中构造一个样本,该样本将给出最接近原始概率分布估计的拟合。
我有一张带有 ID 和年龄的表。让它成为表 1。表 1 中的行是 1000。我有表 2 有 10000 行。我需要从表 2 中选择 1000 行,以便 table2.age 与 table1.age 具有相同的概率分布。有没有办法在python中做到这一点?我不知道从哪里开始。换句话说,让我们估计最适合表 1 中的 1000 个样本的概率分布,然后从另一个表中构造一个样本,该样本将给出最接近原始概率分布估计的拟合。