python - 从 a 创建数据样本。概率分布与列另一个数据集的 PD 非常接近的数据集

翻译自：https://stackoverflow.com/questions/52264187 2018-09-10T19:20:59.310

78 次

我有一张带有 ID 和年龄的表。让它成为表 1。表 1 中的行是 1000。我有表 2 有 10000 行。我需要从表 2 中选择 1000 行，以便 table2.age 与 table1.age 具有相同的概率分布。有没有办法在python中做到这一点？我不知道从哪里开始。换句话说，让我们估计最适合表 1 中的 1000 个样本的概率分布，然后从另一个表中构造一个样本，该样本将给出最接近原始概率分布估计的拟合。

python - 从 a 创建数据样本。概率分布与列另一个数据集的 PD 非常接近的数据集

0 回答 0

Related

Reference