-1

如何在 python 中将 10,000 行的样本外推到整个人口(100,000)。我在 python 中对样本进行了凝聚聚类,坚持将结果外推到整个人群。

4

1 回答 1

0

没有一般规则。

对于层次聚类,这在很大程度上取决于您的联系,并且不同样本或整个总体的聚类可能非常不同。(首先,尝试不同的样本并进行比较!)

将聚类结果推广到新数据通常与为聚类所做的假设相矛盾。这不是分类,而是探索性数据分析。

但是,如果您发现了良好的聚类结果,并且您已经验证它们是可取的,那么您可以在聚类标签上训练一个分类器来预测新数据的聚类标签。

于 2016-12-23T15:50:13.830 回答