Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
如何在 python 中将 10,000 行的样本外推到整个人口(100,000)。我在 python 中对样本进行了凝聚聚类,坚持将结果外推到整个人群。
没有一般规则。
对于层次聚类,这在很大程度上取决于您的联系,并且不同样本或整个总体的聚类可能非常不同。(首先,尝试不同的样本并进行比较!)
将聚类结果推广到新数据通常与为聚类所做的假设相矛盾。这不是分类,而是探索性数据分析。
但是,如果您发现了良好的聚类结果,并且您已经验证它们是可取的,那么您可以在聚类标签上训练一个分类器来预测新数据的聚类标签。