我有 250000 个点的数据集,其中有 15 个特征。每个特征的取值范围为 0 到 100。
所以,我想为这个数据集拟合一个概率分布来识别异常值,比如错误的数据输入。
对于fitdist
R 中的单变量,多变量呢?
如何在 R 或 Python 中有效地做到这一点?
我有 250000 个点的数据集,其中有 15 个特征。每个特征的取值范围为 0 到 100。
所以,我想为这个数据集拟合一个概率分布来识别异常值,比如错误的数据输入。
对于fitdist
R 中的单变量,多变量呢?
如何在 R 或 Python 中有效地做到这一点?