python - 使用Tukey方法python从数据集中检测异常值

Question

我有形状为 1000 个观测值的数据框，6 列

前四列是 int，后两列是字符串数据类型。

我需要帮助找到可以帮助我使用 tukey 方法检测异常值并用 nan 值替换异常值而不删除异常值的函数代码。

我尝试了许多代码来检测异常值，但由于我的数据框中的字符串数据类型，我面临错误消息。

score 0 · Accepted Answer

df.drop()使用方法删除最后两个字符串列

df.drop(['B', 'C'], axis=1)

使用 Tukey 方法识别出异常值后，使用df[i] = NaN替换异常值的值。

1 回答 1