0

我有形状为 1000 个观测值的数据框,6 列

前四列是 int,后两列是字符串数据类型。

我需要帮助找到可以帮助我使用 tukey 方法检测异常值并用 nan 值替换异常值而不删除异常值的函数代码。

我尝试了许多代码来检测异常值,但由于我的数据框中的字符串数据类型,我面临错误消息。

4

1 回答 1

0

df.drop()使用方法删除最后两个字符串列

df.drop(['B', 'C'], axis=1)

使用 Tukey 方法识别出异常值后,使用df[i] = NaN替换异常值的值。

于 2020-05-21T14:12:14.077 回答