我尝试在 R 上使用 ROSE 库来重新平衡我的数据集中的目标变量。这是我的数据集的信息。
- 我的原始数据集共有 132056 条记录。
- 目标变量中共有 279 例 (0.21%) 次要类。
- 目标变量中大类共131777例(99.79%)。
我想对数据集进行欠采样,以使次要类的百分比增加到 5%。
这是我的代码:
df_Under <- ovun.sample(Target ~ ., data = df, method = "under", N =5580, seed = 1)
但是,运行上面的代码后,我收到以下错误消息。
"Error in (function (formula, data, method, subset, na.action, N, p = 0.5, :Too few observations."
我尝试使用 ROSE 的其他方法,例如“over”和“both”,但出现相同的错误。
我该如何解决这个问题?
亲切的问候,