1

我确实想调整使用caret. 由于我的数据集高度不平衡,根据这篇文章,默认Accuracy选项似乎没有太大帮助: https ://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve- and-accuracy-for-classificationcaret

在我的具体情况下,我想确定mtry预测概率的随机森林的最佳参数。我确实有 3 个班级和 98.7% - 0.45% - 0.85% 的平分率。一个可重现的例子——遗憾的是没有不平衡的数据集——由下式给出:

library(caret)
data(iris)


control = trainControl(method="CV", number=5,verboseIter = TRUE,classProbs=TRUE)

grid = expand.grid(mtry = 1:3)
rf_gridsearch = train(y=iris[,5],x=iris[-5],method="ranger", num.trees=2000, tuneGrid=grid, trControl=control)
rf_gridsearch

所以我的两个问题基本上是:

  1. Accuracy除了我还有什么替代的汇总指标?(使用 multiROC 不是我最喜欢的,因为:https ://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification 。我想到了某事。像布赖尔分数)
  2. 我如何实施它们?

非常感谢!

4

0 回答 0