我确实想调整使用caret
. 由于我的数据集高度不平衡,根据这篇文章,默认Accuracy
选项似乎没有太大帮助: https ://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve- and-accuracy-for-classification。caret
在我的具体情况下,我想确定mtry
预测概率的随机森林的最佳参数。我确实有 3 个班级和 98.7% - 0.45% - 0.85% 的平分率。一个可重现的例子——遗憾的是没有不平衡的数据集——由下式给出:
library(caret)
data(iris)
control = trainControl(method="CV", number=5,verboseIter = TRUE,classProbs=TRUE)
grid = expand.grid(mtry = 1:3)
rf_gridsearch = train(y=iris[,5],x=iris[-5],method="ranger", num.trees=2000, tuneGrid=grid, trControl=control)
rf_gridsearch
所以我的两个问题基本上是:
Accuracy
除了我还有什么替代的汇总指标?(使用 multiROC 不是我最喜欢的,因为:https ://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification 。我想到了某事。像布赖尔分数)- 我如何实施它们?
非常感谢!