r - H2O autoML 模型的交叉验证预测

Question

根据 h2o 文档，我可以设置keep_cross_validation_predictions = T从我的automl模型中获取交叉验证预测。

但我无法让它工作。

使用文档中的这个例子

library(h2o)

h2o.init()

# Import a sample binary outcome train/test set into H2O
train <- h2o.importFile("https://s3.amazonaws.com/erin-data/higgs/higgs_train_10k.csv")
test <- h2o.importFile("https://s3.amazonaws.com/erin-data/higgs/higgs_test_5k.csv")

# Identify predictors and response
y <- "response"
x <- setdiff(names(train), y)

# For binary classification, response should be a factor
train[,y] <- as.factor(train[,y])
test[,y] <- as.factor(test[,y])

# Run AutoML for 20 base models (limited to 1 hour max runtime by default)
aml <- h2o.automl(x = x, y = y,
                  training_frame = train,
                  max_models = 20,
                  keep_cross_validation_predictions = TRUE,
                  seed = 1)

运行模型后，我尝试了

h2o.cross_validation_predictions(aml)
h2o.cross_validation_predictions(aml@leader)

h2o.cross_validation_holdout_predictions(aml)
h2o.cross_validation_holdout_predictions(aml@leader)

但它都不起作用。

编辑我正在使用最新的稳定版 3.24.02

score 2 · Accepted Answer

@spore234 我的猜测是你的领导者是一个 Stacked Ensemble 模型，这个模型不应该有任何交叉验证预测。

我们可能应该为这种情况提供一个有意义的警告。

让我也指出以下几行：

h2o.cross_validation_predictions(aml)

将抛出一个有意义的错误，因为用户应该传递一个H2OModel对象但aml它是一个类的实例H2OAutoML。

r - H2O autoML 模型的交叉验证预测

1 回答 1

Related

Reference