7

我正在通过H2O在具有 7000 万行和 25 个数字特征的训练集上使用 R 中的库来尝试随机森林分类模型。总文件大小为 5.6 GB。

验证文件的大小为 1 GB。

我的系统上有 16 GB RAM 和 8 核 CPU。

系统成功地读取了 H2O 对象中的两个文件。

然后我给出以下命令来构建模型:

model <- h2o.randomForest(x = c(1:18,20:25), y = 19, training_frame = traindata, 
                          validation_frame = testdata, ntrees = 150, mtries = 6)

但几分钟后(没有生成任何树),我收到以下错误:

“.h2o.doSafeREST 中的错误(conn = conn,h2oRestApiVersion = h2oRestApiVersion,:意外的 CURL 错误:接收失败:对等方重置连接”

但是,如果我用 1 棵树尝试上面的代码,它会成功运行。

出现上述错误是因为内存问题吗?任何帮助将不胜感激。

4

2 回答 2

5

它是 OutOfMemoryError。R 端此错误消息的一个变体是:

Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion,  : 
  Unexpected CURL error: Empty reply from server

检查 h2o 服务器日志(您也应该这样做)将告诉您:

10-08 20:11:57.165 192.168.0.4:54321     2125   #58072-18 INFO: Total file size: 1.81 GB
10-08 20:11:57.165 192.168.0.4:54321     2125   #58072-18 INFO: Parse chunk size 4194304
        onExCompletion for water.parser.ParseDataset$MultiFileParseTask@3588360e
        java.lang.OutOfMemoryError: Java heap space
:
:
Exception in thread "FJ-0-11" java.lang.OutOfMemoryError: Java heap space
2015-10-08 20:13:14.493:WARN:oejut.QueuedThreadPool:1 threads could not be stopped
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-5    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.458 192.168.0.4:54321     2125   FJ-0-3    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-13   ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:23.033 192.168.0.4:54321     2125   FJ-0-7    ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321
10-08 20:13:26.541 192.168.0.4:54321     2125   FJ-0-5    FATAL: Exiting.
10-08 20:13:26.574 192.168.0.4:54321     2125   FJ-0-7    FATAL: Exiting.
10-08 20:13:26.575 192.168.0.4:54321     2125   FJ-0-3    FATAL: Exiting.
10-08 20:13:26.575 192.168.0.4:54321     2125   FJ-0-13   FATAL: Exiting.

我在 h2o Slater (3.2.0.5) 上运行它,因此根据您的版本,这可能会有所不同。

于 2015-10-09T03:26:14.880 回答
4

可能你的内存不足。尝试在森林生长期间查看系统的内存使用情况。也尝试直接从 H2O web 控制台启动训练(默认为http://localhost:54321/),可能会给出更详细的错误。

于 2015-06-17T06:02:35.993 回答