问题标签 [h2o]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1783 问题

0 投票

2 回答

389 浏览

r - H2O（来自 R 包 h2o）可以保存和重新加载训练数据吗？

我正在尝试H2O通过 R 包进行深度学习h2o，并想问是否H2O可以保存和重新加载训练数据以供将来进行额外训练？

我的代码：

r deep-learning h2o

2015-05-09T08:12:08.060

0 投票

1 回答

6642 浏览

r - h2o randomForest 变量重要性

我正在使用 h2o 包来创建 randomForest 回归模型。我对变量的重要性有一些问题。我正在创建的模型在这里。一切正常。

有些变量是数字的，但有些是分类的。

但是，当我想查看变量重要性时，输出看起来像这样。

我想知道的是：1）为什么会有 NA 值。2) 相对重要性实际上是什么意思。不应该在1到100之间吗？3）为什么输出中没有混淆矩阵？

谢谢您的帮助！

r random-forest confusion-matrix h2o

2015-05-13T21:59:57.510

0 投票

1 回答

288 浏览

hadoop - 在干净的 ubuntu 机器上设置苏打水

我一直在尝试在亚马逊私有云上的干净 Ubuntu 14.04 机器上设置 Hadoop/Spark/Sparkling Water。以root身份做所有事情。我成功地 apt-get java-6、scala 2.10.5、wget 并解压 hadoop 2.6、spark 1.2.1 和苏打水 0.2.1-47。

我将 HADOOP_HOME 和 SPARK_HOME 导出到正确的目录，然后运行 bin/sparkling-shell：

然后是大量的开始任务 X / 完成任务 X 输出，然后是

有人可以指出我可能做错了什么和/或错过了什么吗？如果需要/有帮助，我可以发布我的精确设置脚本。

hadoop apache-spark h2o

2015-05-16T00:00:59.620

0 投票

1 回答

301 浏览

r - 如何获得 R h2o 深度学习包中参数贡献的每个百分比？

如何获得 R h2o 深度学习包中参数贡献的每个百分比？

r parameters deep-learning h2o

2015-05-23T13:47:06.927

0 投票

1 回答

153 浏览

r - h2o.runif() 总是返回相同的向量

我正在编写用于交叉验证模型性能的代码。为了随机拆分数据集，我使用此方法：

不幸的是，它总是返回相同的向量：

0.7309678 0.2405364 0.6374174 0.5504370 0.5975453 0.3332184

我也尝试过使用不同的种子，例如：

结果总是一样的。功能有什么问题？我将不胜感激任何提示。

更新

这是一个完整的代码：

r random cross-validation h2o

2015-06-11T20:37:24.873

0 投票

2 回答

2722 浏览

r - R 中的 as.h2o() 将文件上传到 h2o 环境需要很长时间

我正在使用 h2o 进行一些建模，并调整了模型，我现在希望它用于执行大量预测，大约 60 亿个预测/行，每个预测行需要 80 列数据

我已经将输入数据集分解为大约 500 x 1200 万行块，每个块包含相关的 80 列数据。

但是，将data.table1200 万乘 80 列的数据上传到 h2o 需要相当长的时间，而对我来说，执行 500 次需要的时间非常长……我认为这是因为它在上传之前先解析对象。

相比之下，预测部分相对较快......

有什么建议可以加快这部分的速度吗？改变核心数量会有帮助吗？

以下是问题的可重现示例...

r h2o

2015-06-13T18:01:24.910

0 投票

2 回答

5798 浏览

r - 为什么连接终止

我正在通过H2O在具有 7000 万行和 25 个数字特征的训练集上使用 R 中的库来尝试随机森林分类模型。总文件大小为 5.6 GB。

验证文件的大小为 1 GB。

我的系统上有 16 GB RAM 和 8 核 CPU。

系统成功地读取了 H2O 对象中的两个文件。

然后我给出以下命令来构建模型：

但几分钟后（没有生成任何树），我收到以下错误：

“.h2o.doSafeREST 中的错误（conn = conn，h2oRestApiVersion = h2oRestApiVersion，：意外的 CURL 错误：接收失败：对等方重置连接”

但是，如果我用 1 棵树尝试上面的代码，它会成功运行。

出现上述错误是因为内存问题吗？任何帮助将不胜感激。

r memory out-of-memory random-forest h2o

2015-06-17T05:03:54.760

0 投票

3 回答

9791 浏览

r - 使用 R 和 H2O 进行 Word2Vec 情感分类

我正在尝试使用 R 和 H2O 构建情绪分类模型。我有一个格式为：

因此，情感值为 1、0 和 -1，并且每行中的文本可以由多个句子组成。我知道想要准备数据集以将其与 h2o 的深度学习功能一起使用。因此我想使用tmcn.word2vec R 包。但我不能用这个包逐行转换它。我可以获取整个文本列并将其转换为 word2vec 文档，但随后我的情绪信息将丢失。

是否有另一种方法可以将文本转换为 R 中深度学习函数的数字输入？特别是H2O？

此致

r machine-learning sentiment-analysis deep-learning h2o

2015-06-17T20:18:20.593

0 投票

1 回答

1014 浏览

r - h2o.saveModel 在 Windows 8 上用目录抛出异常

我在 R 中使用 h2o 版本 3.0.0.22，我正在尝试保存我的模型。但我似乎无法弄清楚预期的格式。我尝试了各种变化，但得到了各种不同的例外。

h2o.saveModel(model, dir="c:/temp", name="my.model")

如何在我的 Windows 8 机器上保存我的模型？

更新：这里的命令似乎创建了一个文件夹和文件：

h2o.saveModel(model, filename="file:///C:/temp/model")

这创建了一个文件：C:/temp/DeepLearningModel__8412f3ab21699b5593aa5c6861c8468d.bin 但随后引发了一个不同的错误：

r h2o

2015-07-02T23:25:40.140

0 投票

1 回答

670 浏览

scala - 创建 H2O 云时出现 H2O 苏打水错误

我已经设置了 H2O 苏打水，现在按照http://h2o-release.s3.amazonaws.com/sparkling-water/rel-1.3/6/index.html上的说明进行操作 - 第 3 步说

输入最后一行后出现以下错误。错误如下 -

由于 H2O 苏打水是新版本，我在网上找不到太多帮助。如果有人遇到过这样的错误或知道什么可能是错误的，请帮我弄清楚。

谢谢！

scala apache-spark h2o

2015-07-06T01:21:41.340

1 2 3 4 5 6 7 8 9 10

问题标签 [h2o]

Reference