问题标签 [h2o]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - H2O(来自 R 包 h2o)可以保存和重新加载训练数据吗?
我正在尝试H2O
通过 R 包进行深度学习h2o
,并想问是否H2O
可以保存和重新加载训练数据以供将来进行额外训练?
我的代码:
r - h2o randomForest 变量重要性
我正在使用 h2o 包来创建 randomForest 回归模型。我对变量的重要性有一些问题。我正在创建的模型在这里。一切正常。
有些变量是数字的,但有些是分类的。
但是,当我想查看变量重要性时,输出看起来像这样。
我想知道的是:1)为什么会有 NA 值。2) 相对重要性实际上是什么意思。不应该在1到100之间吗?3)为什么输出中没有混淆矩阵?
谢谢您的帮助!
hadoop - 在干净的 ubuntu 机器上设置苏打水
我一直在尝试在亚马逊私有云上的干净 Ubuntu 14.04 机器上设置 Hadoop/Spark/Sparkling Water。以root身份做所有事情。我成功地 apt-get java-6、scala 2.10.5、wget 并解压 hadoop 2.6、spark 1.2.1 和苏打水 0.2.1-47。
我将 HADOOP_HOME 和 SPARK_HOME 导出到正确的目录,然后运行 bin/sparkling-shell:
然后是大量的开始任务 X / 完成任务 X 输出,然后是
有人可以指出我可能做错了什么和/或错过了什么吗?如果需要/有帮助,我可以发布我的精确设置脚本。
r - 如何获得 R h2o 深度学习包中参数贡献的每个百分比?
如何获得 R h2o 深度学习包中参数贡献的每个百分比?
r - h2o.runif() 总是返回相同的向量
我正在编写用于交叉验证模型性能的代码。为了随机拆分数据集,我使用此方法:
不幸的是,它总是返回相同的向量:
0.7309678 0.2405364 0.6374174 0.5504370 0.5975453 0.3332184
我也尝试过使用不同的种子,例如:
结果总是一样的。功能有什么问题?我将不胜感激任何提示。
更新
这是一个完整的代码:
r - R 中的 as.h2o() 将文件上传到 h2o 环境需要很长时间
我正在使用 h2o 进行一些建模,并调整了模型,我现在希望它用于执行大量预测,大约 60 亿个预测/行,每个预测行需要 80 列数据
我已经将输入数据集分解为大约 500 x 1200 万行块,每个块包含相关的 80 列数据。
但是,将data.table
1200 万乘 80 列的数据上传到 h2o 需要相当长的时间,而对我来说,执行 500 次需要的时间非常长……我认为这是因为它在上传之前先解析对象。
相比之下,预测部分相对较快......
有什么建议可以加快这部分的速度吗?改变核心数量会有帮助吗?
以下是问题的可重现示例...
r - 为什么连接终止
我正在通过H2O
在具有 7000 万行和 25 个数字特征的训练集上使用 R 中的库来尝试随机森林分类模型。总文件大小为 5.6 GB。
验证文件的大小为 1 GB。
我的系统上有 16 GB RAM 和 8 核 CPU。
系统成功地读取了 H2O 对象中的两个文件。
然后我给出以下命令来构建模型:
但几分钟后(没有生成任何树),我收到以下错误:
“.h2o.doSafeREST 中的错误(conn = conn,h2oRestApiVersion = h2oRestApiVersion,:意外的 CURL 错误:接收失败:对等方重置连接”
但是,如果我用 1 棵树尝试上面的代码,它会成功运行。
出现上述错误是因为内存问题吗?任何帮助将不胜感激。
r - 使用 R 和 H2O 进行 Word2Vec 情感分类
我正在尝试使用 R 和 H2O 构建情绪分类模型。我有一个格式为:
因此,情感值为 1、0 和 -1,并且每行中的文本可以由多个句子组成。我知道想要准备数据集以将其与 h2o 的深度学习功能一起使用。因此我想使用tmcn.word2vec R 包。但我不能用这个包逐行转换它。我可以获取整个文本列并将其转换为 word2vec 文档,但随后我的情绪信息将丢失。
是否有另一种方法可以将文本转换为 R 中深度学习函数的数字输入?特别是H2O?
此致
r - h2o.saveModel 在 Windows 8 上用目录抛出异常
我在 R 中使用 h2o 版本 3.0.0.22,我正在尝试保存我的模型。但我似乎无法弄清楚预期的格式。我尝试了各种变化,但得到了各种不同的例外。
h2o.saveModel(model, dir="c:/temp", name="my.model")
如何在我的 Windows 8 机器上保存我的模型?
更新:这里的命令似乎创建了一个文件夹和文件:
h2o.saveModel(model, filename="file:///C:/temp/model")
这创建了一个文件:C:/temp/DeepLearningModel__8412f3ab21699b5593aa5c6861c8468d.bin
但随后引发了一个不同的错误:
scala - 创建 H2O 云时出现 H2O 苏打水错误
我已经设置了 H2O 苏打水,现在按照http://h2o-release.s3.amazonaws.com/sparkling-water/rel-1.3/6/index.html上的说明进行操作 - 第 3 步说
输入最后一行后出现以下错误。错误如下 -
由于 H2O 苏打水是新版本,我在网上找不到太多帮助。如果有人遇到过这样的错误或知道什么可能是错误的,请帮我弄清楚。
谢谢!