1

我目前正在将H2O 的 AutoML用于数据科学项目。但是,在文档、互联网或代码中,我找不到 AutoML 如何处理因子变量的任何地方——它是否进行一次性编码?标签编码?更高级的东西?它是否考虑有多少级别?它取决于算法吗?

目前,AutoML 的表现非常糟糕(略高于基线),我怀疑这是因为它没有正确处理分类变量,而分类变量约占我预测变量的 90%。

4

1 回答 1

1

AutoML 自动运行 H2O-3 中可用的监督学习模型。因此,AutoML 如何处理分类取决于它正在运行的给定模型的默认分类处理。可以在此处找到有关处理分类值的文档,如果您对特定算法感兴趣,请使用相同的文档来查找您感兴趣的算法并查看它如何处理分类值的详细信息,或者使用 Python 或 R API 文档来查找默认值。

于 2019-01-23T19:49:43.853 回答