问题标签 [c5.0]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
945 浏览

r - How to plot final c50 decision tree model (library C50) from caret::train object

I trained Decision Tree model using train function from caret library:

Now I would like to plot Decision Tree for the final model. But this command doesn't work:

Someone already asked about it here: topic

Suggested solution was to use bestTune from the fitted train object to define the relevant c5.0 model manually. And then plot that c5.0 model normally:

I tried to do so. Yes, it makes possible to plot c5.0 model, BUT predicted probabilities from train object and manually recreated c5.0 model don't match.

So, my question is: is it possible to extract final c5.0 model from caret::train object and plot this Decision Tree?

0 投票
0 回答
409 浏览

r - 使用带有 C5.0 决策树的 R 插入符包(训练)进行 K 折交叉验证时出错

现在解决了。问题是 data=OneT.train,这是错误的。此代码是从原始代码复制过来的。它需要是插入号 train() 函数中的 data=OneT 。当前的 OneT.train 在属性字段中存在缺失值,而不是目标,因为重新加载和拆分数据,省略了填充缺失值 - 从未使用过。


我正在尝试使用 caret 包对 C5.0 决策树进行重复的 k 折交叉验证。

以下代码生成一个有效的 C5.0 决策树(混淆矩阵的准确率为 68%):

caret 包代码给出了这些错误(没有缺失值):

数据从 .csv 文件加载,OneGM 为 TRUE 或 FALSE(.csv 中的文本列) - 并且没有任何缺失值。

我想使用上面的单行插入符号包方法(我已经在多个地方看到过这种方法),而且我不是在寻找手动进行交叉验证的解决方案。

没有缺失值 (OneT[is.na(OneT)] <- 0)。以下是数据示例:

谢谢你的帮助。

0 投票
0 回答
40 浏览

r - R“summary(model)”命令在使用 carot 包的 train() 之后永远不会完成(k 折交叉验证)

summary(model) 命令永远不会完成。

K-fold 交叉验证运行如下(R caret 包):

该数据集有 3,000 行,每行 6 个属性。train 命令在 10 秒内完成。当使用直接使用 C5.0 训练的单个模型,不使用插入符号时,模型准确率为 68%。

如何调试 summary(model) 命令无法完成的原因?R-Studio 停止图标可用,并且可以正常工作。该命令未在 30 分钟内完成。

更新: summary(model$finalModel) 也永远不会完成。

谢谢你的帮助。

0 投票
1 回答
92 浏览

r - c5.0() 如何选择决策和根节点?

我正在学习机器学习的决策树方法。现在,我使用的最重要的一段代码是c5. 0. 不得不承认,这是天才的作品。但我不明白它是如何选择根节点和决策节点的。示例:我有一个名为“credit”的数据库。这是前几列:

所以当我在应用 c5.0 后查看决策树时,我看到根节点是$cheking balance,那么下一个决策节点是$credit_history. c5.0 创建决策树时遵循的策略或轨迹是什么?换句话说,它是如何确定决策节点的顺序的?

0 投票
0 回答
19 浏览

r - 在这个交叉验证模型训练中,这个错误是由什么引起的?

此处使用的数据集也已在另一个模型中使用并且有效。此外,C5.0 方法已与另一个数据集一起使用并且效果很好:

0 投票
1 回答
107 浏览

r - 在 Tidymodels 中从经过训练的 C5.0 模型中提取规则

我可以而且应该做一个更简单的代表,但这真的是我的工作。在 Tidymodels 框架中训练 C5.0 模型后,我如何“看到”模型生成的规则?我试图复制这里说明的内容

https://www.tidyverse.org/blog/2020/05/rules-0-0-1/

但我并没有走得太远(但我确信解决方案必须是单线)。

非常感谢!

reprex 包于 2020-12-10 创建(v0.3.0)

0 投票
0 回答
112 浏览

r - > plot(model) FUN(X[[i]], ...) 中的错误:未找到变量匹配

在这里绘制我的模型时,我遇到了这个错误,请帮助我。

0 投票
0 回答
55 浏览

r - 绘图函数中的错误(未找到变量匹配)

我正在尝试绘制我的决策树,但它一直给我这个错误,我不知道出了什么问题。

这是代码:

这是错误:

0 投票
1 回答
205 浏览

r - C5.0 包:粘贴错误(apply(x, 1, paste, collapse = ","), collapse = "\n") : 结果将超过 2^31-1 字节

尝试使用 C5.0 CRAN 包训练具有大约 300 万行和 600 列数据集的模型时,出现以下错误:

粘贴错误(apply(x, 1, paste, collapse = ","), collapse = "\n") : 结果将超过 2^31-1 字节

从存储库所有者对类似问题的回答来看,这是由于字符串中字节数的R 限制,限制为 2^31 - 1。

0 投票
0 回答
68 浏览

r - R C5.0:在 tunegrid 中包含 minCases 时出错(插入符号)

我正在尝试将 minCases 参数实现到我的 c5.0 模型的调整过程中。当我使用 caret 包时,我试图将该参数放入“tuneGrid”中。为此,我找到了以下教程。 https://www.euclidean.com/machine-learning-in-practice/2015/6/12/r-caret-and-parameter-tuning-c50

将代码实现到我的语法中后,出现以下错误:

有谁知道哪里出错了?一旦我在代码的最后一行构建我的模型“mdl”,就会发生错误。

关于上面提到的教程,我当前的代码如下: