“c5.0”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

855 浏览

r - 在 R 语言中使用 C5.0 构建决策树时出错

在这里，我根据其化学成分预测玻璃的类型。化学成分是输入的数字类型（Ri、Na 等），玻璃的类型是输出（Typec），它是因子。使用 C5.0 构建模型后我收到类似的错误

“错误：仅限树模型”

这是我的代码：

在这里运行绘图指令后，我提到了错误。

r decision-tree c5.0

2018-08-24T09:55:08.610

0 投票

0 回答

30 浏览

r - R : 从 rpart 预测到单行结果

我现在正在学习 R

我正在尝试比较不同方法 C5.0 和 rpart C5.0 返回的结果，例如

而 rpart 返回

我认为最好的方法是找到 LB 和 R 之间预测之间的最大值并将其放入新列表中，因此它看起来像这样

ETC

然后我不知道如何把它放进去

amyonw 可以指导我吗？

r rpart c5.0

2018-09-06T13:30:22.733

0 投票

0 回答

160 浏览

r - 无法执行 C50 算法

我正在使用 C50 包，但我无法执行算法，现在有两个基本的东西：没有空值的数据集和变量“credit$default”的因子。我想知道有什么问题。

执行此代码后的消息是：

代码：

r machine-learning decision-tree c5.0

2018-10-09T19:23:42.430

0 投票

0 回答

103 浏览

r - R-C50：C5.0Control 中 minCases 的定义

C50 R包中函数C5.0Control的参数minCases定义为：

必须放入至少两个拆分中的最小样本数的整数。

这是如何实施的？我假设在这种情况下拆分是指拆分操作产生的节点。如我所料，minCases 似乎并不代表必须放在至少一个节点中的最小案例数。

我试图在C 源代码中找到实现。变量 minCases 似乎在第 33 行的extern.h中定义：

extern CaseCount MINITEMS, LEAFRATIO;

例如，它在prune.c的第 249 和 250 行中使用：

if (BranchCases[v] < MINITEMS) { ForEach(i, Bp, Ep) { SmallBranches[Class(Case[i])] += Weight(Case[i]); }

minCases 的真正作用是什么？

r c5.0

2018-11-06T16:58:39.163

0 投票

1 回答

71 浏览

model-fitting - C5.0 只返回一片叶子

我正在 SPSS Modeler 中执行数据分析任务，我终于到达了我试图在数据上拟合一些模型的流点。

但是，当我尝试在我的数据上运行提到的 c5.0 建模节点时，该节点生成了一个仅包含一个叶子的建模块，因此模型中没有决策规则。我之前对数据进行了分区以训练和测试子集（70-30）。我没有使用错误分类成本，而是使用了正确预定义的属性角色。在模型的模型页面中，我检查了使用分区数据、为每个拆分构建模型、组符号、使用全局修剪选项，我也尝试使用专家模式，但在简单模式下也失败了。我尝试使用不同的选项，但它提供了相同的输出而无需单独拆分。

我怎样才能让模型返回一个更复杂的决策树，我想这不是预期的结果。

欢迎任何建议。

model-fitting spss-modeler c5.0

2019-03-06T11:06:38.427

0 投票

0 回答

475 浏览

r - 由于逻辑因素，C5.0 算法不起作用，解决方案？

之前已经问过这个问题，但是没有以解决我问题的方式回答。问题也略有不同。

我正在尝试使用 c5 包构建决策树模型。我试图预测 MMA 战士是否具有冠军潜力（这是一个逻辑因素，有 2 个是/否级别）。

最初此列是一个布尔值，但我使用它将其转换为一个因子

在我的数据框中，它显示“具有 2 个级别的因子”，它应该用作 c5 决策树的分类器，但是我不断收到此错误消息。

我的模型的代码如下。

r machine-learning decision-tree c5.0

2019-04-23T22:44:10.247

0 投票

0 回答

860 浏览

r - 带有插入符号的决策树中属性使用的奇怪结果

我想知道在我的决策树模型中哪些变量很重要。

我通过使用 caret 包的 train() 得到了模型。但是对于因子变量，属性使用的结果很奇怪。

下面是我的代码。

我通过使用 C5imp() 获得了属性用法。（使用summary(mDt)的结果是一样的。）

属性使用结果如下：

年龄 100.00
体重指数 100.00
身高 100.00
体重 100.00
工作7 98.90
piHeatScore 83.81
dailyAlcoholIntake_final 82.96
pi4.L 67.14
家庭收入^9
pi17.C 60.33
pi6.C 59.72
pi13.L 56.53
...

奇怪的是，一个因子变量（例如'pi4'：Ord.factor w/5 个级别“1”<“2”<“3”<“4”<“5”）具有多种属性用法。（例如'pi4.L'、'pi4.Q'、'pi4.C'、'pi^4'）

无序因子也是如此。例如，'marriage' 是一个因子 w/ 6 个级别（“1”、“2”、“3”、“4”、“5”、“6”），并且属性用法显示为 'marriage2'， “marriage3”、“marriage4”、“marriage5”和“marriage6”。

但是，结果应如下所示：

（下面的结果是使用 C5.0() 与相同的数据获得的。显示了一个因素变量的一个属性用法。）

体重指数 100.00
年龄 32.37
pi6 27.28
pi13 16.92
pi9 15.76
工作 9.07
pi14 2.88
...

我认为这是由 C5.0() 和 train() 应用 C5.0 方法时的差异引起的。

我想使用 caret 包的 train() ，因为它会自动应用交叉验证等。

请帮我。

r machine-learning decision-tree r-caret c5.0

2019-05-29T09:06:07.297

0 投票

1 回答

195 浏览

r - 如何获取R中所有数据的实际类和预测类？

我创建模型并在 R 中使用此脚本进行预测，

如果我运行summary(model)，输出只是混淆矩阵和决策树。那么，如何知道包含所有属性、实际类和预测类的所有已处理数据的所有预测结果？

谢谢你。

r classification data-mining prediction c5.0

2020-02-12T09:01:30.080

0 投票

1 回答

190 浏览

r - 为什么我的决策树没有节点？(C5.0)

我有 6 个属性的 204 个数据。

当我使用此脚本创建包含所有数据的模型时model = C5.0(dataset1[,-7], dataset1[,7])，结果给我没有如下图所示的节点。

但是，如果我在这个脚本中只使用 100 个数据model = C5.0(dataset1[1:100,-7], dataset1[1:100,7])，那么结果会给我一个很好的决策树，如下图所示。

问题是什么？问题出在数据上吗？谢谢你。

r classification data-mining decision-tree c5.0

2020-02-19T12:19:52.393

0 投票

1 回答

1125 浏览

r - 错误：*** `undefined.cases' 的第 1 行：属性的 ... 错误值

我正在训练决策树 C5.0，一切运行良好，直到我尝试预测测试数据集中的值。我不确定错误是什么意思：

输出：

错误： *** undefined.cases 的第 1 行：c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,' 对于属性 `SurveyYr' 超出错误限制

r machine-learning c5.0

2020-02-28T03:53:49.647

问题标签 [c5.0]

Reference