问题标签 [c5.0]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
855 浏览

r - 在 R 语言中使用 C5.0 构建决策树时出错

在这里,我根据其化学成分预测玻璃的类型。化学成分是输入的数字类型(Ri、Na 等),玻璃的类型是输出(Typec),它是因子。使用 C5.0 构建模型后我收到类似的错误

“错误:仅限树模型”

这是我的代码:

在这里运行绘图指令后,我提到了错误。

0 投票
0 回答
30 浏览

r - R : 从 rpart 预测到单行结果

我现在正在学习 R

我正在尝试比较不同方法 C5.0 和 rpart C5.0 返回的结果,例如

而 rpart 返回

我认为最好的方法是找到 LB 和 R 之间预测之间的最大值并将其放入新列表中,因此它看起来像这样

ETC

然后我不知道如何把它放进去

amyonw 可以指导我吗?

0 投票
0 回答
160 浏览

r - 无法执行 C50 算法

我正在使用 C50 包,但我无法执行算法,现在有两个基本的东西:没有空值的数据集和变量“credit$default”的因子。我想知道有什么问题。

执行此代码后的消息是:

代码:

0 投票
0 回答
103 浏览

r - R-C50:C5.0Control 中 minCases 的定义

C50 R包中函数C5.0Control的参数minCases定义为:

必须放入至少两个拆分中的最小样本数的整数。

这是如何实施的?我假设在这种情况下拆分是指拆分操作产生的节点。如我所料,minCases 似乎并不代表必须放在至少一个节点中的最小案例数。

我试图在C 源代码中找到实现。变量 minCases 似乎在第 33 行的extern.h中定义:

extern CaseCount MINITEMS, LEAFRATIO;

例如,它在prune.c的第 249 和 250 行中使用:

if (BranchCases[v] < MINITEMS) { ForEach(i, Bp, Ep) { SmallBranches[Class(Case[i])] += Weight(Case[i]); }

minCases 的真正作用是什么?

0 投票
1 回答
71 浏览

model-fitting - C5.0 只返回一片叶子

我正在 SPSS Modeler 中执行数据分析任务,我终于到达了我试图在数据上拟合一些模型的流点。

但是,当我尝试在我的数据上运行提到的 c5.0 建模节点时,该节点生成了一个仅包含一个叶子的建模块,因此模型中没有决策规则。我之前对数据进行了分区以训练和测试子集(70-30)。我没有使用错误分类成本,而是使用了正确预定义的属性角色。在模型的模型页面中,我检查了使用分区数据为每个拆分构建模型组符号使用全局修剪选项,我也尝试使用专家模式,但在简单模式下也失败了。我尝试使用不同的选项,但它提供了相同的输出而无需单独拆分。

我怎样才能让模型返回一个更复杂的决策树,我想这不是预期的结果。

欢迎任何建议。

0 投票
0 回答
475 浏览

r - 由于逻辑因素,C5.0 算法不起作用,解决方案?

之前已经问过这个问题,但是没有以解决我问题的方式回答。问题也略有不同。

我正在尝试使用 c5 包构建决策树模型。我试图预测 MMA 战士是否具有冠军潜力(这是一个逻辑因素,有 2 个是/否级别)。

最初此列是一个布尔值,但我使用它将其转换为一个因子

在我的数据框中,它显示“具有 2 个级别的因子”,它应该用作 c5 决策树的分类器,但是我不断收到此错误消息。

我的模型的代码如下。

0 投票
0 回答
860 浏览

r - 带有插入符号的决策树中属性使用的奇怪结果

我想知道在我的决策树模型中哪些变量很重要。

我通过使用 caret 包的 train() 得到了模型。但是对于因子变量,属性使用的结果很奇怪。

下面是我的代码。

我通过使用 C5imp() 获得了属性用法。(使用summary(mDt)的结果是一样的。)

属性使用结果如下:

  • 年龄 100.00
  • 体重指数 100.00
  • 身高 100.00
  • 体重 100.00
  • 工作7 98.90
  • piHeatScore 83.81
  • dailyAlcoholIntake_final 82.96
  • pi4.L 67.14
  • 家庭收入^9
  • pi17.C 60.33
  • pi6.C 59.72
  • pi13.L 56.53
  • ...

奇怪的是,一个因子变量(例如'pi4':Ord.factor w/5 个级别“1”<“2”<“3”<“4”<“5”)具有多种属性用法。(例如'pi4.L'、'pi4.Q'、'pi4.C'、'pi^4')

无序因子也是如此。例如,'marriage' 是一个因子 w/ 6 个级别(“1”、“2”、“3”、“4”、“5”、“6”),并且属性用法显示为 'marriage2', “marriage3”、“marriage4”、“marriage5”和“marriage6”。

但是,结果应如下所示:

(下面的结果是使用 C5.0() 与相同的数据获得的。显示了一个因素变量的一个属性用法。)

  • 体重指数 100.00
  • 年龄 32.37
  • pi6 27.28
  • pi13 16.92
  • pi9 15.76
  • 工作 9.07
  • pi14 2.88
  • ...

我认为这是由 C5.0() 和 train() 应用 C5.0 方法时的差异引起的。

我想使用 caret 包的 train() ,因为它会自动应用交叉验证等。

请帮我。

0 投票
1 回答
195 浏览

r - 如何获取R中所有数据的实际类和预测类?

我创建模型并在 R 中使用此脚本进行预测,

如果我运行summary(model),输出只是混淆矩阵和决策树。那么,如何知道包含所有属性、实际类和预测类的所有已处理数据的所有预测结果?

谢谢你。

0 投票
1 回答
190 浏览

r - 为什么我的决策树没有节点?(C5.0)

我有 6 个属性的 204 个数据。

在此处输入图像描述

当我使用此脚本创建包含所有数据的模型时model = C5.0(dataset1[,-7], dataset1[,7]),结果给我没有如下图所示的节点。

在此处输入图像描述

但是,如果我在这个脚本中只使用 100 个数据model = C5.0(dataset1[1:100,-7], dataset1[1:100,7]),那么结果会给我一个很好的决策树,如下图所示。

在此处输入图像描述

问题是什么?问题出在数据上吗?谢谢你。

0 投票
1 回答
1125 浏览

r - 错误:*** `undefined.cases' 的第 1 行:属性的 ... 错误值

我正在训练决策树 C5.0,一切运行良好,直到我尝试预测测试数据集中的值。我不确定错误是什么意思:

输出:

错误: *** undefined.cases 的第 1 行:c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,' 对于属性 `SurveyYr' 超出错误限制