问题标签 [c5.0]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 语言中使用 C5.0 构建决策树时出错
在这里,我根据其化学成分预测玻璃的类型。化学成分是输入的数字类型(Ri、Na 等),玻璃的类型是输出(Typec),它是因子。使用 C5.0 构建模型后我收到类似的错误
“错误:仅限树模型”
这是我的代码:
在这里运行绘图指令后,我提到了错误。
r - R : 从 rpart 预测到单行结果
我现在正在学习 R
我正在尝试比较不同方法 C5.0 和 rpart C5.0 返回的结果,例如
而 rpart 返回
我认为最好的方法是找到 LB 和 R 之间预测之间的最大值并将其放入新列表中,因此它看起来像这样
ETC
然后我不知道如何把它放进去
amyonw 可以指导我吗?
r - 无法执行 C50 算法
我正在使用 C50 包,但我无法执行算法,现在有两个基本的东西:没有空值的数据集和变量“credit$default”的因子。我想知道有什么问题。
执行此代码后的消息是:
代码:
r - R-C50:C5.0Control 中 minCases 的定义
C50 R包中函数C5.0Control的参数minCases定义为:
必须放入至少两个拆分中的最小样本数的整数。
这是如何实施的?我假设在这种情况下拆分是指拆分操作产生的节点。如我所料,minCases 似乎并不代表必须放在至少一个节点中的最小案例数。
我试图在C 源代码中找到实现。变量 minCases 似乎在第 33 行的extern.h中定义:
extern CaseCount MINITEMS, LEAFRATIO;
例如,它在prune.c的第 249 和 250 行中使用:
if (BranchCases[v] < MINITEMS) { ForEach(i, Bp, Ep) { SmallBranches[Class(Case[i])] += Weight(Case[i]); }
minCases 的真正作用是什么?
model-fitting - C5.0 只返回一片叶子
我正在 SPSS Modeler 中执行数据分析任务,我终于到达了我试图在数据上拟合一些模型的流点。
但是,当我尝试在我的数据上运行提到的 c5.0 建模节点时,该节点生成了一个仅包含一个叶子的建模块,因此模型中没有决策规则。我之前对数据进行了分区以训练和测试子集(70-30)。我没有使用错误分类成本,而是使用了正确预定义的属性角色。在模型的模型页面中,我检查了使用分区数据、为每个拆分构建模型、组符号、使用全局修剪选项,我也尝试使用专家模式,但在简单模式下也失败了。我尝试使用不同的选项,但它提供了相同的输出而无需单独拆分。
我怎样才能让模型返回一个更复杂的决策树,我想这不是预期的结果。
欢迎任何建议。
r - 由于逻辑因素,C5.0 算法不起作用,解决方案?
之前已经问过这个问题,但是没有以解决我问题的方式回答。问题也略有不同。
我正在尝试使用 c5 包构建决策树模型。我试图预测 MMA 战士是否具有冠军潜力(这是一个逻辑因素,有 2 个是/否级别)。
最初此列是一个布尔值,但我使用它将其转换为一个因子
在我的数据框中,它显示“具有 2 个级别的因子”,它应该用作 c5 决策树的分类器,但是我不断收到此错误消息。
我的模型的代码如下。
r - 带有插入符号的决策树中属性使用的奇怪结果
我想知道在我的决策树模型中哪些变量很重要。
我通过使用 caret 包的 train() 得到了模型。但是对于因子变量,属性使用的结果很奇怪。
下面是我的代码。
我通过使用 C5imp() 获得了属性用法。(使用summary(mDt)的结果是一样的。)
属性使用结果如下:
- 年龄 100.00
- 体重指数 100.00
- 身高 100.00
- 体重 100.00
- 工作7 98.90
- piHeatScore 83.81
- dailyAlcoholIntake_final 82.96
- pi4.L 67.14
- 家庭收入^9
- pi17.C 60.33
- pi6.C 59.72
- pi13.L 56.53
- ...
奇怪的是,一个因子变量(例如'pi4':Ord.factor w/5 个级别“1”<“2”<“3”<“4”<“5”)具有多种属性用法。(例如'pi4.L'、'pi4.Q'、'pi4.C'、'pi^4')
无序因子也是如此。例如,'marriage' 是一个因子 w/ 6 个级别(“1”、“2”、“3”、“4”、“5”、“6”),并且属性用法显示为 'marriage2', “marriage3”、“marriage4”、“marriage5”和“marriage6”。
但是,结果应如下所示:
(下面的结果是使用 C5.0() 与相同的数据获得的。显示了一个因素变量的一个属性用法。)
- 体重指数 100.00
- 年龄 32.37
- pi6 27.28
- pi13 16.92
- pi9 15.76
- 工作 9.07
- pi14 2.88
- ...
我认为这是由 C5.0() 和 train() 应用 C5.0 方法时的差异引起的。
我想使用 caret 包的 train() ,因为它会自动应用交叉验证等。
请帮我。
r - 如何获取R中所有数据的实际类和预测类?
我创建模型并在 R 中使用此脚本进行预测,
如果我运行summary(model)
,输出只是混淆矩阵和决策树。那么,如何知道包含所有属性、实际类和预测类的所有已处理数据的所有预测结果?
谢谢你。
r - 错误:*** `undefined.cases' 的第 1 行:属性的 ... 错误值
我正在训练决策树 C5.0,一切运行良好,直到我尝试预测测试数据集中的值。我不确定错误是什么意思:
输出:
错误: *** undefined.cases 的第 1 行:c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,' 对于属性 `SurveyYr' 超出错误限制