1

我正在尝试使用 rpart 绘制分类树,而 R 不包括我的所有变量。我有 20 个案例和 200 个变量。我的数据看起来像这样:

data <- data.frame(y = c(rep(0, 10), rep(1, 10)), x1 = c(rnorm(20)), x2 = c(rnorm(20)+0.5), x3 = c(rnorm(20)-0.2))

但是 x1 + x2 +x3 .... + x200。

我所有的变量值都与此类似;非常小,有些甚至平均约为 0.0005。我需要一个分类树,我的 y 是二进制的,所以我想要 method = "class" :

cart <- rpart(formula = y ~ ., data = data, method = "class")

当我输入

print(cart)

我得到:

n= 20
node), split, n, deviance, yval 
* denotes terminal node
1) root 20 5.958333 0.4583333  
2) x50< 0.0005126315 16 2.437500 0.1875000 *
3) x50>=0.0005126315 8 0.000000 1.0000000 * 

我不确定为什么它只根据 x50 拆分。我尝试绘制它以查看发生了什么,以及何时执行

plot(cart)

我得到了以下情节:http: //i.imgur.com/cCTa69a.png

知道发生了什么,或者我该如何解决这个问题?非常感激。

4

0 回答 0