python - 如何为决策树的连续特征选择拆分变量

Question

我目前正在实施决策树算法。如果我有一个连续的特征数据，我该如何决定一个分裂点。我遇到的资源很少，说要在每两个点之间选择中间点，但考虑到我有 8000 行数据，这将非常耗时。输出/特征标签具有类别数据。有什么方法可以让我更快地执行此操作

score 0 · Accepted Answer

决策树通过计算熵和信息增益来确定最重要的特征。事实上，8000 行对于决策树来说并不算多。但总的来说，随机森林类似于决策树。它作为合奏工作。可以复习试一试。而且，慢可能和另外一件事有关。

1 回答 1