Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我目前正在实施决策树算法。如果我有一个连续的特征数据,我该如何决定一个分裂点。我遇到的资源很少,说要在每两个点之间选择中间点,但考虑到我有 8000 行数据,这将非常耗时。输出/特征标签具有类别数据。有什么方法可以让我更快地执行此操作
决策树通过计算熵和信息增益来确定最重要的特征。事实上,8000 行对于决策树来说并不算多。但总的来说,随机森林类似于决策树。它作为合奏工作。可以复习试一试。而且,慢可能和另外一件事有关。