问题标签 [rfe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Scikit Learn RFECV ValueError:不支持连续
我正在尝试使用 scikit learn RFECV 使用以下代码在给定数据集中进行特征选择:
我尝试了许多不同的解决方案,但我不断收到以下错误代码:
有任何想法吗?
任何帮助将不胜感激!
r - 随机森林模型中递归特征消除的特征选择错误
我有几百个样本,我已经将它们分为四个不同的类别(集群)。现在,我有兴趣确定将样本分类为不同类别的最佳基因集。
我想应用具有递归特征消除的随机森林并检测基因(特征)。我的数据如下所示。只是在这里发布一些示例数据。
上面的数据只是一个例子:我的原始数据在数据框中df
,第一列有 100 个样本,第二列有 4 个类,第 3 列到第 1002 列共有 1000 个具有表达值的基因。
我正在使用下面的代码,但我看到有一个错误。
有一个错误:我觉得我在某个地方做错了。
在这里,我给出dput
了上述数据。
谁能告诉我如何使用上述数据并应用随机森林来了解哪些基因将样本分类为不同的类别。谢谢。
xgboost - RFECV 用于分类给出 KeyError: 'weight'
使用交叉验证 (RFECV) 的递归特征消除不起作用,得到 KeyError: 'weight' 。如我所见,它无法计算系数,因此缺少权重。我有估计器作为 XGBClassifier。
scikit-learn - 带有逻辑回归的 sklearn RFE
我正在尝试使用RFE特征选择创建逻辑回归模型。
我得到:
如何使用rfe_model.support_
提取所选特征列表(对数据框进行子集化)并制作仅具有这些特征的模型(手动除外,通过制作 for 循环广告对特征列表本身进行子集化)?有没有更优雅的方式?
额外问题:我在哪里可以找到有关逻辑回归特征选择的更多信息(不包括向后、向前和逐步方法)?
python - 使用 catboost 作为估计器时 RFECV 抛出错误
我想利用 Catboost 来执行 RFECV:示例代码在这里:
这会引发以下错误:
我似乎找不到任何解决此问题的文档。有什么解决办法吗?
python - Python 3 在 RFE 中比 Python 2 慢
我是 python sklearn 的新手。自从我迁移到 Python 3 后,我的代码开始需要更多时间来运行 RFECV ......它从 5 小时到几乎 15 小时来运行几个 RFE CV。我找到了这个链接,但我想这个案例与我的不同:为什么 Python 3 比 Python 2 慢得多?
以下是代码示例:
会不会是sklearn版本不同造成的?
r - 如何使用插入符号在递归特征消除中进行下采样?
考虑这里创建的数据框data
:
假设data
是我的训练数据;每行代表对分组变量标识的人群中随机抽样的个体进行的测量Location
。我想使用递归特征消除来确定预测的最佳预测子集Location
。类似地,我想了解每个预测变量解释了多少变化Location
(即,哪些是最重要的,以及它们有多重要)。我已经阅读了如何使用 caret 包使用以下内容来完成此操作:
在我的data
示例中,考虑到每个 中的样本数量不平衡Location
,我想使用下采样来确保Location
在每次迭代时跨级别考虑相同数量的样本。有人可以演示我如何做到这一点吗?
python - 提取特征重要性系数/分数
有没有办法从下面的代码片段中提取实际的特征重要性系数/分数(而不是顶级num_feats
特征)?
python - 如何解决“RFECV 对象没有 support_ 属性”属性错误?
我正在尝试传递 sklearnRFECV
对象并交叉验证分数以返回具有所选特征和特征排名的模型性能。
但是,我很可能会收到“RFECV 对象没有 support_ 属性”错误,因为我没有将其拟合到数据中。我需要一些帮助来确定适合数据的位置以及如何确保测试数据集没有数据泄漏。
原始数据集是时间序列数据,因此我使用 TimeSeries Split 进行了拆分。
此代码源自此处的 RFE 教程
python - 在 SciKit 的 RFECV 中使用包含 ColumnTransformer 的管道
我正在尝试RFECV
使用 SciKit 处理转换后的数据。
为此,我创建了一个管道并将管道传递给RFECV
. 除非我有ColumnTransformer
一个管道步骤,否则它工作正常。它给了我以下错误:
我已经检查了这个问题的答案,但我不确定它们是否适用于这里。代码如下:
显然,我可以在管道之外执行此转换步骤,然后使用转换后的 X,但我想知道是否有任何解决方法。
我还想将此作为RFECV
设计问题提出(它首先将 X 转换为 numpy 数组,而其他具有内置交叉验证的方法,例如GridSearchCV
不这样做)