问题标签 [multiclass-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 选择逻辑回归或决策树
我有我的项目,其中功能是 0 或 1(这意味着是或否),标签是从 0 到 9。应用程序将向用户询问 100 个问题,答案将是 0 或 1(功能)。从这些问题中,我会告诉他哪个标签适合他(如果是 0 或 1 或 2.....9)
我已经做了一些代码(用 LR)你怎么看?对于这种情况,我将使用多类逻辑回归或多类决策树
r - 为什么变量的重要性没有反映在树构造中实际使用的变量中?
我使用以下代码在 R 上生成了一个(未修剪的)分类树:
printcp(fit) 显示:
树构造中实际使用的变量:
年龄
CountryCode
SupportCode
OrderType
prev_AnLP
prev_EVProfLP
prev_ProfLP
prev_TXLP
prev_SplLP
这些是我可以在分类树的每个节点上看到的相同变量,所以它们是正确的。我不明白的是summary(fit)的结果:
变量重要性:
29 prev_EVProfLP
19 prev_AnLP
16 prev_TXLP
15 prev_SplLP
9 prev_ProfLP
7
CountryCode 2 OrderType
1 Pre
1 Mol
从 summary(fit) 结果来看,变量 Pre 和 Mol 似乎比 SupportCode 和 Age 更重要,但在树中 Pre 和 Mol 不用于拆分数据,而使用 SupportCode 和 Age (实际上是在两片叶子之前。 ..但仍然使用!)。为什么?
python - MxNet 指标 API 用于计算带有矢量标签的多类逻辑回归的准确性
如何使用 MxNet metrics api计算带有矢量标签的多类逻辑回归分类器的准确性?以下是标签的示例:
使用此函数的天真方法会产生错误的结果,因为 argmax 会将模型输出压缩为具有最大概率值的索引
我目前的解决方案有点hacky:
python - TensorFlow 分类器始终欠拟合
我正在为具有 25 个特征和 12 个类标签的数据集使用 Tensorflow DNNClassifier。
我现在的代码是:
训练和测试数据的准确率均小于 0.2
我尝试了更多的 epoch,改变了学习率、激活函数和优化器,但准确率并没有提高。
据我所知,我的网络严重欠拟合。在这种情况下,添加更多节点和层应该可以工作,但增加节点和层几乎不会增加准确度,它仍然低于 0.2
任何人都可以指出我的代码中的错误,如果有的话?
machine-learning - Keras 如何测试 keras 中的图像以及如何预测属于分类类别之一的图像?
我像在 keras 文档中一样进行了培训和验证。但是如何测试图像。我知道如何在 scikit-learn 中做到这一点。但我想在 keras 中做。
假设我想预测分类形式的图像。最后我还想打印类名、训练准确率、测试准确率,最后是预测的图像准确率(例如狗:99.8%)。
matlab - 如何为分类学习器应用准备输入?
我的工作是语音识别。这就是我到目前为止所拥有的:
为了训练
我有
input vector matrix (training data)
大小11811x65 double
,对应大小的反应1*65 double
。
用于检测
我有一个大小矩阵
5942x11 double
。
我想使用具有“多类 SVM”的分类学习器应用程序。
我应该如何向分类学习器应用程序提供输入?
- 我们是否只给出训练数据及其相应的输出?
- 可以同时向应用程序提供训练和测试数据吗?
- ? (也许我做错了?)
tensorflow - 用于语音情感识别的 RNN
我想将语音数据分为四种不同的情绪(愤怒、悲伤、快乐、中性)。
问题是当我运行 RNN 代码时,所有语音数据都归为一类。
(例如,所有语音数据一直被归类为“愤怒”。)
我不知道这个问题的原因是什么,以及我必须改变什么来进行培训。
这是我用于训练和计算准确性的 tensorflow RNN 主要功能:
RNN 的输入是语音特征(音高和 MFCC),RNN 的输出是 one-hot 代码。(例如,anger=[1,0,0,0])。
另外,我想知道这样计算分类精度是否正确。
python - ROC-AUC 和 F-1 分数更高,但 ROC 曲线看起来很差
我重新创建了一个新的 Ensemble 方法,在我的三个分类器之间手动进行投票。(感谢帮助我从这里制作函数的丹尼尔:通过使用实例分类器的置信度来提高预测分数)。
此手动投票的目的是为最自信的分类器接受每个实例的答案。下面是代码及其准确度分数:
当我想绘制 ROC 曲线时,我知道我需要predict_probas
再次从这个函数中获取,参考之前链接中的建议,我改为使用函数返回概率:
现在,因为我想为测试集中的所有类绘制 ROC 曲线,所以我做了以下操作,得到的 ROC 曲线看起来与我预期的非常不同,因为我的 ROC-AUC 分数非常好,除了“shaly砂岩”类。
当他们的 F1 分数和 ROC-AUC 分数在几乎所有类别中都相当不错但在 ROC 曲线上表现不佳时,为什么曲线看起来像这样?当我从我的函数返回概率时我做错了什么,或者由于某些原因曲线应该看起来像这样?
python - 每次使用新行打印已排序和压缩的功能
我正在尝试获取单个岩石类型上每个特征的相对重要性以及它的特征名称。我做了以下事情:
我为其中一种岩石类型得到了这个:
当我只为一种类型的岩石做这件事时,我得到了如此平滑的打印结果:
我怎样才能使打印的解决方案看起来像feature_importance
我只得到一种岩石类型的答案时一样平滑(一条线)?
python - ROC or CAP CURVE for a multiclass classification in python
I am unable to plot ROC curve for a multiclass problem.