我目前在多类分类问题中使用来自 scikit-learn 的 LogisticRegression。我决定使用 LogisticRegression 是因为我已经阅读了几篇文章,将其描述为就其返回的预测概率而言经过良好校准的算法。
对于分类器的每个结果,我检查其预测概率以及分类观察与训练集中具有相同决策类的其余示例之间的距离。
令我惊讶的是,即使某个类的预测置信度超过 90%,余弦相似性度量表明给定示例平均与训练中具有相同类的示例集几乎正交放。
有人可以提供一些线索,说明为什么会观察到这种差异吗?
我希望对于与同一类的其他观察结果相距甚远的示例,LogisticRegression 算法将返回低预测概率。