我一直在玩 ML.Net AutoML 并且玩得很开心。我仍然有一些问题,希望有人可以帮助或指导我解决我的一些问题。
问题 1: 我有一个来自 AutoML 的经过训练的二元分类模型。这导致了基于最高准确度的前 5 名算法列表,我最终得到了一个准确率为 89% 的 SdcaLogisticRegressionBinary 二进制分类模型。
现在,当我进行评估时,准确率下降到 84%。这是否意味着原始训练模型被过度拟合了 5%?公平地说,根据评估,我的模型的准确率不是 89%,而是 84%?
问题 2: AutoML 还会在训练期间根据需要删除特征。有没有办法检索包含在最终模型中的实际特征列表,例如确定哪些特征被删除并且没有提高模型的准确性?
当我检查最终模型时,OutputSchema 往往总是包含基于初始训练数据的所有特征。