0

我正在尝试绘制数据的均方误差,但我很难弄清楚如何去做。我知道您需要“真实”值和“预测”值才能获得 mse,但我的项目布局方式相当混乱。

我有一种方法可以生成这样的模型:

def fit_curve(X, y, degree):
    poly_features = PolynomialFeatures(degree = degree)
    x_poly = poly_features.fit_transform(X)
    linreg = LinearRegression()
    model = linreg.fit(x_poly, y)
    return model

这将返回一个已经训练好的模型。

然后,我应该找到所述模型的均方误差。我不确定我应该怎么做,因为模型已经过训练而没有返回预测值。现在我计算mse的方法是:

def mse(X, y, degree, model):
    poly_features = PolynomialFeatures(degree = degree)
    linreg = LinearRegression()
    x_poly = poly_features.fit_transform(X)
    linreg.fit(x_poly, y)
    y_predict = linreg.predict(x_poly)
    mse = mean_squared_error(y_predict, y)
    return mse

我觉得我使用的很多代码msefit_curve. 不幸的是,指导方针说这是我需要这样做的方式(使用mse, X,y和.degreemodel

我认为还值得注意的是,我的电流mse正常工作到大约 13-14 度,它在图表上生成的答案与我给出的解决方案不匹配。我不确定为什么它不能完美运行,因为我认为这是正确的想法。

4

1 回答 1

1

事情应该以这种方式完成:

1) 将您的 X 和 y 拆分为训练集和测试集。您可以为此使用train_test_split。您可以选择您的 test_size (我以 0.33 为例)和 random_state (这有助于重现性)。

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

2) 使用 X_train 和 y_train 拟合您的模型(此处为线性回归)。你有一些特征生成方法(多项式),这很棒。将其与训练数据一起使用。

poly_features = PolynomialFeatures(degree=degree)
linreg = LinearRegression()
X_train_poly = poly_features.fit_transform(X_train)
linreg.fit(X_train_poly, y_train)

3)通过查看它是否可以正确预测看不见的数据(X_test)来评估您的拟合模型。为此,您确实可以将 mean_squared_error 与 model.predict(X_test) 和 y_test 一起使用。注意,您必须对 X_test 应用与对 X_train 所做的相同的转换(这就是我们首先使用 poly_features.transform 的原因)

X_test_poly = poly_features.transform(X_test)
print(mean_squared_error(linreg.predict(X_test_poly), y_test))

希望有帮助。

于 2020-03-11T08:36:41.203 回答