python - 从传入的模型计算 mse

Question

我正在尝试绘制数据的均方误差，但我很难弄清楚如何去做。我知道您需要“真实”值和“预测”值才能获得 mse，但我的项目布局方式相当混乱。

我有一种方法可以生成这样的模型：

def fit_curve(X, y, degree):
    poly_features = PolynomialFeatures(degree = degree)
    x_poly = poly_features.fit_transform(X)
    linreg = LinearRegression()
    model = linreg.fit(x_poly, y)
    return model

这将返回一个已经训练好的模型。

然后，我应该找到所述模型的均方误差。我不确定我应该怎么做，因为模型已经过训练而没有返回预测值。现在我计算mse的方法是：

def mse(X, y, degree, model):
    poly_features = PolynomialFeatures(degree = degree)
    linreg = LinearRegression()
    x_poly = poly_features.fit_transform(X)
    linreg.fit(x_poly, y)
    y_predict = linreg.predict(x_poly)
    mse = mean_squared_error(y_predict, y)
    return mse

我觉得我使用的很多代码mse与fit_curve. 不幸的是，指导方针说这是我需要这样做的方式（使用mse, X,y和.degreemodel

我认为还值得注意的是，我的电流mse正常工作到大约 13-14 度，它在图表上生成的答案与我给出的解决方案不匹配。我不确定为什么它不能完美运行，因为我认为这是正确的想法。

score 1 · Accepted Answer

事情应该以这种方式完成：

1) 将您的 X 和 y 拆分为训练集和测试集。您可以为此使用train_test_split。您可以选择您的 test_size （我以 0.33 为例）和 random_state （这有助于重现性）。

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

2) 使用 X_train 和 y_train 拟合您的模型（此处为线性回归）。你有一些特征生成方法（多项式），这很棒。将其与训练数据一起使用。

poly_features = PolynomialFeatures(degree=degree)
linreg = LinearRegression()
X_train_poly = poly_features.fit_transform(X_train)
linreg.fit(X_train_poly, y_train)

3）通过查看它是否可以正确预测看不见的数据（X_test）来评估您的拟合模型。为此，您确实可以将 mean_squared_error 与 model.predict(X_test) 和 y_test 一起使用。注意，您必须对 X_test 应用与对 X_train 所做的相同的转换（这就是我们首先使用 poly_features.transform 的原因）

X_test_poly = poly_features.transform(X_test)
print(mean_squared_error(linreg.predict(X_test_poly), y_test))

希望有帮助。

python - 从传入的模型计算 mse

1 回答 1

Related

Reference