python - 将成本函数转换为 statsmodels 公式

Question

我想将一些数据拟合到曲线上，将其用作成本函数：

def cost_func(x):
    return ((unknown_conc-x[1]*(x[0]*conc_A+
           (1-x[0])*conc_B))**2).sum()

它在使用 scipy.optimize 时有效，但我想改用 statsmodels。但是我正在努力定义一个 statsmodels 公式。你有什么想法如何做到这一点？

我试过这样的东西，但它不适用于这个 x*A + (1-x)*B：

result = sm.ols(formula="A ~ I(B + C) -1", data=df).fit()

score 1 · Accepted Answer

Statsmodels/patsy 公式是一种用于编写线性模型的语言，因此您需要找到一种方法将您的问题表述为一个公式，其中预测值是您想要拟合的参数的线性函数。

在这种情况下，您正在对预测所在的位置进行最小二乘拟合（使用 Python 语法）：

x[1]*(x[0]*conc_A + (1 - x[0])*conc_B)

展开条款，我们得到：

x[1]*x[0]*conc_A + x[1]*(1 - x[0])*conc_B

让我们定义新参数param0 = x[1]*x[0]和param1 = x[1]*(1 - x[0]). 现在我们的预测变成

param0*conc_A + param1*conc_B

请注意，这些是可逆的，即这些等式成立：

x[0] = param0 / (param0 + param1)
x[1] = param0 + param1

所以这种重新参数化并没有改变我们正在拟合的底层模型，它只是改变了我们表示它的方式。但是新的表示在参数中是线性的，所以现在我们可以将其转换为 statsmodels/patsy 公式：

"conc_A + conc_B - 1"

最后，让我们将我们预测的值放入公式中，给出：

result = sm.ols("unknown_conc ~ conc_A + conc_B - 1", data=df).fit()

如果你符合这个，你会得到和的值param0，param1如果你使用上面的方程，你可以将这些转换回x[0]和x[1]值，以与你之前得到的值进行比较。

1 回答 1