Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

8.4 模型评价

1. SER

回归标准误(SER)是指对回归系数的标准误。在统计学中,标准误是一个用于衡量样本统计量与总体统计量之间差异的指标。对于回归分析中的回归系数,标准误可以帮助我们评估回归系数的稳定性和可靠性。

对于简单线性回归模型,回归标准误可以通过下式计算得到:

SER=i=1n(yiy^i)2n2SER = \sqrt{\frac{\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}{n-2}}

其中:

  • yi y_i 表示第 i i 个观测值的因变量值;

  • y^i \hat{y}_i 表示第 i i 个观测值的预测值(根据回归方程预测的值);

  • n n 表示样本数量。

回归标准误的意义在于:

  • 它是回归系数估计值的标准差,用于评估回归系数的稳定性和精确度。

  • 它可以用于构建置信区间和进行假设检验,例如t检验。

  • 通过比较不同模型的回归标准误,可以帮助我们选择最合适的模型。

总之,回归标准误是回归分析中一个重要的指标,用于评估回归系数的可靠性和模型的拟合效果。

2. R平方

R2R^2(R-squared,R平方)是回归分析中用于评估模型拟合优度的统计指标之一。它是一个介于0和1之间的值,表示因变量的变异性中被自变量解释的比例。R2R^2越接近1,说明模型拟合得越好;R2R^2越接近0,则说明模型对数据的拟合程度较差。

R2R^2 的计算公式如下:

R2=ESSTSS=i=1n(Yi^Yˉ)2i=1n(YiYˉ)2R^2 = \frac{ESS}{TSS}=\frac{\sum^n_{i=1}{(\hat{Y_i}-\bar{Y})^2}}{\sum^n_{i=1}{(Y_i-\bar{Y})^2}}
R2=ESSTSS=1SSRTSSR^2 = \frac{ESS}{TSS}=1-\frac{SSR}{TSS}
R2=1SSRTSSR^2 = 1-\frac{SSR}{TSS}

其中:

  • SSR SSR 是残差平方和,表示模型预测值与实际观测值之间的差异的平方和;

  • TSS TSS 是总平方和,表示实际观测值与因变量均值之间的差异的平方和。

换句话说,R2R^2 是残差平方和占总平方和的比例的补数。它衡量了模型所能解释的因变量变异性的比例,即模型对数据的拟合程度。R2R^2 的取值范围为0到1,其中1表示模型完美拟合数据,0表示模型未能解释因变量的任何变异性。

在回归分析中,R2R^2 通常作为一个重要的指标来评估模型的拟合优度。然而,需要注意的是,R2R^2 并不是模型拟合程度的唯一评价指标,有时候模型的解释能力可能不够好,但 R2R^2 仍然较高,因此在进行模型评估时,需要结合其他指标进行综合考虑。