Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

8.3 多元线性回归

8.3 多元线性回归

作为一元线性回归的扩展形式,多元线性回归用于建立一个因变量与多个自变量之间的线性关系。

多元回归模型是:

Yi=β0+β1X1i+β2X2i+...+βkXki+μi,i=1,...,nY_i = \beta_0 + \beta_1X_{1i} + \beta_2X_{2i} + ... +\beta_kX_{ki} + \mu_i,i=1,...,n

其中:

  • YiY_i 是被解释变量的第 ii 个观测值;X1i,X2i,...,XkiX_{1i},X_{2i},...,X_{ki}kk 个解释变量的第 ii 个观测值; μi\mu_i 是误差项。

  • 总体回归线表示的是 YYXX 之间的总体平均关系。

  • β1\beta_1X1X_1 的斜率系数;β2\beta2X2X_2的斜率系数,等等。

  • 截距 β0\beta_0 是当所有解释变量 XX 取值为零时 YY 期望值。

估计量 β0^,β1^,...,βk^\hat{\beta_0},\hat{\beta_1},...,\hat{\beta_k} 为使得预测误差平方和 i=1n(Yiβ0β1X1i...βkXki)2\sum^n_{i=1}(Y_i-\beta_0-\beta_1X_{1i}-...-\beta_kX_{ki})^2 达到最小的 β0,β1,...,βk\beta_0,\beta_1,...,\beta_k 取值。

预测值 Yi^\hat{Y_i} 和残差 ui^\hat{u_i} 分别为:

Yi^=β0^+β1^X1i+...+βk^Xki,i=1,...,n\hat{Y_i}=\hat{\beta_0} + \hat{\beta_1}X_{1i} + ... + \hat{\beta_k}X_{ki}, i=1,...,n
ui^=YiYi^,i=1,...,n\hat{u_i}=Y_i-\hat{Y_i}, i=1,...,n

其中估计量 β0^,β1^,...,βk^\hat{\beta_0},\hat{\beta_1},...,\hat{\beta_k} 和残差 ui^\hat{u_i} 都是利用 nn 组样本观测数据 (X1i,...,Xki,Yi),i=1,...n(X_{1i}, ..., X_{ki},Y_i), i=1,...n 计算得到的。它们分别是未知真实总体系数 β0,β1,...,βk\beta_0,\beta_1,...,\beta_k 和误差项 μi\mu_i 的估计量。

我们使用OLS方法求的 β0^,β1^,...,βk^\hat{\beta_0},\hat{\beta_1},...,\hat{\beta_k},为普通最小二乘(OLS)估计量。