线性回归模型(linear regression model)
回归模型的一种。用于描述相关变量之间的线性关系。一般形式是\(Y=\beta_0+\beta_1X_1+\cdots +\beta_pX_p+\varepsilon\)。应用时通常作如下假设:\(Y\)是可观测的随机变量,\(X_1,\cdots,X_p\)是可观测的普通变量, \(\beta_0,\beta_1,\cdots,\beta_p\)是未知参数,\(\varepsilon\)是不可观测的随机变量,\(\varepsilon \sim N(0,\sigma^2\)是未知参数。如,\(Y=\beta_0+\beta_1 \ln{X}+\varepsilon\)、\(Y=\beta_0+\beta_1X+\beta_2X^2+\varepsilon\)都是线性回归模型。对于后一个模型,只要引进新自变量\(X_1=X\),\(X_2=X^2\)便成为常见的线性回归模型。设样本含\(n\)组观测值\(Y_i,X_{i1},\cdots,X_{xp},i=1,2,\cdots,n\),则有\(Y_i=\beta_0+\beta_iX_{i1}+\cdots +\beta_pX_{ip}+\varepsilon_i(i=1,2,\cdots,n)\)这一样本模型,可写成矩阵形式为\(Y=X\beta+\varepsilon\)。由于它是有了样本数据后回归分析的出发点,故称。通常作如下假设:\(X\)是列满秩矩阵(即\(X\)的秩与列数相同);\(\varepsilon_1,\cdots,\varepsilon_n\)独立同分布,即\(E(\varepsilon)=0\),\(Cov(\varepsilon)=\sigma^2I_n\),\(I_n\)为\(n\)阶单位阵。后一个假设称“高斯-马尔科夫假设”。通常用最小二乘法估计回归参数。若高斯-马尔科夫假设不成立,考虑用广义最小二乘估计。
没有要显示的评论
没有要显示的评论