皮尔逊独立性卡方检验(Pearson chi-square test of independence)
假设检验的一种。用于检验两个变量是否独立。皮尔逊卡方统计量的重要应用。\(X\)有\(R\)个表征值(状态)\(A_1,A_2,\cdots,A_R\);\(Y\)有\(C\)个表征值:\(B_1,B_2,\cdots,B_C\),二元类别变量(\(X,Y\))定义在同一总体上。随机抽取\(n\)个个体,将观测资料汇总在\(R \times C\)的列联表上(如下表)。欲检验的统计假设\(H_0\):\(X\)与\(Y\)是独立的;\(H_1\):\(H_0\)不真。表中每格内数字\(x_{ij}\)是\(X\)取\(A_i\)且\(Y\)取\(B_j\)的次数,\(x_{i\cdot}=\sum_{j=1}^{C}x_{ij}\),\(x_{\cdot j}=\sum_{i=1}^{R}x_{ij}\),\(n=\sum_{i=1}^{R}x_{i\cdot}=\sum_{j=1}^{C}x_{\cdot j}=\sum_{i=1}^{R} \sum_{j=1}^{C}x_{ij}\)。检验统计量为\(\chi^2=\sum_{i=1}^{R} \sum_{j=1}^{C}\frac{(x_{ij}-\frac{1}{n}x_{i\cdot}x_{\cdot j})^2}{\frac{1}{n}x_{i\cdot}x_{\cdot j}}\),在\(n\to \infty\)时,它的极限分布是\(\chi^2\)分布,自由度为\((R-1)(C-1)\)。对给定的显著性水平\(\alpha\),查得\(\chi^2\)分布的右尾\(\alpha\)分位点\(\chi^2 \alpha ;(R-1)(C-1)\)。当观测值\(\chi_0^2 > \chi^2 \alpha ;(R-1)(C-1)\)时,拒绝\(H_0\)。这里的检验需要大样本。当\(R=C=2\)时,由上式给出的\(\chi^2\)统计量需要修正(称为雅茨连续性校正)为\(\chi^2=\sum_{i=1}^{R} \sum_{j=1}^{C}\frac{(|x_{ij}-\frac{1}{n}x_{i\cdot}x_{\cdot j}|-0.5)……2}{\frac{1}{n}x_{i\cdot}x_{\cdot j}}\),或用\(\chi^2\)统计量的简捷算法:\(\chi^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\),式中字母含义见\(2 \times 2\)列联表所示。注意,此时\(\chi^2\)分布的自由度为1。
没有要显示的评论
没有要显示的评论