皮尔逊拟合优度检验(Pearson goodness-of-fit test)
亦称“拟合优度卡方检验”。非参数检验的一种。用于检验观测到的样本的频率分布与某一理论分布是否一致。皮尔逊提出。它使用\(\chi^2\)统计量,最简单古老,应用十分广泛。欲检验的假设是总体\(X\)服从某确定分布,如“\(H_0\):\(X\)服从二项分布”或“\(H_0\):\(X\)服从正态分布”。首先将\(X\)取值空间\(G\)划分为\(k\)个互不相交的子空间,即\(G=G_1 \cup G_2 \cup \cdots \cup G_k\),在\(H_0\)成立的条件下,可求出\(X\)取值落入\(G_j\)的理论概率\(p_j\)。现随机抽取大小为\(n\)的样本。于是\(X\)取值落入\(G_j\)的理论次数为\(np_j\),而观测次数记为\(f_j\)。检验\(H_0\)的统计量\(\chi^2=\sum_{j=1}^{k}\frac{(f_j-np_j)^2}{np_j}\)。由样本分布理论可知:当\(n \to \infty\)时,\(\chi^2\)的极限分布是自由度为\(k-1\)的\(\chi^2\)分布。在大样本情况下,对于显著性水平\(\alpha\),查得\(\chi^2\)分布的右侧\(\alpha\)分位点\(\chi^2_{\alpha(k-1)}\)。若统计量的观测值\(\chi_0^2\)大于\(\chi^2_{\alpha(k-1)}\),则拒绝\(H_0\);否则,接受\(H_0\)。使用时需注意两点:(1)\(n\)要求充分大,\(p_j\)又不能太小。在实际中一般要求\(np_j \ge 4\),若某组的\(np_j<4\),则该组可与邻组合并(\(j=1,2,\cdots,k\))。(2)检验统计量\(\chi^2\)中含有\(k\)个理论值\(p_j\),它们应当计算出来,但实际上并不容易。若有\(s\)个(\(s<k\))\(p\)值未知,可由样本去估计。这时统计量的自由度变为\(k-s-1\)。
没有要显示的评论
没有要显示的评论