符号检验(sign test)
非参数检验的一种。用于检验两个相关变量\(Y_1\)与\(Y_2\)(均为等距变量)在数值上“差异是否为零”。它利用差数的符号个数构造统计量,故称。对\(n\)个样品观测\(Y_1\)与\(Y_2\),得到样本资料:\((Y_{11},Y_{21}),(Y_{12},Y_{22}),\cdots,(Y_{1n},Y_{2n})\)。考虑差数的符号\(Sign(Y_1-Y_2)=\left\{\begin{matrix}+,当Y_1>Y_2 \\0,当Y_1=Y_2 \\-,当Y_1<Y_2\end{matrix}\right.\)。要检验的假设是\(H_0:P_r(Y_1>Y_2)=P_r(Y_1<Y_2)\);\(H_1:P_r(Y_1>Y_2)\ne P_r(Y_1<Y_2)\)。若\(Y_1\)与\(Y_2\)在数值大小上无显著差异,则样本中正号的差数个数与负号的差数个数应当很接近。记\(n_{+}\)是样本中正号差数个数,\(n_{-}\)是负号差数个数(注意:\(n_{+}+n_{-}\le n\))。我们再记\(r=\min\left \{ n_{+},n_{-} \right \}\),则当\(r\)不太小时,有利于\(H_0\),当\(r\)太小,则有利于\(H_1\)。可查《符号检验的\(r\)临界值表》,查出临界值\(r_\alpha\)。若\(r>r_\alpha\),则接受\(H_0\),否则,拒绝\(H_0\)。一般样本容量\(n\le 25\)时,可查表进行符号检验。该表实际是由二项分布计算得来,但当\(n>25\)时,二项分布接近正态分布,故可用下面方法作检验。记\(T\)为正号差数个数。由统计理论得知,\(T\)的极限分布是平均数为\(n/2\),方差是\(n/4\)的正态分布,于是选用的检验统计量为\(Z=\frac{T-\frac{n}{2}}{\sqrt{n}/2}=\frac{2T-n}{\sqrt{n}}\),在\(H_0\)成立时它趋近于标准正态分布,但为使\(Z\)更具连续性(因为\(T\)是离散变量),常采用修正的\(Z: Z=\frac{(2T\pm1)-n}{\sqrt{n}}\),当\(n/2\)时,上式中括号内取正号;当\(T>n/2\)时,则取负号。
没有要显示的评论
没有要显示的评论