混合类内协方差矩阵(covariance matrix of pooled within-group)
一译“混合组内协方差矩阵”,亦称“混合样本内协方差矩阵”。矩阵的一种。在多元统计中,将来自不同类或不同组的样本离差矩阵\(SS^{(i)}\)综合起来得到的矩阵。它实际是各个样本的协方差矩阵的加权平均,可作为各样本来自的各总体(即各类)的综合协方差矩阵的估计。在判别分析、均值假设检验等方法中都有直接应用。若两个一元总体\(X_1\sim N(\mu_1,\sigma_1^2)\),\(X_2\sim N(\mu_2,\sigma_2^2)\)满足方差齐性,及\(\sigma_1^2=\sigma_2^2=\sigma^2\),为对假设“\(H_0:\mu_1=\mu_2\)”作检验,在未知\(\sigma^2\)时,可用于检验统计量\(t=\frac{\bar{X_1}-\bar{X_2}}{S_p\cdot\sqrt{(N_1+N_2)/N_1 N_2}}\)。在\(H_0\)成立时,\(t\)服从\(t(N_1+N_2-2)\)分布。式中\(N_1\),\(\bar{X_1}\)是来自总体\(X_1\)的样本大小和均值,\(N_2\),\(\bar{X_2}\)是来自总体\(X_2\)的样本大小和均值。再记\(S_1^2\)与\(S_2^2\)是分别来自两个总体的样本方差,则上面的\(S_p^2=\frac{(N_1-1)S_1^2+(N_2-1)S_2^2}{N_1+N_2-2}=\frac{1}{N_1+N_2-2}\left [ \sum_{i=1}^{N_1}(X_{1i}-\bar{X_1})^2+\sum_{i=1}^{N_2}(X_{2i}-\bar{X_2})^2 \right ]\)就是两个样本的混合方差,它是公共方差\(\sigma^2\)的无偏差估计。在\(p\)维情况,若记\(Y_{\alpha}^{(i)}\)为来自第\(i\)类(总体)的随机样本中的第个\(\alpha\)样品(\(\alpha=1,2,\cdots,n_i; i=1,2,\cdots,k\))。各样本的均值向量是\(Y_{\alpha}^{(i)}=\frac{1}{n_i}\sum_{n=1}^{n_i}Y_{\alpha}^{(i)} (i=1,2,\cdots,k)\)。各样本的离差矩阵(即离差平方和矩阵)是\(SS^{(i)}=\sum_{\alpha=1}^{n_1}(Y_{\alpha}^{(i)}-\bar{Y^{(i)}})(Y_{\alpha}^{(i)}-\bar{Y^{(i)}})'\)则\(k\)个类(总体)的样本的混合类内协方差矩阵为\(\frac{1}{N-k}\sum_{i=1}^{k}SS^{(i)}=\frac{1}{N-k}\sum_{i=1}^{k}\sum_{\alpha=1}^{n_i}(Y_{\alpha}^{(i)}-\bar{Y^{(i)}})(Y_{\alpha}^{(i)}-\bar{Y^{(i)}})'\)。它反映\(k\)个类的类内变异的情况。式中的\(N=\sum_{i=1}^k n_i\)。参见“样本协方差矩阵”。
没有要显示的评论
没有要显示的评论