点二列相关系数(point biserial correlation coefficient)
相关系数的一种。二分变量与等距变量之间的相关系数。适用于一列变量观测值为正态分布,另一列变量为分类的二值变量的情况。设\(X\)是含两个状态的类别变量(即\(X\)只取两个值),\(Y\)是等距变量。习惯上将样本数据写成两列(或两行),一列对于\(X\)的一种状态。计算\(X\)与\(Y\)的点二列相关系数公式为\(r_{pb} = \frac{\bar{Y_1}-\bar{Y_2}}{S_Y} \sqrt{p(1-p)} \),式中\(\bar{Y_1}\)为\(X = X_1\)时\(Y\)的平均值;\(\bar{Y_2}\)为\(X = X_2\)时\(Y\)的平均值;\(S_Y\)为\(Y\)的标准差;\(p\)为的样品个数占全部样品个数的比例。若\(X\)的取值为0或1,计算\(X\)与Y的积矩相关系数,结果与点双列相关系数相同,但可能符号不同。
没有要显示的评论
没有要显示的评论