跳转到主要内容

概化系数(generalizability coefficient)

一译“G系数”。概化理论术语。类似经典测量理论中信度的系数。克龙巴赫等人1972年定义。表示为\(E_p^2\)。在常模参照测验中,指用特定测量情境下获得的数据推论被试在推广域上的特质时的稳定性程度。其大小为全域分数变异与期望的观察分数变异之比率。对于\(P \times I\)的设计,期望的观察分数变异\(E_{\sigma_{(X)}}^2\)为\(E_{\sigma_{(X)}}^2=E_1E_P(X_{PI}-\mu_I)^2=\sigma_{(P)}^2+\sigma_{(\delta)}^2\),式中\(X_{PI}\)表示一个人的观察平均分数,\(\mu_I\)表示总体测验的平均分数,\(\sigma_{(P)}^2\)表示一个人的全域分数变异,\(\sigma_{(\delta)}^2\)表示误差变异。概化系数为\(E_P^2=\frac{\sigma_{(P)}^2}{\sigma_{(P)}^2+\sigma_{(\delta)}^2}\),这个系数约等于观察分数与全域分数相关系数的平方的期望值,可解释为两个长度为\(n_i^{'}\)的随机平行测验分数间相关的近似。当D研究(即决策研究)中\(n_i^{'}\)等于G研究(即拓广研究)中的\(n_i\)时,即被试接受长度为\(n_i\)的随机平行测验时,概化系数等于克龙巴赫a系数,即a系数只是概化系数的一个特例。随着用以估计G研究方差成分条件样本的大小(\(n_i\))和决策时实际使用的条件样本数目(\(n_i^{'}\))的不同,可求得不同的G系数。在标准参照测验中,类似信度系数的指标为可靠性指数(index of dependability),用Φ表示,其大小反映估计被试全域分数的可靠性。