跳转到主要内容

3.3 数据统计

3.3.1 统计数据的解释

常见的统计数据不需要进行解释,这对于期刊文章中所使用的绝大多数统计方法来说都是适用的。不过,在下面两种情况下请一定加以解释:⑴不常用的统计方法的结果,尤其是那些虽然在期刊中出现过但是还没有列入统计教材中的方法;⑵有争议的统计数据(如,当显著程度没有达到假设所认可的水平时却认为它们是显著的)。另外,当统计本身就是文章的重点时,也要提供支持性解释。

3.3.2 统计信息的充分描述

进行推论统计时,要提供充分的信息来帮助读者确证所进行的分析。

  • 对于参数检验(例如,单组、多组或者平均数的多因素检验),一组充分的统计信息应包括单元(cell)平均数、单元样本的大小以及变异性(例如单元标准差或者方差)的测量。另外,单元平均数、均方差以及自由度也可以构成一组充分的统计数据。
  • 对于随机区组设计、重复测量设计、多变量方差分析,充分的统计信息包括单元平均数、单元样本大小以及单元内方差-协方差矩阵。
  • 对于相关分析(例如多元回归分析、因素分析以及结构方程模型),充分的统计信息包括样本的大小、方差-协方差矩阵(或相关矩阵)以及其他一些与使用的程序具体相关的信息(例如变量的平均数、信度、假设的结构模型和其他参数)。
  • 对于非参数分析(例如列联表的χ2分析、计数数据的分析),应提供各种原始数据的总体描述(例如每一类别的被试数目、等级的总数、每个单元的样本大小)。
  • 小样本分析(包括个案研究),可以通过表格或者插图来提供完整的数据描述。

3.3.3 统计力

在假设检验中要特别考虑统计力,即正确拒绝研究假设的概率,因此要给出具体的α水平、效应值和样本大小。基于这种考虑,应当提供足够的证据来说明统计力可以检测出实验影响的效果。同样,当检验基于某种统计模型(如正态分布、方差同质性和回归同质性)以及模型拟合中的各种假设时,如果接受虚无假设(即当你认为不存在差异时),也应该意识到样本大小在其中所起的作用。

3.3.4 统计显著性

在推论统计检验中,表示显著性的概率有2种。一种是先验概率(a priori probability),是指错误拒绝一个虚无假设时可接受的水平,即α水平,是假设检验中第一类错误的概率。通常使用的α水平为0.05或0.01。在报告具体的结果之前,按惯例需要申明为统计检验而选择的α水平。如果没有对α水平作一个总的说明,那么在报告每一个结果时都要具体说明α水平。

另一种是通过计算实得的后验概率(posteriori likelihood),是指假定虚无假设为真时,获得一个与实际统计值同样极端或更极端的结果的可能性。比如,假定虚无假设为真,计算出的概率为0.008。现在,许多统计包都提供了这些实际值。除了设置特定的α水平以确定是拒绝还是接受虚无假设外,你还可以报告这一明确信息。例如:

设定α水平为0.05,年龄的效应具有统计显著性,F(1, 123) = 7.27,p = 0.008。

年龄的效应在统计上不显著,F(1,123)=2.45, p = 0.12。

第二个例子只有在论文前面对α水平做了总体说明之后才能使用。如果不希望报告实际概率,也可以报告与之接近的通常使用的概率值。例如:

年龄的效应在统计上不显著,F(1,123)=2.45, p >0.10。

3.3.5 效应大小和相关的强弱

因为上述两种概率值依赖于样本大小,因此这两种概率值都不能反映出效应的重要性或关系的强度。可以采用不依赖于样本大小的一些测量指标来估计效应的重要性或关系的强度。通常这些测量指标包括r2, η2, ω2, R2, φ2, Cramer的V, Kendall的W, Cohen的d和κ, Goodman和Kruskal的λ和γ,以及多变量Roy的Θ和Pillai-Bartlett的V。

尽管在大多数情况下,当报告了统计检验(如t和F)和样本大小(或自由度)时,有关效应大小的量值已经可以获得,但还是建议作者提供效应大小的有关信息。比如,给出基于ν1和ν2自由度下的F比率,由关联效应(η2, 即r2的概括)解释的方差部分可以由ν1F/(ν1F2)决定。

3.3.6 正文中的统计数据

报告推论统计数据(如t检验,F检验, χ2检验)时要提供充分的信息,以让读者能明白作者的分析。当然,充分的信息是以所选择的统计检验和分析为基础的。下面给出了一个呈现样例:

对于即时再认,句型结构的主效应不显著,F(2,116)= 2.80,MSE = 0.025;但句型结构与句子主题和策略之间都有显著的交互作用,分别为F(2,116)=3.71,p < 0.05;F(2,116)3.25,p < 0.05。

与研究假设一样,对于自主运动幻想来说,催眠感受性强的被试(M = 8.18,SD = 7.11)比其他被试(M = 5.25,SD = 4.24)更多地报告,在运动时能明显地感知到固定的灯光,t(60)= 1.99, p=0.05。感受性强的被试组(M = 21.40,SD = 10.34)报告的极端情况的出现频率、注意力集中水平显著高于感受性弱的被试组(M = 46.23, SD = 11.08),t(75)= 2.19, p < 0.05。

用文字叙述的方式进一步强调一些特殊的数据,这样做似乎有一定的意义,但是如果已经以图表的形式报告了描述统计值,那就不需要在正文中再重复了。

对于卡方检验,要在圆括号中注明自由度和样本量,即提供卡方分析的必要数据。例如:

χ2(4,N = 90)= 10.51, p= 0.03

列举系列统计结果时,要确保这些统计数据之间的关系以及他们各自的标志清晰、明确。可以用“分别”、“依次”之类的词阐明其中的关系。例如:

测验1到4的平均数(标准差)分别是2.43(0.50),2.59(1.21),2.68(0.39),2.86(0.12)。

测验1到4的平均数依次为2.43,2.59,2.68,2.86(标准差分别是0.50,1.21,0.39,0.12)。

3.3.7 统计符号

叙述中用到统计术语时,不要用该术语的符号代替术语本身。如,要写成平均数是…,而不是M是…。

总体与样本统计的符号 总体(即理论上的而非实际观测得来的数据)统计量,确切地说是参数,通常用小写希腊字母呈现。也有一些样本(即实际观测得来的数据)统计量用希腊字母呈现(如χ2),但大多数样本统计用斜体拉丁字母呈现(如,SD)。

被试量符号 使用大写斜体字母N标明样本总体的被试人数(如,N =135);使用小写斜体字母n 标明部分样本的被试人数(如,n=30)。

百分比符号(%) 仅在数字后使用百分比符号。在没有给出数字时,使用“百分比”一词。如:

发现18%的老鼠……

确定老鼠的百分比……

提示:为了节省空间,在表头和图例中应使用“%”符号。

统计符号通常使用斜体字。如:NMXdfpSSbSEMSEtF,但希腊字母、下标和上标等标识符(即非变量)以及非变量的缩写(如,sin、log)要用正体排版。向量符号要用黑体字排版。有关字体请参阅3.7(字母的大写与斜体)。

表1给出了一些常见统计术语的缩写。

在论文写作中,要注意区分容易混淆的字母和符号,如数字1和字母l,数字0和字母o,乘号×和字母X,希腊字母Β(β的大写)和英文字母B等。

表1 统计符号列表和释义
印刷体 英文释义 中文释义
ANCOVA Analysis of covariance 协方差分析
ANOVA Analysis of variance (univariance) 方差分析(单变量)
d Cohen's measure of effect size 用于柯斯二氏检验
d' (d prime)measure of sensitivity 敏感性测量或辨别力
D Used in Kolmogorov-Smirnov test 用于Kolmogorov-Smirnov检验
df degree of freedom 自由度
f Frequency 频次
fe Expected frequency 期望频次
F Fisher's F ratio 费舍F比率
Fmax Hartley's test of variance homogeneity Hartley's方差齐性检验
H Used in Kruskal-Wallis test; also used to mean hypothesis 用于克-瓦氏检验;也可代表“假设”
H0 Null hypothesis under test 检验中的虚无假设
H1 Alternative hypothesis 对立假设或备择假设
HSD Tukey's honestly significant difference (also referred to as the Tukey a procedure) Tukey's真实显著性差异
k Coefficient of alienation 离散系数
Coefficient of nondetermination 非决定系数
K-R 20 Kuder-Richardson formula 库理20号公式
LR Likelihood ratio (used with some Chi-square) 似然比(与一些卡方值一同使用)
LSD Fisher's least significant difference 费舍最小显著性差异
M Mean (arithmetic average) 平均数(算术平均数)
MANOVA Multivariate analysis of variance 多元方差分析或多因变量方差分析
Mdn Median 中数
mle Maximum likelihood estimate (used with programs such as LISREL) 最大似然估计(与诸如LISREL之类的程序一起使用)
mode Most frequently occurring score 众数
MS Mean square 均方
MSE Mean square error 均方误
n Number in a subsample 样本数
N Total number in a sample 样本总数
ns Nonsignificant 差异不显著
p Probability; also the success probability of a binomial variable 概率;也指二项分布中的成功概率
P Percentage, percentile 百分比;百分位数
pr Partial correlation 偏相关
q 1- p for a binomial variable 二项分布中1- p的值
Q Quartile (also used in Cochran's test) 四分差
r Pearson product-moment correlation 皮尔逊积差相关
Pearson product-moment correlation  squared; coefficient of determination 皮尔逊积差相关的平方;决定系数

rb

Biserial correlation

二列相关

rk

Reliability of mean k judges' ratings

评分者信度

r1 Estimated reliability of the typical judge 典型判断的估计信度
rpb Point-biserial correlation 点二列相关
rs

Spearman rank correlation coefficient (formerly rho [ρ])

斯皮尔曼等级相关系数(以前用ρ表示)
R Multiple correlation; also composite rank, a significance test 多重相关;也可表示等级
Multiple correlation squared; measure of strength of relationship 多重相关的平方;关系强度的测量
SD Standard devation 标准差
SE Standard error 标准误
SEM Standard error of measurement 测量的标准误
sr Semipartial correlation 半偏相关
SS Sum of squares 平方和
t Computed value of t test t检验统计量
T Computed value of Wilcoxon's or McCall's test 威尔科克逊或麦考尔检验统计量
Computed value of Hotelling's test Hotelling's检验的统计量
Tukey a Turkey's HSD procedure Turkey's HSD程序
U Computed value of Mann-Whitney test 曼-惠特尼检验统计量
V Cramer's statistic for contingency tables; Pillai-Bartlett multivariate criterion 列联表的Cramer's统计值,根据卡方系数计算公式而得
W Kendall's coefficient of concordance 肯德尔和谐系数
x Abscissa (horizontal axis in graph) 横坐标
y Ordinate (vertical axis in graph) 纵坐标
z A standard score; difference between one value in a distribution and the mean of the distribution divided by the SD 标准分;一个分布中的某变量和平均数的差距除以SD所得值
|a| Absolute value of a a的绝对值
α Alpha; probability of a Type I error;  Cronbach's index of internal consistency 犯І型错误的概率;克伦巴赫内部一致性信度系数
β Beta; probability of a Type Ⅱ error (1-β is statistical power); standardized multiple regression coefficient 犯Ⅱ型错误的概率(1-β为统计检验力);标准化多元回归系数
γ Gamma; Goodman-Kruskal's index of relationship Goodman-Kruskal's关系指数
Δ Delta(cap); increment of change 变化的增加量
η² Eta squared; measure of strength of relationship 关系强度的测量
θ Theta(cap); Roy's multivariate creterion Roy's多因变量检验标准
λ Lambda; Goodman-Kruskal's measure of predictability Goodman-Kruskal's预测系数
Λ Lambda(cap); Wilks's multivariate criterion 大写Lambda; Wilks's多因变量检验标准
ν Nu; degrees of freedom 自由度
ρ1 Rho(with subscript); intraclass correlation coefficient Rho(带下标);组内相关(类相关)系数
Σ Sigma(cap); sum or summation Sigma(大写);相加求和
t Tau; Kendall's rank correlation coefficient; also Hotelling's multivariate trace criterion' Tau; Kendall's等级相关系数;也表示Hotelling's多变量trace检验标准
φ Phi; measure of association for a contingency table; also a parameter used in a determining sample size or statistical power

Phi; 列联表相关指标;也用作决定样本量的参数或统计检验力

φ2 Phi squared; proportion of variance accounted for in a 2*2 contingency table

Phi的平方;2×2列联表方差比例

χ2 Computed value of a chi-square test

卡方检验值

Ψ Psi; a statistical comparison

Psi; 统计比较

w2 Omega squared; measure of strength of relationship

Omega的平方;关系强度的测量

^

(caret) when above a Greek letter (or parameter), indicates an estimate (or statistic)

用于希腊字母或符号的上面表示估计或统计

(资料来源:American Psychological Association. Publication Manual of the American Psychological Association. The 5th ed. Washton D C, 2001.141~144,有改动)

3.3.8 数学公式

不需要对常用的统计数据进行解释,但当统计或数学表达方式是新的、少见的或者对于论文来说很关键时,请务必给出有关公式。为节省版面,可以把比较简单的短表达式与文字放在一行中,如a = [(1 + b )/x]1/2。例如下面的表达式就很难放到一行中:

\(a = \sqrt{\frac{1+b}{x}}\)

公式的书写要另起一行,而且公式上下要空一行。即使是简单的公式,如果被多次引用,也要呈现出来。复杂的公式一定要呈现。公式的标注数字要有连续性,并且要靠右边书写。如:

\(x = -2\sum{a_x^2}+a_0+\frac{\cos{x}-5ab}{1/n+ax}\)                                                        (1)

当引用了某一公式时,要写出引用标志;如写作“公式1”(而不要缩写成“式1”,或写作“第一个公式”)。

数学表达式的书写要注意字符之间的空格,比如a+b=c就不如写成a + b = c ,这样看起来要更清楚。同时要特别注意组合符号的书写。通常下标在上标的前面(Xa2),但是撇号“′”要紧接着字母或符号写(X′a)。

数学公式与文字叙述具有同样的功能,是文章的有机组成部分,所以,无论公式是在正文中间还是独占一行,都要按实际需要确定公式后面是否要加逗号、分号或句号。