3.3 数据统计

3.3.1 统计数据的解释

常见的统计数据不需要进行解释，这对于期刊文章中所使用的绝大多数统计方法来说都是适用的。不过，在下面两种情况下请一定加以解释：⑴不常用的统计方法的结果，尤其是那些虽然在期刊中出现过但是还没有列入统计教材中的方法；⑵有争议的统计数据（如，当显著程度没有达到假设所认可的水平时却认为它们是显著的）。另外，当统计本身就是文章的重点时，也要提供支持性解释。

3.3.2 统计信息的充分描述

进行推论统计时，要提供充分的信息来帮助读者确证所进行的分析。

对于参数检验（例如，单组、多组或者平均数的多因素检验），一组充分的统计信息应包括单元（cell）平均数、单元样本的大小以及变异性（例如单元标准差或者方差）的测量。另外，单元平均数、均方差以及自由度也可以构成一组充分的统计数据。
对于随机区组设计、重复测量设计、多变量方差分析，充分的统计信息包括单元平均数、单元样本大小以及单元内方差-协方差矩阵。
对于相关分析（例如多元回归分析、因素分析以及结构方程模型），充分的统计信息包括样本的大小、方差-协方差矩阵（或相关矩阵）以及其他一些与使用的程序具体相关的信息（例如变量的平均数、信度、假设的结构模型和其他参数）。
对于非参数分析（例如列联表的χ2分析、计数数据的分析），应提供各种原始数据的总体描述（例如每一类别的被试数目、等级的总数、每个单元的样本大小）。
小样本分析（包括个案研究），可以通过表格或者插图来提供完整的数据描述。

3.3.3 统计力

在假设检验中要特别考虑统计力，即正确拒绝研究假设的概率，因此要给出具体的α水平、效应值和样本大小。基于这种考虑，应当提供足够的证据来说明统计力可以检测出实验影响的效果。同样，当检验基于某种统计模型（如正态分布、方差同质性和回归同质性）以及模型拟合中的各种假设时，如果接受虚无假设（即当你认为不存在差异时），也应该意识到样本大小在其中所起的作用。

3.3.4 统计显著性

在推论统计检验中，表示显著性的概率有2种。一种是先验概率(a priori probability)，是指错误拒绝一个虚无假设时可接受的水平，即α水平，是假设检验中第一类错误的概率。通常使用的α水平为0.05或0.01。在报告具体的结果之前，按惯例需要申明为统计检验而选择的α水平。如果没有对α水平作一个总的说明，那么在报告每一个结果时都要具体说明α水平。

另一种是通过计算实得的后验概率（posteriori likelihood），是指假定虚无假设为真时，获得一个与实际统计值同样极端或更极端的结果的可能性。比如，假定虚无假设为真，计算出的概率为0.008。现在，许多统计包都提供了这些实际值。除了设置特定的α水平以确定是拒绝还是接受虚无假设外，你还可以报告这一明确信息。例如：

设定α水平为0.05，年龄的效应具有统计显著性，F(1, 123) = 7.27，*p = 0.008。

或

年龄的效应在统计上不显著，F(1,123)=2.45, p = 0.12。

第二个例子只有在论文前面对α水平做了总体说明之后才能使用。如果不希望报告实际概率，也可以报告与之接近的通常使用的概率值。例如：

年龄的效应在统计上不显著，F(1,123)=2.45, p >0.10。

3.3.5 效应大小和相关的强弱

因为上述两种概率值依赖于样本大小，因此这两种概率值都不能反映出效应的重要性或关系的强度。可以采用不依赖于样本大小的一些测量指标来估计效应的重要性或关系的强度。通常这些测量指标包括r2, η2, ω2, R2, φ2, Cramer的V, Kendall的W, Cohen的d和κ, Goodman和Kruskal的λ和γ,以及多变量Roy的Θ和Pillai-Bartlett的V。

尽管在大多数情况下，当报告了统计检验（如t和F）和样本大小（或自由度）时，有关效应大小的量值已经可以获得，但还是建议作者提供效应大小的有关信息。比如，给出基于ν1和ν2自由度下的F比率，由关联效应（η2, 即r2的概括）解释的方差部分可以由ν1F/(ν1F +ν2)决定。

3.3.6 正文中的统计数据

报告推论统计数据（如t检验，F检验, χ2检验）时要提供充分的信息，以让读者能明白作者的分析。当然，充分的信息是以所选择的统计检验和分析为基础的。下面给出了一个呈现样例：

对于即时再认，句型结构的主效应不显著，F（2，116）= 2.80，MSE = 0.025；但句型结构与句子主题和策略之间都有显著的交互作用，分别为F（2，116）=3.71，p < 0.05；F（2，116）3.25，p < 0.05。

与研究假设一样，对于自主运动幻想来说，催眠感受性强的被试（M = 8.18，SD = 7.11）比其他被试（M = 5.25，SD = 4.24）更多地报告，在运动时能明显地感知到固定的灯光，t（60）= 1.99， p=0.05。感受性强的被试组（M = 21.40，SD = 10.34）报告的极端情况的出现频率、注意力集中水平显著高于感受性弱的被试组（M = 46.23， SD = 11.08），t（75）= 2.19， p < 0.05。

用文字叙述的方式进一步强调一些特殊的数据，这样做似乎有一定的意义，但是如果已经以图表的形式报告了描述统计值，那就不需要在正文中再重复了。

对于卡方检验，要在圆括号中注明自由度和样本量，即提供卡方分析的必要数据。例如：

χ²（4，N = 90）= 10.51， p = 0.03

列举系列统计结果时，要确保这些统计数据之间的关系以及他们各自的标志清晰、明确。可以用“分别”、“依次”之类的词阐明其中的关系。例如：

测验1到4的平均数（标准差）分别是2.43（0.50），2.59（1.21），2.68（0.39），2.86（0.12）。

测验1到4的平均数依次为2.43，2.59，2.68，2.86（标准差分别是0.50，1.21，0.39，0.12）。

3.3.7 统计符号

叙述中用到统计术语时，不要用该术语的符号代替术语本身。如，要写成平均数是…，而不是M是…。

总体与样本统计的符号总体（即理论上的而非实际观测得来的数据）统计量，确切地说是参数，通常用小写希腊字母呈现。也有一些样本（即实际观测得来的数据）统计量用希腊字母呈现（如χ2），但大多数样本统计用斜体拉丁字母呈现（如，SD）。

被试量符号使用大写斜体字母N标明样本总体的被试人数（如，N =135）；使用小写斜体字母n 标明部分样本的被试人数（如，n=30）。

百分比符号（%）仅在数字后使用百分比符号。在没有给出数字时，使用“百分比”一词。如：

发现18%的老鼠……

确定老鼠的百分比……

提示：为了节省空间，在表头和图例中应使用“%”符号。

统计符号通常使用斜体字。如：N，MX，df，p，SSb，SE，MSE，t，F，但希腊字母、下标和上标等标识符（即非变量）以及非变量的缩写（如，sin、log）要用正体排版。向量符号要用黑体字排版。有关字体请参阅3.7（字母的大写与斜体）。

表1给出了一些常见统计术语的缩写。

在论文写作中，要注意区分容易混淆的字母和符号，如数字1和字母l，数字0和字母o，乘号×和字母X，希腊字母Β（β的大写）和英文字母B等。

表1 统计符号列表和释义

印刷体	英文释义	中文释义
ANCOVA	Analysis of covariance	协方差分析
ANOVA	Analysis of variance (univariance)	方差分析（单变量）
d	Cohen’s measure of effect size	用于柯斯二氏检验
d’	(d prime)measure of sensitivity	敏感性测量或辨别力
D	Used in Kolmogorov-Smirnov test	用于Kolmogorov-Smirnov检验
df	degree of freedom	自由度
f	Frequency	频次
f_e	Expected frequency	期望频次
F	Fisher's F ratio	费舍F比率
F_max	Hartley's test of variance homogeneity	Hartley's方差齐性检验
H	Used in Kruskal-Wallis test; also used to mean hypothesis	用于克-瓦氏检验；也可代表“假设”
H₀	Null hypothesis under test	检验中的虚无假设
H₁	Alternative hypothesis	对立假设或备择假设
HSD	Tukey’s honestly significant difference (also referred to as the Tukey a procedure)	Tukey’s真实显著性差异
k	Coefficient of alienation	离散系数
k²	Coefficient of nondetermination	非决定系数
K-R 20	Kuder-Richardson formula	库理20号公式
LR	Likelihood ratio (used with some Chi-square)	似然比（与一些卡方值一同使用）
LSD	Fisher's least significant difference	费舍最小显著性差异
M MANOVA Mdn mle mode MS MSE n N ns p P pr q Q r r² r_b r_k r₁ r_pb r_s R R² SD SE	Mean (arithmetic average) Multivariate analysis of variance Median Maximum likelihood estimate (used with programs such as LISREL) Most frequently occurring score Mean square Mean square error Number in a subsample Total number in a sample Nonsignificant Probability; also the success probability of a binomial variable Percentage, percentile Partial correlation 1- p for a binomial variable Quartile (also used in Cochran’s test) Pearson product-moment correlation Pearson product-moment correlation squared; coefficient of determination Biserial correlation Reliability of mean k judges’ ratings Estimated reliability of the typical judge Point-biserial correlation Spearman rank correlation coefficient (formerly rho [ρ]) Multiple correlation;also composite rank, a significance test Multiple correlation squared;measure of strength of relationship Standard devation Standard error	平均数（算术平均数）多元方差分析或多因变量方差分析中数最大似然估计（与诸如LISREL之类的程序一起使用）众数均方均方误样本数样本总数差异不显著概率；也指二项分布中的成功概率百分比；百分位数偏相关二项分布中1- p的值四分差皮尔逊积差相关皮尔逊积差相关的平方；决定系数二列相关评分者信度典型判断的估计信度点二列相关斯皮尔曼等级相关系数（以前用ρ表示）多重相关；也可表示等级多重相关的平方；关系强度的测量标准差标准误








SEM	Standard error of measurement	测量的标准误
sr SS t T *T ² Tukey a U V W x y z \|a\| α β γ Δ η² θ λ Λ ν ρ₁ Σ t φ φ² χ² Ψ w² ^	Semipartial correlation Sum of squares Computed value of t test Computed value of Wilcoxon’s or McCall’s test Computed value of Hotelling’s test Turkey’s HSD procedure Computed value of Mann-Whitney test Cramer’s statistic for contingency tables; Pillai-Bartlett multivariate criterion Kendall’s coefficient of concordance Abscissa (horizontal axis in graph) Ordinate (vertical axis in graph) A standard score; difference between one value in a distribution and the mean of the distribution divided by the SD Absolute value of a Alpha; probability of a Type I error; Cronbach’s index of internal consistency Beta; probability of a Type Ⅱ error (1-β is statistical power); standardized multiple regression coefficient Gamma; Goodman-Kruskal’s index of relationship Delta(cap); increment of change Eta squared; measure of strength of relationship Theta(cap); Roy’s multivariate creterion Lambda; Goodman-Kruskal’s measure of predictability Lambda(cap); Wilks’s multivariate criterion Nu; degrees of freedom Rho(with subscript); intraclass correlation coefficient Sigma(cap); sum or summation Tau; Kendall’s rank correlation coefficient; also Hotelling’s multivariate trace criterion Phi; measure of association for a contingency table; also a parameter used in a determining sample size or statistical power Phi squared; proportion of variance accounted for in a 2*2 contingency table Computed value of a chi-square test Psi; a statistical comparison Omega squared; measure of strength of relationship (caret) when above a Greek letter (or parameter), indicates an estimate (or statistic)	半偏相关平方和 t检验统计量威尔科克逊或麦考尔检验统计量 Hotelling’s检验的统计量 Turkey’s HSD程序曼-惠特尼检验统计量列联表的Cramer’s统计值，根据卡方系数计算公式而得肯德尔和谐系数横坐标纵坐标标准分；一个分布中的某变量和平均数的差距除以SD所得值 a的绝对值犯І型错误的概率；克伦巴赫内部一致性信度系数犯Ⅱ型错误的概率（1-β为统计检验力）；标准化多元回归系数 Goodman-Kruskal’s关系指数变化的增加量关系强度的测量 Roy’s多因变量检验标准 Goodman-Kruskal’s预测系数大写Lambda; Wilks’s多因变量检验标准自由度 Rho(带下标)；组内相关（类相关）系数 Sigma（大写）；相加求和 Tau; Kendall’s等级相关系数；也表示Hotelling’s多变量trace检验标准 Phi; 列联表相关指标；也用作决定样本量的参数或统计检验力 Phi的平方；2×2列联表方差比例卡方检验值 Psi; 统计比较 Omega的平方；关系强度的测量用于希腊字母或符号的上面表示估计或统计

（资料来源：American Psychological Association. Publication Manual of the American Psychological Association. The 5th ed. Washton D C, 2001.141~144，有改动）

3.3.8 数学公式

不需要对常用的统计数据进行解释，但当统计或数学表达方式是新的、少见的或者对于论文来说很关键时，请务必给出有关公式。为节省版面，可以把比较简单的短表达式与文字放在一行中，如a = [(1 + b )/x]1/2。例如下面的表达式就很难放到一行中：

\(a = \sqrt{\frac{1+b}{x}}\)

公式的书写要另起一行，而且公式上下要空一行。即使是简单的公式，如果被多次引用，也要呈现出来。复杂的公式一定要呈现。公式的标注数字要有连续性，并且要靠右边书写。如：

\(x = -2\sum{a_x^2}+a_0+\frac{\cos{x}-5ab}{1/n+ax}\) (1)

当引用了某一公式时，要写出引用标志；如写作“公式1”（而不要缩写成“式1”，或写作“第一个公式”）。

数学表达式的书写要注意字符之间的空格，比如a+b=c就不如写成a + b = c ，这样看起来要更清楚。同时要特别注意组合符号的书写。通常下标在上标的前面（Xa2），但是撇号“′”要紧接着字母或符号写（X′a）。

数学公式与文字叙述具有同样的功能，是文章的有机组成部分，所以，无论公式是在正文中间还是独占一行，都要按实际需要确定公式后面是否要加逗号、分号或句号。