跳转到主要内容

贝叶斯统计

贝叶斯统计(Bayesian statistics)

推断统计理论的一种。英国学者贝叶斯在1763年发表的论文《有关机遇问题求解的短论》中提出。依据获得样本(\(X_1,X_2,\dotsc,X_n\))之后\(\theta\)的后验分布\(\pi(\theta|X_1,X_2,\dotsc,X_n)\)对总体参数\(\theta\)作出估计和推断。它不是由样本分布作出推断。其理论基础是先验概率和后验分布,即在事件概率时,除样本提供的后验信息外,还会凭借自己主观已有的先验信息来估计事件的概率。而以R. A. 费希尔为首的经典统计理论对事件概率的解释是频率解释,即通过抽取样本,由样本计算出事件的频率,而样本提供的信息完全是客观的,一切推断的结论或决策不允许加入任何主观的先验的信息。以对神童出现的概率P的估计为例。按经典统计的做法,完全由样本提供的信息(即后验信息)来估计,认为参数p是一个“值”。贝叶斯统计的做法是,除样本提供的后验信息外,人类的经验对\(p\)有了一个了解,如\(p\)可能取\(p_1\)与\(p_2\),且取\(p_1\)的机会很大,取\(p_2\)机会很小。先验信息关于参数\(p\)的信息是一个“分布”,如\(P(p=p_1)=0.9\),\(P(p=p_2)=0.1\),即在抽样之前已知道(先验的) \(p\)取\(p_1\)的可能性为0.9。若不去抽样便要作出推断,自然会取\(p=p_1\)。但若抽样后,除非后验信息(即样本提供的信息)包含十分有利于“\(p=p_2\)”的支持论据,否则采纳先验的看法“\(p=p_1\)”。20世纪50年代后贝叶斯统计得到真正发展,但在发展过程中始终存在着与经典统计之间的争论。参见“先验概率”、“后验分布”。