跳转到主要内容

正态分布(normal distribution)

亦称“常态分布”、“高斯分布”。连续型随机变量概率分布的一种。德奠弗尔1733年发现。德国数学家高斯在研究误差理论时首先提出。连续型随机变量\(X\)的密度函数为\(f(x)=\frac{1}{\sqrt{2 \pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}(-\infty < x +\infty)\),式中\(\mu\)与\(\sigma\)是两个参数,\(\sigma>0\),\(\mu\)为实数,且简记为\(X \sim N(\mu,\sigma^2)\),称连续型随机变量\(X\)服从正态分布。正态分布的分布函数为\(F(x)=\frac{1}{\sqrt{2\pi \sigma}}\int\limits_{-\infty}^{x} e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt(-\infty < x +\infty)\)。密度函数\(f(x)\)与分布函数\(F(x)\)的图形如下:

正态分布的其他特征:(1)\(f(x)\)的曲线是关于\(y=\mu\)对称的,在\(x=\mu\)时\(f(x)\)有最大值\(\frac{1}{\sqrt{2 \pi \sigma}}\)(图1);(2)\(f(x)\)的各阶导数存在;(3)在\(x=\mu-\sigma\)和\(x=\mu+\sigma\)处各有一个拐点;\(x\)轴是曲线的渐近线,即 \(\);(4)\(\f(x)\)的曲线之下和\(x\)轴之上所围区域的面积等于1,由于曲线关于\(x=\mu\)对称,所以\(x=\mu\)左边与右边面积各\(\frac{1}{2}\);(5)正态分布\(N(\mu,\sigma^2)\)的曲线位置与形状实际上完全取决于参数\(\mu\)和\(\sigma\),其实\(\mu\)是分布的平均值或数学期望,\(\sigma\)是分布的标准差。于是\(\mu\)的大小决定了曲线左右位置,\(\sigma\)的大小决定了曲线的“胖瘦”程度(即离散程度)。但不管\(\mu\)与\(\sigma\)如何变化,曲线下方与\(x\)轴上方所围面积都等于1。试比较下图:

而分布函数\(F(x)\)是一条连续上升的曲线,有两条水平渐近线:\(x\)轴和\(y=-1\);当\(x=\mu\)时,曲线高度为0.5。正态分布在概率统计理论中占有极重要的地位,在统计实践中有十分广泛的应用。一般来说,若影响某一指标的随机因素很多,且每个因素所起的作用不太大(即不起决定性作用),则此指标可被视为服从正态分布。如测量误差、人的生理特征等。正态分布经过标准化可转化成标准正态分布。