正态分布

概率论中, 正态分布 (或 Gauß 分布) 是一种概率分布, 它在数学、统计学、自然科学、社会科学中具有广泛应用, 常常被视为已知期望方差时 “最自然” 的分布. 正态分布记为 , 其中 分别为期望、标准差, 从而 为方差.

下图绘制了正态分布的概率密度函数. 图中选了 作为正态分布的均值, 并且将标准差 也标注了出来. 一般的正态分布由该图像沿水平方向平移、拉伸得到.

对满足正态分布的随机变量而言, 其取值与期望的偏差在 , , 以内的概率分别约为 , , . 这也大致体现于上图中. 可以看出, 偏差在 以外的概率很小. 这在统计学中也被称为 “ 法则”.

正态分布的自然性可见于中心极限定理. 该定理说明, 对一列实值独立同分布随机变量 , 其和 近似满足正态分布 , 其中 分别是各 的期望、标准差. 在自然科学中, 如果将测量的误差视为多个微小误差的叠加, 则类似于上述结论, 测量结果总是近似满足正态分布. 这阐述了正态分布为何在自然科学中普遍出现.

随机向量而言, 也有多元正态分布的概念. 多元正态分布由其均值 协方差矩阵 所确定, 随机向量的取值在均值附近呈椭球形, 该椭球的形状由矩阵 确定. 例如, 下图描绘了一个 元正态分布, 即平面 上的正态分布, 图中颜色深浅代表了相应概率密度函数的取值大小.

1定义

定义 1.1 (正态分布). 给定实数 . 则以 为均值 (或期望), 标准差正态分布 上的概率分布, 记为 , 由概率密度函数给出. 正态分布 称为标准正态分布.

定义 1.2 (多元正态分布).自然数. 给定向量 正定矩阵 , 则以 为均值, 协方差矩阵 元正态分布 上的概率分布, 记为 , 由概率密度函数给出, 其中自变量 . 正态分布 称为 元标准正态分布, 其中 单位矩阵.

注意到, 若实值随机变量 独立同分布, 且满足标准正态分布 , 则随机向量 满足 元标准正态分布.

2性质

基本性质

若实值随机变量 满足正态分布 , 则

期望.

方差.

阶原点绝对

累积分布函数其中 误差函数.

特征函数

对实数 , 实值随机变量 满足正态分布 .

随机向量 满足 元正态分布 , 则

期望.

协方差矩阵.

特征函数

矩阵 维向量 , 随机向量 满足 元正态分布 .

为独立的随机变量, 且 , , 则 .

独立, 且都满足标准正态分布 , 则 满足自由度为 分布.

中心极限定理

中心极限定理说明, 大量独立同分布随机变量的均值近似满足正态分布.

定理 2.1 (中心极限定理). 独立同分布, 满足 . 记均值 , 则有依分布收敛

3相关概念

术语翻译

正态分布英文 normal distribution德文 Normalverteilung (f)法文 loi normale (f)日文 正規分布 (せいきぶんぷ)韩文 정규 분포 (正規分布)