跳转到主要内容

马氏距离(Mahalanobis distance)

一译“马哈拉诺比斯距离”。统计距离的一种。设\(p\)个变量的协方差矩阵为\(V\),第\(i\)个样品\(x_i=(x_{i1},x_{i2},\cdots,x_{ip})'\)和第\(j\)个样品\(x_j=(x_{j1},x_{j2},\cdots,x_{jp})^{'}\)的马氏距离为\(d_{ij}=[(x_i-x_j)^{'}V^{-1}(x_i-x_j)]^{\frac{1}{2}}\),式中\(V^{-1}\)是矩阵\(V\)的逆矩阵。马氏距离不受变量单位的影响,且利用了变量间的相关信息。当协方差矩阵为单位阵时(这时变量间彼此没有线性相关),马氏距离就是通常的欧氏距离。应用时,将样本协方差矩阵\(S=(S_{ij})_{p \times p}\)代替公式中的协方差矩阵\(V\),其中\(S_{ij}\)为变量\(X_i=(x_{1i},x_{2i},\cdots,x_{ni})^{'}\)和\(X_j=(x_{1j},x_{2j},\cdots,x_{nj})^{'}\)的协方差,即\(S_{ij}=\frac{1}{n-1}\sum_{k=1}^{n}(x_{ki}-\bar{x_i})(x_{kj}-\bar{x_j})\)。