歐氏距離定義:歐氏距離(Euclideandistance)是一個通常採用的距離定義,它是在m維空間中兩個點之間的真實距離,兩個向量之間的歐氏距離計算公式如下: 其中X,Y分別是m維的向量. 馬氏距離 我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點.它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求.例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性.因此,有時需要採用不同的距離函式. 如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件: ①當且僅當i=j時,dij=0 ②dij>0 ③dij=dji(對稱性) ④dij≤dik+dkj(三角不等式) 顯然,歐氏距離滿足以上四個條件.滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種. 第i個樣品與第j個樣品的馬氏距離dij用下式計算: dij=(xi一xj)"S-1(xi一xj) 其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,S為樣本協方差矩陣. 馬氏距離有很多優點.它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同.馬氏距離還可以排除變數之間的相關性的干擾.它的缺點是誇大了變化微小的變數的作用.
歐氏距離定義:歐氏距離(Euclideandistance)是一個通常採用的距離定義,它是在m維空間中兩個點之間的真實距離,兩個向量之間的歐氏距離計算公式如下: 其中X,Y分別是m維的向量. 馬氏距離 我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點.它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求.例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性.因此,有時需要採用不同的距離函式. 如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件: ①當且僅當i=j時,dij=0 ②dij>0 ③dij=dji(對稱性) ④dij≤dik+dkj(三角不等式) 顯然,歐氏距離滿足以上四個條件.滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種. 第i個樣品與第j個樣品的馬氏距離dij用下式計算: dij=(xi一xj)"S-1(xi一xj) 其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,S為樣本協方差矩陣. 馬氏距離有很多優點.它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同.馬氏距離還可以排除變數之間的相關性的干擾.它的缺點是誇大了變化微小的變數的作用.