這個問題看起來有點亂,我試著釐清一下。
首先,馬氏距離和Mahalanobis距離是一個概念(馬哈拉諾比斯距離,Mahalanobis distance)。在下面的回答中,我將統一用馬哈拉諾比斯距離這個概念。
馬哈拉諾比斯距離是用來衡量特徵空間中兩個資料點的相似性的。
這裡,x和y是兩個向量(用來表示兩個資料點),S是x和y所屬分佈的協方差矩陣。這個協方差矩陣的作用,是在計算距離(相似性)時,將資料點的特徵/維度之間的相關性納入考量。
因此,當矩陣S是單位矩陣時,馬哈拉諾比斯距離就變為我們熟悉的歐幾里得距離(
Euclidean distance)。
多維Mahalanobis距離是否要用到“互相關張量”來進行描述
我不太清楚你說的多維馬哈拉諾比斯距離是什麼意思?
如果你說的多維是指向量/資料點有多個維度/特徵的話,那這還是馬哈拉諾比斯距離。比如,假設有100個特徵,那一個100維向量仍然是特徵空間中的資料點,只不過是100維空間中的資料點而已,馬哈拉諾比斯距離仍然適用。這100個維度/特徵之間,假設有40個維度是相關的,那這40個維度其實是40個標量,100維向量x和100維向量y之間的互相關性也是用這40個標量之間的協方差矩陣描述。並不涉及“互相關張量”。
如果要用到“互相關張量”的話,那可能是要衡量多個點和多個點之間的距離?一般很少如此操作,當我們要衡量多個點之間的距離時,通常分別衡量這些點兩兩之間的距離。這就又回到了馬哈拉諾比斯距離。
這個問題看起來有點亂,我試著釐清一下。
首先,馬氏距離和Mahalanobis距離是一個概念(馬哈拉諾比斯距離,Mahalanobis distance)。在下面的回答中,我將統一用馬哈拉諾比斯距離這個概念。
馬哈拉諾比斯距離是用來衡量特徵空間中兩個資料點的相似性的。
這裡,x和y是兩個向量(用來表示兩個資料點),S是x和y所屬分佈的協方差矩陣。這個協方差矩陣的作用,是在計算距離(相似性)時,將資料點的特徵/維度之間的相關性納入考量。
因此,當矩陣S是單位矩陣時,馬哈拉諾比斯距離就變為我們熟悉的歐幾里得距離(
Euclidean distance)。
多維Mahalanobis距離是否要用到“互相關張量”來進行描述
我不太清楚你說的多維馬哈拉諾比斯距離是什麼意思?
如果你說的多維是指向量/資料點有多個維度/特徵的話,那這還是馬哈拉諾比斯距離。比如,假設有100個特徵,那一個100維向量仍然是特徵空間中的資料點,只不過是100維空間中的資料點而已,馬哈拉諾比斯距離仍然適用。這100個維度/特徵之間,假設有40個維度是相關的,那這40個維度其實是40個標量,100維向量x和100維向量y之間的互相關性也是用這40個標量之間的協方差矩陣描述。並不涉及“互相關張量”。
如果要用到“互相關張量”的話,那可能是要衡量多個點和多個點之間的距離?一般很少如此操作,當我們要衡量多個點之間的距離時,通常分別衡量這些點兩兩之間的距離。這就又回到了馬哈拉諾比斯距離。