回覆列表
-
1 # 智慧視點
-
2 # 北航秦曾昌
流形學習實際上是基於流形假設(manifold hypothesis):
我們日常見到的高維空間中的自然資料實際上只集中在低維的流形之中。當從流形上離開時,資料出現的機率密度就會劇烈下降。
這裡舉個例子,對於一張200*200的RGB影象,那麼會有10^96329(Latex的10的96329次冪)種可能性。如果我們隨機取樣的話,一個200*200的彩色照片在這個空間中均勻取樣出來的應該是這樣的:
但是我們常見到的圖片卻是下面的樣子:
由此我們可以推斷出
1. 我們日常見到的自然圖片實際上只佔據了整個空間中的很小的一部分;
2. 並且每張圖片之間的都是連續的平滑過渡。
從1中可以得知自然圖片在整個空間中分佈是具有尖峰密度的,由2可知流形上有連續的路徑。因此我們可以將上萬維的圖片轉換成低維的流形進行分析。
對於一系列頭部轉動的圖片,實際上就存在於一個低維的流形之中。
而流形學習就是透過某種方法學習到這一低維的流形,並將其表示出來。從而能夠進行資料降維以及資料視覺化。常用的方法就有Isomap和LLE以及t-SNE。
比如我們就可以利用t-SNE對大小為28*28的手寫數字圖片降到二維,表示出來。就是下面的樣子。
流形還廣泛的用在人臉的不同角度和光照,一個影片中的一個連續動作,等等。
透過線性代數的特徵值和特徵向量去考慮問題,使用實際問題得到一個圖例,在保持的區域性鄰接關係的情況下,將其圖從高維空間中重新畫在一個低維空間中,得到真正解決問題的思維方式。由於使用思維太跨維度目前解決問題使用及成效較少。