一張圖片對於計算機來說,它看到就是一個矩陣,其值從0~255之間,0表示黑色,255表示白色。
將輸入的影象類比為如下的綠色的5*5的矩陣,實際上是0~255之間的值,為了方便我們其中的畫素值用0 ,1 表示,黃色表示卷積核,
那麼卷積的計算過程就是,3*3的卷積核在綠色5*5的輸入影象上不斷從左往右開始掃描,分別對應相乘,如1*1+1*0+0*1+1*0+1*1+1*0+0*1+1*0+1*1=3,依次得到右邊的3*3的卷積後的影象,叫做特徵圖(Feature Map),也就是卷積後提取的特徵。
對於不同的卷積核提取到的是不同的特徵,如下圖,對右邊的輸入影象,分別使用中
間不同的卷積核去進行濾波處理,得到提取到不同的特徵圖,如:邊緣提取卷積核提取到的是edge特徵,銳化卷積核提取到的是Sharpen特徵,box blur 和Gaussian blur 就相當於opencv中的均值濾波和高斯濾波函式處理的結果。這些濾波器使用的是固定的卷積核,所以提取的是固定的特徵。而卷積神經網路的卷積核是透過學習不斷更新的,當網路訓練結束時,神經網路的卷積核也就確定了,卷積核中的每一個值都是一個神經元,神經網路的訓練過程就是卷積核中權重不斷更新的過程。如下圖所示,卷積核從左往右,從上往下不斷掃描後得到的Feature Map,也就是提取到的特徵。
卷積核透過在輸入影象上不斷滑動來產生特徵圖(Feature Map),不同的卷積核可以生成不同的Feature Map。
卷積核相關引數介紹:
1、卷積核深度(depth),也就是卷積核的數量。
2、步長(stride),就是卷積核在輸入圖片上每次移動的畫素個數,stride越大,得到的Feature Map越小,預設是Stride=(1,1)。
3、補零(Zero-Padding),由於以stride從左到右移動最後時,可能出現移動到圖片以外,所以出現補零操作,預設是0.。
一張圖片對於計算機來說,它看到就是一個矩陣,其值從0~255之間,0表示黑色,255表示白色。
將輸入的影象類比為如下的綠色的5*5的矩陣,實際上是0~255之間的值,為了方便我們其中的畫素值用0 ,1 表示,黃色表示卷積核,
那麼卷積的計算過程就是,3*3的卷積核在綠色5*5的輸入影象上不斷從左往右開始掃描,分別對應相乘,如1*1+1*0+0*1+1*0+1*1+1*0+0*1+1*0+1*1=3,依次得到右邊的3*3的卷積後的影象,叫做特徵圖(Feature Map),也就是卷積後提取的特徵。
對於不同的卷積核提取到的是不同的特徵,如下圖,對右邊的輸入影象,分別使用中
間不同的卷積核去進行濾波處理,得到提取到不同的特徵圖,如:邊緣提取卷積核提取到的是edge特徵,銳化卷積核提取到的是Sharpen特徵,box blur 和Gaussian blur 就相當於opencv中的均值濾波和高斯濾波函式處理的結果。這些濾波器使用的是固定的卷積核,所以提取的是固定的特徵。而卷積神經網路的卷積核是透過學習不斷更新的,當網路訓練結束時,神經網路的卷積核也就確定了,卷積核中的每一個值都是一個神經元,神經網路的訓練過程就是卷積核中權重不斷更新的過程。如下圖所示,卷積核從左往右,從上往下不斷掃描後得到的Feature Map,也就是提取到的特徵。
卷積核透過在輸入影象上不斷滑動來產生特徵圖(Feature Map),不同的卷積核可以生成不同的Feature Map。
卷積核相關引數介紹:
1、卷積核深度(depth),也就是卷積核的數量。
2、步長(stride),就是卷積核在輸入圖片上每次移動的畫素個數,stride越大,得到的Feature Map越小,預設是Stride=(1,1)。
3、補零(Zero-Padding),由於以stride從左到右移動最後時,可能出現移動到圖片以外,所以出現補零操作,預設是0.。