回覆列表
  • 1 # 統計機器學習

    用訓練集訓練好的卷積神經網路,當然是既可以提取訓練集的特徵,也可以提取測試集的特徵。

    1、卷積神經網路結構

    2、卷積神經網路發展歷程

    3、反向錯誤傳播

    卷積神經網路(CNN)用訓練集訓練的時候,卷積神經網路的前向傳播的卷積池化等過程即為特徵提取過程,最後計算損失函式,然後反向傳播根據鏈式求導法則來更新CNN的權值引數。這就是在調整每一層網路和卷積核的特徵提取器的引數(各層提取的特徵和起到的作用不同)。

    訓練是為了讓整個卷積神經網路特徵提取器的效果越來越好(越來越適應於訓練集),所以說訓練出來的卷積神經網路能夠提取訓練集的特徵。

    跑測試集是為了測試特徵提取器能力的高低,此時的CNN各層引數已經經過訓練集訓練,能夠提取類似訓練集這種型別的目標的引數(影象,聲音、文字),這時要再跑測試集來測試前面訓練得到的CNN的特徵提取能力。

    附:訓練集、測試集概念

    資料集:在機器學習任務中使用的一組資料,其中的每一個數據稱為一個樣本。反映樣本在某方面的表現或性質的事項或屬性稱為特徵。

    訓練集:訓練過程中使用的資料集,其中每個訓練樣本稱為訓練樣本。從資料中學得模型的過程稱為學習(訓練)。

    測試集:學得模型後,使用其進行預測的過程稱為測試,使用的資料集稱為測試集,每個樣本稱為測試樣本。

  • 2 # 淺度學習的CVer

    訓練集訓練的網路當然可以提取訓練集的特徵,當然前提是你訓練的卷積神經網路成功的收斂了,同時模型沒有過擬合,那麼在你的測試集和訓練集是同類資料的情況下,模型也可以提取測試集的特徵。

    我覺有這種疑問的前提是對卷積神經網路提取的特徵不夠了解。就影象而言,常見的特徵可能就是單純的結構特徵,屬於低階特徵,這種特徵一般由淺層網路來提取,而深層的網路一般都是提取的高階特徵資訊,也許主觀上人類根本無法理解,網路用訓練集提取的特徵,比如說直線這一簡單的結構特徵,是可以通用的,你用其他圖片(包含直線的),那模型就可以檢測出來這個直線,在這種情況下,模型本質上是學習了對應的卷積核引數,也就是影象中的濾波器,一般是可以通用的

  • 中秋節和大豐收的關聯?
  • 為什麼空調掛機會在出風口滴水?