回覆列表
-
1 # 我們的英雄袁隆平姥爺
-
2 # 北航秦曾昌
深度學習模型的訓練,為了避免出現過擬合(Overfitting)的現象,就離不開大量的資料作為支撐。如ImageNet的公開資料集就有幾十萬之多張圖片。但是資料收集和標註工作需耗費大量的人力和時間。因此在實踐中就需要對原有的資料集進行擴充,即資料增強(Data Augmentation)。
資料增強就是透過對原有的影象資料進行一種或者多種變換,來成倍的擴充資料量。有助於網路學習到影象不變性的特徵。
常見的變換有:
l 翻轉變換(Flip):沿著水平或垂直方向對影象進行翻轉;
l 旋轉(Rotation):對影象進行隨機角度的旋轉,從而改變圖片的朝向;
l 平移(Shift):在影象平面上對影象進行某一方向上的平移,如水平或垂直方向,改變圖片內容的位置
l 縮放(Zoom):按照一定比例來縮小或放大影象,改變了影象的大小;
l 裁剪(Crop):對影象中的部位進行隨機的裁剪;
l 尺度變換(Scale):對影象按照指定的尺度因子, 進行放大或縮小; 或者SIFT特徵提取,利用指定的尺度因子對影象濾波構造尺度空間,改變影象內容的大小或模糊程度;
l 新增噪聲擾動(Noise):向影象中加入隨機的畫素擾動,如高斯噪聲等等。
l 對比度變換(Contrast):在影象的HSV顏色空間中,改變飽和度通道S和亮度通道V分量,並保持色調通道H不變,改變影象的對比度和亮度;
l 顏色變換(Color):對影象的RGB顏色空間進行PCA變換,得到主方向向量和特徵值。改變特徵值的大小,再反變換回影象,就可以得到變換後的影象。
深度學習如何增加資料量,問題不錯。我覺得,學習時只思考看到的是增加不了多少資料量的,增加的方法主要兩點就可以1.看得更多自知道的自然就多然資料量就多(但是容易忘)2.從更多思路看待問題,同一個問題用更多的方法不一樣的方法去解決