回覆列表
  • 1 # AI君

    卷積神經網路透過使用者設計的loss funtion(分類往往是cross_entropy),計算影象實際標籤與預測標籤之間的差異,梯度反向傳播,最小化loss,更新各個卷積核引數,從而產生新的預測值。重複過程直到訓練終止。

  • 2 # 牙牙的生活日誌

    首先要了解傳統的影象處理是如何做的。

    舉一個不是很恰當的例子,比如最簡單的邊緣檢測。

    1. 透過邊緣檢測運算元,遍歷增幅影象,可以獲得該影象的邊緣資訊。也就是該影象的特徵資訊。

    2. 我們可以透過比較和目標影象的的邊緣資訊的歐式距離,進行判斷兩者的相似性。

    對於卷積神經網路,你可以發現,卷積層中,都是透過n個類似邊緣檢測的運算元。對影象進行遍歷,提取影象特徵資訊。並且透過網路得多次迭代,據說可以提取出影象的深層特徵。

    所以說卷積神經網路本質上還是特徵提取比較的過程。

  • 3 # 科技資訊傳播者

    可以看出,這是一個比較有資深網際網路技術的問題!需要對一些專業知識做出特別的解釋。

    首先,我們要了解什麼是卷積神經網路?下面是我在網上搜索整理的一些粗淺的知識!

    卷積神經網路(Convolutional Neural Networks, CNN)是一類包含卷積計算且具有深度結構的前饋神經網路(Feedforward Neural Networks),是深度學習(deep learning)的代表演算法之一。卷積神經網路具有表徵學習(representation learning)能力,能夠按其階層結構對輸入資訊進行平移不變分類(shift-invariant classification),因此也被稱為“平移不變人工神經網路。具體解釋可自行搜尋。

    那麼卷積神經網路又是怎麼實現影象識別的呢?他有幾個步奏。

    1、影象識別資料收集

    MNIST手寫體識別資料集解決是一個相對簡單的問題,而對於更加複雜的類別,可以用到CIFAR資料集。比如CIFAR10資料集收集了來自10個不同種類的6萬張圖片,每張圖片畫素為32x32,如下圖CIFAR10資料集與MNIST相似之處在於,其每張圖片大小都是一定的,每張圖片中都只包含一個類別。區別在於CIFAR10中的圖片都是彩色的,而且分類難度也比MNIST高,人工標註的正確率約為94%。

    在現實生活中,圖片的格式不一定都是恆定的,類別也遠超出10種,每張圖片也會包含多個元素,因此需要有更強大的資料集。由斯坦福大學的李飛飛開發的ImageNet,有近1500萬張圖片,關聯了大概20000個類別。

    ImageNet每年都會舉辦影象識別競賽ILSVRC(現已停辦),每年的比賽都提供不同的資料集。下圖給出不同演算法在ImageNet影象分類上的top-5正確率,ton-N表示演算法給出的前N個答案中有一個是正確的,2013年之後基本上所有的研究都集中在卷積神經網路上。

    2、卷積神經網路介入

    深度神經網路有多種,主要有全連線層神經網路,卷積神經網路和迴圈神經網路。其中全連線層神經網路之前已有介紹,其相鄰層的節點之間都會相連。迴圈神經網路將會在後續的章節介紹,以下簡單說一下卷積神經網路。上圖是卷積神經網路的架構圖,輸入的圖片一般會經過多個卷積層和池化層後,再接上數個全連線層後,透過softmax輸出結果。

  • 中秋節和大豐收的關聯?
  • 釀出來的酒度數低用什麼辦法才能提高酒度?