回覆列表
  • 1 # 羽樂生涯

    MTCNN演算法是多工級聯卷積神經網路,用於人臉檢測和人臉對齊,它是一種級聯結構,類似Adaboost演算法,主要包括三個子網路:一個是P-Net網路,主要獲得人臉區域的候選視窗和邊界框的迴歸向量,並用該回歸向量對候選視窗進行校準,然後透過非極大值抑制來合併高度重疊的候選框;第二個子網路是R-Net網路,也是隻做檢測和邊界框迴歸兩個任務;最後一個子網路是O-Net網路,對前面的候選框做進一步的篩選,迴歸邊界框,同時在每個邊界框上計算特徵點的位置。而且,MTCNN一種多尺度網路結構,在輸入影象資料前,先構建影象金字塔,獲得不同尺度的影象再送入P-Net網路。

    SSD演算法是one-stage、端到端的目標檢測演算法,主要思路是在圖片的不同位置進行密集取樣,採用不同的尺度比和長寬比,利用卷積神經網路結構提取特徵進行分類和迴歸,其優勢是速度快。SSD提取不同尺度的特徵圖來做檢測,前面的大尺度特徵圖用於檢測小目標,後面的小尺度特徵圖用於檢測大目標,採用VGG16作為基礎模型。

    yolo目標檢測演算法的基本思想是利用CNN對輸入影象提取特徵,將輸入影象劃分成S×S個單元格,如果某個物體的中心位置落入其中一個單元格,那麼由該單元格負責檢測這個目標。YOLO V3在之前yolo結構的基礎上,採用多個尺度融合的方式做預測,加強對小目標檢測的精確度。基礎分類網路類似ResNet殘差網路,分類任務用Logistic取代了softmax,並利用9種尺度的先驗框,可以很好的檢測大目標和小目標。

    MTCNN是專門用於檢測人臉的目標檢測演算法,而yolo和SSD演算法是通用的目標檢測演算法。通用的目標檢測演算法還有另一種型別,就是two stage的網路模型,先利用一些演算法產生候選區域,然後再對候選區域進行分類和迴歸,這類典型的演算法有R-CNN演算法、Fast R-CNN演算法以及Faster R-CNN演算法、FPN演算法等。這些演算法我也是正在學習,感興趣的加關注,一起交流討論!

  • 中秋節和大豐收的關聯?
  • 老公是媽寶男,幾個大姑姐聯合一起架空我,干涉我的生活怎麼辦?