mtcnn和yolov3和ssd等目標檢測演算法各有什麼特點或優勢？

首頁>Club>2021-04-11 20:41

mtcnn和yolov3和ssd等目標檢測演算法各有什麼特點或優勢？

回覆列表

1 # 羽樂生涯

MTCNN演算法是多工級聯卷積神經網路，用於人臉檢測和人臉對齊，它是一種級聯結構，類似Adaboost演算法，主要包括三個子網路：一個是P-Net網路，主要獲得人臉區域的候選視窗和邊界框的迴歸向量，並用該回歸向量對候選視窗進行校準，然後透過非極大值抑制來合併高度重疊的候選框；第二個子網路是R-Net網路，也是隻做檢測和邊界框迴歸兩個任務；最後一個子網路是O-Net網路，對前面的候選框做進一步的篩選，迴歸邊界框，同時在每個邊界框上計算特徵點的位置。而且，MTCNN一種多尺度網路結構，在輸入影象資料前，先構建影象金字塔，獲得不同尺度的影象再送入P-Net網路。
SSD演算法是one-stage、端到端的目標檢測演算法，主要思路是在圖片的不同位置進行密集取樣，採用不同的尺度比和長寬比，利用卷積神經網路結構提取特徵進行分類和迴歸，其優勢是速度快。SSD提取不同尺度的特徵圖來做檢測，前面的大尺度特徵圖用於檢測小目標，後面的小尺度特徵圖用於檢測大目標，採用VGG16作為基礎模型。

yolo目標檢測演算法的基本思想是利用CNN對輸入影象提取特徵，將輸入影象劃分成S×S個單元格，如果某個物體的中心位置落入其中一個單元格，那麼由該單元格負責檢測這個目標。YOLO V3在之前yolo結構的基礎上，採用多個尺度融合的方式做預測，加強對小目標檢測的精確度。基礎分類網路類似ResNet殘差網路，分類任務用Logistic取代了softmax，並利用9種尺度的先驗框，可以很好的檢測大目標和小目標。
MTCNN是專門用於檢測人臉的目標檢測演算法，而yolo和SSD演算法是通用的目標檢測演算法。通用的目標檢測演算法還有另一種型別，就是two stage的網路模型，先利用一些演算法產生候選區域，然後再對候選區域進行分類和迴歸，這類典型的演算法有R-CNN演算法、Fast R-CNN演算法以及Faster R-CNN演算法、FPN演算法等。這些演算法我也是正在學習，感興趣的加關注，一起交流討論!

∧ 中秋節和大豐收的關聯？

∨ 老公是媽寶男，幾個大姑姐聯合一起架空我，干涉我的生活怎麼辦？

熱門排行

劇多

mtcnn和yolov3和ssd等目標檢測演算法各有什麼特點或優勢？