-
1 # Hollyyyyy
-
2 # 留德華叫獸
我目前在車廠無人駕駛部門的職責之一便是研發無人駕駛感知領域語義|全景分割資料集的半自動標註演算法再具體一點計算機視覺領域的: 語義分割(Semantic Segmentation) 和 全景分割 (Panoptic Segmentation)https://arxiv.org/pdf/1801.00868.pdf它們或許是資料標註領域成本最高的倆個任務(德國高達100人民幣/圖)它們的具體定義可以見上圖一、標註任務語義分割: 對圖片中每一個畫素標註其類別(如:汽車、行人、道路等)全景分割:對於每一個畫素,在語義分割的基礎上再區分目標instance物體(如:汽車1、汽車2、行人5等)二、標註格式通常標註結果還是存成圖片的常見格式(如: png)圖片的每一個通道儲存不同資訊(用數字1-255表示)例如第一通道儲存: 該畫素所屬類別第二通道:如果該畫素屬於目標物體,他屬於第幾個instance第三通道:通常是0或1,1表示該畫素是可以駕駛的區域,0反之三、開源資料集Cityscapes(戴姆勒公司、德國馬普所、TU Darmstadt): https://www.cityscapes-dataset.com/Mapillary Vistas (豐田、Lytf等贊助):https://www.mapillary.com/dataset/vistas?pKey=0_xJqX3-c-KyTb90oG_8HQKitti Dataset (德國KIT和豐田芝加哥研究所): http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php等等可以看到背後都有財團的支援四、資料集的成本和作用成本:據Cityscapes官方,標註一張該資料集中的語義分割平均需要1.5小時!!!德國最低工資是9歐元左右/小時因此在德國標註一張語義分割圖片的成本超過13歐元(約合100塊人民幣)!!重要性:深度學習需要大量精細標註的資料作為“燃料”保守L3要能夠上路需要至少幾百萬張標註精細的訓練圖片人工智慧時代,誰擁有資料誰就擁有源源不斷的燃料資料集也成為無人駕駛公司和主機廠的兵家必爭之地五、用最佳化演算法節約標註成本手動標註一張語義分割畫素級別的圖片平均需要1.5小時有沒有什麼更智慧的辦法提高標註效率呢?專注於最佳化演算法的 @運籌OR帷幄以下略探12:1. ScribbleSup: Scribble-Supervised Convolutional Networks for ...2. Weakly-and Semi-Supervised Panoptic Segmentation3. Fast Interactive Object Annotation With Curve-GCN標註軟體的一般流程是:標註者輸入互動資訊-演算法自動標註-標註者修改-演算法標註直到標註者滿意為止影象分割最佳化演算法結合深度學習CNN便可以達到相較於精細標註95%的精度
回覆列表
之前用過一個叫samples的,就挺好用,推薦。
如果是大批次的影象標註,建議還是找資料公司去做比較好,他們效率高質量也不錯,自己做標註太慢了。據瞭解天元資料就可以做批次的影象標註,服務過很多科研機構和高校做研究,可以瞭解一下。