“你是想賺錢,還是想站著?”
——出自《讓子彈飛》
有些人掙了錢,但是他跪著。
有些人站著,但是掙不著錢。
站著掙錢,真有這麼難嗎?
其實不難。自加入泛函,除了賺到不少零花錢之外,我們每個人還多了一個光榮且使命神聖的稱號——“人工智慧標註員”。
可能好多小夥伴還不知道,我們在做任務的同時,悄然間推動著人工智慧的發展,這錢賺得倍兒有排面。
01 何為資料標註?要理解資料標註,首先要知道AI是如何代替人的部分認知功能的。
回想一下,人類是如何學習的:
要認識一個香蕉,那麼就需要有個人拿著一個香蕉到你面前告訴你,這是一個香蕉。
機器也是一樣,想教機器認識香蕉,我們需要香蕉的照片,上面標註著“香蕉”兩個字,機器透過大量學習圖片中的特徵,來實現認知功能的提升。
對於人工智慧來說,只有標註過的資料才是有效資料,沒有標註過的資料都是無用的。
一、圖片標註
圖片標註包括語義分割、矩形標註、多邊形標註、線段標註、分類標註、關鍵點標註等等,像這種資料在人工智慧裡一般被用於人臉識別、物品識別等領域。
語義分割
矩形標註
多邊形標註
線段標註
關鍵點標註
分類標註
二、語音標註
語音標註包括語音切割和語音轉寫等,透過對語音的切割和翻譯形成語音資料。這種資料一般被應用於語音識別、人工智慧翻譯等領域。
語音切割
語音轉寫
三、文字標註
文字標註主要包括文字分類與文字轉寫,透過對文字的分類處理和轉寫形成文字資料,應用到AI領域。文字標註的資料被廣泛應用於自然語言處理、圖文轉換等領域。
文字分類
文字轉寫
四、影片標註
影片標註目前主要包括影片跟蹤、影片分類,主要應用於天眼系統、智慧識別系統等領域。
影片跟蹤
影片分類
此外,標註的型別除了上面幾種常見,還有很多個性化的,不同的需求需要不同的標註,例如自動摘要等等。
飛速發展的人工智慧領域,帶來了巨大的資料缺口。在AI發展良好的前提下,未來5年甚至更久,資料標註員的需求會一直存在,這棵常青藤,會一直伴隨著AI改變世界。
下期帶大家看看我們標註的資料到底去哪了~