-
1 # 途星
-
2 # 小低調x
關注
首先知識上你要對AI有一個大的梗概,從視覺到文字、語音,從監督、非監督到半監督和強化學習,包括機器學習等等,至少都應有一個初級的瞭解,
這之後,需要找一個你喜歡或者擅長的領域深挖,這樣才能瞭解的有一定深度。閱讀論文,復現實驗,搭demo,發現問題,做新的研究等等。
coding上,框架也會一兩個,pytorch和tensorflow,然後基礎的演算法知識和演算法題也要牢固
-
3 # 點子說
AI一般指人工智慧,雖然聽上去離我們有些遙遠,但現在也悄悄地進入了我們的生活當中,比如無人駕駛,影象搜尋,生物人臉識別,智慧語音客服等等。由此產生了一個新型的職業——人工智慧訓練師。而其中的AI標註就是人工智慧訓練師中的一種工種。
想要快速入行AI資料標註,我們先了解它需要做些什麼。
AI資料標註到底需要做什麼呢?先從視覺識別舉例,比如下圖中的動物,我們透過視覺觀察能很快速地分辨出這是一條狗。原理上也很簡單,透過長期的看圖人類大腦提取整體長相等特徵,然後在腦海中強化形象,當看到一條狗時大腦就能快速識別出來。
人工智慧訓練就是讓機器也和我們大腦一樣,看到某些物體時就能知道這是什麼東西。那麼如何做呢?簡單說就是讓機器像我們人類一樣反覆學習。但不同的是機器是沒有腦子的,它的學習過程只有一堆數字,所以它只要學習數值裡的特徵就可以了。這裡就需要資料標註員透過選擇標註告訴機器對應的結果。比如在一堆水果圖片中,機器會問你哪些是櫻桃,資料標註員正確選出來就行,這就是資料標註員的人工智慧訓練。其實這個訓練一點都不神秘,在日常中我們都有參與,只是平臺沒有給予我們報酬而已。
AI資料標註能賺多少錢?根據資料顯示,資料標註員在三四線城市全職來做每月是2500-3000元左右,這裡主要是考慮資料標註的工作內容不同,以語音標註為例,全職的語音標註員一天標註的有效時長大概是3個小時左右,一天大概創作價值320元,一個月按24天計算月收入是7680元。單個員工發放月工資3500元,加上社保繳納900元左右,再減去一部分房租水電及其它開支,合計一個月每個員工能創造3000元左右的價值。試想如果你請了10個員工,那一個月就是30000元左右的收益。
如果是想兼職做資料標註,可以透過線上的一些招聘軟體應聘,搜尋“資料標註”就可以看到很多相關招聘資訊了。
如果我們想自己開一家AI資料標註公司呢?創業開標註公司最重要的就是賺取勞動差價,其中的兩個關鍵點一定要先解決。一是上哪找任務?二是穩定的標註員工上哪找?
首先如何拿到標註的任務?
目前有標註需求的企業除了一些大廠外,比如阿里、騰訊、百度、華為等等,還有一些代理商平臺,比如莫比嗨客、奧鵬、資料堂等等。如果想拿到大廠的任務,先要註冊好公司,註冊會有一些要求,根據要求匹配就可以了,以下是中國聯通大資料對外招募的幾點關鍵要求,可供參考:
1、公司註冊資金不低於100萬人民幣;關於這一點目前公司註冊資金不需要實際繳納,僅申報就可以了,所以還是比較容易達到的。
2、申請人須為增值稅一般納稅人;
3、在影片、音訊、文字、影象等領域的定製化資料相關合同。
當然每個平臺的要求都會有差異,但是都不會很複雜。申請後就等平臺稽核,通過後會得到後臺登入賬號的資格,然後就可以正常開始接任務來做了。
我們成為服務商後就可以透過各大平臺進行任務釋出和接收任務來做。目前最常見的任務主要是三類:影象影片標註、內容相關性標註和語音標註。其中最賺錢的是影象影片標註。
既然我們知道任務上哪接後,接下來要解決的就是找人來做,總不能全都自己做吧,自己做肯定不太現實。關於招人這塊,只要做事認真,懂些電腦就可以做,門檻不是很高。薪資上前面也有提到,可以做參考。雖然說人員門檻不高,但是想要高效地完成任務還是需要一些方法的,目前最節約成本和有效的一個方法就是針對特定的資料內容做具體的培訓。
這裡需要注意的是,每個平臺的任務都是有正確率的要求的,一般至少要達到95%才會結算,所以想要賺錢一定要讓員工有高效的正確率。除了正確率我們還需要多接一些賺錢的任務,現在最賺錢的任務是百度的無人車駕駛任務,也是行內公認的單價最高的平臺。
剛入行的幾點建議首先現在釋出任務的平臺相對較多,怎樣選擇合適的平臺接任務很重要。儘量找大平臺合作,不要新入行就急於找任務賺錢,結果被一些二道販子割了韭菜。
其次最擔心的還是結款不及時或是結款難,所以在簽訂合同時要注意合同是否具有法律效應,然後一定要拿到後臺賬號,可以登陸後臺檢視資料,這樣結算更有保障一些。
再次資料標註作為這個行業的末端,結算週期大概要1-2個月時間,所以新入行的新人還要準備一部分資金做運轉,同時還要有抗風險的能力做支撐。
最後因為資料標註行業的技術含量很低,人員進入的門檻也不高,可複製性很強,所以很多新入行的公司可能會出現連任務都接不到的情況。
綜上所述,人工智慧的行業未來還是被大家看好的,隨著人工智慧的發展各行各業所需的複雜資料也會大幅度提升。同時5G的推行,也會讓資料進行新一輪的積澱,資料型別會更加多樣化,相關行業對資料的需求增多,這對資料市場也起到了很大的推動力。所以現在進入AI資料標註行業也不算晚,但是可以預見的是,這一行對資料的質量也會越來越嚴格。創業有風險,想入行還需謹慎謹慎再謹慎!
回覆列表
Ai標註又叫人工智慧資料標註,主要是基於目前龐大的人工智慧產業比如語音識別,自動駕駛,無人售貨機等所催生的資料標記員,分為分類,畫框,註釋,標記等工作型別,說白了,主要是為一些已有的資料新增具體的描述,讓它來適應更多的人工智慧演算法,可以說這些資料是現在Ai產業的基礎。
雖說屬於人工智慧的範疇,但是算是初級工作,因此對於學歷等要求不高,目前全國範圍內全職的資料標註師有十萬以上,兼職群體約有百萬,也有專業的標註承包公司比如"點我科技""資料堂"等。
如果想進入這個行業:
1-如果有行業內朋友帶是最簡單的方式,避免走很多彎路。
2-如果沒有這方面朋友,現在網上也有很多培訓課程的影片,當然這種方式需要有一定的自學能力,和理解能力,如果不太夠,還是建議選用第三種方法。
3~參加專門的培訓班或相關公司的培訓生計劃。這個行業需要大量的人,因此市面有專門的課程培訓,或者有的外包公司也包培訓,但是要做好做一段時間的廉價勞動力的準備。
總之,這個行業是個很辛苦的工作,做好心理準備,當然未來5g普及之後,會需要更大量的資料資訊,還需要ai標註員辛勤的付出。