回覆列表
-
1 # 易學智慧
-
2 # 良婷
三個領域都很有前景,通常都需要較大量的訓練資料,其中NLP的資料不同語言難以複用,而CV領域你往往直接可以把美華人收集的訓練資料應用到中國類似的演算法任務中,推薦系統往往是多維度的複合資料。就業選擇面:推薦系統大於NLP大於CV
-
3 # 5分鐘機器學習
計算機視覺的前景個人感覺會更好,像自動駕駛,影象識別,這些未來都是非常大的市場,而且只要活在這個世界上,睜開眼開到的東西都是視覺,計算機以後會根據看到的東西給我們生成適合我們想要的東西,各個方面,衣食住行都會有,這些都是基於計算機視覺。
這個問題直接回答的話可能還是有著很強的個人觀點,所以不如先向你介紹一些這幾個領域目前的研究現狀和應用情況(不再具體介紹其中原理)你自己可以斟酌一下哪方面更適合自己。
一.所謂計算機視覺,是指使用計算機及相關裝置對生物視覺的一種模擬。它的主要任務就是透過對採集的圖片或影片進行處理以獲得相應場景的三維資訊,就像人類和許多其他類生物每天所做的那樣[1]。
現在人工智慧的計算機視覺主要研究方向(比較火)是透過深度學習進行影象識別,目前影象識別主要有兩個研究領域,分類和目標檢測:
①所謂分類即去檢測影象中的物體是否屬於你所定義的類別,這個類別可以是我們廣義的類別,例如貓狗的分類,也可以是基於狀態的類別,例如跳躍的貓和靜坐的貓:
下面給出一個簡單的樣例:
圖1-1
圖1-2
如圖1-1是我們的測試影象,而1-2是我們的測試結果,貓為0,狗為1,預測結果中大概有3個錯誤結果。
②目標檢測是指在影象中精確的找到我們定義的物件,不僅要輸出物件類別,還要輸出該物件在圖片中的位置引數。
樣例如下:
圖1-3
從圖中可以看到不僅標出了物件的類別,也框出了物件在圖片中的位置。
那麼計算機視覺現在的應用領域有哪些呢,非常非常多:
年齡檢測,無人駕駛,智慧交通,狀態檢測,人臉識別,文字識別等等
所以不如這樣去概括,計算機視覺只是在提取圖片(影片)的資訊,類似於我們的眼睛,至於提取之後的資訊如何去運用,這就是需要我們自己的想法去執行了,所以只要人類透過眼睛收集資訊然後再決策執行的事情,都可以成為計算機視覺的發展方向(當然具體實現可能有的複雜有的簡單)
二、再來說下NLP(自然語言處理):NLP也是當今AI熱潮的主要研究方向,所謂NLP是指讓機器能夠理解人類的語言文字,從而實現人機互動,相比於深度學習影象識別,NLP處理的更多是資料的邏輯。
你可以假設一個這樣的場景:
有一段人對鏡頭說話的影片,透過影象識別我們得出它所說的話是“我失戀了,怎麼辦?”
,然後我們想讓機器回答他相應的話語,可是應該如何讓機器去思考怎麼回答上面的問題呢,這涉及到的便是NLP。
NLP 的目標是讓計算機/機器在理解語言上像人類一樣智慧。最終目標是彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距[2],實現人機互動。
NLP流程主要由兩部分構成[3]:
①自然語言理解:理解給定文字的含義,提取關鍵詞等等
②自然語言生成: 1. 文字規劃:完成結構化資料中基礎內容的規劃。
2. 語句規劃:從結構化資料中組合語句,來表達資訊流。
3. 實現:產生語法通順的語句來表達文字。
NLP應用領域:
情感分析,文字分類,智慧客服(聊天機器人),自動提取等等
三. 然後再說一下個性化推薦系統:所謂的個性化推薦系統,其實是建立在海量資料上的資料探勘,所以我們重點來說一下資料探勘的前景和發展方向。
資料探勘即從海量資料中挖掘出隱藏在資料背後的資訊,主要的依賴的方法包括機器學習,統計分析,情報檢索,專家系統(依靠過去的經驗法則)等。
舉個例子:
1.我們來猜個迷(打一動物),體型很大,四條腿,鼻子很長,腿很粗,嘴邊是凸出來的兩根長長的牙齒,耳朵很大(招風耳),性情溫順。
你是不是猜到了答案呢,大象~這其實就是基於我所給你的資料,憑藉經驗的一種分析,這樣的分析計算機也可以做到,只不過他們可以做的比我們更精細,更加數字化,這就是資料探勘。
2.我們用音樂個性化推薦系統來舉個例子,它背後大致是這樣一個邏輯方法:
首先蒐集使用者海量資料,比如100萬個使用者,內容包括使用者的:
喜歡的歌手,搜尋的歷史,性別,經濟儲存,收藏歌曲的風格,標記了的喜歡的歌曲
我們把最後一項“喜歡的歌曲”當做我們最後要預測的目標,前面的所有項當做推斷“喜歡的歌曲”的依據:
程式的執行順序大致是這樣的:
①找尋與你匹配度最高的多個使用者(透過你的搜尋歷史,收藏歌曲,常聽的風格,喜歡的歌手,性別)
②將這些使用者喜歡的歌曲羅列出來並推薦給你
所以這就是資料探勘的意義,他可以挖掘隱藏在資料背後的關係,然後根據這些關係對關鍵資料進行一些預測,但是資料探勘更偏向於結構化資料(結構化資料也稱作行資料,是由二維表結構來邏輯表達和實現的資料,嚴格地遵循資料格式與長度規範,主要透過關係型資料庫進行儲存和管理[4]。)而NPL更偏向於非結構化資料(非結構化資料是資料結構不規則或不完整,沒有預定義的資料模型,不方便用資料庫二維邏輯表來表現的資料。包括所有格式的辦公文件、文字、圖片、XML, HTML、各類報表、影象和音訊/影片資訊等等[5]。)
四、綜上給你一些分析建議1. 首先要選擇自己感興趣的,AI的路還是很難走的,需要很強的邏輯能力,數學能力等等,所以最好選一個自己喜歡的。
2. 三個領域各有側重影象識別偏影象資料,而資料探勘和NLP偏文字資料
3. 難度來說的話個人覺得NLP的坑還是比較多的,因為文字邏輯,人的思維邏輯這種東西,真的很難去理解,更別提再將這種思維轉化為機器理解的語言,所以真是道阻且長。但是NLP的勢頭也還是不錯的,這項研究也是必定會一直持續下去的。
4. 資料探勘在經濟金融行業有很大的應用,如果想往金融方面發展的話可以考慮資料探勘。
5. 計算機視覺影象處理在很多領域都用的上,在未來也會有很多的發展方向,人才需求眾多。
所以綜上,前景基本上都是大大的有,我個人比較看好資料探勘和影象識別~這兩個容易上手一點,也相對的成熟一點。
參考:
[1] https://baike.baidu.com/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/2803351
[2] https://blog.csdn.net/zhouguangfei0717/article/details/80048443
[3] https://blog.csdn.net/perfectzq/article/details/71429558
[4] https://baike.baidu.com/item/%E7%BB%93%E6%9E%84%E5%8C%96%E6%95%B0%E6%8D%AE/5910594
[5] https://baike.baidu.com/item/%E9%9D%9E%E7%BB%93%E6%9E%84%E5%8C%96%E6%95%B0%E6%8D%AE