回覆列表
-
1 # 陸滿庭
-
2 # Visionstory
俗話說:百聞不如一見。人類理解世界,80%資訊來自眼睛。所以計算機視覺CV方向當然更好。
一、CV簡介。CV簡稱計算機視覺,最早產生於上個世紀七十年代,由理論神經科學家Marr提出。後經歷三個發展階段:二維影象處理、三維重建、深度視覺。從2012年深度學習火爆之後,深度視覺發展迅猛,未來發展前景不可限量。
二、學習CV涉及的知識與技能。
作為一個想學習CV的研究生,本科階段應該學好微積分、線性代數、機率統計、數字訊號處理、資料結構、高階語言C++或Python等基礎,研究生階段要系統讀幾本CV和ML專著,學習OpenCV開發,並參加專案實踐,只有實戰能提升能力。
三、CV的典型應用。
1)工業檢測。產品缺陷檢測、非接觸測量、焊縫跟蹤、食品機器人分揀,等等,都要用到CV,幾乎沒有現代工廠不用CV。
2)影視動漫。《阿凡達》、《泰坦尼克號》等大片宏達、震憾人心,主要是CV的虛擬攝製與三維動畫製作技術的效果。
3)安檢識別。現在的機場、火車站、小區都裝有人臉識別系統。疫情之中,不少CV公司開發了戴口罩人臉識別與人群測溫系統。未來的智慧手機也會實現人臉識別。
4)無人駕駛。Google、百度等一大批人工智慧與網際網路公司紛紛佈局無人駕駛,其中核心技術之一就是CV。當然,阿里、京東等物流巨頭也大規模採用視覺AGV。疫情之中,很多視覺AGV用於送餐、送藥、垃圾清運。
5)其他應用。CV應用之廣泛,農業機器人、無人機、醫療影像診斷,方方面面。
這兩者目前都有比較好的前景。
計算機視覺CV廣泛應用於無人駕駛、電子競技、影象識別、人臉識別、無人監控等領域;從直觀就可以想象得到它的發展前景。
而自然語言處理NLP對於不僅僅可以應用於機器翻譯、文字聚類、自動摘要、主旨提取甚至一定的語義理解,還可以做到人工智慧客服、自動答疑、線上電子醫生等等應用。
並且,科學都是相通的,例如計算機視覺的某些技術已經滲透到自然語言處理中來,併發揮了很重要的作用,或者兩者相輔相成。例如,從影象識別到OCR(圖片轉文字)再到後續的語義邊界分析、語義理解和相應反饋處理,就是結合了兩種技術的典型例子。現在流行的智慧音箱,也是先從計算機視覺的角度來進行語音波形的處理然後轉為語義理解和應答的。
因此,這兩個方向都是值得進行研究的,可以根據個人喜好來進行選擇,一般來說,NLP更加枯燥繁瑣一點,而計算機視覺則要涉及更多的數學演算法和原理。