作為人工智慧的關鍵領域之一的計算機視覺近期再次成為了熱點,那麼你真的瞭解什麼是計算機視覺嗎?
一、什麼是計算機視覺?
計算機視覺,英文Computer Vision,簡稱CV。計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等。
二、計算機視覺和機器視覺有何區別?
事實上,二者經常會被混淆,甚至有些“專家”也沒分清。
簡單的說,二者最大的區別,在於技術要求的側重點不一樣,甚至差別很大。 計算機視覺(CV),主要是對質的分析,比如分類識別,這是一個杯子那是一條狗。或者做身份確認,比如人臉識別,車牌識別。或者做行為分析,比如人員入侵,徘徊,遺留物,人群聚集等。
機器視覺(MV),主要側重對量的分析,比如透過視覺去測量一個零件的直徑,一般來說,對準確度要求很高。
三、計算機視覺主要任務是什麼?
計算機視覺的主要任務就是透過對採集的圖片或影片進行處理以獲得相應場景的資訊。計算機視覺任務的主要型別有以下幾種:
1、物體檢測
物體檢測是視覺感知的第一步,也是計算機視覺的一個重要分支。物體檢測的目標,就是用框去標出物體的位置,並給出物體的類別。
物體檢測和影象分類不一樣,檢測側重於物體的搜尋,而且物體檢測的目標必須要有固定的形狀和輪廓。影象分類可以是任意的目標,這個目標可能是物體,也可能是一些屬性或者場景。
2、物體識別(狹義)
計算機視覺的經典問題便是判定一組影象資料中是否包含某個特定的物體,影象特徵或運動狀態。這一問題通常可以透過機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環境中識別任意物體。
現有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別、人臉識別、印刷或手寫檔案識別,或者車輛識別。而且這些識別需要在特定的環境中,具有指定的光照,背景和目標姿態要求。
3、影象分類
一張影象中是否包含某種物體,對影象進行特徵描述是物體分類的主要研究內容。一般說來,物體分類演算法透過手工特徵或者特徵學習方法對整個影象進行全域性描述,然後使用分類器判斷是否存在某類物體。
影象分類問題就是給輸入影象分配標籤的任務,這是計算機視覺的核心問題之一。這個過程往往與機器學習和深度學習不可分割。
4、物體定位
如果說影象識別解決的是what,那麼,物體定位解決的則是where的問題。利用計算視覺技術找到影象中某一目標物體在影象中的位置,即定位。
目標物體的定位對於計算機視覺在安防、自動駕駛等領域的應用有著至關重要的意義。
5、影象分割
在影象處理過程中,有時會需要對影象進行分割來提取有價值的用於後繼處理的部分,例如篩選特徵點,或者分割一或多幅圖片中含有特定目標的部分等。
影象分割指的是將數字影象細分為多個影象子區域(畫素的集合,也被稱作超畫素)的過程。影象分割的目的是簡化或改變影象的表示形式,使得影象更容易理解和分析。更精確地說,影象分割是對影象中的每個畫素加標籤的一個過程,這一過程使得具有相同標籤的畫素具有某種共同視覺特性。
“影象語意分割”是一個畫素級別的物體識別,即每個畫素點都要判斷它的類別。它和檢測的區別是,物體檢測是一個物體級別的,他只需要一個框,去框住物體的位置,而通常分割是比檢測要更難的問題。
計算機視覺是透過建立人工模型來模擬本由人類執行的視覺任務。其本質是模擬人類的感知與觀察的一個過程。這個過程不止識別,而是包含了一系列的過程,並且最終是可以在人工系統中被理解和實現的。
四、“視覺五虎將”都是誰?
目前在計算機視覺領域已經湧現出商湯科技、曠視科技、深蘭科技、依圖科技、雲從科技等一批技術領先的獨角獸公司,行業稱為“視覺五虎將”,我們對這些公司作個簡單介紹。
商湯科技:
目前,商湯科技已與眾多知名戰略合作伙伴和大客戶建立合作,賦能AI於多個行業,迅速落地包括人臉識別、影象識別、影片分析、無人駕駛、醫療影像識別等各類應用技術。此外,商湯科技以人工智慧技術服務於各大安防監控公司、銀行金融機構、手機廠商、機器人廠商、多家移動APP廠商以及政府公安等客戶。
曠視科技:
曠視科技成立於2011年10月,以深度學習和物聯感測技術為核心,立足於自有原創深度學習演算法引擎Brain++,深耕金融安全,城市安防,手機AR,商業物聯,工業機器人五大核心行業。發展至今,曠視已在北京、西雅圖、南京設立獨立研究院,並在十餘個核心城市設立分部。
深蘭科技:
深蘭科技,2014年由歸國博士團隊建立,致力於人工智慧基礎研究和應用開發。在全球擁有近百位全職博士和博士後學術帶頭人,幾百位名校碩士研發人員,團隊曾多次獲得多項世界大賽和國內大賽獎項。團隊利用自主智慧財產權的深度學習架構、機器視覺、生物智慧識別等人工智慧演算法、無媒介支付等核心技術,在自動駕駛及整車製造、智慧機器人、生物智慧、AI晶片、智慧零售、智慧城市、智慧安防、教育軍工等領域都有深入佈局,擁有包括英特爾在內6家人工智慧聯合實驗室。
依圖科技:
成立於2012年,公司核心業務包括智慧安防平臺、智慧健康醫療、城市資料大腦、智慧硬體裝置等。目前,依圖的技術早已經服務全國20餘省安防,為海關總署及中國邊檢等提供人像比對系統,並在招商銀行、浦發銀行,遺蹟網際網路金融等多個業務場景中廣泛應用,車輛識別產品亦被公安系統廣泛採用,依圖也是目前國內唯一擁有10億級人像庫比對能力的公司,搭建了全球最大的人像系統,覆蓋超過15億人像。
雲從科技:
成立於2015年4月,是一家從中科院重慶研究院孵化的專注於計算機視覺與人工智慧的高科技企業。是計算機視覺頭部企業中的國家隊,承建了國家發改委的基礎專案重大工程——“人工智慧基礎資源公共服務平臺”與產業化專案重大工程“人臉識別系統產業化應用平臺”。與公安部、四大銀行、證通、民航總局建立聯合實驗室,推動人工智慧產品標準的建立,成為唯一同時制定國標、部標、行標的人工智慧企業。國家發改委公佈的《2017年“網際網路+”重大工程擬支援專案名單》中包含四個AI公司,雲從科技是其中唯一一家創業公司。
作為人工智慧的關鍵領域之一的計算機視覺近期再次成為了熱點,那麼你真的瞭解什麼是計算機視覺嗎?
一、什麼是計算機視覺?
計算機視覺,英文Computer Vision,簡稱CV。計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等。
二、計算機視覺和機器視覺有何區別?
事實上,二者經常會被混淆,甚至有些“專家”也沒分清。
簡單的說,二者最大的區別,在於技術要求的側重點不一樣,甚至差別很大。 計算機視覺(CV),主要是對質的分析,比如分類識別,這是一個杯子那是一條狗。或者做身份確認,比如人臉識別,車牌識別。或者做行為分析,比如人員入侵,徘徊,遺留物,人群聚集等。
機器視覺(MV),主要側重對量的分析,比如透過視覺去測量一個零件的直徑,一般來說,對準確度要求很高。
三、計算機視覺主要任務是什麼?
計算機視覺的主要任務就是透過對採集的圖片或影片進行處理以獲得相應場景的資訊。計算機視覺任務的主要型別有以下幾種:
1、物體檢測
物體檢測是視覺感知的第一步,也是計算機視覺的一個重要分支。物體檢測的目標,就是用框去標出物體的位置,並給出物體的類別。
物體檢測和影象分類不一樣,檢測側重於物體的搜尋,而且物體檢測的目標必須要有固定的形狀和輪廓。影象分類可以是任意的目標,這個目標可能是物體,也可能是一些屬性或者場景。
2、物體識別(狹義)
計算機視覺的經典問題便是判定一組影象資料中是否包含某個特定的物體,影象特徵或運動狀態。這一問題通常可以透過機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環境中識別任意物體。
現有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別、人臉識別、印刷或手寫檔案識別,或者車輛識別。而且這些識別需要在特定的環境中,具有指定的光照,背景和目標姿態要求。
3、影象分類
一張影象中是否包含某種物體,對影象進行特徵描述是物體分類的主要研究內容。一般說來,物體分類演算法透過手工特徵或者特徵學習方法對整個影象進行全域性描述,然後使用分類器判斷是否存在某類物體。
影象分類問題就是給輸入影象分配標籤的任務,這是計算機視覺的核心問題之一。這個過程往往與機器學習和深度學習不可分割。
4、物體定位
如果說影象識別解決的是what,那麼,物體定位解決的則是where的問題。利用計算視覺技術找到影象中某一目標物體在影象中的位置,即定位。
目標物體的定位對於計算機視覺在安防、自動駕駛等領域的應用有著至關重要的意義。
5、影象分割
在影象處理過程中,有時會需要對影象進行分割來提取有價值的用於後繼處理的部分,例如篩選特徵點,或者分割一或多幅圖片中含有特定目標的部分等。
影象分割指的是將數字影象細分為多個影象子區域(畫素的集合,也被稱作超畫素)的過程。影象分割的目的是簡化或改變影象的表示形式,使得影象更容易理解和分析。更精確地說,影象分割是對影象中的每個畫素加標籤的一個過程,這一過程使得具有相同標籤的畫素具有某種共同視覺特性。
“影象語意分割”是一個畫素級別的物體識別,即每個畫素點都要判斷它的類別。它和檢測的區別是,物體檢測是一個物體級別的,他只需要一個框,去框住物體的位置,而通常分割是比檢測要更難的問題。
計算機視覺是透過建立人工模型來模擬本由人類執行的視覺任務。其本質是模擬人類的感知與觀察的一個過程。這個過程不止識別,而是包含了一系列的過程,並且最終是可以在人工系統中被理解和實現的。
四、“視覺五虎將”都是誰?
目前在計算機視覺領域已經湧現出商湯科技、曠視科技、深蘭科技、依圖科技、雲從科技等一批技術領先的獨角獸公司,行業稱為“視覺五虎將”,我們對這些公司作個簡單介紹。
商湯科技:
目前,商湯科技已與眾多知名戰略合作伙伴和大客戶建立合作,賦能AI於多個行業,迅速落地包括人臉識別、影象識別、影片分析、無人駕駛、醫療影像識別等各類應用技術。此外,商湯科技以人工智慧技術服務於各大安防監控公司、銀行金融機構、手機廠商、機器人廠商、多家移動APP廠商以及政府公安等客戶。
曠視科技:
曠視科技成立於2011年10月,以深度學習和物聯感測技術為核心,立足於自有原創深度學習演算法引擎Brain++,深耕金融安全,城市安防,手機AR,商業物聯,工業機器人五大核心行業。發展至今,曠視已在北京、西雅圖、南京設立獨立研究院,並在十餘個核心城市設立分部。
深蘭科技:
深蘭科技,2014年由歸國博士團隊建立,致力於人工智慧基礎研究和應用開發。在全球擁有近百位全職博士和博士後學術帶頭人,幾百位名校碩士研發人員,團隊曾多次獲得多項世界大賽和國內大賽獎項。團隊利用自主智慧財產權的深度學習架構、機器視覺、生物智慧識別等人工智慧演算法、無媒介支付等核心技術,在自動駕駛及整車製造、智慧機器人、生物智慧、AI晶片、智慧零售、智慧城市、智慧安防、教育軍工等領域都有深入佈局,擁有包括英特爾在內6家人工智慧聯合實驗室。
依圖科技:
成立於2012年,公司核心業務包括智慧安防平臺、智慧健康醫療、城市資料大腦、智慧硬體裝置等。目前,依圖的技術早已經服務全國20餘省安防,為海關總署及中國邊檢等提供人像比對系統,並在招商銀行、浦發銀行,遺蹟網際網路金融等多個業務場景中廣泛應用,車輛識別產品亦被公安系統廣泛採用,依圖也是目前國內唯一擁有10億級人像庫比對能力的公司,搭建了全球最大的人像系統,覆蓋超過15億人像。
雲從科技:
成立於2015年4月,是一家從中科院重慶研究院孵化的專注於計算機視覺與人工智慧的高科技企業。是計算機視覺頭部企業中的國家隊,承建了國家發改委的基礎專案重大工程——“人工智慧基礎資源公共服務平臺”與產業化專案重大工程“人臉識別系統產業化應用平臺”。與公安部、四大銀行、證通、民航總局建立聯合實驗室,推動人工智慧產品標準的建立,成為唯一同時制定國標、部標、行標的人工智慧企業。國家發改委公佈的《2017年“網際網路+”重大工程擬支援專案名單》中包含四個AI公司,雲從科技是其中唯一一家創業公司。