回覆列表
-
1 # 海門老馮
-
2 # 運河畫院
計算機視覺與機器視覺,首先是應用場景不一樣
其次,我感覺最大的區別,在於技術要求的側重點不一樣,甚至差別很大。
計算機視覺,主要是對質的分析,比如分類識別,這是一個杯子那是一條狗。或者做身份確認,比如人臉識別,車牌識別。或者做行為分析,比如人員入侵,徘徊,遺留物,人群聚集等。
機器視覺,主要側重對量的分析,比如透過視覺去測量一個零件的直徑,一般來說,對準確度要求很高。當然,也不能完全按質或量一刀切,有些計算機視覺應用也需要分析量,比如商場的人數統計。有些機器視覺也需要分析質,比如零件自動分揀。但計算機視覺一般來說對量的要求不會很高,商場人數統計誤差個百分之幾死不了人的,但機器視覺真的會,比如那個道岔缺口測量。
既然要求這麼高,是不是機器視覺就比計算機視覺難呢?
也不是的,應該說各有各的難處。計算機視覺的應用場景相對複雜,要識別的物體型別也多,形狀不規則,規律性不強。有些時候甚至很難用客觀量作為識別的依據,比如識別年齡,性別。所以深度學習比較適合計算機視覺。而且光線,距離,角度等前提條件,往往是動態的,所以對於準確度要求,一般來說要低一些。機器視覺則剛好相反,場景相對簡單固定,識別的型別少(在同一個應用中),規則且有規律,但對準確度,處理速度要求都比較高。關於速度,一般機器視覺的解析度遠高於計算機視覺,而且往往要求實時,所以處理速度很關鍵,目前基本上不適合採用深度學習。
以上討論的是技術,商業方面,計算機視覺的應用面更廣一些,畢竟很多業務是跟人相關,比如人臉識別,行為分析等,很多垂直領域都有計算機視覺潛在需求,相對來說,更適合創業;而機器視覺顧名思義,業務主要跟機器相關,而且對準確度甚至安全性要求很高,也就在資質品牌方面有較高的門檻,所以寡頭壟斷嚴重,一般來說,更適合上班而不是創業。
機器人視覺只是個攝像機加上間距探測(雷達),獲得對外部情況的“感知”。至於機器人對感知到的資訊能否有意識的去利用,就很值得懷疑了。據我所知,目前製造出來的機器人,其主觀能動性都是程式化的。其對語言的感知也是預定的,比如:一個語言單詞、片語或一句話所產生的聲波會分別對應於某個相關聯的資訊地址,實現某個答案的語言播放,僅此而已。語言,確實是大腦換醒(突現)某個資訊的存在機制,這個資訊被換醒之後,如果少了自我意識,就無法識別和深度利用(聯想思維),要想機器人具有主觀能動性,除了能夠把感覺到的資訊以某種狀態“潛伏”下來以外,還要對視覺感覺到的資訊與經驗資訊進行對比。透過對比,獲得知道,意識就產生了。然後思維在意識下對即時需求(對某個問題的關注點)進行調動經驗資訊(長期記憶資訊)做出擴散性聯想思維活動。所以人與機器人對感覺資訊的接收方式和利用方式是絕然不同的。
附:人的資訊獲得機制之本人之見
大腦獲取的各種資訊,來自於體內外。大腦獲取資訊的生理途徑來之於視、聽、嗅、味以及體內和體表的感受器。人的一切生理活動皆建立在這些感受器的基礎之上,可以說是這些感受器賦予了生命體的存在、進化、記憶存取以及自主運動和隨意運動的機能。
每一個感受器,在接受一種資訊內容的刺激時,都是感受器內群體性神經感受細胞共同興奮活動的過程。在這個活動過程中,每一個感受細胞各自獨立、各自運作、各具興奮度狀態,但又相互協作,在同一個時間段裡,把一個資訊內容整合在一起。整合,就是形成一個獨一無二的記憶單元(共同興奮體),並且以一個脈衝頻率波的形式,實現長期性、整體性和“困綁”在一起的興奮體狀態記憶。這個“興奮體狀態記憶”,在進入海馬前,還不具有長期記憶的存在機能,但也有初始資訊接受時的短期“印痕”,並在形成長期記憶以後,下次再提取此資訊時,埋下了被容易提取出來的“伏筆”(慣性衝動狀態)。以視覺感受器為例,視野資訊畫面藉助光入瞳孔,再經過晶狀體透鏡聚焦後投射至視網膜。
視網膜上進化出了密密麻麻的縱向排列著的柱狀視杆和視錐感受細胞。視野中,照片式資訊畫面內容被數以萬計的視網膜感受神經錐細胞所一一對應,視網膜上的感覺神經錐細胞將整體的視野照片式資訊畫面內容“分割”成了數以萬計的畫素點。“照片”內容中不同的區域,一般都存在著自然的黑白明暗差和色彩差,無論是黑白差還是色彩差,它們都是一種藉助光子下的衝動頻率波。對視網膜感受細胞的刺激度大小,一般取決於光的明暗度;對視網膜感受細胞的不同色彩刺激,一般取決於光對視野物的折返頻率波的頻率波長。有什麼樣的頻率波。就有什麼樣的視網膜神經錐細胞被刺後的興奮態。使得視網膜神經錐細胞的興奮度狀態與刺激源的明暗度和色彩度刺激相一致。視網膜中每一個神經錐杆細胞本身,都存在著感受閾,可描述為:從抑制狀態的0到最大興奮度狀態的100。如果視野照片式資訊內容的某個區域中一個極其微小的點,其黑白色彩亮度處於1,說明能夠引起視網膜中某一個神經錐杆細胞的興奮閾度低到接近極限,或者說這個視野資訊的微小點上,暗到不能引起神經錐細胞興奮的程度;視野資訊的黑白色彩亮度處於50,說明視網膜內該神經錐杆細胞被刺激後的興奮閾度處於中間狀態。也說明反光亮度和波峰處於中等刺激水平;視野資訊的黑白色彩亮度處於100,說明視網膜內該神經錐杆細胞的興奮度處於最高限度的檔位閾。數以百萬計的視網膜神經錐杆細胞在“面對”視野照片式資訊畫面內容時,“它們”各自做出自己的興奮度反應。這樣,整個視網膜上群體性神經錐細胞的興奮度,就完全徹底地“複製”了視野照片式資訊畫面內容中黑白和色彩度的全部狀態,即使這個視野資訊畫面處於光亮度不斷變化的環境之下,但就整體性而言,視野資訊畫面內容透過光反射,對群體性神經細胞的刺激,仍然保持一致的梯度響應,這個視野資訊不會因光亮度變化而導致資訊內容的串改。視網膜這個群體神經錐杆細胞的整體興奮狀態再匯聚到視神經盤,入視神經,透過外側膝狀體中繼後投射到視覺感覺皮質,引起視覺皮層中群體性神經錐細胞的共同興奮活動。視覺皮層中,神經錐細胞的共同興奮度狀態與視網膜神經細胞的興奮度狀態是一致的,視覺皮質是一種應承性反應,類似於電腦的顯示器,有什麼樣的資訊脈衝頻率波送達,顯示器就“照本宣讀”。因此,視覺皮質的應答性反應與視野資訊畫面內容的黑白色彩相一致。人才得以感覺到視野資訊畫面。以上就是人感受或獲得視野資訊內容的生理運作機制。
人的其它感受器,其構造和形態雖然各不相同,但是有一點是相同的,那就是一個感受器內數以百萬計的感受細胞,分別都有自己的感受閾,呈相嵌模式,縱柱向排列,相互緊鄰在一起,面對同一個資訊單元的刺激,感受細胞在同一時間段裡,各自做出“自己”的衝動度閾值反應。這種群體性神經細胞的共同差異性、協調性反應(興奮),表現出錯落有致,精準地反應出了全部刺激源的資訊狀態。