首頁>科技>

機器視覺是人工智慧正在快速發展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。但由於機器視覺是一門交叉學科,涉及數字影象處理技術、模式識別、自動控制、照明、人機介面等多個領域。因此,很難給機器視覺下一個準確的定義。

製造工程學會(SME)和機器人工業協會(RIA)將機器視覺定義為:機器視覺利用光學和非接觸式感測器自動獲取和解釋真實物體的影象,以獲取有用的資訊來控制機器的運動或過程控制。

在機器視覺系統中,其基本工作流程為:首先照明光源發出的光照射在被測物體上;然後再透過鏡頭成像後由相機捕獲;隨後,由影象採集卡收集並經計算機處理;最後,以預先設計的影象形式顯示在計算機螢幕上,如圖1所示。在這其中,機器視覺成像系統的成像質量決定了整體機器視覺系統的檢測精度,發揮著極為重要的作用。

圖1 機器視覺系統工作流程示意圖

機器視覺成像的一個重要特點是從影象中獲取目標的資訊,傳統視覺成像主要依賴於2D視覺技術:根據灰度或彩色影象中的畫素灰度特徵獲取目標中物體的紋理、形狀、位置、尺寸和方向等資訊。但隨著當前“智慧製造”技術對機器視覺效能的要求逐漸增高,2D視覺技術的侷限性愈發明顯,迫切需要3D視覺成像技術的發展及應用。

目前,3D視覺成像技術主要依賴於飛行時間法(TOF)、結構光法、立體視覺法、三角測量法和調頻連續波(FMCW)法等實現對目標3D資訊的感知和收集。

TOF法

TOF法的基本工作原理為利用光飛行的時間差來獲取物體的深度:探測系統與光源同時啟動,發射的光脈衝經目標物體後反射回探測中並由探測系統直接儲存往返時間,最後根據時間和光速的關係求得與目標物體之間的距離。

這種測試方法也稱為直接TOF法(D-TOF),通常適用於單點測距系統,與掃描技術相結合便可實現3D視覺成像。

圖2 PMD公司的工業TOF相機以及基於TOF法的自動導引叉車示意圖

TOF成像可用於大視野、遠距離、低精度、低成本的3D影象採集。其特點是:檢測速度快、視野範圍較大、工作距離遠、價格便宜,但精度低,易受環境光的干擾。

結構光法

結構光投影3D成像目前是機器人3D視覺感知的主要方式,結構光成像系統是由若干個投影儀和相機組成,如圖3所示,常用的結構形式有:單投影儀單相機、單投影儀-雙相機、單投影儀多相機、單相機-雙投影儀和單相機多投影儀等典型結構形式。

圖3 基於紅外結構光的深度相機:Astra Stereo S U3

結構光投影3D成像的基本工作原理是:利用計算機生成結構光圖案或用特殊的光學裝置產生結構光,經過光學投影系統投射至被測物體表面,然後採用影象獲取裝置(如CCD或CMOS相機)採集被物體表面調製後發生變形的結構光影象,利用影象處理演算法計算影象中每個畫素點與物體輪廓上點的對應關係;最後透過系統結構模型及其標定技術,計算得到被測物體的三維輪廓資訊,如圖4所示。根據結構光投影次數劃分,結構光投影3D成像可以分成單次投影3D成像和多次投影3D成像方法。

圖4 結構光投影3D成像的基本工作原理圖

其中,單次投影3D成像方法曝光和測量時間短,抗振動效能好,適合機器人實時運動引導和手眼機器人等需要對運動物體進行3D成像的應用。但該方法景深較低,無法在大視場情況下獲得較高的垂直空間解析度。

而多次投影3D成像方法恰能實現較高的空間解析度,能有效解決目標表面斜率階躍變化的問題,但也具有相應的不足之處:抗振動效能較差,無法準確的測量連續運動的物體;測量精度對投影儀、相機的環境變化敏感;實時性相對較差。

立體視覺法

立體視覺字面意思是用一隻眼睛或兩隻眼睛感知三維結構,一般情況下是指從不同的視點獲取兩幅或多幅影象重構目標物體3D結構或深度資訊。目前立體視覺3D成像方法可以分為單目視覺、雙目視覺、多(目)視覺和光場3D成像等,其中最為典型的便是雙目立體視覺3D成像。

圖5 Intel實感深度攝像頭D455示意圖及內部結構圖

雙目立體視覺方法是利用兩個相機從兩個不同的視點對同一個目標物體獲得兩個視點影象,然後計算兩個視點影象的視差以此獲得目標物體的3D深度資訊,如圖6所示,該計算過程一般分為以下四個步驟:影象畸變矯正、立體影象校對、影象配準和三角法重投影視差圖計算。

圖6 雙目立體視覺工作原理示意圖

這種雙目立體視覺3D成像的方法是被動視覺成像的一種,比較依賴於機接收到的由目標場景產生的光輻射資訊,已成功應特定條件下的3D測量場景,但場景應用有限,對場景要求較高,比如:目標場景光輻射動態範圍較小且無遮擋、目標物體表面光滑或紋理清晰、幾何規則明顯等。

三角測量法

鐳射三角測量法已經存在了數十年,且目前仍然被廣泛使用,其主要作用是測量目標物體上單個點的準確深度。

其工作原理是利用鐳射光源、目標物體和相機定義一個空間三角形,並透過確定三者之間的相交角度來計算目標物體單個點的3D座標資訊,如圖7所示。在此基礎上,將其與線掃描技術和麵掃描技術相結合便可實現2D和3D的測量。

圖7 三角測量法工作原理示意圖

三角測量法具有非常高的解析度和測量精度,其解析度可擴充套件到毫米及微米級別,但在實際應用中受相機和鐳射光源橫向距離的限制,並且測量時間較長,僅適用於較短的距離的測量。

FMCW法

FMCW法也稱為相干3D成像法,是透過一系列連續調製(如正弦調製、平方幅度調製等)的出射鐳射或LED發射探測光,經目標物體反射後,根據發射和接收訊號之間的調製幅度的相移來獲得物體距離等資訊。

相比於TOF法,FMCW法不依賴於光脈衝的飛行之間和發射光的幅度和功率,而是依賴於窄線寬鐳射器與相干接收器耦合產生的低功率頻率啁啾,具有更高的靈敏度、精度和準確度,並且具有較為優異的抗干擾性,但由於確定相移需要更長的測量和積分時間,且由於相移重複回產生距離歧義的問題,因此該方法僅適用於短距離的測量。

圖8 SiLC Technologies的“4D + Vision Chip”FMCW鐳射雷達感測器示意圖

總結

隨著對機器視覺系統的研究和探索,它已經在製造業生產、日常生活、以及醫療健康等方面扮演者越來越重要的角色,極大地提高了現有的生產力和自動化水平,必將是我國智慧製造中亟需發展和研究的專案。

但該系統較為複雜,涉及多個學科的交叉,比如光學成像、影象處理、自動化、控制等。因此必將出現大量的學科交叉問題及瓶頸,而如何在其中探索出高準確性、實時性和強魯棒性等效能的複合方案將是研究者和應用企業追尋及探索的方向。

10
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 天空或被衛星擠爆,極速網路與原始星空只能二選一?