1. 什麼是視覺
視覺是一個古老的研究課題,同時又是人類觀察世界、認知世界的重要功能和手段。人類從外界獲得的資訊約有75%來自視覺系統,用機器模擬人類的視覺功能是人們多年的夢想。視覺神經生理學,視覺心裡學,特別是計算機技術、數字影象處理、計算機圖形學、人工智慧等學科的發展,為利用計算機實現模擬人類的視覺成為可能。在現代工業自動化生產過程中,計算機視覺正成為一種提高生產效率和檢驗產品質量的關鍵技術之一,如機器零件的自動檢測、智慧機器人控制、生產線的自動監控等;在國防和航天等領域,計算機視覺也具有較重要的意義,如運動目標的自動跟蹤與識別、自主車導航及空間機器人的視覺控制等。
人類視覺過程可以看作是一個從感覺到知覺的複雜過程,從狹義上來說視覺的最終目的是要對場景作出對觀察者有意義的解釋和描述;從廣義上說,是根據周圍的環境和觀察者的意願,在解釋和描述的基礎上做出行為規劃或行為決策。計算機視覺研究的目的使計算機具有透過二維影象資訊來認知三維環境資訊的能力,這種能力不僅使機器能感知三維環境中物體的幾何資訊(如形狀、位置、姿態運動等),而且能進一步對它們進行描述、儲存、識別與理解,計算機視覺己經發展起一套獨立的計算理論與演算法。
2. 什麼是計算機雙目立體視覺
雙目立體視覺(Binocular Stereo Vision)是機器視覺的一種重要形式,它是基於視差原理並利用成像裝置從不同的位置獲取被測物體的兩幅影象,透過計算影象對應點間的位置偏差,來獲取物體三維幾何資訊的方法。融合兩隻眼睛獲得的影象並觀察它們之間的差別,使我們可以獲得明顯的深度感,建立特徵間的對應關係,將同一空間物理點在不同影象中的映像點對應起來,這個差別,我們稱作視差(Disparity)影象。
雙目立體視覺測量方法具有效率高、精度合適、系統結構簡單、成本低等優點,非常適合於製造現場的線上、非接觸產品檢測和質量控制。對運動物體(包括動物和人體形體)測量中,由於影象獲取是在瞬間完成的,因此立體視覺方法是一種更有效的測量方法。雙目立體視覺系統是計算機視覺的關鍵技術之一,獲取空間三維場景的距離資訊也是計算機視覺研究中最基礎的內容。
雙目立體視覺的開創性工作始於上世紀的60年代中期。美國MIT的Roberts透過從數字影象中提取立方體、楔形體和稜柱體等簡單規則多面體的三維結構,並對物體的形狀和空間關係進行描述,把過去的簡單二維影象分析推廣到了複雜的三維場景,標誌著立體視覺技術的誕生。隨著研究的深入,研究的範圍從邊緣、角點等特徵的提取,線條、平面、曲面等幾何要素的分析,直到對影象明暗、紋理、運動和成像幾何等進行分析,並建立起各種資料結構和推理規則。特別是上世紀80年代初,Marr首次將影象處理、心理物理學、神經生理學和臨床精神病學的研究成果從資訊處理的角度進行概括,創立了視覺計算理論框架。這一基本理論對立體視覺技術的發展產生了極大的推動作用,在這一領域已形成了從影象的獲取到最終的三維場景可視表面重構的完整體系,使得立體視覺已成為計算機視覺中一個非常重要的分支。
3、總結
經過幾十年來的發展,立體視覺在機器人視覺、航空測繪、反求工程、軍事運用、醫學成像和工業檢測等領域中的運用越來越廣。
以視覺系統為基礎的三維非接觸式高速測量是一個重要的研究方向,雙目立體視覺方法是其中一種最常用的方法。為了能夠將這些技術應用在實際的無人機專案中,需要儘可能提高演算法的效率與精度。(俊鷹無人機)
1. 什麼是視覺
視覺是一個古老的研究課題,同時又是人類觀察世界、認知世界的重要功能和手段。人類從外界獲得的資訊約有75%來自視覺系統,用機器模擬人類的視覺功能是人們多年的夢想。視覺神經生理學,視覺心裡學,特別是計算機技術、數字影象處理、計算機圖形學、人工智慧等學科的發展,為利用計算機實現模擬人類的視覺成為可能。在現代工業自動化生產過程中,計算機視覺正成為一種提高生產效率和檢驗產品質量的關鍵技術之一,如機器零件的自動檢測、智慧機器人控制、生產線的自動監控等;在國防和航天等領域,計算機視覺也具有較重要的意義,如運動目標的自動跟蹤與識別、自主車導航及空間機器人的視覺控制等。
人類視覺過程可以看作是一個從感覺到知覺的複雜過程,從狹義上來說視覺的最終目的是要對場景作出對觀察者有意義的解釋和描述;從廣義上說,是根據周圍的環境和觀察者的意願,在解釋和描述的基礎上做出行為規劃或行為決策。計算機視覺研究的目的使計算機具有透過二維影象資訊來認知三維環境資訊的能力,這種能力不僅使機器能感知三維環境中物體的幾何資訊(如形狀、位置、姿態運動等),而且能進一步對它們進行描述、儲存、識別與理解,計算機視覺己經發展起一套獨立的計算理論與演算法。
2. 什麼是計算機雙目立體視覺
雙目立體視覺(Binocular Stereo Vision)是機器視覺的一種重要形式,它是基於視差原理並利用成像裝置從不同的位置獲取被測物體的兩幅影象,透過計算影象對應點間的位置偏差,來獲取物體三維幾何資訊的方法。融合兩隻眼睛獲得的影象並觀察它們之間的差別,使我們可以獲得明顯的深度感,建立特徵間的對應關係,將同一空間物理點在不同影象中的映像點對應起來,這個差別,我們稱作視差(Disparity)影象。
雙目立體視覺測量方法具有效率高、精度合適、系統結構簡單、成本低等優點,非常適合於製造現場的線上、非接觸產品檢測和質量控制。對運動物體(包括動物和人體形體)測量中,由於影象獲取是在瞬間完成的,因此立體視覺方法是一種更有效的測量方法。雙目立體視覺系統是計算機視覺的關鍵技術之一,獲取空間三維場景的距離資訊也是計算機視覺研究中最基礎的內容。
雙目立體視覺的開創性工作始於上世紀的60年代中期。美國MIT的Roberts透過從數字影象中提取立方體、楔形體和稜柱體等簡單規則多面體的三維結構,並對物體的形狀和空間關係進行描述,把過去的簡單二維影象分析推廣到了複雜的三維場景,標誌著立體視覺技術的誕生。隨著研究的深入,研究的範圍從邊緣、角點等特徵的提取,線條、平面、曲面等幾何要素的分析,直到對影象明暗、紋理、運動和成像幾何等進行分析,並建立起各種資料結構和推理規則。特別是上世紀80年代初,Marr首次將影象處理、心理物理學、神經生理學和臨床精神病學的研究成果從資訊處理的角度進行概括,創立了視覺計算理論框架。這一基本理論對立體視覺技術的發展產生了極大的推動作用,在這一領域已形成了從影象的獲取到最終的三維場景可視表面重構的完整體系,使得立體視覺已成為計算機視覺中一個非常重要的分支。
3、總結
經過幾十年來的發展,立體視覺在機器人視覺、航空測繪、反求工程、軍事運用、醫學成像和工業檢測等領域中的運用越來越廣。
以視覺系統為基礎的三維非接觸式高速測量是一個重要的研究方向,雙目立體視覺方法是其中一種最常用的方法。為了能夠將這些技術應用在實際的無人機專案中,需要儘可能提高演算法的效率與精度。(俊鷹無人機)