OpenCV是一個基於BSD許可(開源)發行的跨平臺計算機視覺庫,可以執行在Linux、Windows、Android和Mac OS作業系統上。它輕量級而且高效——由一系列 C 函式和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的介面,實現了影象處理和計算機視覺方面的很多通用演算法(百度百科),可以根據自己擅長語言選擇相應介面。安裝教程網上可以查詢。
Caffe
Convolutional Architecture for Fast Feature Embedding,它是一個清晰、高效的深度學習框架,它是開源的,核心語言是C++,它支援命令列、Python和Matlab介面,它既可以在CPU上執行也可以在GPU上執行。
計算機視覺學習基礎為計算機圖形學,一般計算機專業都有開設的學科。
計算機視覺就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給一起檢測的影象
作為一個科學學科,計算機視覺研究相關的理論和技術,檢視建立能夠從影象或者多維資料中獲取“資訊”的人工智慧系統。目前,VR、AR,3D處理等方向,都是計算機視覺的一部分。
需要了解和學習的開源軟體
OpenCVOpenCV是一個基於BSD許可(開源)發行的跨平臺計算機視覺庫,可以執行在Linux、Windows、Android和Mac OS作業系統上。它輕量級而且高效——由一系列 C 函式和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的介面,實現了影象處理和計算機視覺方面的很多通用演算法(百度百科),可以根據自己擅長語言選擇相應介面。安裝教程網上可以查詢。
CaffeConvolutional Architecture for Fast Feature Embedding,它是一個清晰、高效的深度學習框架,它是開源的,核心語言是C++,它支援命令列、Python和Matlab介面,它既可以在CPU上執行也可以在GPU上執行。
Caffe可以應用在視覺、語音識別、機器人、神經科學和天文學。
Caffe提供了一個完整的工具包,用來訓練、測試、微調和部署模型。
Caffe的特點:
模組化:Caffe從一開始就設計得儘可能模組化,允許對新資料格式、網路層和損失函式進行擴充套件。
表示和實現分離:Caffe的模型(model)定義是用Protocol Buffer語言寫進配置檔案的。以任意有向無環圖的形式,Caffe支援網路架構。Caffe會根據網路的需要來正確佔用記憶體。透過一個函式呼叫,實現CPU和GPU之間的切換。 測試覆蓋:在Caffe中,每一個單一的模組都對應一個測試。 Python和Matlab介面:同時提供Python和Matlab介面。 預訓練參考模型:針對視覺專案,Caffe提供了一些參考模型,這些模型僅應用在學術和非商業領域,它們的license不是BSD。TensorFlowTensorFlow是一個基於資料流程式設計(dataflow programming)的符號數學系統,被廣泛應用於各類機器學習(machine learning)演算法的程式設計實現,其前身是谷歌的神經網路演算法庫DistBelief [1] 。Tensorflow擁有多層級結構,可部署於各類伺服器、PC終端和網頁並支援GPU和TPU高效能數值計算,被廣泛應用於谷歌內部的產品開發和各領域的科學研究。TensorFlow由谷歌人工智慧團隊谷歌大腦(Google Brain)開發和維護,擁有包括TensorFlow Hub、TensorFlow Lite、TensorFlow Research Cloud在內的多個專案以及各類應用程式介面(Application Programming Interface, API) 。自2015年11月9日起,TensorFlow依據阿帕奇授權協議(Apache 2.0 open source license)開放原始碼 。TensorFlow支援多種客戶端語言下的安裝和執行。截至版本1.12.0,繫結完成並支援版本相容執行的語言為C和Python,其它(試驗性)繫結完成的語言為JavaScript、C++、Java、Go和Swift,依然處於開發階段的包括C#、Haskell、Julia、Ruby、Rust和Scala。