計算機視覺專案正在蓬勃發展,為2020年採用率的提高奠定了基礎。在過去的幾年中,儘管各種形式的人工智慧得到了發展,但其中一種形式(計算機視覺)在2020年顯示出了特殊的前景。
在《自然》雜誌上發表的一項最新研究中,人工智慧(AI)系統早在2020年就擊敗了人類專家。參與該專案的研究人員(包括Google員工以及美國和英國的醫學專家)進一步推動了計算機視覺的發展。市場上的計算機視覺應用程式可以完成從掃描放射影象到確定冰箱內容的所有工作。
Zededa生態系統副QuattroporteJason Shepherd表示,各種計算機視覺專案可能會在2020年擴大。“計算機視覺將成為AI的殺手級應用程式。”
Forrester副Quattroporte兼首席分析師Thomas Husson對今年的消費電子展(CES)上的主要趨勢進行了推測時,對計算機視覺感到樂觀。 Husson期望在CES上,人們將越來越關注計算機視覺以及增強現實和高階音訊技術。
儘管企業採用計算機視覺的速度快於消費者,但計算機視覺也在消費者領域升溫。鑑於人臉識別功能現在可以解鎖智慧手機,因此公眾更加接觸了該技術。Pinterest等消費類網站已幫助普及了視覺搜尋。 Husson說:“與其他技術(例如增強現實或IoT)配對使用時,在上下文中檢測物件還將開啟新的用例。”
IP攝像頭的普及也推動了計算機視覺專案的發展。 IHS Markit的一份報告預測,到2021年,監控攝像頭將達到10億個。此外,攝像頭正越來越多地部署在工業部門,自動駕駛汽車,無人機,增強現實等領域。 Shepherd認為,相機“是獲得豐富,高頻寬資訊的最佳感測器之一”。
對於科技公司和學術界的研究人員而言,計算機視覺仍然是一個熱門話題。像IBM,亞馬遜,中國公司百度和騰訊,微軟和谷歌這樣的技術巨頭,以及許多著名的國際學術機構,都擁有大量的計算機視覺計劃。
分析公司也對計算機視覺的前景感到樂觀。計算機視覺是2019年Gartner人工智慧炒作週期中最成熟的技術之一。Gartner預測AI子行業距離主流採用尚需兩到五年,而最近的Forrester New Wave致力於計算機視覺平臺計有11個供應商。 Forrester檔案還得出結論,計算機視覺平臺市場正在“光速”發展。
當然,計算機視覺專案被誇大了,但也有望帶來超人的結果。例如,在執法中,配備計算機視覺的監控攝像頭理論上可以在數百人中找到通緝的逃犯。
這項技術有可能被用來解決美國和英國等國家放射科醫生的短缺。
紐瓦克(Newark)的區域解決方案營銷經理Ankur Tomar還指出,計算機視覺技術可以改善工業環境中機器人和檢查系統的本地化。如果將計算機視覺與感測器融合一起使用,Tomar預計該技術將具有一系列潛在應用。
“在工業計算機視覺應用中,” Tomar說,“品質控制檢查員除了使用組裝產品的圖片外,還可以使用組裝過程中記錄的多個感測器的資料來評估其是否合格。”
儘管計算機視覺的採用正在不斷擴大,但仍處於初期階段。計算機視覺的普遍挑戰是資料過載。很少有組織能夠自動處理大量影象或視訊資料。
至少對於監視應用程式而言,廣泛採用計算機視覺的另一個障礙是隱私問題。 “與涉及結構化/二進位制資料的邊緣計算工作負載相比,除了消耗高頻寬並利用不同的工具集之外,計算機視覺工作負載的獨特之處還在於它們往往引起人們對隱私的最大關注,” Zededa的Shepherd說。
Husson同意,計算機在感知周圍環境方面已經有所進步,“因此帶來了海量資料和隱私。”
與面部識別有關的隱私問題已受到廣泛關注。在2019年,舊金山和加利福尼亞州奧克蘭以及馬薩諸塞州的三個社群禁止在執法中使用面部識別工具。俄勒岡州波特蘭市也計劃這樣做。
同時,越來越多的政府優先考慮與隱私相關的立法,其中《通用資料保護條例》和《加州消費者隱私法》就是兩個突出的例子。
Athena Security是德克薩斯州奧斯汀市的一家初創公司,生產探測安全攝像頭系統,它正在使用這種方法。該系統模糊了被攝物件的面孔,並且不使用基於雲的儲存裝置。雅典娜安全域性執行長麗莎·法爾佐恩(Lisa Falzone)表示,這種方法可以幫助防止或加快對大規模威脅安全事件的反應,而不會侵犯公眾的隱私。
Shepherd預測,支援公共利益的資料集共享將有所增加。他認為這種趨勢特別相關,“適用於涉及共同模式的用例,例如,識別人員的人口統計資料並識別常見物件(例如汽車,公共汽車,單車)”。
當前,訓練計算機視覺模型通常是耗時且昂貴的。資料模型的商品化可以幫助簡化此培訓階段,從而有助於增加各種計算機視覺專案的數量。 “差異化的重點將轉移到針對特定環境的程式設計模型,例如在每個生產的產品都是唯一的工廠中識別品質問題,” Shepherd預測。
值得指出的是,計算機視覺系統的效能和訓練資料一樣好。正如最近的《麻省理工新聞》的一篇文章所解釋的那樣,位於偏僻角度且背景不同的常見物件甚至會難倒高階計算機視覺程式。由麻省理工學院和麻省理工學院研究人員等組成的團隊正在努力提高遇到非典型影象時此類系統的準確性。 “我們需要更好,更智慧的演算法,”一位麻省理工學院的研究科學家告訴《麻省理工新聞》。
幸運的是,世界各地的研究人員已經解決了計算機視覺和對抗性機器學習等相關領域的問題,這可以幫助提高此類演算法的智慧性。
就目前而言,相對簡單的計算機視覺用例可能會首先起飛。從長遠來看,如果組織可以開發出釋放計算機視覺所需的必要資料和隱私成熟度,則它們可以更接近某些人認為的AI:理解和預測環境。
支援計算機視覺與語音識別
Gravitylink推出鈦靈AIX是一款集計算機視覺與智慧語音互動兩大核心功能為一體的人工智慧硬體,Model Play是面向全球開發者的AI模型資源平臺,內建多樣化AI模型,與鈦靈AIX結合,基於Google開源神經網路架構及演算法,構建自主遷移學習功能,無需寫程式碼,通過選擇圖片、定義模型和類別名稱即可完成AI模型訓練。