中央明確指示要加快推進國家規劃已明確的重大工程和基礎設施建設,其中要加快 5G 網路、資料中心等新型基礎設施建設進度。相比於傳統的"鐵公基",新基建是立足於高新科技的基礎設施建設,主要包括5G基建、特高壓、城際高速鐵路和城市軌道交通、新能源汽車充電樁、大資料中心、人工智慧、工業網際網路等七大領域。
當前人工智慧理論和技術日益成熟,應用範圍不斷擴大,產業正在逐步形成、不斷豐富,相應的商業模式也在持續演進和多元化。據IDC統計,2018年中國人工智慧市場規模為161.9億元,預計到2022年市場規模將接近700億元,年複合增長率超過50%。據中國人工智慧學會和羅蘭貝格諮詢公司預測,2025年市場規模將達到3萬億美元。
以深度學習為代表的人工智慧演算法的出現極大推動了視覺人工智慧行業的發展。計算機視覺是人工智慧行業的最大組成部分,與其他細分的比較來看,計算機視覺技術應用的市場規模也遠遠大於其他細分。
計算機視覺(Computer Vision) 人工智慧主要應用領域之一,起源於20世紀80年代的神經網路技術,通過使用光學系統和影象處理工具等來模擬人的視覺能力捕捉和處理場景的三維資訊,理解並通過指揮特定的裝置執行決策。2015年以來,全球科技界和產業界高度重視視覺人工智慧研究和應用,在核心技術和產業化應用的研發投入持續倍增。
計算機視覺能極大提升機器的影象感知能力和認知能力,因此應用場景十分廣闊,商業化變現空間大。根據前瞻產業研究院的統計,國內人工智慧企業中,有高達42%的企業應用計算機視覺相關技術,其次是語音和自然語言處理,分別佔比24%、19%,兩者之和才與計算機視覺佔比相當。在安防影像分析、泛金融身份認證、手機和網際網路娛樂、批發零售商品識別、工業製造、廣告營銷、自動駕駛、醫療影像分析等領域都具有巨大應用價值。
視覺人工智慧行業的發展,離不開技術的驅動:一方面諸如GPU、FPGA、ASIC等一系列AI晶片的出現極大提升了晶片計算能力,突破了傳統CPU的算力瓶頸;另一方面以深學習為代表的AI演算法的崛起,使得AI視覺的識別能力有了很大的提高。硬體算力的提升以及軟體演算法的進步都對視覺人工智慧的發展起到了重要的推動作用。
計算機視覺的工作流程包含四個模組:檢測、分類、跟蹤與語義分割。具體為成像裝置首先捕獲影象,然後對每個影象進行預處理,提取特徵後輸入到分類模型中。
計算機視覺是採用影象處理、模式識別、人工智慧技術相結合的手段,著重於一幅或多幅影象的計算機分析。影象可以由單個或者多個感測器獲取,也可以是單個感測器在不同時刻獲取的影象序列。在消費級領域,隨著資料量上漲、運算力提升和深度學習演算法的發展,計算機視覺技術越來越多地被應用在各類消費級應用場景中,典型的如人臉識別服務,具體包括人臉檢測、人臉關鍵特徵點、人臉對比、人臉搜尋、人臉屬性、人臉聚類、人力活體檢測等。
計算機視覺實現了計算機“看得懂”,人臉識別、OCR和影象結構化是其主要應用場景。計算機視覺是用計算機模擬人眼對目標進行識別、跟蹤和測量,並且對圖形進行處理,即實現計算機“看得懂”。
根據億歐智庫《2019計算機視覺人臉識別市場研究報告》顯示,2018年中國計算機視覺人臉識別市場規模為151.7億元,預計2021年將達530億元,年均複合增長率53%,市場規模增長迅速。
計算機視覺行業產業鏈由上游基礎層、中游技術層以及下游應用層組成。
上游基礎層基礎層:主要包括CPU、GPU等晶片硬體,深度神經網路、迴圈神經網路、卷積神經網路等演算法,以及由真實資料和模擬資料共同構成的資料集。核心晶片被Intel、Nvidia等傳統晶片廠商把控,新型晶片廠商尚未崛起,規模應用有待時日;開源平臺以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業的深度學習框架多為二次開發;
中游技術層主要包括視訊識別、圖片識別、模式匹配等嵌入式視覺軟體,以及一站式解決方案。演算法,初創企業佔優;雲端計算,幾乎被AWS、Google Cloud、Azure、阿里雲等壟斷。
下游應用層:為計算機視覺的落地場景,包括智慧安防、智慧金融、手機應用、無人駕駛等商業領域。垂直行業龍頭佔據場景,技術層初創企業向上滲透。
國內計算機視覺的玩家有三類:
1.海康威視、大華股份、宇視科技等安防廠商
安防影像分析的市場需求驅動此類企業的技術研發。在雲邊融合的架構下,近年來安防行業頭部廠商紛紛推出自家智慧化產品和解決方案。
作為人工智慧範疇中最關鍵的子領域之一(人類從外界獲取的資訊中有80%~85%是依靠視覺實現的),計算機視覺技術的願景是利用攝像機等視覺感測裝置來代替人眼對物體進行識別、跟蹤和測量,再由計算機處理這些視覺資訊,從而達到像人眼一樣對事物進行感知和認知,直接對應安防監控系統“看得懂”的需求。
2.網際網路巨頭公司
近年來基於深度學習的智慧語音、計算機視覺、自然語言處理等技術開始向各個應用領域滲透,全球人工智慧產業規模快速增長。為搶佔人工智慧高地,谷歌、微軟、阿里巴巴、百度、騰訊、IBM、Facebook 等國際知名企業均持續增加在人工智慧領域的資本投入。美國、中國、英國、德國、日本等國家也分別出臺人工智慧相關支援政策及國家戰略規劃,為整個產業的發展創造良好的政策環境。
3.創業公司:包括商湯科技、依圖科技和曠視科技等企業,普遍以細分領域為發力點,佈局思路各異。
在商湯、曠視、依圖等頭部企業看,各家戰略思路差異明顯。商湯致力於構造平臺,專注底層基礎應用,力圖在完善平臺後於其他領域快速落地。曠視則在致力於在安防、金融、零售、汽車、教育等廣泛領域提供軟硬體一體化的解決方案。依圖則表現出對安防、醫療兩大領域的專注深耕,依託產品化、工程化能力深入落地。
按照中國資訊通訊研究院的統計結果,目前中國人工智慧應用市場主要由五個領域構成,其中,由於近幾年中國網際網路娛樂、廣告傳播和公共安全視訊監控市場的高速發展,計算機視覺市場規模以37%佔比大幅領先。而在機器視覺領域的細分市場構成中,安防行業又以67.9%佔據大部分份額,這得益於中國公共安全視訊監控建設的龐大市場。根據《安防+AI人工智慧白皮書》的預計,在2020年全球智慧安防產業規模將實現106億美元,中國將達到20億美元。
人工智慧行業是一個典型的技術驅動型行業,技術的核心在於算力、演算法和資料三個方面。GPU及AI專用晶片的出現突破了傳統CPU的算力瓶頸,資料運算速度和處理規模爆發性增長,從而為大資料的分析提供硬體上的支援。越來越多的應用領域正持續積累著日趨豐富的大資料,海量的影象和視訊內容為深度學習提供了有力的資料支撐。
視覺人工智慧行業的快速發展一方面得益於現階段算力的大幅提升及演算法的大幅改善(國內演算法甚至已經達到國際水平),另一方面則受益於下游應用市場的廣闊空間。機器學習、深度學習等演算法能力的不斷增強促進了視覺人工智慧行業的高速發展。