常言道“隔牆有耳”,
是指勸人小心說話,
因為指不定就被有心人聽了去。
而現在,隨著科技的不斷進步發展,
“隔牆有耳”都不算啥了,
因為,技術已經可以做到“隔牆識人”了!
聽起來是不是感覺很可怕?
畢竟有人隔著一堵牆都能知道你是誰~
看到這裡大家是不是想說
不就是聲音來辨識人物嘛,
有什麼大不了的~
黑馬告訴你,還真就不是!
近日,在電氣和電子工程師協會
舉辦的第12屆國際人機互動國際會議上,
英特爾和Gdansk University的研究員
就針對熱成像能否可以
使AI識別出人物的面部特徵進行了解答。
首先我們先來明白下熱成像的原理。
在自然中的一切物體,
都會產生紅外輻射,
輻射能量正比於自身溫度的四次方成正比,
輻射出的波長和其溫度成反比。
而紅外成像的原理就是
根據探測到物體的輻射能量高低將其轉變成熱像圖。
(熱成像下的鴕鳥)
正是基於這個原理,
英特爾的研究人員通過一款名為
Flir ThermaCam SC3000紅外熱像儀進行了面部資料採集分析。
為什麼英特爾要這麼費力的研究“隔牆識人”呢?
錢多?並不是!(雖然錢真的很多)
在生活中有些照明條件不好的環境,
和容易涉及到安全和隱私問題的地方,
我們往往不能增加照明條件和佈置普通攝像頭來識別他人。
而熱成像就能適當的規避這種行為。
這張調侃的圖就足以說明一切:
(圖自虎撲)
那麼英特爾的研究員又是怎麼做的呢?
(下面灰色部分是硬核原理闡述,不感興趣的可直接跳過)
在資料樣本方面,
英特爾採用了兩個面部熱影象資料集。
分別為SC3000-DB和IRIS。
其中SC3000-DB的資料來自英特爾團隊
使用FLIR ThermaCAM * SC3000相機建立,
其包含了40個類別的766張影象,
每個類別分為由19名男性和21名女性志願者組成。
拍攝這些影象時,
志願者需要正視兩分鐘的熱相儀。
相比之下,
IRIS的資料集則由俄克拉荷馬州立大學
視覺計算和影象處理實驗室提供。
主要包含了30名志願者的共4190張影象。
它倆的主要區別在於,
IRIS的熱影象並沒有讓人專注的盯著熱像儀,
相比SC3000-DB的專注,
IRIS包含了更多不可預知的情況。
接下來,研究人員首先對採集到的資料集
進行人臉檢測並裁剪到僅包含面部的區域。
下一步將進行面部識別和裁剪後的資料集影象
生成縮小影象用以模擬降低解析度,
影象縮小至13.14(±1.47)*15.57(±1.96)畫素之後,
研究人員再使用自定義CNN超解析度卷積神經網路進行影象增強識別。
是不是感覺饒了一圈又回來了,
並不是,將採集到的資料
進行降低解析度再放大之後,
可以更好的模擬實際應用中的低解析度現象。
(圖自百度百科)
進行到這一步之後,
就需要進行面部特徵的提取了,
研究人員利用FaceNet DNN架構和可見光影象的模擬
來驗證提取到的模型是否可用於熱影象。
最後,研究人員通過比較兩種面對特徵向量,
發現可以經過了可見光影象資料上訓練過的FaceNet模型,
可以很好地的識別出原本的志願者。
其中,SC3000-DB組的準確性為99.5%,
IRIS組的準確性為82.14%。
可以說,英特爾此舉
不僅證明了“隔牆真的可以識人”,
還證明了熱影象的應用領域大有可為。
(黑馬為什麼第一時間想到了防止越獄……)
比如用在軍事領域方面,
隔著障礙物都能清楚的知道目標人物;
用在醫療或工業領域,
可以做到既不侵犯使用者隱私,
也可以提供一些有用的資訊。
當然就現階段而言,
對於普通消費者的實用性可能並不是很高。
最後,如果想要了解更多關於熱影象
進行人臉識別的資料,
參考資料:
Exploring Deep Learning Face Recognitionwith Thermal Images
https://www.intel.ai/exploring-deep-learning-face-recognition-with-thermal-images/#gs.trgdag
Influence of Thermal Imagery Resolution onAccuracy of Deep Learning based Face Recognition
https://ieeexplore.ieee.org/document/8942636
FaceNet: A Unified Embedding for FaceRecognition and Clustering
https://arxiv.org/abs/1503.03832
https://www.robots.ox.ac.uk/~vgg/publications/2018/Cao18/cao18.pdf