首頁>Club>
5
回覆列表
  • 1 # 不雯

    人臉識別在我們身邊已經有非常多的應用場景了,以下是幾個典型的應用場景

    如銀行服務大廳的一體機,可以做活體檢測

    移動支付可以用刷臉支付

    手持身份證照片的識別,

    還有蘋果的智慧相簿,可以按照人物進行歸類。

    以及美顏相機的特效製作等等。

    從技術角度人臉識別有不同的細分領域:

    人臉檢測很早以前在相機上就已經出現,它可以幫助人像照片的對焦;

    人臉比對,比如智慧相簿的相片歸類。

    屬性的識別包括性別年齡情緒等屬性,微軟工程師曾經用了認知服務,做了一個測年齡的應用,在網際網路上也很快得到傳播。

    還有人臉查詢,從門禁或者監控影片的畫面與資料庫中照片進行匹配,確認相關資訊。

    還有特徵點定位,找出眼耳鼻嘴等人臉上的特徵點。

    我們用一張非常簡約的圖來表示系統的構成包括端雲和數。端是智慧終端,他負責影象影片等資料採集,還有一些預處理;雲是雲伺服器負責計算儲存網路等系統任務;數是資料和模型,包括原始影像資料,監督式學習打上的標籤資料以及訓練出的資料模型等等。

    順帶提及一下,對於不同的應用系統部署方式會有所不同,數可以放在端上,也可以放在雲上,放在端的優點,是沒有網路也可以使用,缺點是需要佔用端的儲存空間,放在雲則恰恰相反,比如Siri的語音識別模型就是放在雲上的,手機是飛航模式時就沒辦法用了。

    下面介紹一下技術原理:

    人臉識別問題中x是影象,當然影象在計算機中的儲存方式是數字矩陣對應影象的畫素點陣,比如1024×768等等,而每個畫素點是用數值來表示RGB或者黑白灰,不同的影象所對應的數字矩陣是不同的,但在數值分佈上會呈現出一定的特徵,比如人臉和五官,不管出現在影象中的哪個位置,對應的數值都會有一定的規律。

    對於人臉檢測問題,y是方框,把人臉能夠裝在方框當中,準確的說也就是這個方框4個點的座標值。

    對於人臉特徵點定位的問題呢,y值是這些特徵點的座標值。

    而對於年齡識別問題,這是標籤值,身份識別也是標籤值,比如下圖照片對應的ID。

    這樣呢,人臉識別的相關問題就都轉換成為基於數值矩陣的分類或者回歸問題,標籤值如果是男女老少這樣的類別,那是分類問題,標籤值如果是特徵點或者定位框,那就是迴歸問題。

    我們以特徵點定位為例,先看一下演示效果,下圖是某次奧巴馬演講的影片的截圖,

    我們運用機器學習的方法做了人臉特徵點的定位。大家知道影片是一幀幀的影象。我們對每一張影象標註了相應的特徵點,就合成了一下的這個影片。

    來看一下我們的訓練資料集。

    x是各種人臉的照片,包括正面側面的各種人像照呢,y是眼耳鼻喉這些關鍵點的座標,我們的目標是用這些資料訓練模型,告訴模型當給定影象是這樣的數值矩陣型,對應的人臉特徵點在這些位置,我們希望訓練好的模型,對於未知的影象可以做出正確的特徵點預測。

    對於影象問題最為常見的模型是卷積神經網路convolution neural networks。

    簡單理解卷積神經網路運用一系列的數學方法,建立多層結構來提取資料特徵,基於這些資料特徵進行判斷預測。圖中的結構有點類似於人的神經網路視網膜採集畫素,神經元提取顏色輪廓等資訊,大腦再將影象資訊與抽象概念進行比對。運用了數學的卷積方法,類似於神經網路,所以這個結構叫做卷積神經網路。

    在圖中的結構中中間的hidden layers,用於影象數字矩陣的特徵提取,是可以複用的,對於分類問題,我們右邊用classification的結構。對於迴歸問題,用regulation的結構就可以了。

    關於卷積神經網路可以用博大精深來形容,近年有非常多的研究成果,比如cmu卡耐基梅隆大學的OpenPose,Facebook的Mask R-CNN等等。

  • 2 # 自由自在的在天空中飛

    其實就是透過人臉識別自動紀錄人臉,然後儲存物品,下次需要拿出來的時候直接人臉識別,自動開啟寄存櫃!方便,可靠!

  • 3 # 懷若先生

    這個主要分兩部1每次寄存先採集人臉心資訊,假定採集到人臉的特真資訊後繫結特定的櫃子開啟儲存櫃,這時候顧客存東西進去,關閉櫃子電腦開啟人臉識別開櫃模式流程。

    2.客戶要開櫃取東西,電腦觸發人臉識別模式,識別成功開啟對應的櫃子。

    整個流程結束等待下次儲存

  • 中秋節和大豐收的關聯?
  • (作文:800字)原來,我也能堅持下去?