首頁>科技>

隨著人臉識別技術的成熟,情感識別被推上一個高潮,但情感識別是否可靠至關重要。

亞馬遜、微軟、IBM 等科技公司紛紛在賣它們的「情感識別」演算法,用語音分析、肢體分析、步態分析,到眼動追蹤等各種方式,來分析人們的情緒狀態,不過其中最受關注的,還是面部識別。

近日臺灣聯合大學研究人員發表論文,提出用特定連續動作間骨骼點速度的變化程度,來區分人類微妙情緒變化的新方法,並表示該方法與時空圖卷積網路(ST-GCN)相比,“可有效地將識別精度提高50%以上”。

一時間,AI識別情感熱潮再次席捲網路。正如以往的多次科技熱潮一樣,情感識別在引發關注的同時,有人歡喜但也有不少人對其表示擔憂。

情感識別的邏輯

其實,面部識別情感是科學家們至少爭論了 100 年的話題。但是過去一個世紀幾乎沒人對情感研究做過全面評估。

把用眼睛觀察到的視覺資訊叫做圖象資訊,如人臉的表情資訊。一般的表情識別可以用單個感官完成,也可以用多個感官相配合來完成,它是一個整體識別和特徵識別共同作用的結果。具體說來,遠處辨認人,主要是依靠人臉的整體識別,而在近距離辨認人,主要是依靠人臉的特徵識別。人臉的整體識別和特徵識別雖然存在聯絡,但總體說是分開的、並行的處理過程。

隨著人臉的計算機處理技術(包括人臉檢測和人臉識別)不斷完善,利用計算機進行面部表情分析也就成為一種可能。通常面部表情識別模型都基於數字化的面部影象或者一小段面部表情序列的影片,根據影片識別要比根據靜態影象識別更準確,影片能捕捉某種表情形成過程的面部動作。當人透過視覺器官把他人面部的刺激訊號接收並傳遞到人的大腦之中,大腦就會進行人臉檢測、人臉影象預處理、人臉特徵提取等程式,然後,把以前儲存在大腦中的若干基本表情的人臉特徵(即臉譜)提取出來,進行對比分析和模糊判斷,找出兩者的人臉特徵最接近的某種基本表情。這時,大腦皮層就會接通該基本表情所對應的興奮區與邊緣系統的神經聯絡,從而產生愉快或痛苦的情感體驗。同時,大腦皮層還會接通該基本表情所對應的興奮區與網狀結構的神經聯絡,從而確定愉快或痛苦的強度。

中國科學院自動化研究所研究員、模式識別國家重點實驗室副主任陶建華介紹說,目前主要有兩種AI情感識別方式。一種是接觸式,即利用腦電、面板電、心率心跳等生理特徵的訊號變化,透過生理引數分析人的情緒變化。另一種是非接觸式,可以基於音訊或影片,利用聲音的特點或者依靠影片資訊中表情、頭部、身體姿態變化進行識別。

情感識別真的準確麼?

儘管有科學家表示,目前機器不但能識別出人的情緒,還相當準確,且準確率超過80%,在一些特定的場景中,甚至能達到90%以上。

但在一些針對面部表情與情感之間的相關性研究中,也存在著和人們生活中真實情況不符的缺陷。當研究中參試者被要求表達感情時,他們往往會從既定俗成的面部情緒,以達到大家普遍認為的憤怒、厭惡、恐懼、快樂、悲傷、驚喜等表情共識。

一些大公司承認了情感表達的微妙之處很難判定,比如微軟就表示它們的軟體分析情感主要認準八大核心情緒狀態。但把情緒歸類,實際上有點刻板印象。人們會憤怒地嘶喊,也會高興地流淚,會在愛慕之人面前假裝漠不關心,也會在春風滿面的時候計劃一項陰謀。這些情感太過複雜,甚至就算是把人們的面部表情放在你面前,你也看不出這是哭、是笑、是驚,還是隻是單純地爽。

經過多年的探索與反思,科學家也發現情感識別本身存在很多不確定,比如人有某種情感時候他會表現出什麼樣的人臉是不確定的,這個和人種、性格、經歷、當前環境、文化背景都有關係,這個科學的叫法是Expression Production,是不確定的。同樣,一個標註者看到一個人臉或者影片,他認為的表情類別也是不確定的,這個同樣和人種、性格、經歷、當前環境、文化背景都有關係,這個科學的叫法是Emotion Perception不確定。

總的來說,他們認為目前對於面部情感的表達和感知方式,存在以下三種誤解:一是同樣的情感並不總是以同樣的方式表達,二是同樣的面部表情不能表明同樣的情感,三是不同文化和背景的面部感情表達都不同。

用對了是救贖 用錯了是深淵

儘管有爭論,但科技的車輪滾滾向前,未來情感識別一定會商業化落地,那麼AI識別人類情感到底是把人類帶入深淵,還是幫助人類更好的生活,很大程度上取決於我們對於科技的敬畏與應用方向研究的把控。

以目前正在推廣的招聘領域來舉例:互曼就是一家這樣的公司,他們會向招聘公司傳送報告,詳細說明應聘者對面試中每個問題的情緒反應,透過對照其性格特徵給出評分,用於反映申請人的“誠實度”或“熱情度”。互曼的創始人兼執行長Yi Xu指出:“如果(招聘公司)說,'我們在尋找好奇心特別強的人',他們可以透過比較各候選人的得分來找到合適的人。”

招聘公司仍然可以採用傳統的面試方式來評估候選人,但他們可以面談的人數或觀看影片申請的數量是有限的。Yi Xu說,互曼公司的情感識別技術可以幫助僱主篩查更多的候選人,並篩選出他們透過其他面試方式可能不會考慮的候選人。她說:“面試官會有偏見,但(採用技術後),他們就不會依據外表來評判申請人,而是會依據他們的性格。”她聲稱,這項技術的目標之一就是克服招聘過程的種族和性別歧視。

車上的面部識別情感技術,可以識別到我們駕駛時正在犯困或焦躁的情緒,然後提醒我們更加專注和平靜,以減少事故的發生。

但是,當情感識別利用不準確的標準,達成不嚴謹的決策,就可能對人們造成一些真實的傷害,不準確的識別可能會導致某人屢屢失業,或求職時刻意偽裝;在法庭中法官用面部表情判斷嫌疑人是否犯罪,可能會直接導致一場死刑。

對情感錯誤理解的演算法可能會使偏見更難以發現,這也絕對值得警惕。

9
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 透過知識圖進行自動測試的眾包需求生成