回覆列表
  • 1 # cnBeta

    種族識別成功率差異是面部識別中的一個大問題,研究表明,如果物件是白人和男人,商業系統會更加準確。部分原因是培訓資料缺乏多樣性,有色人種的出現頻率低於同齡人。 IBM是試圖解決這個問題的公司之一,並且今天宣佈了兩個新的公共資料集,任何人都可以使用它來訓練面部識別系統,其中一個專門用來幫助消除偏見。

    第一個資料集包含100萬張影象,並將幫助培訓能夠識別特定屬性的系統,如頭髮顏色,眼睛顏色和麵部毛髮。每張臉都有這些特徵的註釋,使程式設計師更容易磨練他們的系統,以更好地區分山羊鬍和其他鬍鬚。這不是用於訓練面部識別系統的最大的公共資料集,但是IBM表示包含這種標籤的規模最大。

    第二個資料集是更有趣的一個。它比第一張還要小,包含36,000張照片,但內部的人臉是相同的種族,性別和年齡組合。就像人臉屬性標籤幫助訓練AI系統識別這些差異一樣,擁有多種面部組合可以幫助系統克服各種偏見。這兩個資料集均來自張貼到Flickr的帶有Creative Commons許可證的照片,這些照片經常可以用於研究目的。

    IBM的商業面部識別系統在過去被批評為存在明顯的種族偏見。麻省理工學院媒體實驗室2月份發表的一項研究發現,IBM識別黑面板女性性別的錯誤率接近35%,而識別白人男性錯誤率僅為1%。這些錯誤將變得越來越重要,因為面部識別系統被用於從僱用到識別犯罪嫌疑人的任務。

    IBM表示正在努力改善這些錯誤,並且其面部識別系統的更新版本使用了更廣泛的訓練集(比如今天公佈的那種訓練集),以便將錯誤減少近十倍。然而,如果沒有用於評估偏倚的標準化指標,要準確判斷這些系統的改善程度仍然很難。

    微軟今天早上宣佈,他們已經更新了他們的面部識別技術,以更好地識別不同膚色人種的性別。總共三個主要更新,有助於解決面部識別技術更準確地識別淺色面板人種性別,而膚色更暗的人性別識別率不高的問題。

    該公司表示,他們已經擴大和修訂了培訓和基準資料集,推出了新的資料收集工作並改進了分類器,作為這些變化的一部分。

    這使得微軟能夠將膚色較深的男性和女性的識別錯誤率降低20倍,對女性的識別錯誤率降低9倍。微軟還補充說,他們能夠顯著降低整個人口統計資料的準確度差異。

    此面部識別技術可透過Azure Cognitive Services獲得,Azure團隊與偏見和公平方面的專家合作改善性別分類系統,以便為所有膚色獲得更好的識別效果。

  • 2 # 痴貨愛美食

    對白人準確率很高,有沒有想過深色人種資料集的缺乏,相對來說是深色人種人臉特徵較難提取,而且商用一般比較少出現這種問題,那是版本的問題了。技術一直在更新,大資料也不斷更新,如果準確率還不是很高,那就要等網際網路普及一點就好了。

  • 中秋節和大豐收的關聯?
  • 你認為寶玉和黛玉到底是一種怎樣的愛情?