回覆列表
  • 1 # IoT數字科技時代

    目前的人工智慧技術已經非常擅長識別影象中的物體,但仍然很容易犯些“低階錯誤”。

    在部分情況下,只需在人眼不可見的靜態噪聲中新增一些可選的筆觸或圖層,就可以“愚弄”AI影象識別系統,這有時甚至會造成致命的後果。

    例如,曾有研究人員將列印的塗鴉貼在路牌上導致AI自動駕駛系統將限速標誌識別為禁行,騰訊科恩實驗室也曾釋出報告稱路面上難以注意到的小貼紙就能誤導特斯拉錯誤判斷並駛入反向車道。

    這些誤導標誌被稱為“對抗補丁”,研究人員現在正忙於開發保護人工智慧系統不受這些例子影響的方法。

    但在去年的一篇論文中,Google Brain和普林斯頓大學的一組研究人員,包括該領域最早的研究人員之一Ian Goodfellow,認為這些新研究過於理論化,沒有抓住重點。

    他們說,雖然大部分研究的重點是保護系統免受特別設計的標誌的干擾,但駭客可能會選擇一種更直接的方法:使用一張完全不同的照片,而不是在現有照片上疊加噪音圖案。這也可能導致系統誤判斷。這一批評促使加州大學伯克利分校的博士生Dan Hendrycks編寫了一個新的影象資料集。

    這個資料集中包括一些容易被誤判的影象,比如松鼠(它們通常會被誤認為是海獅)或蜻蜓(它們會被誤認為是井蓋)。他表示:“這些例子似乎更難防範。”

    人工合成的對抗標誌需要知道所有的人工智慧系統是如何防範誤判的。但相比之下,即使人工智慧系統各自的防範措施不同,這些自然的例子也能很好地發揮作用。

    Hendrycks上週在國際機器學習會議上釋出了該資料集的早期版本,包含大約6000幅影象。他計劃在幾周內釋出最終版本,其中包括近8000個影象。他打算讓研究團體使用該資料集作為基準。

    換句話說,與其直接在影象上訓練影象識別系統,不如將其保留下來只用於測試。他說:“如果人們只是用這些資料集訓練系統,那麼系統僅僅只是記住了這些例子。這樣雖然系統已經解決了誤判這些影象的問題,但它們對新影象的誤判程度並沒有得到改善。”

    破解這些令人困惑的誤判背後的邏輯,可能會讓系統的適應性更廣。“為什麼系統會把蜻蜓和鱷梨色拉醬搞混?”Hendrycks開玩笑道,“根本不清楚為什麼會犯這樣的錯誤。”

    為什麼人工智慧會誤判?

    有些人工智慧系統的底層計算機制是已知的,有些則不是,這被稱為“黑箱”,即該系統的開發者可能都無法完全瞭解系統如何做出決策。

    對於影象識別技術來說,有時原因是因為給定的訓練資料集出了問題。比如近日Facebook人工智慧實驗室的一項新研究就表明,科技巨頭銷售的物體識別演算法在識別來自低收入國家的物品時表現得更差。

    據報道,研究人員測試了五種流行的現成物件識別演算法——微軟Azure、Clarifai、谷歌Cloud Vision、亞馬遜Rekognition和IBM Watson。而測試的影象包括來自全球不同階級的家庭的家中用品的影象。這些影象可能來自非洲蒲隆地的一個月收入27美元的家庭,也可能來自烏克蘭一個月收入1090美元的家庭。

    研究人員發現,與月收入超過3500美元的家庭相比,當被要求識別月收入50美元的家庭的物品時,物體識別演算法的出錯率要高出10%左右。

    而且在識別來自美國的照片時,演算法的準確性也比識別來自索馬利亞或布吉納法索的照片要高出15%至20%。

    研究人員稱,在一系列用於影象識別的商業雲服務中,這些發現具有一致性。

    人工智慧演算法的這種“偏見”還有很多別的例子,其中一種常見的推測原因是用於培訓的資料有了偏頗——它們往往反映了相關工程師的生活和背景。由於這些人通常是來自高收入國家的白人男性,他們訓練的演算法所要識別的世界也是如此。

    研究人員稱,視覺演算法的訓練資料主要來自歐洲和北美,“在人口眾多的地理區域,特別是非洲、印度、中國和東南亞,對視覺場景的取樣嚴重不足”。

    由於美國科技公司在人工智慧領域處於世界領先地位,這可能會影響到從照片儲存服務、影象搜尋功能到更重要的AI安全攝像頭、自動駕駛汽車等系統的方方面面。

    “評估人工智慧系統並不一定容易,因為沒有執行這類評估的標準基準。”幫助開展這項研究的Facebook人工智慧研究科學家勞倫斯·範德馬頓(Laurens van der Maaten)在接受採訪時表示。

    “對抗這種偏見最重要的一步是,在培訓AI系統之前的資料收集環節就要謹慎得多。”

    值得注意的是,科技公司們經常把自家人工智慧產品宣傳為“人人平等、人人可得”,但實際上,它們可能只是在按照自己的形象來評估、定義和塑造世界。

  • 2 # 浪語726

    人工智慧有不同的影象演算法,它不像人類的形象思維。識別錯誤肯定是演算法出現問題。比如空間結構,只識別幾個點,當這幾個識別用標誌點發生錯誤錯誤就產生了,畫素是非常龐大的資料,不加甄選的識別是無意義,也做不到。相信演算法的迭代更新,這問題應該很容易解決。

    答案就是出現了bug。

  • 3 # 小火龍JR

    總而言之AI和人看到的東西是不一樣的。在AI眼裡他發現松鼠和海獅,蜻蜓和井蓋有共同點。同樣人類也分不清二鍋頭和茅臺。

  • 中秋節和大豐收的關聯?
  • 無符號二進位制整數1000110轉換成十進位制數是什麼?