把松鼠當海獅、蜻蜓當井蓋……為什麼圖像識別AI會犯這些「低級錯誤」？

目前的人工智慧技術已經非常擅長識別圖像中的物體，但仍然很容易犯些「低級錯誤」。

在部分情況下，只需在人眼不可見的靜態雜訊中添加一些可選的筆觸或圖層，就可以「愚弄」AI圖像識別系統，這有時甚至會造成致命的後果。

例如，曾有研究人員將列印的塗鴉貼在路牌上導致AI自動駕駛系統將限速標誌識別為禁行，騰訊科恩實驗室也曾發布報告稱路面上難以注意到的小貼紙就能誤導特斯拉錯誤判斷並駛入反向車道。

這些誤導標誌被稱為「對抗補丁」，研究人員現在正忙於開發保護人工智慧系統不受這些例子影響的方法。

但在去年的一篇論文中，Google Brain和普林斯頓大學的一組研究人員，包括該領域最早的研究人員之一Ian Goodfellow，認為這些新研究過於理論化，沒有抓住重點。

他們說，雖然大部分研究的重點是保護系統免受特別設計的標誌的干擾，但黑客可能會選擇一種更直接的方法:使用一張完全不同的照片，而不是在現有照片上疊加噪音圖案。這也可能導致系統誤判斷。這一批評促使加州大學伯克利分校的博士生Dan Hendrycks編寫了一個新的圖像數據集。

這個數據集中包括一些容易被誤判的圖像，比如松鼠(它們通常會被誤認為是海獅)或蜻蜓(它們會被誤認為是井蓋)。他表示:「這些例子似乎更難防範。」

人工合成的對抗標誌需要知道所有的人工智慧系統是如何防範誤判的。但相比之下，即使人工智慧系統各自的防範措施不同，這些自然的例子也能很好地發揮作用。

Hendrycks上周在國際機器學習會議上發布了該數據集的早期版本，包含大約6000幅圖像。他計劃在幾周內發布最終版本，其中包括近8000個圖像。他打算讓研究團體使用該數據集作為基準。

換句話說，與其直接在圖像上訓練圖像識別系統，不如將其保留下來只用於測試。他說:「如果人們只是用這些數據集訓練系統，那麼系統僅僅只是記住了這些例子。這樣雖然系統已經解決了誤判這些圖像的問題，但它們對新圖像的誤判程度並沒有得到改善。」

破解這些令人困惑的誤判背後的邏輯，可能會讓系統的適應性更廣。「為什麼系統會把蜻蜓和鱷梨色拉醬搞混?」Hendrycks開玩笑道，「根本不清楚為什麼會犯這樣的錯誤。」

為什麼人工智慧會誤判?

有些人工智慧系統的底層計算機制是已知的，有些則不是，這被稱為「黑箱」，即該系統的開發者可能都無法完全了解系統如何做出決策。

對於圖像識別技術來說，有時原因是因為給定的訓練數據集出了問題。比如近日Facebook人工智慧實驗室的一項新研究就表明，科技巨頭銷售的物體識別演算法在識別來自低收入國家的物品時表現得更差。

據報道，研究人員測試了五種流行的現成對象識別演算法——微軟Azure、Clarifai、谷歌Cloud Vision、亞馬遜Rekognition和IBM Watson。而測試的圖像包括來自全球不同階級的家庭的家中用品的圖像。這些圖像可能來自非洲蒲隆地的一個月收入27美元的家庭，也可能來自烏克蘭一個月收入1090美元的家庭。

研究人員發現，與月收入超過3500美元的家庭相比，當被要求識別月收入50美元的家庭的物品時，物體識別演算法的出錯率要高出10%左右。

而且在識別來自美國的照片時，演算法的準確性也比識別來自索馬利亞或布吉納法索的照片要高出15%至20%。

研究人員稱，在一系列用於圖像識別的商業雲服務中，這些發現具有一致性。

人工智慧演算法的這種「偏見」還有很多別的例子，其中一種常見的推測原因是用於培訓的數據有了偏頗——它們往往反映了相關工程師的生活和背景。由於這些人通常是來自高收入國家的白人男性，他們訓練的演算法所要識別的世界也是如此。