本文由騰訊數碼獨家發佈

要是你曾在Flickr上傳過自己的照片,那可能這些照片未經你允許就用到面部識別訓練中了。

據NBC報道,IBM未經用戶允許,就擅自從Flickr上提取了約100萬張圖片,用於訓練面部識別人工智能。

今年1月,IBM公開了全新的面部數據集“Diversity in Faces”。過去的人工智能算法在識別女性和有色人種時容易出錯,而IBM的新數據集可以讓識別結果更準確。

鑑於面部識別技術通常用於監視、尋人、識別跟蹤狂、標記社交網絡圖片、解鎖手機,甚至解鎖房屋,多數人可能不希望自己的臉用在這類人工智能的訓練中,特別是在訓練識別性別和人種的時候。

IBM數據集中含有YFCC-100M數據集的內容,該數據集中有約1億張創用CC許可圖片,這些圖片均來自Flickr的前東家雅虎,其中有許多都用在了面部識別學術研究和趣味對比項目中。

IBM則使用了其中的約100萬張圖片用在了自己的人工智能訓練中。據NBC報道,這些圖片都依據年齡、性別等特徵進行了標記,甚至對膚色、面部特徵的大小和形狀、姿勢等都有標記。

雖然IBM使用的是創用CC圖片,但並沒有告知那些面部出現在這100萬張圖片中的人,公司到底用這些面部數據進行了什麼研究。

誠然這些人允許自己的照片出現在Flickr上,並且這些圖片爲創用CC許可圖片,但IBM在用這些人的面部訓練人工智能面部識別系統時,並沒有獲得他們的允許。

NBC採訪了一些出現在IBM數據集中的人,其中包括一位公關主管。這位主管告訴NBC,他上傳的圖片中出現的任何人,都不知道自己的照片被用在了這種用途,IBM使用這些照片,卻不先告知他們,這種做法似乎欠妥。

Flickr聯合創始人Caterina Fake也發現IBM使用了她的14張照片。她表示,雖然IBM表示人們可以申請刪除他們的照片,但實際卻不太可能。

雖然IBM向NBC證實,任何希望刪除自己照片的人都可以向IBM發送郵件,但這一操作卻沒有想象中那麼簡單。因爲這一數據集僅對研究人員開放,所以大部分Flickr用戶無法知曉自己的照片是否出現在了數據集中。

現在NBC開發了一個小工具,可以幫助用戶檢測自己的圖片是否出現在了數據集中。

相關文章