圖3. 微軟在Twitter上線的對話機器人極短時間內即學習了大量種族主義言論[9]
我們發表一系列博文介紹AI可解釋的問題,具體請移《MindSpore首次開源可解釋AI能力(https://zhuanlan.zhihu.com/p/345190949)》,《可解釋AI如何幫助圖片分類模型調試調優-可解釋AI系列博文(二)(https://zhuanlan.zhihu.com/p/345200994)》。
我們最後談談AI的信息泄露問題,黑客可能直接攻擊AI獲得關鍵的數據資產。很多時候,訓練數據集和訓練好的模型都是高價值資產,可能會成為黑客新的攻擊目標。除去傳統的侵入信息系統之外,黑客可能通過調用AI服務的API,獲得訓練數據中的高價值信息[10],甚至重構模型本身。