【獵雲網(微信號:ilieyun)】4月11日報道 (編譯:王哲)

  目前,數千萬的人們經常使用智能揚聲器和語音軟件來玩遊戲、聽音樂或搜尋一些瑣事。而這其中有數百萬人卻越來越不願意將這些設備和它們強大的麥克風買回家,因爲他們擔心有人在偷聽。

  有時候,的確有人在偷聽。

  亞馬遜公司在全球僱傭了數千名員工,以幫助改進爲Echo音箱供電的Alexa數字語音助手。研究小組會監聽Echo在其主人家中或辦公室裏收集到的語音記錄。這些錄音會被轉錄、註釋,然後反饋到軟件中,此舉的目的是爲了消除Alexa對人類語言理解的空白,幫助它更好地響應指令。

  七名曾參與過Alexa語音審查程序的人員描述這個程序時,強調了在訓練軟件算法時經常被忽視的人類角色。在營銷材料中,亞馬遜稱Alexa“生活在雲端,並且一直在變得更聰明。” 但是,就像許多爲了實現從經驗中學習的目的而構建的軟件工具一樣,人類也在對其進行一些教學。

  據知情人士透露,這個團隊由一羣承包商和亞馬遜全職員工組成,他們在波士頓、哥斯達黎加、印度和羅馬尼亞等地的前哨站工作。這些知情人士簽署了保密協議,該協議禁止他們公開談論這個項目。

  亞馬遜布加勒斯特辦公室的兩名員工稱,他們每天工作9個小時,每人每次當值時要分析多達1000個音頻片段。布加勒斯特辦公室位於羅馬尼亞首都頗具發展前景的Pipera區,佔據了環球價值大廈(Globalworth building)最高的三層。辦公室裏現代化的設備在搖搖欲墜的基礎設施中十分顯眼,卻沒有任何外部標誌顯示亞馬遜的存在。

  這項工作裏的大部分內容都很平常。波士頓的一名工作人員說,他爲“泰勒·斯威夫特”等特定話語挖掘了積累的語音數據,並對其進行了註釋,以表明搜索者指的是音樂藝術家。

  偶爾,這些工作人員會聽到Echo的主人可能比較隱私的內容,比如,一個女人在淋浴時唱得很糟糕,或者一個孩子大聲呼救。當團隊在解析一個混亂的單詞時需要幫助或遇到一段有趣的錄音時,他們會使用內部聊天室來共享文件。

  有時他們會聽到令他們不安的錄音,或者可能是與犯罪有關的錄音。其中兩名工人說,他們聽到過他們認爲是性侵的錄音。當類似的事情發生時,他們可能會在內部聊天室裏分享經驗,以緩解壓力。亞馬遜表示,當員工聽到令人不快的事情時,他們有相應的程序可以遵循,但兩名羅馬尼亞員工表示,在這樣的情況發生後他們想尋求指導時,卻被告知這不是亞馬遜的工作。

  一位亞馬遜發言人在一份電子郵件聲明中表示:“我們會嚴肅對待客戶個人信息的安全和隱私。爲了改善用戶體驗,我們只標註了一小部分Alexa語音錄音樣本。例如,這些信息可以幫助我們訓練我們的語音識別和自然語言理解系統,從而使得Alexa可以更好地理解您的請求,並確保服務對每個人都有效。”

  聲明中還說,“我們有嚴格的技術和操作保障措施,對濫用我們系統的行爲採取零容忍政策。員工不能直接訪問作爲此工作流一部分的個人或帳戶標識信息。所有信息都被高度保密,爲了保護這些信息,我們使用多因素身份驗證手段來限制訪問、加密和審覈我們的控制程序。”

  亞馬遜在其營銷和隱私政策材料中沒有明確表示,一些人正在監聽Alexa收集的對話錄音。該公司在一份常見問題列表中表示:“我們利用您對Alexa的要求來訓練我們的語音識別和自然語言理解系統。”

  在Alexa的隱私設置中,該公司允許用戶在開發新功能時禁用語音記錄。根據彭博社查看的截圖顯示,發送給Alexa審計員的錄音不提供用戶的全名和地址,但是卻與賬號、用戶名和設備序列號相關。

  外媒在今年早些時候曾報道稱,亞馬遜旗下Ring公司的員工通過在公司門鈴攝像頭拍攝的視頻人工識別車輛和人員,據說這是爲了更好地訓練該軟件自己獨立完成這項工作。

  密歇根大學教授Florian Schaub在研究了與智能揚聲器相關的隱私問題後說:“你沒有必要總是想着有另一個人正在監聽你在家裏對你的智能揚聲器說了些什麼。我認爲,我們已經習慣於這樣一種假設,這些機器只是在進行神奇的機器學習。但事實是,這項工作仍然需要包含人工處理的部分。”

  他補充說道:“這是否屬於隱私問題,取決於亞馬遜和其他公司對他們人工標註的信息類型的謹慎程度,以及他們如何向他人呈現這些信息。”

  自2014年Echo問世後,亞馬遜的圓柱形智能音箱使得語音軟件在家庭中的使用迅速普及。不久後,Alphabet 公司推出了自己的版本“谷歌Home”,隨後是蘋果公司的HomePod。在中國也有許多公司銷售自己推出的類似設備。根據研究機構Canalys的數據顯示,去年全球消費者購買了7800萬個智能揚聲器。還有數百萬人使用語音軟件與智能手機上的數字語音助手進行互動。

  Alexa軟件被設計成聽到一個喚醒詞後連續錄製音頻片段。喚醒詞默認是“Alexa”。但人們可以將其更改爲“Echo”或“computer”。當檢測到喚醒詞時,Echo頂部的光環會變爲藍色,表明該設備正在記錄並向亞馬遜服務器發送一條命令。

  大多數現代語音識別系統依賴於模仿人類大腦的神經網絡。該軟件通過在大量數據中發現模式來學習。驅動Echo和其他智能揚聲器的算法使用概率模型來進行有根據的猜測。如果有人問Alexa附近是否有希臘餐館,算法就知道用戶可能在尋找一家餐館,而不是教堂或社區中心。

  但有時Alexa也會弄錯,尤其是在處理新的俚語、地區口語或英語以外的語言時。在法語中,avec sa的“with him”或“with her”會讓軟件誤以爲有人在使用Alexa wake這個詞。Hecho在西班牙語中表示事實或行爲,有時被誤解爲Echo。這就是爲什麼亞馬遜招募人工助手來填補算法所遺漏的空白。

  蘋果的Siri也有人工助手,主要負責判斷數字語音助手對請求的解釋是否與用戶所說的相符。根據蘋果的一份安全白皮書所示,他們審查的錄音缺乏可識別個人身份的信息,並與隨機標識符綁定存儲6個月。在此之後,數據將被剔除隨機識別信息,但可能會被存儲更長時間,以提高Siri的語音識別能力。

  該公司說,在谷歌,一些評估人員可以從谷歌語音助手那裏獲得一些音頻片段,用來幫助訓練和改進產品,但它與任何可識別個人身份的信息都沒有關聯,而且音頻是失真的。

  亞馬遜最近發佈了一份招聘啓事,爲布加勒斯特的Alexa數據服務公司招聘一名質保經理。招聘啓事裏對工作內容這樣描述:“每天Alexa都要聽成千上萬的人談論不同的話題和不同的語言,她需要我們的幫助來理解這一切。這是你從未見過的大數據處理。我們每天都在創造、標註、策劃和分析大量的語音材料。”

  據一位知情人士透露,亞馬遜對語音數據的審覈過程始於Alexa隨機抽取一小部分客戶語音記錄樣本,並將音頻文件發送給遙遠的員工和承包商。

  一些Alexa審覈人員的任務是轉錄用戶的命令,將錄音與Alexa的自動記錄進行比較,或者對用戶與機器之間的交互進行註釋。這個人問了什麼?Alexa是否提供了有效的響應?

  另一些人則記下偵聽器所聽到的一切,包括背景談話,即使是在孩子們說話的時候。有時偵聽器會聽到用戶討論諸如姓名或銀行信息等私人細節。在這種情況下,他們應該勾選一個表示“關鍵數據”的對話框,然後他們進入下一個音頻文件。

  根據亞馬遜網站上的說法,除非Echo檢測到喚醒詞或按下按鈕激活,否則不會存儲音頻。但有時Alexa似乎在沒有任何提示的情況下就開始錄音了,音頻文件以刺耳的電視聲音或難以理解的噪音開始。無論激活是否錯誤,審覈人員都需要對其進行轉錄。其中一名知情人士說,當Alexa沒有收到喚醒命令或意外觸發時,審覈人員每人每天都會錄製多達100段錄音。

  據兩位評論人士說,在世界各地的家庭中,Echo的主人經常猜測誰在偷聽。他們會問Alexa :“你是爲國家安全局工作嗎?Alexa,有人在聽我們說話嗎?”

相关文章