在家中百無聊賴找不到人聊天時,跟智能產品里語音助手尬聊,應該是很多人都有過的經歷。不過一些用戶對智能音箱說的悄悄話,也有可能被人類聽到。

  最近彭博社消息

  顯示

  ,亞馬遜在全球僱傭了數千名員工,他們會聽到某些來自 Echo 智能音箱的用戶語音請求,並負責將這些轉錄的語音進行註釋標記,以提高 Alexa 對人類語言的識別功能。

  這些員工分佈在波士頓、哥斯達黎加、印度、羅馬尼亞等地,有亞馬遜員工也有外包人員。其中有羅馬尼亞布加勒斯特的工作人員表示,他們每天需要工作 9 個小時,每一次輪班都需要爲超過 1000 個音頻進行解釋標記。

  還有一個在波士頓的語音標記員表示,他曾經爲特定的詞語,比如泰勒斯威夫特(Taylor Swift)積累了語音數據,並將這些語音請求指向音樂藝人。

  對此,亞馬遜的迴應是,這是會涉及很小一部分 Alexa 的錄音,目的是爲了改善用戶使用智能語音助手的用戶體驗。這些錄音都會被嚴格加密,員工在標記語音的過程中,並不會知道這些錄音的具體來源。

  亞馬遜在隱私政策中並沒有明確提示,有人會收聽 Alexa 所收集的語音,而是使用了另外一種表述「我們使用你對 Alexa 的請求來訓練我們的語音識別系統」。不過用戶可以在隱私設置中,選擇禁止設備向亞馬遜提供錄音以開發新功能。

  就目前而言,就算各類宣傳把語音助手、智能音箱們吹噓得功能強大,它們依然只是很初級的人工智能,最常用的功能還是唱歌、尬聊、問天氣。

  語音助手要想「掌握」一門語言,需要解決兩個問題:聲音識別和聲音合成。其中聲音識別是向機器輸入信息,又分爲兩步,分別是:

  第一步,將語音轉成文字的語音識別;

  第二步,語義理解,這裏就需要用到自然語言處理技術

  密歇根大學的學者 Florian Schaub 認爲,人們也許並不會留意到,自己跟語音助手說的小祕密可能會被其他人聽到,而覺得這些設備都在進行神奇的機器學習。事實上,現階段的這些技術依然需要人工的參與。

  市場分析公司 Canalys 的數據顯示,截止到去年全球共賣出 7800 部智能語音助手設備,另外還有數以千萬計的人與智能手機內置的語音助手對話。

  去年 9 月曾有人對比了蘋果、Google、亞馬遜這三家的語音助手,其中一個發現就是,它們在識別美式口音、印度口音的英語時表現不錯,然而在識別中式口音的英語時,蘋果的 Siri 和亞馬遜的 Alexa 的準確率則大幅下降。

  總的來說,要讓機器能夠聽懂人類語言,並且做出準確「聰明」的迴應,依然需要大量人工介入。如果想要把語音助手當做樹洞,也要注意保護自己的隱私信息啦。

相关文章