“外賣App到底有沒有在偷聽?”

  3月18日,我們發佈的《隔屏有耳,記者耗時3個月測試,美團餓了麼是否在“偷聽”?》引發熱議。更多人提到,除了外賣App,電商類、資訊類、音樂類等App都曾出現疑似“偷聽”現象,其中,生態圈模式最爲完整的阿里系被吐槽最多。

  數據來源:3月19日國內14家主流媒體的微博、微信評論,僅供參考

  但也有網友提出質疑,認爲在線“偷聽”的數據量過大,App和手機都無法承受如此巨大的計算量,“巧合”很可能是基於現在互聯網公司強大的大數據計算和推薦。

  來自雲計算、語音識別、白帽子等多個渠道的專業人士向《IT時報》記者證實,通過授權的麥克風“監聽”,並不需要太高的技術門檻,甚至在無網絡的情況下都可以實現語音輸入,也無需實時上傳,只要觸發某個關鍵詞後,再提取文本併發送雲端即可。

  澎湃新聞的一篇報道中甚至提到,有技術團隊僅用了不到5個小時,便在技術層面實現了App鎖屏時在後臺仍可以“監聽”用戶講話內容。

  疑問一:數據大成本高,吃力不討好?

  專家答:不存在大數據量

  3月21日,澎湃新聞在《團隊自編程序證實手機能偷聽,安全專家:未發現“偷聽”鐵證》一文中展示了網絡尖刀創始人曲子龍和他的人工智能團隊進行的一場測試,僅用了不到5個小時,通過程序員編寫示例代碼,模擬打造一款手機軟件,安裝在一部安卓系統手機中,再設置爲允許該模擬軟件使用手機錄音權限,然後將手機屏幕鎖屏。

  結果,該款模擬手機軟件成功獲取了曲子龍團隊的講話內容,並傳輸給後臺服務器轉化成文字信息。

  簡單來說,就是曲子龍團隊從技術層面實現了App鎖屏時在後臺仍可以“監聽”用戶講話內容。

  也有網友質疑,語音數據量巨大,能耗高,“偷聽”用戶的成本太大,這降低了App“偷聽”用戶的可能性。對此,曲子龍在視頻中表示,可以把需要觸發的詞做個庫留在App上,用戶講話內容一旦觸發特定的詞,便會喚醒這個應用開始監聽及分析,以此降低能耗。

  國內知名白帽子公司KEEN GeekPwn實驗室宋宇昊認爲,APP完全可以將麥克風聽到的語音在上傳之前先轉換成文字,這已經是很成熟的技術。然後通過在文本里提取關鍵詞發送雲端,在雲端分析文本特徵,並和用戶身份關聯,給你精準畫像,在大數據時代,這些技術都是相當成熟的。實際上,通過App語音輸入的方式,在本地將語音轉換成文字,上傳的只是幾個標籤,完全不存在大數據量的問題。

  “將一個人一天講的話處理成文本,也只有幾頁紙。如果採用關鍵詞喚醒,數據量還會大大降低。將語音處理成文本的技術並不高級,現在很多輸入法都能做到。”貴陽大數據交易所執行總裁王叄壽也持同樣看法。

  不過,宋宇昊也強調,儘管技術上是可以做到的,但從目前觀察來看,無法對App是否“偷聽”做出結論。

  未來技術的發展將進一步降低“偷聽”的成本。

  事實上,早在20世紀90年代,用於離線語音輸入的PC客戶端軟件就已經出現。宋宇昊指出,隨着近些年人工智能的發展,這一技術已經非常成熟,可以不依賴網絡在手機中流暢地輸入,甚至,一些語音輸入的App可以在手機離線無網絡的情況下實現語音輸入。

  “1分鐘的音頻,只有100ms(毫秒)的延遲。”科大訊飛的技術專家說道。按現在的網速和機器性能,以上的操作可以認爲是實時完成的。

  同時,隨着邊緣計算越來越成熟,“偷聽”的成本還將大大降低。

  一位大數據技術專家向《IT時報》記者闡釋,邊緣計算可以解決傳輸成本、存儲成本及雲端搜索等問題,但技術難點在於離線計算的準確率。

  這並非憑空猜測。據上述專家介紹,在車險行業,車險服務商已經推出基於駕駛行爲的保險,通過內置攝像頭的行車記錄儀和邊緣計算+面部圖像識別技術,系統能夠捕捉駕駛員打哈欠、閉眼、打電話、抽菸等異常動作,這些數據都將用來做車險的風控模型,比如保險人的保費測算,而數據源是車內攝像頭拍下的視頻,通過邊緣計算,可以大大降低數據上傳量。

  近兩年,AI手機概念漸成主流,隨着手機的算力越來越強,計算都邊緣化了,不需要雲端計算的過多參與,那麼,“偷聽”這種技術成本就越來越低了,而且這個未來並不遙遠,“在現在的終端成本上再增加1000元左右,就能支持邊緣計算。”一位技術專家對《IT時報》記者展望。

  疑問二:沒開權限,如何“偷聽”?

  專家答:數據共享普遍存在

  “在同一生態裏,底層數據庫都是共享的。”王叄壽說道。

  3月15日,恩惠(化名)與同事們正在討論共享電單車電瓶回收的事情,10分鐘後,她打開了閒魚,卻突然看到了滿屏的電池、電瓶、逆變器以及二手電瓶車轉讓信息,此前,她從未在閒魚或淘寶上搜索過相關商品。恩惠懷疑閒魚在“偷聽”自己,可打開設置一看,閒魚、淘寶的麥克風都是關閉狀態,但阿里系App中的高德地圖麥克風是開啓狀態。

  爲了進一步測試是否巧合,恩惠和同事們開始討論AirPods,過了一會,刷新後的閒魚首頁變了,二手AirPods開始出現在推薦位。“細思極恐”的恩惠關掉了高德地圖等所有阿里系App的麥克風權限。

  上海市軟件評測中心的工程師從技術上向《IT時報》記者解讀了數據如何共享,一是通過爬蟲跨網站追蹤用戶信息,二是App之間採用同一個SDK開發,或雙方開放數據接口發送數據包,實現共享。

  也就是說,可能存在的情況是,A雖然沒有獲得用戶的麥克風或者讀圖權限,但是完全可以通過有權限的B獲得的信息,實現數據共享。這一點,從這些App的隱私協議中可見端倪。

  《IT時報》記者在查看了近20款主流App的個人隱私協議後發現,超過95%以上的App都會將自有用戶個人信息共享給第三方或合作伙伴。比如,淘寶網隱私權政策中提到,“爲便於我們基於淘寶平臺賬戶向您提供產品和服務,推薦您可能感興趣的信息,識別會員賬號異常,保護淘寶網關聯公司或其他用戶或公衆的人身財產安全免遭侵害,您的個人信息可能會與我們的關聯公司和/或其指定的服務提供商共享。”

  “同時,我們在使用阿里系其他App時,淘寶網也會從關聯公司接收、彙總、分析用戶的個人信息或交易信息。”

  在《IT時報》的另一篇報道,《到底是誰出賣了你的隱私?315晚會沒曝光大廠,我們敢!》一文中記者指出,互聯網巨頭們不僅在自己的生態圈裏共享數據,還會向生態圈外的公司分享用戶畫像,只要用一個手機設備號(IMEI碼),就可以在廣告聯盟間追蹤用戶的標籤,用以精準投放廣告等。

  除了數據共享、用戶畫像服務外,還有很多公司打着大數據的幌子進行數據交易。據《IT時報》記者瞭解,一幅包含公積金、微信餘額、淘寶購物記錄、通話記錄等數據畫成的用戶畫像被“貸款超市”以50元的價格售賣,美其名曰“風控”。另一頭,大數據公司又從廣告主那拿到了廣告費,註冊一個用戶,廣告主給10元,一次點擊給0.8-1元,千次展示給15元。

  疑問三:說方言能防“偷聽”?

  專家答:人工智能可識別20多種方言

  有用戶質疑,當下人工智能還很“傻”,智能音箱等硬件常常無法和人自然互動,手機上的App真可以聽懂我說話嗎?

  3月18日,阮女士與同事在聊天中提起菠蘿與鳳梨的區別,隨後無意打開百度App,就在首頁看見了“菠蘿和鳳梨的區別”的推送。

  “打開百度就是想找找答案,可沒想到還沒搜索,App就自動推送了答案,而此前也從未搜索過任何關於菠蘿和鳳梨的關鍵詞。”據阮女士回憶,在與同事討論時,手機並未打開手機百度App,在手機的隱私權限中也並未給百度App開放語音權限,到底百度爲何如此“聰明”,她並不知道原因。

  陳女士也有類似遭遇。一天在與長輩一起吃飯時,聽長輩們聊起開幼兒園話題,當天晚上,陳女士打開百度App,便看到了關於“開辦私人幼兒園”的內容。陳女士告訴《IT時報》記者,當時長輩們聊天的時候,她並沒有參與,只是在刷微博和淘寶。

  目前聽懂人類說話,人工智能要經歷語音識別和語義分析兩個階段,在語音識別階段,國內相關公司已經做得相當精準,也就是所謂的將語音轉化爲漢字,準確率超過97%,拿科大訊飛來說,目前支持中、英、日、韓、俄等約10種語言的語音識別,訊飛輸入法支持23種中國方言識別。

  技術難度在語義分析階段,需要系統根據用戶數據進行智能分析,並進行精準的推薦,但國內幾大人工智能公司,目前技術進步也非常快。

  多位行業人士認爲,就當前的技術水平而言,讓人工智能聽懂,提取關鍵詞並打標籤,也就是完成語音識別的難度並不大,然後在雲端完成語義分析,這已經是成熟的技術。

  企業迴應

  百度:沒有能力監聽電話

  阿里:截至發稿,並無迴應

  對於這些用戶提出的質疑,百度迴應《IT時報》記者稱,不論蘋果系統還是安卓系統,從保密用戶隱私角度出發,絕對不可能爲 App 開放或者設計這樣的 API 接口,百度的手機應用沒有能力、也從來不會申請所謂的“通話監聽”這一權限。

  然而,儘管“通話監聽”這個權限沒有被申請,但對於麥克風權限的開啓,無論安卓還是蘋果,百度都可以申請用戶授權。不過,百度對此解釋,只有用戶主動開啓語音喚醒功能,纔會開啓麥克風,也就是說,喊小度小度,調起搜索才能開啓麥克風使用權限,而且當百度App切到後臺後,麥克風權限便會關掉。

  截至20日晚八點記者發稿,阿里尚未迴應是否存在利用生態系統內某個App的麥克風權限獲取關鍵詞,爲用戶精準推送的情況。此前,餓了麼曾在本報第一篇文章中迴應,不存在“偷聽”,餓了麼既沒有做類似的產品設置,也不具備相關技術條件,餓了麼嚴格保護用戶隱私,任何必要的信息採集都會在取得用戶事先同意的前提下進行,在合法合規的範圍內使用。

  記者手記:

  請你不要比“我媽還懂我”

  從外賣軟件到互聯網生態系統,到底這些App有沒有“偷聽”用戶,是個“羅生門”。

  儘管從技術層面來看,利用現已成熟的技術就能簡單地從用戶的語音裏抓取關鍵詞,並進行精準推送,這事並不難,但究竟App是否在偷聽,我們依然無法下論斷。

  如今,互聯網公司大多將上傳的數據進行加密,如果想解密,不僅成本、技術門檻高,其中也存在一定法律風險,因此很難抓到“現行”。

  但通過幾個月的持續觀察、大量的用戶統計、場景復現測試,以及大數據共享的廣告聯盟追蹤、App隱私協議探究,我們想要說明的是,無論是“偷聽”“偷看”還是使用所謂的“大數據畫像”,都已經在觸碰用戶隱私保護的底線,這也是爲什麼第一篇文章引發全網激烈討論的原因。

  最近幾天,因爲關掉不少權限,記者發現,不少App似乎沒那麼“懂我”了,我們不知道原因是什麼,但這總是一個令人欣喜的現象。

  因爲,比我媽還懂我,意味着,作爲個體,我已經失去自由。

  編輯:挨踢妹

  圖片:東方IC、網絡

  來源:《IT時報》公衆號vittimes

相关文章