最近發現今日頭條總是能精準推薦平時對話中的內容,且並沒在手機上輸入或搜索過。看了下應用許可權,今日頭條安裝後是默認要訪問麥克風許可權的!請教高手們,有人察覺過嗎,有什麼證實的方法?


最新更新,最近看到一個資訊,要竊聽聲音數據,已經不需要麥克風許可權了

(我後面有分析,你看完如果覺得有道理,幫忙頂到前面去,不要讓排在前面的雞湯三好學生的回答誤導其他人)

以下是我原來最早的回答

*******************

極可能是一些安卓手機才會發生這種現象,ios用戶,或者部分乾淨的安卓手機用戶可能難碰到,有些人會覺得這是陰謀論,覺得很可笑,但是,有陽光的地方就會有黑暗,不要扯那些正義的雞湯文,覺得到處都是陽光,你們沒碰到,不還原別人的使用場景,就強行解釋,一樣很搞笑啊,不要扯什麼演算法,你不能給別人推薦的數據有一部分是程序推薦的,就說自己所有數據都是算出來的。平心而論,不管是誰經歷了這個聊啥推啥的過程,都會懷疑啊,不懷疑才是奇怪的人吧?

首先在技術上這個一定可行,這個語音轉文本提取關鍵字已經很成熟了,類似的智能音箱這種模塊不就是這樣么,它不先分析語音解析你的指令,它能知道你在喊它嗎?所以安卓手機只在特定使用場景收集碎片的語音進行分析(不需要存儲你的錄音),只分析檢出關鍵字文本就可以了,流量又不大,功耗也可以不那麼誇張,如果再加上一定的條件控制(比如只在某些時間段,當手機周圍聲音達到一定等級,也就是手機足夠靠近聲音源時,才觸發第一層收集分析,判斷是否要展開後續操作),功耗就可以更低了,而且這些功耗,對於現在安卓手機一天兩充甚至三充的也算不了什麼,所以這更像是一個利益問題,而不是技術問題,打個比方,蘋果的siri,你在激活她時,她不一樣可以隨時分析你的語音轉成文字嗎?你連續玩siri一段時間,功耗能有多大?問題是蘋果沒有越界激活Siri而已,所以根本就不是什麼技術的原因,而是對方有沒有這麼做的問題,這個問題如果換到各個許可權鬆散的安卓手機上,那就是另一碼事了,這些手機上的什麼airi,biri,ciri們可不是吃素的。

那麼第一個問題:頭條有沒有竊聽?

我覺得沒那麼簡單,應用層的大app自身這麼做容易被逮住,它的數據可能來自一個中介大佬,這樣它既可以肆無忌憚的分析你,出了問題又可以及時脫身,實際上很多人反映不光是頭條有這個現象,甚至知乎,美團,淘寶都能碰到,而且就算你把那些app麥克的許可權禁止,你會「驚喜「的發現,他依然能命中你的語音關鍵字。

首先,這事我自己就經歷過,幾年前我買了一部國產某安卓手機,下了個頭條,有段時間裡面經常出現聊的東西被推送出來,而且當時手機待機時發熱很明顯,放在褲兜里都能感覺到發熱,(當然發熱也可能是電池問題),有時候還給我推過我同事聊天的內容僅僅是因為他們聊天的時候,我在他們身邊刷新聞,全程我都沒開口,這個真的很神奇,這也是我懷疑的開始,後來我把頭條的所有許可權都關了做測試,基本也是聊啥推啥,聯想到現在的app之間都有數據互通之類的,可能數據來源是其他地方,畢竟大公司這麼搞風險也大,然後我把除了頭條之外的app都卸載了,發現依然沒啥影響,所以我覺得是有其他進程在通過這種方式得到用戶聊天關鍵字,然後會將用戶畫像賣給別人(比如賣給一個中介廣告聯盟,中介大數據公司之類的),然後其他app會從這個中介購買一些數據服務,這樣的話,其他app也不知道這數據是怎麼產生的了,這些app,只是和這個中介有業務往來而已,這個層面上看,他們都是正正規規的,所以就是這個未知的中介有問題了。當然,這個中介可能有一些數據源,是良心開發者通過各種深度演算法來側面推出用戶畫像,但是我想說的是,演算法再強也比不過簡單粗暴的直接分析提取關鍵字那麼快捷有效了,這就好比你隨機遇到個路人,聊了隨機幾個新話題,你演算法推測能有直接提取關鍵字准?

很多app有自己獨立的推薦演算法,這是真的,但這種千人千面的技術也是基於源數據進行分析的,混合推薦的時候,你不能說有80%數據是演算法預測的,就聲稱所有推薦都是演算法預測的,這明顯是拿你當白痴小白看待啊,源數據里既可以是自己內部app產生的常規推薦數據,也可以是外部業務合作得到的數據,外部數據源再追蹤下去,你們能保證沒有鬼嗎?所以,別讓所謂的技術名詞給唬住了,你明明在瀏覽器搜索了一個東西,結果其他app馬上推薦了這個東西,你還要強行告訴自己這是高深的演算法推算出來的嗎?

第二個問題:哪些進程有那麼高那麼自由的許可權?

我個人覺得要麼是安卓系統被廠商定製後加的進程(優先順序非常高,根本不受用戶控制,而且可以駕馭在後裝的app之上),要麼是手機中了流氓病毒後產生的流氓進程,我之前說的那個手機,我恢復出廠設置後,只裝一個app然後把所有許可權禁止後,依然是聊啥推啥,然後我對這個手機進行抓包,捕捉這個手機所有請求,發現待機狀態下依然一大堆請求發送出去,亂的一匹,怪不得待機也發熱,看到心裡都發麻,其中就有一個頻率非常高的請求,連介面名字都有一個voice這樣的單詞,但是內容加密了,所以要提供啥證據的話,那還真沒有,只能說是懷疑吧,到底是中病毒還是怎麼樣,鬼知道,那手機後來我就不用了,手機品牌我就不說了,比較小眾,幾年前的某一代手機,安卓4的系統改的。

後來我換了安卓原生系統手機,8.1版本升到9了,對原生系統抓包,沒裝app狀況下乾乾淨淨的幾乎沒有啥請求發出去,心裡舒坦了很多,4G內存和3000毫安時電池兩年了一直很抗干,認真的想想,前些年那麼多手機廠商敢拼價格搞安卓手機,你們的目光都在那些低價高配的硬體的時候,人家可能只是想通過低價銷售硬體先佔據你的手機流量第一入口而已,賣硬體一次性掙的那些錢不是重點啊,重點是往後慢慢用軟體來hold你羊毛,得流量者得天下,所以啊,當你超低價買到一個所謂高配的手機時,也別開心的太早,多想想為什麼,如果它給你6G運行內存,開機本來也就需要2G左右,但是它們開機就給你飆到接近4G,你不覺得很可怕嗎?這些多加進程到底在做什麼,真的是僅僅在優化你的手機?

最後,以上都是推測,不是能100%確定的事實,到底有沒有這種進程在語音分析收集關鍵字,我覺得每個人看法不一樣,我也是高度懷疑而已,感覺這是個利益問題,我自己也看到過很多這種亂收集數據的事情了,之前一個同事跳槽去了家新公司,他們開發的安卓app,後台會默默的把用戶的通訊錄打包上傳,因為他們老闆就是這麼要求的,不過他們沒多久就倒閉了。還有很多例子,我就不一一列舉了,總之,數據這東西,你想要完全的隱私,很難,可能國外也好不到哪去,只是程度不同而已,有些事你知道存在就好了,因為普通人確實也改變不了啥,很多醜像不是不存在,而是缺少一個引爆點,就好比當年的百度莆田系黑醫事件,當時肯定會有三好學生說什麼,大公司怎麼可能這麼搞啊,風險多大啊之類的,實際上,丑象就是存在,只是缺少一個引爆點引起相關部門注意而已,我們現在的聲音對這件事影響太小,大家知道就好了,這個問題將伴隨我們的生活很久很久,直到發生一件足夠大的事情來規範這種行為,如果這件事沒發生,這個現象就會一直存在。

所以,這不是可不可以實現的技術問題,而是會不會發生的利益問題,這個世界必然是規範和不規範並行的,有陽光自然會有黑暗,別盲目相信陰謀論,但也別盲目的扯什麼陽光雞湯文,世界上哪有什麼純粹的東西,有利益牽扯的地方永遠都不會簡單,先做流氓考慮商業利益,做大後再洗白的公司,你們見得還少么,他們不存在嗎?


這種都市傳說類的互聯網謠言最近又在傳播了,但這真的是假新聞,因為在當前的技術條件下,大企業這麼做的性價比非常低。

首先要澄清的是,幾乎所有頭部互聯網企業,都會根據用戶的不同行為去針對性的推送不同的內容, 行內一般稱之為「用戶畫像」「精準推送」。

舉個例子,當淘寶識別出你是年輕女性的時候,它自然會將你打開淘寶時首頁展示的廣告位,換成年輕女性更願意購買的護膚品或者衣服,而不是汽車和剃鬚刀。

這種技術叫「千人千面」,是市面上幾乎所有電商都會使用的技術:針對不同屬性的人群,展示不同的內容。這樣做的好處是可以提升用戶購買商品的轉化率。

再比如我們刷抖音的時候,會發現當我們刷得越久時,抖音給我們推薦的內容就越是「有趣」。因為我們之前使用抖音時產生了許多行為數據---比如給某類視頻集中點贊、評論,在某類視頻下停留時間很長---這些行為數據會幫助APP進一步分析我們自己的喜好,數據積累得越多,它推薦的精準性就越高,所以才有這樣一句話:

互聯網產品往往比我們更了解自己。

簡單總結一下就是,互聯網產品的確會根據我們既有的數據,給我們精準推薦不同的內容,這種內容可以是商品、新聞、廣告等等。

並且,他們獲得我們的既有數據的來源,一定是我們在APP上自己主動或被動填寫的數據(比如年齡、性別、手機型號、地理位置),或者動作行為數據(比如看過哪些內容、點擊過哪些按按鈕)。這類數據搜集起來比較容易,並且很好解析和處理。

但是,如果有人說這些產品要通過「監聽」的手段來獲得我們的語音數據,就有點聳人聽聞了。因為企業這麼做的性價比太低了:

第一,獲得這些數據的難度很大。

客戶需要授權語音功能(否則會有法律風險),然後企業還需要具備「語音-文字」的精確轉化功能和語義識別技術,這兩個技術當前都是很難實現100%精確的。除此以外,我們每天產生的語音內容如果都被企業監聽並搜集下來,這本身會佔據巨大的儲存空間,也是一大技術難題。

第二,獲得這些數據的風險很高

雖然很多大佬說中國人對隱私不太在意,但是最近因為各種事件的出現,讓我們用戶對於隱私保護開始注重起來。比如2019年2月份,京東金融就因為誤截取了客戶的敏感圖片信息而被曝光進而道歉。

連截圖客戶圖片都會被抓住並道歉,可以想像如果哪家企業敢繞過授權來「24小時監聽」用戶,會受到什麼樣的批評和處罰。

關於監聽的風險和難度,也可以從稜鏡事件中得知一二:2013年,前CIA職員斯諾登爆料美國國家安全局有一項代號為「稜鏡」的秘密項目,要求美國電信巨頭每天上傳數百萬用戶的通話記錄,以及進入微軟、谷歌等互聯網巨頭的伺服器,從而監控美國公民的聊天記錄、音視頻等信息。

稜鏡事件曾震驚全世界,但是從事件細節中可以看出,即便是全球最強力的組織:美國政府,也只能做到監聽數百萬用戶的通話記錄,而非全民監聽。對於公民在互聯網上留下的通信記錄,也是對主動發起的通信行為產生的數據進行監控,比如用戶電郵、聊天記錄、視頻、音頻、文件、照片等上網信息,而不是對所有用戶、隨時隨地、24全天候的靜默監聽。這兩者之間,所需要處理的數據量,有著天嚷之別。

連稜鏡計劃都沒辦法做到全民全天候的監聽,對於用戶數量上千萬甚至上億的淘寶、頭條這種國民級APP,讓他們用一家企業的力量對這些海量用戶,進行24小時不間斷的語音監聽,其實是不可能完成任務。

同時稜鏡計劃曝光後所引發的輿論風暴,是連美國政府都難以抵禦的,可以想像如果哪一家企業要進行類似的監聽行為,是會冒著直接倒閉的風險的。

所以目前看來,國內的企業根本不可能冒著如此大的道德和法律風險去監聽客戶。

第三,利用監聽獲取的收益太小。

即便企業拿到了我們日常的通話語音內容,他們還需要從天量的語音內容中抽取出那麼一點點用戶商品偏好的信息,才能夠給用戶做精準推送。

花這麼大的工夫,就為了給你推送一篇文章,還讓你覺得很「驚悚」,我不知道多傻的產品經理才會這麼做。

為了24小時監聽你,他們需要冒著被你發現並捅到網上的風險、還要避免因為監聽你而讓你電池耗費的太快、還要留個巨大的處理器來處理你夾雜著口音和路邊大媽買菜討價還價的雜音,然後終於知道原來你喜歡skii而不是雅詩蘭黛,這難道不是得不償失嗎。

與其繞這麼一圈去監聽你,他們還不如通過更加簡單的方式,比如你在軟體上的行為數據,來得更加方便。


我也是真的希望現在的科技能這麼發達,隨便和朋友聊幾句方言,它這邊都能給我分析出來是幹啥的


陰謀論總是會受到大家的歡迎,這個一直以來都是這樣。所以有些人才會一直傳播朋友圈裡的那些謠言啊。


稍微具備一點科學素養的人,都不會相信這個。如果APP真的實時監聽語音,那你的手機一天至少充五次電了,而且還不知道要花費多少流量。


推薦閱讀:
相关文章