磕俏覀儜撛觞N辦,是抵抗還是順從?


大數據時代沒有個人隱私?

其實,我們都是大數據時代的狗

不知道有沒有人來生想做狗。反正我曾經有那麼一瞬間想過。靠賣萌混過一生,要吃有吃要喝有喝。我24小時各種體位霸佔客廳,鏟屎的每天天黑才爬回來,煮碗面看個片兒洗洗手倒頭就睡。這樣的生活一對比,我可能不是人,但他是真的狗。我決定坐在我家狗的墊子上體會一下。

從這個角度仰望電視還挺奇怪的,脖子疼。電視上正在播新聞:因為擔心傳染肺炎,有人直接把狗子從高樓扔了下去。

我決定不做狗了。舔狗最後一無所有,萬事靠人,最後恐怕生死大權也要拱手相讓。生殖隔離的物理世界,人當然不會成為狗。不過就在隔壁的網路世界,科技卻在把人一點點變成「狗」。這種過程隱秘而緩慢,就像一度一度升溫的水,一下一下遊動的青蛙。

一、大腦探針你見過電影里演的那種,在腦袋上貼滿電極的景象嗎?

這種電極的作用就是感受微弱的腦信號,從而探測到你此時此刻是餓還是渴,想狼還是想娘。

普通人雖然沒有整天帶著電極出街,但是你的所思所想,其實都在被人用另一種更準確的方式探測。舉個栗子:你刷淘寶時,輸入了什麼關鍵詞,選了哪個商品,在頁面停留了幾時,付款前猶豫了多久,沒買的話是在哪一步放棄了購買,這些信息,無一例外都被阿里巴巴感知到。你刷抖音時,雖然感覺上是漫無目的的瀏覽,但是抖音卻可以記錄你在某個視頻里停留了多久,是看到結束還是中途退出,點贊與否,評論幾何。你看,你的大腦就像一個黑盒子,站在對面的人,還真未必知道你在合計著什麼猥瑣計劃;而 App 通過特定姿勢和你交互,千里之外就能精準窺探你的思維邏輯。我把這種操作稱為大腦探針。

《發條橙》

一根鋼針,通過你的眼睛,直接刺入你的大腦深處。鋼針背後的信號,通過光纖傳遞到巨頭們的伺服器里。探針像個注射器,可以「抽血」,也可以「輸血」——不僅能窺探你的思想,還能把你喜歡的東西放到你面前,讓你唾手可得。看看你淘寶里的商品推薦吧,它肯定比你媽,甚至比你自己更了解你的需求。看看抖音里小姐姐笑得多甜,讓你明知道自己此時應該睡覺,身體卻如老驥伏櫪,還能再戰。第二天你腫著眼睛上班,在擁擠的地鐵里,自己埋怨自己不爭氣,怎麼意志力弱得跟個狗似的。。。變成狗,就對了。mission,complete!

你可能會說:誰讓他們看我的數據啦?非禮呀強姦!有人管沒人管?

我得替這些大公司辯護一下:首先,沒「人」看你的數據,看你數據的,只有機器」。以今日頭條為例,你的閱讀記錄被收集到頭條的資料庫,直接上機器演算法流水線,自動匹配和你喜歡的文章相類似的內容,再推回給你。這套輪迴的所有動作,都是機器自動完成的。而頭條的工程師和產品經理,這些人既看不到,也不直接參与,也不關心你的「隱秘興趣」。其次,你記不記得,在剛安裝 App 的時候,你都會勾選一個《用戶協議》(有時候好聽一點叫《用戶體驗改善計劃》)。雖然完整看過《用戶協議》的同學數量基本是0,但這其中已經白紙黑字跟你「約定」好了,你要把自己的使用數據交給他們。你楊白勞是按過手印的。辯護完畢。你可以想像這樣一個宏觀場景。一個龐大的智能體,通過枝蔓縱橫的互聯網,在每個人的頭頂插了一根探針。愚蠢人類的所思所想所欲所求,都像電流一樣流進了那個母體。這像什麼?沒錯,就是《黑客帝國》。

《Matrix》

誰告訴你要建立一個「母體」,必須通過把人泡在水裡,把電極插進腦子這麼噁心心的物理方法?你每天活蹦亂跳自以為自由,其實已經像個刺蝟似的滿頭探針,通過互聯網連接著騰訊、阿里巴巴、百度、位元組跳動等等好幾個「母體」。

這裡中哥得澄清一下,雖然《黑客帝國》里的母體挺邪惡,但我倒不覺得我們世界的「母體」有多壞。這背後的一切是一個公平的交易:通過大腦探針,你把時間和金錢輸送給大公司,他們把你大腦想要的方便、快樂統統給你。貨真價實,童叟無欺。X完再罵XXX,這恐怕不太合適。況且,這個世界上,沒有人能僅僅依靠自己的力量活下去。而母體的本質是每個人讓渡自己的部分權利,從母體那換取相應的利益。如果從這個定義出發,「國家」也是「母體」的一種。你能說國家這種設定是邪惡的嗎?說遠了,肯定有人還不認同我的「歪理邪說」。你當然可以選擇像尼奧一樣吃下偉哥小藥片,逃離互聯網大公司們營建的母體,而且方法很簡單——長按 App,拖入垃圾箱。但是,這種操作這就像「減肥很簡單,只要不吃飯」一樣,絕大多數人根本做不到。如果你能做到,那我只能敬你是條漢子,你可以點擊左上角退出本文了。縱觀互聯網發展史,就是一部大公司傾盡全力發展計算力,發展人工智慧演算法,尋找在你腦袋上「再插一根針」的歷史。我橫豎睡不著,仔細看了半夜,才從字縫裡看出字來,滿本都寫著兩個字是「探針」。如無意外,沒人能阻擋大公司的母體越來越強大。

如今,一個中國人輕而易舉地每天拿起手機150次,醒著時候5分鐘一次。沒有人逼我,但我就是停不下來。我想到了一個故事。本來,原始人靠打獵為生,吃的都是山珍野味,每天出門兩個小時就能搞定全家的口糧,還有足夠平衡的鍛煉。一萬年前,地球氣候驟然降低,不容易打到獵物,只有儲存種子自己種才能養活家人。於是,大部分原始人都開始搞這種「高科技」——農業。然而,地球再次變暖時,人們卻發現自己已經生了太多孩子,出去打獵神馬的再也養不活自己了。新科技總是讓人作繭自縛,這還不是什麼新鮮事兒。如今,為了在生存和競爭中獲得優勢,人們親手讓渡了自己的數據。十幾年過去,人們接受了在網上吃瓜、玩梗、潮牌、追星、吃雞、直播,左邊畫個龍,右邊畫彩虹,生活方式興趣愛好整齊劃一。在數據面前成為狗,是我們戒不掉的癮,這世界正在變成大型 SM 現場。

二、「S」們的姿勢看過中哥寫的阿里雲這群瘋子的淺友,大概知道阿里雲的創世史。但是恐怕很多人都忘了,2009年阿里巴巴拼了命要研發這套巨型計算引擎是為了解啷個「燃眉之急」。跟著中哥回憶一下, 2012,阿里雲經過三年死去活來,終於橫空出世以後,迫不及待支持的第一個服務就叫做「ODPS」。別被這貨的英文名字蒙蔽了,它不是別的,恰恰是大數據計算平台。當時,淘寶已經開始了大規模數據計算。每天半夜到凌晨,淘寶的後台都會全速發動,把前一天的成交數據整理一遍,然後提供給各個賣家,讓他們參考數據優化自己的頁面設計、促銷計劃和廣告投放。(這種服務收一點費,很合理吧?)網上流傳著一張圖片,很有意思。

怪了,為什麼留學美國的李彥宏都覺得雲計算這個東西還不急,而鄉村教師馬雲已經挽起袖子開始幹了?說到底,這和幾個巨頭手裡掌握的數據性質有關係。(別看巨頭都有數據,但數據和數據可不一樣)中哥可以給你分分類,巨頭掌握的數據,可以從「結構化」和「身份化」兩個角度來看。解釋一下:結構化,是指數據可以填到表格里,就像通訊錄一樣規定了每個欄位屬性的那種數據。身份化,就是指數據背後能否對應到你這個真實的人。1)阿里巴巴的數據是「強結構化」+「強身份」的。淘寶,可以知道你購買物品的名稱、價格、購買時間、地址、電話。

支付寶,可以知道你的身份證、電話、付款金額,資金流向。

強結構化的數據處理起來是最簡單的,因為計算機在設計之初就是用來「算數」的,最適合處理比較規整的數據。數據挖掘帶來的利潤顯而易見,那些年阿里巴巴在電商領域一騎絕塵,數據分析肯定功不可沒。但是在2009年之前,阿里巴巴用以支持數據存儲和計算的主要是 IBM 小型機和甲骨文資料庫。這些都是進口貨,死貴死貴的。隨著對於計算越來越倚重,阿里發現一個問題:IBM 和甲骨文資料庫在面對超大規模計算的時候,性能劣化太TM嚴重,相當十分肯定完全對不起這個價格,這才有了用便宜的PC通用伺服器搭建一套計算系統——阿里雲——的衝動。實話實說,阿里雲的創立者王堅博士當初加盟阿里巴巴,目的不是做一個雲計算底層架構,而恰恰是為了做一個大數據平台,而為了做這個大數據平台,反而需要首先建立阿里雲。

王堅

阿里雲其實是個「大數據母體」的副產品。再說到「強身份」。一個人的姓名、年齡、住址、身高體重、生活作息等習慣這些數據,其實隱含了巨大的信息量。就像你看到一個年輕妹子,你會猜她大概率喜歡化妝品和包包;你看到一個肥宅,你會猜他喜歡零食和快樂水。大數據系統利用社會學的知識圖譜,把這些身份背後的隱含信息和搜索關鍵詞信息結合起來去做推薦,往往一發入魂。剁手上癮,豈能無緣無故。2)百度的數據是「強結構化」+「次強身份」的。大多數人在百度搜索的時候,不會使用整句,而是使用關鍵詞。關鍵詞對應的「索引」也是一種結構化數據。這裡多說一句,李彥宏的本科就是北大圖書情報專業,而圖書專業的核心知識就是如何科學地建立「索引」。所以他能搞出百度搜索引擎憑藉的是紮實的科學知識。百度從上線的第一天開始,關鍵詞數據就是核心資源,有了它,不僅可以做競價排名,還可以做廣告推送。

百度的第一場發布會

說到這裡中哥想到了一個趣事。2000年百度搜索引擎首次上線,用戶搜索的第一個關鍵詞是「張朝陽」,第二個關鍵詞就是一個羞羞的辭彙:「成人圖片」。我猜,如果百度開放成人網站的競價排名,那市值比現在要大無數倍。。。但是百度的關鍵詞數據卻不像淘寶一樣可以和具體人的身份精確對應。那是因為,你搜索一個關鍵詞,並不需要先登錄,更不需要填寫收貨地址。你不「自白」,百度就不知道你是誰。這個缺陷其實一直是百度心中的疙瘩。你還記得不,2019年百度和春晚合作,發了一次紅包。那時候,因為涉及到要領錢,必須讓用戶登錄,對應強身份,「年久失修」的登錄系統就承受了巨大的衝擊,差點掛了。然而,百度也並不是對於搜索者一無所知,因為他們可以採取一個「退而求其次」的技術,那就是採集你的「設備指紋」。啥是設備指紋?這裡稍微科普一下,每個設備都有一個獨特的識別碼,加上你的 Wi-Fi 信息,地理信息,基本可以給每個設備分配一個「身份證號」。這樣一來,雖然不知道設備背後的用戶姓甚名誰,家住哪裡,芳齡幾何,但是根據你的行為,能「蒙」出來使用這個設備的人大致年齡,是個有什麼愛好的人。

雖然沒有強身份數據,但是你一有困惑就會問度娘,但只有想買東西的時候才會上淘寶。所以百度這個「母體」的數據探針覆蓋會更廣。有人總愛基於「商業道德」唱衰百度,但其實看一下百度在搜索引擎中的份額,和它背後所對應的數據量,就不會輕易下這個結論了。3)騰訊的數據是「弱結構化」+「弱身份」的。人們在聊天工具里產生的數據,例如「QQ簽名」、「微信朋友圈」,是很隨性的,基本上沒有什麼規律,屬於標準的非結構化數據,用起來也是難度最高。但是你會問,中哥是不是說錯了?QQ、微信這類這都是實名制的聊天工具,怎麼還是弱身份的呢?這裡中哥解釋一下,根據相關法律,公民聊天內容是絕對的隱私,騰訊沒有辦法直接查看和利用你的個人聊天數據。騰訊只是金礦的看門人。。。然而,這裡有一個很巧妙的玩法——騰訊可以使用某些「頻率數據」。例如,機器可以根據數據輕易總結出:人們在微信朋友圈裡,說的最多的關鍵詞有哪些;在QQ上人們傳閱的文件里,有哪些頻率最高。在QQ瀏覽器上,有哪個網址最受歡迎。

於是,這類數據就和具體身份脫鉤了,成為了脫敏的「弱身份數據」。別看是「弱結構化」+「弱身份」,兩個弱,但是這類數據的量卻是非常龐大的。所以,騰訊不小心掌握了一種上帝視角的「超能力」——知道這個國家的人們每時每刻最關心的是什麼事情。這對於騰訊新聞、騰訊視頻之類的內容創作者來說都是非常有用的數據——他們可以根據大家關心的熱點來量身定製內容。你以為騰訊視頻這幾年後來居上,拳打優酷,腳踢愛奇藝,憑的僅僅是努力么?除此之外,騰訊還獲得了一些額外能力。啥能力呢?不是吹牛,通過輿論感知,騰訊經常比警察叔叔都能先知道哪個傳銷開始泛濫,還能知道哪個「老司機」 App 又開始招攬乘客,甚至還能八卦出哪個工廠在頂風作案偷偷排污。。。你可以了解一下騰訊發起的「守護者計劃」——每年騰訊都通過自己的獨門絕技給警察叔叔提供壞人的線索,好多這種利用QQ、微信傳播的非法勾當都是騰訊先打110報的警。(當年我手機上珍藏的一個老司機App就是被騰訊「告老師」的。你問我怎麼知道的?我去參加了守護者計劃的年度成果發布會,這個 App 就是成果之一。。。)

連人都抓了呀啊啊啊

意識到自己具有這種「感知輿論」的能力,騰訊乾脆和很多監管部門建立了合作,這種操作被他們稱為「大數據監管」,這生意,可不是別人想做就能做的。BAT 三家的大數據能力僅僅是個例子,你可以根據這種方法來套用其他公司,就能猜到他們在用大數據做什麼了。這裡我還想多說一句,從商業的角度講,大數據的用法其實有兩個方向:1、趨利——賺錢;2、避害——少賠錢。剛才說的騰訊「大數據監管」就是從「避害」的角度來使用大數據的。(當然主要是直接為社會「避害」,間接為騰訊自己避害。)其實,百度和阿里巴巴也在用各自的數據「避害」。這裡舉幾個例子。你可能知道「度小滿金融」,這是當年由陸奇從「百度金融」拆分演化出來的公司。理論上他們就可以用到百度的數據做「大數據風控」。例如,一個人如果在百度上搜索了好多P2P平台的名字,甚至搜索了「不還花唄會怎樣」之類的虎狼之詞,那麼系統就可以認定這個人的財務狀況很差,可以給他打一個風險很高的分數。這時,如果他來到平台借錢,那麼傻子才會借給他。。。再說阿里巴巴。阿里巴巴其實有一支非常強大的安全團隊,他們的日常就是用數據和智能來抵擋「羊毛黨」的進攻。他們利用大數據做人工智慧學習,知道了正常用戶的習慣,反之就能歸納出羊毛黨的行為有什麼反常之處。在阿里巴巴有一個神秘的系統,叫做「霸下」,它就像一個水壩一樣,圍在整個阿里帝國之外,羊毛黨、黃牛黨99%左右的流量都直接被霸下攔掉,保衛著「帝國」的安全。尤其在每年「雙11」,要不是有霸下,天貓的網站早就被羊毛黨上億的機器流量給衝垮了,巨浪滔天誰也別想剁手。

說了這麼多,其實中哥只是想給你展示一個圖景:1、大數據在保護你;2、大數據在你身上得利;3、大數據在給你提供更好的服務;4、大數據也在不知不覺限定你的行為。就像你和你家狗狗的關係。你細品品。2012年,被公認為大數據元年。這一年同樣也是「雲計算元年」,這一年也是智能手機快速普及的一年。現在回望,「人腦」把最高權杖讓位給「電腦」這個母體,大概也發生在這一年。從這個角度來講,瑪雅預言的「世界末日」也並非沒有道理。從這一年開始,幾乎沒有一家新成立的互聯網公司能夠逃脫被 BAT 等大公司收購的命運,因為在數據方面,大公司掌握了絕對的優勢,小公司螳臂當車,完全沒有勝算。看一下2012年以後騰訊的股價,錢不會說謊。

最後一個殺出重圍的公司,大概是成立於2012年這個坎兒上的位元組跳動,而他們手握的武器,恰恰是大數據和人工智慧。就像尤瓦爾赫拉利在《今日簡史》里直言不諱說的那樣,大公司通過數據能力,形成了「數據霸權」。

尤瓦爾·赫拉利

當然,他寫這本書的時候,腦子裡想的是 Facebook 和 Google。這兩個網站在我們的國家並不存在,所以我們恰好逃脫了他們的數據霸權的統治。謝謝。OK 不能多說了。無論你是否接受,剛才我說的是已經發生的歷史。而此時此刻世界上正在發生的是三件事:1、大公司掌握的計算力在爆炸式地增長。2、大公司在瘋狂招攬人工智慧演算法人才,對數據的利用能力在飛速提高。3、大公司在拓展新的「大腦探針」,從每個人身上得到更多的數據。他們要做什麼?他們在包圍「物理世界」。

三、「物理世界」大潰壩2014年,中國突然平地驚雷掀起了打車大戰。很快局勢明朗,阿里支持的快的打車,騰訊支持的滴滴打車,還有百度支持的 Uber 中國,三足鼎立,燒錢連眼睛都不眨。混戰的結局是:滴滴勝出,三家歸晉,但是血液里留存了 BAT 三家的「骨血」,甚至還摻和了蘋果、軟銀、中投、中國人壽、中信證券,簡直是八國聯軍。巨頭們為什麼一扔就是幾十億,投資一家打車的公司?還能因為什麼。因為數據。過去的互聯網巨頭,所有的數據都是線上數據——和人的空間位置無關,只靠大腦就能給出的數據。滴滴給出的數據,卻是人的空間行動軌跡。第一次,物理世界的大門就這樣敞開給各位巨頭,這太新鮮,太誘人了。時至今日,滴滴所能掌握的數據,都是全國獨一無二的。說到這裡,還得提到另一個隱形巨人,美團。中哥毫不掩飾對於美團的看好。我曾經寫過《野獸美團》,就是在分析美團刻畫物理世界的能力。美團外賣小哥的手機,每隔幾秒就會向總部發回信號。通過這些數據探針,美團可以實時掌握各個飯店、便利店的精確到五米的位置,實時知道哪段路臨時限行,知道各個小區的大門的開關情況,甚至知道今天12:30某大廈的一部電梯從1樓上到14樓所需等待的時間。

美團的手背在身後,趁你不備就給你插一根新的探針。美團合併大眾點評,插了一根你去飯店的軌跡探針。美團做團購,插了一根你看電影、洗腳、唱K等等娛樂軌跡的探針。美團酒店預定,插了一根你開房的軌跡探針。美團收購摩拜,插了一根你短途出行軌跡的探針。美團也曾經覬覦滴滴的打車業務和背後的數據,推出了美團打車,但是說這一役成功恐怕為時尚早。物理世界的數據雖然如此珍貴,但從目前的情況來看,滴滴和美團都沒有做很大的動作來把物理世界的數據變現,這是為啥?並不是因為他們不想,而是在現有的技術條件下,對物理世界數據的變現成本太大。時機未到,讓子彈飛一會兒。

他們在等待幾個技術突破,其中最重要的那個,叫做 5G。一旦 5G 技術大規模商用,物理世界的數據就會變得精確而且便宜,就像 AV 畫質一下子躍升到了高清8K。到那時,互聯網的洪水就會衝破物理世界的堤壩。也許你在街上每走一步,都能看到身邊屏幕上顯示不同的廣告;手機里會給你推送五米開外的店鋪的優惠信息;你口渴,星巴克就在你前方召喚,你心情不好,立刻甜品送到你手上。滴滴和美團,都有巨頭持股。而 BAT 們自己的數據探針野心,也昭然若揭。很少有人記得,2018年,阿里巴巴曾經在「電商」、「金融」、「雲計算」、「物流」這四大賽道旁邊,鄭重地建立了第五條賽道。這條賽道就叫「IoT」。IoT 的中文譯名是「物聯網」。很明顯,這就是沖著刻畫現實世界去的。其實在阿里巴巴旗下,已經孵化了一個非常厲害的面向個人的 IoT 設備——天貓精靈。2020年,天貓精靈升級為獨立的事業部,由阿里雲 IoT 事業部負責人庫偉領導,這個意思就已經很明確了。阿里巴巴把有關 IoT 最強的彈藥都組合到一起,準備干票大的。

這貨是天貓精靈太空蛋,在酒店裡提供特殊服務的

而且,阿里旗下還有一個「隱形大咖」菜鳥網路。估計很多人都是從前兩年家門口的快遞櫃開始認識它的,但其實菜鳥成立很早,而且掌握著大半個中國的物流數據。菜鳥同樣有 IoT 戰略,但技術主要是偏向設備本身的數據探針(不是人),不是本文重點。

這是菜鳥的無人倉機器人

同樣不可忽視的還有百度。從2019年底到2020年初,百度的股價已經上漲了40%左右。百度早就不是那個在很多人心裡只會玩競價排名的百度了。他們手裡有很多驚險刺激的玩意兒。我舉兩個例子:1)小度音箱就是那個擺在客廳和你對話的音箱。2019年,小度的出貨量已經上千萬台,在阿里巴巴天貓精靈和小米小愛同學的夾縫中殺出一條血路。從本質上來看,小度是下一代搜索的入口。也就是說,隨著人工智慧技術進步,未來你可以用語音搜索來代替打字搜索。在「搜索」這個探針上,百度是有預判的。但這遠不是百度的終極野心。你要知道,小度音箱裡面安裝的是「小度助手」,而小度助手是智能設備的操作系統,而特定的智能設備是霸佔和PC、手機完全不同的物理空間的。例如,一般人現在會把小度音箱放在客廳,還有一些智能冰箱是在廚房,百度還和吉利等很多車廠合作把小度助手裝進了汽車裡。在特定的場域里,人會產生特定的需求。這個探針,絕對和百度搜索不同。舉個例子:電視上不是經常有公益廣告,說家人雖然都坐在客廳,但是各自抱著手機么。從本質上來說,並不是人們有多愛手機,而是因為沒有適合客廳的內容和活動。只要有人在小度生態上開發一些家庭運動 App 或者家庭遊戲應用,這個在過去十幾年被抑制的需求一定會爆發。而據我所知,小度的生態有四名萬開發者,這件事情正在發生。

小度智能屏

2)自動駕駛自動駕駛是一個比想像中更長的賽道。我其實都沒有信心,百度到底能不能把這個馬拉松堅持跑完。首先,自動駕駛要克服的技術困難太大,甚至現有的技術路線都不一定走得通。其次,政策風險很大,自動駕駛事故的責任認定,已經涉及到了人類的倫理討論。但我還是相信,終有一天自動駕駛會突破技術和政策的障礙,無人駕駛汽車布滿道路,這將會再造一個道路上的物理互聯網。人們在自動駕駛汽車上,注意力被解放,於是這段大腦空閑可以被插入新的探針。當然,此乃後話。

自動駕駛汽車「阿波龍」

人工智慧、自動駕駛,一個個辭彙看起來很美妙,但是命運饋贈的禮物,早已在暗中標好了價格。我們身上的「探針」越來越多,越來越密,我們的隱私就會越來越少。我們的隱私越來越少,我們和母體作為一個整體的力量就越來越大。注意!注意!注意!這裡所說的隱私變少,並不是人和人之間的隱私變少,而是人和機器之間的隱私變少。從目前的技術發展方向來看,每個人只是對母體單向透明,人類之間並不會分享隱私。人和人就像小狗見面一樣,只是相互嗅嗅,一起玩耍,然後道別。每隻狗狗只對自己的主人敞開一切。大數據讓你只把自己最隱秘的一面透漏給么的感情的機器。這樣,人類仍然是以前的那個人類,道德沒有被顛覆。當然,窺私慾是人的天性。雖然初衷是只給機器看數據,但總會有人類試圖進入機器,盜走價值巨大的他人隱私。所以在未來,數據安全就會成為一個巨大的產業。據我所知,巨頭們的安全部門,目前全都把「數據安全」作為頭等大事。但是不管怎麼說,剛才所討論的數據都逃脫不掉一個天然的道德困境,那就是:你大公司拿我的數據,從我身上攫取了利益。(雖然誰都知道,沒有利益就不可能有商業的繁榮。)數據天生帶有原罪。真的是這樣嗎?恐怕不完全是。有時候大多數人會心甘情願千里送數據給大公司——如果數據可以換來健康。

四、數據的「善惡」人的內臟就像是不喜歡給CEO添麻煩的部門經理。只要臟器沒有拋錨,一般是不會把問題呈報給神經系統和大腦的。這也是為什麼人只有通過體檢才能發現很多早期疾病。從另一個角度理解,人的大腦在臟器里是沒有「探針」的,也就拿不到它們的實時工作數據。人沒有進化出來這個功能,科技可以幫你啊!舉個例子(醫學數據可能不準確,只是為了讓你方便理解):判斷一個人存在「心律不齊」,大概需要在15秒的時間內,連續發生2-3個特定異常的心博。然而這15秒卻可能發生在一天的任何時候。醫生不可能整天陪在你身邊盯著你的數據。這個時候,就需要一個儀器實時收集你的心跳數據,然後通過人工智慧的演算法,找到符合條件的異常心博,然後把這一段生成報告給醫生尋求診斷。

好了,現在的問題很明確,如果你想發現自己心臟異常的細節,就必須把心臟數據如數上交,而這些數據處理技術的背後,依然是 BAT 的身影。騰訊在很早就成立了用人工智慧幫醫生看片子,尋找癌症病變的「覓影」,也成立了 AI 醫療團隊,專門負責用 AI 和數據幫助醫生做診療,也和醫療器械公司合作,輸出疾病判斷的AI能力。

這是騰訊覓影支持的食管癌篩查系統

馬雲更是提出了兩個「H」的戰略,其中一個 H 就是健康。阿里健康也是在港股獨立上市的公司。百度曾經一度因為戰略收縮而裁撤了醫療部門,卻從未放棄對於醫療公司的投資,最近一年又加快了在醫療器械和 AI 醫療的布局。由於涉及國計民生,醫療是一個半壟斷領域,互聯網公司的進入舉步維艱。但是不可否認,病人們對數據智能有著剛需,而擁有數據權柄的公司,又屈指可數。數據不託付給 BAT,又能託付給誰呢?和醫療相類似,保險同樣可以利用足夠多的數據探針,對一個人了如指掌。這樣,可以做到同一個保險對不同的人收取不同保額,千人千面。例如:你的汽車告訴保險公司你的駕駛風格彪悍,保費就提高;你的起步很平順,交通違章少,保費就降低。螞蟻金服的相互寶,騰訊的微保,背後的殺手鐧都是「數據」二字。於是,我們終於走到了這個很有趣的道德困境:隱私到底值多少錢?隱私能當飯吃嗎?如果說放棄隱私可以換來整個社會的生產力,你會矯情地考慮考慮;那麼如果放棄隱私可以救自己和他人的生命,你依然會拒絕嗎?放棄隱私的誘惑有很多,總有一款適合你。讓你淪陷的,有可能是大數據醫療,有可能是大數據保險,有可能是金錢, 有可能是性,有可能是孤獨,有可能是陪伴,有可能是快樂,也有可能是恐懼。

我猜想,未來世界就像一個蟻巢,母體就是蟻后,它擁有和普通螞蟻完全不同的形態,為整個蟻巢提供動力和意義,無數工蟻負責照顧蟻后。而母體本身,無需,也並不意識到自己為何存在,它只是被需要,因為被更多人需要而越來越強大。只要探針足夠多,計算力足夠強,在任何時候,母體都能告訴你什麼是對,什麼是錯。你可以聽,也可以不聽,但你最好聽,因為你可憐大腦的思維能力在大數據面前就是個渣渣。就像你的狗狗飛奔向巧克力的時候,你一把拉住:「不,你不能。」有人說數據善良,有人說數據邪惡。但有一點無可辯駁:人類的生命有限,但數據或許永恆。前兩天,我看到了一個新聞,一位韓國的媽媽,依靠數據在虛擬現實世界裡重現了她已經過世的七歲女兒。

那一刻,數據是真是假,是善是惡,我無從判斷。本來我想結束在這裡,但我突然想到另一個故事,一個真實的故事,一個很多人都聽過,卻一直讓我難忘的故事。四歲的時候,男孩的爸爸給他買了 Xbox 遊戲機。他們每天都在快樂地玩遊戲,時光飛逝。直到六歲的時候,爸爸突然去世了。悲傷的他整整十年都沒有再碰那個遊戲手柄。直到有一天,他偶然翻出了遊戲機,決定打開再玩一次最愛跟爸爸玩的賽車遊戲 Rally Sports Challenge。遊戲開始時,他竟然看到了一台「鬼車」從他身邊超過,他恍然大悟,這是遊戲的一個設定——最快圈速的紀錄數據會成為一個「虛像」一直跑在賽道上。那是由爸爸創造的最快紀錄,每一次拐彎,每一次油門剎車,都是爸爸親手創造的。少年一直玩,一直玩。就像爸爸又回到身邊和自己比賽。直到有一天,他玩得太熟練了,終於超越了爸爸的車。在終點線前,他突然意識到什麼,猛踩剎車,再不向前。他等著,等父親的「鬼車」從他身邊超過,淚流滿面。

再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmini

知乎原文鏈接https://zhuanlan.zhihu.com/p/110120618


首答!感謝。

必須承認大數據對個人隱私的保護帶來了挑戰。

與傳染病流行的三要素(傳染源、傳播途徑、易感人群)類似,大數據增加了隱私泄露的「傳染源」的數量、加速了「傳播途徑」、擴大了「易感人群」的規模,並且「疫苗」的推出還存在時效性缺陷,因此無疑給個人隱私保護帶來了巨大的挑戰。

主要問題在於:

  • 「傳染源」方面,更多的個人隱私以可傳播的形式存在;
  • 「傳播途徑」方面,個人隱私傳播的路徑更加多樣、傳播速度更快;
  • 「易感人群」方面,個人隱私數據蘊含著巨大的經濟價值,有許多人或者實體想要利用這些數據牟利;
  • 「疫苗」方面,技術發展的速度遠大於立法、修法的速度,很多時候存在法律與現實脫節的問題。

但這個問題並不是單向的,從普通用戶角度看到的是大數據對個人隱私保護的挑戰;從大數據從業者的角度,看到的還有由於對隱私保護的重視導致的數據孤島問題。

隨著大數據的不斷發展,重視數據隱私和安全已經成了世界性的趨勢,世界上很多國家都在立法保護數據安全和隱私。例如影響非常廣泛的歐盟的《數據安全保護條例》(General Data Protection Regulation, GDPR),GDPR的實施對大數據的收集、交換、轉移、建模等各個環節都帶來了巨大的挑戰,一個涉及大數據的實體稍有不慎就可能面臨嚴(ju)厲(e)的(de)處(fa)罰(kuan)。:)

而我國也在加快立法進程以保護數據安全和個人隱私,近年來,許多法律、法規、規章密集出台;並且呈現出嚴格化和全面化的趨勢(如下圖)。此外,十三屆全國人大常委會已將制定《個人信息保護法》列入本屆立法規劃,預計會在近年內出台。

但是,對於個人隱私保護來說,並不是法律管得越嚴格、越全面就越好。

以GDPR為例,作為影響最廣泛的數據安全法律,其執行一年多以來,已經引起了很多的爭議。今年6月,美國智庫信息技術和創新基金會(ITIF)下屬的數據創新中心發布報告,分析了歐盟GDPR對企業、數字創新、勞動力市場和消費者等多方面的挑戰。報告指出,GDPR生效一年後,越來越多的證據表明法律沒有產生預期的結果,而且帶來了意想不到的後果,具體表現為:對歐盟經濟和企業產生負面影響、消耗公司資源、傷害歐洲科技創業公司、削弱數字廣告行業的競爭、企業實施起來過於複雜等。GDPR甚至給普通消費者也帶來了不少問題:未能增加用戶之間的信任,對用戶的在線訪問產生負面影響,過於複雜讓消費者難以理解等。

GDPR的實施之所以會導致普通消費者面臨各種問題,我認為一大因素是其賦予了過多的數據自決權利。弗洛伊德在《文明與缺憾》裡面提出,大多數人並不是真的想要自由,因為自由包含著責任,而大多數人並不願意承擔責任。給個人賦予過多的數據自決權利並不必然意味著對個人隱私的良好保護,一個很現實的問題是數據自決權利的實施很可能會淪為勾選隱私保護格式條款一樣的存在(事實上,連美國聯邦最高法院的羅伯茨大法官,都坦言自己不會閱讀平常遇到的隱私協議)。我們常常呼籲大數據公司、從業者在收集數據時要遵循「最少夠用原則「,但也想呼籲法律的制定要遵循」最少夠用原則「,讓法律的歸法律,讓技術的歸技術

那麼有哪些技術可以有效地保護個人隱私呢?

一個具有代表性的例子是近年來出現的聯邦學習技術,它可以有效地在保護個人隱私的同時發展大數據和人工智慧。聯邦學習最初的設計目標就是在保障數據安全和個人隱私的前提下開展機器學習。它能夠做到各個數據擁有者的數據不出本地,通過交換加密參數聯合建模,且聯合模型的效果基本等同於將所有數據直接聚合起來建模的效果(如下圖)。

(縱向聯邦學習示意圖,Qiang Yang, Yang Liu, Tianjian Chen, and Yongxin Tong. 2018. Federated Learning. Communications of The CCF, 14, 11 (2018),49-55)

總之,要想大數據發展與個人隱私保護兼得,離不開法律的完善與技術的進步。立法方面我們能做的可能很少,但作為從業者,我們可以多多關注聯邦學習等技術,共同推進大數據發展與隱私保護的和諧共存。

感謝,這個回答如對你有用,記得點個贊同??


前段時間一個熱點事件是關於 facebook 的,說它泄露了八千七百萬的用戶數據,這個說法各方報道的不太一樣。《紐約時報》報道的是五千萬,「劍橋分析」說大概是三千萬。


這個數據不是一般的數據,實際上是個人識別數據。個人識別數據是美國隱私法裡面的辭彙,主要指的就是這些數據可以用來識別,追蹤一個人。比如我的年齡、星座、手機號、身份證數據等等。


但是有些數據就不是這種,比如你的睡眠時間,你上的學校。這些都不是直接關聯到你,而是一些比較普遍的東西。


實際上,這事兒比想像的要複雜不少。2015 年美國《守望者》報道說美國議員泰德·克魯斯利用一家叫做「劍橋分析」的數據分析公司搜集用戶數據,通過有針對性地影響選民,協助唐納德·特朗普贏得了 2016 年的美國總統大選。


2018 年,《紐約時報》、《守望者》從一名前劍橋分析的員工克里斯托弗·威利那得到更多關於劍橋分析的信息,開始更為詳實地報道。社交媒體輕易泄露的個人數據隱私以及這些隱私泄露可能造成的嚴重後果,使大家陷入了巨大的恐慌。


一切都從一個叫亞歷山大·科根的劍橋大學研究員講起。科根是俄國人,七歲才到美國讀書,在香港大學博士,之後在劍橋大學做研究員,研究社會心理學。科根在劍橋時候發明了叫「數字生活」的軟體,該軟體能搜集你信息,繼而建立一個心理人格的檔案。


比如你在建軍節的時候,玩的那個變軍裝遊戲,就搜集了你照片和姓名信息。這些遊戲的共同點就是在開始之前需要你同意授權抓取你的個人信息對不對?「數字生活」在 Facebook 上也是這麼操作的,這個套路在國內外都已經非常成熟了。


大約二十七萬的 Facebook 用戶都同意了「數字生活」來抓取數據。但它實際上不僅搜集了用戶的信息,還搜集了用戶朋友的信息,這樣總數高達八千七百萬。這時候你可能說,這個明顯不對啊。


但科根卻認為這些信息都是經過用戶授權的。當你選擇使用這個軟體的時候,軟體清楚地提示你會搜集你和你的朋友的一些基本信息,用來提升用戶體驗。搜集你的朋友的信息,比如年齡,性別和職業等,可以提升對軟體對你的人格的評估和理解。


但問題是,你是同意了,但是你的朋友卻沒同意他們的信息被暴露出去。這就很尷尬了。這種情況算不算泄露用戶數據呢?你說算,但是你同意了啊;你說不算,但是你的朋友沒有同意啊。就好比你去問小李要小張的電話,小李打開手機通訊錄,給你看了。現在我問你,這個手機操作系統存不存在信息泄露問題?

最低 0.3 元/天開通會員,查看完整內容

購買該鹽選專欄查看完整 11 節內容

鹽選專欄

科技倫理論:反思智能時代背後的哲學

王小偉 哲學學院副教授

11 小節 | 1 小時

¥29.90 會員免費


大數據時代的隱私數據分兩種

一種是數字化後的你的行為習慣,比如,你搜了搜跑鞋,看新聞的時候給你推一雙亞瑟士的跑鞋廣告,這種隱私的獲取、分析和觸達都是自動的,不會有人看到,這種隱私應該沒什麼抵抗的必要。

第二種是用戶手機、姓名、地址等隱私數據,拿到數據後可以通過電話簡訊郵件等方式觸達用戶,這種隱私數據比較敏感,應該花大力氣進行整治非法濫用的問題。

關於大數據在商業上的應用:

最近參與了幾個央企之間的合作項目,說白了就是把脫敏後的用戶數據互換,這種互換是無感的。比如你是某桶油的用戶,又是某通訊商的用戶,你的數據在兩大巨頭的資料庫里都存在。

二者合作後,某桶油通過大數據分析平台知道你平時打開APP的喜好,大致分析出你是一個愛理財的好少年,或者是一個愛看寶寶樹的寶媽,那麼你下次去加油的時候,APP里可能就會收到金融理財或者奶粉的推送。


個人隱私還是有的,只要你不讓它進入互聯網,嘿嘿。

大數據本身是科技的一大進步,比如它能自動給你推薦你喜歡聽的歌、喜歡吃的外賣、喜歡看的新聞類型,給我們帶來便利。 隱私數據的泄露,是大數據安全的範疇,是沒有合法使用大數據的一個負面效能,比如最近的facebook用戶信息泄露,導致facebook股價大跌。

所以我們需要積極擁抱新的技術,但企業和個人也要加強數據安全意識。


推薦閱讀:
相关文章