轉載自 CovenantLabs:如何讓數據成為資產?先讓數據動起來!

數據是什麼?1946年,「數據(data) 」一詞首次用於表示「可傳輸和可存儲的計算機信息,數據和信息通常可以互換使用,但區別在於數據是需要處理的、原始的、無組織的事實,而不是信息本身。當處理,解釋,組織,結構化或呈現數據以使其有意義或有用時,它們才被稱為信息。

正如 Nate Silver 在「信號與噪音」中這樣說到:「The numbers have no way of speaking for themselves. We speak for them. We imbue them with meaning」

同時,在數字時代,很多人都說數據是這個時代的「新石油」,但和石油不一樣的是,數據只有流通起來,才能釋放其中蘊藏的巨大價值。當前,仍有大量數據還沉睡在政府、企業、個人手中,數據的共享、開放、流通和應用程度還遠遠不夠,距離最大程度發揮數據價值讓全社會共享還存在巨大的鴻溝。目前國內的數據產業就像一位資深頸椎病患者,需要一位高明的老中醫,舒筋活血,直擊痛點,打通任督二脈。血脈通暢了,病自然也就好了。

而當我們在討論數據流通時,數據(data)就不僅僅是一種信息了,而會被考慮為一種特殊的商品,數據流通也就意味著這種特殊商品的交易。在傳統商品交易時需要考慮的一些問題,「數據」同樣需要考慮,業界將它歸結為四個主要問題:權益與隱私問題;安全問題;質量問題和定價問題,我們就圍繞這四個問題結合區塊鏈進行深入討論。

(圖片來源於網路)

數據權益和隱私問題

首先是數據權益和隱私問題,作為特殊的數字資源,數據權益包括所有權、使用權、可複製權、遺忘權等等。舉個栗子??:

小C是一位上班族,習慣駕車通勤,周末還會有出門郊遊的愛好,由此積累了大量的個人行車數據。在這其中,一些專業的工況數據和性能數據,小C一個文科生看了就頭疼,也不想去研究,他只想要經過處理、組織後、有意義的信息就好了。於是小C和數據服務方達成協議,把數據的使用權交給了他們。

但是緊接著問題來了,小C是一個及其注重隱私的人,對於自己的個人用戶數據,比如行車路線、駕車習慣等等並不想隨意暴露給他人,這些數據又暴露家庭住址和個人喜愛的等信息的風險。但是呢,又需要服務商為自己提供車輛診斷等信息,所以決定把這些數據,進行脫敏處理,分許可權進行訪問,哪一部分能看都由他說了算,甚至在他去世之後,可以遺忘這些數據。

看到這裡,我們發現兩個問題,首先:數據的所有權必然是用戶自身的,第三方機構擁有的僅僅是使用權。其次:用戶對數據具體使用的需求是多樣化的,小C既想讓需要的人看到,又想保護自己的隱私,讓服務商可用不可得、且可用不可見,正如上一期中提到的理想型 App,用戶對於設備和自身數據有著絕對控制權,而且有著控制的慾望。而想要滿足這種需求,必須建立起有效的去中心化的機制。

說到這裡不得不提歐盟的 GDPR (General Data Protection Regulation) 法案,此法案已經在 2018年5月25日生效,考慮了很多從個人數據隱私保護的角度的問題。其中有一條很有意思:只要一個公司在歐盟經營,那麼它必須給用戶提供導出數據的選項。於是有了下面這張圖:

(圖片來源於知乎網友:@physixfan)

雖然大家一般認為微信是個中國的產品,但是我們發現微信為了不退出歐盟市場,選擇遵守了歐盟的法案,這個功能與我們 PC 端和移動端所使用的聊天數據備份是不一樣的,它還可以導出朋友圈數據,感興趣的讀者可以註冊一個歐盟手機號試試。

中心化存儲的安全性如何保證?

以上是關於權益的討論,當與數據流通結合時,對於小C而言,車輛數據一旦流通起來,換一家洗車店或者車行做保養,可以直接拿出自己的車輛數據,一目了然。從服務商角度來說,數據一旦流通起來,意味著交易的更多可能性,把自己的數字資產真正利用起來,甚至像 Kevin Kelly (《失控》作者)說的那樣,未來有一天把數字資產寫進財務報表。

同時,對於負責海量數據存儲和傳輸的服務商來說,如何保證其數字資產的安全也是一個大問題。有許多專家持有這樣的觀念:數字資產= 數據+區塊鏈,為什麼會有區塊鏈+?打個比方,傳統的大型機構一般會建立自己龐大的中心化資料庫,其中包含千千萬萬個小C的車輛信息,這些數據中蘊藏著巨大的價值,但這樣的資料庫往往是中心化的,各個大中心之間都是不互通的,也就是我們所稱的「數據孤島」。這種中心化的存儲方式具備極大的風險,一旦被攻擊,或者是系統漏洞,會造成極大範圍的個人隱私泄漏。類似的例子不勝枚舉,比如 Facebook 最近再現數據泄漏醜聞被正式起訴,小扎這個聖誕節怕是不好過了。

(圖片來源於網路)

想要避免這種情況,去中心化的分散式存儲絕對是最佳解決思路之一。同時還可以大大地提高效率並且保護用戶的個人隱私,讓用戶決定誰能訪問和修改相應的數據,並且可查閱到信息在何時被何人訪問,把數據權益真正從機制上還給用戶,還能夠讓其享受數據帶來的便利,這也是區塊鏈對於個人的重大意義。

數據質量及可信性

除了安全問題,數據質量及可信性是決定數據流通與交易未來可持續發展的重要因素之一。從某種程度上說,相較其他工業產品,數據生產門檻較低,目前很難保證不科學、不真實、不可靠、未經驗證的數據不會被進行交易。比如某些地下灰色市場,一些數據會被反覆的倒賣,想要溯源的難度太大,且無法判斷合法性。

因此,數據質量的評估體系,應涵蓋從數據採集、數據清洗、數據整理、數據交易的各個環節。而針對這種溯源的需求,區塊鏈技術天然具備透明日誌記錄以及可追溯、不可篡改的特性,非常適合做安全、透明的追溯審計。

數據的定價與估值問題

當審計追溯問題解決之後,另一大利好是關於數據的定價問題,在目前的數據交易市場,由於數據類型、實時性、可靠性、數量、質量、格式、可獲取性、跨界程度的不同,數據定價非常複雜,而且缺乏統一規範的定價模型與策略,無法使各方都能達成共識。供需方對於數據的定價思路各有考量,數據供應商會考慮使用數據加工成本的計算方式評估數據資源價格,而需方則希望按數據使用獲得的價值的比例與供方協商價格。

除了供需方對於數據價值的判斷,數據早已成為眾多企業估值攀升的重要支撐,不久前曝光出的某知名獨角獸企業數據造假事件只是冰山一角,用創業公司一位同行的話來說:「現在的startups沒有哪一個是乾淨的,造假的動機很簡單,一切為了利益。互聯網創業者需要拿投資,投資人怎麼評估一個產品、一家企業是不是有潛力?就是通過用戶量、活躍用戶量、使用時長、點評量等來判斷的」。

當數據來源的各個環節都變成可追溯審計之後,不僅可以為定價提供一個很好的參考,協助多方更好的達成共識,也能夠將數據造假這種行為拒之門外。數據的陽光、透明、規範化流通,是大數據產業和數字經濟健康發展的基石,也是 ConvantSQL 致力於解決的問題。

如何讓石油燃燒起來

如何讓數據這個特殊的商品,自由高效,有序合法地流通需要政府、企業以及個人的多方努力。目前,我國很多省份開始高度重視大數據戰略和智慧城市戰略,建立起了省級大數據管理局,這表明政府已充分認識到大數據的重要性。專職機構的設立意味著規範化和專業化,從前數據流通的監管以及合法合規性等懸而未決的問題有了促進解決的強力推手。以上列舉的問題,真正實施起來必然有更多細節的難關需要攻克。而在技術層面上,一個去中心化、分散式、可溯源和不可篡改的資料庫,必然能夠為數據的傳輸與交易帶來革新。

Refs:

@信通院 (2017-05-15 ) 促進數據流通,釋放數據紅利

@信通院 (2018-05-16) 區塊鏈在數據流通中的應用

@中國信通院 (2018-04) 數據流通關鍵技術白皮書

@大數據文摘 (2018-12-19) FacebooK被正式起訴,涉與150多家科技公司「數據共享」

@鄔賀銓 (2017-03-28) 數據流通與交易的四大挑戰

@大數據技術標準推薦委員會 (2018-12-21) 專家視野 | 張楠:數據權與數據治理

@"Data vs Information (2018-12-11) Difference and Comparison | Diffen". www.diffen.com.

@Medicalchain (2017-11-17) A blockchain for electronic health records

長按二維碼關注 CovenantLABS


推薦閱讀:
相关文章