大數據不僅是數量級上的大,更是觀念上的大。大數據成為了數字經濟時代經濟活動的基礎。從電商平台分析商品售賣情形,到社交平台分析社會輿論熱點,所有的數字經濟活動都離不開大數據。我們認為,認清大數據的特性非常有助於我們認識數字經濟的新面相。

「大數據」是「數據」的質變

從大數據與技術發展的關係角度來看,數據是以電子設備為載體的,二進位欄位的表達。與數據有關的操作首先是計算機底層的技術問題——即通過一定的代碼演算法,實現數據的獲取、使用、存儲等。伴隨著計算機與資料庫等技術的不斷發展,加之網路的出現,網路計算能力越來越強、數據獲取範圍越來越廣、數據的使用用途也越來也多。所以「大數據」並不僅僅意味著數據量的「大」,更意味著數據的價值變「大」了。早在2001年,麥塔集團(META Group)(後被Gartner收購)分析師道格·萊尼(Doug Laney)提出大數據管理的3個方向——即時處理的速度(Velocity)、格式的多樣化(Variety)與數據量的規模(Volume)。在此基礎上,Gartner、IDC等國際諮詢機構又提出了數據準確性(Veracity)、數據可視性(Visualization)與合法性(Validity)等要求。

從大數據與信息的關係角度來看,大數據指的是規模和格式前所未有而又相互關聯的大量數據,搜集自網路空間和實體世界,技術人員通過高速、多方分析後,可以從中挖掘出甚至超出原有數據量級的信息量。這意味著,只有在大數據環境下才能夠出現天量的信息。而對於這些信息載體進行再次或者多元的「大數據」分析,將會爆發出更多的數據與信息。因此,有學者提到,大數據時代的技術和現實變革是圍繞著數據的「量」和「價值」展開的。

從大數據與網路空間的關係角度來看,海量的數據和相互之間的結構性、非結構性關聯,使得大數據充分地擴展了網路空間。經過幾十年的發展,人類社會早已經將自己的社會活動拓展到網路空間。網路空間不再是虛擬的角落。人類一方面利用大數據進行分析、拓展網路空間,一方面也在不斷向網路空間貢獻數據。

從大數據與社會效用的關係角度來看,諸多國家逐漸意識到大數據存在十分重要的戰略價值。在國家戰略層面,我國率先倡議網路空間治理的多個宏觀原則——「尊重維護網路空間主權、和平利用網路空間、依法治理網路空間、統籌網路安全與發展」。這些原則映射到網路空間治理的微觀層面就是大數據治理。在商業戰略層面,大數據的發展讓社會步入了數字經濟時代。大數據所特有的基於數據分析、挖掘、獲取和交易所產生的經濟利用廣闊前景和巨大的輻射力,是商業競爭中各參與主體競相爭奪的重要資源。

「大數據」是勞動對象也是勞動的結果

目前來看,數字經濟中的「大數據」運用的商業模式主要分為兩大類:第一類,以大數據為標的物的直接交易。這類交易指的是把狹義上的「大數據」——即數據集作為交易的標的物。第二類,以大數據分析之後的數據與信息為標的物的間接交易。這種交易指的是採用各項分析方法對數據進行挖掘、分析,產生大量的統計結果、主體偏好、決策參考等信息,基於這些信息的再利用、重組與拓展,形成商業決策和商業行為,例如利用行為畫像的精準營銷,基於大數據統計的投資決策等等。

與農經濟時代以土地作為重要的生產資料、工業經濟時代以石油等能源作為重要的生產資料類似,數字經濟時代以大數據作為最基礎也是最重要的生產資料。這兩種商業模式中,前者所指稱的「大」數據是交易對象,後者所謂的「大數據」是勞動的對象。但是我們需要敏銳地觀察到,大數據能夠成為生產資料的最重要原因是:數字經濟的本質——信息經濟。在大數據時代,信息的載體是數據。對於數據的分析與挖掘,其實質是生產各類信息產品。這就好比在土地上進行勞作,生產出來的是各種農業產品;對石油等能源材料進行勞作,生產出來的是各種工業產品。

數字經濟時代的特點還在於,信息的流轉具有循環性質,即人類不僅通過數據勞動獲取信息;而且自身也在不斷提供信息以被數據化。在前數字經濟時代,信息的載體是口口相傳或者文字記錄。對於那些帶有智力成果屬性的信息採用了知識產權的方法加以確權;對於那些帶有勞動服務性質的信息(例如請私家偵探進行的調查)採用了合同等方式加以確權。而在數字經濟時代,數據與信息的特性導致數據的多重屬性——同樣的一個數據,有時候是勞動的對象和交易的對象,有時候是勞動的結果。這就是數據權屬難以被確定的一個深層次原因。而目前,各國立法大多存在著數據與信息兩詞的互用,本質上是沒有理解大數據作為數字經濟「生產資料」這一判斷。

作為生產資料的「大數據」的特點

「大數據」的形成方式和使用方式決定了其與一般生產資料的不同,其擁有無形性、外部性、多次使用性等特點。

(1)無形性。數據是以計算機等電子設備為載體的二進位表述,脫離於計算機數據無法存在。網路空間中的大數據也都需要存儲在物理設備中。因此,無形性是大數據最基本,也是最顯著的特徵。同樣具有無形性的知識產權是對於信息權屬的擬制。正是大數據的無形性,造成了權屬理解上的難度。

(2)外部性。數據存在於電子設備和網路中。由於數據控制的原因,數據往往存在被泄露或者失竊的風險;同時,出於使用的原因,數據可能會被主動公開。兩種情況都會對非數據控制人或者數據權利與義務人產生溢出效應。例如用戶在全網的各類行為數據會被商業主體免費獲取。

(3)多主體使用與復用性。一方面,數據可以為一個數據控制者多次使用,數據的存在具有復用性;另一方面,數據可以同時或者非同時地為多控制主體使用。例如消費者在電子商務平台的一般消費數據可以同時被平台、平台商家、監管部門等使用。

何海鋒 京東數字科技研究院研究員

張彧通 京東數字科技研究院研究員

劉元興 京東數字科技研究院研究員

推薦閱讀:

相关文章