現在大數據越來越火了,在公司裏也感覺到。各種Hadoop、Spark,然後BI部門每天報表分析。有點好奇,大數據技術在未來的發展趨勢是什麼?


大數據,人類又一個技術烏託邦?(王冠雄)

【大數據是一個時代,「國家隊」很及時】

去年底宣佈的一個事情,將對未來有深遠影響,現在大家還沒意識到。

2013年11月19日,國家統計局與11家國內企業簽署戰略合作框架協議,合作內容涉及大數據應用統計標準,以及企業數據補充政府統計數據等領域。有分析稱,在大數據國家戰略日益強烈的情況下,統計局介入將進一步推動大數據的應用落地。

大數據絕對不是忽悠,它是當下IT領域最時髦的詞,簡單說就是從各種數據中快速獲取價值信息的能力。美國是最早發現和使用大數據科學價值的國家。2012年3月,奧巴馬政府宣佈投資2億美元拉動大數據相關產業發展,將「大數據戰略」上升為國家戰略,奧巴馬政府甚至將大數據定義為「未來的新石油」。當時美國政府聲明說通過提高美國從大型複雜的數據集中提取知識和管理的能力,來加強整個國家的競爭力,這被認為是跟互聯網同一個級別的時代。顯然,大數據不止是一個辭彙,更是一門技術,是一個產業時代。

而中國作為世界上人口最多、GDP排名第二的國家,成立大數據國家隊是非常及時的。大數據的精髓在於「大」,它不是抽樣而是全樣,它不是盲人摸到的象腿或者是象鼻子,而是整個大象本身,大數據的精妙處在於用的人越多越增持,通過這樣一個模糊的宏觀判斷,能夠完成一個精準的個體推薦,從而會讓整個生產效率得到極大提高。

【不開放大數據,周邊創業是無米之炊】

目前我國大數據應用還存在一些問題。

首先,大數據不是IT公司的專利。第一批國家統計局引入的戰略合作夥伴,大多數還是聚焦在IT公司,其實不是隻有IT公司纔有大數據,如線下零售巨頭企業在實體經濟中積累了很大的數據資源,他們數據的深度和廣度不亞於甚至超過互聯網公司。第一批進入的合作夥伴之一上海鋼聯其實掌握了煤炭鋼鐵在內的大宗商品數據,這是國家統計局沒有涉及到的。因此,非IT類公司、擁有巨大的業務形態的企業,都可以成為第二批國家統計局大數據合作夥伴。我們也看到,國家統計局作為國家法定職能部門把姿態放平,主動尋求和民營企業的合作,這是非常可喜的進步。

第二,擁有大數據的IT公司和非IT公司應該打破數據格局。我們看BAT(百度、阿里、騰訊),近期圍繞微信和淘寶發生新一輪互相屏蔽,在早前百度和淘寶進行了屏蔽,這三家掌握搜索、消費和社交的數據,本來是三方的數據匯總才能拼湊出比較完整的網上信息圖譜,但是三家公司為了彼此的商業利益,並沒有體現出數據合作的意願,而是互相封殺,這將給社會數據的流動帶來傷害。因此,在保證一定商業利益的基礎上,巨頭的眼光應該放遠一點,打破數據割據。這看起來是一個很難實現的烏託邦。不過任何美好的事情都需要烏託邦的願景作為起步的。我們看到許多美好的事情,比如說互聯網,全世界的人通過互聯網聯結在一起,開始大家覺得烏託邦,現在已經形成現實。

第三,應該呼籲政府相關部門進一步開放市場。因為圍繞大數據不管是應用還是創業,最核心的是要有數據的源頭,然後才能進行採集、編輯,重新編製。據報道,現在大量的關於國民經濟或者說民生的數據其實還在封閉狀態,在工商部門、銀行、保險、公安、醫院、社保,包括電信運營商機構的手裡。如何讓這些數據流動起來,能讓大家更方便,其實應該由政府帶頭實現等級制數據的開放共享。在不違反保密或者是國防的情況下,如果不開放大數據,那麼相關研究和創業都是無米之炊。

所以還是應該抓住這個機遇,進一步開放市場,不斷試點,一步一步把數據開放轉起來,帶來更多的應用價值。

【隱私保護與數據精準之間的平衡】

數據應該共融共通,還要開放市場。這個開放市場不僅僅是企業之間開放,企業對個人也要開放。

為什麼現在開放變得這麼謹慎?因為開放有風險,一是安全問題,二是倫理問題。已經有專家指出:安全問題是對於國防、軍事以及整個經濟信息的保密顧慮而言;倫理問題是從個體角度而言,即網民的隱私。《大數據》作者曾經說過,在一個有組織的社會裡,幾乎每一則信息都在不同的時候,以不同的形式公開過。就公民而言,他的信息一次性在網上公開,和第一種情況有本質區別。大數據平臺在提供服務的同時,也在時刻收集用戶的各種消費習慣、瀏覽習慣甚至生活習慣。如何保護用戶的隱私成了大數據時代發展過程中不可迴避的問題。因此,大數據的應用價值在於個人隱私保護與數據精準之間的平衡。

要真正做到大數據的開放,還需要很長的路走。大數據會成為互聯網之後,人類又一個技術烏託邦。大數據的啟動跟互聯網有著相同的邏輯,一開始大家談,不知道怎麼做,會有一輪甚至幾輪比較明顯的產業泡沫,但是隨著那些看似烏託邦的願景,一個技術、一個嘗試的創業公司的進入,會一步一步變成現實。

未來大數據會怎樣,創業者跟投資者都需要很謹慎。目前來說,就大數據做預測是非常危險的事情,比較謹慎的說,可能在三年左右會看到一些具體的、受到社會應用的大數據,往長期看則還是未知數。


趨勢預測是最扯淡的,也沒有什麼意義。絕大多數的大數據推崇者都沒有理解大數據的真正含義。

BTW,自己領悟才最重要,不妨看看《失控》,相信看完你會有獨特的感悟。


您好,很榮幸為您解答。大數據市場的發展趨勢和前景是許多參加大數據培訓學習的學員比較關心的問題,隨著大數據的崛起,許多學員開始進行大數據培訓學習,從而進入大數據行業。後臺君認為這是個不錯的選擇,但是在學習前一定要了解大數據。剛剛回答了一個類似的問題,但您放心,後臺君一定會不厭其煩的為您解決您的疑惑。下面就一起分析一下大數據的數據市場和未來發展趨勢。

近年來,全球大數據儲量呈現爆炸式增長,其中中國數據產生量增長最為迅速,平均每年增長速度比全球快3%,預計到2025年中國將成為全球最大的數據圈。

中國數據圈將受到來自物聯網設備信號、元數據、娛樂相關數據、雲計算和邊緣計算增長的驅動,中國生產力數據和物聯網數據佔比將從2015年的11%增長至2025年的40%。

全球大數據儲量規模爆炸式增長

隨著物聯網、電子商務、社會化網路的快速發展,全球大數據儲量迅猛增長,成為大數據產業發展的基礎。預測未來幾年,全球大數據儲量規模也都會保持40%左右的增長率。在數據儲量不斷增長和應用驅動創新的推動下,大數據產業將會不斷豐富商業模式,構建出多層多樣的市場格局,具有廣闊的發展空間。

中國網民規模穩步增長,將超越美國

當前網民增長進入了一個相對平穩的階段,互聯網在易轉化人羣和發達地區居民中的普及率已經達到較高水平。

當前,我國正在加速從數據大國向著數據強國邁進。國際數據公司IDC和數據存儲公司希捷的一份報告顯示,到2025年,隨著中國物聯網等新技術的持續推進,產生的數據將超過美國。

生產力數據和物聯網數據增長迅猛

預計到從2015到2025年,娛樂數據(來自數字電視、在線視頻、音樂和遊戲的數據)將增長7.8倍,生產力數據(大數據和元數據)和物聯網數據的增長則更加迅猛,娛樂數據的佔比將從46%以上下降到25%。

隨著大數據的不斷發展,我們的生活將快速發生改變,大數據引用不斷融入我們的生活中。我們對於大數據會有更好的理解 。

大數據的發展趨勢雖然好,但是面臨很多挑戰的:

對於大數據近幾年的火爆發展和大數據相關就業崗位的增加,有很多IT技術培訓機構都瞄準了大數據培訓行業的機會不斷的開設大數據培訓班,讓許多想要從事大數據的人通過參加大數據培訓班快速的進入到大數據行業。隨著大數據培訓行業的不斷發展,相關的發展問題也越來越多,挑戰性也越來越大。那麼大數據培訓都有那些挑戰呢?

1、隨著大數據行業的不斷發展,相應的大數據培訓班也越來越多,各種各樣的班級形式相互之間的競爭越來越大,越來越激烈,導致宣傳成本大幅增加。

2、行業培訓機構層次不齊,教學質量也是良莠不齊,缺乏規範性。有的培訓班就倆個老師就開課講授,甚至相關教學設備都配不齊。相比較好的大數據培訓就相對好些,不管是教學環境還是師資力量都是比較不錯的。

3、學員對於培訓機構的信任度的提高,就目前而言大多數人對應培訓機構的信任度是普遍比較低的,因外市場上的有許多機構培訓出來的學員是什麼也沒學到工作也找不到的。

4、課程內容的制定,由於國內目前相關的技術都是國外的,想要做到及時更新比較困難,如果掌握前沿技術是大數據培訓的關鍵。

通過上邊的分析,大家一定對大數據現階段的培訓有所瞭解,那們我們要學習大數據的話也可以根據這方面的內容去分析大數據培訓機構是否具有競爭力。

最後大數據發展「錢」景,但有一點須注意,長期堅持學習是不被社會淘汰的法寶。做不到,請繞道。


大數據作為一個全新互聯網的產業,仍然處於快速發展的初期,在這個快速發展的領域,每時每刻都在產生新的事物。從整體發展角度評價,大數據行業的未來將呈現直線上升發展趨勢。數據是資源也是戰略資源,大數據技術就是從數量龐大、結構複雜,快速獲得有價值信息的能力,它已成為學術界、企業界甚至各國政府關注的熱點。近幾年,大數據從「可有可無」的邊緣迅速演變成「必須獲取」的核心。深度挖掘分析把數據變成可操作利用的情報,提供個性化推薦、精細化運營,幫助企業降低成本,增加利潤,大數據的作用在逐漸顯現。數據已成為新的企業戰略制高點,也各個企業爭奪的新焦點。其應用領域也十分廣泛,醫療,教育,體育,金融,娛樂產業,房地產,電影電視劇的製作等等,都用上了大數據。近年來,中國互聯網三巨頭BAT(百度、阿里、騰訊)均耗費巨資投入大數據發展,紛紛建立大數據研究院、大數據實驗室等,提供大數據專業服務,一批大數據專業分析公司也應運而生。各家公司都在搭建大數據平臺,或者已經在生產環境實踐大數據,有些公司已經做了足夠的瞭解,開發準備就緒。那麼大數據該怎麼學,學習大數據需要什麼條件呢?

學習大數據是需要有前提條件的,首先需要你具備一定的編程和Linux基礎。這裡個人覺得會一些Java或者Python是最好的,推薦你看《貝葉斯思維:統計建模的PYTHON學習法》目前流行大數據的Hadoop框架,map-reduce框架可以用Java編程,很多部分都是用開源的Java語言編寫。對於想要轉行大數據的程序員來講,在你工作中,或多或少的瞭解和接觸過大數據相關的東西,這使得你們學起來比起0基礎入門的人要少走很多彎路,擁有更高的學習效率,在這場長跑中已經有了可觀的領先優勢。而對於需要從編程基礎開始的人來說,想要趕上前者的步伐就需要你更多的努力和付出了,你們要花費更多的時間去鑽研和學習,這時候如果有人能給你一些正確的指引將會讓你受益良多。學習的過程相對來講會有更多的困難,但最後你們要到的終點是一樣的,如果你足夠努力彎道超車也不是不可能。


從不惜重金聘用首席數據科學家到採購最新的分析軟體,企業領導者們在應用數據分析提高業務方面可謂極盡所能。

但是,想要真正用好數據分析相關技術,卻沒有那麼簡單。

「數字化業務涉及到的規模、複雜度、數據分佈結構、所需的執行速度等問題意味著:任何僵化和集中的架構或工具都會崩潰,」Gartner副總裁Donald Feinberg說。 「任何企業的持續生存都將取決於靈活的,以數據為中心的架構,以響應不斷變化的速度。」

Donald Feinberg認為,數字化顛覆帶來了挑戰,但也出現了前所未有的機遇。

龐大的數據量與雲的強大處理能力相結合,意味著現在可以大規模地訓練和執行相關演算法,以最終實現AI的全部潛力。

Gartner 建議企業領導者與高級業務負責人應該深入瞭解以下十大技術趨勢,並討論他們的關鍵業務優先順序,以探索以下主要趨勢在推進這些關鍵業務方面的應用。

1.增強分析(Augmented Analytics)

作為數據分析的高級增強階段,增強分析能為分析計劃帶來更多自動化動能以及創新洞察力。

因為在正式進入數據分析之前,都需要對數據進行抽取、清洗、融合等準備工作,以提高數據分析的效率和準確性,更利於決策。而增強分析則能夠幫助普通用戶在沒有數據科學專家或IT人員協助的情況下,訪問有效數據,並對理論和假設情況展開測試與驗證。

增強型數據分析側重於增強智能的特定領域,利用機器學習(machine learning)轉變分析內容的開發、使用與共享方式。

Gartner表示,到2020年,增強分析將成為分析和BI解決方案的主要賣點。

機器學習和人工智慧、增強型分析將為數據和分析市場帶來顛覆,因為它將徹底改變開發、消費和共享分析內容的方式,可使數據準備、洞察力獲取和洞察力可視化這個過程實現自動化,在許多情況下無需專業的數據科學家

2.增強數據管理(Augmented data Management)

增強數據管理是指利用機器學習功能和AI技術來製作數據管理類別,包括數據質量,主數據管理,元數據管理,數據集成以及資料庫管理系統(DBMS)自我配置和自我調整。

它可以自動執行許多手動任務,為技術水平較低的用戶提供使用數據的機會。它還有助於高技能的技術資源專註於更多的增值任務。

據Gartner預測,到2022年底,藉助機器學習和自動化服務級別管理,數據管理中的手動任務將減少45%。

3.持續智能(Continuous Intelligence)

持續數據可不僅僅是實時數據的時髦說法。它是一種設計模式,指將實時分析與業務運營相結合,處理當前和歷史數據以規定響應事件的行動。

「持續智能代表了數據和分析團隊工作的重大變化,」Gartner研究副總裁Rita Sallam說。「分析和BI(商業智能)團隊在2019年幫助企業做出更明智的實時決策,這是一個巨大的挑戰,也是一個巨大的機會。它可以被看作是運營商業智能的終極目標。」

到2022年,超過一半的重要新業務系統將採用持續智能,使用實時上下文數據來改善決策。

4.可解釋的 AI(Explainable AI)

AI已經越來越多地用於數據管理,但AI解決方案如何解釋為什麼他們得出某些結論?這是可解釋的人工智慧的用武之地。

數據科學和機器學習平臺中的可解釋AI是關於在自然語言中準確性,屬性,模型統計和特徵方面生成數據模型的解釋。

5.圖形分析(Graph)

圖形分析是一組分析技術,可幫助企業探索關注實體(如交易,流程和員工)之間的關係。

到2022年,圖形處理和圖形資料庫管理系統的應用將以每年100%的速度增長。

6.數據結構(Data Fabric)

數據結構是指單一且一致的數據管理框架。它著眼於在分散式數據環境中實現無摩擦訪問和數據共享,而不是孤立存儲。

到2022年,定製數據結構配置將主要用作靜態基礎架構,迫使組織進行新一輪的成本控制,以完全重新設計更動態的數據網格方法。

7.NLP /會話分析(NLP/Conversational Analytics)

到2020年,50%的分析查詢將通過搜索,自然語言處理(NLP)或語音生成,或者將自動生成。

分析複雜的數據組合併使組織中的每個人都可以訪問分析的需求將推動更廣泛的採用,使分析工具像搜索界面或與虛擬助手的對話一樣簡單。

根據另一項單獨研究,NLP 用例非常龐大,預計到 2020 年 NLP 市場價值將達到 134 億美元。

8.商用人工智慧和機器學習(Commercial AI and ML)

Gartner表示,到2022年,75%利用ML和AI技術的新終端用戶解決方案將採用商業解決方案而非開源平臺構建。

商業供應商已經在開源生態系統中創建了連接器,它們為組織提供了擴展AI和ML所需的功能,例如項目和模型管理、透明度、復用、數據沿襲,平臺凝聚力以及開源技術所缺乏的集成。

9.區塊鏈(Blockchain)

區塊鏈等分散式分類賬本技術在數據分析領域看起來很有前景,因為它們可能會在不受信任的參與者網路中提供分散的信任。

分析用例的影響很大,特別是那些利用參與者關係和交互的分支。

但是,根據Gartner的說法,未來幾年,區塊鏈將在這個領域完全起飛。與此同時,企業將部分地與區塊鏈技術和標準集成,這些技術和標準很可能由其主要客戶或網路決定。這包括與您現有的數據和分析基礎架構的集成。

10.持久性內存伺服器(Persistent Memory Servers)

持久存儲器技術旨在降低採用內存計算(IMC)的架構的成本和複雜性。持久性內存代表DRAM和NAND快閃記憶體之間的新內存層,可為高性能工作負載提供經濟高效的大容量內存。

根據Gartner的說法,它有可能升級應用程序性能,可用性,啟動時間,集羣方法和安全實踐。它還將通過減少數據複製的需要,幫助組織降低其應用程序和數據體系結構的複雜性。

「數據量正在激增,實時將數據轉化為價值的緊迫性正以同樣快的速度增長,」Feinberg說。 「新的伺服器工作負載不僅要求更快的CPU性能,還要求大容量內存和更快的存儲。」


趨勢一:提升企業競爭力

隨著互聯網時代的飛速發展,大數據產業已經成為這個時代發展不可或缺的因素,同時也是提升企業競爭力的強力資源。大數據行業有著巨大的價值和資源,只有掌握了大數據,纔能有效地控制資源。在企業的發展過程中,各方都需要通過數據分析來獲取信息。

趨勢二:有效促進技術創新

目前,它主要是由開源的,和一個大數據技術框架系統集成多種技術和架構不斷形成,因此有必要打造出自主創新和開放源碼的組合可供企業使用的新的大數據技術開發的模式。

趨勢三:促進其他行業的發展

藉助強大平臺,大數據開發運維一體化模式快速發展,不斷更新,使大數據的使用效果更加清晰這一顯著的提升在一定程度上促進了大數據的發展。可以說學習技術的快速發展帶動了視覺化技術的發展。特別是對於人機交互,採用特定的原理在此基礎上,將分析結果直觀地展示出來,便於用戶理解。

趨勢四:展現數據資產的價值

在我國未來的發展中,受到不同類型和形式的碼頭的影響,使網路功能不斷豐富,積累了豐富的數據資產,形成了互聯網數據的社會。因此,企業在發展中合理運用大數據挖掘技術技術,可以展示數據資產的價值,從而支持自身的發展。

趨勢五:價值鏈更加完善,突出優勢

利用大數據技術,可以在改造傳統價值鏈的同時,從最初的生產驅動到需求驅動。該企業通過了研究開發、設計、生產等環節完善價值鏈,提高產品服務水平能力,顯示其智力和靈活性的發展優勢。



推薦閱讀:
相關文章