你好,如果你是零基礎自學大數據的話,前期不太建議直接看書,可以先從視頻開始,後續覺得有知識點沒那麼理解時,再通過博客、書籍來補充比較好。而且大數據的內容是比較多的,有很多的框架組件,下面圖片是我自己準備的「大數據書架」,有需要可以自提電子版的。 具體大數據開發學習路線可以參考下方鏈接,是我自學大數據拿到offer總結的一些資料,學習路線中包含的資料都可以通過文章鏈接獲取。我的大數據學習之路?mp.weixin.qq.com希望對你有幫助~ 你好,如果想看書的話,你在百度,谷歌等搜Hadoop,數據倉庫,Scala,Spark,Flink等,或者直接搜大數據開發.在出現的相關書籍中找最靠前的,銷量最高的,肯定沒錯.不過我覺得看書沒有看視頻學習效果好,我這裡有大數據的一些資料,挺好的.你可以參考下.鏈接:https://pan.baidu.com/s/12eHX-rpOwBHG1PwRzQQd-w 密碼:3o4f 想自學大數據,想問問需要看什麼書呀?主要分為4個階段來學習:一、編程學習階段Java是大數據學習需要的編程語言基礎,大數據的開發基於常用的高級語言。經典圖書推薦:Java 高效編程(Effective Java)二、大數據核心知識 Linux體系、Hadoop離線計算大綱、分散式資料庫Hbase、數據倉庫Hive、數據遷移工具Sqoop、Flume分散式日誌框架、Scala編程語言、大數據離線分析Spark、數據實時分析Storm、消息訂閱分發系統Kafka等。經典圖書推薦:《大數據技術全解》、《Hadoop權威指南》、《Hive編程指南》、《Hbase權威指南》《Spark 快速大數據分析》、《Spark機器學習:核心技術與實踐》 三、大數據項目實戰數據獲取、數據處理、數據分析、數據展現、數據應用。數據分析師,還要有良好的數學功底,了解一些描述統計相關的內容,需要有一定公式計算能力,了解常用統計模型演算法;對於數據挖掘工程師來說,各類演算法也需要熟練使用,對數學的要求是最高的。 經典圖書推薦:《概率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用 》等。四、人工智慧AI大數據學習最終的目的是應用,大數據技術可以應用在各個領域,最重要的領域之一是人工智慧。經典圖書推薦:《機器學習》、《模式分類》、《數據挖掘實用機器學習技術》、《人工智慧及其應用》、《概率圖模型》希望可以幫助到你! 目前大數據在職。如果是在校生,建議還是先夯實基礎。計算機核心課程:計算機網路、操作系統,數據結構好好學一學。如果是在職人員,想轉行到大數據,業餘時間在 B 站看相關的視頻就可以,這裡就不直接推薦了,避免打廣告嫌疑。關於書籍,推薦幾本我看過的、比較不錯的。 Hadoop系列 Hadoop 底層的 HDFS/Yarn 仍然是大數據團隊的首選組件。所以很有必要從 hadoop 入門開始學習大數據。MapReduce 雖然已經慢慢退出大數據計算的舞台,但是作為數據引擎的鼻祖,分而治之的思想一直保留到現在,被目前流行的優秀的計算框架借鑒,在內存管理、計算模型的上做了很大的優化,後面的 Spark、Flink就是目前比較流行的內存計算框架。 Hadoop權威指南:大數據的存儲與分析(第4版)京東¥ 116.90去購買?Hive 是目前建設數倉的必備工具,目前主流的大數據集計算引擎都已經實現了與 Hive 的對接,Flink 最近幾個版本也在優化與 Hive 的整合。Hive 的元數據模型以及廣大的用戶群體,決定了它在大數據領域的絕對地位。Hive編程指南京東¥ 34.50去購買?[圖書]Hadoop YARN權威指南 計算機與互聯網 |63939京東¥ 59.00去購買? Spark系列 Spark技術內幕:深入解析Spark內核架構設計與實現原理京東¥ 47.50去購買?Spark Streaming實時流式大數據處理實戰京東¥ 34.50去購買? 大數據總覽 大數據之路:大數據實踐京東¥ 52.14去購買? Flink 這是我最近開始看的一本書,國內上市比較晚,是阿里的工程師翻譯過來的,很值的一看。基於Apache Flink的流處理京東¥ 66.00去購買? 數睿數據:看完大呼過癮!豆瓣高分系列書單,讓你從小白到精通數據分析!?zhuanlan.zhihu.com可以作為啟蒙讀物 首先需要有JAVA,Linux和SQL的基礎,然後學習大數據生態體系,包括:hadoop,spark,flink,nosql,其實我說的這些,就是學習的一個步驟。重點是掌握大數據的原理,思想和架構。 問題太模糊了,是想學大數據編程嗎?建議先百度了解下什麼是大數據、大數據時代、大數據思維、大數據編程等,先理解一下這個概念。 推薦閱讀:
你好,如果你是零基礎自學大數據的話,前期不太建議直接看書,可以先從視頻開始,後續覺得有知識點沒那麼理解時,再通過博客、書籍來補充比較好。
而且大數據的內容是比較多的,有很多的框架組件,下面圖片是我自己準備的「大數據書架」,有需要可以自提電子版的。
具體大數據開發學習路線可以參考下方鏈接,是我自學大數據拿到offer總結的一些資料,學習路線中包含的資料都可以通過文章鏈接獲取。
希望對你有幫助~
你好,如果想看書的話,你在百度,谷歌等搜Hadoop,數據倉庫,Scala,Spark,Flink等,或者直接搜大數據開發.在出現的相關書籍中找最靠前的,銷量最高的,肯定沒錯.
不過我覺得看書沒有看視頻學習效果好,我這裡有大數據的一些資料,挺好的.你可以參考下.鏈接:https://pan.baidu.com/s/12eHX-rpOwBHG1PwRzQQd-w 密碼:3o4f
想自學大數據,想問問需要看什麼書呀?主要分為4個階段來學習:
一、編程學習階段
Java是大數據學習需要的編程語言基礎,大數據的開發基於常用的高級語言。
經典圖書推薦:
Java 高效編程(Effective Java)
二、大數據核心知識
Linux體系、Hadoop離線計算大綱、分散式資料庫Hbase、數據倉庫Hive、數據遷移工具Sqoop、Flume分散式日誌框架、Scala編程語言、大數據離線分析Spark、數據實時分析Storm、消息訂閱分發系統Kafka等。
《大數據技術全解》、《Hadoop權威指南》、《Hive編程指南》、《Hbase權威指南》
《Spark 快速大數據分析》、《Spark機器學習:核心技術與實踐》
三、大數據項目實戰
數據獲取、數據處理、數據分析、數據展現、數據應用。
數據分析師,還要有良好的數學功底,了解一些描述統計相關的內容,需要有一定公式計算能力,了解常用統計模型演算法;
對於數據挖掘工程師來說,各類演算法也需要熟練使用,對數學的要求是最高的。
《概率論與數理統計》、《統計學》推薦David Freedman版、《業務建模與數據挖掘》、《數據挖掘導論》、《SAS編程與數據挖掘商業案例》、《Clementine數據挖掘方法及應用 》等。
四、人工智慧AI
大數據學習最終的目的是應用,大數據技術可以應用在各個領域,最重要的領域之一是人工智慧。
《機器學習》、《模式分類》、《數據挖掘實用機器學習技術》、《人工智慧及其應用》、《概率圖模型》
希望可以幫助到你!
目前大數據在職。如果是在校生,建議還是先夯實基礎。計算機核心課程:計算機網路、操作系統,數據結構好好學一學。如果是在職人員,想轉行到大數據,業餘時間在 B 站看相關的視頻就可以,這裡就不直接推薦了,避免打廣告嫌疑。
關於書籍,推薦幾本我看過的、比較不錯的。
Hadoop 底層的 HDFS/Yarn 仍然是大數據團隊的首選組件。所以很有必要從 hadoop 入門開始學習大數據。MapReduce 雖然已經慢慢退出大數據計算的舞台,但是作為數據引擎的鼻祖,分而治之的思想一直保留到現在,被目前流行的優秀的計算框架借鑒,在內存管理、計算模型的上做了很大的優化,後面的 Spark、Flink就是目前比較流行的內存計算框架。
Hadoop權威指南:大數據的存儲與分析(第4版)京東¥ 116.90去購買?
Hive 是目前建設數倉的必備工具,目前主流的大數據集計算引擎都已經實現了與 Hive 的對接,Flink 最近幾個版本也在優化與 Hive 的整合。Hive 的元數據模型以及廣大的用戶群體,決定了它在大數據領域的絕對地位。
Spark技術內幕:深入解析Spark內核架構設計與實現原理京東¥ 47.50去購買?Spark Streaming實時流式大數據處理實戰京東¥ 34.50去購買?
大數據之路:大數據實踐京東¥ 52.14去購買?
這是我最近開始看的一本書,國內上市比較晚,是阿里的工程師翻譯過來的,很值的一看。
可以作為啟蒙讀物
首先需要有JAVA,Linux和SQL的基礎,然後學習大數據生態體系,包括:hadoop,spark,flink,nosql,其實我說的這些,就是學習的一個步驟。重點是掌握大數據的原理,思想和架構。
問題太模糊了,是想學大數據編程嗎?建議先百度了解下什麼是大數據、大數據時代、大數據思維、大數據編程等,先理解一下這個概念。