做為在數據行業十多年的從業者,給一些建議吧。

雖然我研究生方向也是數據方向,我並不想講如何能拿到大數據課程高分,而是想講講如何學習更好適合自己未來發展。

我們假定一個前提就是你想找一份大數據方向的工作。

大數據方向職位基本分三大類,大數據研發,大數據分析和大數據產品。三個職位要求有方向上的區別的。

如果自己有很強編程能力首選大數據研發方向,研發大概又分成數據應用研發和數據基礎研發。大部分公司職位是數據應用研發,使用Python,SQL,Java完成一些腳本和數據類工具開發工作,以及數據倉庫方法論學習。數據基礎研發,更多是數據計算,存儲,分析類平臺,例如阿里自己改造hadoop搞的maxcompute(原odps)更多需要深入理解計算系統設計方法,編程語言偏底層例如C,C++。

大數據分析,需要具有常見的演算法模型使用能力。不需要設計研發演算法,但是要對各類機器學習演算法決策樹,隨機森林,梯度類,聚類,分類等演算法,涉及統計學,概率論等。其實更多企業對問題進行分析時候,很多時候使用是運營類分析方法,而不是演算法,例如針對一個流程在哪個環境出現了問題,通常使用漏斗模型分析。分析類工作需要深入瞭解分析對象的業務情況,和數據質量情況,有時候甚至自己處理臟數據問題,這是工作的基礎。

大數據產品,首先做為一個產品經理,需要具備對業務問題產品化的解決能力,其次需要了解大數據常見技術,分析方法,能夠根據問題設計涉及不同技術和分析方法的產品解決方案。數據產品經理,與其他產品經理相比,最核心都是產品邏輯分析能力。因此,不僅僅要對上訴大數據的各類技術包括演算法學習瞭解,更重要需要學習邏輯分析方法,提高能力,例如,金字塔原理,啟示錄,神一樣的產品經理等,需要學習邏輯學,C端應用類產品需要學習心理學,最好都學習一點哲學。

分析和產品,同時也強調對用戶需求的溝通和理解,這是分析和產品工作的基礎。雖然技術類崗位尤其應用技術類崗位也需要但是要求不算太高。

先回答這麼多。


其實答案都在課本里和課堂裏。

需要認真聽課嗎?分情況。如果老師水平不錯,那就跟著老師走沒問題。如果老師水平不行,建議自學,然後找到不懂的問老師。曾經有一個理論非常好,就是幾乎所有的高難度領域的人本質上都是自學的。複雜高深的知識是無法傳授的,只能給予老師自己的理解,真正的掌握還是要靠學生通過自己的方式理解。

文獻讀不讀?讀。而且很重要。如果有不錯的英文能力,就去讀原文。如果沒有,就去學英語。這裡不開玩笑,文獻閱讀能力將是以後你在這個行業裏屹立不倒的基礎,跟別人競爭的砝碼。市面上或者課本里對於某一個演算法會有很多很多的教學,但是萬變不離其宗,這個宗就是原文獻。很多東西,當初演算法的發明者和研究者已經都講清楚了,甚至各種舉例,生怕讀者看不懂。大量的教學只不過是對最初坐著的粗略的模仿罷了。

做項目重要嗎?非常重要。很多理論,只有在用的時候,才發現自己真正開始學到了。實踐是鞏固學習知識的最好的方法。而大學往往有很多免費的資源和機會讓你去實踐,為何不好好利用?如果真的打算在這個行業幹,就好好做項目。

演算法。在國內大數據行業幹,沒有過硬的演算法是喫不開的。所以建議從大學期間就開始刷題。推薦fucking algorithm github。也可以去看別的教學,或者直接去leetcode刷題。演算法題不難,難在要早點開始。開始的越早,你到後面會發現越簡單。一切知識時間問題罷了


這個專業應該是最近纔有的,之前的專業都是計算機科學與技術,網路安全。現在隨著人工智慧和大數據火了起來,各個學校也開始追熱點,開了這門專業。

說下我的理解,專業都離不開他的本質。計算機的本質是什麼呢? 編程,操作系統,數據結構,網路,編譯原理,演算法,數學,概率論等基礎的東西。

如果要實用一些,和大數據掛上鉤,那可以學習下分散式系統設計和原理,資料庫原理,另外可以瞭解下網路框架

學校裏學習的這些看著聽沒用的,都是理論知識,如果對實踐感興趣,可以找一個大數據框架源碼來閱讀和時間,最近比較火的flink,hudi以及之前比較經典的hbase,hive,hadoop找一個來弄熟悉了就是對自己巨大的提升

分類來說,如果偏工程領域的,建議現在就開始多實踐編程和演算法,多練習leetcode等,以及在大型的工程項目中去實踐,我上面說的在github上都可以找到源碼,在閱讀源碼過程中你會有各種各樣的問題,比如一致性問題,存儲問題,分散式計算,容錯等等,這樣你就知道課本中知識的用處。

如果偏分析和演算法領域,建議把數學,概率論,離散數據學習好,多練習一些建模比賽,推導一下常見的機器學習,深度學習等演算法原理,和學習中的知識相結合,在推導之外,用目前成熟的機器學習框架比如tensorflow等來聯繫一下小demo,由淺入深,然後參加一些比賽,用python等來實踐演算法,比如多參加kaggle,這樣提升是最快的。在自己去門後就可以去挑戰更深入的前沿領域了

最後補充一下,不要被專業所侷限,大數據專業本質也是計算機領域,學習的內容都是差不多的,就業比較廣,找到自己的興趣點,然後深入學習就可以了


需要把基礎架構學好,另外要多去思考,假如換成這樣可不可以


在知識結構的設計上,大數據應用技術涉及到數學、統計學、編程語言、大數據平臺、操作系統、數據分析工具等內容,另外也會涉及到物聯網、雲計算等相關方面的內容。數學和統計學是大數據技術的重要基礎,即使從事落地應用也要重點掌握一些常見的演算法,要學好打牢基礎

編程語言的學習通常會集中在Java、Python、Scala、R等編程語言上,從目前就業的角度出發,Java是不錯的選擇。如果未來想從事大數據應用開發崗位,那麼需要重點學習一下編程語言部分。大數據平臺的學習是大數據應用技術的重點學習內容之一,大數據平臺的學習內容包括大數據平臺的部署、調試、維護等內容。目前Hadoop、Spark是比較常見的大數據平臺,同時這兩個平臺也比較適合初學者學習和實驗。經過多年的發展,目前大數據平臺的組件已經逐漸豐富,所以這部分學習內容也相對比較多。數據分析工具的學習可以從基本的Excel開始,然後進一步學習各種BI工具,在學數據分析工具的過程中也涉及到一些常見的數據分析演算法以及資料庫知識。TABS(泰博斯)創新實驗室-背景提升領航者?

www.tabs-lab.com圖標
推薦閱讀:
相關文章