想要做的事情很多,想要去的地方很多。很多很多隻是想想的事情,在若干年後可能連記都記不起來了。

所以我慢慢的給自己設限,所有的事情to do it,無論它或大或小,投入進去,或者堅持下去,時間應該被使用而不是被浪費。

給自己做的事情做規劃,一旦寫出來,就一定要打勾完成它。

為什麼要去做?什麼時候做?怎麼做?什麼時候做好?做得到底怎麼樣?

現在開始學習數據分析了,用數據分析的方法為自己想做的事情,明確方向。

對未來的猜測有很多種,因為不知道哪一個會真真切切的發生,所以先盡所能去準備好自己能做的。

在萬千行業中pick數據分析師,在各大城市中pick南京。不確切的理由有很多,用數據來看看可能面臨的問題。

猴子老師live:數據分析步驟

關於南京數據分析師需求:

1.提出問題

a)南京數據分析師薪資情況?

b)南京數據分析師主要行業分佈情況?

c)南京數據分析師崗位經驗學歷要求?

通過對這個行業的瞭解,對比自己的情況,找到自己仍需要奮鬥的方向,好好學習,天天向上~

2.採集數據

某招聘網站,爬取20頁招聘信息,共計600條,採集關鍵詞:職位名稱,薪資,經驗及學歷要求,公司名稱,公司規模,公司類型

3.數據清洗

1)選擇子集:隱藏除關鍵詞以外的部分

2)列名重命名:雙擊單元格進行修改

3)刪除重複項:因為記錄中並無職位編碼等唯一識別號,所以在數據中選擇「刪除重複值」,並全選列來識別重複值。

4)缺失值處理:對於空值單元格進行定位,在開始選項卡中的編輯功能中找到查找和選擇按鈕,下拉找到定位功能,定位條件選擇「空值」,定位到缺失值後補全內容。

Tip:輸入後按[Ctrl+Enter]可以批量填充內容。

缺失值處理的四種方法:

  1. 通過人工手動補全
  2. 刪除缺失的數據
  3. 用平均值代替缺失值
  4. 用統計模型計算出的值代替缺失值
初始數據

5)一致化處理

  • 【分列】即對抓取過程中很多合併在一起的部分進行拆分處理:先在需要分列的部分後面插入一列,以免分列後覆蓋原有信息。在數據選項卡中選擇分列功能,選擇「分割符號」選項,下一步選擇輸入分隔符號「-」,最後選擇完成,即可將薪資項分開,重命名為「最高薪資」、「最低薪資」。同理將「經驗及學歷要求」列,用「 」空格符號將「南京」欄位拆分出去並隱藏。
  • 將薪資列符號「k」統一替換掉:在開始選項卡中的編輯欄選擇【查找和選擇】,並選擇替換功能,查找內容「k」,替換內容不填寫,點擊全部替換,將所有「k」替換掉,檢查是否有遺漏。

Tips:還可以通過函數方法提取需要的內容。

FIND函數:查找一個字元串在另一個字元串中出現的起始位置

Left/Right函數:從左/右開始到指定XX位置進行截取Mid函數:在指定位置開始截取一定長度字元
利用LEFT函數提取數據
利用MID函數提取數據
  • 進一步需要將學歷及經驗要求分列,由於沒有統一符號作為標誌,可以選擇通過查找替換功能添加某個固定符號進去,再利用【分列】功能進行拆分提取。我選擇在經驗要求內容後面加 「 」即空格:選擇查找「年」,替換為「年 」、選擇查找「不限」,替換為「不限 」、選擇查找「應屆生」,替換為「應屆生 」,處理後發現「年以內」字樣也被拆開,所以可以進行還原,查找「年 以內」,替換為「年以內 」,即可全部將經驗和學歷由空格符號分開,再利用【分列】功能。
通過查找替換功能實現分列要求

對於內容中有統一固定特點的部分,利用查找替換做統一整理,方便快捷~

  • 處理平均薪資:在「最高薪資」、」最低薪資」後面添加一列「平均薪資」,輸入公式Average。

Tips:數據類型是文本而不是數字時,無法進行運算。可以選擇複製粘貼為數值後再進行分列。

用分列工具處理數據類型
將數值轉換為數字

6)數據排列:開始選項卡中編輯菜單欄裏有排序功能。

7)異常值處理:經過調整之後,數據基本一致化,通過數據透視表功能,查看一下職位列內容:[Ctrl A]全選文字內容,在插入選項卡中選擇【數據透視表】功能,新建工作表中選擇「職位名稱」欄位,發現很多與數據分析無關的職位。則在職位列後插入一列,命名「數據分析師職位名稱」,下面輸入函數=IF(COUNT(FIND({「數據運營」,「數據分析」,「分析師」},A2)),「是」,「否」),可篩選出與數據分析無關的崗位。最後將結果保存到另外一張表上,命名「清洗結果」。

清晰步驟完成。

清洗結果

4.構建模型

  • 添加分析工具:在文件選項卡中,找到「選項」→「載入項」→Excel添加項、轉到→選擇「分析工具庫」→確定,即可在數據選項卡中找到「數據分析」選項。
  • 在「數據分析」選項中選擇「描述統計」,輸入構建模型的區域,並選擇「匯總統計」、「平均值置信度」、「第K大值」、「第K小值」。
構建模型:描述統計

5.數據可視化

通過數據透視表整理出需要對比了解的數據。

------------------------------------------------------------------------------------------------------------------------------------------分界線------以下為數據分析結果------------------

  • 薪資情況:根據統計結果,南京地區數據分析相關行業招聘平均薪資的平均數是9.56k,因為薪資波動較大,最低平均薪資3k(多為實習生及助理職位),最高平均薪資37.5k(多為數據分析工程師及專家),所以該平均數並不能代表整體平均薪資情況,平均薪資中位數7.5k相對更加合理。而招聘中薪資區間在4k~6k的是最多的,佔比15.32%;令人驚訝的是,平均薪資在15k左右的崗位招聘量竟也佔比12.65%,大部分集中在數據工程師或經驗豐富的數據分析師中。
都給多少錢咧?
平均薪資的描述統計分析結果

所以自己對自己首次進入數據分析行業的薪資目標是至少5k以上,還是非常有可能達到的。而且數據分析「錢景」是一片大好,還要靠自己努力不斷攀升level。

  • 行業情況:統計結果中,有123個公司在進行招聘,包括30多種行業,其中對數據分析類崗位需求量最大的行業是互聯網行業,整體佔比約在30%左右,其次是數據服務行業和計算機軟體類行業。
so many行業需要數據分析

根據自己的大學專業—信息與計算科學,可考慮計算機行業發展;根據自己的工作經驗—餐飲行業,也可以選擇餐飲相關類型公司。

  • 經驗要求:根據統計結果,數據分析類行業對招聘者經驗要求大多集中在1~3年,佔整體37.55%,出乎意料的是,有約22.92%的招聘信息是不限制工作經驗的。似乎該行業對學歷要求的門檻並不是很高。經過進一步瞭解發現,數據分析行業的首要要求是能力即技術方面,有基礎的人進入這個行業的機會是比較大的,但是薪資上面,經驗在3年以上的,平均薪資也至少是在15k以上的,相比於沒有經驗的應屆生及經驗較少的應聘者來說,有高出1倍甚至3倍的差別。
經驗重要嗎?

所以,自己需要努力增強基礎技能,得到能夠進入該行業的機會,然後不斷積累沉澱,讓自己在不斷熟悉業務不斷提升技能的同時,取得更高的薪資報酬。

  • 學歷要求:72.33%的招聘信息都是要求本科生學歷的,大專學歷也有19.37%的機會進入該行業,雖然對學歷要求沒有想像中那麼嚴格,但是薪資上面,明顯是碩士學位有更高的起點,平均薪資大約在14.58k,作為本科生平均薪資在10k左右,而這個數據值高於整體招聘信息的平均薪資也是因為數據分析工程師及總監類崗位薪資處於最高平均值37.5k,拉高了整體的平均薪資。
不同的學歷要求及能拿到的薪資

原本考慮考研,但是目前的實際情況還不太允許,自己已經很幸運啦,有機會能進入到這個行業,沒有那麼高的起點也可以通過努力不斷學習進步,如果後期想要有更多更深入的探索,可以在有了實踐經驗後,斟酌考慮繼續深造,我相信只要想學習,無論何時何地都有機會。

  • 另外,根據統計可以瞭解到,數據分析類崗位需求在各種行業中都是有的,哪怕是中小型初創企業,數據分析類崗位需求也佔整體招聘的15%左右。但相比之下,規模較大的公司,該崗位需求量也更高一些,薪資也相對更高。
不同規模的公司對該崗位的需求及平均薪資情況

但我覺得每個崗位都是公司企業的一顆螺絲釘,必不可少,且一定能發揮作用影響整體發展,所以在簡歷投遞中,我對公司規模上不會做嚴格的界限,當然也一定願意在有能力的人身邊學習更多的本領,在積極向上的環境中做好自己的工作。

註:以上數據僅取自南京數據分析類崗位招聘情況的一部分,僅有253條數據,數據量較小,對整個南京數據分析市場需求判斷可能有所偏差。僅用於個人未來規劃判斷。另:其中異常值較多,如部分大公司對數據挖掘工程師及數據總監等的招聘,平均薪資在37k左右,遠遠高於普通數據分析工作的平均薪資,對整體數據也可能有所影響。

-----------------------------------------------------------------------------------------------

在南京工作的租房問題:

根據上述方法,在某租房網站上抓取部分租房信息,並進行數據清洗及整理。

在934條租房信息中,房租的平均值在1482元,最高房租12000元,最低房租300元,波動較大,對平均值影響較大。其中位數1200元能好地表現整體租金情況,於我而言,有至少一半的房源租金是我可以接受的。

其中,單間相比於整租來說更便宜一些,平均租金分別為1126元和2092元,

合租還是自己住?
不同戶型的租金價格

單間類房源中,兩個人合租租金價格最為便宜,平均租金在852元左右;在整租的房源中,1室1衛的小公寓平均租金在1727元左右,其他類型租金都比較高。

所以:除去較為高檔的小區外,南京地區的大部分租房租金還是在我的承受範圍之內的,也就是說在1500元以內租到房子的概率肯定在50%以上(平均租金中位數為1200元),所以可以嘗試選擇自己可以接受的較大概率事件。但如果想要自己獨立租一套房子,壓力可能會更大一些,後期可以再慢慢努力。

註:以上數據僅取自南京整體租房信息的一部分即934條,數據量不夠大,有可能有一定的偏差,另:由於小區形態不同,高端住宅小區的租金價格偏高,屬於異常值,對整體數據判斷有一定影響。


此次通過Excel對於自己想要做的事情,想要去的城市進行了簡單的分析瞭解,後期學習到更多的數據分析方法還會回來進行補充。通過數據去解決自己的疑慮,比乾等著看熱鬧有趣多了,just do it~(* ̄︶ ̄)

推薦閱讀:

相關文章