解開數據之謎---我的數據分析之路
一、發現問題
從2009年大學畢業到現在已經工作9年了,本科學的是信息管理與信息系統專業,畢業之後卻幹了9年的金融公司後台管理的工作;從2016年開始就有了學習數據分析的想法,因為本身對這方面很感興趣,而且所學專業讓我入門更輕鬆一些,但是因為中間公司的業務發展,工作很忙,所以這個想法就放下了,到了2017年整體金融市場的環境蕭條,導致公司的業績也是一路下滑,為了降低成本一再裁員,雖然我還未受波及,但是也總感覺頭上懸了一把達摩克利斯之劍。深深的感覺到了危機,總結自己工作這幾年發現除了會管理後台其他什麼都不會做。通過自我分析和查閱資料發現數據分析的工作很適合自己,立即下定決心確定了以後的職業方向,下一步就是學習數據分析的知識,也是偶然的機會看到猴子老師的文章,覺得猴子老師的方法很好,就想和猴子老師學習數據分析的工具和方法,希望通過和猴子老師的學習,完成轉行,成功拿到offer,加油。
二、分析問題
- 數據分析(初級)的核心技能:Excel,概率論與數理統計,SQL;
- 數據分析(中級)的核心技能:概率論與數理統計,SQL,Python/R語言、數據可視化處理;
- 數據據分析(高級)的核心技能:概率論與數理統計,SQL,Python/R語言、機器學習;
根據我自身的情況,現階段的學習任務應該是快速學習初級階段,然後重點學習中級和高級的技能。
三、解決問題
1. 確定感興趣的數據分析的行業
金融行業。選擇金融行業的原因一是因為自己在這個行業工作很多年對這個行業很熟悉。二是個人認為金融行業未來還是很有前景的,三是金融行業現在對數據分析師的需求量很大,通過學習,掌握了核心技能之後工作會相對好找一些。
2. 找到該行業的職業需求
3. 獲取這個行業相關的數據
- 由於我一直從事的都是金融行業風險類的工作,轉行也是想轉相關方向,所以我的數據選擇了kaggle上下載的german-credit-risk(德國信貸風險)數據;
- 雖然數據量有點小只有1000條數據,但是我想通過處理這些數據來學習方法和思路;以後會處理更多更大的數據;
- 數據源地址:
German Credit Risk
- 數據包包含9個欄位,分別如下:
- Age年齡(數字)
- Sex性別(文字:男性,女性)
- Job工作(數字:0 - 非技工和非居民,1 - 非技工和居民,2 – 技工,3 - 高級技工)
- Housing住房(文字:自有,租住或沒有)
- Saving accounts活期儲蓄賬戶(文字 - 小,中等,相當豐富,豐富)
- Checking account普通支票賬戶(數字,用德國馬克表示)
- Credit amount信用額度(數字,以馬克表示)
- Duration久期(數字,以月表示)
- Purpose目的(文字:汽車,傢具/設備,廣播/電視,家用電器,維修,教育,商業,度假/其他)
一、學習計劃
我現在的工作會經常加班,而且我還要一個考試要複習,所以暫時每天能保證1個小時的有效學習時間,12月份時間會充裕一些,到時候我會調整我的學習計劃,暫定學習計劃如下:
- 描述統計分析(7天)
- 使用Excel進行數據分析(7天)
- 使用SQL進行數據分析(10天)
- 可視化和ppt(5天)
- 業務知識(7天)
這個學習計劃的時間不是很充分,我會抓緊一切碎片化的時間進行學習,保證學習質量。
推薦閱讀: