項目背景

人工智慧時代,我們每天都在接觸各種各樣的信息和數據推送,如何能夠在這龐大的數據羣中找到未來的機會或許是你我的當務之急。你可以選擇使用基礎的Excel,因為它也是日常工作中最常用的工具,如果不考慮性能和數據量,它足以讓你應付絕大部分的分析工作。Excel對十萬條以內的數據處理起來絕對沒有問題,但大數據時代從來就不缺數據,很多公司的數據都放在資料庫中,因此這時我們就需要使用操作資料庫的語言如SQL語言、R語言、Python等來對其進行分析處理。如何將數據分析的結果直觀、形象地展示出來,運用於實際的決策、分析以及對於公司方向的把控,這就就需要我們進一步將數據可視化和進行相應PPT商業數據報告的製作。

項目簡介

為了了解數據分析師崗位的需求,從招聘網站上獲得相關信息是比較便捷和十分必要的。

本次項目通過GooSeeker爬蟲軟體對BOSS直聘上的數據分析師職位數據進行爬取後,然後進行探索和分析,以具體數據分析數據分析師職位大概情況。

數據來源

本項目所使用的數據全部來自BOSS直聘,通過GooSeeker爬蟲軟體爬取。

選擇BOSS直聘作為本項目的數據源,主要是因為相對於其他招聘網站,BOSS直聘上的崗位信息非常完整、整潔,極少存在信息的缺漏,並且幾乎所有展現出來的信息都是非常規範化的,極大的減少了前期數據清理和數據整理的工作量。但是BOSS也有一大缺陷,就是一次只能蒐集10頁,每頁30條,最多300條信息。

項目目的

項目希望通過實際的招聘數據來描述目前數據分析師崗位基本情況:

數據分析師對學歷和工作經驗的要求;

數據分析師的地域及行業分佈;

招聘數據分析師的企業的融資狀況和規模;

不同城市、經驗、行業、學歷、企業融資狀況的薪酬分佈情況;

從用人單位的角度看,數據分析師應當具備的技能。

數據採集與清洗

在BOSS直聘搜索「數據分析」後的招聘界面如下:

我通過「數據分析」為關鍵詞在BOSS直聘上搜索了相關數據分析師崗位需求,使用GooSeeker爬蟲軟體進行相關數據的爬取。爬取後的局部數據如圖:

使用Excel清洗數據,按照職位名稱(position)、公司名稱(company)、所在城市(city)、最低薪酬(min salary)、最高薪酬(max salary)、平均薪酬(average salary)、學歷要求(edu)、經驗要求(exp)、行業類別(industry)、公司融資階段(finance)和公司規模(scale)分列,整理後得到299條數據記錄和11個變數,缺失值較少。清洗後局部如圖:

數據分析師職位對學歷的要求

很明顯,對於數據分析崗位而言,本科學歷要求是目前主流,其次是大專學歷,碩士學歷和部分不限學歷只佔據極個別的崗位需求。

數據分析師職位對經驗的要求

工作1-3年經驗的熟手需求量最大,其次是3-5年工作經驗的資深分析師。對應屆生的需求很少,但要求10年以上的更少,在獲取的299條信息中,僅為1個需求。

我們大致可以猜測出:

數據分析是個年輕的職業方向,大量的工作經驗需求集中在1-3年;

對於數據分析師來說,5年是個瓶頸期,如果在5年之內沒有轉型或者質的提升,大概以後的競爭壓力會比較大;

應屆生找數據分析工作可能比較困難,需要累積實習經驗。

數據分析崗位城市分佈

在這299條數據分析崗位招聘信息裏,有89條來自北京市,近1/3的需求量全國第一。排在前八的城市分別是:北京、上海、深圳、杭州、南京、廣州、成都、廈門。

數據分析這一職業大量集中在北上深廣大一線城市,以及杭州、南京這些互聯網和電子商務企業的聚集地也在逐漸增多。其中北京市的需求量是上海的兩倍多,不得不感嘆帝都的數據分析人才需求量之大。上海作為國內經濟中心,緊隨其後。深圳有騰訊、華為等企業總部,杭州則有阿里巴巴,數據人才的需求也都很大。

總而言之,想從事數據分析的小夥伴請重點關注北上深和杭州的招聘信息。當然,從另一個方面說,這些城市的競爭壓力想必也是很大的。

數據分析崗位行業分佈

互聯網、計算機軟體、移動互聯網、互聯網金融和電子商務行業為數據分析提供了大量的就業機會,數據行業的繁榮也相應的催生了專門提供數據服務的公司。雖然傳統行業對數據人才的需求目前並不顯著,但相信隨著互聯網+對傳統行業的滲透,這些行業對數據人才的需求也會慢慢增加。

公司融資狀況分佈

上市公司對數據人才的需求最大;其次是不需要融資和D輪及以上融資公司,這類公司大多處於初創型,急需數據人才加快公司發展。天使輪的公司規模大多較小,對數據分析和數據挖掘的需求也相對較小。

公司規模分佈

10000、1000-9999人的公司對數據分析師的需求最大,反之,20-99人的公司因為規模小,需求也少。但總體來看,除極小規模的公司以外,數據分析崗位受公司規模的影響不大。

城市與薪酬分佈

排名前八的城市(北京、上海、深圳、杭州、廣州、南京、廣州、成都、廈門)的薪酬分佈情況總體上比數據人才需求小的那些城市分散,可能因為這些大城市企業種類多,開出的工資差異也大。北京、上海、深圳、杭州平均薪酬(中位數)分佈中位數大約在1萬元~2萬元之間/每月,居全國首位。其次是南京、廣州、成都、廈門。從待遇上看,數據分析師在北京、上海、深圳、杭州是不錯的選擇。武漢、東莞兩城市由於獲取的數量少(基數小),目前從招聘的情況來看,有點異軍突起的錯覺,但是還是要根據實際的情況的綜合評估考慮。

[完]

推薦閱讀:

相關文章