數據質量在數據分析中的重要性毋庸置疑,其直接影響數據的產出和數據價值的高低,通常我們對數據質量的判斷主要依據準確性、完整性和一致性三方面。但是,這幾點原始數據往往並不具備。所以數據清洗成為了數據分析的重要前提,並且佔據了整個數據分析工作中80%的時間。
那麼如何通過數據清洗來提高數據質量呢?接下來小編就來教大家10個數據清洗小技巧,希望能幫助小夥伴們提高工作效率~
1、準備工作
拿到數據表之後,先做這些準備工作,方便之後的數據清洗。
(1)給每一個sheet頁命名,方便尋找
(2)給每一個工作表加一列行號,方便後面改為原順序
(3)檢驗每一列的格式,做到每一列格式統一
(4)做數據源備份,防止處理錯誤需要參考原數據
(5)刪除不必要的空行、空列
2、統一數值口徑
這是個無聊而必要的步驟。例如我們統計銷售任務指標,有時用合同金額有時用回款金額,口徑經常不統一。統計起來就很麻煩。所以將不規範的數值改為規範這一步不可或缺。