做過數據產品的人都會知道,質量高的數據對於產品的意義。筆者在之前曾經歷過數據質量管理的具體功能設計,算是較為完整地感受過數據質量管理過程。所以在此簡單復盤下經驗,藉此拋磚引玉。
為什麼有這麼多人強調改善數據質量管理的重要性,用一種很抽象的比喻描述,如果把整個數據應用比作人體的話,那好的數據就相當於新鮮和沸騰的血液,能讓我們的身體充滿活力,高效地工作思考。而質量差的血液攜帶廢物和毒素,隨著毒素越積越多,血液以及血管就會發生病變,血液流經的全身各處器官也會大受影響。如果非要要具體的數據證明,我摘取了一些專家的統計:
影響因素
在此附上數據的生命周期圖,包括各環節的數據流轉和數據處理。
評估維度
具體工作
如何通過具體工作來貫徹落實數據質量管理呢?由於數據質量管理是貫穿數據整個生命周期的,所以根據數據的各環節進行分點描述:
數據稽核
(1)定義
(3)校驗流程
2、配置調度規則,例如調度頻率等。
2)重複值處理
3)異常值處理
4)不一致值處理
5)丟失關聯值處理
參考資料
談數據稽核(3)
重點!速查文檔地址請戳此
推薦閱讀: