捉摸不透,大叔已經好久沒分享筆記了,分析了一下,主要原因有兩個,其一是懶,其二是很懶。。。

今天抽空分享個數據清洗的小案例。


這個案例有兩個點,一個是數據源要清洗,其次,問題也得清洗。

先來第一步,把數據源清洗為一個一維表,大夥應該都沒問題的,之前也分享過好幾次了

然後再把平均分列拆成列表,方便做條件的時間調用,直接一個split就好了。

接著把字元串裏的數據提取出來,記得要轉為數值哦

好了第一步數據源清洗好了,第二步條件,大叔覺得第二步可能稍稍比第一步繞一點點,

大叔的思路是把條件都拆出來,然後循環的對清洗好的數據源表做篩選,再把平均份合併,最後計算。

但循環的時候會發現有個點,就是條件表並不是所有條件都是用姓名,我一些是指定行號,那麼我們循環的時候就要注意了,要加一個條件判斷。大叔還是選擇先不拆分吧,這樣邏輯會淺析一點。

首先我們先判斷下是否包含有數字(有數字代表要索引行號),沒數字就直接可以篩選了(注意,大叔這裡又偷懶了,沒考慮有多個姓名的情況,理論上要加一層Transform)

接著寫第二個條件指定索引行號的,大叔套路就直接提取字元中的數字,注意記得要減1,因為M裏的索引跟大多編程語言一樣起始索引是從0開始。

然後發現又要做一層判斷,有行號索引跟姓名在一起的,我們又分開做。

這裡跟上面節省的一樣,理論上也要加Transform


分享結束,感謝觀看,Thanks!


推薦閱讀:
相關文章