stata如何刪除重複值_stata刪除重複值
stata如何刪除重複值_stata刪除重複值
請問 (1) 在stata中 有某兩個或多個樣本所有變數或部分變數相同,想刪除重複的樣本 僅保留一個如何操作。
(2)想有條件地刪除樣本,比如 if year==2007 ,命令是怎樣的呢?
我的問題的兩個例子就是:
(1) id year age height1 2007 5 1.21 2007 5 1.42 2008 5 1.2
比如在這個數據中,前兩個樣本id year age相同,我想要刪除掉其中一個,僅保留一個,然後還想附加一個條件,就是刪掉height較小(1.2)的那個。(2)還是上面的數據,然後我想要刪掉 year==2007的全部樣本。
請問這兩個命令如何操作,謝謝了。
最佳解答:
*設數據中無缺失值
bys id year age (height): g n=_nbys id year age (height): g N=_Nkeep if n==Ndrop n N如果想要刪除height較大的數據 需要怎麼做呢
*先gsort排序,再duplicates去除第二個相同樣本
gsort year -height數據分析培訓
duplicates drop id-age, force
推薦閱讀: