stata如何刪除重複值_stata刪除重複值

請問 (1) 在stata中 有某兩個或多個樣本所有變數或部分變數相同,想刪除重複的樣本 僅保留一個如何操作。

(2)想有條件地刪除樣本,比如 if year==2007 ,命令是怎樣的呢?

我的問題的兩個例子就是:

(1) id year age height1 2007 5 1.21 2007 5 1.4

2 2008 5 1.2

比如在這個數據中,前兩個樣本id year age相同,我想要刪除掉其中一個,僅保留一個,然後還想附加一個條件,就是刪掉height較小(1.2)的那個。

(2)還是上面的數據,然後我想要刪掉 year==2007的全部樣本。

請問這兩個命令如何操作,謝謝了。

最佳解答:

*設數據中無缺失值

bys id year age (height): g n=_nbys id year age (height): g N=_Nkeep if n==Ndrop n N

如果想要刪除height較大的數據 需要怎麼做呢

*先gsort排序,再duplicates去除第二個相同樣本

gsort year -height數據分析培訓

duplicates drop id-age, force

推薦閱讀:

相關文章