stata如何刪除重複值_stata刪除重複值

請問（1）在stata中有某兩個或多個樣本所有變數或部分變數相同，想刪除重複的樣本僅保留一個如何操作。

（2）想有條件地刪除樣本，比如 if year==2007 ，命令是怎樣的呢？

我的問題的兩個例子就是：

（1） id year age height1 2007 5 1.21 2007 5 1.4

2 2008 5 1.2

比如在這個數據中，前兩個樣本id year age相同，我想要刪除掉其中一個，僅保留一個，然後還想附加一個條件，就是刪掉height較小（1.2）的那個。

（2）還是上面的數據，然後我想要刪掉 year==2007的全部樣本。

請問這兩個命令如何操作，謝謝了。

最佳解答：

*設數據中無缺失值

bys id year age (height): g n=_nbys id year age (height): g N=_Nkeep if n==Ndrop n N

如果想要刪除height較大的數據需要怎麼做呢

*先gsort排序，再duplicates去除第二個相同樣本

gsort year -height數據分析培訓

duplicates drop id-age, force

數據分析師需要哪些技能？