2014-04-04 1 views
2

Pandas에서 우리는 기본적으로 중복 데이터의 첫 번째 행을 유지 dataframe.drop_duplicates()를 사용하여 중복을 제거 할 수 있습니다. keep_last = True이면 마지막 행이 유지됩니다. 팬더 drop_duplicate을 사용하여 임의의 행을 유지하고 중복 행을 삭제할 수있는 방법은 무엇입니까? 어쩌면떨어지고 중복 무작위로

답변

4

:

idx = np.random.permutation(np.arange(len(df))) 
df.iloc[idx].drop_duplicates() 
관련 문제