2014-02-11 3 views

답변

1

당신이 중복으로 dataframe을 분할 할 경우, 어쩌면 당신은 .duplicated()에 의해 반환 된 부울 배열 사용할 수 있습니다

>>> df = pd.DataFrame({"A": [1,1,2,3,2,4]}) 
>>> df 
    A 
0 1 
1 1 
2 2 
3 3 
4 2 
5 4 

[6 rows x 1 columns] 
>>> df_a, df_b= df[~df.duplicated()], df[df.duplicated()] 
>>> df_a 
    A 
0 1 
2 2 
3 3 
5 4 

[4 rows x 1 columns] 
>>> df_b 
    A 
1 1 
4 2 

[2 rows x 1 columns] 
관련 문제