2017-03-15 1 views
1

팬더에서 볼 수있는 몇 가지 예가 혼란 스럽습니다. 예를 들어 이것은 내가 최근에 읽은 게시물에서 단축 : df[df.duplicated()] 그냥 df.duplicated()를 사용하여 대 : df 필요가 외부에있을 이유가 이해하지 못하는 어떤팬더 구문 예제 혼동

df[df.duplicated()|df()]

입니다. 처음 예제를 본 적이없는 문서에서는 모든 것이 df.something_doing() 형식으로 표시됩니다. 그러나 나는 df[df.something_doing()]과 같은 많은 예를보고 외부에있는 df이 무엇을하는지 이해하지 못합니다.

답변

2

df.duplicated()는 부울 값을 반환합니다. 언급 된 조건이 충족되면 True를 마스크로 제공하고 그렇지 않으면 False를 제공합니다. 당신은 부울 마스크에 따라 dataframe의 조각을 원하는 경우에 , 당신이 필요합니다에만 열을 원하는 경우 'ID가'입니다

df[df.duplicated()] 

또 다른 간단한 예,이 dataframe

col1 id 
0 1  a 
1 0  a 
2 1  a 
3 1  b 

을 고려 'A',

df.id == 'a' 

당신에게 부울 마스크 그러나

을 줄 것이다

은 데이터 프레임을 반환합니다.

col1 id 
0 1  a 
1 0  a 
2 1  a 
관련 문제