기본적으로 데이터 프레임에서 중복 된 데이터를 삭제하고 두 개의 열 (이름 및 클러스터)별로 그룹화 된 열의 가장 낮은 값을 유지하려고합니다. 여기 내 dataframe 경우 예를 들어, :groupby 및 r 데이터 프레임에서 가장 낮은 값 제거
Name cluster score
19 Steve a1 30
51 Steve a2 30
83 Steve a2 -28
93 Steve a2 -38
115 Bob a4 30
147 Bob a5 -8
179 Bob a5 30
팬더와 SQL이는 GROUPBY 수행 할 것입니다하지만 난 R에서 그것을 알아 내기 위해 사투를 벌인거야 정말조차 시작. 이름과 클러스터의 이중 정렬을 시도했습니다. 첫 번째 groupby는 Name이고 cluster입니다. 그래서 3 개의 'Steve, a2'가 있기 때문에 가장 낮은 점수를 지키고 싶습니다.
이 Name cluster score
19 Steve a1 30
93 Steve a2 -38
115 Bob a4 30
147 Bob a5 -8
어떤 도움이