2016-09-01 8 views
1

아래와 같은 데이터 프레임이 있습니다. 두 열 모두 문자열이며, ValCol은 쉼표로 구분 된 정수 문자열입니다. 인덱스는 의미없는 일반 정수 인덱스입니다.팬더의 행 값에 열 값 연결하기

NameCol ValCol 
Name1  555, 333 
Name2  433 
Name1  999 
Name3  123 
Name2  533 

는 쉼표로 구분 된 정수의 순서에 대해 걱정하지 않는다

NameCol ValCol 
Name1  555, 333, 999 
Name2  433, 533 
Name3  123 

T로 집계하는 가장 좋은 방법은 무엇입니까,하지만 난 그들 사이에 쉼표를 유지할 필요가 없습니다. 그것은 매우 작은 데이터 프레임, < 100 레코드가 될 가능성이 있으므로 효율성은 중요하지 않습니다.

나는 이것에 대한 몇 가지 접근 방식이 있어야한다고 생각하지만, 아직 이해하지 못했습니다.

답변

4

groupby 방법을 사용 :

df = df.groupby('NameCol')['ValCol'].apply(', '.join).reset_index() 

결과 출력 : 너무 많은 의미가 매우 깨끗

NameCol   ValCol 
0 Name1 555, 333, 999 
1 Name2  433, 533 
2 Name3   123 
+0

, 감사합니다! – John

관련 문제