2016-06-16 2 views
1

저는 특히 Python과 pandas에 매우 익숙합니다. ID 변수가 다른 열과 일치하는 데이터 프레임의 한 열에서 모든 문자열을 연결하려는 불규칙한 변형 문제가 있습니다. id에 따라 수행해야하는 연결 수가 달라질 수 있으므로 불규칙한 모양 변형 문제입니다.reshape python concatenate text 불규칙한 데이터 프레임

import pandas as pd 
import numpy as np 
df = pd.read_csv('sample.txt') 
print df 

    id text 
0 1 ABC 
1 1 BCD 
2 2 CDE 
3 2 DEF 
4 2 EFG 
5 3 FGH 

내가 바꿀 id을 사용하고 경우에 대한 모든 text을 연결하고자하는 id 일치,이 같은 결과 : (df_new) 인쇄 :

그래서 예를 들면

join를 집계와

id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 

답변

4

사용 groupby :

print (df.groupby('id')['text'].apply(' '.join).reset_index()) 
    id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 
+0

EKL이 답변으로 문제가 해결되었다고 생각되면 녹색 체크 표시를 클릭하여 '수락'으로 표시하십시오. 이것은 지역 사회가 답이없는 질문에 초점을 유지하는 데 도움이됩니다. – Lahiru