2017-10-25 5 views
1

모두들.팬더 데이터 프레임 병합 멀티 키

DataFrame Merge와 관련된 질문이 있습니다.

저는 DF1, DF2를 사용합니다.

DF1에는 UserID, ContentID, Genre Column이 있습니다. DF2에는 UserID, ContentID, Rating Column이 있습니다.

내가 다음 행을 평가 디스플레이에 맞게 멀티 coloumn 키 (사용자 ID, 콘텐츠 ID) 를 사용하려면, 없음 일치하는 행은 NAN

Plz은, CSV 이하 나, PLZ, 감사

도움말을 확인하다

DataFrame1 

UserID ContentID Genre 
U-1 C-1  G-1 
U-1 C-2  G-2 
U-1 C-3  G-3 
U-2 C-1  G-1 
U-2 C-2  G-2 
U-2 C-3  G-3 
U-3 C-1  G-1 
U-3 C-2  G-2 
U-3 C-3  G-3 


DataFrame2 
UserID ContentID Rating 
U-1 C-1  3 
U-1 C-2  3 
U-2 C-2  3 
U-3 C-1  3 

Want Result 
UserID ContentID Genre Rating 
U-1 C-1  G-1 3 
U-1 C-2  G-2 3 
U-1 C-3  G-3 NAN 
U-2 C-1  G-1 NAN 
U-2 C-2  G-2 3 
U-2 C-3  G-3 NAN 
U-3 C-1  G-1 3 
U-3 C-2  G-2 NAN 
U-3 C-3  G-3 NAN 
+0

당신은 찬성 투표 수 당신이 묻는 질문을 받아들이십시오. – Wen

답변

1

간단한 merge

df1.merge(df2,on=['UserID','ContentID'],how='left') 
Out[531]: 
    UserID ContentID Genre Rating 
0 U-1  C-1 G-1  3.0 
1 U-1  C-2 G-2  3.0 
2 U-1  C-3 G-3  NaN 
3 U-2  C-1 G-1  NaN 
4 U-2  C-2 G-2  3.0 
5 U-2  C-3 G-3  NaN 
6 U-3  C-1 G-1  3.0 
7 U-3  C-2 G-2  NaN 
8 U-3  C-3 G-3  NaN 
관련 문제