2016-08-18 2 views
0

저는 두 가지 데이터 세트를 Excel에 포함 시켰습니다.Rapidminer에 가입하십시오.

enter image description here

는 몇 가지를주의하십시오 : 여기 내 데이터와 같은 모습입니다 ID 3 1 Sheet1에있는 전화가 시트 2에서 다릅니다; 2 - ID 4의 경우 sheet2에는 전화 번호가 있지만 sheet1에는 전화 번호가 없습니다.

내가 원하는 것은 모든 정보가 들어있는 두 장의 조합입니다. 따라서 누락 된 값이 채워질 것이고 동일한 ID에 2 개의 다른 값이있을 때마다 rapidminer가 다른 값 (예 : phonenumber1, phonenumber2)을 포함하는 추가 열을 만들길 원합니다.

참고 매우 기술적 인 사람이 아니기 때문에 간단한 해결책이 있는지 여부와 복잡한 경우 복잡한 단계를 설명해야합니다.

THX!

답변

1

Join 연산자는 매개 변수를 올바르게 설정하면 원하는대로 할 수 있습니다. 먼저 스프레드 시트를 읽은 다음 두 예제 세트를 Join 연산자에 연결합니다. 이 연산자의 key attributes을 왼쪽 및 오른쪽 키 모두에 대해 IDage으로 설정하십시오. 그런 다음 remove double attributes 매개 변수의 선택을 취소하십시오.

프로세스를 실행 한 후에는 추가 열이 표시됩니다.