2017-12-08 2 views
0

가정하자 PCollection의 P1을 갖는다 {1,2,3} PCollection의 P2는 {A, B, C}둘 또는 여러 PCollection 참여하면 *없이 * 흐름 키

I 쌍을 갖는다 PCollection를 생성하고자했다 p1과 p2는 {A, 1}, {B, 2}, {C, 3}

과 같은 도움이됩니다.

감사합니다, K

+0

1 : 1 매핑의 조합은 정상입니다. {A, 3} {B, 1} {C, 2}와 같은 것도 괜찮습니다. – tlrmfj

+0

이것을 사용하여 달성하고자하는 것에 대해 더 많이 알 수 있습니까? 다소 이상한 작업이므로 실제 최종 목표를 달성 할 수있는 더 나은 방법이있을 수 있습니다. – jkff

+0

P1과 P2 사이에는 특별한 관계가 없습니다. 그것은 사람들 목록과 소녀 목록과 같습니다. 1 : 1 매핑 목록 만 있으면됩니다. – tlrmfj

답변

0

은 내가 조인을 수행하기 위해 CoGroupByKey를 사용 후 1, 2, ... 각 PCollection의 요소에 일련 번호를 할당 할 stateful ParDo를 사용하는 것이 좋습니다, 그리고 거라고 생각합니다. 즉, 각 PCollection은 1 명의 작업자를 사용하여 순차적으로 처리되지만 현재이 특정 작업을보다 효율적으로 구현하는 방법을 생각할 수 없습니다.

관련 문제