1
스파크 + 자바 프로그래밍에 대한 도움이 필요합니다. I는 전화와 다른 큰 하나가 기본적으로, 나는이 첫 번째 (A)와 두 번째 (B)에서에 반복 할 필요 B. 라고, HDFS에 큰 파일이스파크 : 2 파일 반복 읽기
: 이 내 문제입니다 같은 순간. 내가 그런 일을 의미한다 (이것은 의사) :
a = read.A; //Read record from A
b = read.B; // Read record from B
while(a != EOF)
{
if (a > b)
{
b= read.B;
// Write Output in some way
}
else
{
a= read.A;
//Write output in some way
}
}
는 사용 스파크 + 자바와 같은 뭔가를 possibile인가요?
Join의 출력은 A의 첫 번째 행이 B의 첫 번째 행과 함께있는 엘레멘트 집합이됩니다. – Edge7
확인. 내 문제는 내가 동등한 가입에 관심이 없다는 것이다. 제 의사 코드를 살펴 보시면됩니다. 2 파일을 반복하고 파일 A에서 튜플을 잡고 파일 B와 viceversa를 반복하는 데 관심이 있습니다. – Edge7
나는 그들을 반복하고, A가 B를 A로 잡고 B가 A Edge7