Hy,하둡의 데이터 그룹화
다음과 같은 문제가 있습니다. I 가진 2 개 데이터 세트는 다음과 같은 구조의 데이터를 포함하는 하나
A1 B2 C1 D1
A1 B2 C1 D3
A3 B1 C2 D2
etc
이러한 객체에 대한 값을 포함하는 다른 하나 I 그룹 데이터 I는 A1을 가질 수있다보다는 어떻게
A1=x
B2=y
C1=z
D1=q
etc
를 = x B2 = y C1 = z D1 = q를 계산하기 위해서?
감사합니다.
두 번째 데이터 집합은 데이터 노드의 메모리에 맞게 충분히 작습니까? – climbage
예라고합시다. 그것을리스트에 저장하라고합니까? – sergiuz
일종의지도 일 가능성이 높습니다. 그렇지만 그렇습니다. 'DistributedCache'를 통해 파일을 배포하고 매퍼로 읽을 수 있습니다. – climbage