2016-07-22 3 views
0

한 줄을 여러 줄로 변환하고 일부 변형을 적용했습니다. 내가 tupple를 사용하여 시도하지만PIG의 여러 줄에서 쉼표로 구분 된 한 줄로

D = foreach grouped generate group, COUNT(R); 
requestFile = foreach D generate (bag{tuple(chararray)}) D.group as abc:{(group:chararray)}; 
G = GROUP requestFile ALL; 
F = FOREACH G generate requestFile; 

D 개별 단어가 반복되는 시간의 수를 가지고, wrked하지 않은

지금은 한 줄에 각각의 라인을 변환해야합니다.

답변

0

당신은 위의 코드처럼 한 행에 여러 행을 변환하는 BagToTuple의 평평를 사용해야

D = FOREACH grouped generate group, COUNT(R); 
G = GROUP D ALL; 
F = FOREACH G generate FLATTEN(BagToTuple(D)) ; 
관련 문제