2014-12-26 2 views
0

에 정렬 아파치 돼지 문서에서 다음 예제를 테스트하고있다. 어떤 생각?는 돼지 라틴어

$ pig -version 
Apache Pig version 0.14.0 (r1640057) 
compiled Nov 16 2014, 18:02:05 


grunt> a= load 'data' as (c1:int, c2:int, c3:int); 
grunt> describe a; 
a: {c1: int,c2: int,c3: int} 
grunt> dump a; 
(1,2,3) 
(4,2,1) 
(8,3,4) 
(4,3,3) 
(7,2,5) 
(8,4,3) 
grunt> result = order a by c1 desc; 
grunt> dump result; 
(8,4,3) 
(8,3,4) 
(4,3,3) 
(4,2,1) 
(1,2,3) 
(7,2,5) 
grunt> result = order a by c2 desc; 
grunt> dump result; 
(8,4,3) 
(7,2,5) 
(4,2,1) 
(1,2,3) 
(4,3,3) 
(8,3,4) 
grunt> result = order a by c3 desc; 
grunt> dump result;     
(7,2,5) 
(4,3,3) 
(8,4,3) 
(1,2,3) 
(4,2,1) 
(8,3,4) 

답변

0

당신은 기본 구분 기호 (tab)하지만 실제 입력 데이터가 제대로 탭으로 구분되지를 사용하여 데이터를로드한다. 입력 데이터 필드가 'data' 파일의 탭으로 구분되는지 확인할 수 있습니까?

아래의 예에서 각 입력 필드는 탭과 그 잘 작동하는 것으로 구분됩니다.

data: 
1<TAB>2<TAB>3 
4<TAB>2<TAB>1 
8<TAB>3<TAB>4 
4<TAB>3<TAB>3 
7<TAB>2<TAB>5 
8<TAB>4<TAB>3 

grunt> a= load 'data' as (c1:int, c2:int, c3:int); 
(1,2,3) 
(4,2,1) 
(8,3,4) 
(4,3,3) 
(7,2,5) 
(8,4,3) 
grunt> result = order a by c1 desc; 
grunt> dump result; 
(8,3,4) 
(8,4,3) 
(7,2,5) 
(4,2,1) 
(4,3,3) 
(1,2,3) 
grunt> result = order a by c2 desc; 
grunt> dump result; 
(8,4,3) 
(8,3,4) 
(4,3,3) 
(1,2,3) 
(4,2,1) 
(7,2,5) 
grunt> result = order a by c3 desc; 
grunt> dump result; 
(7,2,5) 
(8,3,4) 
(1,2,3) 
(4,3,3) 
(8,4,3) 
(4,2,1) 
관련 문제