2014-11-12 4 views
1

복잡한 데이터 형식을 사용하여 하이브에 테이블을 만들려고합니다.하이브의 복합 데이터 형식 문제

내 열 중 하나는 문자열 배열이고 다른 하나는지도 배열입니다.

테이블에 데이터를로드 한 후 데이터를 쿼리 할 때 맵 배열 인 세 번째 열에 원하는 결과가 표시되지 않습니다.

다음은 내 하이브 쿼리입니다 :

1 단계 :

load data local inpath '/home/xyz/data.txt' overwrite into table transactiondb2; 

3 단계 :

select * from transactiondb2; 

그리고 내 출력이 같다 2

create table transactiondb2(order_id int,billtype array<string>,paymenttype array<map<string,int>>)ROW FORMAT 
DELIMITED FIELDS TERMINATED BY '\t' 
COLLECTION ITEMS TERMINATED BY '|' 
MAP KEYS TERMINATED BY '#'; 

단계 다음과 같습니다 :

다음과 같이 16,

OK

1 ["A","B"] [{"credit":null,"10":null},{"cash":null,"25":null},{"emi":null,"30":null}] 
2 ["C","D"] [{"credit":null,"157":null},{"cash":null,"45":null},{"emi":null,"35":null}] 
3 ["X","Y"] [{"credit":null,"25":null},{"cash":null,"38":null},{"emi":null,"50":null}] 
4 ["E","F"] [{"credit":null,"89":null},{"cash":null,"105":null},{"emi":null,"85":null}] 
5 ["Z","A"] [{"credit":null,"7":null},{"cash":null,"79":null},{"emi":null,"105":null}] 
6 ["D","Y"] [{"credit":null,"30":null},{"cash":null,"100":null},{"emi":null,"101":null}] 
7 ["A","Z"] [{"credit":null,"50":null},{"cash":null,"9":null},{"emi":null,"85":null}] 
8 ["B","Z"] [{"credit":null,"70":null},{"cash":null,"38":null},{"emi":null,"90":null}] 

그리고 내 입력 파일의 데이터는 다음과 같습니다

1  A|B  credit#10|cash#25|emi#30 
2  C|D  credit#157|cash#45|emi#35 
3  X|Y  credit#25|cash#38|emi#50 
4  E|F  credit#89|cash#105|emi#85 
5  Z|A  credit#7|cash#79|emi#105 
6  D|Y  credit#30|cash#100|emi#101 
7  A|Z  credit#50|cash#9|emi#85 
8  B|Z  credit#70|cash#38|emi#90 

답변

1

내가 그것을 자신을 해결했다.

우리는이 데이터를 다음과 같이 테이블을 만들고로드 다른

0

후 하나 개의 맵에서 값을 사용합니다 기본적으로 명시 적으로 맵의 배열을 언급하지 않아도, 당신은 원하는 출력을 얻을 것이다.

create table complex(id int,bill array<string>,paytype map<string,int>) 
ROW FORMAT 
DELIMITED FIELDS TERMINATED BY '\t' 
COLLECTION ITEMS TERMINATED BY '|' 
MAP KEYS TERMINATED BY '#'; 
+0

OP가 정확히 무엇입니까? –