하이브 쿼리를 실행하는 데 AWS-EMR을 사용하고 하이브 버전 0.13.1을 실행하는 동안 성능 문제가 있습니다.하이브 버전의 성능 문제 0.13.1
최신 버전의 하이브는 10 행의 데이터를 실행하는 데 약 5 분이 걸렸습니다. 그러나 230804 행에 대한 동일한 스크립트는 2 일이 소요되고 여전히 실행 중입니다. 문제를 분석하고 수정하려면 어떻게해야합니까?
샘플 데이터 :
표 1 : 표 1에 대한
hive> describe foo;
OK
orderno string
Time taken: 0.101 seconds, Fetched: 1 row(s)
샘플 데이터 :
hive>select * from foo;
OK
1826203307
1826207803
1826179498
1826179657
표 2
01 표 2 23,516,hive> describe de_geo_ip_logs;
OK
id bigint
startorderno bigint
endorderno bigint
itemcode int
Time taken: 0.047 seconds, Fetched: 4 row(s)
샘플 데이터 :
hive> select * from bar;
127698025 417880320 417880575 306
127698025 3038626048 3038626303 584
127698025 3038626304 3038626431 269
127698025 3038626560 3038626815 163
내 쿼리 :
SELECT b.itemcode
FROM foo a, bar b
WHERE a.orderno BETWEEN b.startorderno AND b.endorderno;
하이브 0.13은 이전 버전의 쿼리가이 버전에서 실행되지 않기 때문에 많은 문제가 있습니다. 최신 하이브 사용 0.14 –
하이브 -0.14는 삽입, 업데이트, 삭제와 같은 많은 고급 기능을 가지고 있습니다. –
이 질문은 터무니 없습니다. . – gobrewers14