0
임팔라 PARQUET TABLE of 50GB 데이터를 생성했습니다. 5 개의 테이블 조인, 데이터 그룹화 및 정렬을 사용하여 쿼리를 실행하고 있습니다.임팔라 쿼리에서 오류 또는 데이터가 전혀 반환되지 않습니다.
쿼리가 끝날 때 서버가 출력 데이터에 응답하지 않아 Impala에서 예외가 발생했습니다.
cloudera 관리자에서 하나의 노드가 몇 분 뒤로 나쁜 상태에 있다는 것을 알 수 있습니다.
쿼리 :
select
d_year, s_city, p_brand1,
sum(lo_revenue - lo_supplycost) as profit
from
lineorder_kylin_parqt_ext, dates_kylin_parqt_ext ,customer_kylin_parqt_ext, supplier_kylin_parqt_ext, part_kylin_parqt_ext
where
lo_custkey = c_custkey
and lo_suppkey = s_suppkey
and lo_partkey = p_partkey
and lo_orderdate = d_datekey
and c_region = 'AMERICA'
and s_nation = 'UNITED STATES'
and (d_year = 1997 or d_year = 1998)
and p_category = 'MFGR#14'
group by
d_year, s_city, p_brand1
order by
d_year, s_city, p_brand1;
응답이 없다는 것은 무엇을 의미합니까? 질의 *가 데이터를 반환해야한다는 것이 확실합니까? 예를 들어 조건이 행을 선택하지 않았습니까? 또한 'cloudera 매니저에서 한 노드가 건강에 좋지 않다는 것을 알 수 있습니다'라고 말하면 나쁜 건강 상태는 무엇입니까? – Matt
그 노드 역할이 다시 시작됩니다. 어떤 출력을 돌려 주어야합니다. 그래서 많은 양의 메모리를 먹으면서 노드에 임팔라 악마를 죽이는 대답을 얻었습니다. –