2015-01-05 3 views
0

임팔라 PARQUET TABLE of 50GB 데이터를 생성했습니다. 5 개의 테이블 조인, 데이터 그룹화 및 정렬을 사용하여 쿼리를 실행하고 있습니다.임팔라 쿼리에서 오류 또는 데이터가 전혀 반환되지 않습니다.

쿼리가 끝날 때 서버가 출력 데이터에 응답하지 않아 Impala에서 예외가 발생했습니다.

cloudera 관리자에서 하나의 노드가 몇 분 뒤로 나쁜 상태에 있다는 것을 알 수 있습니다.

쿼리 :

select 
    d_year, s_city, p_brand1, 
    sum(lo_revenue - lo_supplycost) as profit 
from 
    lineorder_kylin_parqt_ext, dates_kylin_parqt_ext ,customer_kylin_parqt_ext, supplier_kylin_parqt_ext, part_kylin_parqt_ext 
where 
    lo_custkey = c_custkey 
    and lo_suppkey = s_suppkey 
    and lo_partkey = p_partkey 
    and lo_orderdate = d_datekey 
    and c_region = 'AMERICA' 
    and s_nation = 'UNITED STATES' 
    and (d_year = 1997 or d_year = 1998) 
    and p_category = 'MFGR#14' 
group by 
    d_year, s_city, p_brand1 
order by 
    d_year, s_city, p_brand1; 
+0

응답이 없다는 것은 무엇을 의미합니까? 질의 *가 데이터를 반환해야한다는 것이 확실합니까? 예를 들어 조건이 행을 선택하지 않았습니까? 또한 'cloudera 매니저에서 한 노드가 건강에 좋지 않다는 것을 알 수 있습니다'라고 말하면 나쁜 건강 상태는 무엇입니까? – Matt

+0

그 노드 역할이 다시 시작됩니다. 어떤 출력을 돌려 주어야합니다. 그래서 많은 양의 메모리를 먹으면서 노드에 임팔라 악마를 죽이는 대답을 얻었습니다. –

답변

0

나는 그것이 메모리를 먹고 있었다으로 OS가 노드에 임 팔 라 악마를 살해 한 대답을 얻었다. 커널 로그와 Cloudera Manager에서 쿼리가 실행되는 악마가 죽은 것으로 확인되었습니다.

관련 문제