하이브 데이터베이스에서 작동하는 scala/spark 패키지가 있습니다. 일부 특정 값에 대한 데이터가 있는지 확인하기 위해 쿼리가 실행되는 루프를 실행합니다.Hive- 데이터를 더 빨리 확인하는 방법
SELECT * FROM myTable WHERE col1 = 7879 AND col2= 1071 AND col3= 3027 LIMIT 1;
그런 다음 행을 반환하는지 여부에 따라 진행하십시오. 실행에 약 25 초가 걸립니다.
나는이 방법이 있는지 여부 횟수에 따라
SELECT COUNT(*) FROM myTable WHERE col1 = 7879 AND col2= 1071 AND col3= 3027;
진행하기보다 빠른
이0 데이터가 테이블에 존재하는지 확인하는 빠른 방법이 있나요이다 작동 보았다 특정 제약 조건?
EDIT - 루프는 다른 쿼리의 결과 행을 기반으로 실행되므로 100 개 이상의 행이 생성됩니다.
업데이트 된 답변 확인 –