저는 하둡 (Hadoop)의 새로운 꿀벌이에요. 그래서이 기본적인 질문으로 도와주세요.MapReduce 작업이 하이브에서 실행되기 시작합니다.
하이브에서 "select * from table where <condition>;"
을 수행하면 기본 HDFS 파일에 필터링을 적용해야하므로 mapreduce가 실행됩니다.
하지만 하이브에서 where 절을 사용하지 않고 select * from table
을 수행 할 때 간혹 mapreduce가 시작되고 때로는 실행되지 않습니다. 나의 이해는 필터링 조건이 없기 때문에 mapreduce를 실행하지 않아야한다는 것이 이상적입니다.
왜 누군가가 mapive가 Hive에서 시작되는 경우가 거의 없는지 설명 할 수 있습니까?
미리 감사드립니다.