0
를 거치지 않고 HDFS 파일을 병합합니다. HDFS가 클러스터 자체에 몇 개의 파일을 병합하도록 알려줄 수 있습니까?나는이 작업을 수행 할 수있는 네트워크
를 거치지 않고 HDFS 파일을 병합합니다. HDFS가 클러스터 자체에 몇 개의 파일을 병합하도록 알려줄 수 있습니까?나는이 작업을 수행 할 수있는 네트워크
나는 당신과 비슷한 문제가 있습니다. 여기에 article with number of HDFS files merging options이지만 모두 구체적인 내용이 있습니다. 이 목록의 아무도 내 요구 사항을 충족하지 못합니다. 희망이 당신을 도울 수 있습니다.
그래서 MapReduce 설정 속도가 문제가되지 않으면 큰 문제가되지 않습니다. 실시간 요구 사항이있는 경우 상황이 복잡해집니다.
내 '미친'아이디어 중 하나는 동일한 클러스터에서 Hbase를 사용하면서 HBase 보조 프로세서 메커니즘 (엔드 포인트)을 사용하고 파일에 지역 정보를 차단하는 것입니다. '미친'이라는 단어가 당신을 멈추게하지 않으면 다음을보십시오. http://blogs.apache.org/hbase/entry/coprocessor_introduction