동일한 클러스터의 한 hdfs 디렉토리에서 다른 hdfs 디렉토리로 많은 파일을 이동 (복사하지 않음)해야합니다.많은 파일을 hdfs에서 hdfs로 옮깁니다.
나는 distcp를 사용할 수 있지만 파일 복사 (복제) 이후에 과도한 것처럼 보입니다. 그냥 으로 이동하고으로 이동하십시오. 두 가지 질문 : 나는) 이동 (또는 새 경로로 변경해야 할 파일의 수백만이 있기 때문에이 작업을 수행하는 맵리 듀스를 사용하고자하는
:
A) 거기 있나요. 나는 또한 그것을 oozie와 통합하고 싶다. 나는 mapreduce 일을 나 자신으로 쓸 수 있었다. 그러나 나는 그 일을할만한 것이 있는지 궁금해하고 있었다.
B)지도로 표시해야하나요?
불행히도, 나는 hdfs rename의 성능 특성에 대해 충분히 알지 못합니다; 내가 파일 이름 바꾸기에 대한 단일 스레드 방식으로 접근 할 수 있다고 생각합니까?