0
나는 hadoop을 사용하고 있고 지우고 자하는 파일을 생성하는 맵 작업을하고있다. 현재이 파일들을 콜렉터를 통해 줄이기 작업에 전달하고있다. reduce 작업은이 파일을 수집기로 전달합니다. 그러면 파일을 유지할 수 있습니다.맵에 의해 생성 된 시퀀스 파일을 유지하기 위해 hadoop
내 질문은 어떻게 안정적이고 효율적으로지도로 만든 파일을 유지합니까?
나는지도의 출력물을 자동으로 삭제할 수 없다는 것을 알고 있지만, 더 나은 접근 방법은 없는가?
감사합니다.
감사합니다.하지만 맵 내에서 파일을 사용해야했습니다. 예를 들어 이미지를 만든 다음 이미지에서 특정 피쳐를 추출합니다. 각 tasktracker가 시퀀스 파일을 만들고 맵 함수가 시퀀스 파일에 대한 정적 참조를 검색하도록 결정했습니다. – akintayo