매퍼 (mapper)에 텍스트 파일을 입력하고 시퀀스 파일을 출력하고 싶습니다. 간단한지도를 작성하는 방법 - 동일한 작업을 줄일 수 있습니까? 텍스트 파일에는 탭 구분 값이 있습니다. 예 입력 : 그룹 1 1 2 3 4 5
이러한 입력의 난의 키에서 "그룹 1"이되며, 그 값이 1 2 3 4 5탭으로 구분 된 텍스트 파일을 시퀀스 파일로 변환하는 간단한 map-reduce 작업을 작성하는 방법은 무엇입니까?
의 벡터이어야 출력 시퀀스 파일을 작성하고자 어떻게이 일자리를 쓸 수 있습니까? 또한이 경우 감속기가 필요 없다고 느낍니다. 이 경우 ID 감속기 작업을 작성하는 방법은 무엇입니까? 감속기 작업을 생략 할 수 있습니까?
감사합니다. 감사합니다.
Hadoop이 필요하지 않습니다. 번거롭게할만한 충분한 데이터가 있는지 확인하십시오. –
현재로서는 데이터가 그리 크지 않지만 모든 것이 작동하면 큰 데이터 세트에서 실행됩니다. 어쨌든 이것은 해결되었습니다. 나는 이것을 위해 단지 map 함수를 작성했다. 응답 주셔서 감사합니다! – Amruta