현재 Hadoop을 사용 중입니다. 주어진 작업에 대한 맵 작업이 자체 노드에서 또는 다른 노드에서 데이터를 읽는지 여부에 대한 정보를 얻을 수 있는지 궁금합니다. 나는 HDFS가 모든 노드에 분산되어 있다는 것을 알고 있지만 주어진 작업과 주어진 맵 작업에 대해, 앰프 작업이 실행중인 동일한 노드에서 얼마나 많은 데이터가 읽혔는지와 얼마나 많은 데이터를 읽었는지를 나타내는 카운터/메트릭이 있습니다. 네트워크를 통해 데이터를 읽었습니다.동일한 노드 통계에서 읽기 작업을 매핑하는 Hadoop
0
A
답변
0
Hadoop에는 로컬에서 읽은 데이터의 양과 네트워크를 통해 읽은 데이터의 양을 알려주는 카운터가 없습니다. 당신이 할 수
있는 유일한 방법은 다른 표준 카운터를 결합하고 그 기반으로 로컬의 근사치를 얻을 수 및 네트워크를 통한 데이터를 읽을 수있을 것이다.
DATA_LOCAL_MAPS : 로컬 데이터 (로컬 컴퓨터)를 사용하여 작업의 맵 작업 수입니다.
RACK_LOCAL_MAPS : 자신의 입력 데이터와 동일한 랙의 노드에서 실행지도 작업의 수.
OTHER_LOCAL_MAPS 그들의 입력 데이터가있는 것과 다른 랙의 노드에서 실행 된 작업의 수.
MAP_INPUT_BYTES : 모든지도 작업에 의해 총 (전체 작업)
소비 된 데이터의 양을 알려줍니다 * (당신은 하둡 배포판의 카운터의 정확한 이름을 확인해야합니다)
,745 : EACH지도 ONE 입력 분할 처리하고 기본 입력 분할은 거의 동일한 것으로,이 식을 이용하여 국부적으로 처리 된 데이터의 총량을 찾을 수 있음을 고려
곱셈의 두 번째 항은지도 작업 당 입력 바이트 수를 나타냅니다.
관련 문제
- 1. hadoop 단일 노드 설정
- 2. 일시적으로 hadoop 노드 일시 중단 - 백그라운드 hadoop 클러스터
- 3. hadoop 단일 노드 설정 bash : bin/hadoop 권한이 거부되었습니다.
- 4. HADOOP 데이터 노드 이상한 것들
- 5. 스탠드에서 실행중인 hadoop 작업을 병렬로 수행하는 방법 hadoop distritbuion 0.20.0
- 6. 읽기 노드 SimpleXML을
- 7. XML의 노드 읽기
- 8. XML 노드 읽기
- 9. DataTables/DataSet에 동일한 루트 노드 아래에있는 여러 xml 테이블 읽기
- 10. 원격으로 hadoop 작업을 실행하는 중 예외가 발생했습니다.
- 11. 동일한 하드웨어에서 hadoop 클러스터를 실행해야합니까?
- 12. 단일 노드 클러스터에서 Hadoop 실행 sort 예
- 13. HADOOP - 매퍼 내에서 노드 이름 얻기
- 14. 상위 메모리 시스템에서 Hadoop 단일 노드 구성
- 15. 프로그래밍 방식으로 Hadoop Mapreduce 프로그램 출력 읽기
- 16. Hadoop 작업을 다시 실행하면 분할 된 맵 출력이 여전히 동일한 Reducer로 이동합니까?
- 17. Hadoop 다중 VM 스폰하기
- 18. Hadoop : 모든 노드에 균일하게 작업을 배포하는 방법
- 19. Hadoop DistributedCache가 hadoop 작업에서 상태
- 20. 조건부 XML 노드 읽기 Groovy
- 21. 요소를 기반으로 XML 노드 읽기?
- 22. 자식 xml 노드 읽기 문제
- 23. 동일한 노드 데이터에서 여러 treeViews로드
- 24. 많은 파일 읽기 hadoop mapreduce 분산 캐시
- 25. 읽기/쓰기 (Hadoop) 중에 오류가 발생했습니다
- 26. Hadoop 스트리밍에서 노드 당 최대 감속기 수를 설정하는 방법은 무엇입니까?
- 27. 동일한 파일에 쓰기/읽기
- 28. Amazon EC2에서 실행중인 hadoop 작업 : 다중 노드 클러스터
- 29. 오라클은 읽기 작업을 어떻게 수행합니까?
- 30. 동일한 URL을 가진 여러 노드