JobTracker가 TaskTracker에 맵 작업을 할당 할 때 NameNode와 대화해야합니까? 아니면 InputSplit 자체에서 정보를 얻을 수 있습니까? 코드를 살펴보면 InputSplits가 BlockLocations로 압축되어 있음을 알 수 있습니다. JobTracker가이 정보와 함께 가지 않거나 네임 노드로 작업해야합니까?Hadoop - 매핑 할 파일
답변
클라이언트는 분할 정보를 계산하고 분할 정보와 함께 HDFS에 씁니다.
당신은 하둡 1.x에서 JobSplit.SplitMetaInfo
에보고도 위치를 직렬화 구현 직렬화가있을 수 있습니다.
은 JobTracker는 슬롯을 사용할 수있는 경우 위치가 빠른 실행을위한 다만 힌트입니다 이러한 직렬화 및 일정을, 선택합니다.
JobTracker를 블록의 위치를 얻을 수있는 네임 노드에 연락한다. 이 프로세스는 작업이 처리중인 블록 수가 매우 큰 경우 특히 시간이 걸릴 수 있습니다.
감사합니다. Donald. 내 혼란은 InputSplit이 데이터를 얻을 수있는 가능한 위치와 호스트에 대한 메타 데이터를 가지고 있기 때문에 Job Tracker가이 작업을 수행해야하는 이유와 관련이 있습니다. 감사. – Suresh
InputSplit은 실제로 알지 못합니다. 찾으려면 NameNode로 이동해야합니다. –
- 1. Hadoop : 이진 파일 매핑
- 2. Hadoop 파이프와 새로운 매핑 패키지
- 3. Hadoop gzip 압축 파일
- 4. JSON 파일 용 Hadoop
- 5. hadoop HDFS 파일 업데이트
- 6. 다른 hadoop 유형 파일
- 7. 두 개의 데이터 세트를 통한 Hadoop 매핑
- 8. hibernate - 매핑 매핑 XML 파일
- 9. Hadoop. HDFS에서 파일 생성에 관하여
- 10. 모든지도 작업을위한 Hadoop 캐시 파일
- 11. Hadoop 파일 단위 블록 크기
- 12. hadoop 분산 캐시에서 파일 액세스
- 13. Apache Hadoop - 손상시 파일 제외
- 14. Hadoop 파일 시스템 통계 (FileSystem.Statistics)
- 15. Hadoop webhdfs curl 파일 만들기
- 16. Hadoop 작업 부작용 파일 예제
- 17. Hadoop 분산 캐시 - 파일 수정
- 18. Hadoop HDFS 최대 파일 크기
- 19. Hadoop 스토어 파일 추가 위치
- 20. 파일 시스템 - 메모리 매핑 파일
- 21. Hadoop dfs -ls는 내 hadoop/dir에있는 파일 목록을 반환합니다.
- 22. 매핑 XML 파일
- 23. 이 파일 매핑 아키텍처
- 24. 일반 텍스트 파일 매핑
- 25. 텍스트 파일 매핑
- 26. 매핑 파일 문제 (관계)
- 27. 메모리 매핑 파일 식별
- 28. Hadoop 개발, 테스트 및 디버깅 Eclipse로 작업 매핑/축소
- 29. Hadoop DistributedCache가 hadoop 작업에서 상태
- 30. Hadoop 파일 업로드 프로세스 내부 작업
토마스에게 감사드립니다. 그래서, 이것은 단지 암시 일뿐입니다. 시나리오를 가져 가자. JobTracker가 실행할 데이터가 TaskTracker의 로컬 드라이브에 있음을 확인하면 TaskTracker에이를 알릴 수 있습니까? 아니면 TaskTracker가이를 식별하기 위해 NameNode와 접촉하게됩니까? – Suresh
그러한 의사 소통이 없습니다. Jobtracker 내부의 스케줄러는'SplitMetaInfo'를 조사 할 것이고 그 위치에서 사용 가능한 슬롯이 있다면 그것은 tasktracker에게 지시를 보내어 그 입력으로 작업을 수행 할 것입니다. –
데이터가있는 컴퓨터 (DataLocal 없음)에서 데이터를 사용할 수없는 경우 데이터가있는 컴퓨터를 찾아야합니까? TaskTracker가 NameNode와 대화해야하거나 메타 데이터 (블록 위치 포함)를 사용하고 다른 컴퓨터와 직접 대화 할 수 있습니까? – Suresh