EMR 인스턴스가 중간 유형으로 실행 중일 때 EMR 인스턴스가 종료 된 단계 중 하나에서 발견되었습니다. 5 개의 인스턴스에 AWS의 중간 인스턴스를 사용했습니다. 용량은 3.75GB RAM입니다. mapred.child.java.opts 속성에 대해 힙 크기를 3000MB로 지정했습니다. JobConf를 사용하여 conf.set ("mapred.child.java.opts", "-Xmx3000m")과 같은 매개 변수를 설정하여이를 설정했습니다. 아마존 EMR 프로그램을 실행하려면 세 단계를 거쳐야합니다. 마지막 단계에서 java.lang.Throwable : Child Error라는 문제가 발생했습니다. 그 일이 실패한 이유는 무엇입니까? 또한 자식 노드의 매퍼에 필요한 최적의 힙 크기는 얼마입니까?Mapred Child Error : AWS EMR 인스턴스가 종료되었습니다.
0
A
답변
0
특별한 것을하지 않는 한 - 3000M은 너무 높은 숫자입니다. 얼마나 많은지도 작업이 기계 당 실행 중인지 확인할 수 있습니까? 하나 이상을 실행한다면 - 3.75GB 램을 쉽게 날려 버릴 것입니다. (어쨌든 커널을 위해서는 자유롭게 사용해야합니다.)
우리는 서비스로 hadoop (Qubole)을 제공합니다. 기본적으로 여기에 (그리고 이전의 공연에서) - 기본값으로 1024M을 사용합니다. 당신은 그 아래에 io.sort.mb를 잘 설정하기를 원할 것입니다 (예를 들어 400-500MB). 사용자가 특수한 작업 (큰지도 쪽 조인과 같은)을 수행하는 경우에만 -이를 부딪 힐 이유가 있습니다. 증가해야하는 경우 시스템 당 최대 동시 맵 작업 수를 줄여야합니다 (둘 이상인 경우).
관련 문제
- 1. AWS EMR 오류 : 작업 흐름의 모든 슬레이브가 종료되었습니다.
- 2. AWS EMR 자동 스케일링
- 3. AWS EMR kerberizing 클러스터 hadoop.security.AccessControlException
- 4. 돼지 AWS EMR 자이 썬 직렬화 오류
- 5. EMR : 마스터 인스턴스가 부트 스트랩 작업을 다운로드하지 못했습니다.
- 6. GCE 인스턴스가 세부 정보 또는 설명없이 종료되었습니다
- 7. AWS EMR - Apache Flink 웹 클라이언트
- 8. AWS EMR S3에서 외부 라이브러리 가져 오기
- 9. 수동으로 AWS EMR 단계를 수행하지 못하게하는 방법
- 10. aws emr cli로 하이브 구성을 전달합니다.
- 11. AWS - 현재 단계에서 EMR 단계를 추가하려면 어떻게합니까
- 12. AWS EMR 기계가 축소 출력을 결합하지 않음
- 13. AWS EMR 클러스터에서 작업 노드의 지점 종료 처리
- 14. cuda error MSB3721이 코드 2로 종료되었습니다.
- 15. AWS Datapipeline ServiceAccessSecurityGroup
- 16. Amazon EMR : 데이터로 클러스터 초기화
- 17. 클라이언트 컴퓨터의 mapred-site.xml은 hadoop 클러스터의 mapred-site.xml과 같아야합니다.
- 18. mapred-site.xml이 mapred-default.xml의 매개 변수를 덮어 쓰지 않습니다.
- 19. AWS EMR 스트리밍 클러스터에 PHP 필수 라이브러리를 포함하려면 어떻게해야합니까?
- 20. Mapred Task Timeout
- 21. 하둡은 mapred : 소스
- 22. 충돌시 AWS EB 인스턴스가 자동으로 재시작합니까?
- 23. AWS ec2 인스턴스가 일부 IP에서 열리지 않았습니다.
- 24. 아마존 aws windows 인스턴스가 스크립트를 사용하여 시작합니다
- 25. KMS 암호화 된 S3 마루 파일에 AWS EMR 작성
- 26. AWS EMR 5.0에서 실행중인 boto3의 MR 작업에 스트리밍 단계 추가
- 27. AWS EMR 작업 진행 상태를 모니터링하는 가장 좋은 방법은 무엇입니까?
- 28. Amazon AWS EMR "아니오"구성 샘플 응용 프로그램
- 29. AWS EMR 클러스터 또는 이름 노드의 스냅 샷 생성 가능성
- 30. 다양한 warc.gz 파일 매핑, EMR
전체 스택 추적을 제공 할 수 있습니까? 또한 "최적의 힙 크기"가 없으며 작업의 성격, 데이터의 양 및 기타 많은 매개 변수에 따라 달라 지므로 정확하게 수행하려는 작업에 대해 더 자세히 설명해야합니다. –
내 스택 추적 : 짧게 만듭니다. java.lang.Throwable의 : 자식 오류 \t org.apache.hadoop.mapred.TaskRunner.run (TaskRunner.java:271) 에 의해 발생 : 때 java.io.IOException : 137 의 제로가 아닌 상태로 작업 프로세스 종료 \t at org.apache.hadoop.mapred.TaskRunner.run (TaskRunner.java:258) java.lang.Throwable : 하위 오류 \t at org.apache.hadoop.mapred.TaskRunner.run (TaskRunner.java:271) 발생 원인 : java.io.IOException : 0이 아닌 상태 137 인 태스크 프로세스 종료 \t at org.apache.hadoop.mapred.TaskRunner.run (TaskRunner.java:258) – prasanna
응답 해 주셔서 감사합니다. – prasanna