작업이 Hadoop 작업으로보고하여 작업에 시간 초과가 발생하지 않도록하려면 어떻게해야합니까?

2) 때때로 스트리밍에 10 분 이상 소요되며 진행 상황이 작업에보고되지 않으면 작업이 종료됩니다.

3) context.progress() 메소드를 사용하여 진행 상황을보고하려했지만 도움이되지 않았습니다.

hadoop 작업의 진행 상태를보고하는 데 필요한 다른 것이 있습니까?

나는이 문제와 다음 코드를 시뮬레이트하기 위해 다음과 같이 샘플 코드를 작성했습니다. 작업 ID : attempt_201202061119_0001_m_000001_1, 상태 :

Thread.sleep(360000); 

context.progress(); 

Thread.sleep(360000);

그것은 오류 메시지가 다음

12/02/06 11시 40분 25초 정보의 mapred.JobClient 실패 작업이 attempt_201202061119_0001_m_000001_1가 상태를보고하는 데 실패 실패 601 초입니다. 죽이는!

2012-02-06 samarth

이 더 높은 값으로 mapred.task.timeout 속성을 설정하면이 문제를 해결하는 가장 쉬운 방법입니다.

2012-02-07 12:53:57 wlk

context.progress()가 작동해야하지만 이후 버전에서 수정 된 https://issues.apache.org/jira/browse/MAPREDUCE-1905 문제가 발생했을 수 있습니다.

2017-04-18 01:09:04 Harinder

답변