2014-09-30 3 views
2

내 캠퍼스의 클러스터는 작업 관리를 위해 PBS TORQUE를 사용합니다.TORQUE qsub 요청에서 특정 노드 제외

소프트웨어로 구식 인 몇 개의 노드가 있습니다. 내 작업이 해당 노드 중 하나에 전송되면 실패합니다. 작업 요청에서 특정 노드 (또는 노드 목록)를 제외하는 방법이 있습니까?

+1

실행할 특정 노드 또는 노드 목록을 지정할 수는 있지만 매우 제한적입니다. 최신 상태의 노드에 등록 정보를 지정하도록 관리자에게 요청한 다음 해당 등록 정보로 노드의 서브 세트를 요청할 수 있습니다. 여기에서 구문을 찾을 수 있습니다. http://docs.adaptivecomputing.com/torque/4-1-3/Content/topics/2-jobs/requestingRes.htm – chuck

+0

@chuck 관리자는 다른 것들로 매우 바빠서 길을 걷고 있습니다. 응답하기에는 너무 오랜 시간이 걸리며 일반적으로 이런 것들에주의를 기울이지 마십시오. 내 작업을 실행할 수있는 대체 * 노드 목록을 어떻게 지정합니까? – becko

답변

0

직장에서 선택할 수있는 세트를 지정할 수 있는지 확실하지 않습니다. 노드 목록을 지정할 수 있지만 작업이 실행되기 전에 모든 노드가 사용 가능 상태가 될 때까지 기다려야합니다. 제외 할 노드 수에 따라 다음과 같이 할 수 있습니다. 당신은 자원을 부과 방법에 있지만 그것은 당신이 당신의 작업이 실행 얻을 수 있도록하는 경우는

cat $PBS_NODEFILE | grep -v badnode1 |grep -v badnode2 > goodnodes NP=wc -l goodnodes #need back ticks around "wc -l goodnodes" mpirun -np $NP -machinefile goodnodes ./a.out

이 적합하지 않습니다.