2011-03-21 1 views
0

32 노드의 클러스터에서 실행되는 UPC-NAS 벤치 마크 (256 스레드 용으로 컴파일 됨)를 가져 오려고합니다. 내가 그것을 실행하면 RSH 연결은 247 개 스레드 설립하고 다음과 같이 오류를 제공을 종료한다32 노드 클러스터에서 NAS 벤치 마크의 256 스레드 실행 중 "p4_error : 자식 프로세스가 종료되었습니다"오류

p0_11350: p4_error: Child process exited while making connection to remote process on dell16: 0 
506 rm_l_237_24446: (26.785156) net_send: corm_11947: (215.339844) net_srm_l_1rm_24412: (26.785156) net_send: could not write to fd=4, errnrrrm_l_127_5013: (121.984375) net_send: could not w rite to fd=5, errno = 32 
문제가 자리하고있는 곳

아무도 지적 할 수 있습니까?

그것은 64처럼 작은 미세 스레드 실행 (128) 등

답변

2

ERRNO 32 EPIPE (#define EPIPE 32 /* Broken pipe */)이다.

일부 파일 설명자 제한이 적용됩니다 (확인 ulimit -a). 또는 네트워크 한계. 또는 네트워크 오류입니다.

또한 p4는 고대에 오래된 것임을 언급해야합니다. 내부 제한이 될 수 있습니다. p4의 발달은 15 년이 넘었습니다. 데비안 안정에 포함되는면에서 매우 안정적인 코드입니다.

그럼 왜 mpich1을 사용합니까? 덜 고대 mpich2로 이동할 수 있습니까?

+1

osgx가 말했듯이, 더 이상 MPICH1을 사용하지 마십시오. 대신 MPICH2로 이동하십시오. 더 빠르며 (일반적으로) 더 많은 기능을 갖추고 확실하게 견고합니다. –

관련 문제