여러 노드가 포함 된 클러스터를 사용합니다. 그들 각각에는 8 개의 코어가있는 2 개의 프로세서가 있습니다. 나는 SLURM과 함께 Open MPI를 사용한다.MPI 및 2 소켓 노드 비 균일 메모리 액세스
내 테스트에 따르면 MPI 보내기/Recv 데이터 전송 속도는 다음과 같습니다. 순위 0의 MPI 프로세스와 MPI 프로세스 1 사이의 속도는 약 9GB/초이지만 프로세스 0과 프로세스 2 사이의 속도는 5GB/초입니다. 우리 프로세스가 다른 프로세서에서 실행되기 때문에 이런 일이 일어난다 고 가정합니다.
로컬이 아닌 메모리 액세스를 피하고 싶습니다. 권장 사항은 here으로 나타났습니다. 문제는 8 개의 MPI 프로세스를 모두 동일한 프로세서에서 실행할 수 있습니까? 그렇다면 어떻게해야합니까?
감사합니다.
고마워, 정확히 내가 무엇을 찾고 있었는지! –