3
모든 배열에 길이가 같은 길이의 배열이 있습니다 (10이라고 가정 함). 배열의 일부 값에는 프로세서의 순위가 포함됩니다. 예를 들어 ...MPI를 사용하여 모든 순위의 배열 병합
Proc 1: [1 0 0 0 0 1 0 0 0 1]
Proc 2: [0 2 2 0 0 0 0 2 2 0]
Proc 3: [0 0 0 3 3 0 3 0 0 0]
이제 가장 효율적인 방법은 무엇인가 (사용한 MPI-2)의 모든 프로세서 모두의 합으로 간주 될 수있는 다음의 배열
[1 2 2 3 3 1 3 2 2 1]
끝나야 배열 (모든 순위에 분산). 1K + 코어에서이 작업을 빠르게 수행하려는 경우 성능이 중요합니다.
감사 :
또는 당신이 현재 위치에서 작업을 사용할 수 있지만이 성능이 저하됩니다 메모리 부족 경우
. 나는 더 나은 것을 전혀 생각할 수 없었기 때문에 합계를 예제로 사용했습니다. 나는 그 최선의 선택을 추측한다. – stali