2017-11-26 3 views

벡터에 행렬을 곱하는 코드를 작성합니다. 나는 MPI를 사용한다. 행렬은 행으로 구성된 청크로 분산됩니다. 청크 크기가 항상 같지 않을 수도 있습니다. 청크가 제대로 작동하지만, 이걸 실행하려고하면 절반 빈 벡터가 생깁니다. 그러나, 나는 완전한 벡터를받을 것으로 예상되었다. 첨부 된 코드를 살펴보십시오. 문제는 MPI_Gatherv 함수에 있다고 생각합니다.MPI_Gatherv가 올바르게 작동하지 않습니다.

#include <stdio.h> 
#include <mpi.h> 
#include <stdlib.h> 
#define COLUMN 4 
#define ROW 7 
#define dp 100.0f 

// Local start 
#define chunk_low(commrank, commsize, nvert) \ 
    ((commrank) * (nvert)/(commsize)) 

// Local end 
#define chunk_height(commrank, commsize, nvert) \ 
    (chunk_low((commrank) + 1, commsize, nvert) - 1) 

// Local size 
#define chunk_size(commrank, commsize, nvert) \ 
    (chunk_height(commrank, commsize, nvert) - \ 
    chunk_low(commrank, commsize, nvert) + 1) 

// Matrix initialization function 
void init_matrix(int column, int row, float *matrix) 
    int j, i; 
    for(i=0; i < row; i++){ 
     for(j=0; j < column; j++){ 
      matrix[i*column+j] = i * column + j; // (float)rand()/RAND_MAX * dp *2.0f - dp; 
      printf(" %f ", matrix[i * column + j]); 

int main(int argc, char **argv) 
    int rank, size; 
    int i, j; 
    float *vm, *local_matrix, *result, *vector; 
    double time1, time2; 
    int *displs, *rcounts, *scounts; 

    vm = (float *)calloc(ROW * COLUMN, sizeof(float)); 
    vector = malloc(COLUMN * sizeof(float)); 
    MPI_Init(&argc, &argv); 
    MPI_Comm_rank(MPI_COMM_WORLD, &rank); 
    MPI_Comm_size(MPI_COMM_WORLD, &size); 

    /* Process 0 - master */ 
    if (rank==0) 

     printf("\nNumbers of proccesses %d. \nElements in vector %d.\n", size, COLUMN); 

     /* Init vector vA */ 
     init_matrix(COLUMN, ROW, vm); 

     for (i = 0; i < COLUMN; i++) { 
      vector[i] = (11 * 5) + (11 * i); 

     result = (float *)calloc(ROW, sizeof(float)); 

     //Time begining calculating of programm 

    /* End of work process 0 */ 

    displs = (int *)malloc(sizeof(int) * size); 
    scounts = (int *)malloc(sizeof(int) * size); 
    rcounts = (int *)malloc(sizeof(int) * size); 

    for (i = 0; i < size; i++) { 
     displs[i] = chunk_low(i, size, ROW) * COLUMN; // Position initialization 
     rcounts[i] = scounts[i] = chunk_size(i, size, ROW) * COLUMN; 

    local_matrix = (float *)calloc(chunk_size(rank, size, ROW) * COLUMN, sizeof(float)); 

    MPI_Bcast(vector, COLUMN, MPI_DOUBLE, 0, MPI_COMM_WORLD); 
    MPI_Scatterv(vm, scounts, displs, MPI_FLOAT, local_matrix, 
       rcounts[rank], MPI_FLOAT, 0, MPI_COMM_WORLD); 

    int local_row = scounts[rank]/COLUMN; 
    float *local_result = (float *)calloc(local_row, sizeof(float));; 

    for(i = 0; i < local_row; i++) { 
     for (j = 0; j < COLUMN; j++) { 
      local_result[i] += local_matrix[i * COLUMN + j] * vector[j]; 

    MPI_Gatherv(local_result, local_row, MPI_FLOAT, result, rcounts, displs, MPI_FLOAT, 0, MPI_COMM_WORLD); 
    /* Only master-process */ 
    if (rank==0) 
     //Time ending programm 
     printf("\nTime parallel calculation = %f s.\n",time2-time1); 
     for (i = 0; i < ROW; i++) 
      printf(" %f\n", result[i]); 
    // End work of master-process 

    /* Delete storage arrays of process */ 

    return 0; 

을 실행 한 후이 코드는 내가 예상 한 : 484.000000 1628.000000 0.000000 0.000000 0.000000 0.000000 : 484.000000 1628.000000 2772.000000 3916.000000 5060.000000 6204.000000 7348.000000

그러나이 결과를 얻을 0.000000



문제는 우리가 MPI_Gatherv에게 건네 주었던 displs에서 분명히했다

관련 문제