На этом шаге мы приведем результаты выполнения последовательного и параллельного алгоритма, а также тексты приложений.

Приведем результаты вычислительных экспериментов, выполненных для оценки времени выполнения рассмотренного параллельного алгоритма Флойда для решения задачи поиска всех кратчайших путей (таблица 1).

Таблица 1. Результаты вычислительных экспериментов для параллельного алгоритма Флойда для решения задачи поиска всех кратчайших путей (время выполнения приведено в миллисекундах)
Число вершин Последовательный алгоритм Параллельный алгоритм

1 процессор 4 процессора

10 0,1475 0,2243 0,2329

20 1,1356 1,1624 1,2097

30 4,5139 4,2275 3,8685

40 9,6766 11,8165 8,8614

50 18,7163 19,1024 17,3413

60 31,8857 33,6132 29,3977

70 52,3894 51,7294 47,5813

80 74,5921 75,1036 69,4612

90 105,4508 112,2645 100,5634

100 149,5732 150,2847 137,4674

Таблица 1. Результаты вычислительных экспериментов для параллельного алгоритма Флойда для решения задачи поиска всех кратчайших путей (время выполнения приведено в миллисекундах)
Число вершин	Последовательный алгоритм	Параллельный алгоритм
1 процессор	4 процессора
10	0,1475	0,2243	0,2329
20	1,1356	1,1624	1,2097
30	4,5139	4,2275	3,8685
40	9,6766	11,8165	8,8614
50	18,7163	19,1024	17,3413
60	31,8857	33,6132	29,3977
70	52,3894	51,7294	47,5813
80	74,5921	75,1036	69,4612
90	105,4508	112,2645	100,5634
100	149,5732	150,2847	137,4674

Приведем реализации последовательного и параллельных алгоритмов.

Последовательный алгоритм:

#include "stdafx.h"
#include <cstdlib>
#include <cstdio>
#include <ctime>
#include <algorithm>
#include <conio.h>

using namespace std;

const double InfinitiesPercent = 50.0;
const double RandomDataMultiplier = 10;

int Min(int A, int B) {
  int Result = (A < B) ? A : B;

  if((A < 0) && (B >= 0)) Result = B;
  if((B < 0) && (A >= 0)) Result = A;
  if((A < 0) && (B < 0))  Result = -1;

  return Result;
}

void PrintMatrix(int *pMatrix, int RowCount, int ColCount) {
  for(int i = 0; i < RowCount; i++) {
    for(int j = 0; j < ColCount; j++)
      printf("%7d", pMatrix[i * ColCount + j]);
    printf("\n");
  }
}

void RandomDataInitialization(int *pMatrix, int Size) {
  srand( (unsigned)time(0) ); 
    
  for(int i = 0; i < Size; i++)
    for(int j = 0; j < Size; j++)
      if(i != j) {
        if((rand() % 100) < InfinitiesPercent)
          pMatrix[i * Size + j] = -1;
        else 
          pMatrix[i * Size + j] = rand() + 1;
      }
      else
        pMatrix[i * Size + j] = 0;
}

void ProcessInitialiazation(int *&pMatrix, int& Size) {
  do {
    printf("Enter the number of vertices: ");
    scanf("%d", &Size);
    if(Size <= 0)
      printf("The number of vertices should be greater then zero\n");
  } while(Size <= 0);

  printf("Using graph with %d vertices\n", Size);
  pMatrix = new int[Size * Size];
  RandomDataInitialization(pMatrix, Size);
}

void ProcessTermination(int *pMatrix) {
  delete []pMatrix;
}

void SerialFloyd(int *pMatrix, int Size) {
  int t1, t2;
  for(int k = 0; k < Size; k++)
    for(int i = 0; i < Size; i++)
      for(int j = 0; j < Size; j++)
        if((pMatrix[i * Size + k] != -1) &&
           (pMatrix[k * Size + j] != -1)) {
          t1 = pMatrix[i * Size + j];
          t2 = pMatrix[i * Size + k] + pMatrix[k * Size + j];
          pMatrix[i * Size + j] = Min(t1, t2);
      }
}

int main(int argc, char* argv[]) {
  int *pMatrix; 
  int  Size;       

  time_t start, finish;
  double duration = 0.0;

  printf("Serial Floyd algorithm\n");

  ProcessInitialiazation(pMatrix, Size);

  printf("The matrix before Floyd algorithm\n");
  PrintMatrix(pMatrix, Size, Size);

  start = clock();
  SerialFloyd(pMatrix, Size);
  finish = clock();

  printf("The matrix after Floyd algorithm\n");
  PrintMatrix(pMatrix, Size, Size);

  duration = (finish - start)*1000 / double(CLOCKS_PER_SEC);
  
  printf("Time: %10.5f\n", duration);

  ProcessTermination(pMatrix);

 getch();
}

Параллельный алгоритм:

#include "stdafx.h"
#include <cstdlib>
#include <cstdio>
#include <ctime>
#include <conio.h>
#include <algorithm>
#include <mpi.h>


using namespace std;

static int ProcRank;    
static int ProcNum;     

const double InfinitiesPercent = 50.0;
const double RandomDataMultiplier = 10;

int Min(int A, int B) {
  int Result = (A < B) ? A : B;

  if((A < 0) && (B >= 0)) Result = B;
  if((B < 0) && (A >= 0)) Result = A;
  if((A < 0) && (B < 0))  Result = -1;

  return Result;
}

void CopyMatrix(int *pMatrix, int Size, int *pMatrixCopy) {
  copy(pMatrix, pMatrix + Size * Size, pMatrixCopy);
}

bool CompareMatrices(int *pMatrix1, int *pMatrix2, int Size) {
  return equal(pMatrix1, pMatrix1 + Size * Size, pMatrix2);
}

void SerialFloyd(int *pMatrix, int Size) {
  int t1, t2;
  for(int k = 0; k < Size; k++)
    for(int i = 0; i < Size; i++)
      for(int j = 0; j < Size; j++) 
        if((pMatrix[i * Size + k] != -1) &&
           (pMatrix[k * Size + j] != -1)) {
          t1 = pMatrix[i * Size + j];
          t2 = pMatrix[i * Size + k] + pMatrix[k * Size + j];
          pMatrix[i * Size + j] = Min(t1, t2);
      }
}

void PrintMatrix(int *pMatrix, int RowCount, int ColCount) {
  for(int i = 0; i < RowCount; i++) {
    for(int j = 0; j < ColCount; j++) {
      printf("%7d", pMatrix[i * ColCount + j]);
      fflush(stdout);
    }
    printf("\n");
    fflush(stdout);
  }
}



void RandomDataInitialization(int *pMatrix, int Size) {
  srand( (unsigned)time(0) ); 
    
  for(int i = 0; i < Size; i++)
    for(int j = 0; j < Size; j++)
      if(i != j) {
        if((rand() % 100) < InfinitiesPercent)
          pMatrix[i * Size + j] = -1;
        else 
          pMatrix[i * Size + j] = rand() + 1;
      }
      else
        pMatrix[i * Size + j] = 0;
}

void ProcessInitialization(int *&pMatrix, int *&pProcRows, int& Size, int& RowNum) {
  setvbuf(stdout, 0, _IONBF, 0);
  if(ProcRank == 0) {
      printf("Enter the number of vertices: ");
      scanf("%d", &Size);
  }

  MPI_Bcast(&Size, 1, MPI_INT, 0, MPI_COMM_WORLD);

  int RestRows = Size;
  for(int i = 0; i < ProcRank; i++) 
    RestRows = RestRows - RestRows / (ProcNum - i);
  RowNum = RestRows / (ProcNum - ProcRank);

  pProcRows = new int[Size * RowNum];

  if(ProcRank == 0) {
    pMatrix = new int[Size * Size];
    RandomDataInitialization(pMatrix, Size);
  }
}


void ProcessTermination(int *pMatrix, int *pProcRows) {
  if(ProcRank == 0)
    delete []pMatrix;
    delete []pProcRows;
}



void DataDistribution(int *pMatrix, int *pProcRows, int Size, int RowNum) {
  int *pSendNum; 
  int *pSendInd;

  int RestRows = Size; 

  pSendInd = new int[ProcNum];
  pSendNum = new int[ProcNum];

  RowNum = Size / ProcNum;
  pSendNum[0] = RowNum * Size;
  pSendInd[0] = 0;
  for (int i = 1; i < ProcNum; i++) {
    RestRows -= RowNum;
    RowNum = RestRows / (ProcNum - i);
    pSendNum[i] = RowNum * Size;
    pSendInd[i] = pSendInd[i - 1] + pSendNum[i - 1];
  }
  MPI_Scatterv(pMatrix, pSendNum, pSendInd, MPI_INT, 
    pProcRows, pSendNum[ProcRank], MPI_INT, 0, MPI_COMM_WORLD);
  delete []pSendNum;
  delete []pSendInd;
}



void ResultCollection(int *pMatrix, int *pProcRows, int Size, int RowNum) {
  int *pReceiveNum; 
  int *pReceiveInd;  
  int RestRows = Size; 
  pReceiveNum = new int[ProcNum];
  pReceiveInd = new int[ProcNum];
  RowNum = Size / ProcNum;
  pReceiveInd[0] = 0;
  pReceiveNum[0] = RowNum * Size;
  for(int i = 1; i < ProcNum; i++) {
    RestRows-= RowNum;
    RowNum = RestRows / (ProcNum - i);
    pReceiveNum[i] = RowNum * Size;
    pReceiveInd[i] = pReceiveInd[i - 1] + pReceiveNum[i - 1];
  }

  MPI_Gatherv(pProcRows, pReceiveNum[ProcRank], MPI_INT,
    pMatrix, pReceiveNum, pReceiveInd, MPI_INT, 0, MPI_COMM_WORLD);
  delete []pReceiveNum;
  delete []pReceiveInd;
}
void RowDistribution(int *pProcRows, int Size, int RowNum, int k, int *pRow) {
  int ProcRowRank;  
  int ProcRowNum; 
  int RestRows = Size;
  int Ind = 0;
  int Num = Size / ProcNum;
   for(ProcRowRank = 1; ProcRowRank < ProcNum + 1; ProcRowRank ++) {
    if(k < Ind + Num ) break;
    RestRows -= Num;
    Ind+= Num;
    Num= RestRows / (ProcNum - ProcRowRank);
  }
  ProcRowRank = ProcRowRank - 1;
  ProcRowNum  = k - Ind;
  if(ProcRowRank == ProcRank)
    copy(&pProcRows[ProcRowNum*Size],&pProcRows[(ProcRowNum+1)*Size],pRow);

  MPI_Bcast(pRow, Size, MPI_INT, ProcRowRank, MPI_COMM_WORLD);
}

void ParallelFloyd(int *pProcRows, int Size, int RowNum) {
  int *pRow = new int[Size];
  int t1, t2;
  for(int k = 0; k < Size; k++) {
    RowDistribution(pProcRows, Size, RowNum, k, pRow);
    for(int i = 0; i < RowNum; i++) 
      for(int j = 0; j < Size; j++)
        if( (pProcRows[i * Size + k] != -1) &&
            (pRow[j]!= -1)) {
          t1 = pProcRows[i * Size + j];
          t2 = pProcRows[i * Size + k] + pRow[j];

        pProcRows[i * Size + j] = Min(t1, t2);
      }
  }
 delete []pRow;
}

void ParallelPrintMatrix(int *pProcRows, int Size, int RowNum) {
  for(int i = 1; i < ProcNum; i++) {
    MPI_Barrier(MPI_COMM_WORLD);
    if (ProcRank == i) {
      printf("ProcRank = %d\n", ProcRank); 
      fflush(stdout);
      printf("Proc rows:\n");
      fflush(stdout);
      PrintMatrix(pProcRows, RowNum, Size);
      fflush(stdout);
    }
    MPI_Barrier(MPI_COMM_WORLD);
  }
}

void TestDistribution(int *pMatrix, int *pProcRows, int Size, int RowNum) {
  MPI_Barrier(MPI_COMM_WORLD);
  if (ProcRank == 0) {
    printf("Initial adjacency matrix:\n");
    PrintMatrix(pMatrix, Size, Size);
  }
  MPI_Barrier(MPI_COMM_WORLD);
  ParallelPrintMatrix(pProcRows, Size, RowNum);
}
int main(int argc, char* argv[]) {
  int *pMatrix;      
  int  Size;         
  int *pProcRows;   
  int  RowNum;     

  double start, finish;
  double duration = 0.0;

  int *pSerialMatrix = 0;

  MPI_Init(&argc, &argv);
  MPI_Comm_size(MPI_COMM_WORLD, &ProcNum);
  MPI_Comm_rank(MPI_COMM_WORLD, &ProcRank);

  if(ProcRank == 0)
    printf("Parallel Floyd algorithm\n");

  ProcessInitialization(pMatrix, pProcRows, Size, RowNum);

  if (ProcRank == 0) {
    pSerialMatrix = new int[Size * Size];
    CopyMatrix(pMatrix, Size, pSerialMatrix);
  }

  start = MPI_Wtime();
  DataDistribution(pMatrix, pProcRows, Size, RowNum);
  TestDistribution(pMatrix, pProcRows, Size, RowNum);

  ParallelFloyd(pProcRows, Size, RowNum);
  ParallelPrintMatrix(pProcRows, Size, RowNum);

  ResultCollection(pMatrix, pProcRows, Size, RowNum);
  if(ProcRank == 0)
  { printf("Result matrix: \n");
    PrintMatrix(pMatrix, Size, Size);
  }
  finish = MPI_Wtime();

  duration = (finish - start)*1000;
  if(ProcRank == 0)
    printf("Time: %10.5f\n", duration);

  if (ProcRank == 0)
    delete []pSerialMatrix;

  ProcessTermination(pMatrix, pProcRows);

  MPI_Finalize();
 getch();
}

Файлы этих проектов можно взять здесь.

Со следующего шага мы начнем рассматривать параллельные алгоритмы решения дифференциальных уравнений в частных производных.

Предыдущий шаг Содержание Следующий шаг