assignment5 finished

master
Peter Babič 9 years ago
parent 93d06bb2b5
commit 8891227149
  1. 166
      assignment5.c
  2. BIN
      assignment5.pdf
  3. 79
      assignment5.tex

@ -0,0 +1,166 @@
#include <mpi.h>
#include <stdio.h>
#include <malloc.h>
#include <stdlib.h>
#include <string.h>
#define HASHTABLESIZE 10
#define WORDSIZE 6
#define STEP 3;
int doHash(char* word)
{
int i,hash = 0;
for(i = 0; i < strlen(word); i++)
hash += (int)word[i];
return hash % HASHTABLESIZE;
}
int main(argc, argv)
int argc;
char *argv[];
{
int size, rank;
int hashtable[HASHTABLESIZE], *dataChunk;
char word[WORDSIZE];
int i, full,placed,runs, hash, *sendcounts, *offsets,
chunkSize, zvysok, bounds[2], retbuf[2];
MPI_Status status;
/* Initialize MPI */
MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_WORLD, &size);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
chunkSize = HASHTABLESIZE / size;
zvysok = HASHTABLESIZE % size;
if (rank == 0)
{
//hashtabulka, 0=volne,1=obsadene
hashtable[0] = 1; hashtable[1] = 1;
hashtable[2] = 1; hashtable[3] = 1;
hashtable[4] = 0; hashtable[5] = 1;
hashtable[6] = 1; hashtable[7] = 0;
hashtable[8] = 0; hashtable[9] = 1;
strcpy(word, "hasho"); //hashovany retazec
for(i = 0; i < HASHTABLESIZE; i++)
{
if(hashtable[i] == 0)
printf("%d: -\n", i);
else
printf("%d: subor plny\n", i);
}
sendcounts = (int*) malloc(size*sizeof(int));
offsets = (int*) malloc(size*sizeof(int));
for(i = 0; i < size; i++)
{
if(i < zvysok)
{
sendcounts[i] = chunkSize + 1;
offsets[i] = i * (chunkSize + 1);
}
else
{
sendcounts[i] = chunkSize;
offsets[i] = (zvysok*(chunkSize+1)) + ((i-zvysok) * chunkSize);
}
}
}
MPI_Bcast(word,WORDSIZE,MPI_CHAR,0,MPI_COMM_WORLD);
chunkSize = rank < zvysok ? chunkSize+1 : chunkSize;
dataChunk = (int*) malloc(sizeof(int)* chunkSize);
/*
int MPI_Scatterv(void* sendbuf, int *sendcounts,
int *displs, MPI_Datatype sendtype, void* recvbuf,
int recvcount, MPI_Datatype recvtype, int root,
MPI_Comm comm);
*/
MPI_Scatterv(hashtable, sendcounts, offsets, MPI_INT, dataChunk, chunkSize, MPI_INT, 0, MPI_COMM_WORLD);
if(rank < zvysok)
bounds[0] = rank * (chunkSize); //chunksize je uz o jedna vacsi
else
bounds[0] = (zvysok*(chunkSize+1)) + ((rank-zvysok) * chunkSize);
bounds[1] = bounds[0] + chunkSize;
//check ci nema svoj segment plny
full = 1; //na zac. akoze plny, ak najdem neobsadene - set 0(=neplny)
for(i = 0; i < chunkSize; i++)
{
if(dataChunk[i] == 0)
{
full = 0;
break;
}
}
if(full == 0) //nie je plny - najdi miesto pre novy prvok
{
hash = doHash(word);
runs = 0; //pocet prechodov hashtabulkou
placed = 0; //umiestnene do tab?
while(placed == 0 && runs < chunkSize)
{
if(hash >= bounds[0] && hash < bounds[1])
{
i = hash-bounds[0]; //local index
if(dataChunk[i] == 0)
placed = 1;
}
if(placed == 0)//nema miesto
{
do
{
hash += STEP;
if(hash >= HASHTABLESIZE)
{
runs++;
hash -= HASHTABLESIZE;
}
} while (hash<bounds[0] || hash>=bounds[1]);
}
}
retbuf[0] = runs; //pocet prechodov - da/neda sa ulozit ?
retbuf[1] = hash; //pozicia
}
else //full
{
retbuf[0] = -1; //neda sa ulozit
retbuf[1] = -1;
}
if(rank == 0)
{
i=STEP;
//printf("\nhash: %d, step: %d\n", doHash(word), i);
//printf("master %d: runs=%d pos=%d\n",rank,retbuf[0],retbuf[1]);
for(i = 1; i < size; i++)
{
MPI_Recv(bounds, 2, MPI_INT, i, 1, MPI_COMM_WORLD, &status);
//printf("slave %d: runs=%d pos=%d\n", i, bounds[0], bounds[1]);
if(bounds[0] != -1 && (bounds[0]<retbuf[0] || (bounds[0]==retbuf[0] &&
bounds[1] < retbuf[1]) || retbuf[0] == -1)) //compare runs
{
retbuf[0] = bounds[0];
retbuf[1] = bounds[1];
}
}
//final result
if(retbuf[0] == -1)
printf("neda sa ulozit\n");
else
printf("ulozene do: %d\n", retbuf[1]);
}
else
{
MPI_Send(retbuf,2,MPI_INT,0,1,MPI_COMM_WORLD);
}
MPI_Finalize();
return (EXIT_SUCCESS);
}

BIN
assignment5.pdf (Stored with Git LFS)

Binary file not shown.

@ -0,0 +1,79 @@
\documentclass[fleqn,12pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[slovak]{babel}
\usepackage{amsmath}
% ---------------------------------------------------------------
% pri pouziti pdftex-u s obrazkami jpg pouzit nasledujuci riadok
\usepackage[pdftex]{color,graphicx}
% pri pouziti cslatex-u s obrazkami eps namiesto predosleho riadku
% pouzit nasledujuci riadok
% \usepackage{color,graphicx}
% ----------------------------------------------------------------
\setlength\textheight{200mm}
\setlength\textwidth{160mm}
\oddsidemargin=0mm\evensidemargin=0mm
\sloppy
\begin{document}
\thispagestyle{empty}
\begin{center}
{\Large Katedra počítačov a informatiky FEI TU v Košiciach}
\end{center}
\vfill
\begin{center}
{\huge Paralelné programovanie}
\end{center}
\begin{center}
{\large 2015/2016}
\end{center}
\vfill
\begin{center}
{\large Peter Babič} \hfill {\large Počítačové modelovanie}
\end{center}
\clearpage
\setcounter{section}{4}
\section{Paralelné asociatívne ukladanie reťazca do tabuľky}
\subsection*{Paralelná dekompozícia problému}
Hash funkcia určí pre každý súbor, či v ňom slovo bude alebo nebude uložené. Master proces určí, ktoré procesy budú obstarávať ktoré súbory pomocou \verb|MPI_Scatterv| a dbá na to, aby každý proces obstarával ukladanie d približne rovnakého počtu súborov. Hashovaný výraz je zdieľadný medzi všetkými procesmi pomocou \verb|MPI_Bcast|. Procesy sa pokúšajú postupne prechádzať súbory, ktoré im boli priradené a uložiť do nich obdržaný reťazec. Výsledky sú poslané individuálne naspäť do master procesu, kde je výsledok vypísaný na štandardný výstup.
Program využije všetky dostupné vlákna.
\subsection*{Spôsob využitia nových komunikátorov}
Všetky procesy zahrnuté do riešenia sú súčasťou globálneho komunikátora \verb|MPI_COMM_WORLD|.
\subsection*{Spôsob využitia topológie procesov}
V riešení nepoli využité virtuálne topológie.
\subsection*{Hodnotenie efektívnosti výpočtu}
Experimentálne namerané výsledky behu sekvenčného a paralelného algoritmu na processore Intel Core2 Duo Processor T9500 so 4 GB priľahlej RAM sú uvedené v tabuľke \ref{t:efecti}. Vstupom je pole obsahujúce 30 slov.
\begin{table}[h!]
\caption{Porovnanie sekvenčného (1) a paralelného (2+) algoritmu}
\label{t:efecti}
\centering
\begin{tabular}{l|rrrrrrrr}
\hline
Počet procesov & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\
\hline
Čas v ms & 0.17 & 0.19 & 0.21 & 0.30 & 0.32 & 0.33 & 0.39 & 0.45 \\
\hline
Vyťaženie CPU v \% & 94 & 99 & 101 & 108 & 116 & 124 & 128 & 137 \\
\hline
\end{tabular}
\end{table}
Výsledky naznačujú, že použitá implementácia algoritmu dosahuje najlepšie výsledky v sekvenčnej forme. S nárastom vlákien sa zvyšuje čas aj vyťaženosť CPU.
\end{document}
Loading…
Cancel
Save