assignment2.tex finished

master
Peter Babič 9 years ago
parent fe82132a38
commit 0ac6403fe4
  1. BIN
      assignment2.pdf
  2. 10
      assignment2.tex

BIN
assignment2.pdf (Stored with Git LFS)

Binary file not shown.

@ -39,9 +39,9 @@
\subsection*{Paralelná dekompozícia problému}
Master proces sa stará o načítanie dát a rozpočítanie počtu prvkov priradených pre slave procesy na približne rovnaké časti. Tie sú následne indivuálne rozoslané medzi všetky dostupné slave procesy, vrátane master procesu, blokujúcej komunikácie \verb|MPI_Send| a \verb|MPI_Receive| Proces so získanej časti nájde maximum. Jednotlivé maximá sú následne spätne získané master procesom pomocou \verb|MPI_Gather|, ktorý z nich nájde absolútne maximum. Po ukončení behu pralelnej časti algoritmu master proces vypíše výsledok na štandardný výstup.
Matica je v programe reprezentovaná ako jedno-rozmerné pole. Riešenie netrenasponuje aktuálne dáta, iba indexy. Master proces sa stará o načítanie dát a rozpočítanie počtu indexov priradených pre slave procesy na približne rovnaké časti. Tie sú následne indivuálne rozoslané medzi všetky dostupné slave procesy, vrátane master procesu, blokujúcou komunikáciou \verb|MPI_Send| a \verb|MPI_Receive|. Rozmery matice sú uložené do poľa a zdieľadné medzi všetkými procesmi pomocou \verb|MPI_Bcast|. Proces transponuje všetky získané indexya tie sú následne spätne získané master procesom pomocou \verb|MPI_Gatherv|. Po ukončení behu pralelnej časti algoritmu master proces vypíše výsledok na štandardný výstup.
Program využije všetky dostupné vlákna. Jedinou podmienkou je, aby počet párov vstupných hodnôt bol rovný alebo väčší ako počet vlákien, inak algoritmus nemá zmysel paralelizovať.
Program využije všetky dostupné vlákna.
\subsection*{Spôsob využitia nových komunikátorov}
@ -53,7 +53,7 @@ V riešení nepoli využité virtuálne topológie.
\subsection*{Hodnotenie efektívnosti výpočtu}
Experimentálne namerané výsledky behu sekvenčného a paralelného algoritmu na processore Intel Core2 Duo Processor T9500 so 4 GB priľahlej RAM sú uvedené v tabuľke \ref{t:efecti}. Vstupom bol súbor obsahujúci 500 000 hodnôt.
Experimentálne namerané výsledky behu sekvenčného a paralelného algoritmu na processore Intel Core2 Duo Processor T9500 so 4 GB priľahlej RAM sú uvedené v tabuľke \ref{t:efecti}. Vstupom bol súbor obsahujúci maticu s rozmermi 5 x 9.
\begin{table}[h!]
\caption{Porovnanie sekvenčného (1) a paralelného (2+) algoritmu}
@ -63,9 +63,9 @@ Experimentálne namerané výsledky behu sekvenčného a paralelného algoritmu
\hline
Počet procesov & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\
\hline
Čas v sekundách & 0.24 & 0.33 & 0.33 & 0.35 & 0.42 & 0.45 & 0.60 & 0.60 \\
Čas v ms & 0.15 & 0.16 & 0.17 & 0.20 & 0.20 & 0.20 & 0.29 & 0.35 \\
\hline
Vyťaženie CPU v \% & 92 & 125 & 140 & 141 & 150 & 156 & 158 & 161 \\
Vyťaženie CPU v \% & 88 & 99 & 105 & 111 & 112 & 115 & 125 & 127 \\
\hline
\end{tabular}
\end{table}

Loading…
Cancel
Save