Εργασία για το μεταπτυχιακό μάθημα Παράλληλοι υπολογισμοί από τον φοιτητή Μουζακίδη Αλέξανδρο AM M 853

Εργασία για το μεταπτυχιακό μάθημα Παράλληλοι υπολογισμοί από τον φοιτητή Μουζακίδη Αλέξανδρο AM M 853 Θέμα Παράλληλη Αριθμητική Επίλυση Μερικών Διαφορικών Εξισώσεων με τις μεθόδους Jacob και Jacob over relaaton Ακαδημαϊκό έτος 2006-2007

2 Παρουσίαση προβλήματος Αριθμητική επίλυση διαφορικής εξίσωσης Η επίλυση διαφορικών εξισώσεων είναι μία περιοχή όπου η χρήση παράλληλου υπολογισμού είναι επιβεβλημένη λόγω του μεγάλου όγκου δεδομένων που έχουμε να επεξεργαστούμε συνήθως.. Μια τέτοια διαφορική εξίσωση είναι η Laplace που στον 2δ χώρο δίνεται από τον ακόλουθο τύπο 2 2 2 2 0 0 1 u u = Από την υπόθεση έχουμε συνοριακές συνθήκες 0 0 1 0 u u u = = = και 1 1 u =. Για την λύση του προβλήματος σε υπολογιστή μετατρέπουμε την εξίσωση σε ένα σύστημα γραμμικών εξισώσεων. Δηλαδή ένα σύστημα της μορφή Α Χ = Β. Για να κάνουμε αυτό χωρίζουμε τον χώρο μέσα στον όποιο θέλουμε να βρούμε την λύση σε σημεία που ισαπέχουν μεταξύ τους κάποια πολύ μικρή απόσταση έστω. Δηλαδή ισχύει. 2 1 2 1 2 2 2 2 2 2 ϑ ϑ ϑ ϑ Χρησιμοποιώντας αυτή την προσέγγιση πάνω στην εξίσωση Laplace έχουμε. 0 4 1 2 =

3 Η παραπάνω εξίσωση περιγράφει το γραμμικό σύστημα για την λύση του οποίου υλοποιήθηκε η επαναληπτική μέθοδος Jacob και η επέκταση της Jacob overrelaaton. Μέθοδοι Jacob και Jacob over relaaton Η μέθοδος χρησιμοποιεί την παρακάτω εξίσωση για την εύρεση των άγνωστων ενός γραμμικού συστήματος της μορφής ΑΧ = Β. 1 1 = j j j j a b a Όπου είναι η τιμή του στην κ επανάληψη και για την εύρεση του χρησιμοποιούμε τις τιμές όλων των 1 j με j. Όταν ο αλγόριθμος εκτελείται σε n επεξεργαστές σε κάθε επανάληψη χρειάζεται n1 προσθέσεις και έναν πολλαπλασιασμό. Στην δική μας περίπτωση εκτελεί τρεις προσθέσεις και ένα πολλαπλασιασμό. Η συνολική πολυπλοκότητα του αλγορίθμου εξαρτάται από τον αριθμό των επαναλήψεων. Στην περίπτωση της εξίσωσης Laplace και του γραμμικού συστήματος που προκύπτει η επαναληπτική σχέση της Jacob είναι η παρακάτω. 4 1 1 1 1 1 = Για να προσπαθήσουμε να επιτύχουμε καλύτερες ταχύτητες σύγκλησης μπορούμε να συμπεριλάβουμε την τιμή του στοιχείου 1 και να το πολλαπλασιάσουμε με μια παράμετρο 1-ω με 0 < ω < 1. Η γενική εξίσωση Jacob να γίνει. 1 1 1 = j j j j a b a ω ω Και η εξίσωση Jacob για το δικό μας πρόβλημα θα γίνει. 1 1 1 1 1 4 = ω ι ω H σύγκλιση του αλγορίθμου μπορεί να διαπιστωθεί υπολογίζοντας την νόρμα της διαφοράς μεταξύ των διαδοχικών διανυσμάτων κ1 και κ δηλ. την ποσότητα. = = n 1 2 1 1

και ελέγχοντας αν είναι μικρότερη από ένα συγκεκριμένο όριο ε. Αν αυτό επαληθεύεται τότε το διάνυσμα 1 είναι κατά προσέγγιση η λύση του γραμμικού συστήματος. Επίσης για να αποφευχθεί η ατέρμονη επανάληψη της παραπάνω διαδικασίας ορίζεται και ένα άνω όριο επαναλήψεων έστω Ζ. Αν ο αλγόριθμος εκτελέσει Ζ επαναλήψεις χωρίς να προκύψει σύγκλιση τότε θεωρούμε ότι η διαδικασία δεν συγκλίνει και τερματίζουμε τον αλγόριθμο. Μονοδιάστατη καταμέριση στοιχείων κατά γραμμές και επεξεργασία σε φυσική διάταξη Στην μονοδιάστατη καταμέριση ενός γραμμικού συστήματος κατά γραμμές ακολουθήται η καταμέριση που παρουσιάζεται στο παρακάτω σχήμα. A: n n m = n/p P ο αριθμός των CPUs Δηλαδή μοιράζονται σε κάθε επεξεργαστή κάποιος αριθμός συνεχομένων γραμμών και καλείται να υπολογίσει τις τιμές των Χ μόνο για αυτές τις γραμμές. Στην περίπτωση μας ο κάθε υπολογιστής αναλαμβάνει να υπολογίσει έναν αριθμό σημείων. Από το εσωτερικό πλέγμα που σχηματίζεται 4

Σε κάθε επανάληψη ο κάθε επεξεργαστής έχει όλες τις παραμέτρους του πινάκα Α που αντιστοιχούν στα Χ που πρέπει να υπολογίσει. Σε κάθε επανάληψη πρέπει να ενημερωθεί για τις άλλαξες των Χ στα σύνορα του. Δηλαδή χρειάζεται να επικοινωνήσει με τον επεξεργαστή που βρίσκεται από πάνω του και αυτόν που είναι από κάτω του για να ανταλλάξουν τις νέες τιμές των Χ. Στην εφαρμογή θεωρώ ότι οι επεξεργαστές μοιράζονται με την σειρά στις περιοχές διαμερίσεις. Δηλαδή ο επεξεργαστής 0 αναλαμβάνει τα πρώτα n/p στοιχειά ο επεξεργαστής 1 τα επόμενα n/p και πάει λέγοντας. Όποτε ο επεξεργαστής ν επικοινωνεί με τον ν 1 και ν 1. Φυσικά πριν την αποστολή μηνυμάτων γίνεται έλεγχος αν ο επεξεργαστής είναι ο πρώτος δηλαδή αν ν = 0ή αν είναι ο τελευταίος δηλαδή αν ν =π 1. Όπου π είναι ο συνολικός αριθμός των επεξεργαστών. Άρα σε κάθε επανάληψη υπάρχει μια καθολική επικοινωνία όλων των επεξεργαστών για τον υπολογισμό της συνολικής νόρμας που χρειάζεται στον έλεγχο σύγκλησης και ο κάθε επεξεργαστής στέλνει 2 μηνύματα για την ανταλλαγή των Χ. Εκτός από τον πρώτο και τον τελευταίο που στέλνουν μόνο ένα μήνυμα αφού έχουν μόνο ένα γείτονα. Δηλαδή ο κάθε επεξεργαστής ανταλλάσειπ 1μηνύματα μεγέθους όσο ένας αριθμός κινητής υποδιαστολής διπλής ακρίβειας συνήθως 4 λέξεις δηλαδή 8 btes.όπου π είναι ο αριθμός των επεξεργαστών. Επίσης ανταλλάσσονται 2 μηνύματα μεγέθους 4μ λέξεων όπου μ είναι ο αριθμός των στοιχείων μιας γραμμής και το 4 δηλώνει το μέγεθος των αριθμών κινητής υποδιαστολής διπλής ακριβείας. Ο συνολικός χρόνος επικοινωνίας που χρειάζεται ο αλγόριθμος συγκλείνει μετά από I βήματα θα είναι 5

t comm = I π 1 ts 2t w 2 ts 4µ tw Ο Χρόνος επεξεργασίας θα είναι άσος με t µ 2 comp = I t c π Όπου t c είναι ο χρόνος που χρειάζεται σε κάθε επανάληψη για να υπολογιστεί η νέα τιμή για το κάθε στοιχείο του πλέγματος t w είναι ο χρόνος που χρειάζεται για την μεταφορά μιας λέξης και t s π χρόνος έναρξης για την αποστολή ενός μηνύματος. Δισδιάστατη καταμέριση στοιχείων σε τετράγωνα και υπολογισμός σε φυσική διάταξη ύψος Στην δυσδιάστατη καταμέριση ο πινάκας των σημείων χωρίζεται σε τετράγωνα με. Σε αυτή τη μορφή καταμέρισης ο κάθε επεξεργαστής αναλαμβάνει ένα ψ τετράγωνο. Οι επεξεργαστές μοιράζονται από πάνω προς τα κάτω και από αριστερά προς τα δεξιά πχ αν έχουμε 16 επεξεργαστές θα μοιραστούν ως εξής 0 4 8 12 1 5 9 13 2 6 10 14 3 7 11 15 Σε κάθε επανάληψη υπάρχει πάλι η καθολική επικοινωνία όλων των επεξεργαστών για τον υπολογισμό της νόρμας π 1 μηνύματα από κάθε 6

επεξεργαστή μεγέθους ενός αριθμού κινητής υποδιαστολής διπλής ακριβείας αλλά τώρα ο κάθε επεξεργαστής ανταλλάσει από 2 έως 4 μηνύματα αναλόγως τον αριθμό των γειτονικών επεξεργαστών. Δηλαδή ανταλλάσσονται από κάθε 4µ επεξεργαστή 4 t s tw μηνύματα μεγέθους µ / π λέξεων. Άρα όταν ο π αλγόριθμος χρειάζεται Ι επαναλήψεις για να επιτευχθεί σύγκληση ο συνολικός χρόνος επικοινωνίας θα είναι t comm 4µ = Ι π 1 t s 2t w 4 t s t w π Ο Χρόνος επεξεργασίας θα είναι άσος με t µ 2 comp = I t c Για των υπολογισμό του αριθμού του επεξεργαστή γειτνίασης χρησιμοποιούμε τους ακολούθους τύπους. Αν είμαστε στον επεξεργαστή ν ο πάνω επεξεργαστής έχει την τιμή ν 1 ο κάτω την τιμή ν 1 ο αριστερός π ν π και για τον δεξιό ν π. Όπου π ο συνολικός αριθμός των επεξεργαστών. Φυσικά πριν την αποστολή μηνυμάτων προς τις 4 κατεύθυνσης γίνεται έλεγχος. Αν ν < π είμαστε στην πρώτη στήλη άρα δεν έχουμε αριστερούς γείτονες αν. ν π π είμαστε στην δεξιά στήλη και δεν έχουμε δεξιούς γείτονες αν νmod p = 0τότε είμαστε στην πρώτη γραμμή και δεν έχουμε βόρειους γείτονες και τέλος αν ν 1 Mod p = 0 τότε είμαστε στην τελευταία γραμμή και δεν έχουμε νοτίους γείτονες Μονοδιάστατη καταμέριση στοιχείων κατά γραμμές και επεξεργασία σε διάταξη κόκκινου μαύρου Σε αυτή την διάταξη υπολογισμών το πλέγμα χωρίζεται στους επεξεργαστές όπως ακριβώς και στην περίπτωση της μονοδιάστατης καταμέρισης της φυσικής διάταξης αλλά τώρα οι γραμμές χαρακτηρίζονται ως μαύρες ή κόκκινες. αναλόγως αν είναι μόνες η ζυγές. Σε κάθε επανάληψη υπολογίζονται πρώτα οι τιμές των σημείων πάνω στις μαύρες γραμμές και στην συνεχεία αυτά των κόκκινων Η διάφορα με την φυσική διάταξη έγκειται στο ότι ο υπολογισμός των κόκκινων σημείων λαμβάνει υπόψη του τις νέες τιμές των βόρειων και νοτίων σημείων που υπολογιστήκαν κατά την διάρκεια υπολογισμού των μαύρων σημείων. 7

Σε κάθε επανάληψη οι επεξεργαστές πάλι χρειάζονται το πολύ χρόνο επικοινωνίας t comm = I π 1 ts 2t w 2 ts 4µ tw αφού δεν αλλάζει κάτι ούτε στον αριθμό ούτε στο μέγεθος των μηνυμάτων που αποστέλλονται Ο Χρόνος επεξεργασίας θα είναι άσος με t µ 2 comp = I t c π Δισδιάστατη καταμέριση στοιχείων σε τετράγωνα και υπολογισμός σε διάταξη κόκκινου μαύρου ΣΕ αυτή την μορφή επεξεργασίας η καταμέριση των στοιχείων γίνεται όπως ακριβώς και στην φυσική διάταξη δηλαδή το πλέγμα χωρίζεται με τετράγωνα ο κάθε επεξεργαστής αναλαμβάνει να υπολογίσει τιμές για κάθε στοιχεία ενός τετραγώνου και επικοινωνεί με τους επεξεργαστές που είναι γύρω του για να λαβει της νέες τιμές. Σε αυτή την περίπτωση όμως το κάθε σημείο χαρακτηρίζεται ως κόκκινα η ως μαύρο αναλόγως αν το άθροισμα των συντεταγμένων του είναι άρτιος η περιττός αριθμός αντίστοιχα 8

Σε κάθε επανάληψη οι επεξεργαστές πάλι χρειάζονται το πολύ χρόνο επικοινωνίας t comm 4µ = Ι π 1 t s 2t w 4 t s t w π αφού δεν αλλάζει κάτι ούτε στον αριθμό ούτε στο μέγεθος των μηνυμάτων που αποστέλλονται Ο Χρόνος επεξεργασίας θα είναι άσος με t = I comp t c Οι διατάξεις κόκκινο-μαύρο μετατρέπουν την Jacob σε μια ενδιάμεση μέθοδο της Jacob και Gauss Sedel Αποτέλεσμα είναι τα τελικά νουμερα να διαφέρουν λίγο λόγω της αλλαγής των υπολογισμών αλλά ο αλγόριθμος να έχει μικρότερους χρόνους σύγκλησης µ 2 Σύγκριση τρόπων καταμερισμού Όπως είδαμε παραπάνω ο τρόπος επεξεργασίας είτε γίνει σε φυσική διάταξη είτε σε κόκκινο μαύρο δεν επηρεάζει την πολυπλοκότητα του αλγορίθμου περά από τον αριθμό των επαναλήψεων που θα χρειαστούν για να επιτευχθεί σύγκληση Όπως επίσης η μέθοδος JOR διαφέρει από την μέθοδο Jacob μόνο στον απαιτούμενο αριθμό επαναλήψεων για να επιτευχθεί λύση. Επομένως η διάφορα στις εφαρμογές θα φάνει μόνο από τον αριθμό και το μέγεθος των μηνυμάτων που ανταλλάσουν. Δηλαδή από τον καταμερισμό που θα χρησιμοποιηθεί π 9

Στην.περίπτωση της καταμέρισης σε τετράγωνα ο συνολικός χρόνος που χρειάζεται για την λύση του προβλήματος είναι t p 2 4µ µ = Ι π 1 t s 2t w 4 t s t w t c π π Ενώ στην περίπτωση της καταμέρισης σε οριζόντιες γραμμές ο χρόνος που χρειάζεται είναι 2 µ t p = I π 1 ts 2t w 2 ts 4µ tw t c π Στο παρακάτω σχήμα βλέπουμε τις γραφικές παραστάσεις του χρόνου κάθετος αξίνας που χρειάζεται για να λυθεί το πρόβλημα σε συνάρτηση με τον αριθμό των επεξεργαστών που δίνονται οριζόντιος αξίνας. Για την γραφική παράσταση υπέθεσα ότι το tc = t w =1 1 ms και το t s = 4 ms. Τα νούμερα αυτά δεν είναι πραγματικά με την άποψη ότι δεν γνωρίζω αν πράγματι ισχύουν για κάποια υπολογιστική μηχανή. Τα νούμερα όμως αυτά νομίζω πως είναι σωστά για την απεικόνιση της γραφικής παράστασης καθώς μου φαίνεται λογικό η αρχικοποίηση μιας επικοινωνίας να χρειάζεται τέσσερεις φορές περισσότερο χρόνο από την αποστολή μιας λέξης μέσα από το δίκτυο. Φυσικά αυτό εξαρτάται από τις προδιαγραφές του δικτύου και του πρωτοκόλλου επικοινωνίας αλλά νομίζω πως είναι ένα ρεαλιστικό σενάριο. Παρατηρούμε ότι η καταμέριση σε οριζόντιες λωρίδες παρουσιάζει αρχικά καλυτέρους χρόνους δηλαδή για μικρό αριθμό επεξεργαστών αλλά γρήγορα οι δυο γραμμές ουσιαστικά συμπίπτουν. Ακολουθούν τα διάγραμμα της συνάρτησης επιτάχυνσης και απόδοσης αντίστοιχα 10

Ο τύπος υπολογισμού της επιτάχυνσης είναι S p T = T 1 p Ο τύπος υπολογισμού της αποδοτικότητας είναι E p = S p p Από τα παραπάνω διαγράμματα παρατηρούμε ότι η χρήση της καταμέρισης σε τετράγωνα έχει συνεχώς μεγαλύτερη επιτάχυνση και είναι πιο αποδοτική από την καταμέριση σε οριζόντιες λωρίδες για οποιοδήποτε αριθμό επεξεργαστών Υλοποίηση 11

Για την εργασία δημιουργήθηκαν 8 προγράμματα σε γλώσσα προγραμματισμού C που υλοποιούν την επίλυση της διαφορικής Laplace με την μέθοδο Jacob και JOR σε όλες τις μορφές διαμερίσεις και επεξεργασίας που αναφέρθηκαν παραπάνω. Θα μπορούσα φυσικά να φτιάξω ένα κεντρικό πρόγραμμα και αναλόγως τις παραμέτρους εισόδου να εκτελεί διαφορετικά πράγματα αλλά θέλησα να κρατήσω τον κώδικα όσο πιο απλό γίνεται. Ο κώδικας υπάρχει στο τελευταίο κομμάτι της εργασίας και βρίσκεται σε 8 διαφορετικά αρχεία κειμένου. Τα αρχεία έχουν τα παρακάτω ονόματα jacob_blocs.c Περιέχει τον κώδικα για την επίλυση με απλή μέθοδο Jacob με καταμέριση σε τετράγωνα και επεξεργασία σε φυσική διάταξη jacob_blocs_red_blac.c Περιέχει τον κώδικα για την επίλυση με απλή μέθοδο Jacob με καταμέριση σε τετράγωνα και επεξεργασία σε διάταξη κόκκινο-μαύρο jacob_strps.c Περιέχει τον κώδικα για την επίλυση με απλή μέθοδο Jacob με καταμέριση σε οριζόντιες γραμμές και επεξεργασία σε φυσική διάταξη jacob_strps_red_blac.c Περιέχει τον κώδικα για την επίλυση με απλή μέθοδο Jacob με καταμέριση σε οριζόντιες γραμμές και επεξεργασία διάταξη κόκκινο μαύρο jor_blocs.c Περιέχει τον κώδικα για την επίλυση με την μέθοδο JOR με καταμέριση σε τετράγωνα και επεξεργασία σε φυσική διάταξη jor_blocs_red_blac.c Περιέχει τον κώδικα για την επίλυση με τη μέθοδο JOR με καταμέριση σε τετράγωνα και επεξεργασία σε διάταξη κόκκινο-μαύρο jor_strps.c Περιέχει τον κώδικα για την επίλυση με τη μέθοδο JOR με καταμέριση σε οριζόντιες γραμμές και επεξεργασία σε φυσική διάταξη jor_strps_red_blac.c Περιέχει τον κώδικα για την επίλυση με τη μέθοδο JOR με καταμέριση σε οριζόντιες γραμμές και επεξεργασία διάταξη κόκκινο μαύρο Ο κώδικας μεταγλωττίστηκε με τον GCC και τον Mcrosot cl compler αλλά είναι γραμμένος αποκλειστικά σε standard C οπότε φυσιολογικά δεν θα έχει πρόβλημα με κανένα compler αν αυτός μπορεί να μεταφράσει και τα eader του MPI σωστά. Στην περίπτωση που μεταγλωττιστεί με gcc θα πρέπει να δοθεί και η παράμετρος lm εκτός από τις βιβλιοθήκες του MPI καθώς γίνεται χρήση της βιβλιοθήκης mat. Σε όλα τα προγράμματα γίνεται έλεγχος για το αν ο αριθμός των γραμμών η στηλών είναι ακέραιο πολλαπλάσιο των επεξεργαστών η της ρίζας των επεξεργαστών αναλόγως του τι υλοποιεί το πρόγραμμα και αν δεν είναι γίνεται κατανομή επιπλέων γραμμών η στηλών στους επεξεργαστές μέχρι να έχουμε το σωστό αριθμό γραμμών. Αυτό έχει σαν αποτέλεσμα ορισμένοι επεξεργαστές να λαμβάνουν περισσότερο φόρτο εργασίας από άλλους αλλά ήταν απαραίτητο μιας που η εφαρμογή έπρεπε να τρέξει για δεδομένα όπου συνέβαινε το παραπάνω φαινόμενο και έπρεπε να βγάζει σωστά αποτελέσματα. Οι εφαρμογές που εκτελούν την απλή Jacob δέχονται τρεις παραμέτρους. Πρώτα τον αριθμό των στοιχείων που θα έχει η πλευρά του εσωτερικού 12

1 τετραγωνικού πλέγματος δηλαδή αν το = όλο το πλέγμα θα έχει 42 στοιχειά 41 σε κάθε πλευρά αλλά το εσωτερικό θα έχει 40 άρα στην εφαρμογή πρέπει να δοθεί ο αριθμός 40. Δεύτερη παράμετρος πρέπει να δοθεί ο μέγιστος αριθμός επαναλήψεων δηλαδή μέσα σε πόσες επαναλήψεις θα πρέπει ο αλγόριθμος να επιτύχει σύγκληση. Τρίτη κα τελευταία παράμετρος είναι το επιτρεπτό σφάλμα. Η εκτέλεση δηλαδή της εφαρμογής θα είναι κάτι που μοιάζει με το παρακάτω mprun np 16 jacob_strps 80 10000000 0.00001 Στην περίπτωση που εκτελούμε πείραμα χρησιμοποιώντας πρόγραμμα που υλοποιεί την JOR μέθοδο θα πρέπει να δώσουμε μια επιπλέον παράμετρο για την τιμή που θα πάρει το ω. Δηλαδή θα εκτελέσουμε κάτι σαν το παρακατω mprun np 16 jacob_strps 80 10000000 0.00001 0.5 Η εφαρμογές σχεδιάστηκαν απλά για τις ανάγκες της εκτέλεσης τους σε μορφή πειραμάτων για αυτό και δεν έγιναν ασφαλείς. Δηλαδή δεν ελέγχουν αν οι παράμετροι που τους δίνονται είναι σωστές. Αν δοθούν λάθος παράμετροι η συμπεριφορά του προγράμματος εξαρτάται από το είδος του λάθους που δόθηκε πχ ένα ω μεγαλύτερο από 1 θα είχε σαν αποτέλεσμα η μέθοδος να μην συγκλείνει ποτέ ενώ ένα αρνητικό νούμερο για το μέγεθος του πλέγματος θα είχε σαν αποτέλεσμα να μην μπορεί να δεσμευτεί μνήμη. Ο μοναδικός έλεγχος που γίνεται είναι στην περίπτωση που χρησιμοποιείται η δισδιάστατη κατανομή σε τετράγωνα όπου εξετάζεται ο αριθμός των επεξεργαστών και απαιτείται να έχουν ακέραια ριζα. Η κάθε εφαρμογή στο τερματισμό της τυπώνει τον αριθμό των επαναλήψεων που εκτέλεσε τον χρόνο που χρειάστηκε για επικοινωνία και τον χρόνο που χρειάστηκε για την επεξεργασία ο πρώτος επεξεργαστής. Μετρήσεις Οι πινάκες που ακλουθούν περιέχουν τα αποτελέσματα από την εκτέλεση των πειραμάτων. Για την μέθοδο JOR χρησιμοποιήθηκε για τιμή του ω το 0.5 η όποια δεν είναι η βέλτιστη αλλά δεν μπόρεσα να βρω από κάπου ποια είναι η βέλτιστη ω. Αυτό που παρατήρησα είναι ότι για ε>0.1 η JOR συγκλείνει σε λιγότερες επαναλήψεις από την απλή Jacob ενώ για μεγαλύτερα ε θέλει περισσότερες επαναλήψεις και τείνει να εξισωθεί με την Jacob για ω 1 Jacob strps p n Tcomm Tcomp Toverall Sp Ep teratons ε 1 40 0 0.556741 0.556741 2655 0.00001 2 40 0.058635 0.288203 0.346838 1.605190 0.802595 2655 0.00001 4 40 0.119945 0.153985 0.27393 2.032421 0.508105 2655 0.00001 13

6 40 0.1409 0.112745 0.253645 2.194961 0.365827 2655 0.00001 8 40 0.205934 0.086549 0.292483 1.903499 0.237937 2655 0.00001 16 40 0.351694 0.058683 0.410377 1.356657 0.084791 2655 0.00001 1 60 0 2.558841 2.558841 5580 0.00001 2 60 0.141395 1.299145 1.44054 1.776307 0.888153 5580 0.00001 4 60 0.280271 0.669105 0.949376 2.695287 0.673822 5580 0.00001 6 60 0.35574 0.457319 0.813059 3.147178 0.524530 5580 0.00001 8 60 0.450076 0.376776 0.826852 3.094678 0.386835 5580 0.00001 16 60 0.838714 0.208465 1.047179 2.443556 0.152722 5580 0.00001 1 80 0 7.613305 7.613305 9463 0.00001 2 80 0.265061 3.850334 4.115395 1.849957 0.924979 9463 0.00001 4 80 0.497381 1.955149 2.45253 3.104266 0.776066 9463 0.00001 6 80 0.638231 1.389299 2.02753 3.754965 0.625828 9463 0.00001 8 80 0.983016 1.014631 1.997647 3.811136 0.476392 9463 0.00001 16 80 1.841581 0.544698 2.386279 3.190450 0.199403 9463 0.00001 Jacob strps red_blac p n Tcomm Tcomp Toverall Sp Ep teratons ε 1 40 0 0.448758 0.448758 2065 0.00001 2 40 0.069881 0.237458 0.307339 1.460140 0.730070 2065 0.00001 4 40 0.117867 0.130435 0.248302 1.807307 0.451827 2065 0.00001 6 40 0.123375 0.101638 0.225013 1.994365 0.332394 2065 0.00001 8 40 0.138361 0.077399 0.21576 2.079894 0.259987 2065 0.00001 16 40 0.26344 0.044653 0.308093 1.456567 0.091035 2065 0.00001 1 60 0 2.04201 2.04201 4348 0.00001 2 60 0.194176 1.044155 1.238331 1.649002 0.824501 4348 0.00001 4 60 0.242244 0.550592 0.792836 2.575577 0.643894 4348 0.00001 6 60 0.349257 0.379983 0.72924 2.800189 0.466698 4348 0.00001 8 60 0.356687 0.319062 0.675749 3.021847 0.377731 4348 0.00001 16 60 0.653538 0.162457 0.815995 2.502479 0.156405 4348 0.00001 1 80 0 5.946478 5.946478 7385 0.00001 2 80 0.206657 3.004838 3.211495 1.851623 0.925811 7385 0.00001 4 80 0.388176 1.525714 1.91389 3.107011 0.776753 7385 0.00001 6 80 0.498805 1.093175 1.59198 3.735272 0.622545 7385 0.00001 8 80 0.767347 0.798253 1.5656 3.798210 0.474776 7385 0.00001 16 80 1.437843 0.425505 1.863348 3.191287 0.199455 7385 0.00001 JOR strps p n Tcomm Tcomp Toverall Sp Ep teratons ε 1 40 0 1.13065 1.13065 4841 0.00001 2 40 0.137644 0.583625 0.721269 1.567584 0.783792 4841 0.00001 4 40 0.236822 0.309988 0.54681 2.067720 0.516930 4841 0.00001 6 40 0.287158 0.227421 0.514579 2.197233 0.366206 4841 0.00001 14

8 40 0.363778 0.171468 0.535246 2.112393 0.264049 4841 0.00001 16 40 0.725684 0.121415 0.847099 1.334732 0.083421 4841 0.00001 1 60 0 5.17011 5.17011 10117 0.00001 2 60 0.279719 2.622235 2.901954 1.781596 0.890798 10117 0.00001 4 60 0.469306 1.348573 1.817879 2.844034 0.711009 10117 0.00001 6 60 0.687572 0.92364 1.611212 3.208833 0.534805 10117 0.00001 8 60 0.838639 0.755685 1.594324 3.242823 0.405353 10117 0.00001 16 60 1.603081 0.416411 2.019492 2.560104 0.160007 10117 0.00001 1 80 0 15.35697 15.35697 17085 0.00001 2 80 0.52424 7.736949 8.261189 1.858930 0.929465 17085 0.00001 4 80 0.902841 3.932958 4.835799 3.175684 0.793921 17085 0.00001 6 80 1.193478 2.795926 3.989404 3.849440 0.641573 17085 0.00001 8 80 1.660296 2.027855 3.688151 4.163867 0.520483 17085 0.00001 16 80 3.496343 1.080424 4.576767 3.355419 0.209714 17085 0.00001 JOR strps red blac p n Tcomm Tcomp Toverall Sp Ep teratons ε 1 40 0 1.008033 1.008033 4316 0.00001 2 40 0.122717 0.520332 0.643049 1.567583 0.783792 4316 0.00001 4 40 0.211139 0.27637 0.487509 2.067722 0.516930 4316 0.00001 6 40 0.256016 0.202757 0.458773 2.197237 0.366206 4316 0.00001 8 40 0.324327 0.152873 0.4772 2.112391 0.264049 4316 0.00001 16 40 0.646985 0.108248 0.755233 1.334731 0.083421 4316 0.00001 1 60 0 4.614107 4.614107 9029 0.00001 2 60 0.249638 2.340235 2.589873 1.781596 0.890798 9029 0.00001 4 60 0.418836 1.203545 1.622381 2.844034 0.711009 9029 0.00001 6 60 0.613629 0.82431 1.437939 3.208834 0.534806 9029 0.00001 8 60 0.74845 0.674417 1.422867 3.242824 0.405353 9029 0.00001 16 60 1.430683 0.371629 1.802312 2.560104 0.160007 9029 0.00001 1 80 0 13.717455 13.717455 15261 0.00001 2 80 0.468272 6.91095 7.379222 1.858930 0.929465 15261 0.00001 4 80 0.806453 3.513074 4.319527 3.175685 0.793921 15261 0.00001 6 80 1.066062 2.497432 3.563494 3.849440 0.641573 15261 0.00001 8 80 1.483042 1.811361 3.294403 4.163867 0.520483 15261 0.00001 16 80 3.123072 0.965078 4.08815 3.355419 0.209714 15261 0.00001 Jacob blocs p n Tcomm Tcomp Ta Sp Ep teratons ε 1 40 0 0.562269 0.562269 2655 0.00001 4 40 0.088707 0.159675 0.248382 2.263727 0.565932 2655 0.00001 16 40 0.154236 0.057377 0.211613 2.657063 0.166066 2655 0.00001 1 60 0 2.577173 2.577173 5580 0.00001 4 60 0.216481 0.694201 0.910682 2.829937 0.707484 5580 0.00001 15

16 60 0.404598 0.213956 0.618554 4.166448 0.260403 5580 0.00001 1 80 0 7.677145 7.677145 9463 0.00001 4 80 0.385734 2.005665 2.391399 3.210315 0.802579 9463 0.00001 16 80 0.695014 0.56972 1.264734 6.070166 0.379385 9463 0.00001 Jacob blocs red blac p n Tcomm Tcomp Ta Sp Ep teratons ε 1 40 0 0.30623 0.30623 1446 0.00001 4 40 0.048313 0.086964 0.135277 2.263726 0.565931 1446 0.00001 16 40 0.084002 0.031249 0.115251 4.878647 0.304915 1446 0.00001 1 60 0 1.409594 1.409594 3052 0.00001 4 60 0.118405 0.379696 0.498101 2.829936 0.707484 3052 0.00001 16 60 0.221296 0.117024 0.33832 4.166452 0.260403 3052 0.00001 1 80 0 4.212978 4.212978 5193 0.00001 4 80 0.211679 1.100647 1.312326 3.210314 0.802578 5193 0.00001 16 80 0.381402 0.312645 0.694047 11.061419 0.691339 5193 0.00001 JOR blocs p n Tcomm Tcomp Ta Sp Ep teratons ε 1 40 0 1.178127 1.178127 4841 0.00001 4 40 0.168631 0.33027 0.498901 0.613809 0.153452 4841 0.00001 16 40 0.291068 0.114339 0.405407 1.386925 0.086683 4841 0.00001 1 60 0 5.410398 5.410398 10117 0.00001 4 60 0.360555 1.428722 1.789277 1.440343 0.360086 10117 0.00001 16 60 0.727319 0.42511 1.152429 2.236297 0.139769 10117 0.00001 1 80 0 16.051876 16.051876 17085 0.00001 4 80 0.682614 4.168217 4.850831 1.582645 0.395661 17085 0.00001 16 80 1.24926 1.165562 2.414822 3.179176 0.198699 17085 0.00001 JOR blocs red blac p n Tcomm Tcomp Ta Sp Ep teratons ε 1 40 0 0.919917 0.919917 3780 0.00001 4 40 0.197508 0.257885 0.455393 0.672452 0.168113 3780 0.00001 16 40 0.340912 0.089279 0.430191 1.307022 0.081689 3780 0.00001 1 60 0 4.232806 4.232806 7915 0.00001 4 60 0.423118 1.117756 1.540874 1.672540 0.418135 7915 0.00001 16 60 0.853523 0.332583 1.186106 2.172802 0.135800 7915 0.00001 1 80 0 12.579372 12.579372 13389 0.00001 4 80 0.802416 3.266506 4.068922 1.886776 0.471694 13389 0.00001 16 80 1.468511 0.913416 2.381927 3.223082 0.201443 13389 0.00001 16

Διαγράμματα 17

Από όλα τα παραπάνω διαγράμματα φαίνεται ότι όσο αυξάνεται το μέγεθος του υποβαλλομένου προβλήματος αυξάνει η απόδοση και η επιτάχυνση του συστήματος 24

Παρατηρούμε ότι οι γραμμές της επιτάχυνσης για την περίπτωση της χρήσης επεξεργασίας σε διάταξη κόκκινο μαύρο συμπίπτον με τις γραμμές της επιτάχυνσης της επεξεργασίας σε φυσική διάταξη. Αυτό Ιαν κάτι το αναμενόμενο αφού όπως είπα και παραπάνω η πολυπλοκότητα του αλγορίθμου δεν επηρεάζεται από των τρόπο επεξεργασίας παρά μόνο από τον τρόπο καταμέρισης την καταμέρισης του πλέγματος. 27

Ομοίως με την επιτάχυνση παρατηρούμε ότι οι γραμμές της αποδοτικότητας για την περίπτωση της χρήσης επεξεργασίας σε διάταξη κόκκινο μαύρο συμπίπτον με τις γραμμές της αποδοτικότητας της επεξεργασίας σε φυσική διάταξη. Όπως αναμένετε 29

Από τα παραπάνω διαγράμματα και από τους πινάκες με τα αριθμητικά δεδομένα βλέπουμε πως οι θεωρητικές συναρτήσεις επαληθεύονται. Οι υλοποιήσεις που χρησιμοποιούν την καταμέριση σε τετράγωνα παρουσιάζουν μεγαλύτερη επιτάχυνση και απόδοση από τους αντίστοιχους αλγορίθμους που χρησιμοποιούν την καταμέριση σε οριζόντιες γραμμές. Οι μικρές διακυμάνσεις που εμφανίζονται σε ορισμένα γραφήματα δικαιολογούνται στα πλαίσια της αστάθειας του συστήματος που εξετελέσθησαν τα πειράματα. 30