Ορολογία. Παράδειγµα 3. Εξισορρόπηση Εργασίας. Ε-85: Ειδικά Θέµατα Λογισµικού. E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 6

Σχετικά έγγραφα
Ε-85: Ειδικά Θέµατα Λογισµικού

Παράλληλη Επεξεργασία

2/4/2012 Προγραμματισμός συστημάτων κοινόχρηστης μνήμης (ΙΙ) OpenMP Β. Δημακόπουλος

Προγραμματισμός με το OpenMP Β. Δημακόπουλος

Μέρος IΙ: OpenMP Κεφάλαιο 4 (νέο βιβλίο)

Ε-85: Ειδικά Θέµατα Λογισµικού

Προγραµµατισµός Νηµάτων. Αρχικοποίηση µιας Φοράς pthread_once_t once_block = PTHREAD_ONCE_INIT; pthread_mutex_t mutex;

OpenMP. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

OpenMP. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Συστήµατα Παράλληλης Επεξεργασίας. OpenMP

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών. OpenMP. Συστήματα Παράλληλης Επεξεργασίας 9 ο Εξάμηνο

OpenMP. Συστήµατα Παράλληλης Επεξεργασίας Εργαστήριο Υπολογιστικών Συστηµάτων. Αθήνα, Νοέµβριος /11/2004 Εισαγωγή στο OpenMP 1

Εισαγωγή στον Προγραµµατισµό Πολυεπεξεργαστικών Συστηµάτων Κοινής Μνήµης µε...

Λ10 Παράλληλος & Κατανεμημένος Προγραμματισμός 2009

Παράλληλη Επεξεργασία

ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΑΡΑΛΛΗΛΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΜΕ OpenMP

OpenMP. Προγραµµατισµός Αρχιτεκτονικών Μοιραζόµενης Μνήµης. Συστήµατα Παράλληλης Επεξεργασίας Εργαστήριο Υπολογιστικών Συστηµάτων ΕΜΠ. OpenMP p.

Κατανεμημένα και Παράλληλα Συστήματα (εργαστήριο) Παραδείγματα με openmp

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

Συστήματα Παράλληλης και Κατανεμημένης Επεξεργασίας

Ε-85: Ειδικά Θέµατα Λογισµικού

Κατανεμημένος και Παράλληλος Προγραμματισμός

EM 361: Παράλληλοι Υπολογισμοί

Υλοποίηση cancellation στον παραλληλοποιητικό μεταφραστή OMPi. Εμμανουήλ Φελουτζή. με Α.Μ: 1579 ΔΙΠΛΩΜΑΤΟΣ

ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΑΡΑΛΛΗΛΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΜΕ OpenMP (2 ο Μέρος)

Αποδοτική εκτέλεση προγραμμάτων OpenMP σε συστάδες Η/Υ

Συστήματα Παράλληλης και Κατανεμημένης Επεξεργασίας

Κατανεμημένος και Παράλληλος Προγραμματισμός

Περίληψη. Υπερυπολογιστές. Υπολογιστικά προβλήµατα. TOP 500 (Ιούνιος 2007) TOP 500 (Ιούνιος 2009) Ε-85: Ειδικά Θέµατα Λογισµικού

Υ07 Παράλληλα Συστήματα /3/2018 Προγραμματισμός συστημάτων κοινόχρηστης μνήμης (IΙ)

Ε-85: Ειδικά Θέµατα Λογισµικού

ΥΛΟΠΟΙΗΣΗ ΣΥΝΤΑΚΤΙΚΟΥ ΑΝΑΛΥΤΗ ΓΙΑ ΤΟΝ ΠΑΡΑΛΛΗΛΟΠΟΙΗΤΙΚΟ ΜΕΤΑΦΡΑΣΤΗ OMPI Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙ ΙΚΕΥΣΗΣ. Υποβάλλεται στην

Διάλεξη 2η: Αλγόριθμοι και Προγράμματα

Ε-85: Ειδικά Θέµατα Λογισµικού

Κατανεμημένος και Παράλληλος Προγραμματισμός

Κατανεμημένος και. Ηλίας Κ. Σάββας Αναπληρωτής Καθηγητής Τμήμα Μηχανικών Πληροφορικής ΤΕ, ΤΕΙ Θεσσαλίας

Εισαγωγή στον Προγραµµατισµό. Διάλεξη 8 η : Συναρτήσεις Χειµερινό Εξάµηνο 2011

Εισαγωγή στον Προγραμματισμό

Δομημένος Προγραμματισμός

Εισαγωγή στον Προγραμματισμό

Η γλώσσα προγραμματισμού C

Εισαγωγή στον Προγραμματισμό (με. τη C)

Η πολυνηματική γλώσσα προγραμματισμού Cilk

Αντικειµενοστρεφής Προγραµµατισµός

Δομημένος Προγραμματισμός. Τμήμα Επιχειρηματικού Σχεδιασμού και Πληροφοριακών Συστημάτων

Η γλώσσα προγραμματισμού C

Εισαγωγή στη γλώσσα προγραμματισμού JAVA. Δομές Δεδομένων Διδάσκων: Π.Α. Μήτκας Τομέας Ηλεκτρονικής και Υπολογιστών

Δομημένος Προγραμματισμός (ΤΛ1006)

ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΥΠΟΛΟΓΙΣΤΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ

Εισαγωγή στον Προγραµµατισµό. Διάλεξη 2 η : Βασικές Έννοιες της γλώσσας προγραµµατισµού C Χειµερινό Εξάµηνο 2011

Ηλεκτρονικοί Υπολογιστές

Εισαγωγή στον Προγραµµατισµό. Διάλεξη 3 η : Επίλυση Προβληµάτων Χειµερινό Εξάµηνο 2011

Εισαγωγή στον Προγραμματισμό

Παρακάτω δίνεται o σκελετός προγράμματος σε γλώσσα C. Σχολιάστε κάθε γραμμή του κώδικα.

ΗΥ-150. Προγραµµατισµός. Εντολές Ελέγχου Ροής

Εισαγωγή στην C. Μορφή Προγράµµατος σε γλώσσα C

Διάλεξη 5η: Εντολές Επανάληψης

Ανάλυση ροής δεδομένων και autoscoping στον παραλληλοποιητικό μεταφραστή OMPi

Εισαγωγή στον Προγραμματισμό

Προγραμματισμός Η/Υ (ΤΛ2007 )

Α. unsigned int Β. double. Γ. int. unsigned char x = 1; x = x + x ; x = x * x ; x = x ^ x ; printf("%u\n", x); Β. unsigned char

Κεφάλαιο : Εισαγωγή στην C: (Διαλέξεις 3-4)

Στόχοι και αντικείμενο ενότητας. Προτάσεις επανάληψης. Έλεγχος ροής προγράμματος. #5.. Εντολές Επανάληψης

Προγραμματισμός Η/Υ (ΤΛ2007 )

Κεφάλαιο : Επαναλήψεις (for, do-while)

Κεφάλαιο 3.1, : Συναρτήσεις I. ( ιάλεξη 11) ιδάσκων: ηµήτρης Ζεϊναλιπούρ

ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΔΟΜΗΜΕΝΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΠαράδειγµαΠρογραµµατισµού

FORTRAN και Αντικειμενοστραφής Προγραμματισμός

ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ - ΕΙΣ

Παράλληλη Επεξεργασία Εργαστηριακή Ασκηση Εαρινού Εξαµήνου 2008

Προγραμματισμός Συστημάτων

Μεθόδων Επίλυσης Προβλημάτων

Cilk: Φιλοσοφία και Χρήση

Δομημένος Προγραμματισμός. Τμήμα Επιχειρηματικού Σχεδιασμού και Πληροφοριακών Συστημάτων

Παράλληλη Επεξεργασία

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Κεφάλαιο : Επαναλήψεις (oι βρόγχοιfor, do-while) (Διάλεξη 10) Εντολές Επανάληψης που θα καλυφθούν σήμερα

Δομημένος Προγραμματισμός. Τμήμα Επιχειρηματικού Σχεδιασμού και Πληροφοριακών Συστημάτων

Υπολογισμός - Εντολές Επανάληψης

Ανάπτυξη και Σχεδίαση Λογισμικού

Εισαγωγή στον Προγραμματισμό

Κεφάλαιο 3.1, : Συναρτήσεις I. (Διάλεξη 11)

ιορθώσεις επί της 2 ης έκδοσης εκτύπωσης 2002

Προγραμματισμός Η/Υ (ΤΛ2007 )

Στόχοι και αντικείμενο ενότητας. Πέρασμα Πίνακα σε Συνάρτηση (συν.) Πέρασμα Πίνακα σε Συνάρτηση. #8.. Ειδικά Θέματα Αλγορίθμων

Π. Σταθοπούλου ή Οµάδα Α (Φοιτητές µε µονό αριθµό Μητρώου ) ιδασκαλία : Παρασκευή 11πµ-13µµ ΗΛ7

Ιδιοκτησία Αντικειµένου

Ενσωματωμένα Συστήματα

Κεφάλαιο , 3.2: Συναρτήσεις II. ( ιάλεξη 12) ιδάσκων: ηµήτρης Ζεϊναλιπούρ

Εισαγωγή στον Προγραμματισμό

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 3 Ο. Σταθερές-Παράμετροι-Μεταβλητές Αριθμητικοί & Λογικοί Τελεστές Δομή ελέγχου-επιλογής Σύνθετοι έλεγχοι

ΤΕΜ-101 Εισαγωγή στους Η/Υ Εξεταστική Ιανουαρίου 2011 Θέματα Β

Προγραμματισμός Ι. Δυναμική Διαχείριση Μνήμης. Δημήτρης Μιχαήλ. Ακ. Έτος Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Πληροφορική 2. Αλγόριθμοι

Εισαγωγή στην Πληροφορική

Η γλώσσα προγραμματισμού C

Εισαγωγή στην επιστήμη των υπολογιστών

Συστήματα Παράλληλης και Κατανεμημένης Επεξεργασίας

ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΔΟΜΗΜΕΝΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Transcript:

Ε-85: Ειδικά Θέµατα Λογισµικού Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων Χειµερινό Εξάµηνο 2009-10 «Προγραµµατισµός µε το µοντέλο OpenMP» Παναγιώτης Χατζηδούκας (Π.Δ. 407/80) Ορολογία Μιαοµάδα νηµάτων στο OpenMPαποτελείται από το κύριο νήµα (master) και τους εργάτες (workers) Ένα παράλληλο τµήµα είναι ένα κοµµάτι κώδικα που εκτελείται από όλα τα νήµατα ταυτόχρονα Το κύριο νήµα έχει πάντοτε αριθµό αναγνωριστικού = 0 Ο ορισµός του µεγέθους της οµάδας νηµάτων, εφόσον επιτρέπεται, πραγµατοποιείται πριν την εισαγωγή σε µια παράλληλη περιοχή Οι παράλληλες περιοχές µπορεί να είναι εµφωλευµένες, αλλά η υποστήριξη της εκτέλεσης εσωτερικών επιπέδων εξαρτάται από την υλοποίηση Μια δοµή διαµοίρασης έργου µοιράζει την εκτέλεση του κώδικα που περιέχεται στο παράλληλο τµήµα µεταξύ των µελών της οµάδας νηµάτων Εποµένως, χωρίζει κατάλληλα τη δουλειά E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 1 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 2 Παράδειγµα 1 shared(n,x,y) private(i) num_threads(4) for (i=0; i<n; i++) x[i] += y[i]; /*-- End of parallel region --*/ Παράδειγµα 2 void mxv_row(int m,int n,double *a,double *b,double *c) int i, j; double sum; for private(i, j, sum) shared(m, n, a, b, c) for (i=0; i<m; i++) sum = 0.0; for (j=0; j<n; j++) sum += b[i*n+j]*c[j]; a[i] = sum; /*-- End of parallel for --*/ E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 3 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 4 Παράδειγµα 3 shared(n,a,b,c,d) private(i) for (i=0; i<n-1; i++) b[i] = (a[i] + a[i+1])/2; for (i=0; i<n; i++) d[i] = 1.0/c[i]; /*-- End of parallel region --*/ (implied barrier) Εξισορρόπηση Εργασίας Αποτελεί βασικό παράγοντα απόδοσης Για συνηθισµένες λειτουργίες, π.χ. πρόσθεση διανυσµάτων, η εξισορρόπηση εργασίας δεν αποτελείται ζήτηµα Για λιγότερο οµαλές λειτουργίες πρέπει να δοθεί ιδιαίτερη σηµασία στην διαµοίραση της εργασίας µεταξύ των νηµάτων Παράδειγµα µη οµαλών (irregular) λειτουργιών: Αντιµετάθεση ενός πίνακα Πολλαπλασιασµός τριγωνικών πινάκων Παράλληλες αναζητήσεις σε µία διασυνδεδεµένη λίστα Για τέτοιες περιπτώσεις, η δοµή διαµοίραση for χρησιµοποιείται µε την οδηγία schedule που καθορίζει διάφορους αλγορίθµους δροµολόγησης των επαναλήψεων E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 5 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 6 1

Οδηγία schedule Χρήση schedule ( static dynamic guided [, chunk] ) schedule (runtime) static [,chunk] ιαµοιράζει τις επαναλήψεις, που έχουν χωριστεί σε τµήµατα µεγέθους "chunk«, µεταξύ των νηµάτων µε κυκλικό τρόπο Αν δεν ορίζεται το "chunk", αυτό ορίζεται κατά προσέγγιση ίσο µε N/P και κάθε νήµα εκτελεί ένα τµήµα επαναλήψεων dynamic [,chunk] ιαχωρίζει τις επαναλήψεις σε τµήµατα µεγέθους "chunk Κάθε νήµα µόλις τελειώσει ένα τµήµα, παίρνει δυναµικά το επόµενο guided [,chunk] Παρόµοια µε dynamic, αλλά το µέγεθος του τµήµατος µειώνεται εκθετικά runtime Ο αλγόριθµος δροµολόγησης καθορίζεται κατά τον χρόνο εκτέλεσης ελέγχοντας τη µεταβλητή περιβάλλοντος OMP_SCHEDULE Παράδειγµα Πολλαπλά chunks E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 7 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 8 Συγχρονισµός To OpenMPορίζει τις ακόλουθες εντολές για την υποστήριξη συγχρονισµού: atomic critical section barrier flush ordered single (Στην πραγµατικότητα είναι δοµή διαµοίρασης έργου που περιλαµβάνει συγχρονισµό) master (Στην ουσία δεν είναι εντολή συγχρονισµού) Συγχρονισµός critical Μόνοένα νήµα µπορεί κάθε στιγµή να µπει στο critical section for private(b) shared(res) for (i =0; i<niters; i++) b = doit(i); #pragma omp critical consume(b, &res); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 9 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 10 Συγχρονισµός atomic To atomicείναι ειδική περίπτωση του critical section πουµπορεί να χρησιµοποιηθεί για ορισµένες απλές εντολές. Εφαρµόζεται µόνο για την ανανέωση µιας θέσης µνήµης (την ανανέωση του x στο ακόλουθο παράδειγµα) private(b) b = doit(i); #pragma omp atomic x = x + b; Συγχρονισµός barriers Barrier: Κάθε νήµα περιµένει να φτάσουν όλα ταυπόλοιπα νήµατα πριν προχωρήσει. shared (A, B, C) private(id) id=omp_get_thread_num(); A[id] = big_calc1(id); #pragma omp barrier for(i=0;i<n;i++) C[i]=big_calc3(I,A); /* υπονοούµενο barrier */ for(i=0;i<n;i++) B[i]=big_calc2(C, i); /* χωρίς barrier */ A[id] = big_calc3(id); /* υπονοούµενο barrier */ E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 11 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 12 2

Συγχρονισµός ordered Η εντολή ordered επιβάλει την ακολουθιακή σειρά εκτέλεσης για ένα τµήµα private (res) ordered for (i=0;i<n;i++) res = do_work(i); #pragma ordered printf( res = %d\n, res); Συγχρονισµός master Ηεντολή master χαρακτηρίζει ένα δοµηµένο block τοοποίο εκτελείται µόνο από το νήµα -αρχηγό. Τα υπόλοιπανήµατα το αγνοούν (δεν υπάρχουν υπονοούµενα barriers ή flushes). private (tmp) do_many_things(); #pragma omp master exchange_boundaries(); #pragma barrier do_many_other_things(); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 13 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 14 Συγχρονισµός single Η εντολή single χαρακτηρίζει ένα block κώδικα το οποίο εκτελείται από ένα µόνο νήµα. Υπονοούνται barrier και flush στο τέλος του single block private (tmp) do_many_things(); #pragma omp single exchange_boundaries(); do_many_other_things(); Συγχρονισµός flush Η εντολή flush δηλώνει ένα σηµείο στο οποίο το νήµα επιχειρεί να δηµιουργήσει συνεπή εικόνα της µνήµης. Όλες οι πράξεις µνήµης (αναγνώσεις και εγγραφές) που ορίζονται πριν από αυτό το σηµείο πρέπει να ολοκληρωθούν. Όλες οι πράξεις µνήµης (αναγνώσεις και εγγραφές) που ορίζονται µετά απόαυτό το σηµείο πρέπει να εκτελεστούν µετά το flush Οι µεταβλητές σε registers ή write buffers πρέπει να εγγραφούν στη µνήµη Τα ορίσµατα του flush ορίζουν ποιες µεταβλητές θα γίνουν flush. Αν δεν υπάρχουν ορίσµατα όλες οι ορατές στο νήµα µεταβλητές γίνονται flush. E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 15 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 16 Υπονοούµενος Συγχρονισµός Barriers υπονοούνται µετά τις ακόλουθες εντολές OpenMP: end parallel end do (except when nowait is used) end sections (except when nowait is used) end critical end single (except when nowait is used) Flush υπονοείται µετά τις ακόλουθες εντολές OpenMP: barrier critical, end critical end do end parallel end sections end single ordered, end ordered Συναρτήσεις Βιβλιοθήκης Συναρτήσεις locks omp_init_lock(), omp_set_lock(), omp_unset_lock(), omp_test_lock() Συναρτήσεις περιβάλλοντος χρόνου εκτέλεσης: Αλλαγή/Έλεγχος του αριθµού των νηµάτων omp_set_num_threads(), omp_get_num_threads(), omp_get_thread_num(), omp_get_max_threads() Ενεργοποίηση/απενεργοποίηση εµφωλευµένου παραλληλισµού και dynamic mode omp_set_nested(), omp_set_dynamic(), omp_get_nested(), omp_get_dynamic() Έλεγχος εκτέλεσης σε παράλληλο τµήµα omp_in_parallel() Αριθµός επεξεργαστών στο σύστηµα omp_num_procs() E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 17 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 18 3

Προστασία Πόρων µε locks omp_lock_t lck; omp_init_lock(&lck); private (tmp) id = omp_get_thread_num(); tmp = do_lots_of_work(id); omp_set_lock(&lck); printf( %d%d, id, tmp); omp_unset_lock(&lck); Συναρτήσεις βιβλιοθήκης Γιανα ελεγχθεί ο αριθµός των νηµάτων που εκτελούν ένα πρόγραµµα αρχικά απενεργοποιείται το dynamic mode και κατόπιν καθορίζεται ο αριθµός των νηµάτων. void main() omp_set_dynamic(0); omp_set_num_threads(4); int id=omp_get_thread_num(); do_lots_of_stuff(id); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 19 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 20 Μεταβλητές Περιβάλλοντος Έλεγχος scheduling των loops εφόσον έχει καθοριστεί omp for schedule(runtime). OMP_SCHEDULE schedule[, chunk_size] Καθορισµός του default αριθµού νηµάτων. OMP_NUM_THREADS int_literal Ενεργοποίηση/απενεργοποίηση dynamic mode OMP_DYNAMIC TRUE FALSE Ενεργοποίηση/απενεργοποίηση παράλληλης εκτέλεσης εµφωλευµένων παράλληλων τµηµάτων OMP_NESTED TRUE FALSE Χρήση Κώδικας OpenMP void main() printf( Hello world from thread %d of %d\n, omp_get_thread_num(), omp_get_num_threads(); Παραγωγή εκτελέσιµου αρχείου για OMPi, GNU GCC 4.2, Intel compiler, Sun Studio compiler) $ ompicc -o hello hello.c $ gcc -fopenmp -o hello hello.c $ icc -openmp -o hello hello.c $ suncc -xopenmp=parallel -o hello hello.c E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 21 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 22 Χρήση Εκτέλεση $ export OMP_NUM_THREADS=4 $./hello Hello world from thread 0 of 4 Hello world from thread 2 of 4 Hello world from thread 1 of 4 Hello world from thread 3 of 4 $ export OMP_NUM_THREADS=1 $./hello Hello world from thread 0 of 1 Βιβλιογραφία Links OpenMP consortium http://www.openmp.org OpenMP community http://www.compunity.org Intel Compilers http://developer.intel.com/software/products/compilers The OMPi Compiler http://www.cs.uoi.gr/~ompi OpenMP Application Program Interface, Version 2.5, 2005 ιαθέσιµο και στη σελίδα του µαθήµατος E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 23 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 24 4

Παράδειγµα 1 void a1(int n, float *a, float *b) int i; for for (i=1; i<n; i++) /* i is private by default */ b[i] = (a[i] + a[i-1]) / 2.0; Παράδειγµα 2 int main() int x = 2; num_threads(2) shared(x) if (omp_get_thread_num() == 0) x = 5; else printf("1: Thread# %d: x = %d\n", omp_get_thread_num(),x ); return 0; #pragma omp barrier if (omp_get_thread_num() == 0) printf("2: Thread# %d: x = %d\n", omp_get_thread_num(),x ); else printf("3: Thread# %d: x = %d\n", omp_get_thread_num(),x ); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 25 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 26 Παράδειγµα 3 int main() # ifdef _OPENMP printf("compiled by an OpenMP-compliant implementation.\n"); # endif return 0; Παράδειγµα 4 void sub(float *x, int npoints) int iam, nt, ipoints, istart; private(iam,nt,ipoints,istart) iam = omp_get_thread_num(); nt = omp_get_num_threads(); ipoints = npoints / nt; /* size of partition */ istart = iam * ipoints; /* starting array index */ if (iam == nt-1) /* last thread may do more */ ipoints = npoints - istart; subdomain(x, istart, ipoints); void subdomain(float *x, int istart, int ipoints) int i; for (i = 0; i < ipoints; i++) x[istart+i] = 123.456; void main() float array[10000]; sub(array, 10000); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 27 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 28 Παράδειγµα 5 int main() omp_set_dynamic(1); num_threads(10) /* do work here at most 10 threads */ return 0; Παράδειγµα 6 #include <math.h> void a8(int n, int m, float *a, float *b, float *y, float *z) int i; for (i=1; i<n; i++) b[i] = (a[i] + a[i-1]) / 2.0; for (i=0; i<m; i++) y[i] = sqrt(z[i]); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 29 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 30 5

void XAXIS(); void YAXIS(); void ZAXIS(); void a9() sections #pragma omp section XAXIS(); #pragma omp section YAXIS(); #pragma omp section ZAXIS(); Παράδειγµα 7 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 31 void work1() void work2() Παράδειγµα 8 void a10() #pragma omp single printf("beginning work1.\n"); work1(); #pragma omp single printf("finishing work1.\n"); #pragma omp single nowait printf("finished work1 and beginning work2.\n"); work2(); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 32 int dequeue(float *a); void work(int i, float *a); Παράδειγµα 9 int counter = 0; #pragma omp threadprivate(counter) Παράδειγµα 10 void a13(float *x, float *y) int ix_next, iy_next; shared(x, y) private(ix_next, iy_next) #pragma omp critical (xaxis) ix_next = dequeue(x); work(ix_next, x); #pragma omp critical (yaxis) iy_next = dequeue(y); work(iy_next, y); int increment_counter() counter++; return(counter); int increment_counter_2() static int counter_2 = 0; #pragma omp threadprivate(counter_2) counter_2++; return(counter_2); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 33 E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 34 void work(int i, int j) Παράδειγµα 11 void good_nesting(int n) int i, j; default(shared) for (i=0; i<n; i++) shared(i, n) for (j=0; j < n; j++) work(i, j); E-85: Ε.Θ.Λ: Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων 35 6