Παρουςίαςθ 2 θσ Άςκθςθσ:

Σχετικά έγγραφα
Παρουσίαση 2 ης Άσκησης:

Παρουσίαση 1 ης Άσκησης:

Γράφοι. Δομζσ Δεδομζνων Διάλεξθ 9

Παρουσίαση 2 ης Άσκησης:

Δομζσ Δεδομζνων Πίνακεσ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Παράςταςη ςυμπλήρωμα ωσ προσ 1

Παράςταςη ακεραίων ςτο ςυςτημα ςυμπλήρωμα ωσ προσ 2

ΘΥ101: Ειςαγωγι ςτθν Πλθροφορικι

Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Εργαςτιριο 1

Παράλληλος προγραμματισμός: Υλοποίηση παράλληλων προγραμμάτων

Παρουσίαση 5 ης Άσκησης:

Παρουσίαση 5 ης Άσκησης:

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 2 ο Εργαςτιριο Διαχείριςθ Διεργαςιϊν

Η γλώςςα προγραμματιςμού C

An Overview of Parallel Architectures

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 7 θ Διάλεξθ Διαχείριςθ Μνιμθσ Μζροσ Γ

Δζντρα. Δομζσ Δεδομζνων

HY437 Αλγόριθμοι CAD

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Συστήµατα Παράλληλης Επεξεργασίας. Παράλληλοςπρογραµµατισµός: Υλοποίηση παράλληλων προγραµµάτων

Υπολογιςτική πολυπλοκότητα αλγορίθμων γραμμικοφ προγραμματιςμοφ

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Λ10 Παράλληλος & Κατανεμημένος Προγραμματισμός Μάθημα 0 ο 13/10/2009. Β. Δημακόπουλος

5 ΜΕΘΟΔΟΙ - ΠΑΡΑΜΕΤΡΟΙ

HY437 Αλγόριθμοι CAD

ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Ανάπτυξη Εφαρμογών Σε Προγραμματιςτικό Περιβάλλον

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Σημειωματάριο Δευτέρας 4 Δεκ. 2017

Virtualization. Στο ςυγκεκριμζνο οδηγό, θα παρουςιαςτεί η ικανότητα δοκιμήσ τησ διανομήσ Ubuntu 9.04, χωρίσ την ανάγκη του format.

HY437 Αλγόριθμοι CAD

17. Πολυδιάςτατοι πίνακεσ

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Διάλεξθ 4

Εφαρμογέσ Μικροχπολογιςτών ςτισ Τηλεπικοινωνίεσ. Έλεγχοσ ςειριακήσ θφρασ του 8051 (Serial Port)

Δείκτεσ Διαχείριςθ Μνιμθσ. Βαγγζλθσ Οικονόμου Διάλεξθ 8

All Pairs Shortest Path

Προγραμματιςμόσ Μεκόδων Επίλυςθσ Προβλθμάτων. 15. Πίνακεσ ΙI. Ιωάννθσ Κατάκθσ. ΕΠΛ 032: Προγραμματιςμόσ Μεκόδων Επίλυςθσ Προβλθμάτων

Ιςίδωροσ Ροδομαγουλάκθσ Αλγόρικμοι Δικτφων και Πολυπλοκότθτα K-median

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

10/12/2013 Συστήματα κατανεμημένης μνήμης (ΙΙ) + Μετρικές και επιδόσεις Β. Δημακόπουλοσ

ΕΡΓΑΣΗΡΙΑΚΗ ΑΚΗΗ 4.1

Μάθημα 9 ο ΤΕΧΝΙΚΕΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΙΚΟΝΙΚΗΣ ΜΝΗΜΗΣ

HY437 Αλγόριθμοι CAD

Βελτιστοποίηση και Παραλληλοποίηση Κώδικα για Αλγορίθμους Γράφων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διάλεξη 29: Γράφοι. Διδάσκων: Παναγιώτης Ανδρέου

ΔΟΜΗ ΑΠΛΗΣ ΕΠΙΛΟΓΗΣ Αςκήςεισ με ψευδογλώςςα/ διάγραμμα ροήσ. Αντώνης Μαϊργιώτης

FX10 SIMD SIMD. [3] Dekker [4] IEEE754. a.lo. (SpMV Sparse matrix and vector product) IEEE754 IEEE754 [5] Double-Double Knuth FMA FMA FX10 FMA SIMD

Αλγόριθμοι Αναζήτησης

ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Λ10 Παράλληλος & Κατανεμημένος Προγραμματισμός 2009

ΕΝΔΕΙΚΣΙΚΕ ΟΔΗΓΙΕ ΠΡΟΑΡΜΟΓΗ ΣΩΝ BROWSERS

ΕΝΟΤΗΤΑ 2: ΤΟ ΛΟΓΙΣΜΙΚΟ ΤΟΥ ΥΠΟΛΟΓΙΣΤΗ. ΚΕΦΑΛΑΙΟ 5: Γνωριμία με το λογιςμικό του υπολογιςτι

Εργαστηριακή άσκηση στο μάθημα του Αυτομάτου Ελέγχου (ΜΜ803)

HY220 Εργαςτήριο Ψηφιακών Κυκλωμάτων.

Η οπτικι επεξεργαςία ςτθν Κακαρι Αλεξία: Μελζτθ περίπτωςθσ ΑΛΕΞΑΝΔΡΑ ΟΙΚΟΝΟΜΟΥ

HY523 Εργαςτηριακή Σχεδίαςη Ψηφιακών Κυκλωμάτων με εργαλεία Ηλεκτρονικού Σχεδιαςτικού Αυτοματιςμού. 2 ΗΥ523 - Χωροκζτθςθ

Ειςαγωγι ςτο Δομθμζνο Προγραμματιςμό. Βαγγζλθσ Οικονόμου

Παράλληλος προγραμματισμός: Σχεδίαση παράλληλων προγραμμάτων

Δομζσ Δεδομζνων. Αναηιτθςθ και Ταξινόμθςθ Διάλεξθ 3

ΠΡΟΓΡΑΜΜΑΣΙΜΌ ΤΠΟΛΟΓΙΣΏΝ. Κεφάλαιο 8 Η γλϊςςα Pascal

ΘΕΜΑΣΑ ΕΡΓΑΙΩΝ ΓΙΑ ΣΟ ΜΑΘΗΜΑ ΠΡΟΟΜΟΙΩΗ

ΠΑΡΑΡΤΗΜΑ Α - ΠΙΝΑΚΕΣ ΠΟΣΟΤΗΤΩΝ

ΛΕΙΤΟΥΓΙΚΆ ΣΥΣΤΉΜΑΤΑ. 5 ο Εργαςτιριο Ειςαγωγι ςτθ Γραμμι Εντολϊν

Εργαςτιριο Πικανοτιτων Σθμειϊςεισ προγραμματιςμοφ: βαςικζσ γνϊςεισ ανάπτυξθσ εφαρμογϊν. Κϊςτασ Αρβανιτάκθσ

Άςκθςθ 1θ: Να γραφεί αλγόρικμοσ που κα δθμιουργεί με τθ βοικεια διπλοφ επαναλθπτικοφ βρόχου, τον ακόλουκο διςδιάςτατο πίνακα:

HY422 Ειςαγωγή ςτα Συςτήματα VLSI. HY422 - Διάλεξθ 4θ - Διαςυνδζςεισ

Διαδικασία με βήματα. 1. Αλλάηω το χρϊμα ςκθνικοφ ςε γκρι(#3333).

ΒΙΟΛΟΓΟΙ ΓΙΑ ΦΥΣΙΚΟΥΣ

Αναπαράςταςθ Γνώςθσ ςτον Παγκόςμιο Ιςτό Ενότθτα 2: XML Δομθμζνα Ζγγραφα Ιςτοφ, Μζροσ 4 ο XPath

Τ07. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΤΣΗΜΑΣΑ. Β. Δημακόπουλος.

Η πολυνηματική γλώσσα προγραμματισμού Cilk

ΕΝΟΤΗΤΑ 3: Χριςθ εργαλείων ζκφραςθσ, επικοινωνίασ, ανακάλυψθσ και δθμιουργίασ. ΚΕΦΑΛΑΙΟ 7: Υπθρεςίεσ Αναηιτθςθσ ςτον Παγκόςμιο Ιςτό

ΣΥΣΤΗΜΑΤΑ ΠΑΡΑΛΛΗΛΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ 9o εξάμηνο ΗΜΜΥ, ακαδημαϊκό έτος

Σχεδίαση Αλγορίθμων - Τμήμα Πληροφορικής ΑΠΘ -4ο εξάμηνο 1

Οδηγίεσ προσ τουσ εκπαιδευτικοφσ για το μοντζλο τησ Αριθμογραμμήσ

Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ -4ο εξάμηνο 1

Νζεσ Τάςεισ ςτην εκπαιδευτική διαδικαςία: Gamification

Τεχνικζσ Ανάλυςησ Διοικητικών Αποφάςεων

3 η ΑΣΚΗΣΗ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ

ΛΕΙΣΟΤΡΓΙΚΆ ΤΣΉΜΑΣΑ. 8 θ Διάλεξθ Ιδεατι Μνιμθ Μζροσ Α

Αναζήτηση Κατά Βάθος. Επιμέλεια διαφανειών: Δ. Φωτάκης Συμπληρώσεις: Α. Παγουρτζής. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Παράλληλος προγραμματισμός: παράλληλες λ υπολογιστικές πλατφόρμες και ανάλυση προγραμμάτων

Ειςαγωγή ςτην πληροφορική

Extra Λογιςτική Διαχείριςη & Extra Μιςθοδοςία

Υ07 Παράλληλα Συστήματα /10/2013

Περιεχόμενα Διδακτζασ Ύλθσ για τθν Εκμάκθςθ του HTML

ΠΛΗ111. Ανοιξη Μάθηµα 10 ο. Γράφοι. Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Πολυτεχνείο Κρήτης

Το εσωτερικό ενός PC. Τεχνολογία Η/Υ & Πληροφοριών - 05 Κεντρική μονάδα Χουρδάκης Μανόλης

Διάλεξη 18: Γράφοι I Εισαγωγή

Τμήματα Μνήμησ Υπολογιςμόσ Φυςικών διευθύνςεων. Εκπαιδεφτρια: Μαρία Πολίτθ

ΡΟΓΑΜΜΑΤΙΣΤΙΚΟ ΡΕΙΒΑΛΛΟΝ MICRO WORLDS PRO

Πανεπιςτιμιο Κφπρου ΟΙΚ 223: Μακθματικά για οικονομολόγουσ ΙΙ Διδάςκων:

Η επικράτηση των ψηφιακών κυκλωμάτων 1o μέρος

ΕΝΟΣΗΣΑ 1: ΓΝΩΡIΖΩ ΣΟΝ ΤΠΟΛΟΓΙΣΗ Ω ΕΝΙΑΙΟ ΤΣΗΜΑ. ΚΕΦΑΛΑΙΟ 2: Σο Εςωτερικό του Τπολογιςτι

ΙΝΣΙΣΟΤΣΟ ΕΚΠΑΙΔΕΤΣΙΚΗ ΠΟΛΙΣΙΚΗ

3 ΕΝΤΟΛΕΣ ΕΠΑΝΑΛΗΨΗΣ ( while, do while )

Transcript:

Εθνικό Μετςόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιςτών Εργαςτήριο Υπολογιςτικών Συςτημάτων Παρουςίαςθ 2 θσ Άςκθςθσ: Ανάπτυξη παράλληλου κώδικα και μελζτη επίδοςησ του αλγόριθμου FW ςε μοντζρνεσ πολυπφρηνεσ αρχιτεκτονικζσ Ακ. Έτοσ 2017-2018 9 ο Εξάμθνο

Αλγόριθμοσ Floyd-Warshall (FW) Εφρεςθ ελάχιςτου μονοπατιοφ ανάμεςα ςε οποιοδιποτε ηεφγοσ κόμβων ενόσ κατευκυνόμενου γράφου (τα βάρθ των ακμϊν μποροφν να είναι και αρνθτικά). for (k=0; k<n; k++) for (i=0; i<n; i++) for (j=0; j<n; j++) A[i][j] = min(a[i][j], A[i][k]+A[k][j]); Για κάκε χρονικό βιμα k υπολογίηει για κάκε ηεφγοσ κόμβων i-j αν υπάρχει ςυντομότερο μονοπάτι από τον i προσ τον j περνϊντασ από το κόμβο k N: αρικμόσ κόμβων του γράφου Α: πίνακασ διπλανϊν κορυφϊν (αν i,j δεν ςυνδζονται τότε Α*i+*j+ = αρχικά) Πολυπλοκότθτα: Θ(n 3 ) 2

Ακ. Έτοσ 2010-2011 Παράδειγμα: γράφοσ 8 κόμβων

Ακ. Έτοσ 2010-2011 Παράδειγμα: γράφοσ 8 κόμβων

Ακ. Έτοσ 2010-2011 Παράδειγμα: γράφοσ 8 κόμβων

k=0 FW Task graph A 00 A 00 A 01 A 02 A 03 A 10 A 11 A 12 A 13 A 01 A 02 A 03 A 10 A 20 A 30 A 20 A 21 A 22 A 23 A 30 A 31 A 32 A 33 A 11 A 12 A 13 A 21 A 22 A 23 A 31 A 32 A 33 k=1 A 11 A 00 A 01 A 02 A 03 A 10 A 11 A 12 A 13 A 10 A 12 A 13 A 01 A 21 A 31 A 20 A 21 A 22 A 23 A 30 A 31 A 32 A 33 A 00 A 02 A 03 A 20 A 22 A 23 A 30 A 32 A 33 6

Σειριακή και παράλληλη εκτζλεςη Για μεγάλα Ν (ο Α δεν χωράει ςτθν cache), ο FW είναι memory bound: Ο πίνακασ Α πρζπει να μεταφζρεται από τθν κφρια μνιμθ ςε κάκε επανάλθψθ k Οι πράξεισ που γίνονται είναι πολφ απλζσ (ςφγκριςθ / πρόςκεςθ) ςε ακζραιουσ ι πραγματικοφσ απλισ ακρίβειασ Παράλλθλθ εκτζλεςθ: Τα loops i, j είναι παράλλθλα Ο αλγόρικμοσ δεν κλιμακϊνει καλά ςε αρχιτεκτονικζσ κοινισ μνιμθσ 7

J.-S. Park, M. Penner, and V. K. Prasanna, Optimizing Graph Algorithms for Improved Cache Performance, IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS, VOL. 15, NO. 9, SEPTEMBER 2004. FWR (A, B, C) if (base case) FWI (A, B, C) else FWR (A 11, B 11, C 11 ); FWR (A 12, B 11, C 12 ); FWR (A 21, B 21, C 11 ); FWR (A 22, B 21, C 12 ); FWR (A 22, B 21, C 12 ); FWR (A 21, B 21, C 11 ); FWR (A 12, B 11, C 12 ); FWR (A 11, B 11, C 11 ); FWI (A, B, C) for (k=0; k<n; k++) for (i=0; i<n; i++) for (j=0; j<n; j++) A[i][j] = min(a[i][j], B[i][k]+C[k][j]); Καλείται ωσ: FWR(A, A, A); 8

A 00 A 01 A 10 A 11 9

A 00 A 01 A 10 A 11 10

A 00 A 01 A 10 A 11 11

A 00 A 01 A 10 A 11 12

A 00 A 01 A 10 A 11 13

A 00 A 01 A 10 A 11 14

A 00 A 01 A 10 A 11 15

A 00 A 01 A 10 A 11 16

A 00 A 01 A 10 A 11 17

FWR (A, B, C) if (base case) FWI (A, B, C) else FWR (A 00, B 00, C 00 ); FWR (A 01, B 00, C 01 ); FWR (A 10, B 10, C 00 ); 1 2 Παραλλθλία FWR (A 11, B 10, C 01 ); 3 FWR (A 11, B 10, C 01 ); FWR (A 10, B 10, C 00 ); FWR (A 01, B 00, C 01 ); FWR (A 00, B 00, C 00 ); 4 5 6 18

tiled 1 2 2 2 2 3 3 3 2 3 3 3 6 5 6 6 2 3 3 3 5 4 5 5 6 5 6 6 9 9 8 9 6 5 6 6 9 9 8 9 8 8 7 8 12 12 12 11 9 9 8 9 12 12 12 11 12 12 12 11 11 11 11 10 19

sandman: 4 x Intel Xeon E5-4620 (Sandy Bridge) Συνολικά 32 πυρινεσ (και 64 threads) Περιβάλλον εκτζλεςησ Core 0 Core 1 Core 2 Core 3 Core 0 Core 1 Core 2 Core 3 (NUMA Node 0) 64GB RAM L3 16MiB L3 16MiB (NUMA Node 1) 64GB RAM Core 4 Core 5 Core 6 Core 7 Core 4 Core 5 Core 6 Core 7 Core 0 Core 1 Core 2 Core 3 Core 0 Core 1 Core 2 Core 3 (NUMA Node 2) 64GB RAM L3 16MiB L3 16MiB (NUMA Node 3) 64GB RAM Core 4 Core 5 Core 6 Core 7 Core 4 Core 5 Core 6 Core 7 20

Οδηγίεσ Για χριςθ του sandman: $ qsub q serial l nodes=sandman:ppn=64 <script> Μπορείτε να επιλζξετε μεταξφ OpenMP και ΤΒΒs για τθν εκπόνθςθ τθσ άςκθςθσ Μπορείτε να χρθςιμοποιείτε τα μθχανιματα τθσ ουράσ parlab για τθν ανάπτυξθ του παράλλθλου κϊδικα Θα βρείτε τον κϊδικα τθσ άςκθςθσ ςτον scirouter ςτο path: /home/parallel/pps/2017-2018/a2/fw-serial Θα βρείτε παραδείγματα και οδθγίεσ μεταγλϊττιςθσ/εκτζλεςθσ για τα TBBs ςτον scirouter ςτο path: /home/parallel/pps/2017-2018/a2/tbb-workspace 21