Εισαγωγή. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Σχετικά έγγραφα
Εισαγωγή. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Εισαγωγή. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Περιεχόμενο μαθήματος

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών. Εισαγωγή. Συστήματα Παράλληλης Επεξεργασίας 9 ο Εξάμηνο

Εισαγωγή. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Συστήµατα Παράλληλης Επεξεργασίας

Αρχιτεκτονική Υπολογιστών

Παρουσίαση 2 ης Άσκησης:

Αρχιτεκτονική Υπολογιστών

An Overview of Parallel Architectures


Αρχιτεκτονική Υπολογιστών

Εισαγωγή. Λογισµικό & Προγραµµατισµός Συστηµάτων Υψηλής Επίδοσης

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΑρχιτεκτονικήΥπολογιστών. Ι (ένα) Δημήτρης Γκιζόπουλος. Καθηγητής

Κεντρική Μονάδα Επεξεργασίας. Επανάληψη: Απόδοση ΚΜΕ. ΚΜΕ ενός κύκλου (single-cycle) Παραλληλισμός σε επίπεδο εντολών. Υπολογιστικό σύστημα

Αρχιτεκτονική Υπολογιστών Ι (ένα)

Υ07. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ. Β. Δημακόπουλος.

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Αρχιτεκτονική Υπολογιστών

Παραλληλισμός σε επίπεδο εντολών

ΤΕΧΝΙΚΕΣ ΑΥΞΗΣΗΣ ΤΗΣ ΑΠΟΔΟΣΗΣ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ I

Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές

Παράλληλα Συστήματα. Γιώργος Δημητρίου. Ενότητα 3 η : Παράλληλη Επεξεργασία. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής

Συστήµατα Παράλληλης Επεξεργασίας. Παράλληλος προγραµµατισµός: Σχεδιασµός παράλληλων προγραµµάτων

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Main source: "Discrete-time systems and computer control" by Α. ΣΚΟΔΡΑΣ ΨΗΦΙΑΚΟΣ ΕΛΕΓΧΟΣ ΔΙΑΛΕΞΗ 4 ΔΙΑΦΑΝΕΙΑ 1

Εφαρµογές µε ανάγκες για υψηλές επιδόσεις Αξιολόγηση επίδοσης Παραλληλοποίηση εφαρµογών

EM 361: Παράλληλοι Υπολογισμοί

Αρχιτεκτονική υπολογιστών

Διεργασίες και Νήματα (2/2)

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Παρουσίαση 1 ης Άσκησης:

5/3/2012. Εισαγωγή στα Παράλληλα Συστήµατα (Οργάνωση-Προγραµµατισµός) Β. Δημακόπουλος Α. Ευθυμίου

Κατανεμημένος και Παράλληλος Προγραμματισμός. Ύλη μαθήματος. Βιβλιογραφία Μαθήματος 2/27/2016

ΑΝΙΧΝΕΥΣΗ ΓΕΓΟΝΟΤΩΝ ΒΗΜΑΤΙΣΜΟΥ ΜΕ ΧΡΗΣΗ ΕΠΙΤΑΧΥΝΣΙΟΜΕΤΡΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Αρχιτεκτονική Υπολογιστών. ηµήτρης Γκιζόπουλος Καθηγητής

ΥΠΟΛΟΓΙΣΤΙΚΗ ΧΗΜΕΙΑ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ ΜΟΡΙΑ, ΥΛΙΚΑ, ΠΕΡΙΒΑΛΛΟΝ

Περίληψη. Υπερυπολογιστές. Υπολογιστικά προβλήµατα. TOP 500 (Ιούνιος 2007) TOP 500 (Ιούνιος 2009) Ε-85: Ειδικά Θέµατα Λογισµικού

Διαφορές single-processor αρχιτεκτονικών και SoCs

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Αρχιτεκτονική Υπολογιστών

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

ΠΛΕ-079. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. dimako@cs.uoi.gr

Παράλληλος προγραμματισμός: παράλληλες λ υπολογιστικές πλατφόρμες και ανάλυση προγραμμάτων

ΕΝΣΩΜΑΤΩΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΤΕΙ ΗΠΕΙΡΟΥ- ΣΤΕΦ ΤΜΗΜΑ ΜΗΧ. ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

Παράλληλος Προγραμματισμός με OpenCL

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

Ιστορία των επεξεργαστών (CPUs)

ΥΠΟΛΟΓΙΣΤΙΚΗ ΧΗΜΕΙΑ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ ΜΟΡΙΑ, ΥΛΙΚΑ, ΠΕΡΙΒΑΛΛΟΝ. Ι ΑΣΚΟΝΤΕΣ: Μαρία Κανακίδου, Σταύρος Φαράντος, Γιώργος Φρουδάκης

ΠΛΕ-006 ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ Διδάσκων: Β. Δημακόπουλος.

Finite Field Problems: Solutions

Αριθµητικές Μέθοδοι Collocation. Απεικόνιση σε Σύγχρονες Υπολογιστικές Αρχιτεκτονικές

«Σχεδιασμός Ψηφιακών Συστημάτων σε FPGA» Εαρινό εξάμηνο

Right Rear Door. Let's now finish the door hinge saga with the right rear door

Πολυπύρηνοι επεξεργαστές Multicore processors

Παράλληλοι υπολογιστές

ΑΠΟΤΕΛΕΣΜΑΤΑ ΔΙΑΒΟΥΛΕΥΣΗΣ. Προκήρυξη Διαγωνισμού για την «Προμήθεια Εξοπλισμού Κόμβου Μηχανικής Μάθησης» /

TMA4115 Matematikk 3

ΤΕΧΝΙΚΕΣ ΑΠΟΔΟΤΙΚΗΣ ΧΡΗΣΗΣ ΤΟΥ ΕΘΝΙΚΟΥ ΥΠΕΡΥΠΟΛΟΓΙΣΤΙΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ARIS Αθήνα, 17 Δεκεµβρίου2015 Ιωάννης Λιαµπότης iliaboti at grnet.

CMOS Technology for Computer Architects

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

ΓΕΩΜΕΣΡΙΚΗ ΣΕΚΜΗΡΙΩΗ ΣΟΤ ΙΕΡΟΤ ΝΑΟΤ ΣΟΤ ΣΙΜΙΟΤ ΣΑΤΡΟΤ ΣΟ ΠΕΛΕΝΔΡΙ ΣΗ ΚΤΠΡΟΤ ΜΕ ΕΦΑΡΜΟΓΗ ΑΤΣΟΜΑΣΟΠΟΙΗΜΕΝΟΤ ΤΣΗΜΑΣΟ ΨΗΦΙΑΚΗ ΦΩΣΟΓΡΑΜΜΕΣΡΙΑ

EM 361: Παράλληλοι Υπολογισμοί

Ε-85: Ειδικά Θέµατα Λογισµικού

ΣΥΣΤΗΜΑΤΑ ΥΠΟΛΟΓΙΣΤΩΝ.

6.003: Signals and Systems. Modulation

Δίκτυα Διασύνδεσης. Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων

Υ- 01 Αρχιτεκτονική Υπολογιστών Πολυεπεξεργαστές

Προγραμματισμός και Χρήση Ηλεκτρονικών Υπολογιστών - Βασικά Εργαλεία Λογισμικού

Fractional Colorings and Zykov Products of graphs

Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology)

ΕΘΝΙΚΗ ΥΟΛΗ ΔΗΜΟΙΑ ΔΙΟΙΚΗΗ ΙH ΕΚΠΑΙΔΕΤΣΙΚΗ ΕΙΡΑ ΤΜΗΜΑ ΚΟΙΝΩΝΙΚΗΣ ΔΙΟΙΚΗΣΗΣ ΔΙΟΙΚΗΣΗ ΜΟΝΑΔΩΝ ΥΓΕΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Ειδική διάλεξη 2: Εισαγωγή στον κώδικα της εργασίας

Παρουσίαση 2 ης Άσκησης:

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

Section 8.3 Trigonometric Equations

Η επικράτηση των ψηφιακών κυκλωμάτων 1o μέρος

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

Σχετικά με την CBS εκ. Κύκλος εργασιών. Partners. 165 εργαζόμενοι. Μηχανικοί. Developers. Sales & Consultants. 34 Συνεργασίες.

ST5224: Advanced Statistical Theory II

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

«Θεσμικό πλαίσιο για την Ενεργειακή Αποδοτικότητα και την Εξοικονόμηση Ενέργειας στο κτιριακό και βιομηχανικό τομέα»

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Cilk: Φιλοσοφία και Χρήση

Matrices and vectors. Matrix and vector. a 11 a 12 a 1n a 21 a 22 a 2n A = b 1 b 2. b m. R m n, b = = ( a ij. a m1 a m2 a mn. def

Κεφάλαιο 1ο Πολυπρογραμματισμός Πολυδιεργασία Κατηγορίες Λειτουργικών Συστημάτων

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

Παράλληλη Επεξεργασία

Κυκλωμάτων» Χειμερινό εξάμηνο

Capacitors - Capacitance, Charge and Potential Difference

ΠΑΝΔΠΗΣΖΜΗΟ ΠΑΣΡΩΝ ΣΜΖΜΑ ΖΛΔΚΣΡΟΛΟΓΩΝ ΜΖΥΑΝΗΚΩΝ ΚΑΗ ΣΔΥΝΟΛΟΓΗΑ ΤΠΟΛΟΓΗΣΩΝ ΣΟΜΔΑ ΤΣΖΜΑΣΩΝ ΖΛΔΚΣΡΗΚΖ ΔΝΔΡΓΔΗΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ

The challenges of non-stable predicates

Transcript:

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Εισαγωγή 9 ο Εξάμηνο

Περιεχόμενο μαθήματος Ζητήματα παράλληλων αρχιτεκτονικών Κατηγορίες παράλληλων αρχιτεκτονικών Δίκτυα διασύνδεσης Παράλληλος προγραμματισμός Σχεδιασμός παράλληλων προγραμμάτων Ζητήματα υλοποίησης: προγραμματιστικά μοντέλα, γλώσσες και εργαλεία Αλληλεπίδραση εφαρμογών - αρχιτεκτονικής Εργαστήριο και εργασίες: Παραλληλοποίηση προγραμμάτων Μετρήσεις επίδοσης

Διαδικαστικά Διαλέξεις: Τρίτη 16:15-19:00, Αίθουσα 06 Εργαστήριο: Ίδιες ώρες με τις διαλέξεις, είτε στο Εργαστήριο Υπολογιστικών Συστημάτων (Κτ. Υπολογιστή) είτε στην αίθουσα Σχήμα βαθμολογίας: 50% γραπτό, 50% εργαστήριο. Απαιτείται προβιβάσιμος βαθμός στο γραπτό. Βιβλίο-σημειώσεις:, Γ. Παπακωνσταντίνου, Θ. Θεοχάρης, Π. Τσανάκας Σημειώσεις Διαφάνειες μαθημάτων Λίστα μαθήματος: http://lists.cslab.ece.ntua.gr/mailman/listinfo/parlab Γραφτείτε στη λίστα!: Ερωτήσεις- απορίες Ανακοινώσεις (επίσημες!)

Διαφημίζοντας το μάθημα Η παραλληλία υπάρχει οπουδήποτε υπάρχουν πολλαπλές λειτουργικές μονάδες: στην παραγωγή, στην κατασκευή, κλπ, δηλαδή σχεδόν παντού! Παραλληλία στα υπολογιστικά συστήματα: Στο εσωτερικό του επεξεργαστή: ILP και pipelines vector processing Στο επίπεδο του λειτουργικού για την αξιοποίηση των πόρων του συστήματος (CPU, I/O devices) Σε πολυπύρηνα συστήματα Σε υπερυπολογιστικά συστήματα με χιλιάδες επεξεργαστές Παράλληλος προγραμματισμός Παραδοσιακά για επιστημονικές εφαρμογές σε υπερυπολογιστές Πρόσφατα για ΟΛΕΣ τις εφαρμογές σε πολυπύρηνους επεξεργαστές Ο παράλληλος προγραμματισμός είναι επιτέλους trendy!!!

Τι θα μάθω Ζητήματα αρχιτεκτονικής που αφορούν τα συστήματα παράλληλης επεξεργασίας Ποιες είναι οι μεγάλες αρχιτεκτονικές κλάσεις παράλληλων συστημάτων Πως διασυνδέονται οι υπολογιστικοί κόμβοι (δίκτυα διασύνδεσης) «Μεθοδολογίες» σχεδίασης παράλληλων προγραμμάτων Γλώσσες, προγραμματιστικά μοντέλα και εργαλεία παράλληλου προγραμματισμού: MPI OpenMP CUDA Cilk PGAS

Supercomputers Για δεκαετίες: parallel computing = supercomputing Συνεργασία πολλών επεξεργαστών για την επίλυση επιστημονικών προβλημάτων: Επιστήμες μηχανικού (ρευστοδυναμική, στατική, κλπ) Επιστήμες της γης και του διαστήματος (πρόγνωση καιρού/σεισμών/πυρκαγιάς, μαγνητικές καταιγίδες, αστρονομία, κοσμολογία, κλπ) Επιστήμες της ζωής (ανάλυση DNA, πρωτεϊνών) Οικονομικές επιστήμες Κοινωνικές επιστήμες Εφαρμογές number crunching με ακόρεστη «δίψα» για υπολογιστική δύναμη Πλατφόρμα εκτέλεσης: υπερυπολογιστές με χιλιάδες επεξεργαστικές μονάδες

www.top500.org

www.top500.org

Top systems

Κλάσεις Υπολογιστών Υψηλών Επιδόσεων Δύο μεγάλες αρχιτεκτονικές κλάσεις: Cluster: εμπορικό δίκτυο διασύνδεσης και μέρη Πλεονεκτήματα : Οικονομικότερες λύσεις Ευκολία στην συναρμολόγηση, ρύθμιση και λειτουργία Μειονεκτήματα : Λιγότερο «κλιμακώσιμο» (?) «Μετριότερη» επίδοση (?) Περισσότερο ενεργοβόρο Custom built: ειδικά κατασκευασμένο δίκτυο διασύνδεσης Πλεονεκτήματα : «Κλιμακώσιμο» Υψηλή επίδοση Χαμηλότερη κατανάλωση ενέργειας Μειονεκτήματα : Υψηλό κόστος

Ταξινόμηση ΥΥΕ Υποκλάσεις (τύποι): Cluster(*): Homogeneous cluster: βασίζεται σε ομογενείς CPUs Heterogeneous cluster: βασίζεται σε ετερογενείς CPUs Custom built: MPP(*): Super-scalar CPU με μέτριο ή χωρίς πολυνηματισμό Vector: Κόμβοι διανυσματικών μονάδων MMT: Μαζικά πολυνηματικές CPUs Άλλοι όροι Thin cluster node: μικρό μέγεθος υπολογιστικών μονάδων, μνήμης και Ι/Ο (π.χ. 2-4 πυρήνες) Fat cluster node: μεγάλο μέγεθος υπολογιστικών μονάδων, μνήμης και Ι/Ο (π.χ.. Περισσότεροι από 16 πυρήνες) Constellation (*) συστοιχία P 1 κόμβων με P 2 πυρήνες (P 2 >P 1 ) Accelerated: κόμβοι περιλαμβάνουν επιταχυντές HW (π.χ. GP-GPU, FPGA) (*) όροι TOP500

Timeline: distribution of architectures in Top500

Επεξεργαστές και επιταχυντές Οι ΥΥΕ χρησιμοποιούν κατά κύριο λόγο εμπορικούς επεξεργαστές Τα τελευταία χρόνια έχει αυξηθεί ραγδαία η χρήση επιταχυντών (κυρίως GPUs) Σημαντικό εύρος από οικογένειες επεξεργαστών: AMD Opteron NEC 3200 IBM Power 6/7 IBM PowerPC 970MP IBM PowerXcell 8i Intel Itanium Intel Xeon

Processor families share June 2012

Επιταχυντές Κάρτες γραφικών Καλύτερη επίδοση ανά μονάδα ισχύος και κόστους από τους επεξεργαστές Μαζικά πολυπύρηνες Διαχείριση ιεραρχίας μνήμης από το λογισμικό Χαμηλή επίδοση σε εφαρμογές με πολύπλοκες ροές ελέγχου Απαιτούν εξειδικευμένα προγραμματιστικά μοντέλα και εργαλεία

Interconnect share June 2012

Top500: June 2012 list (companies)

Top500: June 2012 list (countries)

Top500 highlights Ranked 1 st : Sequoia - BlueGene/Q, 1.572.864 cores Power BQC 16C 1.60 GHz 5D torus custom interconnection network 16.32PFlops USA 207 / 500 cluster με Gigabit Ethernet Μόνο 2 από αυτά στο Top100 (#61, #72) 209 / 500 cluster με Infiniband 3 από αυτά στο Top10 ~5000 πυρήνες απαιτούνται για την είσοδο στο top500

Multi-core processors Intel Xeon Westmere, 4, 6, 10 cores, HT Sandy-Bridge, 4, 6, 8 cores Intel Teraflops Research Chip (Polaris) 80-core processor AMD Opteron Magny-Cours, 4, 6 cores Interlagos, 4, 8,,12, 16 cores IBM Power 7 4, 6, 8-core (4 threads/core), up to 4 CPUs per system (up to 128 hw threads) Tilera Tile TILE64, 64-core TILE-Gx, 100-core Sun UltraSPARC T3 sixteen-core, 128-concurrent-threads

Technological trends: From Moore s law The number of transistors on integrated circuits doubles approximately every two years (Moore, 1965) More good news! transistors become faster as well! CPU speed doubles every 18 months (David House) What to do with so many, fast transistors? Instruction Level Parallelism! (ILP) Deeper pipelines Faster clock speeds Larger caches Better branch predictors Out of order execution Superscalar Faster processing cores at no programming cost

Technological trends: From Moore s law

From wikipedia: Technological trends: to Dennard Scaling MOSFETs continue to function as voltage-controlled switches while all key figures of merit such as layout density, operating speed, and energy efficiency improve provided geometric dimensions, voltages, and doping concentrations are consistently scaled to maintain the same electric field (Dennard 1974) P = CV 2 f (C = count, V = voltage, f = frequency) Increase in device count Higher operating frequencies Lower supply voltages Constant power / chip!!!

what a wonderful world Is it? In ~2004 we hit the ILP wall Transistors could not be utilized to increase serial performance Logic became too complex Performance attained was very low compared to power consumption Solution: Multicore CPUs! But.. The free lunch is over welcome to the jungle! (http://herbsutter.com/welcome-to-the-jungle/) We need parallel software

The end of Dennard scaling? Transistors are becoming too small A lot of energy is lost in leakage Voltage has not dropped significantly during the last few years

If P = CV 2 f C can still increase as predicted my Moore s law transistors get shorter number of cores increase V cannot drop drastically We need to keep f low But P may take off. The power wall

Ok.. Is that all? No CPU to memory gap The memory wall: CPUs are much faster than memory and applications may starve waiting for data from main memory

Two ways ahead The catapult way: Advances through technological breakthrough The parkour way: Redesign software and algorithms This is what the course Parallel Processing Systems is about

Παράλληλες πλατφόρμες εκτέλεσης Η «ιδανική» παράλληλη πλατφόρμα PRAM Ταξινόμηση του Flynn Ρεαλιστικές πλατφόρμες: Κοινής μνήμης Κατανεμημένης μνήμης Υβριδικές Σύνοψη του μαθήματος Αναλυτική μοντελοποίηση παράλληλων προγραμμάτων Αξιολόγηση επίδοσης Μοντελοποίηση και πρόβλεψη της επίδοσης

Σχεδιασμός παράλληλων προγραμμάτων Σύνοψη του μαθήματος Κατανομή δεδομένων και υπολογισμών task centric vs data centric tasks, processes and processors Αλληλεπίδραση μεταξύ tasks: συγχρονισμός και επικοινωνία Υλοποίηση παράλληλων προγραμμάτων Προγραμματιστικά μοντέλα Κοινού χώρου διευθύνσεων Ανταλλαγής μηνυμάτων Προγραμματιστικές δομές (πώς μπορώ να «μιλήσω» παράλληλα;) Ζητήματα επίδοσης και αλληλεπίδραση με την αρχιτεκτονική (γιατί δεν παίρνω την επίδοση που θέλω;)

Σύνοψη του μαθήματος Συγχρονισμός: Από το hardware στις δομές συγχρονισμού υψηλού επιπέδου Εφαρμογές: Seven dwarves Dense Linear Algebra Sparse Linear Algebra Spectral Methods N-Body Methods Structured Grids Unstructured Grids MapReduce (Monte Carlo) New applications Combinational Logic Find Nearest Neighbors Graph Traversal Dynamic Programming Back-track/Branch & Bound Graphical Model Inference Finite State Machine