***Computer Organization & Design the Hardware/Software Interface, David Patterson & John Hennessy, Morgan Kaufmann Publishers, 4thed

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "***Computer Organization & Design the Hardware/Software Interface, David Patterson & John Hennessy, Morgan Kaufmann Publishers, 4thed. 2008."

Transcript

1

2 «Οι υπολογιστές όλων των μεγεθών θα ενσωματώσουν τον παραλληλισμό ακόμα περισσότερο από ότι σήμερα αυτοί οι οποίοι κατανοούν από εφαρμογές,αλγόριθμούς και αρχιτεκτονικές θα βρεθούν προετοιμασμένοι γι αυτή την ευκαιρία.» ***Computer Organization & Design the Hardware/Software Interface, David Patterson & John Hennessy, Morgan Kaufmann Publishers, 4thed

3 Τα σύγχρονα πολύπλοκα επιστημονικά προβλήματα του αιώνα μας, τα οποία αποκαλούνται «μεγάλες προκλήσεις» και αφορούν την ιατρική, την φαρμακολογία, την κβαντοχημεία, την αστροφυσική, την γενετική μηχανική, κ.ά., αντιμετωπίζονται σήμερα με αριθμητική προσομοίωση, η οποία απαιτεί τεράστια υπολογιστική ισχύ, την οποία οι ακολουθιακοί υπολογιστές δεν διαθέτουν. Τα τελευταία χρόνια παρατηρείται μια ραγδαία ανάπτυξη και εξάπλωση στον χώρο της παράλληλης επεξεργασίας στην προσπάθεια να επιταχυνθούν όσο το δυνατό περισσότερο και γρηγορότερα οι απαραίτητοι υπολογισμοί τέτοιων εφαρμογών. Η παραγωγή λοιπόν υπολογιστικών συστημάτων, τα οποία είναι επιδεκτικά εκτεταμένων υπολογισμών, π.χ. 150 τρισεκατομμυρίων πράξεων προς πρόβλεψη των ιδιοτήτων ενός υλικού, έγινε επιτακτική ανάγκη, και είναι ήδη γεγονός. Τα συστήματα αυτά, τα οποία βασίζονται στην Ευκλείδεια έννοια της παραλληλίας, καλούνται παράλληλοι υπολογιστές και είναι υπολογιστικές μηχανές με δυνατότητες παράλληλης επεξεργασίας δεδομένων.

4 Οι πρώτες ιδέες για single instruction multiple data (SIMD)υπολογιστές εντοπίζονται χρονολογικά στην κατασκευή του ILLIAC IV. Ο Iliiac IV ήταν ένα από τα πρώτα ερευνητικά παράλληλα συστήματα των supercomputer projects της δεκαετίας του 70.Το έργο άρχισε το1965 και έτρεξε την πρώτη πραγματική εφαρμογή του το1976 (έντεκα ολόκληρα χρόνια μετά). Το σύστημα σχεδιάστηκε για να αποδίδει 1000MFLOPS και όταν ολοκληρώθηκε απέδιδε μόνο15mflops(δηλαδή μόνο το1,5% του αρχικού σχεδιασμού!). Το κόστος αρχικής εκτίμησης για την κατασκευή του ήταν 8$ εκατομμύρια και ξεπέρασε τα 31$ εκατομμύρια το1966, τελικά όμως κατασκευάστηκε μόνο το ένα τέταρτο της αρχικά σχεδιασμένης μηχανής. Το σύστημα χρησιμοποιούσε 64 επεξεργαστές στα13mhz και η συνολική του μνήμη ήταν1μβ!

5 ILLIAC IV

6

7 Οι παράλληλοι υπολογιστές δεν είναι πρόσφατη εξέλιξη ο πρώτος παράλληλος υπολογιστής, ονόματι Burroughs D825, εμφανίστηκε μόλις το 1962 και διέθετε 4 επεξεργαστές οι οποίοι συνδέονταν με την μνήμη μέσω ενός διακόπτη εγκάρσιων ράβδων. Αυτό το πρώιμο ενδιαφέρον για τις παράλληλες αρχιτεκτονικές ήταν απόρροια της ευρείας τότε πεποίθησης μεταξύ των επιστημόνων πληροφορικής ότι η βελτίωση της απόδοσης των επεξεργαστών επρόκειτο πολύ σύντομα να πέσει πάνω στον τοίχο που ακούει στο όνομα ταχύτητα του φωτός.

8 Στην πορεία αυτή η πεποίθηση διαψεύστηκε χάρη σε μια σειρά από επαναστάσεις στον τρόπο κατασκευής και στην αρχιτεκτονική των μονο-επεξεργαστών. Πάντως, τα ερευνητικά κέντρα στράφηκαν σε υπερ-υπολογιστές οι οποίοι ήταν άκριβοί εξαιτίας της πολύπλοκης αρχιτεκτονικής και επειδή κατασκευάζονταν σε λίγα αντίτυπα κατόπιν παραγγελίας, ενώ στο εμπορικό κομμάτι κυριάρχησαν οι «φθηνοί» μονο-επεξεργαστές. Η αύξηση του αριθμού των τρανζίστορ στα ολοκληρωμένα κυκλώματα που ακολούθησε τον νόμο του Moore (διπλασιασμός κάθε 2 χρόνια και αργότερα κάθε 18 μήνες) και η επακόλουθη αύξηση της απόδοσης κράτησε περίπου 4 δεκαετίες.

9 Στο διάστημα αυτό, οι αρχιτέκτονες των μονοεπεξεργαστών εκμεταλλεύτηκαν τα επιπλέον τρανζίστορ για να υλοποιήσουν σημαντικές καινοτομίες με πρώτη και κυρίαρχη την σωλήνωση εντολών (pipeline instruction).

10 Με αυτή έγινε εφικτή μια πρώτη περιορισμένη μορφή παραλληλισμού, ο λεγόμενος παραλληλισμός σε επίπεδο εντολών (ILP) χάρη στον οποίο ο επεξεργαστής μπορεί να εκτελεί πολλές εντολές ταυτόχρονα με την κάθεμια να καταλαμβάνει διαφορετικό στάδιο της σωλήνωσης. Η δυσκολία του εγχειρήματος έγκειτο στην ανάγκη δυναμικού ελέγχου των εξαρτήσεων δεδομένων κατά την ώρα εκτέλεσης, αφού πλέον δεν ίσχυε η υπόθεση της ολοκλήρωσης μιας εντολής πριν την έναρξη της επόμενης.

11 Το πρώτο αυτό άλμα διαδέχτηκαν και άλλες καινοτομίες όπως η εκτέλεση των εντολών εκτός σειράς (out-oforder execution), η πρόβλεψη διακλάδωσης (branch prediction) κατά την οποία ο επεξεργαστής διαλέγει ένα μονοπάτι του βρόχου βάσει της πρόσφατης συμπεριφοράς του, και ακόμα η έκδοση πολλαπλών εντολών σε κάθε κύκλο ρολογιού (υπερβαθμωτοί επεξεργαστές) η οποία αύξησε κατακόρυφα την δίψα των τελευταίων για εντολές προς αποφυγή του pipeline stalling

12 Η ανάγκη για πιο γρήγορη τροφοδοσία αντιμετωπίστηκε με διάφορους τρόπους όπως μεγαλύτερες caches, αναδιάταξη των εντολών απ τον μεταγλωττιστή και την υποθετική εκτέλεση (speculative execution) κατά την οποία ο επεξεργαστής εκτελεί κώδικα ο οποίος μπορεί και να μην χρειαστεί. Τέλος, να αναφέρουμε συνοπτικά τον παραλληλισμό μέσω διανυσματικών εντολών, για παράδειγμα το σετ εντολών SSE (Streaming SIMD Extensions) που επιτρέπει την ταυτόχρονη επεξεργασία πολλών δεδομένων, αλλά και την τεχνική SMT (Simultaneous Multi-Threading) η οποία εκτελεί μια δεύτερη ροή ελέγχου σε περίπτωση που ο επεξεργαστής περιμένει λόγω αστοχίας cache της πρώτης (ψευδο-παραλληλισμός σε επίπεδο νήματος). SSE

13 Η αύξηση της απόδοσης των μονο-επεξεργαστών πήρε τέλος την 1η δεκαετία του 21ου αιώνα όταν και έγινε αντιληπτό ότι η παραγόμενη θερμότητα όρθωνε ανυπέρβλητα εμπόδια στην περαιτέρω αύξηση του ρολογιού. Οι αρχιτέκτονες Η/Υ στράφηκαν στην μοναδική εναπομείνασα επιλογή χρησιμοποίησαν τα τρανζίστορ που είχαν στη διάθεσή τους για να χωρέσουν στο ίδιο chip δύο πυρήνες (και αργότερα ολόκληρους ελεγκτές μνήμης και μονοπάτια διασύνδεσης). Με αυτό τον τρόπο, οι παράλληλοι υπολογιστές έκαναν την είσοδό τους στον εμπορικό κόσμο με την μορφή των πολυπύρηνων επεξεργαστών.

14 Από την άλλη πλευρά, η σύγκλιση έγινε την ίδια περίπου εποχή, όταν οι επιστήμονες αντιλήφθηκαν τα ωφέλη της κατασκευής υπερ-υπολογιστών με τη σύνδεση πολλών και φτηνών εξαρτημάτων έναντι λίγων και ισχυρών. Οι πανάκριβοι υπερυπολογιστές έδωσαν σιγά σιγά τη θέση τους στα λεγόμενα συστήματα MPP (Massively Parallel Processing) τα οποία αποτελούνται από φθηνούς επεξεργαστές του εμπορίου που διασυνδέονται με ένα ταχύτατο και ακριβό δίκτυο διασύνδεσης. Αργότερα και το εξειδικευμένο δίκτυο υποχώρησε προς χάριν εμπορικών λύσεων οδηγώντας στις λεγόμενες συστοιχίες υπολογιστών (clusters) οι οποίες αποτελούν σήμερα την πλειοψηφία των μεγάλων παράλληλων υπολογιστών.

15 την παραπάνω εικόνα παρουσιάζεται η αρχιτεκτονική εξέλιξη των top 500 υπολογιστών.

16 Μέχρι τα μέσα της δεκαετίας του 70 οι βασικές αρχιτεκτονικές πρόοδοι, όπως είναι η bit-παράλληλη μνήμη, η bit-παράλληλη αριθμητική, κρυφή μνήμη, οι δίαυλοι, η διαφυλλωμένη μνήμη, η σωλήνωση εντολών, οι πολλαπλές λειτουργικές μονάδες, οι σωληνωμένες λειτουργικές μονάδες είχαν είδη συμπεριληφθεί στους σχεδιασμούς υπερυπολογιστών. Έκτοτε αύξηση της απόδοσης επεξεργαστή σήμαινε μείωση χρόνου του κύκλου εντολής. Αυτό έγινε ιδιαίτερα δύσκολο, εφόσον η ταχύτητα των ηλεκτρονικών κυκλωμάτων περιορίζεται από την ταχύτητα του φωτός. Κατ αντιδιαστολή οι πρώιμοι μικροϋπολογιστές, οι οποίοι δεν είχαν ενσωματώσει όλες τις αρχιτεκτονικές προόδους στο σχεδιασμό τους, είχαν μεγάλα περιθώρια εξέλιξης, η οποία ανελικτικά οδήγησε σε εντυπωσιακές αποδόσεις αυτήν την κλάση των υπολογιστών.

17 Το μείζον θέμα που ανέκυψε με την εμφάνιση των σύγχρονων ανομοιογενών και πολυεπίπεδων συστοιχιών έχει να κάνει με την δυσκολία προγραμματισμού τους. Πράγματι, αν κάποιος εξετάσει την κατάσταση στον τομέα του παράλληλου λογισμικού όπως αυτή διαμορφώνεται τα τελευταία χρόνια θα διαπιστώσει ότι πλέον δεν υφίσταται μια ενιαία λύση. Αντιθέτως, χρησιμοποιείται ένας συνδυασμός από διαφορετικά προγραμματιστικά «παραδειγμάτα», καθένα από τα οποία αντιστοιχεί σε διαφορετικό επίπεδο της αρχιτεκτονικής. Δεν είναι σπάνιο να έχουμε στο ίδιο πρόγραμμα χρήση της MPI για τον παραλληλισμό σε επίπεδο διεργασίας, OpenMP για την πολυνηματική επεξεργασία εντός κόμβου (SMP ή NUMA) και CUDA για τον προγραμματισμό των γραφικών επεξεργαστών που τυχόν επιταχύνουν τον παράλληλο υπολογιστη. Προφανώς, η ταυτόχρονη γνώση όλων αυτών των ιδιωμάτων πέραν της γνώσης των ίδιων των αλγορίθμων, δυσχεραίνουν αφάνταστα τη δουλειά του παράλληλου προγραμματιστή.

18 Η σύγκλιση στη σχετική απόδοση μεταξύ μικροϋπολογιστών και παραδοσιακών υπερυπολογιστών κατέληξε στην ανάπτυξη εμπορικά βιώσιμων παράλληλων υπολογιστών οι οποίοι αποτελούνται από δεκάδες ή και εκατοντάδων υπολογιστών και λέγονται μαζικά παράλληλοι. Με μια απλοϊκή προσέγγιση, θα μπορούσε κανείς να υποθέσει ότι όσο περισσότερες μονάδες επεξεργασίας είναι διαθέσιμες, τόσο πιο γρήγορα εκτελείται μια οποιαδήποτε απαιτητική εφαρμογή. Άρα, θα ήταν αρκετή η διάθεση τεράστιων υπερυπολογιστών, που θα επέλυαν το κάθε πρόβλημα σε κλάσματα του δευτερολέπτου. Στην πραγματικότητα όμως τα πράγματα είναι διαφορετικά. Ένας μεγάλος αριθμός των υπολογιστικά απαιτητικών εφαρμογών δεν εμφανίζει επιτάχυνση ανάλογη με την αύξηση των διαθέσιμων επεξεργαστών. Πιο απλά υπάρχει ένα όριο πέρα από το οποίο για κάθε πρόβλημα, η αύξηση του αριθμού των επεξεργαστικών μονάδων, όχι μόνο δεν επιταχύνει την επίλυση του, αλλά αντίθετα την καθυστερεί. Το όριο αυτό δεν εξαρτάται μόνο από την δυσκολία της κάθε εφαρμογής, αλλά κυρίως από τον τρόπο που αυτή έχει προγραμματιστεί να εκτελεστεί παράλληλα. Δεν αρκεί να διαθέτει κανείς συστήματα τεράστιας υπολογιστικής ισχύος, προκειμένου να εκτελέσει ταχύτατα κάποια απαιτητική εφαρμογή. Απαιτείται προσεκτικός προγραμματισμός και σωστή διαμέριση της εφαρμογής, ώστε να γίνεται εκμετάλλευση των πόρων του υπερυπολογιστή και να επιταχύνεται η εκτέλεση.

19 Παράλληλος Τπολογισμός /Παράλληλη Επεξεργασία είναι η ταυτόχρονη πραγματοποίηση δύο ή περισσοτέρων διαφορετικών ροών εκτέλεσης κατά το ίδιο χρονικό διάστημα. ΣοΤλικό The Hardware Παράλληλος Υπολογιστής Parallel Computer Παράλληλος Επεξεργαστής Parallel Processor Υπερυπολογιστής Supercomputer Πολυεπεξεργαστικό σύστημα Multiprocessor Πολυπύρηνος επεξεργαστής Multi-core Παράλληλο ύστημα Παράλληλο σύστημα έχουμε όταν συνυπάρχουν πολλαπλά αντίτυπα μονάδων υλικού(hardware)στο ίδιο υπολογιστικό σύστημα, τα οποία έχουν τη δυνατότητα να παράγουν έργο ταυτόχρονα. ΣοΛογισμικό The Software Παράλληλος αλγόριθμος Parallel algorithm Παράλληλο πρόγραμμα Parallel program Παραλληλοποιητής Μεταφραστής Parallelizing Compiler

20 Η συνεχώς αυξανόμενη ζήτηση μεγαλύτερης υπολογιστικής ισχύς για την επίλυση προβλημάτων αιχμής της έρευνας και της τεχνολογίας έχει οδηγήσει στη χρήση υπολογιστών με πολλούς επεξεργαστές σε συνδυασμό με μεθόδους παράλληλης επεξεργασίας. Οι μέθοδοι αυτές στοχεύουν στην ταυτόχρονη εκμετάλλευση πολλών επεξεργαστών για την αντιμετώπιση μιας μεγάλης υπολογιστικής διεργασίας (task), χωρίζοντας την σε μικρότερες ανεξάρτητες υποδιεργασίες (subtasks). Η χρήση λοιπόν του όρου παράλληλη επεξεργασία υπονοεί υπολογιστικές διατάξεις με περισσότερους του ενός επεξεργαστές. Οι διατάξεις αυτές είναι γνωστές ως υπερυπολογιστές (supercomputers) ή παράλληλοι υπολογιστές (parallel computers) ή υπολογιστές υψηλής απόδοσης (high performance computers).

21 Τλικό-Hardware Η πρόσκρουση στο φράγμα της μνήμης(memory wall) και στο φράγμα της ισχύος(power wall),οδήγησαν στην επανάσταση των πολυπύρηνων επεξεργαστών (the multi-core revolution). Ο νόμος του Moore επαναδιατυπώνεται: Ο αριθμός των πυρήνων σε κάθε επεξεργαστή διπλασιάζεται περίπου κάθε δυο χρόνια(ενώ η ταχύτητα ρολογιού παραμένει σχεδόν σταθερή) Λογισμικό-Software Αναζήτηση για νέα προγραμματιστικά μοντέλα. Νέες,ταυτόχρονες(concurrent) γλώσσες προγραμματισμού Παραλληλοποιητές Μεταφραστές Ετερογενή περιβάλλοντα:cpus+gpus Περιβάλλοντα κατανεμημένης επεξεργασίας:mpi, SDSM, PGAS. Πολυνηματισμός και Διεκπεραιωτική Μνήμη(transactional memory).

22 Η παράλληλη επεξεργασία αποτελεί μια εξέλιξη της ακολουθιακής επεξεργασίας που προσπαθεί να μιμηθεί αυτό που σχεδόν πάντα συμβαίνει στο φυσικό κόσμο: πολλά σύνθετα, αλληλοσχετιζόμενα γεγονότα συμβαίνουν ταυτόχρονα, το καθένα με τη δική του εσωτερική ακολοθουθία συμβάντων, και με καποιας μορφής επικοινωνία ή συγχρονισμό μεταξύ των γεγονότων. Μερικά παραδείγματα: Τροχιές πλανητών, αστεριών ή γαλαξιών Μετεωρολογικά φαινόμενα, θαλάσσια ρεύματα Κίνηση τεκτονικών πλακώ Κυκλοφορία οχημάτων σε μια πόλη Γραμμή παραγωγής σε ένα εργοστάσιο Ημερήσια δραστηριότητα σε μια επιχείριση Οικοδόμηση ενός τεχνικού έργου Εξυπηρέτηση μιας παραγγελίας σε ένα κατάστημα.

23 Παραδοσιακά, η παράλληλη επεξεργασία θεωρείται ως εξειδικευμένη τεχνική με βασικό σκοπό την αριθμητική επίλυση σύνθετων προβλημάτων επιστήμης και μηχανικής, όπως: Πρόβλεψη του καιρού, μακροπρόθεσμα κλιματικά μοντέλα ύνθετες χημικές και πυρηνικές αντιδράσεις Αστρονομία και υπολογιστική φυσική Γονιδιωματική, υπολογιστική βιολογία Γεωλογία, σεισμολογία Τπολογιστική ρευστοδυναμική Μηχανική - από νανοεξαρτήματα έως αεροπλάνα ύνθετα ηλεκτρικά και ηλεκτρονικά κυκλώματα Κατασκευαστικές διεργασίες Σεχνητή όραση, επεξεργασία φυσικής γλώσσας.

24

25 Αυτό που προσπαθούμε κατά βάση να πετύχουμε με τη παράλληλη επεξεργασία είναι να κερδίσουμε χρόνο ή/και να επεξεργαστούμε μεγαλύτερο μέγεθος δεδομένων. Σο υλικό γίνεται συνεχώς φθηνότερο και ισχυρότερο, το λογισμικό είναι γενικά δημόσια διαθέσιμο και βελτιώνεται συνεχώς, ο όγκος των δεδομένων αυξάνεται με αλματώδεις ρυθμούς και λόγω διαδικτύου, ο διαθέσμιος χρόνος μας παραμένει ίδιος. Η παράλληλη επεξεργασία προσπαθεί να εκμεταλλευτεί όσο γίνεται πιο αποδοτικά το άφθονο υλικό, έτσι ώστε με τη βοήθεια ειδικού λογισμικού να επιτύχει μέγιστη επεξεργασία δεδομένων στον ελάχιστο χρόνο.

26 Η ταχύτητα των υπολογιστών καθορίστηκε για πολλές δεκαετίες κυρίως από την εξέλιξη της τεχνολογίας που είχε ως βασικό στόχο τη συρρίκνωση των τρανζίστορ. Πιο συγκεκριμένα : Μείωση παρασιτικών χωρητικοτήτων Αύξηση ταχύτητας Μείωση κόστους Μείωση κατανάλωσης ενέργειας/τρανζίστορ Αύξηση των λειτουργιών/chip Αυτό σημαίνει ΠΟΛΤΠΛΟΚΟΣΗΣΑ!! Νόμος Bill Joy (Επιδόσεις εκθετικά αυξανόμενες (integer SPEC bechmarks)

27 Προβλήματα που ανέκυψαν: Η ταχύτητα των κυκλωμάτων δεν μπορεί να αυξάνει απεριόριστα( θεωρητικό όριο η ταχύτητα του φωτός). Η συνολική κατανάλωση ενέργειας αυξάνει δραματικά καθώς αυξάνει ο αριθμός των τρανζίστορ/chip. Κβαντομηχανικά φαινόμενα και μεγάλες διασπορές των κυκλωματικών παραμέτρων δυσκολεύουν εξαιρετικά το σχεδιασμό των επεξεργαστών. Λύσεις: Ανάπτυξη νέων τεχνολογιών. ΠΑΡΑΛΛΗΛΙΜΟ Παραλληλισμός σε επίπεδο εντολών (διοχέτευση,υπερβαθμωτές αρχιτεκτονικές) αύξηση της ταχύτητας x10. Παράλληλοι Τπολογιστές με πολλαπλούς επεξεργαστές. Πχ σύστημα με1000 επεξεργαστές προσφέρει θεωρητικά αύξηση της ταχύτητας x1000.

28 Παραδοσιακά, το λογισμικό γράφεται με στόχο την ακολουθιακή (σειραική) εκτέλεση: Ο υπολογιστής θεωρείται οτι έχει μια Κεντρική Μονάδα Επεξεργασίας (CPU); Το πρόβλημα (problem) επιλύεται με την εκτέλεση μιας σειράς (ακολουθίας) εντολών (instructions). Οι εντολές προυποθέτουν την ολοκλήρωση των προηγούμενων εντολών. Κάθε χρονική στιγμή (t1, t2, t3,..., tn) εκτελείται μια εντολή.

29 ειριακό μοντέλο (κλασικός Η/Τ) Ποιο είναι το πρόβλημα με αυτό το μοντέλο; Φυσικοί νόμοι: με βάση την ειδική θεωρία της σχετικότητας του Αϊνστάιν, η ταχύτητα των ηλεκτρικών σημάτων είναι μικρότερη ή ίση αυτής του φωτός. Η ταχύτητα του φωτός είναι περίπου 0,3 m/nsec στο κενό, και αρκετά μικρότερη σε χάλκινα καλώδια. Άρα, αν η απόσταση μεταξύ CPU και μνήμης είναι 30 cm, θα χρειαστεί (τουλάχιστον) 1 nsec για να πάει η διεύθυνση στη μνήμη και άλλο 1 nsec για να φτάσει το δεδομένο στη CPU (υποθέτοντας ότι η μνήμη έχει ΜΗΔΕΝΙΚΗ καθυστέρηση). Άρα η μόνη λύση για να κάνουμε ταχύτερους υπολογιστές είναι να τους κάνουμε εξαιρετικά μικροσκοπικούς!

30 Ήδη τα μεγέθη των τρανζίστορ και οι αποστάσεις μέσα στα chip είναι πολύ μικρές (2-3 μόρια απαρτίζουν κάποια τμήματα των τρανσίστορ). Περαιτέρω σμίκρυνση θα συνοδευτεί από μοριακά / ατομικά / πυρηνικά φαινόμενα που δεν ξέρουμε ακόμα πώς να τα χειριστούμε!! Μικρά μεγέθη και αύξηση συχνότητας λειτουργίας (για ταχύτητα) οδηγεί σε αύξηση της κατανάλωσης. Από τα 4Ghz περίπου πριν 2 χρόνια, οι συχνότητες έπεσαν στα 2GHz στους πρόσφατους επεξεργαστές! Υπάρχει άλλη λύση; Δεύτερη (και μοναδική) λύση Παραλληλισμός. Πολλαπλές εντολές εκτελούνται παράλληλη (ταυτόχρονα). Άρα γρηγορότερη ολοκλήρωση των προγραμμάτων. Τπέρβαση από τον ακολουθιακό τρόπο σκέψης, σε έναν τρόπο σκέψης με όρους και συνθήκες παραλληλίας.

31 Η παράλληλη επεξεργασία είναι η ταυτόχρονη χρήση πολλαπλών υπολογιστικών πόρων για την επίλυση ενός προβλήματος. Ο υπολογιστής θεωρείται οτι διαθέτει πολλαπλές CPUs Το πρόβλημα διασπάται σε διακριτά τμήματα (εργασίες, tasks) που μπορούν να επιλυθούν ταυτόχρονα. Κάθε τμήμα επιλύεται με την εκτέλεση μιας σειράς (ακολουθίας) εντολών. Οι εντολές κάθε τμήματος εκτελούνται ταυτόχρονα σε διαφορετικές CPUs. Για τις εντολές κάθε τμήματος ισχύουν οι περιορισμοί της ακολουθιακής εκτέλεσης.

32 Οι υπολογιστικοί πόροι μπορεί να είναι: Ένας υπολογιστής με πολλές CPUs (ή μια CPU με πολλούς πυρήνες -cores) ή μια CPU με πολλές ALUs. Η σύνδεση μεταξύ των CPUS ή ALUs καθώς και με τη κεντρική μνήμη επιτυγχάνεται μέσω είτε εξειδικευμένου δικτύου διασύνδεσης ή τυπικού διαύλου. Πολλοί υπολογιστές συνδεδεμένοι είτε σε συστοιχίες μέσω εξειδικευμένης διασύνδεσης υψηλής απόδοσης και κοινά προσπελάσιμους δίσκους, ή σε τυπικό τοπικό δίκτυο ή ακόμη και μέσω διαδικτύου. Συνδυασμός των δύο παραπάνω καταστάσεων (πχ υπολογιστές πολλαπλών πυρήνων σε τοπικό δίκτυο). Σο υπολογιστικό πρόβλημα συνήθως παρουσιάζει τα παρακάτω χαρακτηριστικά: Μπορεί να τεμαχιστεί σε διακριτά τμήματα - υποπροβλήματα- που μπορούν να επιλυθούν - εκτελεστούν - ταυτόχρονα. Η επίλυση του προβλήματος με τη χρήση πολλαπλών υπολογιστικών πόρων είναι αποδοτικότερη από ότι σε απλό υπολογιστή (αύξηση της ταχύτητας εκτέλεσηςspeedup, αύξηση του μεγέθους του προβλήματοςscaleup).

33 Ποια η φύση, το μέγεθος και ο αριθμός των επεξεργαστών; Απλές ALU ή πλήρεις CPU(ομογενείς ή ετερογενείς); Ενσωματωμένοι πυρήνες,διακριτοί επεξεργαστές ή συνδιασμός; 2-10 ή εκατοντάδες ως δεκάδες χιλιάδες επεξεργαστές; Ποιά η φύση, το μέγεθος και ο αριθμός των στοιχείων μνήμης; Κοινή ή κατανεμημένη μνήμη; SRAM ή DRAM; Ενσωματωμένη μνήμη ή όχι; Κρυφή μνήμη και επίπεδα κρυφής μνήμης;

34 Πώς αλληλοσυνδέονται οι επεξεργαστικές μονάδες με τα στοιχεία μνήμης; τατική Διασύνδεση, όπου όλα τα στοιχεία που απαρτίζουν την αρχιτεκτονική διασυνδέονται με ένα σταθερό τρόπο (πχ αστεροειδής διάταξη,δακτύλιος,πλέγμα) Δυναμική διασύνδεση, όπου τα στοιχεία διασυνδέονται με ένα δίκτυο μεταγωγής (switching network) το οποίο μπορεί να δρομολογεί δυναμικά τα μηνύματα μεταξύ των στοιχείων.

35 Οι τεχνολογίες του Παραλληλισμού Επιπέδου Εντολής (Instruction Level Parallelism) φαίνεται να έχουν φτάσει στο όριό τους, με την έννοια οτι οι τεχνολογικές βελτιώσεις είναι σχετικά μικρές και παρουσιάζουν μεγάλο κόστος (ILP wall). Το σχήμα που ακολουθεί συνοψίζει τις βασικές τεχνικές ILP που συναντώνται σε ένα σύγχρονο επεξεργαστή: Διοχέτευση Εντολών και Πράξεων, Πολυνηματική / Υπερβαθμωτή Εκτέλεση, Εκτέλεση εντός/εκτός σειράς, Πρόβλεψη διακλαδώσεων, Προκαταβολική Προσκόμιση και Ιεραρχία Κρυφής Μνήμης. Παρακάτω φαίνεται η μικροαρχιτεκτονική μιας CPU με αρκετά στοιχεία ILP.

36 Η μνήμη είναι μεν άφθονη αλλά η προσπέλασή της είναι πολύ πιο δαπανηρή σε σχέση με την επεξεργασία. Πρέπει να βρεθούν τρόποι ταυτόχρονης επεξεργασίας περισσοτέρων δεδομένων (Memory Wall).

37 Σαχύτητα μετάδοσης - η ταχύτητα ενός ακολουθιακού υπολογιστή εξαρτάται ευθέως από τη ταχύτητα μετάδοσης των δεδομένων στο υλικό. Απόλυτα όρια θέτουν οι ταχύτητα διάδοσης του φωτός (30 cm/nanosecond) και η ταχύτητα διάδοσης σήματος σε χαλκό (9 cm/nanosecond). Η αύξηση της ταχύτητας του επεξεργαστή απαιτεί διαρκώς πυκνότερη τοποθέτηση των κυκλωμάτων του. Όρια στη σμίκρυνση - η τεχνολογία ολοκληρωμένων κυκλωμάτων επιτρέπει διαρκώς μεγαλύτερους αριθμούς transistors ανά chip. Όμως, ακόμη και σε μοριακό ή ατομικό επίπεδο ολοκλήρωσης, υπάρχει ένα φυσικό όριο στη πυκνότητα των κυκλωμάτων και στην ενεργειακής κατανάλωση (watt/cm2). Ενεργειακοί περιορισμοί - η κατανάλωση ισχύος των επεξεργαστών βαίνει διαρκώς αυξανόμενη αναλογικά με τη συχνότητα του ρολογιού ενός επεξεργαστή, πλησιάζοντας σε δύσκολα διαχειρίσιμα όρια. τόσο για τροφοδοσία όσο και για ψύξη (Power wall).

38 Διαπιστώνουμε οτι πλέον οι 'παραδοσιακοί' τομείς είναι σχεδόν μειοψηφικοί, ενώ νέοι τομείς εμφανίζονται. Είναι πλέον φανερό οτι τόσο σε επίπεδο διακομιστών και data centers αλλά ακόμη και σε επίπεδο προσωπικών υπολογιστών η παράλληλη επεξεργασία κερδίζει συνεχώς έδαφος.

39 Προκύπτει λοιπόν το ερώτημα Τι είναι εκείνο που πρέπει να εκτελείται παράλληλα; Διακρίνουμε λοιπόν : Υπολογιστές που εκτελούν πολλές ανεξάρτητες εργασίες ταυτόχρονα (π.χ χρονομεριστικά συστήματα time sharing systems). Υπολογιστές που εκτελούν μια μοναδική εργασία η οποία αποτελείται από πολλές παράλληλες διεργασίες. Υπολογιστές όπου η παραλληλία προέρχεται από ένα υψηλό βαθμό διοχέτευσης ή από πολλές ALU που επεξεργάζονται ταυτόχρονα το ίδιο ρεύμα εντολών (διανυσματική επεξεργασία). Η διαφορά των προηγούμενων περιπτώσεων έγκειται σε αυτό που ονομάζουμε μέγεθος μονάδας διαιρετότητας (grain size). Η εκτέλεση μεγάλων ενοτήτων λογισμικού με μικρή ή καθόλου επικοινωνία ανάμεσα στις ενότητες καλείται παραλληλία μεγάλης μονάδας διαιρετότητας (coarse grained parallelism). Στην αντίθετη περίπτωση έχουμε παραλληλία μικρής μονάδας διαιρετότητας (fine grained parallelism).

40 Η οργάνωση των συστημάτων διακρίνεται σε : υστήματα ασθενούς σύζευξης (loosely coupled) όπου υπάρχει ένας περιορισμένος αριθμός μεγάλων CPU με συνδέσεις χαμηλής ταχύτητας μεταξύ των CPU. Αποτελεί συνήθως την καλύτερη επιλογή για προβλήματα μεγάλης μονάδας διαιρετότητας. υστήματα ισχυρής σύζευξης (tightly coupled) όπου οι επεξεργαστικές μονάδες είναι μικρότερες, σε μικρή απόσταση και αλληλεπιδρούν συχνά μεταξύ τους μέσω δικτύων επικοινωνίας με μεγάλο εύρος ζώνης. Αποτελεί συνήθως την καλύτερη επιλογή για προβλήματα μικρής μονάδας διαιρετότητας.

41 Πρόσφατο παρελθόν SMPs (symmetric multiprocessors) 2 4 επεξεργαστές (μονοπύρηνοι) συνηθισμένοι, μέχρι 8 επεξεργαστές σε εμπορικά συστήματα Πανάκριβα συστήματα με επεξεργαστές ελάχιστα Κοινή μνήμη ΑΛΛΑ σήμερα πλέον (Dual core / Quad core / Multicore / Manycore) τα φτηνότερα PC έχουν 1 επεξεργαστή τουλάχιστον διπύρηνο!! Διπύρηνοι αρχικά, τώρα 8πύρηνοι, 12πύρηνοι (Intel, AMD) Σ1 (Sun Niagara) ή Sun UltraSPARC T1 : 8πύρηνοι (με 4-way multithreaded πυρήνες) από τον 12/2005!

42 Manycore (πολλών πυρήνων) Μιλάμε για πολλούς πυρήνες Υπάρχει τριψήφιο νούμερο (> 64); NAI! Intel 80-πύρηνο πρωτότυπο Φεβ απλά cores 2 floating point engines /core network-on-a-chip τύπου πλέγματος 100 million transistors, >1 Teraflop peak!

43 Τα Δίκτυα-σε-Ψηφίδα (Network-on-Chip, NoC) αποτελούν μια νέα προσέγγιση του μοντέλου Σύστημα-σε-Ψηφίδα (System-on-Chip, SoC). Τα συστήματα που βασίζονται στην τεχνολογία NoC μπορούν να χειριστούν εφαρμογές με διαφορετικές συχνότητες (ρολόγια) λειτουργίας που πολλά από τα σημερινά σύνθετα SoC χρησιμοποιούν. Η λύση του NoC χρησιμοποιεί μια επικοινωνία μεθόδου δικτύωσης και προσφέρει βελτιώσεις σε σύγκριση με τα συμβατικά συστήματα SoC.

44 Τα NoC μπορούν να θεωρηθούν σαν μια ενοποιημένη επικοινωνία πολλών SoC παρά σαν μια νέα επαναστατική προσέγγιση.σημαντικό είναι να τονίσουμε ότι τα NoC και οι εφαρμογές τους στα MP-SoCs προέρχονται από δύο διαφορετικές κατευθύνσεις: Από τη μία είναι οι σχεδιαστές SoC, που είναι εξοικειωμένοι με τη σχεδίαση ad-hoc συστημάτων βασισμένα σε τεχνολογία bus και Από την άλλη αυτοί που ασχολούνται με πολυεπεξεργαστικά συστήματα από την πλευρά της υπολογιστικότητας. τις αρχιτεκτονικές τύπου NoC ο παραδοσιακός διάδρομος (bus) αντικαθίσταται από ένα δίκτυο. Η επικοινωνία δεδομένων μεταξύ των δομικών μονάδων του chip γίνεται με τη χρήση πακέτων-δεδομένων μέσα από το δίκτυο. Σο δίκτυο αποτελείται από καλώδια (wires) και δρομολογητές (routers). Οι επεξεργαστές, οι μνήμες και γενικά τα δομικά blocks (IP-blocks, Intellectual Property) συνδέονται με τους δρομολογητές.

45 Οι αλγόριθμοι δρομολόγησης παίζουν πολύ σημαντικό ρόλο στη λειτουργία του δικτύου καθώς οι δρομολογητές αποφασίζουν τον τρόπο χειρισμού των πακέτων βασισμένοι στον εκάστοτε αλγόριθμο. Πολλά από τη δικτύωση πολυεπεξεργαστών (MP-SoC) στο επίπεδο της πλακέτας, χρησιμοποιούνται στην σχεδίαση των NoCs προσαρμοσμένα στις διάφορες αρχιτεκτονικές,υπάρχουν όμως και αρκετές διαφορές. ΔΙΑΥΟΡΕ με SoCs Η σχεδίαση των SoCs στηρίζεται γύρω από τη χρήση μοιραζόμενου μέσου (shared bus) και ad-hoc σημείο-προς-σημείο συνδέσεων. Μια σημαντική διαφορά εντοπίζεται στο γεγονός ότι η πυκνότητα των καλωδίων μέσα στο chip προσφέρει πολύ μεγαλύτερες ταχύτητες από αυτή των καλωδίων έξω από το chip. Διαφορά εντοπίζεται και στο μέγεθος των καταχωρητών (buffers). Το μέγεθός τους αποτελεί έναν πολύ κρίσιμο παράγοντα στην σχεδίαση NoC καθώς καλύπτουν πολύ ωφέλιμο χώρο μέσα στην ψηφίδα και η κατανάλωση ενέργειας του συστήματος μεταβάλλεται σημαντικά ανάλογα με το μέγεθός τους.

46 Διάφοροι τύποι SoC και NoC τοπολογιών

47 Οι Προσαρμογείς Δικτύου (Network adapters) εκτελούν την κατάλληλη διασύνδεση με την οποία οι πυρήνες (IP blocks) συνδέονται στο NoC. Η λειτουργία τους είναι η σωστή σύνδεση και επικοινωνία των πυρήνων με το δίκτυο. Οι Δρομολογητές (Routing nodes) είναι υπεύθυνοι για τη σωστή δρομολόγηση των πακέτων σύμφωνα με τον εκάστοτε αλγόριθμο. Οι υνδέσεις (Links) συνδέουν τους κόμβους. Μπορεί να αποτελούνται από ένα ή και περισσότερα λογικά ή φυσικά κανάλια. Οι πυρήνες (cores) αποτελούν τις λειτουργικές μονάδες του NoC. Κάθε πυρήνας να είναι επεξεργαστής, μνήμη, DSP, αποκωδικοποιητής κτλ.

48 Σο παραπάνω σχήμα δείχνει ένα παράδειγμα ενός 4*4 NoC,το οποίο παρέχει μια καθολική επικοινωνία στο chip. Αντί για διαδρόμους (busses) και δεδομένες ζεύξεις σημείου προς σημείο, έχει χρησιμοποιηθεί μια πιο γενική διάταξη η οποία χρησιμοποιεί ένα πλέγμα από δρομολογητές διασκορπισμένους μέσα στο chip οι οποίοι συνδέονται με καλώδια.

49 for (i = 0; i < k; i = i+1) c[i] = a[i]+b[i]; Εφαρμογές (grand challenges) συμπεριφορά σωματιδίων (π.χ. δυναμική των μορίων) μελέτη των κυμάτων των ωκεανών και πρόβλεψη καιρού σεισμικά μοντέλα σχεδιασμός VLSI κυκλωμάτων με τη βοήθεια του υπολογιστή (CAD) εξέλιξη των γαλαξιών. Ο παραλληλισμός επηρεάζει το σύνολο ενός υπολογιστικού σύστήματος: έχουμε παράλληλες αρχιτεκτονικές, λειτουργικά συστήματα / συστήματα εκτέλεσης που υποστηρίζουν τον παραλληλισμό, παράλληλες γλώσσες / βιβλιοθήκες προγραμματισμού, παράλληλους αλγορίθμους και μεθοδολογίες ανάπτυξης λογισμικού και εφαρμογών. Όμως ενώ τα ακολουθιακά αντίστοιχα είναι σχετικά καλά ορισμένα, οι παράλληλες εκδοχές επιτρέπουν αρκετούς βαθμούς ελευθερίας και συνακόλουθα εναλλακτικές προσεγγίσεις. Η υιοθέτηση ή μη μιας προσέγγισης δεν είναι μόνο θέμα ορθότητας αλλά και τεχνολογικής συγκυρίας.

50 Φρήση πολλών υπολογιστών ή επεξεργαστών για την επίλυση ενός προβλήματος. Οι κύριοι λόγοι χρήσης της παράλληλης επεξεργασίας είναι: Μείωση του χρόνου εκτέλεσης (και χρημάτων, αν δεχτούμε οτι "ο χρόνος είναι χρήμα") Επίλυση μεγαλυτέρων προβλημάτων (δες π.χ. το Αμερικανικό Grand Challenge και αντίστοιχες Ευρωπαικές δράσεις) Επεξεργασία του συνεχώς αυξανόμενου όγκου δεδομένων που παράγει το Διαδίκτυο Παροχή ταυτόχρονης (concurrent) πρόσβασης σε ακριβούς πόρους, ίσως και μέσω εικονικοποίησης (Virualization) Μερικοί άλλοι λόγοι: Χρήση απομακρυσμένων πόρων μέσω τοπικών δικτύων και Διαδικτύου. Μείωση κόστους, χρήση πολλών "φθηνών" πόρων αντί λίγων ακριβών (πχ υπερ-υπολογιστών). Κατανομή δεδομένων σε πολλούς υπολογιστές ώστε να ξεπεραστούν περιορισμοί στο μέγεθος της μνήμης.

51 Η Intel το 2007 επέδειξε την τεχνογνωσία της παρουσιάζοντας μια CPU με 80 πυρήνες. Μόνο που αυτή η 80-πύρηνη CPU δεν έχει καμία απολύτως συμβατότητα με τα υπάρχοντα Λειτουργικά Συστήματα, ακολούθως και με τα προγράμματα που «τρέχουν» σε αυτά, χώρια που η ίδια η Intel είχε πει πως «έχουμε χρόνια ακόμα μπροστά μας, μέχρι να χρησιμοποιηθεί μια τέτοια CPU» συνεπώς η 80-πύρηνη CPU της Intel παρουσιάστηκε μόνο για το «παιχνίδι επίδειξης τεχνογνωσίας» και τίποτα άλλο. Κάπου εδώ είναι που κάνει την διαφορά η «Tilera» με τους «Tile Gx» επεξεργαστές (που θα έχουν μοντέλα των 16, 36, 64 και 100 πυρήνων) διότι μπορούν να τοποθετηθούν ως συν-επεξεργαστές σε υπολογιστές με CPU Intel / AMD αλλά δύνανται να τοποθετηθούν και σκέτοι, αυτόνομοι, κάτι που συνεπάγεται ότι είναι «συμβατοί» με την υπάρχουσα τεχνολογία λογισμικού, όπερ εστί άμεσα αξιποιήσιμοι και όχι σε «κάποιο μελλοντικό έτος».

52 ο Tile Gx100 «τρέχει» στα 1.5GHz καταναλώνοντας μόνο 55 watt, την στιγμή που οι CPU της Intel με 2 και 4 πυρήνες καταναλώνουν τουλάχιστον watt. Μάλιστα ο «μικρός» επεξεργαστής Tile Gx των 16 πυρήνων αγγίζει μετά βίας τα 5 watt σε κατανάλωση (πέσαμε δηλαδή στα επίπεδα κατανάλωσης των μικρών και φορητών συσκευών).

53 Κόμβος (Node) Ένας αυτόνομος υπολογιστής (που θα μπορούσε να λειτουργήσει αυτόνομα, αν δεν ανήκε σε ένα παράλληλο σύστημα). Συνήθως περιέχει πολλαπλούς πυρήνες ή συνεπεξεργαστές (GPUs). Κεντρική Μονάδα Επεξεργασίας (Central Processing Unit, CPU) / Πυρήνας (Core) Μέχρι πριν μερικά χρόνια η CPU είχε τη μορφή που ορίζεται στο Μοντέλο Von Neuman (SISD), με τις εσωτερικές επεκτάσεις των τεχνολογιών Παραλληλισμού Επιπέδου Εντολής (Instruction Level Parallelism), που παρουσιάστηκαν σύντομα παραπάνω. Όμως πλέον η CPU έχει ταυτιστεί με την έννοια του Πυρήνα (Core), ενώ ένα ολοκληρωμένο κύκλωμα CPU πλέον περιλαμβλανει 4, 6 ή και παραπάνω Πυρήνες (άρα πλήρεις CPUs). Αυτές διασυνδέονται με εσωτερικό δίαυλο και μοιράζονται τα υψηλότερα επίπεδα της Ιεραχίας Κρυφής Μνήμης. Κάθε Κόμβος (Node) ενός Παράλληλου συστήματος συνήθως περιέχει 1 ή περισσότερα ολοκληρωμένα κυκλώματα CPUs, άρα αρκετούς Πυρήνες.

54 Η παραπάνω εικόνα που απεικονίζει μια τυπική συστοιχία με πολυπύρηνους κόμβους.

55 Μονάδα Επεξεργασίας (Processing Unit, PU) Ένας συνδυασμός ALU και Τοπικής Μνήμης. Συνήθως χρησιμοποιείται σε συστήματα SIMD όπου μια μεγάλη ομάδα PEs ελέγχονται από μια Μονάδα Ελέγχουυ και εκτελούν τους ίδιους υπολογισμούς σε διαφορετικά δεδομένα. Τυπικό παράδειγμα οι επεξεργαστές των GPUs. Μονάδα Επεξεργασίας Γραφικών (Graphics Processing Unit, GPU) Συν-επεξεργαστές τύπου SIMD που διαθέτουν αρκετές εκατοντάδες PUs οργανωμένα σε ομάδες (blocks) με κοινή μνήμη. Τα PUs μπορούν να προσπελάσουν τα δεδομένα στη μνήμη τους σε μορφή ανύσματος ή πολυδιάστατου πίνακα. Οι GPUs επιτυγχάνουν εντυπωσιακές αποδόσεις στην ομαλή (χωρίς σημαντικές διακλαδώσεις ή πρόσβαση σε ανώτερα επίπεδα της ιεραρχίας μνήμης) επεξεργασία μεγάλου όγκου πινακοποιημενων δεδομένων. Χρησιμοποιούνται ως συνεπεξεργαστές σε σύγχρονα υβριδικά παράλληλα συστήματα.

56 Διάγραμμα μιας τυπικής GPU

57 Διάγραμμα ενός block PUs

58 Δίκτυο Διασύνδεσης (Interconnection Network) Tα εξαρτήματα του παράλληλου υπολογιστή που είναι υπεύθυνα για την υλοποίηση της επικοινωνίας μεταξύ επεξεργαστών ή επεξεργαστών και μνήμης ή ολόκληρων υπολογιστών. Το δίκτυο διασύνδεσης συνήθως μπορεί να είναι ένας απλός δίαυλος (bus) ή μια τυπική υποδομή τοπικού δικτύου. Όμως σε μεγαλύτερα παράλληλα συστήματα το δίκτυο διασύνδεσης είναι αρκετά περίπλοκες κατασκευές όπως crossbar switches, διακοπτικά συστήματα πολλαπλών σταδίων, πλέγματα, δακτύλιοι, δένδρα, υπερκύβοι διαφόρων διαστάσεων κλπ. Εργασία (Task) Μια λογικά διακριτή ενότητα υπολοιστικής εργασίας η που εκτελείται από ένα επεξεργαστή. Λογικά εμφανίζεται ως πρόγραμμα, υποπρόγραμμα (sub-routine), διαδικασία (procedure), συνάρτηση (function) ή μέθοδος (method). Συνήθως υλοποιείται σαν διεργασία (process) ή νήμα (thread) Παράλληλη Εργασία (Parallel Task) Μια εργασία γραμμένη έτσι ώστε να μπορεί να εκτελεστεί ορθά από πολλαπλούς επεξεργαστές ειραική - Ακολουθιακή Εκτέλεση (Serial - Sequential Execution) Συμβατική εκτέλεση ενός προγράμματος, μια εντολή κάθε φορά, όπως συμβαίνει σε συστήματα ενός επεξεργαστή (δε λαμβάνεται υπ' όψη ο Παραλληλισμός Επιπέδου Εντολής, ILP). Όμως, σχεδόν όλα τα παράλληλα προγράμματα έχουν κάποιο τμήμα που απαιτεί ακολουθιακή εκτέλεση

59 υγχρονισμός (Synchronization) Συντονισμός της εκτέλεσης των (ασύγχρονων) παραλλήλων εργασιών σε πραγματικό χρόνο, που συνήθως επιτυγχάνεται μέσω επικοινωνίας (αρχιτεκτονικές MIMD). Συνήθως η κάθε παράλληλη εργασία περιέχει στο κώδικά της δομές συγχρονισμού, οι οποίες απαιτούν την επικοινωνία με άλλες εργασίες πριν η εργασία συνεχίσει την εκτέλεσή της. Ο συχγρονισμός υπονοεί οτι τουλάχιστο μια εργασία θα αναμένει, άρα ο αντίστοιχος επεξεργαστής θα είναι άεργος. Στις αρχιτεκτονικές SIMD η εκτέλεση των εντολών στις μονάδες επεξεργασίας είναι εξ' ορισμού σύγχρονη. Μαζικά Παράλληλος Επεξεργαστής (Massively Parallel Processor) Αναφέρεται σε ειδικά παράλληλα συστήματα με πολύ μεγάλο αριθμό επεξεργαστών - για τη συγκεκριμένη τεχνολογία (συντομογραφία ΜPP). Συνήθως εννοούμε χιλιάδες επεξεργαστές. Τα δικτυα διασύνδεσης των MPPs προφανώς δεν μπορεί να είναι ούτε συμβατικοί δίαυλοι ούτε και τοπικά δίκτυα διαχωρισμός από συστοιχίες, clusters). Συνήθως χρησιμοποιούνται ιεραρχικά συνδεδεμένα συστήματα μεταγωγής ή ειδικά διασυνδετικά δίκτυα.

60 υνηθισμένο μέτρο σύγκρισης της απόδοσης παράλληλων υπολογιστών. Σο μέτρο προκύπτει ως μέσος όρος εκτέλεσης μιας συγκεκριμένης ομάδας μετρο-προγραμμάτων (benchmarks) και αποτελεί το βασικό κριτήριο κατάταξης στο Top500.

61 Τα υπολογιστικά συστήματα μπορούν να ταξινομηθούν με βάση διαφορετικά κριτήρια. Για παράδειγμα Ταξινόμηση Flynn (1966) : βασίζεται στον αριθμό εντολών και τον αριθμό δεδομένων. Αρχιτεκτονική μνήμης : βασίζεται στο αν η μνήμη είναι κοινή ή κατανεμημέμη Με βάση την διασύνδεση των υπολογιστών την τοπολογία του δικτύου ΠΡΟΟΦΗ!!! Σα περισσότερα σύγχρονα παράλληλα υπολογιστικά συστήματα έχουν υβριδική αρχιτεκτονική

62 Καθώς οι υπολογιστές εκτελούν εντολές πάνω σε δεδομένα το πλήθος των εντολών και των δεδομένων που μπορεί να διαχειριστεί ένας υπολογιστής σε μια δεδομένη χρονική στιγμή, αποτελεί βασικό χαρακτηριστικό του υπολογιστή αυτού. Η ταξινόμηση των υπολογιστών ανάλογα με το πόσες διαφορετικές ακολουθίες εντολών (instruction streams) εκτελούνται ταυτόχρονα σε πόσες ακολουθίες δεδομένων (data streams) προτάθηκε το 1972 από τον Michael Fylnn και έχει κυριαρχήσει σήμερα. ΠΡΟΟΦΗ!!! Η ταξινόμηση Fylnn μπορεί να αναφέρεται τόσο στο hardware όσο και στο software. Η ταξινόμηση Flynn διακρίνει τους παράλληλους υπολογιστές με βάση δύο κριτήρια (διαστάσεις), τη πολλαπλότητα Εντολών (Instruction) και Δεδομένων (Data). Κάθε διάσταση μπορεί να λάβει δύο τιμές: Απλός (Single) ή Πολλαπλός (Multiple).

63 Έτσι οι υπολογιστές ανήκουν σε μια από τις παρακάτω τέσσερεις κατηγορίες : SISD: Single Instruction Single Data(Ενιαίες εντολές Ενιαία δεδομένα) SIMD : Single Instruction Multiple Data(Ενιαίες εντολές Πολλαπλά δεδομένα) MISD : Multiple Instruction Single Data(Πολλαπλές εντολές Ενιαία δεδομένα) MIMD : Multiple Instruction Multiple Data(Πολλαπλές εντολές Πολλαπλά δεδομένα)

64 Αρχιτεκτονική von Neumann : Ο (μοναδικός) υπολογιστής εκτελεί σειριακά (μια-μια) τις εντολές Τόσο τα δεδομένα όσο και οι εντολές φορτώνονται στην μνήμη. Control Instruction Processor Data Memory Βελτίωση της Υπολογιστικής Ισχύος με : Αύξηση της ταχύτητας του υπολογιστή Βελτίωση του χρόνου πρόσβασης στη μνήμη υμφόρηση δεδομένων (bottleneck) Η ταχύτητα εκτέλεσης του κώδικα εξαρτάται από τον ρυθμό μεταφοράς των δεδομένων από την μνήμη στον επεξεργαστή.

65 Ο τυπικός σειραικός (μη-παράλληλος) υπολογιστής Απλή εντολή: μόνο μια ροή εντολών εκτελείται από τη CPU σε κάθε χρονική στιγμή (δε λαμβάνεται υπ' όψη ο Παραλληλισμός Επιπέδου Εντολής, ILP) Απλό δεδομένο: μόνο μια ροή δεδομένων υφίσταται επεξεργασία σε κάθε χρονική στιγμή Προσδιοριστική (Deterministic) εκτέλεση Το παλαιότερο και, μέχρι πρόσφατα, το επικρατέστερο μοντέλο Παραδείγματα: τα περισσότερα PCs, σταθμοί εργασίας και κεντρικοί υπολογιστές

66 Ο υπολογιστής τύπου SISD εκτελεί μία μόνο εντολή κάθε χρονική στιγμή σε ένα δεδομένο. Όπως φαίνεται και στο διπλανό σχήμα το μοντέλο αυτό είναι ο κλασικός επεξεργαστής (πχ Pentium IV). (CU=Control Unit, PU=Processing Unit, M=Μνήμη, IS=Instruction Stream, DS=Data Stream, I/O=Input/Ouput). Υπάρχει μια μονάδα ελέγχου (CU) η οποία δέχεται εντολές και εξυπηρετεί την είσοδο και την έξοδο. Η εντολή που δίνεται από τη μονάδα ελέγχου πηγαίνει στην μονάδα επεξεργασίας (PU) όπου και εκτελείται. Η μονάδα επεξεργασίας χρησιμοποιεί δεδομένα από τη μνήμη (MU) η οποία παρέχει επίσης εντολές στην μονάδα ελέγχου

67 Στον υπολογιστή τύπου SIMD υπάρχουν πολλές επεξεργαστικές μονάδες που λέγονται και επεξεργαστικά στοιχεία (PE) τα οποία όμως εκτελούν την ίδια εντολή. Η εντολή προέρχεται από την μοναδική μονάδα ελέγχου (CU) που υπάρχει στο σύστημα. Κάθε επεξεργαστική μονάδα έχει κάποια τοπική μνήμη (LM) απ όπου αντλεί τα δεδομένα πάνω στα οποία θα εκτελεστεί η εν λόγω εντολή. Ένας υπολογιστής τύπου SIMD είναι συνήθως προσκολλημένος σε ένα κύριο υπολογιστή (πχ ένα Unix Workstation, ένα PC ), ο οποίος στέλνει εντολές για να εκτελεστούν από τον SIMFD υπολογιστή. Έτσι οι υπολογιστές αυτού του τύπου είναι αρκετά απλοί στο λογισμικό αφού δεν υπάρχει πχ λειτουργικό σύστημα, σπανίως χειρίζονται την είσοδο και την έξοδο(κάτι που είναι δουλειά του κεντρικού υπολογιστή). Συνήθως οι υπολογιστές αυτοί είναι κάποιου είδους επιταχυντές,δηλαδή είναι ειδικευμένοι να εκτελούν γρήγορα κάποιες ειδικές λειτουργίες που χρειάζονται σε κάποιες ειδικές εφαρμογές. Για παράδειγμα, κάποιοι αλγόριθμοι επεξεργασίας εικόνας, όπως η συνέλιξη ή ο μετασχηματισμός Fourier μπορούν να υλοποιηθούν εύκολα σε τέτοιου είδους υπολογιστή.

68

69 Συνήθως υπάρχει μια κεντρική μονάδα ελέγχου (CU), πολλαπλές μονάδες επεξεργασίας (PUs) σχετικά μικρής ισχύος που συνδέονται με τη μνήμη και μεταξύ τους με εσωτερικό δίκτυο διασύνδεσης Δύο βασικές εκδοχές: Επεξεργαστές Πινάκων (Array Processors) και Ανυσματικοί Επεξεργαστές (Vector Processors) Απλή εντολή: όλες οι μονάδες επεξεργασίας (Processing Units, PUs) εκτελούν την ίδια εντολή σε κάθε χρονική στιγμή Πολλαπλά δεδομένα: κάθε PU επεξεργάζεται διαφορετική ροή δεδομένων Σύγχρονη (κεντρικά συγχρονιζόμενη) και προσδιοριστική εκτέλεση Συστήματα ειδικού σκοπού (και συν-επεξεργαστές) για προβλήματα με μεγάλο βαθμό κανονικότητας (πχ επεξεργασία εικόνας, πράξεις πινάκων). Πρόκειται για εξειδικευμένη μορφή παραλληλισμού, η οποία βασίζεται κυρίως σε επεμβάσεις στο υλικό και την αρχιτεκτονική. Επίσης μπορεί να ειδωθεί ως ειδική περίπτωση της κατηγορίας MIMD. Βρίσκει σημαντικές εφαρμογές στην επαναλαμβανόμενη 'ομαλή' επεξεργασία πινακοποιημένων δεδομένων (συμβολοσειρές, εικόνες, αλφαριθμητικά, βιολογικά δεδομένα) καθώς και ροών δεδομένων (ήχος, πακέτα δικτύου, σήμα, video). Οι Μονάδες Επξεργασίας Γραφικών (Graphic Processing Units, GPUs) είναι το πιο πετυχημένο παράδειγμα SIMD αρχιτεκτονικής σήμερα. Παρακάτω φαίνεται ένα τέτοιο παράδειγμα.

70 Όλοι οι επεξεργαστές εκτελούν την ίδια εντολή χρησιμοποιώντας διαφορετικά σύνολα δεδομένων. Όλοι οι επεξεργαστές είναι συγχρονισμένοι στο ίδιο σημείο εκτέλεσης. Οι εντολές δίνονται στους επεξεργαστές από έναν επεξεργαστή ελέγχου (συνήθως ο master node). Μπορεί να είναι τύπου «κατανεμημένης» (distributed) ή «μοιρασμένης» (shared) μνήμης.

71 Μονάδα ελέγχου: ισχυρή Προσκόμιση εντολών μετάδοση προς όλα τα ΕΣ εκτέλεση βαθμωτών πράξεων & ελέγχων Επεξεργαστικά Στοιχεία: Απλά, μόνο αριθμητικές / λογικές πράξεις Όχι αυτόνομοι (back-end -> front-end)

72 Πρωτοπόρα συστήματα ( 70 & 80) Ακριβοί οι αυτόνομοι επεξεργαστές Κυρίως ερευνητικά, εξειδικευμένα μηχανήματα Illiac IV Επηρέασαν τα κατοπινά συστήματα «επεξεργαστές πίνακα» (array processors) Πλέον μόνο για ειδικού σκοπού συστήματα (π.χ. systolic arrays)! Επανεμφάνιση ως: SWAR (SIMD-Within-A-Register: MMX, SSE, κλπ) GPUs

73 Το μοντέλο αυτό προσομοιάζει τη λειτουργία pipeline. Υπάρχει μια σειρά από επεξεργαστικές μονάδες όπου η κάθε μια έχει τον δικό της ελεγκτή και επομένως εκτελεί εν γένει διαφορετική εντολή από τις άλλες. Η διαφορά από το μοντέλο MIMD είναι ότι η ακολουθία δεδομένων είναι μία. Τα δεδομένα πηγάζουν απί την κύρια μνήμη, όπου τα επεξεργάζεται η πρώτη μονάδα επεξεργασίας, το αποτέλεσμα της πράξης παραδίδεται στη μονάδα 2, αυτή κατόπιν παραδίδει στη μονάδα 3 κοκ.

74 Μια ροή δεδομένων τροφοδοτεί πολλαπλές PUs Κάθε PU επεξεργάζεται τα δεδομένα ανεξάρτητα μέσω ανεξάτρητων ροών εντολών Ελάχιστα πρακτικά παραδείγματα, όπως ο πειραματικός υπολογιστήc.mmp του πανεπιστημίου Carnegie-Mellon C.mmp (1971) Μερικές πιθανές χρήσεις: πολλαπλά φίλτρα συχνοτήτων που επενεργούν σε ένα σήμα πολλαπλοί αλγόριθμοι κρυπτογραφίας που επενεργούν σε ένα κρυπτογραφημένο κείμενο Δεν υπάρχουν πολλοί τέτοιου τύπου υπολογιστές, γιατί οι SIMD και MIMD αρχιτεκτονικές επιτρέπουν καλύτερη διαχείριση μνήμης και λιγότερη επικοινωνία μεταξύ επεξεργαστών.

75 Ο πλέον διαδεδομένος τύπος παράλληλου υπολογιστή. Σταδιακά, με την έλευση των πολυ-πύρηνων συστημάτων, τείνει να καταστεί ο πλέον διαδεδομένος τύπος υπολογιστή. Συνήθως υπάρχουν πολλαπλούς επεξεργαστές (CPUs) που συνδέονται μεταξύ τους είτε με δίαυλο και μοιραζόμενη μνήμη είτε με εσωτερικό δίκτυο και κατανεμημένη μνήμη είτε πρόκειται για κοινούς υπολογιστές συνδεδεμένους μέσω δικτύου. Δύο βασικές εκδοχές: Μοιραζόμενης Μνήμης ή Πολυ-επεξεργαστές (Shared Memory, Multi-processors) και Κατανεμημένης Μνήμης ή Πολυ-υπολογιστές (Distributed Memory, Multi-computers) Πολλαπλές εντολές: κάθε CPU μπορεί να εκτελεί διαφορετική ροή εντολών ή διαφορετική εντολή από την ίδια ροή εντολών Πολλαπλά δεδομένα: κάθε CPU μπορεί να επεξεργάζεται διαφορετική ροή δεδομένων ή διαφορετικό δεδομένο από την ίδια ροή.

76 Η εκτέλεση συνήθως είναι ασύγχρονη (ένα ρολόι ανά επεξεργαστή) και ίσως μη-προσδιοριστική (αν δεν προβλεφθεί επαρκής συντονισμός) Η συντριπτική πλειονότητα των παράλληλων συστημάτων εμπίπτει σε αυτή τη κατηγορία, με την οποία ασχολούμαστε στο υπόλοιπο κείμενο. Διαγράμματα και παραδείγματα θα δούμε στις επόμενες ενότητες Παραδείγματα: Αρχιτεκτονικές Μοιραζόμενης Μνήμης (Shared Memory): Πολυπύρηνα συστήματα (Multi-core), Συμμετρικοί Πολυ-Επεξεργαστές (Symmetric Multi-Processors) Αρχιτεκτονικές Κατανεμημένης Μνήμης (Distributed Memory): Networks of Workstations (NOWs), Συστοιχίες (Clusters), Κατανεμημένοι Υπολογιστές (τύπου BOINC). Τβριδικά υστήματα: Αποτελούν τη μεγάλη πλειοψηφία των σύγχρονων υπερυπολογιστών και συνδυάζουν τις παραπάνω κατηγορίες.

77 τα παραπάνω σχήματα φαίνεται η διάταξη ενός υπολογιστή τύπου MIMD

78 Υπάρχουν πολλές μονάδες ελέγχου οι οποίες εν γένει εκδίδουν διαφορετικές εντολές και υπάρχουν πολλές μονάδες επεξεργασίας (μια για κάθε μονάδα ελέγχου). Οι επεξεργαστικές μονάδες είτε επικοινωνούν μέσα από μια κοινή μνήμη είτε διαθέτουν τοπικές μνήμες οπότε επικοινωνούν μεταξύ τους μέσω κάποιου δικτύου διασύνδεσης. Έτσι το μοντέλο αυτό μοιάζει με πολλούς υπολογιστές οι οποίοι λειτουργούν εν μέρει ανεξάρτητα μεταξύ τους αλλά συνεργάζονται για τη λύση του ίδιου προβλήματος μέσω κάποιου δικτύου επικοινωνίας.

79 Τα μοντέλα SIMD και MIMD είναι τα βασικά παράλληλα μοντέλα. Το μοντέλο MISD δεν έχει μέχρι στιγμής υλοποιηθεί στην πράξη ως αυτόνομος και ολοκληρωμένος υπολογιστής. Στην αρχή της ιστορίας των παράλληλων υπολογιστών το μοντέλο SIMD μελετήθηκε πιο εκτενώς γιατί είναι και το απλούστερο. Δεν υπάρχει υπολογιστής στο εμπόριο ο οποίος να ακολουθεί αυτό το μοντέλο. Η φιλοσοφία του pipeline ωστόσο που κυριαρχεί στο MISD,χρησιμοποιείται και μάλιστα πολύ συχνά, σε συγκεκριμένες υπομονάδες μέσα σε επεξεργαστές. Έτσι έχουμε, πχ το pipeline εντολών, το pipeline της μονάδας κινητής υποδιαστολής (Floating Point Unit) κτλπ Οι επεξεργαστές τύπου MIMD είναι οι πιο γενικού σκοπού και μπορούν να σταθούν μόνοι τους σαν αυτόνομοι υπολογιστές σε αντίθεση με τους υπολογιστές τύπου SIMD οι οποίοι πρέπει να είναι συνδεδεμένοι με κάποιο κεντρικό υπολογιστή. Στο μοντέλο MIMD εντάσσονται και τα clusters καθώς αποτελούνται ουσιαστικά από πολλές μονάδες τύπου SISD συνδεδεμένες στο δίκτυο.

80 1. Οι μηχανές MIMD προσφέρουν ευελιξία,δηλαδή μπορούν είτε να χρησιμοποιηθούν σαν υπολογιστές ενός χρήστη όπου δίνεται η δυνατότητα επιτάχυνσης των εφαρμογών είτε σαν πολυπρογραμμαριζόμενες μηχανές όπου εκτελούνται πολλές εργασίες (tasks) ταυτόχρονα. 2. Οι μηχανές MIMD μπορούν να χτιστούν χρησιμοποιώντας κοινούς επεξεργαστές όπως ο Intel Pentium.Οι περισσότεροι παράλληλοι υπολογιστές τύπου MIMD που υπάρχουν σήμερα στην αγορά χρησιμοποιούν τέτοιου τύπου επεξεργαστές.

81 Ο τύπος υπολογισμού MIMD είναι το πιο σημαντικό υπολογιστικό μοντέλο παράλληλης επεξεργασίας. Για το λόγο αυτό αναφέρω αυτή την ενότητα. Οι μηχανές MIMD ταξινομούνται βασικά σε δύο αρχιτεκτονικές κλάσεις με βάση την οργάνωση της μνήμης. Έτσι έχουμε : 1. Τους υπολογιστές με κοινή μνήμη (shared memory) οι οποίοι καλούνται και πολυεπεξεργαστές (multiprocessors) και 2. Τους υπολογιστές με κατανεμημένη μνήμη(distributed memory) οι οποίοι καλούνται και πολυυπολογιστές (multicomputers).

82 Στα συστήματα πολυεπεξεργαστών (multiprocessor) όλες οι CPU μοιράζονται μια κοινή φυσική μνήμη (συστήματα μοιραζόμενης μνήμης shared memory systems) Σχετικά μικρός αριθμός CPU (Nprocs< 64) Εύκολος προγραμματισμός

83 το παραπάνω σχήμα παρουσιάζεται η δομή ενός πολυεπεξεργαστή με κοινή μνήμη.

84 Πλεονεκτήματα Ο καθολικός χώρος φυσικών διευθύνσεων επιτρέπει ένα μοντέλο προγραμματισμού φιλικό προς το χρήστη, αφού είναι παρόμοιο με αυτό του ακολουθιακού προγραμματισμού Η επικοινωνία και ο συγχρονισμός είναι εύκολα και γρήγορα λόγω της μοιραζόμενης μνήμης και μέ χρήση προγραμματιστικών τεχνικών του Συντρέχοντος (Concurrent) προγραμματισμού. Μειονεκτήματα Κύριο μειονέκτημα είναι η έλλειψη κλιμάκωσης στον αριθμό επεξεργαστών. Η πρόσθεση CPUs αυξάνει ταχύτατα τη κυκλοφορία στο δίαυλο της μνήμης, καθώς επίσης και τη κίνηση που σχετίζεται με τη συνοχή κρυφής μνήμης. Η προσπάθεια να παρακαμφθεί το πρόβλημα της κλιμάκωσης με τη χρήση ειδικού υλικού, πχ μνήμη μεγάλου εύρους ζώνης ή ειδικοί δίαυλοι και διασυνδετικά δίκτυα, αυξάνει σημαντικά το κόστος και δυσκολεύει την συντήρηση/αναβάθμιση του συστήματος. Ο προγραμματιστής πρέπει να χρησιμοποιήσει με επιτυχία τεχνικές συντρέχοντος (Concurrent) προγραμματισμού.

85 Οι συνηθέστεροι πολυ-επεξεργαστές μέχρι πρόσφατα ήταν οι Συμμετρικοί Πολυ-Επεξεργαστές (Symmetric Multi-Processors, SMPs). Σταδιακά αντικαθίστανται από (ή αποτελούνται από) Πολυ-Πύρηνους (Multi-Core) Επεξεργαστές οι οποίοι από πλευράς προγραμματισμού είναι πολυεπεξεργαστές σε σμίκρυνση. Και στις δύο παραπάνω κατηγορίες οι επεξεργαστές του συστήματος είναι πανομοιότυποι (εξ' ου και "συμμετρικοί"). Επίσης όλοι οι επεξεργαστές έχουν ίσους χρόνους προσπέλασης στη μοιραζόμενη μνήμη (Ομοιόρφη Προσπέλαση Μνήμης, Uniform Memory Access, UMA). Υποστηρίζεται Cache Coherency (CC) γι' αυτό ονομάζονται και CC-UMA. Το ένα SMP έχει δυνατότητα προσπέλασης στη μνήμη του άλλου αλλά ο χρόνος προσπέλασης της απομακρυσμένης μνήμης δεν είναι ίσος με αυτό της τοπικής του μνήμης (Ανομοιόρφη Προσπέλαση Μνήμης, Non- Uniform Memory Access, NUMA). Μπορεί να υποστηρίζεται cache cohernecy ή οχι. SMPs (Symmetric Multiprocessors, υμμετρικοί πολυεπεξεργαστές) πχ Dual / Quad Pentiums Πολυ-νηματικοί (Multi-threaded) επεξεργαστές

86

87 Στα σύγχρονα πολυπύρηνα συστήματα, σε κάθε CPU (core) εννοείται η ύπαρξη μνήμης Cache, με στόχο την απρόσκοπτη τροφοδοσία της CPU με δεδομένα και τη μείωση της κυκλοφορίας στο δαυλο μνήμης. O όρος συνοχή κρυφής μνήμης σημαίνει οτι όταν ένας επεξεργαστής ενημερώνει μια θέση της κρυφής του μνήμης, τότε όλοι οι άλλοι επεξεργαστές - και η κύρια μνήμη - ενημεώνονται έγκαιρα γι' αυτή τη τροποποίηση. Για τα συστήματα Shared memory UMA η συνοχή κρυφής μνήμης είναι δεδομένη και επιτυγχάνεται σε επίπεδο υλικού, διαφανώς για το προγραμματιστή. Υπάρχουν δύο βασικο αλγόριθμοι. O write-through αλγόριθμος Snooping Cache, ο οποίος είναι απλός αλλά δαπανηρός, ειδικά όσο ο αριθμός των CPUs αυξάνει. O write-back αλγόριθμος MESI (Modified, Exclusive, Shared, Invalid) είναι ο πιο δημοφιλής αλγόριθμος. Για τα συστήματα Shared Memory NUMA η συνοχή κρυφής μνήμης δεν είναι δεδομένη, αλλά σταδιακά γίνεται απαραίτητη. Το πιο συνηθισμένο πρωτόκολλο στηρίζεται σε καταλόγους (Directory Based).

88 Δι-πύρηνοι ή πολυ-πύρηνοι επεξεργαστές: δύο ή περισσότεροι επεξεργαστές στο ίδιο 'πακέτο'. Σχετικά παλιά ιδέα (transputer, wafer scale integration) αλλά τεχνικά και επιχειρηματικά προβλήματα. Αρχικά ιδιαίτερη L1 cache (μέσα στο chip), αλλά όλοι έχουν κοινή L2 cache έξω από το chip. Δεύτερη γενιά με ιδιαίτερες L1 και L2 cache. Συνδυασμός με πολυ-νηματική επεξαργασία (hyperthreading). Intel core duo, core 2 duo, Pentium και Xeon. AMD dual core Opteron και Athlon και FX-6x. 2006: Η παιγνιδομηχανή Xbox 360 επεξεργαστής PowerPC με τρείς πυρήνες. Η παιγνιδομηχανή PlayStation 3 -- επεξεργαστής με 9 πυρήνες.

89 Στα συστήματα πολυυπολογιστών (multicomputer) κάθε CPU έχει τη δική της ιδιωτική μνήμη (συστήματα κατανεμημένης μνήμης distributed memory systems). Σχετικά μεγάλος εώς πολύ μεγάλος αριθμός CPU. Μπορούμε να χρησιμοποιήσουμε πολλές χιλιάδες επεξεργαστών. Ο μόνος τρόπος για να φτάσουμε σε ισχύς Pflops. Δυσκολότερος προγραμματισμός.

90 το παραπάνω σχήμα παρουσιάζεται η δομή ενός πολυυπολογιστή με κατανεμημένη μνήμη

91 Πλεονεκτήματα Ο αριθμός των επεξεργαστών και το μέγεθος της μνήμης κλιμακώνονται σχετικά εύκολα. Ο κάθε επεξεργαστής έχει τοπική μνήμη στην οποία έχει απρόσκοπτη και ταχεία πρόσβαση, χωρίς επιβαρύνσεις διαμοιρασμού και συνοχής κρυφής μνήμης. Σε αυτό το επίπεδο ο προγραμματισμός μοιάζει με τον συμβατικό. Μπορούμε να χρησιμοποιήσουμε συμβατικούς υπολογιστές και τεχνολογίες δικτύου, περιορίζοντας δραματικά το κόστος κατασκευής, συντήρησης και αναβάθμισης του παράλληλου συστήματος. Μειονεκτήματα Το μοντέλο προγραμματισμού για την επικοινωνία δεδομένων και τον συγχρονισμό είναι αρκετά σύνθετο, απαιτείται ρητός προγραμματισμός αρκετών λεπτομερειών. Είναι δύσκολη η απεικόνιση σύνθετων δομών δεδομένων σε κατανεμημένη μνήμη, ιδίως όταν οι εφαρμογές απαιτούν καθολική επικοινωνία μεταξύ δεδομένων σε διάφορα στάδια του προγράμματος. Μπορεί να απαιτηθούν σημαντικές μετακινήσεις δεδομένων. Οι χρόνοι προσπέλασης στη μνήμη δεν είναι ομοιόμορφοι. Ο λόγος υπολογισμού προς επικοινωνία επιβάλλει συνήθως αδρομερή παραλληλισμό, επομένως η κλιμάκωση μπορεί να επιτευχθεί μόνο με μεγάλα μεγέθη δεδομένω και για εφαρμογές που απαιτούν σχετικά περιορισμένη επικοινωνία.

92 Από αρχιτεκτονική άποψη, αν το κόστος επικοινωνίας δεν είναι πολύ μεγαλύτερο από αυτό της πρόσβασης στη μοιραζόμενη μνήμη, ένα σύστημα Κατανεμημένης Μνήμης μπορεί να αντιμετωπιστεί ως σύστημα Μοιραζόμενης Μνήμης NUMA. Γίνονται προσπάθειες για την ανάπτυξη τεχνικών σε επίπεδο υλικού αλλά και λογισμικού για την ανάπτυξης ενός ενοποιημένου συστήματος (πχ Κατανεμημένης Μοιραζόμενης Μνήμης, Distributed Shared Memory, DSM) αλλά ακόμη η επιβάρυνση του υλικού, του λειτουργικού συστήματος ή του συστήματος εκτέλεσης είναι σημαντική.

93

94 Το πρόβλημα του περιορισμού στο μέγιστο αριθμό των επεξεργαστών που μπορούν να χρησιμοποιηθούν στις αρχιτεκτονικές κοινής μνήμης επιλύεται με τεχνικές μεταβλητής ταχύτητας πρόσβασης στη μνήμη (Non Uniform Memory Access, NUMA). Το βασικό χαρακτηριστικό των αρχιτεκτονικών κοινής μνήμης είναι ότι όλοι οι επεξεργαστές έχουν την ίδια ταχύτητα πρόσβασης στη μνήμη μέσω του διαύλου ή των πολλαπλών διαύλων επικοινωνίας. Μπορούν όμως να κατασκευαστούν υπολογιστές κοινής μνήμης με διαφορετική ταχύτητα πρόσβασης των επεξεργαστών στη μνήμη. Στην επόμενη διαφάνεια απεικονίζεται μια τέτοια αρχιτεκτονική

95 Διάταξη επεξεργαστών και μνήμης σε MIMD αρχιτεκτονικές NUMA Αποτελείται από τέσσερις μονάδες επεξεργασίας, κάθε μια από τις οποίες βασίζεται στην αρχιτεκτονική της κοινής μνήμης (συνήθως κάθε τέτοια μονάδα επεξεργασίας περιέχει μέχρι 16 επεξεργαστές). Κάθε επεξεργαστής έχει πρόσβαση στην τοπική μνήμη της μονάδας επεξεργασίας που ανήκει μέσω ενός διαύλου επικοινωνίας αλλά ταυτόχρονα έχει πρόσβαση και στις μνήμες των υπολοίπων μονάδων μέσω ενός δεύτερου διαύλου επικοινωνίας μικρότερης ταχύτητας από τον τοπικό δίαυλο. Με την τεχνική αυτή μπορούν να κατασκευαστούν υπολογιστές κοινής μνήμης με μεγάλο πλήθος επεξεργαστών. Οι υπολογιστές της κατηγορίας αυτής συχνά αναφέρονται με τον όρο υπολογιστές κατανεμημένης κοινής μνήμης (DSM, Distributed Shared Memory).

96 Οι δυο προηγούμενες κατηγορίες είναι οι βασικές αρχιτεκτονικές παράλληλων υπολογιστών. Οι κατασκευάστριες εταιρείες, στηριζόμενες στις αρχιτεκτονικές αυτές,κατασκευάζουν σήμερα παράλληλους υπολογιστές που συνδυάζουν τις δυο αυτές βασικές κατηγορίες. Η αρχιτεκτονική του διπλανού σχήματος, γνωστή ως αρχιτεκτονική εικονικής κοινής μνήμης (virtual shared memory), στηρίζεται στο μοντέλο των υπολογιστών κατανεμημένης μνήμης, όπου κάθε επεξεργαστής έχει την δικιά του μνήμη, ταυτόχρονα όμως κάθε επεξεργαστής έχει και απ ευθείας πρόσβαση στην μνήμη των υπολοίπων μέσω ενός κυκλώματος επικοινωνίας ανεξάρτητου των επεξεργαστών.

97 Οι μεγαλύτεροι και ταχύτεροι σύγχρονοι υπολογιστές συνδυάζουν τις αρχιτεκτονικές μοιραζόμενης και κατανεμημένης μνήμης. Τυπικά, στην απλoύστερη εκδοχή έχουμε Πολυ-Πύρηνους επεξεργαστές συνδεδεμένους μέσω ενός γρήγρου τοπικού δικτύου. Εναλλακτικά, ο κάθε κόμβος μπορεί να διαθέτει και GPUs ως συνεπεξεργαστές, επιτρέποντας μια σύνθετη αρχιτεκτονική που περιλαμβάνει Distributed Memory MIMD, Shared Memory MIMD και SIMD συστήματα στον ίδιο παράλληλο υπολογιστή.

98 ΜPP Blue Gene της IBM

99 O κάθε κόμβος είναι ένα UMA σύστημα μοιραζόμενης μνήμης. Οι επεξεργαστές έχουν πρόσβαση στη μοιραζόμενη τοπική μνήμη του κόμβου, με συνοχή κρυφής μνήμης. Επι πλέον μπορεί να διαθέτουν GPU συνεπεξεργαστές. Οι κόμβοι είναι συνδεδεμένοι μεταξύ τους με δίκτυο, έτσι ώστε ο κάθε κόμβος έχει πρόσβαση στη μνήμη των υπολοίπων κόμβων με τη λογική της κατανεμημημένης μνήμης. Οι τρέχουσες τάσεις της τεχνολογίας δείχνουν οτι το μέλλον βρίσκεται στις υβριδικές παράλληλες αρχιτεκτονικές. Τα σύγχρονα μεγάλα Clusters και ΜPP's ανήκουν σε αυτή τη κατηγορία. Η βασική διαφοροποίηση μεταξύ των δύο κατηγοριών είναι οτι στα μεν Clusters χρησιμοποιύνται ιεραρχικά συνδεδεμένες διακοπτικές διατάξεις τοπικoύ δικτύου (πχ Gigabit Ethernet, Infiniband switches) ενώ στα MPP's χρησιμοποιoύνται ειδικά διασυνδετικά δίκτυα τα οποία επιτρέπουν ταχύτατη (σημειακή ή σε blocks) σύνδεση μεταξύ ενός υποσυνόλου επεξεργαστών και πιο αργή σύνδεση (μέσω δικτύου) με τα πλέον απομακρυσμένους επεξεργαστές.

100 Από τη πλευρά του υλικού οι υβριδικές αρχιτεκτονικές είναι η προφανής λύση για την κλιμακούμενη εκμετάλλευση του άφθoνου υλικού που έχουμε στη διάθεσή μας. Από τη πλευρά του προγραμματισμού το υβριδικό μοντέλο είναι αρκετά σύνθετο, αφού περιλαμβάνει τόσο συντρέχοντα παραλληλισμό όσο και ρητή επικοινωνία. Ακόμη, μπορεί να περιλαμβάνει και SIMD προγραμματισμό των GPUs. Γίνονται αρκετές προσπάθειες για την ανάπτυξη ενός ενοποιμένου μοντέλου Υβριδικού (Hybrid) ή Ετερογενούς (Heterogeneous) παράλληλου προγραμματισμού.

101 Τα τελευταία χρόνια η ραγδαία εξέλιξη στο υλικό (hardware) των προσωπικών υπολογιστών, κυρίως στους επεξεργαστές, από τις δύο κυρίαρχες στον χώρο εταιρίες Intel και AMD, αλλά και στο υπόλοιπο υλικό (π.χ. μητρικές πλακέτες, μνήμες),οδήγησε στην κατασκευή προσωπικών υπολογιστών με εξαιρετικά υψηλές υπολογιστικές επιδόσεις και με χαμηλό οικονομικό κόστος. Από την άλλη πλευρά, η εξέλιξη της τεχνολογίας των δικτύων υπολογιστών, οδήγησε σε δίκτυα με μεγάλη χωρητικότητα (bandwidth) και με μικρή καθυστέρηση (latency), όπως το Fast Ethernet, το Gigabit Ethernet, το Myrinet και το SCI. Οι εξελίξεις αυτές σε συνδυασμό με την ανάπτυξη του σταθερού, αξιόπιστου και ελεύθερα διαθέσιμου λειτουργικού συστήματος Linux, έδωσαν την ώθηση για την πραγματοποίηση επιστημονικών υπολογισμών μεγάλης κλίμακας σε συστοιχίες Beowulf (Beowulf clusters)

102 Μια συστοιχία Beowulf είναι ένας υψηλής απόδοσης παράλληλος υπολογιστής, κατασκευασμένος από προσωπικούς υπολογιστές κόμβους της συστοιχίας. Οι κόμβοι φέρουν ελεύθερα διαθέσιμο λειτουργικό σύστημα, συνήθως Linux, και είναι κατάλληλα διασυνδεδεμένοι με αποκλειστικό (private) δίκτυο επικοινωνίας υψηλής ταχύτητας. Μια συστοιχία μπορεί να είναι είτε ομογενής δηλαδή όλοι οι κόμβοι να έχουν το ίδιο υλικό και το ίδιο λειτουργικό σύστημα είτε ετερογενής, δηλαδή να έχει διαφορετικούς κόμβους ως προς το υλικό ή/και ως προς το λειτουργικό σύστημα.

103 To 1994 o Thomas Sterling, στα πλαίσια του ερευνητικού έργου Beowulf, κατασκεύασε την πρώτη συστοιχία με 16 κόμβους διασυνδεδεμένους με δίκτυο Ethernet, στο ερευνητικό κέντρο CESDIS (Center of Excellence in Space Data and Information Sciences) της NASA. Ήταν η πρώτη προσπάθεια για την ανάπτυξη παράλληλου υπολογιστικού συστήματος βασισμένου σε προσωπικούς υπολογιστές με στόχο την δημιουργία ενός συστήματος υψηλών επιδόσεων με πολύ μικρότερο κόστος από αυτό των υπερυπολογιστών.

104 Από τότε οι συστοιχίες άρχισαν να κερδίζουν συνεχώς έδαφος έναντι των υπερυπολογιστών γιατί εκτός απ την χαμηλή τους τιμή έφτασαν οι επιδόσεις τους να είναι αντίστοιχες. Χάρη σε αυτά τα πλεονεκτήματα φτάσαμε σήμερα σε σημείο στη λίστα υπερυπολογιστών TOP 500 οι 411 από τους 500 υπολογιστές της λίστας να είναι συστοιχίες (δεδομένα Ιουνίου 2011) Βασικά πλεονεκτήματα Εμπορικοί επιτραπέζιοι υπολογιστές υψηλής απόδοσης σε χαμηλή τιμή. Εμπορικά διαθέσιμο hardware τοπικών δικτύων (μεταγωγείς, κάρτες) σε χαμηλή τιμή. Ευκολη αναβάθμιση με προσθήκη νέων υπολογιστών ή αλλαγή του hardware δικτύων. Εύκολη προσαρμογή υπάρχοντος λογισμικού μεταβίβασης μηνυμάτων.

105 Λογισμικό για clusters Προγραμματισμός μεταβίβασης μηνυμάτων. Parallel Virtual Machine (PVM) - τέλη 1980, αρχικά πολύ δημοφιλές. Message Passing Interface (MPI) πρότυπο που ορίστηκε στα μέσα του 1990 (MPICH, LAM). Βιβλιοθήκες χρήστη για μεταβίβαση μηνυμάτων. Χρήση με συμβατικές γλώσσες (C, C++, Fortran...). υστήματα διασύνδεσης clusters Αρχικά fast Ethernet, 100 Μbits/sec - οικονομική λύση Gigabit Ethernet, 1 Gbit/sec - λογική αναβάθμιση Εξειδικευμένα συστήματα υψηλής απόδοσης Myrinet, 2.4 Gbits/sec μονοπωλιακή αγορά SCI (Scalable Coherent Interface), 5 Gbits/sec Infiniband, 2 ως 96 Gbits/sec ίσως να ενσωματωθεί στα μελλοντικά PCs

106 Συλλογή από διασυνδεδεμένους «κόμβους» Φτηνοί / ευρέως διαθέσιμοι επεξεργαστές (π.χ. clusters από PCs) Ο μόνος τρόπος να φτιάξουμε «οικονομικούς» υπερ-υπολογιστές (πολλά Teraflops) Sandia Laboratories Red Storm (Cray, 2004) AMD Opterons (basically PC nodes), 75 Terabytes of memory > 100 Teraflops (peak) Linux Κόστος: $ Σε αντιδιαστολή με τον Earth Simulator ( NEC, Ιαπωνία, 2002) Διανυσματικός υπερυπολογιστής 5120 διανυσματικοί επεξεργαστές, 10 Terabytes of memory 35 Teraflops (sustained) Κόστος: $ (2002, most expensive computer ever built)

107 Διάγραμμα Cluster της Google

108 Σο μέλλον : Clusters από πολυπύρηνους κόμβους

109

110 Πόσο γρήγορα είναι τα σημερινά παράλληλα συστήματα; Ποιές είναι οι βασικές αρχιτεκτονικές που χρησιμοποιούνται; Παραπομπή στο /project/ Εκεί βρίσκουμε απαντήσες σε καίρια ερωτήματα όπως τα παραπάνω μέσω στατιστικών ( g/statistics/) Η συντρυπτική πλειονότητα των σύγχρονων παράλληλων συστημάτων ανήκουν στη κατηγορία τών Συστοιχιών (Clusters). Οι κόμβοι των Συστοιχιών, επίσης στη συντριπτική τους πλειοψηφία είναι SMP's με Πολυπύρηνους Επεξεργαστές και μάλιστα εμπορικά διαθέσιμοι, όχι δηλαδή ειδικής κατασκευής. Πρόσφατα άρχισαν να εισχωρούν κόμβοι που διαθέτουν συνεπεξεργαστές GPU. Τα δίκτυα δισύνδεσης είναι επίσης στη μεγάλη τους πλειοψηφία Gigabit Ethernet ή ανάλογα, δηλαδή και πάλι είναι εμπορικά διαθέσιμα και όχι ειδικής κατασκευής.

111

112

113

114 GPU (Graphics Processing Unit) αρχιτεκτονική : χρήση πολυεπεξεργαστικής κάρτας γραφικών Υβριδική Αρχιτεκτονική : Οι επεξεργαστές της κάρτας γραφικών είναι SIMD ενώ οι επεξεργαστές της μητρικής είναι MIMD. Αποτελεί μια πολύ ισχυρή και οικονομική λύση! Δυνατότητα κατασκευής υπολογιστή γραφείου(desktop) με ισχύ τάξης Tera-flops.

115

116 Η αύξηση της ταχύτητας δεν είναι γραμμική συνάρτηση του αριθμού των CPU.

117 Η μέγιστη επιτάχυνση συνήθως ορίζεται ίση με τον αριθμό των χρησιμοποιούμενων επεξεργαστών p (γραμμική επιτάχυνση). Είναι πιθνανή η υπερ-γραμμική επιτάχυνση (μεγαλύτερη του p) σε ειδικές περιπτώσεις.

118 Ο συντελεστής επιτάχυνσης είναι: Η εξίσωση αυτή είναι γνωστή ως νόμος Amdahl.

119

120 Jaguar, USA Cores:224,256

121 Roadrunner, USA Cores:122,400

122 Tera 100 France

123 Hopper United States

124 Pleiades United States

125 Cielo United States

126 Tsubame Japan

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Αρχιτεκτονική Υπολογιστών Παραλληλισμός Βασικές Πηγές: Αρχιτεκτονική Υπολογιστών: μια Δομημένη Προσέγγιση, Α. Tanenbaum, Vrije Universiteit, Amsterdam. Computer Architecture and Engineering, K. Asanovic,

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 13: (Μέρος Γ ) Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών

Διαβάστε περισσότερα

Πολυπύρηνοι επεξεργαστές Multicore processors

Πολυπύρηνοι επεξεργαστές Multicore processors Πολυπύρηνοι επεξεργαστές Multicore processors 1 Μετάβαση στους πολυπύρηνους(1) Απόδοση των µονοεπεξεργαστών 25% ετήσια βελτίωση της απόδοσης από το 1978 έως το 1986 Κυρίως από την εξέλιξη της τεχνολογίας

Διαβάστε περισσότερα

Οργάνωση επεξεργαστή (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

Οργάνωση επεξεργαστή (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική Οργάνωση επεξεργαστή (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική Ταχύτητα εκτέλεσης Χρόνος εκτέλεσης = (αριθμός εντολών που εκτελούνται) Τί έχει σημασία: Χ (χρόνος εκτέλεσης εντολής) Αριθμός

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 13: (Μέρος Γ ) Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών

Διαβάστε περισσότερα

Παράλληλα Συστήματα. Γιώργος Δημητρίου. Ενότητα 3 η : Παράλληλη Επεξεργασία. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής

Παράλληλα Συστήματα. Γιώργος Δημητρίου. Ενότητα 3 η : Παράλληλη Επεξεργασία. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής Γιώργος Δημητρίου Ενότητα 3 η : Παράλληλη Επεξεργασία Παράλληλες Αρχιτεκτονικές Παράλληλο σύστημα είναι ένα σύνολο από επεξεργαστικά στοιχεία (processing elements) τα οποία: συνεργάζονται για γρήγορη επίλυση

Διαβάστε περισσότερα

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Ενότητα 2: Αρχιτεκτονικές Von Neuman, Harvard. Κατηγοριοποίηση κατά Flynn. Υπολογισμός απόδοσης Συστημάτων

Διαβάστε περισσότερα

Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC

Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC Πλεονεκτήματα MPSoC Είναι ευκολότερο να σχεδιαστούν πολλαπλοί πυρήνες επεξεργαστών από τον σχεδιασμό ενός ισχυρότερου και πολύ πιο σύνθετου μονού επεξεργαστή.

Διαβάστε περισσότερα

EM 361: Παράλληλοι Υπολογισμοί

EM 361: Παράλληλοι Υπολογισμοί ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ EM 361: Παράλληλοι Υπολογισμοί Ενότητα #2: Αρχιτεκτονική Διδάσκων: Χαρμανδάρης Ευάγγελος ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Διαβάστε περισσότερα

ΠΛΕ-006 ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ 2012-13. Διδάσκων: Β. Δημακόπουλος. dimako@cs.uoi.gr

ΠΛΕ-006 ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ 2012-13. Διδάσκων: Β. Δημακόπουλος. dimako@cs.uoi.gr ΠΛΕ-006 ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ 2012-13 Διδάσκων: Β. Δημακόπουλος dimako@cs.uoi.gr Στοιχεία για το μάθημα Ημέρα/ώρα Τρίτη, 09:00 12:00 Διδακτικό υλικό: Βιβλία «Στοιχεία παράλληλου υπολογισμού» - Πάντζιου

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Γιώργος Δημητρίου Ενότητα 11 η : Εισαγωγή σε Παράλληλες Αρχιτεκτονικές Παράλληλη Επεξεργασία Επίπεδο Παραλληλισμού Από εντολές έως ανεξάρτητες διεργασίες Οργανώσεις Παράλληλων Αρχιτεκτονικών Συμμετρικοί,

Διαβάστε περισσότερα

Παράλληλοι υπολογιστές

Παράλληλοι υπολογιστές Παράλληλοι υπολογιστές Κ.Γ. Μαργαρίτης προσαρμογή από το μάθημα του Barry Wilkinson ITCS 4145/5145 2006Cluster Computing Univ. of North Carolina at Charlotte 1 Απαίτηση για ταχύτητα Συνεχής απαίτηση για

Διαβάστε περισσότερα

Η ΤΑΞΙΝΟΜΗΣΗ ΤΟΥ FLYNN!!! 1 ο ΕΠΑΛ ΡΟΔΟΥ ΤΟΜΕΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ!!!! Χατζηνικόλας Κώστας www.costaschatzinikolas.gr

Η ΤΑΞΙΝΟΜΗΣΗ ΤΟΥ FLYNN!!! 1 ο ΕΠΑΛ ΡΟΔΟΥ ΤΟΜΕΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ!!!! Χατζηνικόλας Κώστας www.costaschatzinikolas.gr Η ΤΑΞΙΝΟΜΗΣΗ ΤΟΥ FLYNN 1 ο ΕΠΑΛ ΡΟΔΟΥ ΤΟΜΕΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Χατζηνικόλας Κώστας www.costaschatzinikolas.gr Τα 4 Είδη Των Αρχιτεκτονικών Των Σύγχρονων Η/Υ Ο Michael J. Flynn 1 το 1966 πρότεινε τον χωρισμό

Διαβάστε περισσότερα

Διαφορές single-processor αρχιτεκτονικών και SoCs

Διαφορές single-processor αρχιτεκτονικών και SoCs 13.1 Τα συστήματα και η επικοινωνία μεταξύ τους γίνονται όλο και περισσότερο πολύπλοκα. Δεν μπορούν να περιγραφούνε επαρκώς στο επίπεδο RTL καθώς αυτή η διαδικασία γίνεται πλέον αρκετά χρονοβόρα. Για αυτό

Διαβάστε περισσότερα

5/3/2012. Εισαγωγή στα Παράλληλα Συστήµατα (Οργάνωση-Προγραµµατισµός) Β. Δημακόπουλος Α. Ευθυμίου

5/3/2012. Εισαγωγή στα Παράλληλα Συστήµατα (Οργάνωση-Προγραµµατισµός) Β. Δημακόπουλος Α. Ευθυμίου 5/3/2012 Εισαγωγή στα Παράλληλα Συστήµατα (Οργάνωση-Προγραµµατισµός) Β. Δημακόπουλος Α. Ευθυμίου Τι περιλαμβάνει το σημερινό μάθημα; Εισαγωγή στα παράλληλα συστήματα Τι είναι; Πώς φτάσαμε ως εδώ; Τι σημαίνει

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Αρχιτεκτονική Υπολογιστών Παραλληλισμός Βασικές Πηγές: Αρχιτεκτονική Υπολογιστών: μια Δομημένη Προσέγγιση, Α. Tanenbaum, Vrije Universiteit, Amsterdam. Computer Architecture and Engineering, K. Asanovic,

Διαβάστε περισσότερα

ΠΛΕ-079. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. dimako@cs.uoi.gr

ΠΛΕ-079. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. dimako@cs.uoi.gr ΠΛΕ-079 ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Διδάσκων: Β. Δημακόπουλος dimako@cs.uoi.gr Στοιχεία για το μάθημα Αντικείμενο του μαθήματος: 1. Η δομή των παράλληλων υπολογιστών (πολυπύρηνα, smps, clusters,

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Α Γενικού Λυκείου (Μάθημα Επιλογής)

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Α Γενικού Λυκείου (Μάθημα Επιλογής) ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Α Γενικού Λυκείου (Μάθημα Επιλογής) Σύγχρονα Υπολογιστικά Συστήματα τους υπερυπολογιστές (supercomputers) που χρησιμοποιούν ερευνητικά εργαστήρια τα μεγάλα συστήματα (mainframes)

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Αρχιτεκτονική Υπολογιστών Παραλληλισμός Βασικές Πηγές: Αρχιτεκτονική Υπολογιστών: μια Δομημένη Προσέγγιση, Α. Tanenbaum, Vrije Universiteit, Amsterdam. Computer Architecture and Engineering, K. Asanovic,

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Απόδοση ΚΜΕ. (Μέτρηση και τεχνικές βελτίωσης απόδοσης)

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Απόδοση ΚΜΕ. (Μέτρηση και τεχνικές βελτίωσης απόδοσης) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Απόδοση ΚΜΕ (Μέτρηση και τεχνικές βελτίωσης απόδοσης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Κεντρική Μονάδα Επεξεργασίας

Διαβάστε περισσότερα

Κεφάλαιο 1.5: Τα βασικά μέρη ενός υπολογιστή

Κεφάλαιο 1.5: Τα βασικά μέρη ενός υπολογιστή Κεφάλαιο 1.5: Τα βασικά μέρη ενός υπολογιστή 1.5.1 Ανάλυση των μερών ενός υπολογιστή Μονάδα συστήματος Είναι το κουτί του υπολογιστή το οποίο φαίνεται αρκετά συμπαγές, αλλά στην πραγματικότητα αποτελείται

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ << ΜΕΛΕΤΗ ΤΗΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ CUDA ΚΑΙ ΠΑΡΑΛΛΗΛΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΡΤΩΝ GPU ΤΗΣ NVIDIA >> Αρ. Μητρώου: 04/2519

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ << ΜΕΛΕΤΗ ΤΗΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ CUDA ΚΑΙ ΠΑΡΑΛΛΗΛΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΡΤΩΝ GPU ΤΗΣ NVIDIA >> Αρ. Μητρώου: 04/2519 ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ > Της φοιτήτριας ΚΕΛΑΪΔΗ ΑΙΜΙΛΙΑ Επιβλέπων καθηγητής ΔΙΑΜΑΝΤΑΡΑΣ ΚΩΝ/ΝΟΣ Αρ. Μητρώου: 04/2519 Θεσσαλονίκη

Διαβάστε περισσότερα

Πληροφορική Ι. Μάθημα 6 ο Εκτέλεση πράξεων, Αρχιτεκτονική Η/Υ. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας

Πληροφορική Ι. Μάθημα 6 ο Εκτέλεση πράξεων, Αρχιτεκτονική Η/Υ. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας Πληροφορική Ι Μάθημα 6 ο Εκτέλεση πράξεων, Αρχιτεκτονική Η/Υ Δρ. Γκόγκος Χρήστος Εκτέλεση προγραμμάτων Πρόγραμμα: Ένα σύνολο από εντολές.

Διαβάστε περισσότερα

i Throughput: Ο ρυθμός ολοκλήρωσης έργου σε συγκεκριμένο χρόνο

i Throughput: Ο ρυθμός ολοκλήρωσης έργου σε συγκεκριμένο χρόνο Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 6-7 Απόδοση ΚΜΕ (Μέτρηση και τεχνικές βελτίωσης απόδοσης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Κεντρική Μονάδα Επεξεργασίας

Διαβάστε περισσότερα

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Ενότητα 2: Αρχιτεκτονικές Von Neuman, Harvard. Κατηγοριοποίηση κατά Flynn. Υπολογισμός απόδοσης Συστημάτων

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr Διπλωματικές

Διαβάστε περισσότερα

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΟΣ ΔΙΚΤΥΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΟΣ ΔΙΚΤΥΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΙΚΟΣ ΔΙΚΤΥΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΓΑΣΙΑ ΜΕ ΤΙΤΛΟ ΕΠΕΞΕΡΓΑΣΤΕΣ - CPU Μπακρατσάς Γιώργος geback007@yahoo.gr Δεκέμβριος, 2014 Περιεχόμενα ΕΙΣΑΓΩΓΗ... 3 ΙΣΤΟΡΙΚΗ ΑΝΑΔΡΟΜΗ... 4 ΧΡΟΝΟΛΟΓΙΕΣ

Διαβάστε περισσότερα

Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή

Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή 1 Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή μνήμη(cache). Η cache είναι πολύ σημαντική, πολύ γρήγορη,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. 1.1. Υλικό και Λογισμικό.. 1 1.2 Αρχιτεκτονική Υπολογιστών.. 3 1.3 Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6

ΠΕΡΙΕΧΟΜΕΝΑ. 1.1. Υλικό και Λογισμικό.. 1 1.2 Αρχιτεκτονική Υπολογιστών.. 3 1.3 Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή στην Δομή, Οργάνωση, Λειτουργία και Αξιολόγηση Υπολογιστών 1.1. Υλικό και Λογισμικό.. 1 1.2 Αρχιτεκτονική Υπολογιστών.. 3 1.3 Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6 1.3.1 Δομή

Διαβάστε περισσότερα

Υ07. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ. Β. Δημακόπουλος.

Υ07. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ. Β. Δημακόπουλος. Υ07 ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ Διδάσκων: Β. Δημακόπουλος dimako@cse.uoi.gr Υ07 Παράλληλα Συστήματα 2015-16 23/2/2016 Εισαγωγή στα Παράλληλα Συστήματα (Οργάνωση-Προγραμματισμός) Οργάνωση του μαθήματος Διδάσκων:

Διαβάστε περισσότερα

Κατανεμημένος και Παράλληλος Προγραμματισμός. Ύλη μαθήματος. Βιβλιογραφία Μαθήματος 2/27/2016

Κατανεμημένος και Παράλληλος Προγραμματισμός. Ύλη μαθήματος. Βιβλιογραφία Μαθήματος 2/27/2016 Κατανεμημένος και Παράλληλος Προγραμματισμός Ηλίας Κ. Σάββας Αναπληρωτής Καθηγητής Τμήμα Μηχανικών Πληροφορικής ΤΕ, ΤΕΙ Θεσσαλίας Email: savvas@teilar.gr Ύλη μαθήματος. Εισαγωγή στον κατανεμημένο προγραμματισμό.

Διαβάστε περισσότερα

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. MYE-023 ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Διδάσκων: Β. Δημακόπουλος dimako@cse.uoi.gr Στοιχεία για το μάθημα Αντικείμενο του μαθήματος: 1. Η δομή των παράλληλων υπολογιστών (πολυπύρηνα, smps, clusters,

Διαβάστε περισσότερα

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2015-16 Τεχνολογίες Κύριας (και η ανάγκη για χρήση ιεραρχιών μνήμης) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης i Στα σύγχρονα

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Ιεραρχία συχνά και το

Διαβάστε περισσότερα

Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ. «Φέτα» ημιαγωγών (wafer) από τη διαδικασία παραγωγής ΚΜΕ

Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ. «Φέτα» ημιαγωγών (wafer) από τη διαδικασία παραγωγής ΚΜΕ Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ Η Κεντρική Μονάδα Επεξεργασίας (Central Processing Unit -CPU) ή απλούστερα επεξεργαστής αποτελεί το μέρος του υλικού που εκτελεί τις εντολές ενός προγράμματος υπολογιστή

Διαβάστε περισσότερα

Τεχνολογίες Κύριας Μνήμης

Τεχνολογίες Κύριας Μνήμης Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Τεχνολογίες Κύριας (και η ανάγκη για χρήση ιεραρχιών μνήμης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Κύρια Μνήμη

Διαβάστε περισσότερα

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Για βελτίωση της απόδοσης

Διαβάστε περισσότερα

Εισαγωγή στην Αρχιτεκτονική Η/Υ

Εισαγωγή στην Αρχιτεκτονική Η/Υ Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2017-18 Εισαγωγή στην Αρχιτεκτονική (θεμελιώδεις αρχές λειτουργίας των υπολογιστών) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. MYE-023 ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Διδάσκων: Β. Δημακόπουλος dimako@cse.uoi.gr Στοιχεία για το μάθημα Αντικείμενο του μαθήματος: 1. Η δομή των παράλληλων υπολογιστών (πολυπύρηνα, smps, clusters,

Διαβάστε περισσότερα

1. Οργάνωση της CPU 2. Εκτέλεση εντολών 3. Παραλληλία στο επίπεδο των εντολών 4. Γραμμές διοχέτευσης 5. Παραλληλία στο επίπεδο των επεξεργαστών

1. Οργάνωση της CPU 2. Εκτέλεση εντολών 3. Παραλληλία στο επίπεδο των εντολών 4. Γραμμές διοχέτευσης 5. Παραλληλία στο επίπεδο των επεξεργαστών ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ ΟΡΓΑΝΩΣΗ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Ι Γ. Τσιατούχας 2 ο Κεφάλαιο ιάρθρωση 1. Οργάνωση της 2. εντολών 3. Παραλληλία στο επίπεδο των εντολών 4. Γραμμές διοχέτευσης 5. Παραλληλία στο

Διαβάστε περισσότερα

Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο

Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο AEN ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΠΛΟΙΑΡΧΩΝ Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο ΘΕΩΡΙΑ 3 η Διάλεξη ΧΑΣΑΝΗΣ ΒΑΣΙΛΕΙΟΣ ΥΠΟΛΟΓΙΣΤΙΚΟ ΣΥΣΤΗΜΑ Υπολογιστικό σύστημα: Ένα δυναμικό σύστημα που: Χρησιμοποιείται για επίλυση προβλημάτων

Διαβάστε περισσότερα

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών Γιώργος Δημητρίου Ενότητα 1 η : Βασικές Αρχές Αρχιτεκτονικής Η/Υ Σύγχρονοι Μικροεπεξεργαστές Intel 6-core i7 (Gulftown) 2010, >1 billion transistors Απόδοση Μικροεπεξεργαστών V Μετρήσεις με μετροπρογράμματα

Διαβάστε περισσότερα

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος.

MYE-023. Διδάσκων: ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Β. Δημακόπουλος. MYE-023 ΠΑΡΑΛΛΗΛΑ ΣΥΣΤΗΜΑΤΑ & ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Διδάσκων: Β. Δημακόπουλος dimako@cse.uoi.gr Στοιχεία για το μάθημα Αντικείμενο του μαθήματος: 1. Η δομή των παράλληλων υπολογιστών (πολυπύρηνα, smps, clusters,

Διαβάστε περισσότερα

Αρχιτεκτονική υπολογιστών

Αρχιτεκτονική υπολογιστών 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 3 : Μια άποψη του κορυφαίου επιπέδου λειτουργίας και διασύνδεσης του υπολογιστή Καρβούνης Ευάγγελος Η έννοια

Διαβάστε περισσότερα

Κεντρική Μονάδα Επεξεργασίας. Επανάληψη: Απόδοση ΚΜΕ. ΚΜΕ ενός κύκλου (single-cycle) Παραλληλισμός σε επίπεδο εντολών. Υπολογιστικό σύστημα

Κεντρική Μονάδα Επεξεργασίας. Επανάληψη: Απόδοση ΚΜΕ. ΚΜΕ ενός κύκλου (single-cycle) Παραλληλισμός σε επίπεδο εντολών. Υπολογιστικό σύστημα Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Παραλληλισμός σε επίπεδο εντολών (Pipelining και άλλες τεχνικές αύξησης απόδοσης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

Τεχνολογικά Επιτεύγµατα. Πλεονεκτήµατα. Ορισµός Κατανεµηµένου Συστήµατος. Μειονεκτήµατα. E-03: Λειτουργικά Συστήµατα ΙΙ 6. Εαρινό Εξάµηνο 2005-06

Τεχνολογικά Επιτεύγµατα. Πλεονεκτήµατα. Ορισµός Κατανεµηµένου Συστήµατος. Μειονεκτήµατα. E-03: Λειτουργικά Συστήµατα ΙΙ 6. Εαρινό Εξάµηνο 2005-06 Τεχνολογικά Επιτεύγµατα Ε-03: Λειτουργικά Συστήµατα ΙΙ Εαρινό Εξάµηνο 2005-06 Ανάπτυξη ισχυρών µικροεπεξεργαστών ηµιουργία τοπικών δικτύων υψηλών ταχυτήτων «Εισαγωγή στα Κατανεµηµένα Λειτουργικά Συστήµατα»

Διαβάστε περισσότερα

Παραλληλισμός σε επίπεδο εντολών

Παραλληλισμός σε επίπεδο εντολών Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2015-16 Παραλληλισμός σε επίπεδο εντολών (Pipelining και άλλες τεχνικές αύξησης απόδοσης) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

Κεφάλαιο 3. Διδακτικοί Στόχοι

Κεφάλαιο 3. Διδακτικοί Στόχοι Κεφάλαιο 3 Σε ένα υπολογιστικό σύστημα η Κεντρική Μονάδα Επεξεργασίας (ΚΜΕ) εκτελεί τις εντολές που βρίσκονται στην κύρια μνήμη του. Οι εντολές αυτές ανήκουν σε προγράμματα τα οποία, όταν εκτελούνται,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μάθημα 8. 1 Στέργιος Παλαμάς

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μάθημα 8. 1 Στέργιος Παλαμάς ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας Τμήμα Λογιστικής Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές Μάθημα 8 Κεντρική Μονάδα Επεξεργασίας και Μνήμη 1 Αρχιτεκτονική του Ηλεκτρονικού Υπολογιστή Μονάδες Εισόδου Κεντρική

Διαβάστε περισσότερα

2. Στοιχεία Αρχιτεκτονικής Παράλληλων Υπολογιστών... 45

2. Στοιχεία Αρχιτεκτονικής Παράλληλων Υπολογιστών... 45 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 9 1. Εισαγωγή... 13 1.1 Οι Μεγάλες Σύγχρονες Επιστημονικές Προκλήσεις... 13 1.2 Εξέλιξη της Παράλληλης Επεξεργασίας Δεδομένων... 14 1.3 Οι Έννοιες της Σωλήνωσης, του Παραλληλισμού

Διαβάστε περισσότερα

Παράλληλη Επεξεργασία

Παράλληλη Επεξεργασία Παράλληλη Επεξεργασία Φροντιστήριο: Εισαγωγή στα Πολυεπεξεργαστικά Συστήματα Διερασίες και Νήματα σε Πολυεπεξεργαστικά Συστήματα Εργαστήριο Πληροφοριακών Συστημάτων Υψηλής Επίδοσης Parallel and Distributed

Διαβάστε περισσότερα

Εφαρµογές Πληροφορικής Υπολογιστών. Κεφάλαιο 3 Το υλικό του υπολογιστή

Εφαρµογές Πληροφορικής Υπολογιστών. Κεφάλαιο 3 Το υλικό του υπολογιστή Κεφάλαιο 3 Το υλικό του υπολογιστή Εισαγωγή Τµήµατα του Η/Υ καιοργάνωση Μονάδα Κεντρικής Μνήµης Κεντρική Μονάδα Επεξεργασίας (CPU) Μονάδα Εισόδου Εξόδου ίαυλοι Επικοινωνίας Εναλλακτικές αρχιτεκτονικές

Διαβάστε περισσότερα

ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ

ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΣΑΓΩΓΗ ΠΑΡΑΛΛΗΛΕΣ ΑΡΧΙΤΕΚΤΟΝΙΚΕΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΥΨΗΛΩΝ ΕΠΙΔΟΣΕΩΝ Εισαγωγή [1] Future computers of

Διαβάστε περισσότερα

Εισαγωγή στην Επιστήμη των Υπολογιστών

Εισαγωγή στην Επιστήμη των Υπολογιστών Εισαγωγή στην Επιστήμη των Υπολογιστών Ενότητα 3: Χειρισμός δεδομένων, 2ΔΩ Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης Διδάσκων: Θεόδωρος Τσιλιγκιρίδης Μαθησιακοί Στόχοι Η Ενότητα 3 διαπραγματεύεται θέματα

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ 2 Ο ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΑΠΟΣΤΟΛΙΑ ΠΑΓΓΕ Υπολογιστής Συνοπτικό λεξικό Οξφόρδης -> «ηλεκτρονική υπολογιστική μηχανή»

Διαβάστε περισσότερα

Το υλικό του υπολογιστή

Το υλικό του υπολογιστή Το υλικό του υπολογιστή Ερωτήσεις 1. Τι αντιλαμβάνεστε με τον όρο υλικό; Το υλικό(hardware) αποτελείται από το σύνολο των ηλεκτρονικών τμημάτων που συνθέτουν το υπολογιστικό σύστημα, δηλαδή από τα ηλεκτρονικά

Διαβάστε περισσότερα

Το μάθημα συνοπτικά (1) Το μάθημα συνοπτικά (2) Τι είναι ένα υπολογιστικό σύστημα ;

Το μάθημα συνοπτικά (1) Το μάθημα συνοπτικά (2) Τι είναι ένα υπολογιστικό σύστημα ; Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2017-18 Εισαγωγή στην Αρχιτεκτονική (θεμελιώδεις αρχές λειτουργίας των υπολογιστών) http://mxstef.gthub.o/courses/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

Αρχιτεκτονική Η/Υ Το chipset ενός υπολογιστικού συστήματος. Δρ. Μηνάς Δασυγένης

Αρχιτεκτονική Η/Υ Το chipset ενός υπολογιστικού συστήματος. Δρ. Μηνάς Δασυγένης Αρχιτεκτονική Η/Υ Το chipset ενός υπολογιστικού συστήματος Δρ. Μηνάς Δασυγένης mdasyg@ieee.org 1 1 Οι εταιρείες παραγωγής IC διαφημίζουν εκτός από τους επεξεργαστές και τα chipset τους 2 2 Τι είναι όμως

Διαβάστε περισσότερα

Δίκτυα Υπολογιστών I

Δίκτυα Υπολογιστών I Δίκτυα Υπολογιστών I Βασικές Αρχές Δικτύωσης Ευάγγελος Παπαπέτρου Τμ. Μηχ. Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Ε.Παπαπέτρου (Τμ.Μηχ. Η/Υ & Πληροφορικής) MYY703: Δίκτυα Υπολογιστών I 1 / 22 Διάρθρωση 1 Βασικές

Διαβάστε περισσότερα

1. Παράλληλοι υπολογιστές

1. Παράλληλοι υπολογιστές ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ MHXANIKOI Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΡΑΛΛΗΛΟΙ ΥΠΟΛΟΓΙΣΤΕΣ Γ. Τσιατούχας 8 ο Κεφάλαιο ιάρθρωση 1. Παράλληλοι υπολογιστές 2. Πολυεπεξεργαστές 3. Πολύ υπολογιστές 4. Δίκτυα διασύνδεσης

Διαβάστε περισσότερα

Αρχιτεκτονική Μνήμης

Αρχιτεκτονική Μνήμης ΕΣ 08 Επεξεργαστές Ψηφιακών Σημάτων Αρχιτεκτονική Μνήμης Τμήμα Επιστήμη και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήμιο Πελοποννήσου Βιβλιογραφία Ενότητας Kuo [2005]: Chapters 3 & 4 Lapsley [2002]: Chapter

Διαβάστε περισσότερα

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 10ο μάθημα: Ορια παραλληλίας επιπέδου εντολής και πολυνηματικοί επεξεργαστές Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Ορια

Διαβάστε περισσότερα

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Ενότητα 3: Διασωλήνωση, Clusters, Στοιχεία Παράλληλου Προγραμματισμού Δρ. Μηνάς Δασυγένης mdasyg@ieee.org

Διαβάστε περισσότερα

Συστήματα σε Ολοκληρωμένα Κυκλώματα

Συστήματα σε Ολοκληρωμένα Κυκλώματα Συστήματα σε Ολοκληρωμένα Κυκλώματα Κεφάλαιο 4: Αρχιτεκτονική των Embedded Μικροεπεξεργαστών Διδάσκων: Καθηγητής Οδυσσέας Κουφοπαύλου Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών ΕΙΣΑΓΩΓΗ Παρουσιάζεται

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΥΠΟΛΟΓΙΣΤΕΣ

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΥΠΟΛΟΓΙΣΤΕΣ ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΥΠΟΛΟΓΙΣΤΕΣ ΜΑΘΗΜΑ 3 ο ΛΕΙΤΟΥΡΓΙΚΗ ΔΟΜΗ ΥΠΟΛΟΓΙΣΤΗ ΒΑΣΙΚΗ ΜΟΝΑΔΑ ΜΝΗΜΗ & CPU Λειτουργική Δομή Αρχιτεκτονική Von Neumann Όλοι οι υπολογιστές ακολουθούν την αρχιτεκτονική κατά Von-Neumann

Διαβάστε περισσότερα

Διαβιβάζεται συνημμένως στις αντιπροσωπίες το έγγραφο - C(2017) 6321 final - Annex 1 Part 6/11.

Διαβιβάζεται συνημμένως στις αντιπροσωπίες το έγγραφο - C(2017) 6321 final - Annex 1 Part 6/11. Συμβούλιο της Ευρωπαϊκής Ένωσης Βρυξέλλες, 27 Σεπτεμβρίου 2017 (OR. en) 12656/17 ADD 6 ΔΙΑΒΙΒΑΣΤΙΚΟ ΣΗΜΕΙΩΜΑ Αποστολέας: Ημερομηνία Παραλαβής: Αποδέκτης: COMER 100 CFSP/PESC 829 CONOP 74 ECO 56 UD 215

Διαβάστε περισσότερα

Αρχές Δικτύων Επικοινωνιών. Επικοινωνίες Δεδομένων Μάθημα 4 ο

Αρχές Δικτύων Επικοινωνιών. Επικοινωνίες Δεδομένων Μάθημα 4 ο Αρχές Δικτύων Επικοινωνιών Επικοινωνίες Δεδομένων Μάθημα 4 ο Τα επικοινωνιακά δίκτυα και οι ανάγκες που εξυπηρετούν Για την επικοινωνία δύο συσκευών απαιτείται να υπάρχει μεταξύ τους σύνδεση από σημείο

Διαβάστε περισσότερα

Κεφάλαιο 1.6: Συσκευές αποθήκευσης

Κεφάλαιο 1.6: Συσκευές αποθήκευσης Κεφάλαιο 1.6: Συσκευές αποθήκευσης 1.6.1 Συσκευές αποθήκευσης Μνήμη τυχαίας προσπέλασης - RAM Η μνήμη RAM (Random Access Memory Μνήμη Τυχαίας Προσπέλασης), κρατεί όλη την πληροφορία (δεδομένα και εντολές)

Διαβάστε περισσότερα

Διάρθρωση. Δίκτυα Υπολογιστών I Βασικές Αρχές Δικτύωσης. Διάρθρωση. Δίκτυο Υπολογιστών: ένας απλός ορισμός. Ευάγγελος Παπαπέτρου

Διάρθρωση. Δίκτυα Υπολογιστών I Βασικές Αρχές Δικτύωσης. Διάρθρωση. Δίκτυο Υπολογιστών: ένας απλός ορισμός. Ευάγγελος Παπαπέτρου Δίκτυα Υπολογιστών I Βασικές Αρχές Δικτύωσης Ευάγγελος Παπαπέτρου Τμ. Μηχ. Η/Υ & Πληροφορικής, Παν. Ιωαννίνων Ε.Παπαπέτρου (Τμ.Μηχ. Η/Υ & Πληροφορικής) MYY703: Δίκτυα Υπολογιστών I 1 / 22 Ε.Παπαπέτρου

Διαβάστε περισσότερα

ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ. Σημειώσεις Θεωρίας

ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ. Σημειώσεις Θεωρίας Ινστιτούτα Επαγγελματική Κατάρτισης ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ Σημειώσεις Θεωρίας Επιμέλεια: Ματθές Δημήτριος Αθήνα 2017 Μάθημα 1: Υπολογιστικό Σύστημα 1.1 Τι είναι ένα υπολογιστικό σύστημα Ένα υπολογιστικό

Διαβάστε περισσότερα

Αυτοματισμοί και Συστήματα Αυτομάτου Ελέγχου. Ενότητα 2

Αυτοματισμοί και Συστήματα Αυτομάτου Ελέγχου. Ενότητα 2 Αυτοματισμοί και Συστήματα Αυτομάτου Ελέγχου Ενότητα 2 Τι είναι το PLC ΠΕΡΙΕΧΟΜΕΝΑ 2 Τι είναι το PLC. 2.1 Πλεονεκτήματα των PLC. 2.2 Η δομή ενός PLC. 2.3 Τα PLC της αγοράς. 2.4 Αρχή λειτουργίας ενός PLC.

Διαβάστε περισσότερα

9. Συστολικές Συστοιχίες Επεξεργαστών

9. Συστολικές Συστοιχίες Επεξεργαστών Κεφάλαιο 9: Συστολικές συστοιχίες επεξεργαστών 208 9. Συστολικές Συστοιχίες Επεξεργαστών Οι συστολικές συστοιχίες επεξεργαστών είναι επεξεργαστές ειδικού σκοπού οι οποίοι είναι συνήθως προσκολλημένοι σε

Διαβάστε περισσότερα

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης Κεφάλαιο 7 1. Σε τι διαφέρει ο Η/Υ από τις υπόλοιπες ηλεκτρικές και ηλεκτρονικές συσκευές; Που οφείλεται η δυνατότητά του να κάνει τόσο διαφορετικές

Διαβάστε περισσότερα

Ενότητα 4. Εισαγωγή στην Πληροφορική. Αναπαράσταση δεδοµένων. Αναπαράσταση πληροφορίας. υαδικοί αριθµοί. Χειµερινό Εξάµηνο 2006-07

Ενότητα 4. Εισαγωγή στην Πληροφορική. Αναπαράσταση δεδοµένων. Αναπαράσταση πληροφορίας. υαδικοί αριθµοί. Χειµερινό Εξάµηνο 2006-07 Ενότητα 4 Εισαγωγή στην Πληροφορική Κεφάλαιο 4Α: Αναπαράσταση πληροφορίας Κεφάλαιο 4Β: Επεξεργαστές που χρησιµοποιούνται σε PCs Χειµερινό Εξάµηνο 2006-07 ρ. Παναγιώτης Χατζηδούκας (Π..407/80) Εισαγωγή

Διαβάστε περισσότερα

Κεντρική Μονάδα Επεξεργασίας

Κεντρική Μονάδα Επεξεργασίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κεντρική Μονάδα Επεξεργασίας (Σχεδιασμός και λειτουργία μιας απλής ΚΜΕ) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

Δομή Ηλεκτρονικού υπολογιστή

Δομή Ηλεκτρονικού υπολογιστή Δομή Ηλεκτρονικού υπολογιστή Η κλασσική δομή του μοντέλου που πρότεινε το 1948 ο Von Neumann Κεντρική Μονάδα Επεξεργασίας Είσοδος Αποθήκη Αποθήκη - Έξοδος Εντολών Δεδομένων Κλασσικό μοντέλο Von Neumann

Διαβάστε περισσότερα

Λειτουργικά Συστήματα Ι. Καθηγήτρια Παπαδάκη Αναστασία

Λειτουργικά Συστήματα Ι. Καθηγήτρια Παπαδάκη Αναστασία Λειτουργικά Συστήματα Ι Καθηγήτρια Παπαδάκη Αναστασία 2013 1 Ηλεκτρονικός Υπολογιστής αποτελείται: 1. Από Υλικό Hardware (CPUs, RAM, Δίσκοι), & 2. Λογισμικό - Software Και μπορεί να εκτελέσει διάφορες

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ (1) ΓΕΝΙΚΑ ΣΧΟΛΗ ΠΟΛΥΤΕΧΝΙΚΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΙΠΕΔΟ ΣΠΟΥΔΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ CEID_NE4617 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ Χειμερινό εξάμηνο ΤΙΤΛΟΣ

Διαβάστε περισσότερα

ΧΡΟΝΙΚΗ ΠΕΡΙΟΔΟΣ Γεωργία Πελέκη, Έλντα Μπάλι Τζαφέρι Τζένη, Αλεξία Παπαδοπούλου, Ντοριλέιν Γκαρσία

ΧΡΟΝΙΚΗ ΠΕΡΙΟΔΟΣ Γεωργία Πελέκη, Έλντα Μπάλι Τζαφέρι Τζένη, Αλεξία Παπαδοπούλου, Ντοριλέιν Γκαρσία ΧΡΟΝΙΚΗ ΠΕΡΙΟΔΟΣ 1964 1981 Γεωργία Πελέκη, Έλντα Μπάλι Τζαφέρι Τζένη, Αλεξία Παπαδοπούλου, Ντοριλέιν Γκαρσία Τεχνολογία Επιδόσεις Το 1958, ο Τζακ Κίλμπυ (Jack Kilby) της εταιρείας Texas Instruments κατάφερε

Διαβάστε περισσότερα

Συστήµατα Παράλληλης Επεξεργασίας

Συστήµατα Παράλληλης Επεξεργασίας http://www.cslab.ece.ntua.gr/courses/pps Εισαγωγή Νεκτάριος Κοζύρης Γιώργος Γκούµας nkoziris@cslab.ece.ntua.gr goumas@cslab.ece.ntua.gr Περιεχόµενο µαθήµατος Ζητήµατα παράλληλων αρχιτεκτονικών Κατηγορίες

Διαβάστε περισσότερα

Πανεπιστήμιο Θεσσαλίας Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Πανεπιστήμιο Θεσσαλίας Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήμιο Θεσσαλίας Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Αρχιτεκτονική Υπολογιστών Άσκηση 6: Ασκήσεις Εξαμήνου Μέρος Β Νοέμβριος 2016 Στην άσκηση αυτή θα μελετήσουμε την εκτέλεση ενός

Διαβάστε περισσότερα

Εισαγωγή Θέματα H/W. Χάρης Μανιφάβας Τμήμα Εφ. Πληροφορικής & Πολυμέσων ΤΕΙ Κρήτης. Κατανεμημένα Συστήματα (Ε) Εισαγωγή: Θέματα H/W 1

Εισαγωγή Θέματα H/W. Χάρης Μανιφάβας Τμήμα Εφ. Πληροφορικής & Πολυμέσων ΤΕΙ Κρήτης. Κατανεμημένα Συστήματα (Ε) Εισαγωγή: Θέματα H/W 1 Εισαγωγή Θέματα H/W Χάρης Μανιφάβας Τμήμα Εφ. Πληροφορικής & Πολυμέσων ΤΕΙ Κρήτης Εισαγωγή: Θέματα H/W 1 Θέματα Hardware Τα ΚΣ αποτελούνται από πολλαπλά CPUs ιαφορετικοί τρόποι σύνδεσης και επικοινωνίας

Διαβάστε περισσότερα

Αρχιτεκτονική υπολογιστών

Αρχιτεκτονική υπολογιστών 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 11-12 : Δομή και Λειτουργία της CPU Ευάγγελος Καρβούνης Παρασκευή, 22/01/2016 2 Οργάνωση της CPU Η CPU πρέπει:

Διαβάστε περισσότερα

Στοιχεία από την αρχιτεκτονική των μικροϋπολογιστών

Στοιχεία από την αρχιτεκτονική των μικροϋπολογιστών Στοιχεία από την αρχιτεκτονική των μικροϋπολογιστών Η επεξεργασία των δεδομένων ακολουθεί μια στερεότυπη διαδρομή: τα δεδομένα εισάγονται στο υπολογιστικό σύστημα, υφίστανται μια ορισμένη επεξεργασία και

Διαβάστε περισσότερα

http://www.cslab.ece.ntua.gr/diplom/

http://www.cslab.ece.ntua.gr/diplom/ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ KΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ http://www.cslab.ece.ntua.gr/ ιπλωµατική

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα

Κατανεμημένα Συστήματα Κατανεμημένα Συστήματα Σημειώσεις εργαστηρίου Μέρος 2ο - Lab#4, Κατανεμημένα Συστήματα Νεβράντζας Βάιος-Γερμανός Λάρισα, Φεβρουάριος 2013 Με ρος 2ο-Lab4, σελίδα 1 Περίληψη Στο 2ο μέρος του εργαστηριακού

Διαβάστε περισσότερα

ΤΜΗΜΑΤΑ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ

ΤΜΗΜΑΤΑ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ ΤΜΗΜΑΤΑ ΗΛΕΚΤΡΟΝΙΚΟΥ ΥΠΟΛΟΓΙΣΤΗ Τα τμήματα ενός ηλεκτρονικού υπολογιστή είναι: 1. Επεξεργαστής 2. Μνήμη RAM και ROM 3. Κάρτα γραφικών 4. Μητρική Πλακέτα 5. Σκληρός Δίσκος 6. DVD / Blue Ray 7. Τροφοδοτικό

Διαβάστε περισσότερα

Εισαγωγή στην Αρχιτεκτονική Η/Υ

Εισαγωγή στην Αρχιτεκτονική Η/Υ Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2014-15 Εισαγωγή στην Αρχιτεκτονική (θεμελιώδεις αρχές λειτουργίας των υπολογιστών) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης

Διαβάστε περισσότερα

Κεφάλαιο Το υπολογιστικό σύστημα Η εξέλιξη του ανθρώπου πραγματοποιήθηκε χάρη στην ικανότητά στον χειρισμό εργαλείων.

Κεφάλαιο Το υπολογιστικό σύστημα Η εξέλιξη του ανθρώπου πραγματοποιήθηκε χάρη στην ικανότητά στον χειρισμό εργαλείων. Α Γενικού Λυκείου Κεφάλαιο 1 1.1 Το υπολογιστικό σύστημα Η εξέλιξη του ανθρώπου πραγματοποιήθηκε χάρη στην ικανότητά στον χειρισμό εργαλείων. Ιδιαίτερη θέση έχουν οι Υπολογιστικές συσκευές. Μηχανισμός

Διαβάστε περισσότερα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική

Διαβάστε περισσότερα

Βασικές Έννοιες Πληροφορικής

Βασικές Έννοιες Πληροφορικής Βασικές Έννοιες Πληροφορικής 1. Τι είναι ο Ηλεκτρονικός Υπολογιστής Ο Ηλεκτρονικός Υπολογιστής είναι οποιαδήποτε συσκευή μεγάλη ή μικρή που επεξεργάζεται δεδομένα και εκτελεί την εργασία του σύμφωνα με

Διαβάστε περισσότερα

Chapter 4 ( ή 1 στο βιβλίο σας)

Chapter 4 ( ή 1 στο βιβλίο σας) Η διασύνδεση Υλικού και λογισμικού David A. Patterson και John L. Hennessy Chapter 4 ( ή 1 στο βιβλίο σας) Αξιολόγηση και κατανόηση της απόδοσης Δέκατη (10 η ) δίωρη διάλεξη. Διαφάνειες διδασκαλίας από

Διαβάστε περισσότερα

Το εσωτερικό ενός PC. Τεχνολογία Η/Υ & Πληροφοριών - 05 Κεντρική μονάδα Χουρδάκης Μανόλης

Το εσωτερικό ενός PC. Τεχνολογία Η/Υ & Πληροφοριών - 05 Κεντρική μονάδα Χουρδάκης Μανόλης Το εσωτερικό ενός PC 1 Το κουτί του PC (περίβλημα) περιέχει όλα τα βασικά μέρη του συστήματος Δύο κατηγορίες κουτιών: Desktop και Tower Mini tower Midi tower Full tower Κεντρική μονάδα Ο τύπος του κουτιού

Διαβάστε περισσότερα

Κεφάλαιο 4 ο. Ο Προσωπικός Υπολογιστής

Κεφάλαιο 4 ο. Ο Προσωπικός Υπολογιστής Κεφάλαιο 4 ο Ο Προσωπικός Υπολογιστής Μάθημα 4.3 Ο Επεξεργαστής - Εισαγωγή - Συχνότητα λειτουργίας - Εύρος διαδρόμου δεδομένων - Εύρος διαδρόμου διευθύνσεων - Εύρος καταχωρητών Όταν ολοκληρώσεις το μάθημα

Διαβάστε περισσότερα

Συστήματα σε Ολοκληρωμένα Κυκλώματα

Συστήματα σε Ολοκληρωμένα Κυκλώματα Συστήματα σε Ολοκληρωμένα Κυκλώματα Κεφάλαιο 1: Τι, Γιατί και Πώς των MPsoCs Διδάσκων: Καθηγητής Οδυσσέας Κουφοπαύλου Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών ΕΙΣΑΓΩΓΗ Τα Multiprocessor

Διαβάστε περισσότερα

Αρχιτεκτονική Μνήµης

Αρχιτεκτονική Μνήµης ΕΣ 08 Επεξεργαστές Ψηφιακών Σηµάτων Αρχιτεκτονική Μνήµης Τµήµα Επιστήµη και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου Βιβλιογραφία Ενότητας Kuo [2005]: Chapters 3 & 4 Lapsley [2002]: Chapter

Διαβάστε περισσότερα

Ηλεκτρονικός Υπολογιστής

Ηλεκτρονικός Υπολογιστής Ηλεκτρονικός Υπολογιστής Ε ί ν α ι μ ι α μ η χ α ν ή κα τ α σ κ ε υ α σ μ έ ν η κ υ ρ ί ω ς α π ό ψ η φ ι α κά η λ ε κ τ ρ ο ν ι κά κ υ κ λ ώ μ α τ α κα ι δ ε υ τ ε ρ ε υ ό ν τ ω ς α π ό η λ ε κ τ ρ ι

Διαβάστε περισσότερα

*Ένας υπολογιστής είναι στην πραγματικότητα ένα σύστημα πολλών μερών που συνεργάζονται μεταξύ τους.

*Ένας υπολογιστής είναι στην πραγματικότητα ένα σύστημα πολλών μερών που συνεργάζονται μεταξύ τους. Ένας υπολογιστής είναι στην πραγματικότητα ένα σύστημα πολλών μερών που συνεργάζονται μεταξύ τους. *Τα φυσικά μέρη που μπορούμε να δούμε και να αγγίξουμε ονομάζονται συνολικά υλικό (hardware). * * υπερυπολογιστές

Διαβάστε περισσότερα

Παραλληλισµός Εντολών (Pipelining)

Παραλληλισµός Εντολών (Pipelining) ΕΣ 08 Επεξεργαστές Ψηφιακών Σηµάτων Παραλληλισµός Εντολών (Pipelining) Τµήµα Επιστήµη και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου Βιβλιογραφία Ενότητας Kuo [2005]: Chapter 3: Section 3.4,

Διαβάστε περισσότερα