Προχωρηµένα Θέµατα Αρχιτεκτονικής

Σχετικά έγγραφα
Chapter 4 (1) Αξιολόγηση και κατανόηση της απόδοσης

Chapter 4 ( ή 1 στο βιβλίο σας)

i Throughput: Ο ρυθμός ολοκλήρωσης έργου σε συγκεκριμένο χρόνο

ΕΠΛ 605 Προχωρηµένη Αρχιτεκτονική Υπολογιστών. Pedro Trancoso. CASPER group Department of Computer Science University of Cyprus, Cyprus.

Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology)

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Απόδοση ΚΜΕ. (Μέτρηση και τεχνικές βελτίωσης απόδοσης)

ΠΛΕ- 027 Μικροεπεξεργαστές

Αφηρημένες έννοιες και τεχνολογία υπολογιστών

Προχωρηµένα Θέµατα Αρχιτεκτονικής Η/Υ. Storage Systems.. Λιούπης

Υ- 01 Αρχιτεκτονική Υπολογιστών Εισαγωγή

Κεφάλαιο 4 Εκτίμηση και Κατανόηση Απόδοσης (Assessing and Understanding Performance)

Αρχιτεκτονική Υπολογιστών

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

Αρχιτεκτονικές Υπολογιστών

Αρχιτεκτονική Υπολογιστών

Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση. Κεφάλαιο 1. Αφηρηµένες έννοιες και τεχνολογία υπολογιστών

Κεφάλαιο 1. ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ --. Σερπάνος. Σημείωση

Κεφάλαιο 1. Σημείωση. Εισαγωγή. Βασικές αρχές σχεδιασμού υπολογιστών

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Κυκλωμάτων» Χειμερινό εξάμηνο


ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός

Οι τέσσερις αρχές για τον σχεδιασμό του συνόλου εντολών μιας μηχανής είναι:

Απόδοση Υπολογιστικών Συστημάτων

Αρχιτεκτονική Υπολογιστών Ι (ένα)

ΑρχιτεκτονικήΥπολογιστών. Ι (ένα) Δημήτρης Γκιζόπουλος. Καθηγητής

Χρονισμός και Απόδοση Υπολογιστικών Συστημάτων

ΤΕΧΝΙΚΕΣ ΑΥΞΗΣΗΣ ΤΗΣ ΑΠΟΔΟΣΗΣ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ I

Κεφ. 1: Μετρικά Σύγκρισης Επίδοσης και Χρονοπρογράμματα (Benchmarking), και Άλλα Μετρικά Κεφ. 1

Processor-Memory (DRAM) ιαφορά επίδοσης

ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός

Κεντρική Μονάδα Επεξεργασίας

*Ένας υπολογιστής είναι στην πραγματικότητα ένα σύστημα πολλών μερών που συνεργάζονται μεταξύ τους.

ΜΥΕ- 05 Αρχιτεκτονική Υπολογιστών 2

Κεφάλαιο 4 Εκτίμηση και Κατανόηση Απόδοσης

Αρχιτεκτονική και απόδοση Υπολογιστών

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

Αρχιτεκτονική Υπολογιστών

Εισαγωγή στην Δομή, Οργάνωση, Λειτουργία και Αξιολόγηση Υπολογιστών

Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή

Αρχιτεκτονική Υπολογιστών

Αρχιτεκτονική Υπολογιστών

Παραλληλισμός σε επίπεδο εντολών

ΚΕΦΑΛΑΙΟ 1 ΥΛΙΚΟ ΥΠΟΛΟΓΙΣΤΩΝ

Τελική Εξέταση, Απαντήσεις/Λύσεις

Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

Τεχνικές Εκτίμησης Υπολογιστικών συστημάτων. Γιάννης Γαροφαλάκης. Καθηγητής

Κεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy)

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 2: Φορτίο εργασίας, μετρήσεις και πειράματα

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

Αρχιτεκτονική Υπολογιστών

i Όλες οι σύγχρονες ΚΜΕ είναι πολυπλοκότερες!

Κεφ. 1: Μετρικά Σύγκρισης Επίδοσης και Χρονοπρογράμματα (Benchmarking) Κεφ. 1. Εαρινό Εξάμηνο 2017

Ιστορία των επεξεργαστών (CPUs)

ΘΕΜΑ PROJECT COMPILER FLAGS ΤΡΑΧΑΝΗΣ ΔΗΜΗΤΡΗΣ 6108 ΤΡΑΧΑΝΗΣ ΓΕΩΡΓΙΟΣ 5789

Κεφάλαιο 1. Αφηρηµένες έννοιες και τεχνολογία υπολογιστών. Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση

ΕΙΣΑΓΩΓΗ. Αρχιτεκτονική Η/Υ ΗΜΟΣ ΜΠΟΛΑΝΑΚΗΣ

Διάλεξη 15 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΥΠΟΛΟΓΙΣΤΕΣ

ΠΛΕ- 027 Μικροεπεξεργαστές 9ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Κρυφές μνήμες εισαγωγή

Κεντρική Μονάδα Επεξεργασίας. Επανάληψη: Απόδοση ΚΜΕ. ΚΜΕ ενός κύκλου (single-cycle) Παραλληλισμός σε επίπεδο εντολών. Υπολογιστικό σύστημα

Εισαγωγή στον έλεγχο ορθής λειτουργίας ψηφιακών συστημάτων. Δημήτρης Νικολός, Τμήμα Μηχ. Ηλεκτρονικών Υπολογιστών και Πληροφορικής, Παν.

ΕΠΛ221: Οργάνωση Υπολογιστών και Συµβολικός Προγραµµατισµός

ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ Ι. Κεφάλαιο 1 Εισαγωγή στην Δομή, Οργάνωση, Λειτουργία και Αξιολόγηση Υπολογιστών

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems)

Τέτοιες λειτουργίες γίνονται διαμέσου του

Η διασύνδεση Υλικού και λογισμικού David A. Patterson και John L. Hennessy. Αφηρημένες έννοιες και τεχνολογία υπολογιστών

Αρχιτεκτονική Υπολογιστών

Τεχνολογίες Κύριας Μνήμης

Τεχνικές βελτιστοποίησης µε σκοπό την επίτευξη χαµηλής κατανάλωσης ισχύος

Επαρκή χωρητικότητα αποθήκευσης Αποδεκτό επίπεδο μέσης απόδοσης Χαμηλό μέσο κόστος ανά δυαδικό δ ψηφίο

Αρχιτεκτονική Υπολογιστών

ΔΙΑΧΥΤΑ ΚΑΙ ΕΝΣΩΜΑΤΩΜΕΝΑ ΣΥΣΤΗΜΑΤΑ

Processor-Memory (DRAM) Διαφορά επίδοσης

Προβλήµατα και τεχνικές

MPSoCs για εφαρμογές Video

Οργάνωση επεξεργαστή (1 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

Προχωρηµένα Θέµατα Αρχιτεκτονικής

Εισαγωγή στην Αρχιτεκτονική Η/Υ

Το ολοκληρωμένο κύκλωμα μιας ΚΜΕ. «Φέτα» ημιαγωγών (wafer) από τη διαδικασία παραγωγής ΚΜΕ

Ελληνικό Ανοικτό Πανεπιστήµιο. Η Ανάλυση και ο Σχεδιασµός στην Ενοποιηµένη ιαδικασία. ρ. Πάνος Φιτσιλής

I/O: Λίγη θεωρία ουρών, RAID

«Σχεδιασμός Ψηφιακών Συστημάτων σε FPGA» Εαρινό εξάμηνο

Προγραµµατισµός Συστηµάτων Πραγµατικού Χρόνου

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή

Διαγράμματα UML για την τεκμηρίωση της Αρχιτεκτονικής

Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

Αρχιτεκτονική Υπολογιστών

3. Προσωπικός Ηλεκτρονικός Υπολογιστής (Personal Computer - PC)

Προχωρηµένα Θέµατα Αρχιτεκτονικής

ΑΡΧΙΤΕΚΤΟΝΙΚΗ HARDWARE ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

1. Οργάνωση της CPU 2. Εκτέλεση εντολών 3. Παραλληλία στο επίπεδο των εντολών 4. Γραμμές διοχέτευσης 5. Παραλληλία στο επίπεδο των επεξεργαστών

Κεφάλαιο 5. Στόχοι Κεφαλάιου. Η αρχιτεκτονική von Neumann. Nell Dale John Lewis. Κεντρική Μονάδα Επεξεργασίας (ΚΜΕ/CPU)

Εισαγωγή στην Αρχιτεκτονική Η/Υ

Processor-Memory (DRAM) ιαφορά επίδοσης

Τι είναι η Αρχιτεκτονική Υπολογιστών; Αρχιτεκτονική του συνόλου των εντολών. Οργάνωση. Hardware. 3 πλευρές του σχεδιασµού των υπολογιστών

Οργάνωση Υπολογιστών ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Εργαστήριο 10: Επίδοση Επεξεργαστών, CPI. Μανόλης Γ.Η. Κατεβαίνης

Transcript:

Προχωρηµένα Θέµατα Αρχιτεκτονικής Fundamentals of Computer Design. Λιούπης

Αύξηση απόδοσης µικροεπεξεργαστών Αύξηση των παρεχόµενων στο χρήστη δυνατοτήτων Κυριαρχία των βασισµένων σε µικροεπεξεργαστές υπολογιστικών συστηµάτων

Νέες όψεις υπολογιστικών συστηµάτων Desktop computing - τάση για βελτιστοποίηση του Price/Performance Servers - παροχή πιο αξιόπιστων και µεγαλύτερης κλίµακας υπηρεσιών - κρίσιµα σηµεία: διαθεσιµότητα και δυνατότητα κλιµάκωσης Embedded computers - ποικιλία επεξεργαστικής ισχύος και κόστους - απαίτηση για real-time απόδοση - ανάγκη για ελαχιστοποίηση µνήµης και ισχύος - τάση για χρησιµοποίηση cores επεξεργαστών µαζί µε ειδικού σκοπού κυκλώµατα

Συνοπτικά χαρακτηριστικά των 3 υπολογιστικών κλάσεων

Το έργο του computer designer Καθορισµός γνωρισµάτων Σχεδίαση ενός συστήµατος µέγιστης απόδοσης, διατηρώντας τους περιορισµούς σε κόστος και ισχύ - σχεδιασµός του συνόλου εντολών - λειτουργική οργάνωση - λογικός σχεδιασµός - υλοποίηση: σχεδιασµός ολοκληρωµένου κυκλώµατος, packaging, ισχύς, cooling Βελτιστοποίηση του σχεδιασµού

Λειτουργικές απαιτήσεις που αντιµετωπίζει ο αρχιτέκτονας υπολογιστών

Τεχνολογικές τάσεις Integrated circuit logic technology - πλήθος transistors/chip αυξάνει 55% ανά χρόνο Semiconductor DRAM - αύξηση πυκνότητας (40%-60%), µικρή βελτίωση cycle time, bandwidth ανά chip διπλασιάζεται καθώς µειώνεται το latency Τεχνολογία µαγνητικών δίσκων - αύξηση πυκνότητα δίσκων (100%), µικρή βελτίωση access time Τεχνολογία δικτύων - πιο γρήγορη αύξηση σε bandwidth τα τελευταία χρόνια

Κόστος Τιµή Κόστος: ποσό που ξοδεύεται για την παραγωγή µαζί µε το overhead Τιµή: ποσό στο οποίο πουλιέται ένα καλό προϊόν Το κόστος µειώνεται µε το χρόνο λόγω του learning curve (κόστος κατασκευής µειώνεται στο πέρασµα του χρόνου) Learning curve µετριέται καλύτερα µε τις αλλαγές στο yield (ποσοστό κατασκευασµένων ολοκληρωµένων που επιβιώνουν µετά τον έλεγχο) Μείωση κόστους λόγω της αύξησης σε όγκο και του ανταγωνισµού µαζικής παραγωγής

Τιµές γενιών DRAMs

Τιµές Intel Pentium III

Κόστος ενός ολοκληρωµένου Cost of integrated circuit = Cost of die + Cost of testing die + Cost of Final test yield packaging and final test Cost of die = Dies Cost of wafer per wafer Die yield Dies per wafer = π (Wafer diameter/2) Die area 2 π Wafer diameter 2 Die area Defects per unit area Die area Die yield = Wafer yield 1+ α α

Παράδειγµακατανοµής κόστους σε ένα σύστηµα

Συνιστώσες του κόστους Direct costs: άµεσα συσχετισµένα µε την παραγωγή προϊόντος Gross margin: έµµεσο overhead προστιθέµενο από την εταιρεία Average discount: εκπτώσεις από την εταιρεία κυρίως λόγου µαζικής παραγωγής Average selling price < List price

Cost vs. Performance High-performance design: το κόστος δεν λαµβάνεται υπόψη στην επίτευξη του στόχου Low-cost design: η απόδοση θυσιάζεται για να επιτευχθεί χαµηλό κόστος Cost-performance design: ο σχεδιαστής εξισορροπεί το κόστος σε αντιστοιχία µε την απόδοση (περισσότεροι σχεδιαστές κινούνται προς αυτή την κατεύθυνση)

Μέτρηση απόδοσης Response (execution) time: ο χρόνος από την αρχή ως την ολοκλήρωση ενός event Throughput: συνολική εργασία που γίνεται για δοσµένο χρονικό διάστηµα X is faster than Y n times : Execution time 1 Performance Y Y n = = = Execution time 1 X Performance X Performance Performance X Y

Επιλογή προγράµµατος για εκτίµηση απόδοσης Real applications: compilers, software για επεξεργασία κειµένου κλπ. - παίρνουν είσοδο, έξοδο, πιο κοντά στην πραγµατικότητα Modified applications - τροποποίηση µε σκοπό να αυξήσουν portability και να εστιάσουν σε µια όψη της απόδοσης Kernels: Livermore Loops, Linpack - αποµόνωση απόδοσης ανεξάρτητων χαρακτηριστικών Toy Benchmarks: Puzzle, Quicksort -µόνο για µια πρώτη εντύπωση Synthetic Benchmarks: Whetstone, Dhrystone - εξοµοίωση της συµπεριφοράς ενός γενικής χρήσης προγράµµατος

Benchmark Suites Desktop Benchmarks: CPU-intensive & graphics-intensive benchmarks Server Benchmarks: CPU throughputoriented benchmark Embedded Benchmarks: λόγω µεγάλης ποικιλίας σε embedded εφαρµογές και απαιτήσεις, µη ρεαλιστικό ένα απλό σύνολο από benchmarks

Σύγκριση απόδοσης Average execution time: Arithmetic mean = 1 n i= 1 Weighted execution time: Weighted arithmetic mean = n Time i Normalized execution time: Geometric mean = Geometric mean(x ) Geometric mean(y ) n n i= 1 i = i n i= 1 Weight i Time i Execution time ratio i X Geometric mean( Y i i )

Παράδειγµασύγκρισης απόδοσης

Αρχές σχεδιασµού υπολογιστών(1) Κάνε την συνηθισµένη κατάσταση γρήγορη Amdahl s law: Speedup overall = Performance for entire task using the enhancement when possible Performance for entire task without using the enhancement Speedup overall = Execution time for entire task without using the enhancement Execution time for entire task using the enhancement when possible Execution time Speedup overall new = Execution time Execution time = Execution time old new old = Fraction enhanced ( 1 Fraction ) + enhanced Speedupenhanced ( 1 Fraction ) enhanced 1 Fraction + Speedup enhanced enhanced

Αρχές σχεδιασµού υπολογιστών(2) Εξισώσεις για CPU performance: CPU time = CPU clock cycles for a program Clock cycle time CPU time = CPI = CPU clock cycles for a program Clock rate CPU clock cyclesfor a program Instruction count CPU time = Instruction count Clock cycle time Cycles per instruction CPU time = CPU clock cycles = Instruction count Clock cycle time Clock rate n i= 1 IC i CPI i n CPU time = ICi CPIi Clock cycle time i= 1 CPI = n IC CPI IC i i n i= 1 i = i= 1 Instruction count Instruction count CPI i

Αρχές σχεδιασµού υπολογιστών(3) Αρχή της τοπικότητας: τα προγράµµατα έχουν την τάση να χρησιµοποιούν δεδοµένα και εντολές που έχουν χρησιµοποιηθεί πρόσφατα - Temporal locality - Spatial locality Εκµετάλλευση παραλληλισµού

Απόδοση και Τιµή/Απόδοση για Desktop Συστήµατα Απόδοση και τιµή-απόδοση για 7 συστήµατα, µετρηµένα µε το SPEC CINT2000 benchmark

Απόδοση και Τιµή/Απόδοση για Transaction-Processing Servers Απόδοση και τιµή-απόδοση για τα 6 πιο υψηλά σε απόδοση συστήµατα, µετρηµένα µε το TPC- C benchmark

Απόδοση και Τιµή/Απόδοση για Embedded Processors Σχετική τιµή-απόδοση για 5 embedded processors για τρία από τα πέντε EEMBC benchmark suites, θεωρώντας µόνο την τιµή του επεξεργαστή

Σφάλµατα και παγίδες (1) Σφάλµα: η σχετική απόδοση δύο επεξεργαστών µε την ίδια αρχιτεκτονική συνόλου εντολών (ISA) µπορεί να κριθεί από το clock rate ή από την απόδοση ενός απλού benchmark suite Απόδοση Pentium 4 σχετική µε Pentium III

Σφάλµατα και παγίδες (2) Σφάλµα: Τα benchmarks παραµένουν έγκυρα για πάντα

Σφάλµατα και παγίδες (3) Παγίδα: συγκρίνοντας την απόδοση προγράµµατος σε γλώσσα assembly γραµµένο από το χρήστη και δηµιουργηµένο από compiler, υψηλού επιπέδου γλώσσας πρόγραµµα Σφάλµα: η κορυφαία απόδοση συµπίπτει µε την πραγµατική απόδοση

Σφάλµατα και παγίδες (4) Σφάλµα: ο καλύτερος σχεδιασµός για ένα σύστηµα είναι αυτός που βελτιστοποιεί το πρωταρχικό αντικειµενικό στόχο χωρίς να λαµβάνει υπόψη την υλοποίηση Παγίδα: παραµελώντας το κόστος του software τόσο κατά την αποτίµηση ενός συστήµατος ή κατά την εξέταση του κόστους/απόδοση Παγίδα: πέφτοντας θύµατα του Amdahl s Law, προσπαθώντας να βελτιστοποιήσουµε κάποια όψη ενός συστήµατος πριν µετρήσουµε την χρησιµότητα του Σφάλµα: τα synthetic benchmarks προβλέπουν την απόδοση για πραγµατικά προγράµµατα

Σφάλµατα και παγίδες (5) Σφάλµα: τα MIPS είναι ένα ακριβές µέτρο για την σύγκριση αποδόσεων υπολογιστών MIPS = Instruction count Execution time 10 6 = Clock rate 6 CPI 10 Execution time = Instruction count 6 MIPS 10 Τα MIPS εξαρτώνται από το σύνολο εντολών, κάνοντας το δύσκολο να συγκρίνεις MIPS από υπολογιστές µε διαφορετικά σύνολα εντολών Τα MIPS διαφέρουν µεταξύ προγραµµάτων του ίδιου υπολογιστή ΠΙΟ ΣΗΜΑΝΤΙΚΟ! Τα MIPS µπορεί να διαφέρουν αντιστρόφως µε τη απόδοση!