Processor-Memory (DRAM) ιαφορά επίδοσης
|
|
- Εύανδρος Ζέρβας
- 8 χρόνια πριν
- Προβολές:
Transcript
1 Processor-Memory (DRAM) ιαφορά επίδοσης µproc 6%/yr Performance Processor-Memory Performance Gap: (grows 5% / year) DRAM 7%/yr.
2 Ιεραρχία µνήµης Part of The On-chip CPU Datapath Registers One or more levels (Static RAM): Level : On-chip 6-64K Level 2: On or Off-chip 28-52K Level 3: Off-chip 28K-8M Dynamic RAM (DRAM) 6M-6G Registers Cache Main Memory Όσο αποµακρυνόµαστε από τη CPU : Μικρότερο κόστος/bit Μεγαλύτερη χωρητικότητα Μεγαλύτερος χρόνος πρόσβασης-καθυστέρηση Χαµηλότερος ρυθµός εξόδου Interface: SCSI, RAID, IDE, 394 4G-G Magnetic Disc Optical Disk or Magnetic Tape
3 Παράδειγµα Ιεραρχίας Μνήµης ( µε 2 επίπεδα cache ) Processor Μεγαλύτερη Ταχύτητα Μεγαλύτερη Χωρητικότητα Datapath Control Registers On-Chip Level One Cache L Second Level Cache (SRAM) L 2 Main Memory (DRAM) Virtual Memory, Secondary Storage (Disk) Tertiary Storage (Tape) Ταχύτητα : -5ns ns 3ns 5ns ms sec Μέγεθος : <KB <256KB <8MB <4GB >GB TB Bandwidth : 5GB/s 5GB/s 25GB/s 4GB/s MB/s
4 Το µοντέλο της Ιεραρχίας Μνήµης Disk memory µέγεθος : 5bytes 64KB 52MB GB ταχύτητα :,25ns ns ns 5ms
5 Παράδειγµα Ιεραρχίας µνήµης Digital PWS 6 au - Alpha 264 CPU 6MHz CPU Level Capacity Throughput Latency 32 registers W L cache 2W L2 cache.5mw ext.l3 cache Register 52B 24GB/sec 2ns L cache 8KB 6GB/sec 2ns L2 cache 96KB 8GB/sec 6ns L3 cache 4MB 888MB/sec 24ns 64MW main memory GW Disk space Main Mem 52MB GB/sec 2ns
6 Τυπικές Αρχιτεκτονικές IBM Power 3: L = 64 KB, 28-way set associative L2 = 4 MB, direct mapped, line size = 28, write back Compaq EV6 (Alpha 2264): L = 64 KB, 2-way associative, line size= 32 L2 = 4 MB (or larger), direct mapped, line size = 64 HP PA: no L2 PA85, PA86: L =.5 MB PA87: L = 2.25 MB AMD Athlon: L = 64 KB, L2 = 256 KB Intel Pentium 4: L = 8 KB, L2 = 256 KB Intel Itanium: L = 6 KB, 4-way associative L2 = 96 KB, 6-way associative L3 = off chip, size varies
7 Γιατί είναι ωφέλιµη η Ιεραρχία Μνήµης; Τοπικότητα δεδοµένων (data locality) Κατά κανόνα τα προγράµµατα προσπελαύνουν ένα µικρό µόνο µέρος του συνόλου των διευθύνσεων (εντολές/δεδοµένα) κατά την εκτέλεση ενός συγκεκριµένου τµήµατός τους ύο είδη τοπικότητας δεδοµένων: Temporal Locality: Στοιχεία που έχουν πρόσφατα προσπελαστεί τείνουν να προσπελαύνονται ξανά στο άµεσο µέλλον Spatial locality: Γειτονικά στοιχεία όσων έχουν ήδη προσπελαστεί, έχουν αυξηµένη πιθανότητα να προσπελαστούν στο άµεσο µέλλον Η ύπαρξη τοπικότητας στις αναφορές ενός προγράµµατος, καθιστά εφικτή τη δυνατότητα να ικανοποιούνται η αίτηση για δεδοµένα από επίπεδα µνήµης που βρίσκονται ιεραρχικά ανώτερα
8 Ορολογία block line - page : η µικρότερη µονάδα µεταφοράς δεδοµένων µεταξύ των επιπέδων µνήµης To Processor From Processor Upper Level Memory Blk X Lower Level Memory Blk Y
9 Ορολογία hit : το block βρίσκεται σε κάποια θέση του εξεταζόµενου επιπέδου µνήµης hit rate : hits/συνολικές προσπελάσεις µνήµης hit time : χρόνος προσπέλασης των δεδοµένων miss : το block δεν υπάρχει στο εξεταζόµενο επίπεδο µνήµης miss rate : (hit rate) miss penalty : (χρόνος µεταφοράς των δεδοµένων ενός block στο συγκεκριµένο επίπεδο µνήµης) + (χρόνος απόκτησης των δεδοµένων από την CPU) access time : χρόνος απόκτησης της ης λέξης transfer time : χρόνος απόκτησης των υπόλοιπων λέξεων
10 H Βάση της Ιεραρχίας Μνήµης Οι δίσκοι περιέχουν όλα τα δεδοµένα Όταν ο επεξεργαστής χρειάζεται κάποιο στοιχείο, αυτό ανεβαίνει σε ανώτερα επίπεδα µνήµης Η cache περιέχει αντίγραφα των στοιχείων της µνήµης που έχουν χρησιµοποιηθεί Η µνήµη περιέχει αντίγραφα των στοιχείων του δίσκου που έχουν χρησιµοποιηθεί
11 4 Ερωτήσεις για τις caches Πού µπορεί να τοποθετηθεί ένα block σε ένα ψηλότερο επίπεδο στην ιεραρχία µνήµης; Τοποθέτηση block : direct-mapped, fully associative, set-associative Πώς βρίσκουµε ένα block στα διάφορα επίπεδα µνήµης; Αναγνώριση ενός block : Tag / Block Ποιο από τα ήδη υπάρχοντα block της cache πρέπει να αντικατασταθεί σε περίπτωση ενός miss; Μηχανισµός αντικατάστασης block : Random, Least Recently Used (LRU), FIFO Τι συµβαίνει όταν µεταβάλλουµε το περιεχόµενο ενός block; µηχανισµοί εγγραφής : write-through ή write-back write-allocate ή no-write-allocate
12 Οργάνωση της Cache Τοποθέτηση ενός block µνήµης στην cache Direct mapped : (διεύθυνση block) mod (αρ. block στην cache) Set associative : (διεύθυνση block) mod (αρ. sets στην cache) Fully associative : οπουδήποτε!
13 Cache µε 8 blocks και µνήµη µε 32 blocks Οργάνωση της Cache Αρ. Block To block 2 µπαίνει οπουδήποτε To block 2 µπαίνει µόνο στο block 4 (=2 mod 8) Αρ. Block To block 2 µπαίνει οπουδήποτε µέσα στο set (=2 mod 4) Αρ. Block Cache Αρ. Block διεύθυνση του block frame Μνήµη
14 Τα πεδία διεύθυνσης Φυσική ιεύθυνση (CPU) Tag ιεύθυνση του Block Index Block Offset Επιλογή Set Επιλογή εδοµένων
15 Τα πεδία διεύθυνσης Φυσική ιεύθυνση (CPU) Tag ιεύθυνση του Block Index Block Offset Μέγεθος block offset = log2(µέγεθος block) Μέγεθος Index = log2( Συνολικός αριθµός blocks/associativity) Μέγεθος tag = µέγεθος address - µέγεθος index - µέγεθος offset
16 Οργάνωση της Cache Direct Mapped Cache Κάθε block µπορεί να αποθηκευθεί µόνο σε µία θέση : (διεύθυνση block) MOD (Αρ. blocks στην cache) στο παράδειγµά µας: (διεύθυνση block address) MOD (8) cache 8 cache block frames 32 memory blocks cacheable () MOD () = Μνήµη
17 Παράδειγµα : Direct Mapped Cache Tag field ιεύθυνση (θέση των bit) Index field 2 byte offset tag index index valid 2 tag data 24 Blocks Κάθε block = λέξη Μπορεί να αποθηκεύσει 2 32 bytes µνήµης data Hlt
18 Παράδειγµα 4K blocks Κάθε block = 4 words Direct Mapped Cache v bits 28 bits tag Tag field tag ιεύθυνση (θέση των bit) Index field index 2 data byte offset Επιλογή λέξης block offset data 4K είσοδοι Mux 32 Καλύτερη αξιοποίηση της spatial locality
19 4-Way Set Associative Cache: (MIPS) Tag Field ιεύθυνση Index Field Index V Tag Data V Tag Data V Tag Data V Tag Data sets 24 block frames Hlt 4 to multiplexer data
20 Οργάνωση της Cache : Set Associative Cache -way set associative (direct mapped) block Tag Data Χωρητικότητα cache : 8 words way set associative Set Tag Data Tag Data 2 3 Set 4-way set associative Tag Data Tag Data Tag DataTag Data 8-way set associative (fully associative) Tag DataTag Data Tag DataTag Data Tag DataTag Data Tag Data Tag Data
21 Παράδειγµα οργάνωσης cache- διευθυνσιοδότηση L cache µε 28 cache block frames Κάθε block frame περιέχει 4 λέξεις (6 bytes) 6-bit διευθύνσεις µνήµης στην cache (64Kbytes κύρια µνήµη ή 496 blocks µνήµης) είξτε την οργάνωση της cache (mapping) και τα πεδία διευθύνσεων της cache για: Fully Associative cache. Direct mapped cache. 2-way set-associative cache.
22 Fully Associative Case Valid bit V V Oι 28 tags ελέγχονται παράλληλα από το hardware κατά την τοποθέτηση ενός data block στην cache V ιεύθυνση του Block = 2bits Tag = 2bits Block Offset = 4bits
23 Direct Mapped Cache Valid bit V V V Μόνο ένα tag ελέγχεται παράλληλα από το hardware κατά την τοποθέτηση ενός data block στην cache V ιεύθυνση του Block = 2bits Tag = 5bits Index = 7bits Block Offset = 4bits Κύρια Μνήµη
24 2-Way Set-Associative Cache ύο tags σε ένα set ελέγχονται παράλληλα από το hardware κατά την τοποθέτηση ενός data block στην cache ιεύθυνση του Block = 2bits Tag = 6bits Index = 6bits Block Offset = 4bits Κύρια Μνήµη
25 Προσπέλαση δεδοµένων σε Direct Mapped Cache Η CPU καλεί προς ανάγνωση τις εξής διευθύνσεις: x4 x48 xc x44 διεύθυνση 4 8 C C C Κύρια µνήµη τιµή της λέξης a b c d e f g h i j k l
26 8ΚΒ Direct-mapped cache 4W blocks Αρχικά όλες οι θέσεις invalid index valid tag x-3 x4-7 x8-b xc-f
27 8ΚΒ Direct-mapped cache 4W blocks Read (x4) index valid tag x-3 x4-7 x8-b xc-f Read block : invalid data στο block!
28 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d Φόρτωσε τα ζητούµενα δεδοµένα στην cache!
29 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d Επέστρεψε το b(θέση ) στην CPU
30 8ΚΒ Direct-mapped cache 4W blocks Read (x48) index valid tag x-3 x4-7 x8-b xc-f a b c d Read block 4 : invalid data στο block 4!
31 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h Φόρτωσε τα ζητούµενα δεδοµένα στην cache και κάνε το block valid!
32 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h Επέστρεψε στην CPU την τιµή g!
33 8ΚΒ Direct-mapped cache 4W blocks Read (xc) index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h Read block!
34 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h To πεδίο tag έχει τη σωστή τιµή! Άρα επιστρέφεται η τιµή d
35 8ΚΒ Direct-mapped cache 4W blocks Read (x44) index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h Read block!
36 Miss : πρέπει να αντικατασταθεί το block µε νέα δεδοµένα 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f a b c d e f g h Valid data αλλά το πεδίο tag δεν είναι το σωστό 2!=
37 8ΚΒ Direct-mapped cache 4W blocks Read index valid tag x-3 x4-7 x8-b xc-f i j k l e f g h Φόρτωσε το σωστό περιεχόµενο και στείλε το j στην CPU
38 Υπολογισµός του αριθµού των bits που χρειάζονται Πόσα bits συνολικά χρειάζονται σε µία direct-mapped cache µε 64 KBytes data και blocks της λέξης, για 32-bit διευθύνσεις; 64 Kbytes = 6 Kwords = 2 4 words = 2 4 blocks Block size = 4 bytes => offset size = 2 bits, #sets = #blocks = 2 4 => index size = 4 bits Tag size = address size - index size - offset size = =6 bits Bits/block = data bits + tag bits + valid bit = = 49 Bits της cache = #blocks x bits/block = 2 4 x 49 = 98 Kbytes Πόσα bits συνολικά χρειάζονται σε µία 4-way set associative cache για την αποθήκευση των ίδιων δεδοµένων; Block size και #blocks δεν αλλάζει. #sets = #blocks/4 = (2 4 )/4 = 2 2 => index size = 2 bits Tag size = address size - index size - offset = = 8 bits Bits/block = data bits + tag bits + valid bit = = 5 Bits της cache = #blocks x bits/block = 2 4 x 5 = 2 Kbytes Αύξηση του associativity => Αύξηση των bits της cache
39 Υπολογισµός του αριθµού των bits της cache που χρειάζονται Πόσα bits συνολικά χρειάζονται σε µία direct- mapped cache µε 64KBytes data και blocks των 8 λέξεων, για 32-bit διευθύνσεις (2 32 bytes µπορούν να αποθηκευθούν στη µνήµη); 64 Kbytes = 2 4 words = (2 4 )/8 = 2 blocks block size = 32 bytes => offset size = block offset + byte offset = 5 bits #sets = #blocks = 2 => index size = bits tag size = address size - index size - offset size = = 6 bits bits/block = data bits + tag bits + valid bit = 8 x = 273 bits bits in cache = #blocks x bits/block = 2 x 273 = Kbytes Αύξηση του µεγέθους του block => Μείωση των bits της cache.
40 Μηχανισµοί αντικατάστασης ενός block της cache Random (τυχαία) επιλογή ενός τυχαίου block µε βάση κάποια ψευδοτυχαία ακολουθία απλή υλοποίηση στο hardware είναι η τεχνική που χρησιµοποιείται συνήθως LRU (least recently used) αντικαθιστάται το block που δεν έχει χρησιµοποιηθεί για περισσότερη ώρα ακριβή υλοποίηση στο hardware
41 Μηχανισµοί εγγραφής σε block (σε περίπτωση write-hit) Σε περίπτωση write-hit, γνωστοποιείται η αλλαγή στην κύρια µνήµη ; ναι : write-through όχι : write-back Σε περίπτωση miss, τοποθετείται το block στην cache; ναι : write-allocate (συνήθως µε write-back) όχι : write-no-allocate (συνήθως µε write-through)
42 Write-Back & Write-Through write-back : ενηµέρωση της µνήµης µόνο κατά την αποµάκρυνση του block από την cache οι εγγραφές πραγµατοποιούνται µε την ταχύτητα της cache dirty bit κατά την τροποποίηση αντικατάσταση των clean block χωρίς ενηµέρωση της µνήµης Χαµηλό ποσοστό misses Πολλές εγγραφές σε µία ενηµέρωση write-through : ενηµέρωση της µνήµης σε κάθε εγγραφή το κατώτερο ιεραρχικά επίπεδο περιέχει τα εγκυρότερα δεδοµένα εύκολη υλοποίηση αυξηµένη µετακίνηση δεδοµένων προς τη µνήµη συχνά χρησιµοποιείται ένας write buffer για αποφυγή καθυστερήσεων όσο ενηµερώνεται η µνήµη
43 Write-Allocate & write-no no-allocate (στη περίπτωση write-miss) Write-allocate : το block φορτώνεται από τη µνήµη στη cache και στη συνέχεια µεταβάλλουµε τα δεδοµένα του (χωρίς να ενηµερώσουµε τα κατώτερα (πιο κοντινά στην κεντρική µνήµη) επίπεδα µνήµης) write-no-allocate : οι µετατροπές των δεδοµένων γίνονται απευθείας στα χαµηλότερα επίπεδα της ιεραρχίας µνήµης (χωρίς να εµπλακεί η cache) Allocate a cache line to store the memory block!
44 Read hit / misses read hit : ανάγνωση των δεδοµένων από cache την read miss : µεταφορά ολόκληρου του block που περιέχει τα δεδοµένα που αναζητάµε στην cache και στη συνέχεια όπως στο read hit
45 Write hit / misses Write-back & Write-allocate write hit : εγγραφή των δεδοµένων στην cache (µόνο). Η κύρια µνήµη ενηµερώνεται µόνο όταν αποµακρυνθεί το block από την cache και το block είναι dirty write miss : το block µεταφέρεται στην cache (στη σωστή θέση) και στη συνέχεια όπως στο write hit
46 Write hit / misses Write-through & write-no-allocate write hit : εγγραφή των νέων δεδοµένων στην cache και ενηµέρωση της κύρια µνήµης write miss : η εγγραφή γίνεται µόνο στην κύρια µνήµη, ενώ δεν εµπλέκεται καθόλου η cache
47 Συνέχεια από το προηγούµενο παράδειγµα... 8ΚΒ Direct-mapped cache - 4W blocks write through Write (x44), m index valid tag x-3 x4-7 x8-b xc-f i j k l e f g h Read block 4!
48 8ΚΒ Direct-mapped cache - 4W blocks write through Write index valid tag x-3 x4-7 x8-b xc-f i j k l e m g h 5 5 Valid data - σωστό tag εγγραφή στο πεδίο της cache και ενηµέρωση της κύριας µνήµης!
49 8ΚΒ Direct-mapped cache - 4W blocks write back Write (x44), m Ind. V dirty tag x-3 x4-7 x8-b xc-f i j k l e f g h 5 5 Read block 4!
50 8ΚΒ Direct-mapped cache - 4W blocks write back Write Ind. V dirty tag x-3 x4-7 x8-b xc-f i j k l e m g h 5 5 Valid data - σωστό tag εγγραφή στο πεδίο της cache και ενηµέρωση του dirty bit!
51 8ΚΒ Direct-mapped cache - 4W blocks write back Read (x84c) Ind. V dirty tag x-3 x4-7 x8-b xc-f i j k l e m g h 5 5 Read block 4!
52 8ΚΒ Direct-mapped cache - 4W blocks write back Read Ind. V dirty tag x-3 x4-7 x8-b xc-f i j k l e m g h 5 5 Valid data το πεδίο tag όµως δεν ταιριάζει :!=4 Το dirty bit είναι : Ενηµερώνεται η µνήµη (x4-x4f) και στη συνέχεια φορτώνεται η σωστή διεύθυνση
53 Επιστρέφεται η τιµή r στη CPU 8ΚΒ Direct-mapped cache - 4W blocks write back Read Ind. V dirty tag x-3 x4-7 x8-b xc-f i j k l 4 p q r s 5 5 Φορτώνεται η σωστή διεύθυνση - ενηµερώνονται τα πεδία tag - dirty
54 Επίδοση των επιπέδων µνήµης (performance) µέσος χρόνος προσπέλασης των δεδοµένων (access time) t avg = t hit + miss rate t miss penalty
55 Cache : ενοποιηµένη ή όχι; Ενοποιηµένη για εντολές και δεδοµένα (unified) Μικρότερο κατασκευαστικό κόστος Καλύτερο ισοζύγισµα του χώρου που καταλαµβάνεται από εντολές/δεδοµένα Επιπλέον misses λόγω διεκδίκησης κοινών θέσεων στην cache (conflict misses) ύο διαφορετικές caches για εντολές και δεδοµένα (data cache & instruction cache) 2-πλάσιο εύρος ζώνης όχι conflict misses
56 Παράδειγµα Σε ποια περίπτωση έχουµε καλύτερη επίδοση; Σε σύστηµα µε 6ΚΒ instruction cache και 6ΚΒ data cache ή σε σύστηµα µε 32ΚΒ unified cache; Υποθέτουµε ότι το 36% των εντολών είναι εντολές αναφοράς στη µνήµη (load/store). hit time = clock cycle miss penalty = clock cycles στη unified cache είναι: hit time = 2 clock cycles όταν πρόκειται για εντολή load/store Χρησιµοποιείστε τα δεδοµένα του ακόλουθου πίνακα : Instr.cache data cache unified cache 6KB KB
57 Παράδειγµα (συνέχεια) Λύση miss rate = misses mem accesses miss miss miss rate rate rate 6 KB instr cache = 6 KB data cache = 3.82 = = = KB unif cache = 74% %.4 =.324 miss rate (unified cache) < miss rate (instr + data cache)
58 Παράδειγµα (συνέχεια) t avg Λύση = tinstr + tdata = 74% ( +.4 ) + 26% ( +.4 ) = 4.24 t avg = = 4.44 µέσος χρόνος/access (instr+data cache) < µέσος χρόνος/access (unified cache)
59 Cache Associativity Miss rate 5% 2% 9% 6% Παρατήρηση : Μια 4-way cache έχει σχεδόν το ίδιο hit rate µε µια directmapped cache διπλάσιου µεγέθους 3% % One-way Two-way Four-way Eight-way Associativity KB 2 KB 4 KB 8 KB 6 KB 32 KB 64 KB 28 KB
60 Μεγάλα Cache Blocks tag data (χώρος για µεγάλο block) Σε µεγάλα cache blocks επωφελούµαστε από την spatial locality. Λιγότερος χώρος απαιτείται για tag (µε δεδοµένη χωρητικότητα της cache) Υπερβολικά µεγάλο µέγεθος block σπαταλάει το χώρο της cache Τα µεγάλα blocks απαιτούν µεγαλύτερο χρόνο µεταφοράς (transfer time). Ένας καλός σχεδιασµός απαιτεί συµβιβασµούς!
61 Μέγεθος Block και Miss Rate 4% 35% 3% Miss rate 25% 2% 5% % 5% % Κανόνας : το µέγεθος του block πρέπει να είναι µικρότερο από την τετραγωνική ρίζα του µεγέθους της cache. Block size (bytes) KB 8 KB 6 KB 64 KB 256 KB
62 Miss Rates για Caches διαφορετικού µεγέθους,, Associativity & αλγορίθµους αντικατάστασης block Associativity: 2-way 4-way 8-way Μέγεθος LRU Random LRU Random LRU Random 6 KB 5.8% 5.69% 4.67% 5.29% 4.39% 4.96% 64 KB.88% 2.%.54%.66%.39%.53% 256 KB.5%.7%.3%.3%.2%.2%
63 Επίδοση των caches Για CPU µε ένα µόνο επίπεδο (L) cache και καθόλου καθυστέρηση όταν έχουµε cache hit: Με ιδανική µνήµη Χρόνος CPU = (κύκλοι ρολογιού κατά τη λειτουργία της CPU + κύκλοι ρολογιού λόγω καθυστέρησης από προσπέλαση της µνήµης(mem stalls)) x χρόνος κύκλου ρολογιού Mem stalls = (Αναγνώσεις x miss rate αναγνώσεων x miss penalty αναγνώσεων) + (Εγγραφές x miss rate εγγραφών x miss penalty εγγραφών) Αν τα miss penalties των αναγνώσεων και των εγγραφών είναι ίδια: Mem stalls = Προσπελάσεις µνήµης x Miss rate x Miss penalty
64 Χρόνος εκτέλεσης χρόνος αριθµός κύκλοι χρόνος = x x εκτέλεσης εντολών εντολή κύκλου αριθµός κύκλοι CPU κύκλοι µνήµης χρόνος + εντολών εντολή εντολή κύκλου = x x αριθµός κύκλοι CPU αναφορές κύκλοι µνήµης χρόνος + x εντολών εντολή εντολή αναφορά κύκλου = x x Αρχιτεκτονική του Instruction Set Τεχνολογία του Compiler Υλοποίηση της CPU Ιεραρχία Μνήµης και Cache
65 Επίδοση των caches CPUtime = Instruction count x CPI x Χρόνος κύκλου ρολογιού CPI execution = CPI µε ιδανική µνήµη CPI = CPI execution + Mem stalls/εντολή CPUtime = Instruction Count x (CPI execution + Mem stalls/εντολή) x χρόνος κύκλου ρολογιού Mem stalls/εντολή = Προσπελάσεις µνήµης/εντολή x Miss rate x Miss penalty CPUtime = IC x (CPI execution + Προσπελάσεις µνήµης ανά εντολή x Miss rate x Miss penalty) x Χρόνος κύκλου ρολογιού Misses/εντολή = Προσπελάσεις µνήµης ανά εντολή x Miss rate CPUtime = IC x (CPI execution + Misses/εντολή x Miss penalty) x Χρόνος κύκλου ρολογιού(c)
66 Παράδειγµα Έστω µία CPU λειτουργεί µε ρολόι 2 MHz (5 ns/cycle) και cache ενός επιπέδου. CPI execution =. Εντολές: 5% arith/logic, 3% load/store, 2% control Υποθέτουµε cache miss rate =.5% και miss penalty = 5 cycles. CPI = CPI execution + Mem stalls/εντολή Mem Stalls/εντολή = Mem accesses /εντολή x Miss rate x Miss penalty Mem accesses /εντολή = +.3 =.3 Instruction fetch Load/store Mem Stalls /εντολή =.3 x.5 x 5 =.975 CPI = = 2.75 Η ιδανική CPU χωρίς misses είναι 2.75/. =.88 φορές γρηγορότερη
67 Παράδειγµα Στο προηγούµενο παράδειγµα υποθέτουµε ότι διπλασιάζουµε τη συχνότητα του ρολογιού στα 4 MHZ. Πόσο γρηγορότερο είναι το µηχάνηµα για ίδιο miss rate και αναλογία εντολών; εδοµένου ότι η ταχύτητα της µνήµης δεν αλλάζει, το miss penalty καταναλώνει περισσότερους κύκλους CPU: Miss penalty = 5 x 2 = cycles. CPI =. +.3 x.5 x = = 3.5 Speedup = (CPI old x C old )/ (CPI new x C new ) = 2.75 x 2 / 3.5 =.36 Το νέο µηχάνηµα είναι µόνο.36 φορές ταχύτερο και όχι 2 φορές γρηγορότερο λόγω της επιπλέον επιβάρυνσης των cache misses. CPUs µε µεγαλύτερη συχνότητα ρολογιού, έχουν περισσότερους κύκλους/cache miss και µεγαλύτερη επιβάρυνση της µνήµης στο CPI.
68 2 επίπεδα Cache: L, L 2 CPU L Cache Hit Rate = H, Hit time = κύκλος (καθόλου Stall) L 2 Cache Hit Rate = H 2, Hit time = T 2 κύκλοι Main Memory Penalty λόγω προσπέλασης µνήµης, M
69 Cache 2 επιπέδων CPUtime = IC x (CPI execution + Mem Stalls/εντολή) x C Mem Stalls/εντολή = Mem accesses/εντολή x Stalls/access Για ένα σύστηµα µε 2 επίπεδα cache, χωρίς penalty όταν τα δεδοµένα βρεθούν στην L cache: Stalls/memory access = [miss rate L ] x [ Hit rate L 2 x Hit time L 2 + Miss rate L 2 x Memory access penalty) ] = (-H) x H2 x T2 + (-H)(-H2) x M L Miss, L2 Hit L Miss, L2 Miss: Προσπέλαση της Main Memory
70 Επίδοση της L2 Cache Memory Access Tree CPU Stalls/Memory Access CPU Memory Access L L Hit: Stalls = H x = (No Stall) L Miss: % = (-H) L 2 L2 Hit: (-H) x H2 x T2 L2 Miss: Stalls = (-H)(-H2) x M Stall cycles per memory access = (-H) x H2 x T2 + (-H)(-H2) x M
71 Παράδειγµα L2 Cache CPU µε CPI execution =. και συχνότητα 5 MHZ.3 memory accesses/εντολή. L cache : στα 5 MHZ µε miss rate 5% L 2 cache : στα 25 MHZ µε miss rate 3%, (T 2 = 2 κύκλοι) M (Memory access penalty) = κύκλοι. Να βρεθεί το CPI. CPI = CPI execution + Mem Stalls/εντολή Χωρίς Cache, CPI =. +.3 x = 3. Με L Cache, CPI =. +.3 x.5 x = 7.6 Mem Stalls/εντολή = Mem accesses/εντολή x Stalls/access Stalls/memory access = (-H) x H2 x T2 + (-H)(-H2) x M =.5 x.97 x x.3 x = =.247 Mem Stalls/εντολή = Mem accesses/εντολή x Stalls/access =.247 x.3 =.32 CPI = =.42 Speedup = 7.6/.42 = 5.35
72 3 επίπεδα Cache CPU L Cache L2 Cache Hit Rate = H, Hit time = κύκλος (καθόλου Stall) Hit Rate = H 2, Hit time = T 2 κύκλοι L3 Cache Hit Rate = H 3, Hit time = T 3 Main Memory Memory access penalty, M
73 Επίδοση της L3 Cache CPUtime = IC x (CPI execution + Mem Stalls/εντολή) x C Mem Stalls/εντολή = Mem accesses /εντολή x Stalls/access Για ένα σύστηµα µε 3 επίπεδα cache, χωρίς penalty όταν τα δεδοµένα βρεθούν στην L cache: Stalls/memory access = [miss rate L ] x [ Hit rate L 2 x Hit time L 2 + Miss rate L 2 x (Hit rate L3 x Hit time L 3 + Miss rate L 3 x Memory access penalty) ] = (-H) x H2 x T2 + (-H) x (-H2) x H3 x T3 + (-H)(-H2) (-H3)x M
74 Επίδοση της L3 Cache Memory Access Tree CPU Stalls/Memory Access CPU Memory Access L L Hit: Stalls = H x = (καθόλου Stall) L Miss: % = (-H) L 2 L2 Hit: (-H) x H2 x T2 L2 Miss: % = (-H)(-H2) L 3 L3 Hit: (-H) x (-H2) x H3 x T3 L3 Miss: (-H)(-H2)(-H3) x M Stalls/memory access = (-H) x H2 x T2 + (-H) x (-H2) x H3 x T3 + (-H)(-H2) (-H3) x M
75 Παράδειγµα L3 Cache CPU µε CPI execution =. και συχνότητα 5 MHZ.3 memory accesses/εντολή. L cache : στα 5 MHZ µε miss rate 5% L 2 cache : στα 25 MHZ µε miss rate 3%, (T 2 = 2 κύκλοι) L 3 cache : στα MHZ µε miss rate.5%, (T 3 = 5 κύκλοι) Memory access penalty, M= cycles. Να βρείτε το CPI. χωρίς Cache, CPI =. +.3 x = 3. Με L Cache, CPI =. +.3 x.5 x = 7.6 Με L 2 Cache, CPI =. +.3 x (.5 x.97 x x.3 x ) =.42 CPI = CPI execution + Mem Stalls/εντολή Mem Stalls/εντολή = Mem accesses/εντολή x Stall cycles/access Stalls/memory access = (-H) x H2 x T2 + (-H) x (-H2) x H3 x T3 + (-H)(-H2) (-H3) x M =.5 x.97 x x.3 x.985 x x.3 x.5 x = =.7 CPI =. +.3 x.7 =.24 Speedup σε σχέση µε L µόνο = 7.6/.24 = 6.2 Speedup σε σχέση µε L, L2 =.42/.24 =.5
76 Είδη των Cache Misses: 3C s Compulsory: Συµβαίνουν κατά την πρώτη πρόσβαση σε ένα block. Το block πρέπει να κληθεί από χαµηλότερα επίπεδα µνήµης και να τοποθετηθεί στην cache (αποκαλούνται και cold start misses ή first reference misses). 2Capacity: Τα blocks αποµακρύνονται από την cache επειδή δεν χωράνε σε αυτήν όλα όσα απαιτούνται κατά την εκτέλεση ενός προγράµµατος (το σύνολο των δεδοµένων που χειρίζεται ένα πρόγραµµα είναι πολύ µεγαλύτερο από την χωρητικότητα της cache). 3 Conflict: Στην περίπτωση των set associative ή direct mapped caches, conflict misses έχουµε όταν πολλά blocks απεικονίζονται στο ίδιο set (αποκαλούνται και collision misses ή interference misses).
77 Tα 3 Cs των Cache: Απόλυτα Miss Rates (SPEC92) Miss Rate / τύπο way 2-way 4-way 8-way Capacity Μέγεθος Cache (KB) Compulsory
78 Tα 3 Cs των Cache: Σχετικά Miss Rates (SPEC92) % -way Miss Rate / είδος 8% 6% 4% 2% 2-way 4-way 8-way Capacity % Cache Size (KB) Compulsory
79 Βελτιστοποίηση της επίδοσης της Cache Πώς; Περιορισµός του Miss Rate Μείωση του Cache Miss Penalty Μείωση του χρόνου για Cache Hit
80 Βελτιστοποίηση της επίδοσης της Cache Τεχνικές µείωσης του Miss Rate: * Μεγαλύτερο µέγεθος block * Αύξηση της χωρητικότητας της cache * Μεγαλύτερου βαθµού associativity * Pseudo-associative Caches * Victim caches * Hardware/Software prefetching εντολών-δεδοµένων * Compiler-controlled prefetching * βελτιστοποιήσεις στον Compiler Τεχνικές µείωσης του Cache Miss Penalty: * Cache 2ου επιπέδου (L 2 ) * merging write buffers * Early restart and critical word first * Non-blocking caches * Προτεραιότητα στα read misses έναντι των writes Τεχνικές µείωσης του Cache Hit Time: * Μικρές και απλές caches * Αποφυγή της µετάφρασης των διευθύνσεων κατά τη διάρκεια του indexing * Pipelining writes για γρήγορα write hits
81 Τεχνικές µείωσης του Miss Rate: Μεγαλύτερο µέγεθος Block Το µεγάλο µέγεθος block βελτιώνει την επίδοση της cache επειδή επωφελούµαστε από την spatial locality Για δεδοµένο µέγεθος cache, µεγαλύτερο µέγεθος block σηµαίνει λιγότερα cache block frames Η επίδοση βελτιώνεται µέχρι το σηµείο όπου λόγω του µικρού αριθµού των cache block frames αυξάνονται τα conflict misses και εποµένως και το συνολικό cache miss rate 25% Miss Rate 2% 5% % 5% % K 4K 6K 64K 256K Μέγεθος Block (bytes) 256
82 Τεχνικές µείωσης του Miss Rate: Μεγαλύτερο µέγεθος cache Με την αύξηση του µεγέθους της cache προκαλείται: αύξηση του hit time αύξηση του κατασκευαστικού κόστους Αυτή η τεχνική δηµοφιλής σε off-chip caches Σηµείωση : οι L2,L3 caches σήµερα έχουν µέγεθος όσο ήταν η Κύρια Μνήµη πριν χρόνια
83 Τεχνικές µείωσης του Miss Rate: Μεγαλύτερου βαθµού Associativity Παράδειγµα: Μέσος χρόνος πρόσβασης στη µνήµη vs. Miss Rate Cache Size Associativity (KB) -way 2-way 4-way 8-way (Μπλε σηµαίνει ότι ο µέσος χρόνος δεν βελτιώνεται µε την αύξηση του associativity)
84 Τεχνικές µείωσης του Miss Rate: Pseudo-Associative Cache Συνδυάζει το µικρό χρόνο αναζήτησης (hit time) των Direct Mapped caches και το µικρότερο αριθµό τωνr conflict misses στις 2-way set-associative caches. Η cache διαιρείται σε δύο τµήµατα: Όταν έχουµε cache miss, ελέγχουµε το άλλο µισό της cache για να δούµε αν τα δεδοµένα που αναζητάµε βρίσκονται εκεί. Στην περίπτωση αυτή έχουµε ένα pseudo-hit (slow hit) Ο ευκολότερος τρόπος υλοποίησης είναι η αναστροφή του most significant bit στο πεδίο index για να βρίσκουµε το άλλο block στο pseudo set. Hit Time Pseudo Hit Time Miss Penalty Time Μειονέκτηµα: είναι δύσκολη η αποδοτική υλοποίηση του CPU pipelining αν το L cache hit παίρνει ή 2 κύκλους. Χρησιµοποιείται καλύτερα σε caches που δεν είναι συνδεδεµένες απευθείας µε τη CPU (L 2 cache). Χρησιµοποιείται στην L 2 cache του MIPS R. Παρόµοια είναι και η L 2 του UltraSPARC.
85 Τεχνικές µείωσης του Miss Rate: Victim Caches Τα δεδοµένα που αποµακρύνονται από την cache τοποθετούνται σε έναν µικρό πρόσθετο buffer (victim cache). Σε περίπτωση cache miss ελέγχουµε το περιεχόµενο της victim cache πριν τα αναζητήσουµε στην κύρια µνήµη Jouppi [99]: Μία victim cache 4 εισόδων αποτρέπει το 2% έως 95% των conflict misses για µία 4 KB direct mapped cache Χρησιµοποιείται σε Alpha, HP PA-RISC µηχανήµατα. Address =? =? CPU CPU address Data Data in out Address In Out Tag Tag =? =? Data Cache Victim Cache Write Buffer buffer Lower Level Memory
86 Τεχνικές µείωσης του Miss Rate: Hardware/Compiler Prefetching εντολών και δεδοµένων Φέρνουµε εντολές ή δεδοµένα στην cache ή σε έναν εξωτερικό buffer (prefetch) πριν ζητηθούν από τη CPU. Παράδειγµα: Ο Alpha APX 264 φέρνει 2blocks σε κάθε miss: Το ζητούµενο block τοποθετείται στην cache και το αµέσως επόµενο σε έναν stream buffer εντολών. Η ίδια λογική εφαρµόζεται και στις προσπελάσεις δεδοµένων µε έναν data buffer. Μπορεί να επεκταθεί και για πολλαπλούς stream buffers δεδοµένων σε διαφορετικές διευθύνσεις (4 streams βελτιώνουν το data hit rate κατά 43%). Αποδεικνύεται ότι, σε ορισµένες περιπτώσεις, 8 stream buffers οι οποίοι χειρίζονται δεδοµένα ή εντολές, µπορούν να αποτρέψουν το 5-7% των συνολικών misses.
87 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations Βελτιστοποίηση του κώδικα επιτυγχάνοντας τοπικότητα κατά την προσπέλαση δεδοµένων : Αναδιοργάνωση των procedures στη µνήµη για τη µείωση των conflict misses. Merging Arrays: Βελτίωση της spatial locality µε έναν πίνακα δεδοµένων αντί 2 πίνακες. Loop Interchange: Αλλαγή της σειράς φωλιάσµατος των βρόχων για να προσπελαύνουµε τα δεδοµένα µε την ίδια σειρά όπως αποθηκεύονται στη µνήµη. Loop Fusion: Συνδυασµός 2 ή περισσοτέρων ανεξάρτητων βρόχων που περιέχουν τους ίδιους βρόχους και κάποιες κοινές µεταβλητές. Blocking: Βελτίωση της temporal locality προσπελαύνοντας ένα τµήµα µόνο των δεδοµένων επαναληπτικά αντί να διατρέχουµε ολόκληρες τις γραµµές ή τις στήλες.
88 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations Merging Arrays /* Before: 2 sequential arrays */ int val[size]; int key[size]; /* After: array of stuctures */ struct merge { int val; int key; }; struct merge merged_array[size]; Merging : Μειώνονται τα conflicts µεταξύ των στοιχείων των val και key Βελτίωση του spatial locality
89 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations /* Before */ for (k = ; k < ; k = k+) for (j = ; j < ; j = j+) for (i = ; i < 5; i = i+) x[i][j] = 2 * x[i][j]; /* After */ for (k = ; k < ; k = k+) for (i = ; i < 5; i = i+) for (j = ; j < ; j = j+) x[i][j] = 2 * x[i][j]; Loop Interchange Η προσπέλαση δεδοµένων που βρίσκονται σε συνεχόµενες θέσεις µνήµης και όχι µε απόσταση λέξεων βελτιώνει στο παράδειγµά µας την spatial locality.
90 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations /* Before */ for (i = ; i < N; i = i+) for (j = ; j < N; j = j+) a[i][j] = /b[i][j] * c[i][j]; for (i = ; i < N; i = i+) for (j = ; j < N; j = j+) d[i][j] = a[i][j] + c[i][j]; /* After */ for (i = ; i < N; i = i+) for (j = ; j < N; j = j+) { a[i][j] = /b[i][j] * c[i][j]; d[i][j] = a[i][j] + c[i][j]; } Loop Fusion Αντί 2 misses/access στα a & c τελικά miss/access Βελτίωση της spatial locality
91 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations /* Before */ for (i = ; i < N; i = i+) for (j = ; j < N; j = j+) {r = ; for (k = ; k < N; k = k+){ r = r + y[i][k]*z[k][j];}; x[i][j] = r; }; Blocking Οι 2 εσωτερικότεροι βρόχοι: Προσπελαύνουν όλα τα NxN στοιχεία του z[ ] Προσπελαύνουν επαναληπτικά τα N στοιχεία της γραµµής του y[ ] Εγγραφή των N στοιχείων της γραµµής του x[ ] Capacity Misses : είναι συνάρτηση του N και του µεγέθους της Cache: 3 NxNx4 <=µεγέθους της Cache => καθόλου capacity misses Βασική ιδέα: αναζητάµε τον BxB υποπίνακα που χωράει στην cache
92 Τεχνικές µείωσης του Miss Rate: Compiler Optimizations Blocking /* After */ for (jj = ; jj < N; jj = jj+b) for (kk = ; kk < N; kk = kk+b) for (i = ; i < N; i = i+) for (j = jj; j < min(jj+b-,n); j = j+) {r = ; for (k = kk; k < min(kk+b-,n); k = k+) { r = r + y[i][k]*z[k][j];}; x[i][j] = x[i][j] + r; }; B : Blocking Factor Capacity Misses αντί 2N 3 + N 2 -> 2N 3 /B +N 2 Πιθανών να επηρεάζονται και τα conflict misses
93 Τεχνικές µείωσης του Miss Penalty: Early Restart και Critical Word First εν περιµένουµε να µεταφερθεί το πλήρες block στην cache πριν την επανεκκίνηση της CPU: Early restart: Αµέσως µόλις φορτωθεί η ζητούµενη λέξη του block, αποστέλλεται στη CPU και συνεχίζεται η επεξεργασία των δεδοµένων από αυτήν. Critical Word First: Φορτώνεται πρώτη από όλο το block η ζητούµενη λέξη και αποστέλλεται στη CPU αµέσως µόλις φτάσει. Έτσι η CPU συνεχίζει την επεξεργασία ενώ οι υπόλοιπες λέξεις του block µεταφέρονται από την κύρια µνήµη. Είναι συνήθως χρήσιµες όταν το µέγεθος των cache block είναι µεγάλο. Τα προγράµµατα µε καλή spatial locality ζητούν δεδοµένα που βρίσκονται σε συνεχόµενες θέσεις µνήµης και δεν επωφελούνται από την τεχνική του early restart.
94 Τεχνικές µείωσης του Miss Penalty: Προτεραιότητα στα Read Misses έναντι των Writes Στις write-through caches µε write buffers παρουσιάζεται πρόβληµα µε τις συγκρούσεις RAW κατά την ανάγνωση από την κύρια µνήµη σε περίπτωση που έχουµε cache miss: Ο write buffer κρατά τα προσφάτως τροποποιηµένα δεδοµένα που χρειάζονται για την ανάγνωση. Μία λύση είναι απλά να περιµένουµε µέχρι να αδειάσει ο write buffer, αυξάνοντας έτσι το miss penalty (σε παλιούς MIPS κατά 5% ). Ελέγχουµε τα περιεχόµενα του write buffer πριν την ανάγνωση: αν δεν υπάρχουν εκεί τα ζητούµενα δεδοµένα, πρέπει να τα καλέσουµε από την κύρια µνήµη. Στις write-back caches, για ένα read miss αντικαθιστάται το block αν είναι dirty: Συνήθως: Πρώτα µεταφέρεται το dirty block στη µνήµη και στη συνέχεια πραγµατοποιείται η ανάγνωση. ιαφορετικά: Αντιγράφεται το dirty block σε έναν write buffer, στη συνέχεια πραγµατοποιείται η ανάγνωση, και τέλος η εγγραφή. Η CPU καθυστερεί λιγότερο γιατί ξεκινάει την επεξεργασία δεδοµένων αµέσως µετά την ανάγνωση.
95 Τεχνικές µείωσης του Miss Penalty: ιεύθυνση εγγραφής Merging write buffers Ένα cache block frame διαιρείται σε sub-blocks. Υπάρχει ένα valid bit ανά sub-block στα cache block frames. ε χρειάζεται να φορτώσουµε ένα ολόκληρο block στην περίπτωση miss αλλά µόνο το ζητούµενο sub-block ιεύθυνση εγγραφής Mem[] Mem[8] Mem[6] Mem[24] Mem[] Mem[8] Mem[6] Mem[24] κάθε buffer χωράει 4 λέξεις των 64-bit. Μόνο στο 2ο σχήµα αξιοποιούνται
96 Τεχνικές µείωσης του Miss Penalty: Non-Blocking Caches Οι Non-blocking caches ή lockup-free caches επιτρέπουν στις data caches να αποστέλλουν δεδοµένα που περιέχουν (cache hits) όσο διεκπεραιώνεται ένα miss: Απαιτείται out-of-order εκτέλεση των εντολών από τη CPU. hit under miss : µειώνει το effective miss penalty γιατί συνεχίζεται η επεξεργασία δεδοµένων από τη CPU αντί να αγνοούνται οι αιτήσεις για νέα δεδοµένα. hit under multiple miss ή miss under miss : µπορεί να προσφέρει επιπλέον µείωση του effective miss penalty by επικαλύπτοντας τα πολλαπλά misses. Αυξάνεται σηµαντικά η πολυπλοκότητα του cache controller αφού µπορεί να υπάρχουν πολλές µη διεκπεραιωµένες προσπελάσεις στη µνήµη. Απαιτεί πολλαπλά memory banks ώστε να εξυπηρετούνται πολλαπλές προσπελάσεις στη µνήµη. Παράδειγµα: Intel Pentium Pro/III επιτρέπει να εκκρεµούν µέχρι και 4 misses.
97 Τεχνικές µείωσης του Hit Time : Pipelined Writes Οέλεγχος του tag και η ενηµέρωση της cache από την προηγούµενη εντολή- µπορεί να γίνονται ταυτόχρονα (pipeline) αν υλοποιηθούν ως διαφορετικά στάδια Μόνο STORES µπορούν να υλοποιηθούν pipeline: πρέπει να αδειάσει ο buffer πριν από ένα miss Store r2, (r) Check r Add -- Sub -- Store r4, (r3) M[r]<-r2& check r3 Tag =? =? Delayed write buffer M u x Data CPU address Data Data in out Write buffer Lower level memory Delayed Write Buffer : which must be checked on reads; either complete write or read from buffer
98 Τεχνικές µείωσης του Hit Time : Avoiding Address Translation Αποστολή της virtual address στην cache: Ονοµάζεται Virtually Addressed Cache ή απλά Virtual Cache vs. Physical Cache Κάθε φορά που αλλάζουµε διεργασία η cache πρέπει να καθαρίζεται (flushed), διαφορετικά θα επιστρέψει λανθασµένα hits Κόστος : χρόνος flush + compulsory misses λόγω του αδειάσµατος της cache Χειρισµός των aliases (αποκαλούνται και synonyms); 2 διαφορετικές virtual addresses αντιστοιχίζονται στην ίδια physical address I/O πρέπει να επικοινωνεί µε την cache, εποµένως χρειάζονται οι virtual addresses Λύση για τα aliases: Το HW εγγυάται ότι ι συνδυασµός index field & direct mapped είναι µοναδικός : page coloring Λύση για το cache flush: Προσθέτουµε µία process identifier tag η οποία αναγνωρίζει τη διεργασία καθώς και τις διευθύνσεις της διεργασίας: δεν επιστρέφεται hit από λάθος διεργασία
99 Τεχνικές µείωσης του Hit Time : Virtually Addressed Caches CPU CPU CPU TB $ VA PA VA Tags $ TB VA VA PA Tags VA $ TB PA L2 $ PA PA MEM MEM Συµβατική Οργάνωση MEM Virtually Addressed Cache Μετάφραση µόνο σε miss Synonym προβλήµατα Επικάλυψη της $ προσπέλασης µε VA µετάφραση: Απαιτείται δείκτης στην $ index για να παραµένει σταθερό κατά τη µετάφραση
100 Σύνοψη Τεχνική MR MP HT Complexity Miss rate Miss Penalty Hit time Μεγαλύτερο µέγεθος Block + Υψηλότερη Associativity + Victim Caches + 2 Pseudo-Associative Caches + 2 HW Prefetching of Instr/Data + 2 Compiler Controlled Prefetching + 3 Compiler Reduce Misses + Προτεραιότητα στα Read Misses + Subblock Placement + + Early Restart & Critical Word st + 2 Non-Blocking Caches + 3 Second Level Caches + 2 Small & Simple Caches + Avoiding Address Translation + 2 Pipelining Writes +
101 Κύρια Μνήµη (Main( Memory) Ηκύρια µνήµη γενικώς χρησιµοποιεί Dynamic RAM (DRAM), στην οποία χρησιµοποιείται ένα transistor για την αποθήκευση ενός bit, αλλά απαιτεί µία περιοδική ανανέωση των δεδοµένων, διαβάζοντας όλες τις σειρές (~κάθε 8 msec). Η Static RAM µπορεί να χρησιµοποιηθεί αν το επιπρόσθετο κόστος, η χαµηλή πυκνότητα, και η κατανάλωση ενέργειας είναι ανεκτές (π.χ. Cray Vector Supercomputers). Η επίδοση της κύριας µνήµης επηρεάζεται από : Memory latency: Επηρεάζει το cache miss penalty και µετριέται από: Access time: Ο χρόνος που µεσολαβεί µεταξύ µίας αίτησης προς τη κύρια µνήµη και της στιγµής που η απαιτούµενη πληροφορία είναι διαθέσιµη στην cache/cpu. Cycle time: Ο ελάχιστος χρόνος µεταξύ διαδοχικών αιτήσεων προς τη µνήµη (µεγαλύτερος από τον access time στη DRAM για να επιτρέπει στις γραµµές διευθύνσεων να παραµένουν σταθερές) Memory bandwidth: Ο ρυθµός µεταφοράς δεδοµένων µεταξύ κύριας µνήµης και cache/cpu.
102 Οργάνωση της DRAM
103 Τεχνικές Βελτιστοποίησης του Memory Bandwidth Ευρύτερη Κύρια Μνήµη: Το εύρος της µνήµης αυξάνεται κατά έναν αριθµό λέξεων (συνήθως κατά το µέγεθος ενός cache block επιπέδου 2). Το Memory bandwidth είναι ανάλογο του εύρους της µνήµης. π.χ. ιπλασιάζοντας το εύρος της cache, διπλασιάζεται και το memory bandwidth Απλή Interleaved Memory: Η µνήµη οργανώνεται σε έναν αριθµό από banks καθένα µε εύρος λέξης. Ταυτόχρονες αναγνώσεις ή εγγραφές πολλών λέξεων επιτυγχάνονται µε αποστολή διευθύνσεων µνηµών σε πολλά memory banks σε µία φορά. Interleaving factor: Αναφέρεται στην αντιστοίχηση των διευθύνσεων µνήµης στα memory banks. π.χ. χρησιµοποιώντας 4 banks, bank έχει όλες τις λέξεις των οποίων οι διευθύνσεις είναι: (διεύθυνση λέξης) (mod) 4 =
104 Ευρύτερη µνήµη,bus και cache Στενό bus και εύρος cache µε interleaved memory 3 παραδείγµατα εύρους bus, memory, και memory interleaving για να επιτύχουµε µεγαλύτερο memory bandwidth Ο απλούστερος σχεδιασµός: Όλα έχουν το µέγεθος µίας λέξης
105 Memory Width, Interleaving: Παράδειγµα ίνεται ένα σύστηµα µε τις ακόλουθες παραµέτρους: Μέγεθος Cache Block = word, Memory bus width = word, Miss rate = 3% Miss penalty = 32 κύκλους : (4 κύκλοι για αποστολή της διεύθυνσης, 24 κύκλοι access time / λέξη, 4 κύκλοι για αποστολή µιας λέξης) Memory access / εντολή =.2 Ιδανικό execution CPI (αγνοώντας τα cache misses) = 2 Miss rate (µέγεθος block=2 word) = 2% Miss rate (µέγεθος block=4 words) = % Tο CPI του µηχανήµατος µε blocks της λέξης = 2 + (.2 x.3 x 32) = 3.5 Μεγαλώνοντας το µέγεθος του block σε 2 λέξεις δίνει το ακόλουθο CPI: 32-bit bus και memory, καθόλου interleaving = 2 + (.2 x.2 x 2 x 32) = bit bus και memory, interleaved = 2 + (.2 x.2 x ( ) = bit bus και memory, καθόλου interleaving = 2 + (.2 x.2 x x 32) = 2.77 Μεγαλώνοντας το µέγεθος του block σε 4 λέξεις, δίνει CPI: 32-bit bus και memory, καθόλου interleaving = 2 + (.2 x % x 4 x 32) = bit bus και memory, interleaved = 2 + (.2 x % x ( ) = bit bus και memory, καθόλου interleaving = 2 + (.2 x 2% x 2 x 32) = 2.77
106 Συστατικά ενός Computer System SDRAM PC/PC33-33MHZ bits wide 2-way interleaved ~ 9 MBYTES/SEC L L2 L3 Double Data Rate (DDR) SDRAM PC2 266MHZ (effective 33x2) bits wide 4-way interleaved ~2. GBYTES/SEC (second half 2) RAMbus DRAM (RDRAM) 4-8MHZ 6 bits wide channel ~.6 GBYTES/SEC ( per channel) CPU Caches Memory Controller Memory 6MHZ -.7GHZ (a multiple of system bus speed) Pipelined ( 7-2 stages ) Superscalar (max ~ 4 instructions/cycle) Memory Bus System Bus Controllers adapters Disks Displays Keyboards Examples: Alpha, AMD K7: EV6, 2MHZ Intel PII, PIII: GTL+ MHZ Intel P4 4MHZ NICs I/O Devices: I/O Buses Example: PCI, 33MHZ 32 bits wide 33 MBYTES/SEC Networks
107 Virtual Memory Η Virtual memory ελέγχει 2 επίπεδα της ιεραρχίας µνήµης: Κύρια µνήµη (DRAM) Μαζική αποθήκευση (συνήθως µαγνητικοί δίσκοι) Η κύρια µνήµη διαιρείται σε blocks κατανεµηµένες σε διαφορετικές τρέχουσες διεργασίες του συστήµατος: Βlocks καθορισµένου µεγέθους: Pages (µέγεθος 4k έως 64k bytes). Βlocks µεταβλητού µεγέθους : Segments (µέγεθος το πολύ 26 µέχρι 232) Σε δεδοµένο χρόνο, για κάθε τρέχουσα διεργασία, ένα κοµµάτι των δεδοµένων ή του κώδικα φορτώνεται στην κύρια µνήµη ενώ το υπόλοιπο είναι διαθέσιµο µόνο στους µαγνητικούς δίσκους. Ένα block κώδικα ή δεδοµένων που χρειάζεται για την εκτέλεση µιας διεργασίας αλλά δεν υπάρχει στη κύρια µνήµη έχει ως αποτέλεσµα ένα page fault (address fault) και το block πρέπει να φορτωθεί στην κύρια µνήµη από το δίσκο ή τον χειριστή του λειτουργικού συστήµατος (OS handler). Ένα πρόγραµµα µπορεί να εκτελεστεί σε οποιαδήποτε θέση της κύριας µνήµης ή του δίσκου χρησιµοποιώντας έναν µηχανισµό επανατοποθέτησης ο οποίος να ελέγχεται από το λειτουργικό σύστηµα που να αντιστοιχεί τις διευθύνσεις από τον χώρο των virtual addresses (logical program address) στο χώρο των physical addresses (κύρια µνήµη, δίσκος).
108 Μετάφραση Virtual -> Physical Addresses Συνεχόµενος χώρος των virtual addresses ενός προγράµµατος Οι Physical θέσεις των blocks A, B, C
109 Paging & Segmentation
110 Virtual Memory Πλεονεκτήµατα Έχουµε την ψευδαίσθηση ότι διαθέτουµε περισσότερη φυσική κύρια µνήµη Επιτρέπει τον επανατοποθέτηση των προγραµµάτων Προστατεύει από παράτυπη πρόσβαση στη µνήµη Virtual address Virtual page number Page offset Translation Physical page number Page offset Physical address
111 Αντιστοίχιση των Virtual Addresses σε Physical Addresses µέσω ενός πίνακα σελίδων (Page( Table)
112 Μετάφραση των Virtual Addresses Virtual page number Valid Page table Physical page or disk address Physical memory Disk storage
113 Page Table Page table register Virtual address Virtual page number Page offset Χρειάζονται 2 προσπελάσεις µνήµης: στο page table στο αντικείµενο Page table Valid 2 2 Physical page number 8 Ifthenpageisnot present in memory Physical page number Page offset Physical address
114 Τυπικές παράµετροι της Cache και της Virtual Memory
115 Virtual Memory Στρατηγικές Τοποθέτηση του block στην κύρια µνήµη: Η fully associative τεχνική χρησιµοποιείται για την ελάττωση του miss rate. Αντικατάσταση του block: The least recently used (LRU) block αντικαθίσταται όταν ένα νέο block έρχεται στη µνήµη από το δίσκο. Στρατηγική εγγραφών: Χρησιµοποιείται η τεχνική write back και µόνο οι dirty σελίδες µεταφέρονται από την κύρια µνήµη στο δίσκο. Για την τοποθέτηση των blocks στην κύρια µνήµη χρησιµοποιείται ένας page table. Ο page table δεικτοδοτείται από τον εικονικό αριθµό σελίδας (virtual page number) και περιέχει τη φυσική διεύθυνση (physical address) του block. Paging: To Offset συγχωνεύεται µε τη διεύθυνση της φυσικής σελίδας. Segmentation: Το Offset προστίθεται στη διεύθυνση του physical segment. Για την αξιοποίηση της address locality, χρησιµοποιείται συνήθως ο translation look-aside buffer (TLB) για την αποθήκευση των προσφάτως µεταφρασµένων διευθύνσεων ώστε να αποφεύγεται προσπέλαση της µνήµης προκειµένου να διαβαστεί ο πίνακας σελίδων (page table).
116 Επιτάχυνση της µετάφρασης διευθύνσεων: Translation Lookaside Buffer (TLB) TLB: Μία µικρή on-chip fully-associative cache που χρησιµοποιείται για τη µετάφραση διευθύνσεων. Αν µία virtual address υπάρχει µέσα στο TLB (TLB hit), δεν προσπελαύνεται ο πίνακας σελίδων της κύριας µνήµης. Virtual Page Number TLB Entries Valid Valid Tag Physical Page or Disk Address Physical Page Address TLB (on-chip) Entries Physical Memory Page Table (in main memory) Disk Storage
117 Η λειτουργία του Alpha AXP 264 Data TLB κατά τη µετάφραση των διευθύνσεων Virtual address TLB = 32 blocks Data cache = 256 blocks Η πρόσβαση στα TLB γίνεται συνήθως µε την τεχνική pipeline Valid Read Permission Write Permission
118 TLB & Cache Operation TLB Operation Virtual address TLB access Cache is physically-addressed TLB miss use page table No TLB hit? Yes Physical address No Write? Yes Cache operation Try to read data from cache No Write access bit on? Yes Cache miss stall No Cache hit? Yes Write protection exception Write data into cache, update the tag, and put the data and the addre ss into the write buffer Deliver data to the CPU
119 Συνδυασµός των Cache, TLB, Virtual Memory Cache TLB Virtual Είναι δυνατό? Πότε? Memory Miss Hit Hit Ναι, δεν ελέγχεται το page table Hit Miss Hit TLB miss, βρίσκεται στο page table Miss Miss Hit TLB miss, cache miss Miss Miss Miss Page fault Miss Hit Miss Αδύνατο, αν όχι στη µνήµη ούτε στο TLB Hit Hit Miss Αδύνατο, αν όχι στη µνήµη ούτε στο TLB ή στην cache Hit Miss Miss Αδύνατο, αν όχι στη µνήµη ούτε στην cache
120 Σύνοψη
Processor-Memory (DRAM) ιαφορά επίδοσης
Processor-Memory (DRAM) ιαφορά επίδοσης µproc 6%/yr 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999 2 2 22 23 24 25 Performance Processor-Memory Performance Gap: (grows 5% /
Διαβάστε περισσότεραΕίδη των Cache Misses: 3C s
Είδη των Cache Misses: 3C s 1 Compulsory: Συμβαίνουν κατά την πρώτη πρόσβαση σε ένα block. Το block πρέπει να κληθεί από χαμηλότερα επίπεδα μνήμης και να τοποθετηθεί στην cache (αποκαλούνται και cold start
Διαβάστε περισσότεραΕθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών - Μηχανικών Υπολογιστών. Αρχιτεκτονική Υπολογιστών Νεκτάριος Κοζύρης. Cache Optimizations
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών - Μηχανικών Υπολογιστών Αρχιτεκτονική Υπολογιστών Νεκτάριος Κοζύρης Cache Optimizations Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Διαβάστε περισσότεραProcessor-Memory (DRAM) ιαφορά επίδοσης
Processor-Memory (DRAM) ιαφορά επίδοσης µproc 6%/yr 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999 2 2 22 23 24 25 Performance Processor-Memory Performance Gap: (grows 5% /
Διαβάστε περισσότεραΕίδη των Cache Misses: 3C s
Είδη των Cache Misses: 3C s Compulsory: Συµβαίνουν κατά την πρώτη πρόσβαση σε ένα block. Το block πρέπει να κληθεί από χαµηλότερα επίπεδα µνήµης και να τοποθετηθεί στην cache (αποκαλούνται και cold start
Διαβάστε περισσότεραProcessor-Memory (DRAM) Διαφορά επίδοσης
Performance Processor-Memory (DRAM) Διαφορά επίδοσης 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999 2 2 22 23 24 25 µproc 6%/yr Processor-Memory Performance Gap: (grows 5%
Διαβάστε περισσότεραProcessor-Memory (DRAM) ιαφορά επίδοσης
Processor-Memory (DRAM) ιαφορά επίδοσης µproc 6%/yr Processor-Memory Performance Gap: (grows 5% / year) DRAM 7%/yr. Performance 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999
Διαβάστε περισσότεραΟργάνωση Ιεραρχίας Μνήμης - Caches
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών - Μηχανικών Υπολογιστών Αρχιτεκτονική Υπολογιστών Νεκτάριος Κοζύρης Οργάνωση Ιεραρχίας Μνήμης - Caches Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό
Διαβάστε περισσότεραCach O p i timisati tions
Cache Optimisations i 1 Διαφορά Επίδοσης Processor-Memory Performance Gap: (grows 50% / year) 2 SRAM vs DRAM 1-transistor DRAM cell 6-transistor SRAM cell 3 Intel 45nm 6T SRAM cell 4 Ιεραρχία Μνήμης Πρέπει
Διαβάστε περισσότερα(advanced_ca, ακ. έτος Cache Optimisations
Cache Optimisations Διαφορά Επίδοσης Processor-Memory Performance Gap: (grows 50% / year) Ιεραρχία Μνήμης Πρέπει να μειώσουμε το processor-memory performance gap Η προσπέλαση δεδομένων (code & data) δεν
Διαβάστε περισσότεραΕικονική Μνήμη (virtual memory)
Εικονική Μνήμη (virtual memory) Πολλά προγράμματα εκτελούνται ταυτόχρονα σε ένα υπολογιστή Η συνολική μνήμη που απαιτείται είναι μεγαλύτερη από το μέγεθος της RAM Αρχή τοπικότητας (η μνήμη χρησιμοποιείται
Διαβάστε περισσότεραΕθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών - Μηχανικών Υπολογιστών. Αρχιτεκτονική Υπολογιστών Νεκτάριος Κοζύρης.
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών - Μηχανικών Υπολογιστών Αρχιτεκτονική Υπολογιστών Νεκτάριος Κοζύρης Εικονική Μνήμη Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Διαβάστε περισσότεραΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 7ο μάθημα: Κρυφές μνήμες (cache) - εισαγωγή Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Σύστημα μνήμης! Η μνήμη είναι σημαντικό
Διαβάστε περισσότεραΚεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy)
Κεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy) 1 Συστήματα Μνήμης Η οργάνωση του συστήματος μνήμης επηρεάζει τη λειτουργία και απόδοση ενός μικροεπεξεργαστή: Διαχείριση μνήμης και περιφερειακών (Ι/Ο) απότολειτουργικόσύστημα
Διαβάστε περισσότεραΙόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Ιεραρχία συχνά και το
Διαβάστε περισσότεραΠροχωρηµένα Θέµατα Αρχιτεκτονικής
Προχωρηµένα Θέµατα Αρχιτεκτονικής Memory Hierarchy Design. Λιούπης Ιεραρχία Μνήµης Τα προγράµµατα απαιτούν όλο και περισσότερη και πιο γρήγορη µνήµη Γρήγορη και µεγάλη µνήµη -> ακριβή Αυτό οδηγεί σε ιεραρχία
Διαβάστε περισσότεραΔιάλεξη 15 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης
ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 5 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης Νίκος Μπέλλας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πόσο μεγάλη είναι μια μνήμη cache;
Διαβάστε περισσότεραΙεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Για βελτίωση της απόδοσης
Διαβάστε περισσότεραΑσκήσεις Caches
Ασκήσεις Caches 1 Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4-way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1
Διαβάστε περισσότεραΥ- 01 Αρχιτεκτονική Υπολογιστών Υπόβαθρο: Κρυφές μνήμες
Υ- 01 Αρχιτεκτονική Υπολογιστών Υπόβαθρο: Κρυφές μνήμες Αρης Ευθυμίου Το σημερινό μάθημα Κρυφές μνήμες (cache memory) Βασική οργάνωση, παράμετροι: γραμμές, συσχετιστικότητα, συνολική χωρητικότητα Επίδοση:
Διαβάστε περισσότεραΆσκηση 1η. Θεωρήστε ένα σύστημα μνήμης με μία cache: 4 way set associative μεγέθους 256ΚΒ,
Ασκήσεις Caches Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4 way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1 byte
Διαβάστε περισσότεραΠΛΕ- 027 Μικροεπεξεργαστές 9ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Κρυφές μνήμες εισαγωγή
ΠΛΕ- 027 Μικροεπεξεργαστές 9ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Κρυφές μνήμες εισαγωγή Αρης Ευθυμίου Σύστημα μνήμης Η μνήμη είναι σημαντικό κομμάτι ενός υπολογιστή Επηρεάζει κόστος, ταχύτητα, κατανάλωση
Διαβάστε περισσότεραΑσκήσεις Caches
Ασκήσεις Caches 1 Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4-way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1
Διαβάστε περισσότεραΕικονική Μνήμη (Virtual Μemory)
ΗΥ 431 Αρχιτεκτονική Παραλλήλων Συστημάτων Διάλεξη 16 Εικονική Μνήμη (Virtual Μemory) Νίκος Μπέλλας Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Απλό πείραμα int *data = malloc((1
Διαβάστε περισσότεραΠΛΕ- 027 Μικροεπεξεργαστές
ΠΛΕ- 027 Μικροεπεξεργαστές 10ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Εικονική μνήμη, σχεδίαση αποδοτικής κρυφής μνήμης, προγραμματισμός για κρυφή μνήμη Αρης Ευθυμίου Εικονική μνήμη ως cache Η κύρια
Διαβάστε περισσότεραΑσκήσεις Caches. Αρχιτεκτονική Υπολογιστών. 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: Νεκ. Κοζύρης
Αρχιτεκτονική Υπολογιστών 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: 2014-2015 Νεκ. Κοζύρης nkoziris@cslab.ece.ntua.gr Ασκήσεις Caches http://www.cslab.ece.ntua.gr/courses/comparch/ Άδεια Χρήσης Το παρόν εκπαιδευτικό
Διαβάστε περισσότεραΕικονική Μνήμη (Virtual Μemory)
ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 16 Εικονική Μνήμη (Virtual Μemory) Νίκος Μπέλλας Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Απλό πείραμα int *data = malloc((1
Διαβάστε περισσότεραΕικονική Μνήμη (virtual memory)
Εικονική Μνήμη (virtual memory) Πολλά προγράμματα εκτελούνται ταυτόχρονα σε ένα υπολογιστή Η συνολική μνήμη που απαιτείται είναι μεγαλύτερη από το μέγεθος της RAM Αρχή τοπικότητας (η μνήμη χρησιμοποιείται
Διαβάστε περισσότεραΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ Η/Υ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ Η/Υ ΤΕΛΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΤΗΝ ΟΡΓΑΝΩΣΗ ΣΤΟΥΣ Η/Y (ΗΥ232) Τετάρτη, 21 Δεκεμβρίου 2016 ΔΙΑΡΚΕΙΑ ΔΙΑΓΩΝΙΣΜΑΤΟΣ 3 ΩΡΕΣ Για πλήρη
Διαβάστε περισσότεραVirtual Memory. Αρχιτεκτονική Υπολογιστών. 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: Νεκ. Κοζύρης
Αρχιτεκτονική Υπολογιστών 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: 24-25 Νεκ. Κοζύρης nkoziris@cslab.ece.ntua.gr Virtual Memory http://www.cslab.ece.ntua.gr/courses/comparch/ Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό
Διαβάστε περισσότεραΑρχιτεκτονική υπολογιστών
1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 4 : Κρυφή Μνήμη Καρβούνης Ευάγγελος Δευτέρα, 30/11/2015 Χαρακτηριστικά Θέση Χωρητικότητα Μονάδα Μεταφοράς
Διαβάστε περισσότεραProcessor-Memory (DRAM) Διαφορά επίδοςθσ
Performance Processor-Memory (DRAM) Διαφορά επίδοςθσ 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999 2 2 22 23 24 25 µproc 6%/yr Processor-Memory Performance Gap: (grows 5%
Διαβάστε περισσότεραΤμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών H/Y Department of Electrical and Computer Engineering. Εργαστήριο 8. Χειμερινό Εξάμηνο
Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών H/Y Department of Electrical and Computer Engineering Οργάνωση και Σχεδίαση Η/Y (HY232) Εργαστήριο 8 Χειμερινό Εξάμηνο 2016-2017 1. Προσομοίωση λειτουργίας ιεραρχίας
Διαβάστε περισσότεραΙεραρχία Μνήμης. Εικονική μνήμη (virtual memory) Επεκτείνοντας την Ιεραρχία Μνήμης. Εικονική Μνήμη. Μ.Στεφανιδάκης
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής ρχιτεκτονική Υπολογιστών 2016-17 Εικονική Μνήμη (και ο ρόλος της στην ιεραρχία μνήμης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Δευτερεύουσα μνήμη
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΑΡΧΙΤΕΚΤΟΝΙΚΗ
Διαβάστε περισσότεραi Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2015-16 Τεχνολογίες Κύριας (και η ανάγκη για χρήση ιεραρχιών μνήμης) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης i Στα σύγχρονα
Διαβάστε περισσότεραΑρχιτεκτονική Υπολογιστών
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αρχιτεκτονική Υπολογιστών Υποσύστημα μνήμης Διδάσκων: Επίκουρος Καθηγητής Αριστείδης Ευθυμίου Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Διαβάστε περισσότεραΑρχιτεκτονική Υπολογιστών
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αρχιτεκτονική Υπολογιστών Υποσύστημα μνήμης Διδάσκων: Επίκουρος Καθηγητής Αριστείδης Ευθυμίου Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Διαβάστε περισσότεραΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 9ο μάθημα: Κρυφές μνήμες εικονική μνήμη Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Μεγαλύτερη associadvity! Rules of thumb:
Διαβάστε περισσότεραΤεχνολογίες Κύριας Μνήμης
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Τεχνολογίες Κύριας (και η ανάγκη για χρήση ιεραρχιών μνήμης) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Κύρια Μνήμη
Διαβάστε περισσότεραΔιάλεξη 14 Εισαγωγή στην Ιεραρχία Μνήμης
ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 14 Εισαγωγή στην Ιεραρχία Μνήμης Νίκος Μπέλλας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων 1 H Μικρο-αρχιτεκτονική μας 4 1 0 PCSrc IF/ID Control ID/EX
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ε Ρ Γ ΑΣ Τ ΗΡ ΙΟ Υ ΠΟΛΟΓΙΣ Τ ΙΚΩΝ Σ Υ Σ Τ ΗΜΑΤΩΝ w w w. c s l ab.ece.ntua.gr
Διαβάστε περισσότεραΔΙΑΛΕΞΗ 8: ΕΙΚΟΝΙΚΗ (Virtual) ΜΝΗΜΗ
2/9/5 ΗΜΥ 32 -- ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΛΕΞΗ 8: ΕΙΚΟΝΙΚΗ (Virtual) ΜΝΗΜΗ Διδάσκουσα: ΜΑΡΙΑ Κ. ΜΙΧΑΗΛ Επίκουρη Καθηγήτρια, ΗΜΜΥ (mmichael@ucy.ac.cy) [Προσαρµογή από Computer Architecture,
Διαβάστε περισσότεραΙόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Εικονική Μνήμη. (και ο ρόλος της στην ιεραρχία μνήμης)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2011-12 Εικονική (και ο ρόλος της στην ιεραρχία μνήμης) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης Ιεραρχία η νέα τάση: [2011]
Διαβάστε περισσότεραΑ. Δίνονται οι. (i) στη. πρέπει να. πιο. (ii) $a0. $s0 θα πρέπει να. αποθήκευση. αυξάνει τον. f: sub sll add sub jr. h: addi sw sw.
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΡ ΙΟ ΥΠΟΛΟΟ ΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua. gr ΑΡΧΙΤΕΚΤΟΝΙΚΗ
Διαβάστε περισσότεραΠροηγμένοι Μικροεπεξεργαστές. Υποσύστημα Μνήμης
Προηγμένοι Μικροεπεξεργαστές Υποσύστημα Μνήμης An unbalanced system CPU Memory 2011-01-17 Εργαστήριο Ηλεκτρονικών Εφαρμογών 2 Memory Wall Στους πρώτους μικροεπεξεργαστές: Η μνήμη τόσο γρήγορη όσο και ο
Διαβάστε περισσότεραΖητήµατα Απόδοσης. Ιεραρχία Μνήµης. Αναγκαιότητα για Ιεραρχία Μνήµης. Processor-DRAM Gap (latency) Ε-85: Ειδικά Θέµατα Λογισµικού
Ε-85: Ειδικά Θέµατα Λογισµικού Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων Χειµερινό Εξάµηνο 2009-10 «Ιεραρχία Μνήµης και Τεχνικές Βελτιστοποίησης» Παναγιώτης Χατζηδούκας (Π.Δ. 407/80) Ζητήµατα Απόδοσης
Διαβάστε περισσότεραΘέµατα Φεβρουαρίου
Θέµατα Φεβρουαρίου 2-2 cslab@ntua 2- Θέµα ο (3%): Έστω η παρακάτω ακολουθία εντολών που χρησιµοποιείται για την αντιγραφ από µια θέση µνµης σε µια άλλη (memory-to-memory copy): lw $2, ($) sw $2, 2($) i)
Διαβάστε περισσότεραΥ- 01 Αρχιτεκτονική Υπολογιστών Ιεραρχία μνήμης: προχωρημένα θέματα
Υ- 01 Αρχιτεκτονική Υπολογιστών Ιεραρχία μνήμης: προχωρημένα θέματα Αρης Ευθυμίου Το σημερινό μάθημα Εικονική μνήμη και κρυφές μνήμες Physical/Virtual indexing Σκοπός: μείωση hit Ome Τεχνικές σχετικές
Διαβάστε περισσότεραΕπιπλέον διδακτικό υλικό κρυφών μνημών: set-associative caches, πολιτικές αντικατάστασης, χειρισμός εγγραφών
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Οργάνωση Υπολογιστών Επιπλέον διδακτικό υλικό κρυφών μνημών: set-associative caches, πολιτικές αντικατάστασης, χειρισμός εγγραφών Μανόλης Γ.Η. Κατεβαίνης Τμήμα Επιστήμης
Διαβάστε περισσότεραΟργάνωση Υπολογιστών (ΙI)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Οργάνωση Υπολογιστών (ΙI) (κύρια και κρυφή μνήμη) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Ένα τυπικό
Διαβάστε περισσότεραΑρχιτεκτονική Υπολογιστών
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 11: Κρυφή Μνήμη Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών http://arch.icte.uowm.gr/mdasyg
Διαβάστε περισσότεραΚεφάλαιο 5. ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ -. Σερπάνος 2. Σημείωση
Κεφάλαιο 5 ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ -. Σερπάνος 1 Σημείωση Οι παρούσες διαφάνειες παρέχονται ως συμπλήρωμα διδασκαλίας για το μάθημα «Αρχιτεκτονική Υπολογιστών» του Τμήματος Ηλεκτρολόγων Μηχανικών & Τεχνολογίας
Διαβάστε περισσότερα3 η ΑΣΚΗΣΗ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ntua.gr 3 η ΑΣΚΗΣΗ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ
Διαβάστε περισσότεραΕικονική Μνήμη (virtual memory)
Εικονική Μνήμη (virtual memory) Πολλά προγράμματα εκτελούνται ταυτόχρονα σε ένα υπολογιστή Η συνολική μνήμη που απαιτείται είναι μεγαλύτερη από το μέγεθος της RAM Αρχή τοπικότητας (η μνήμη χρησιμοποιείται
Διαβάστε περισσότεραΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός. Ενότητα 7(α) - Ιεραρχία Μνήμης
ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός Ενότητα 7(α) Ιεραρχία Μνήμης 1 Οργάνωση Συστήματος Μνήμης Μια από τις κυριότερες λειτουργίες ενός υπολογιστικού συστήματος ηαποθήκευσηκαιηανάκλησηπληροφοριώναπότιςμονάδες
Διαβάστε περισσότεραΕνότητα 2: Η κρυφή µνήµη και η λειτουργία της
Ενότητα 2: Η κρυφή µνήµη και η λειτουργία της Στην ενότητα αυτή θα αναφερθούµε εκτενέστερα στη λειτουργία και την οργάνωση της κρυφής µνήµης. Θα προσδιορίσουµε τις βασικές λειτουργίες που σχετίζονται µε
Διαβάστε περισσότεραΔΙΑΛΕΞΕΙΣ 6-7: ΚΡΥΦΗ ΜΝΗΜΗ (Cache)
ΗΜΥ 312 -- ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΛΕΞΕΙΣ 6-7: ΚΡΥΦΗ ΜΝΗΜΗ (Cache) Διδάσκων: Χάρης Θεοχαρίδης, ΗΜΜΥ ttheocharides@ucy.ac.cy [Προσαρμογή από Computer Architecture, Hennessy & Patterson,
Διαβάστε περισσότεραΕπανάληψη Ιεραρχία Μνήμης Memory Hierarchy. Κεφάλαιο 5- Ιεραρχία Μνήμης
Επανάληψη Ιεραρχία Μνήμης Memory Hierarchy 1 Ιδεατά θέλουμε να ισχύει για μια μνήμη: Άπειρη, γρήγορη και φτηνή μνήμη 2 Πραγματικότητα 3 Υπάρχει λύση; 4 Τοπικότητα Αναφοράς/Χρήσης (Locality of Reference)
Διαβάστε περισσότεραΤελική Εξέταση, Απαντήσεις/Λύσεις
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (ΗΜΜΥ) HMΜY 212 Οργάνωση Η/Υ και Μικροεπεξεργαστές Εαρινό Εξάμηνο, 2007 Τελική Εξέταση, Απαντήσεις/Λύσεις Άσκηση 1: Assembly για
Διαβάστε περισσότεραΑρχιτεκτονική Υπολογιστών
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 11: Κρυφή Μνήμη Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών http://arch.icte.uowm.gr/mdasyg
Διαβάστε περισσότεραΚύρια μνήμη. Μοντέλο λειτουργίας μνήμης. Ένα τυπικό υπολογιστικό σύστημα σήμερα. Οργάνωση Υπολογιστών (ΙI)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 015-16 Οργάνωση Υπολογιστών (ΙI) (κύρια και ) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Ένα τυπικό υπολογιστικό
Διαβάστε περισσότεραΠροηγμένοι Μικροεπεξεργαστές. Paging & Segmentation
Προηγμένοι Μικροεπεξεργαστές Paging & Segmentation Segmentation Τεχνική για σπάσουμε την μνήμη σε λογικά κομμάτια Κάθε κομμάτι αποθηκεύει πληροφορία σχετική με data segments for each process code segments
Διαβάστε περισσότεραΕικονική Μνήμη (virtual memory)
Εικονική Μνήμη (virtual memory) Πολλά προγράμματα εκτελούνται ταυτόχρονα σε ένα υπολογιστή Η συνολική μνήμη που απαιτείται είναι μεγαλύτερη από το μέγεθος της RAM Αρχή τοπικότητας (η μνήμη χρησιμοποιείται
Διαβάστε περισσότεραΕικονική Μνήμη (Virtual memory)
ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 16 Εικονική Μνήμη (Virtual memory) Νίκος Μπέλλας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων 1 Προβλήματα φυσικής μνήμης (1) Τι θα συμβεί εάν η μνήμη
Διαβάστε περισσότεραΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός Κεφάλαιο 5: Ιεραρχία Μνήμης Memory Hierarchy
ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός Κεφάλαιο 5: Ιεραρχία Μνήμης Memory Hierarchy 1 Main Memory Secondary Memory CPU Bus Input/Output Μια από τις κυριότερες λειτουργίες ενός υπολογιστικού
Διαβάστε περισσότεραΔΙΑΛΕΞΕΙΣ 6-7: ΚΡΥΦΗ ΜΝΗΜΗ (Cache)
ΗΜΥ 312 -- ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΛΕΞΕΙΣ 6-7: ΚΡΥΦΗ ΜΝΗΜΗ (Cache) Διδάσκουσα: ΜΑΡΙΑ Κ ΜΙΧΑΗΛ Επίκουρη Καθηγήτρια, ΗΜΜΥ (mmichael@ucyaccy) [Προσαρµογή από Computer Architecture, Hennessy
Διαβάστε περισσότεραΚεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy)
Κεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy) 1 Συστήματα Μνήμης Η οργάνωση του συστήματος μνήμης επηρεάζει τη λειτουργία και απόδοση ενός μικροεπεξεργαστή: Διαχείριση μνήμης και περιφερειακών (Ι/Ο) απότολειτουργικόσύστημα
Διαβάστε περισσότεραΔΙΑΛΕΞΗ 8: ΕΙΚΟΝΙΚΗ (Virtual) ΜΝΗΜΗ
ΗΜΥ 32 -- ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΛΕΞΗ 8: ΕΙΚΟΝΙΚΗ (Virtual) ΜΝΗΜΗ Διδάσκων: Χάρης Θεοχαρίδης, ΗΜΜΥ ttheocharides@ucy.ac.cy [Προσαρμογή από Computer Architecture, Hennessy & Patterson,
Διαβάστε περισσότεραΑρχιτεκτονική Υπολογιστών
ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αρχιτεκτονική Υπολογιστών Υποσύστημα μνήμης Διδάσκων: Επίκουρος Καθηγητής Αριστείδης Ευθυμίου Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Διαβάστε περισσότεραΛειτουργικά Συστήματα Η/Υ
Λειτουργικά Συστήματα Η/Υ Κεφάλαιο 8 «Ιδεατή Μνήμη» Διδάσκων: Δ. Λιαροκαπης Διαφάνειες: Π. Χατζηδούκας Ιδεατή Μνήμη Οργάνωση. Εισαγωγή. Ιδεατές και πραγματικές διευθύνσεις. Λογική οργάνωση. Τμηματοποίηση
Διαβάστε περισσότεραΕνσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems)
Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems) Μαθηµα 2 ηµήτρης Λιούπης 1 Intel SA-1110 µc StrongARM core. System-on-Chip. Εξέλιξη των SA-110 και SA-1100. 2 ARM cores ARM: IP (intellectual
Διαβάστε περισσότεραadd $t0,$zero, $zero I_LOOP: beq $t0,$s3, END add $t1, $zero,$zero J_LOOP: sub $t2, $s3, $t0 add $t2, $t2, $s1 int i, j, tmp; int *arr, n;
Άσκηση 1 η Μέρος Α Ζητούμενο: Δίνεται το παρακάτω πρόγραμμα σε C καθώς και μια μετάφραση του σε assembly MIPS. Συμπληρώστε τα κενά. Σας υπενθυμίζουμε ότι ο καταχωρητής $0 (ή $zero) είναι πάντα μηδέν. int
Διαβάστε περισσότεραΕΘΝΙKΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Ονοματεπώνυμο: ΑΜ:
ΕΘΝΙKΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Ονοματεπώνυμο: ΑΜ: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ (τμήμα Μ - Ω) Κανονική εξεταστική Φεβρουαρίου
Διαβάστε περισσότεραΕίδθ των Cache Misses: 3C s
Είδθ των Cache Misses: 3C s 1 Compulsory: Συμβαίνουν κατά τθν πρϊτθ πρόςβαςθ ςε ζνα block. Το block πρζπει να κλθκεί από χαμθλότερα επίπεδα μνιμθσ και να τοποκετθκεί ςτθν cache (αποκαλοφνται και cold start
Διαβάστε περισσότεραΣχεδιασµός της Ιεραρχίας Μνήµης. Pedro Trancoso
Σχεδιασµός της Ιεραρχίας Μνήµης Pedro Trancoso H&P Appendix C H&P Chapter 5 Μνήµη GIER Computer, Norway, ca. 1962 Micron, Automata Processor, 2014 2 1 Η Αρχή... Ideally one would desire an indefinitely
Διαβάστε περισσότεραΟργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση. Κεφάλαιο 5. Μεγάλη και γρήγορη: Αξιοποίηση της ιεραρχίας της µνήµης
Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση Κεφάλαιο 5 Μεγάλη και γρήγορη: Αξιοποίηση της ιεραρχίας της µνήµης Ασκήσεις Η αρίθµηση των ασκήσεων είναι από την 4 η έκδοση
Διαβάστε περισσότεραΜε τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή
Μνήμη Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή ηλεκτρονική συσκευή, σε προσωρινή ή μόνιμη βάση. Τα σύγχρονα
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ
Διαβάστε περισσότεραΛειτουργικά Συστήματα
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Λειτουργικά Συστήματα Ενότητα 8: Διαχείριση Μνήμης. Φυσικές και Λογικές Διευθύνσεις Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ
Διαβάστε περισσότεραΕΠΛ 605: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2018 ΕΡΓΑΣΙΑ 3 (13/10/2018) Ηµεροµηνία Παράδοσης δεύτερου µέρους: 18/10/2018
ΕΠΛ 605: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2018 ΕΡΓΑΣΙΑ 3 (13/10/2018) Ηµεροµηνία Παράδοσης δεύτερου µέρους: 18/10/2018 Ηµεροµηνία Παράδοσης πρώτου µέρους: 25/10/2018 Θα πρέπει να παραδώσετε
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ
Διαβάστε περισσότεραΕικονική Μνήµη. Κεφάλαιο 8. Dr. Garmpis Aristogiannis - EPDO TEI Messolonghi
Εικονική Μνήµη Κεφάλαιο 8 Υλικό και δοµές ελέγχου Οι αναφορές στην µνήµη υπολογίζονται δυναµικά κατά την εκτέλεση Ηδιεργασίαχωρίζεταισετµήµατα τα οποία δεν απαιτείται να καταλαµβάνουν συνεχόµενες θέσεις
Διαβάστε περισσότεραΗ ιεραρχία της μνήμης
Η ιεραρχία της μνήμης Οι περιορισμοί στο σχεδιασμό της μνήμης συνοψίζονται σε τρεις ερωτήσεις : 1) Πόση 2) Πόσο γρήγορη 3) Πόσο ακριβή Ερωτήματα-Απαντήσεις Ερώτημα πόση μνήμη. Είναι ανοικτό. Αν υπάρχει
Διαβάστε περισσότεραΣΥΣΚΕΥΕΣ ΑΠΟΘΗΚΕΥΣΗΣ (ΜΝΗΜΗ)
ΣΥΣΚΕΥΕΣ ΑΠΟΘΗΚΕΥΣΗΣ (ΜΝΗΜΗ) Συσκευές αποθήκευσης Ένας υπολογιστής προκειµένου να αποθηκεύσει δεδοµένα χρησιµοποιεί δύο τρόπους αποθήκευσης: Την Κύρια Μνήµη Τις συσκευές µόνιµης αποθήκευσης (δευτερεύουσα
Διαβάστε περισσότεραΕπανάληψη Ιεραρχία Μνήμης Memory Hierarchy. Κεφάλαιο 5- Ιεραρχία Μνήμης
Επανάληψη Ιεραρχία Μνήμης Memory Hierarchy 1 Οργάνωση Συστήματος Μνήμης Ένα υπολογιστικό σύστημα συνήθως διαθέτει πολλούς τύπους μνήμης Registers, buffers, caches, main memory, secondary memory (flash/ssd,
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ
Διαβάστε περισσότεραΔΙΑΧΕΙΡΙΣΗ ΜΝΗΜΗΣ. Λειτουργικά Συστήματα Ι. Διδάσκων: Καθ. Κ. Λαμπρινουδάκης ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι Μάθημα: Λειτουργικά Συστήματα Ι ΔΙΑΧΕΙΡΙΣΗ ΜΝΗΜΗΣ Διδάσκων: Καθ. Κ. Λαμπρινουδάκης clam@unipi.gr 1 ΕΙΣΑΓΩΓΗ Μνήμη : Πόρος ζωτικής σημασίας του οποίου η διαχείριση απαιτεί ιδιαίτερη
Διαβάστε περισσότεραΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ
Διαβάστε περισσότεραΜάθημα 8: Διαχείριση Μνήμης
Μάθημα 8: Διαχείριση Μνήμης 8.1 Κύρια και δευτερεύουσα μνήμη Κάθε μονάδα ενός υπολογιστή που χρησιμεύει για τη μόνιμη ή προσωρινή αποθήκευση δεδομένων ανήκει στην μνήμη (memory) του υπολογιστή. Οι μνήμες
Διαβάστε περισσότεραΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός. Ενότητα 7 Ιεραρχία Μνήμης
ΕΠΛ221: Οργάνωση Υπολογιστών και Συμβολικός Προγραμματισμός Ενότητα 7 Ιεραρχία Μνήμης 1 Οργάνωση Συστήματος Μνήμης Μια από τις κυριότερες λειτουργίες ενός υπολογιστικού συστήματος είναι η αποθήκευση και
Διαβάστε περισσότεραΕπανάληψη Ιεραρχία Μνήμης Memory Hierarchy. Κεφάλαιο 5- Ιεραρχία Μνήμης
Επανάληψη Ιεραρχία Μνήμης Memory Hierarchy 1 Ιδεατά θέλουμε να ισχύει για μια μνήμη: Άπειρη, γρήγορη και φτηνή μνήμη 2 Πραγματικότητα 3 Υπάρχει λύση; 4 Τοπικότητα Αναφοράς/Χρήσης (Locality of Reference)
Διαβάστε περισσότεραΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ
ΠΑΡΑΛΛΗΛΗ ΕΠΕΞΕΡΓΑΣΙΑ ΜΝΗΜΗ Πρωτόκολλα Συνέπειας Μνήµης σε Πολυεπεξεργαστικά Υπολογιστικά Συστήµατα ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΥΨΗΛΩΝ ΕΠΙ
Διαβάστε περισσότεραΔιαχείριση Κύριας Μνήμης
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Διαχείριση Κύριας Μνήμης Λειτουργικά Συστήματα Υπολογιστών 7ο Εξάμηνο, 2016-2017 Διαχείριση
Διαβάστε περισσότεραΛειτουργικά Συστήματα
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Λειτουργικά Συστήματα Ενότητα 8: Διαχείριση Μνήμης. Φυσικές και Λογικές Διευθύνσεις Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και
Διαβάστε περισσότεραΑσκήσεις στα Προηγμένα Θέματα Αρχιτεκτονικής Υπολογιστών
Ασκήσεις στα Προηγμένα Θέματα Αρχιτεκτονικής Υπολογιστών ακ. έτος 2006-2007 Νεκτάριος Κοζύρης Νίκος Αναστόπουλος {nkoziris,anastop}@cslab.ece.ntua.gr Άσκηση 1: pipelining Εξετάζουμε την εκτέλεση του παρακάτω
Διαβάστε περισσότεραΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι. Λειτουργικά Συστήματα Ι ΔΙΑΧΕΙΡΙΣΗ ΜΝΗΜΗΣ. Επ. Καθ. Κ. Λαμπρινουδάκης
ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι Μάθημα: Λειτουργικά Συστήματα Ι ΔΙΑΧΕΙΡΙΣΗ ΜΝΗΜΗΣ Διδάσκων: Επ. Καθ. Κ. Λαμπρινουδάκης clam@unipi.gr 1 ΕΙΣΑΓΩΓΗ Μνήμη : Πόρος ζωτικής σημασίας του οποίου η διαχείριση απαιτεί ιδιαίτερη
Διαβάστε περισσότεραHY425 Αρχιτεκτονική Υπολογιστών, Χειµερινό Εξάµηνο
Review from last lecture HY425 Αρχιτεκτονική Υπολογιστών Διάλεξη 04 Δηµήτρης Νικολόπουλος, Αναπληρωτής Καθηγητής Τµήµα Επιστήµης Υπολογιστών Πανεπιστήµιο Κρήτης Speed Up Pipeline Depth; if ideal CPI is
Διαβάστε περισσότεραΠαραλληλισμός σε επίπεδο εντολών
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2015-16 Παραλληλισμός σε επίπεδο εντολών (Pipelining και άλλες τεχνικές αύξησης απόδοσης) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης
Διαβάστε περισσότερα