Εφαρμογή σε υπολογισμούς αραιών πινάκων. Αντώνιος - Κορνήλιος Κούρτης 1 / 43. Εργαστήριο Υπολογιστικών Συστημάτων ΕΜΠ
|
|
- Αγάθη Λαιμός
- 8 χρόνια πριν
- Προβολές:
Transcript
1 Ανάπτυξη Λογισμικού και Τεχνικών Συμπίεσης Δεδομένων για τη Βελτίωση της Επίδοσης Υπολογιστικών Εφαρμογών σε Παράλληλες Αρχιτεκτονικές Μοιραζόμενης Μνήμης Εφαρμογή σε υπολογισμούς αραιών πινάκων Αντώνιος - Κορνήλιος Κούρτης Εργαστήριο Υπολογιστικών Συστημάτων ΕΜΠ 1 / 43
2 Σκελετός Παράλληλα Συστήματα Μοιραζόμενης Μνήμης Συμπίεση για βελτίωση επίδοσης εφαρμογών με έντονες προσβάσεις μνήμης σε ΠΣΜΜ Αραιοί πίνακες και SpMxV CSR-DU CSR-VI CSX 2 / 43
3 Σκελετός Παράλληλα Συστήματα Μοιραζόμενης Μνήμης Υπόβαθρο Συμπίεση για βελτίωση επίδοσης εφαρμογών με έντονες προσβάσεις μνήμης σε ΠΣΜΜ Αραιοί πίνακες και SpMxV CSR-DU CSR-VI Συμβολή CSX 2 / 43
4 Πολυπύρηνοι επεξεργαστές Η εποχή των πολυπύρηνων επεξεργαστών (multicore era) (διέξοδος των αρχιτεκτόνων στο φράγμα της σειριακής επίδοσης) ( ) απαιτείται αλλαγή στο λογισμικό A τρόπος προγραμματισμού (εξετάζουμε εφαρμογές χωρίς κόστος παραλληλοποίησης) επίδοση core L1 core L1 core L1 core L1 L2 L2 main memory (or off-chip cache) 3 / 43
5 Κλάσεις εφαρμογών (ως προς την επίδοσή τους σε ένα σύστημα μοιραζόμενης μνήμης) core core core core L1 L1 L1 L1 L2 L2 main memory (or off-chip cache) 4 / 43
6 Κλάσεις εφαρμογών (ως προς την επίδοσή τους σε ένα σύστημα μοιραζόμενης μνήμης) Καλή συμπεριφορά χρονική τοπικότητα αναφορών χωρίς εξαρτήσεις core core core core L1 L1 L1 L1 L2 L2 main memory (or off-chip cache) 4 / 43
7 Κλάσεις εφαρμογών (ως προς την επίδοσή τους σε ένα σύστημα μοιραζόμενης μνήμης) Εφαρμογές με έντονες προσβάσεις μνήμης έλλειψη χρονικής τοπικότητας αναφορών υψηλός λόγος προσβάσεων μνήμης προς πράξεις υπολογισμών περιορισμένη επεκτασιμότητα λόγω κορεσμού core core core core L1 L1 L1 L1 L2 L2 main memory (or off-chip cache) 4 / 43
8 Προτεινόμενη αντιμετώπιση: Συμπίεση ανταλλαγή κύκλων μνήμης για κύκλους υπολογισμών c c m c m c c 5 / 43
9 Προτεινόμενη αντιμετώπιση: Συμπίεση ανταλλαγή κύκλων μνήμης για κύκλους υπολογισμών c c m c m c c c m κόστος αποσυμπίεσης 5 / 43
10 Προτεινόμενη αντιμετώπιση: Συμπίεση ανταλλαγή κύκλων μνήμης για κύκλους υπολογισμών c c m c m c c c κόστος αποσυμπίεσης m c c c m c προϋπόθεση: υπερκέραση κόστους αποσυμπίεσης 5 / 43
11 Ανακεφαλαίωση Πρόβλημα: } Έντονες προσβάσεις στη μνήμη Περιορισμένη επεκτασιμότητα Πολυπύρηνοι επεξεργαστές Προσέγγιση: { } προσβάσεων μνήμης Συμπίεση Βελτίωση επίδοσης υπολογισμών Εφαρμογή: Υπολογισμοί αραιών πινάκων πυρήνας SpMxV 6 / 43
12 Αραιοί πίνακες Μεγάλος αριθμός μηδενικών Εφαρμογές (επιστημονικές): μερικές διαφορικές εξισώσεις γράφοι γραμμικός προγραμματισμός Αποδοτική αναπαράσταση (μέγεθος και υπολογισμοί) μη-μηδενικές αριθμητικές τιμές δεδομένα δομής πίνακα Καθιερωμένα σχήματα αποθήκευσης: COO: πρώτη προσέγγιση CSR: βασική προσέγγιση (base-line) BCSR: εξελιγμένη προσέγγιση (state-of-the-art) 7 / 43
13 Σχήμα COO COOrdinate format Απoθήκευση μη-μηδενικών τιμών Συντεταγμένες για κάθε μη-μηδενική τιμή row_ind: col_ind: values: nnz 8 / 43
14 Σχήμα COO COOrdinate format Απoθήκευση μη-μηδενικών τιμών Συντεταγμένες για κάθε μη-μηδενική τιμή row_ind: col_ind: values: nnz 8 / 43
15 Σχήμα COO COOrdinate format Απoθήκευση μη-μηδενικών τιμών Συντεταγμένες για κάθε μη-μηδενική τιμή row_ind: col_ind: values: nnz 8 / 43
16 Σχήμα CSR (Compressed Sparse Row) nrows+1 row_ptr: col_ind: values: nnz 9 / 43
17 Σχήμα CSR (Compressed Sparse Row) nrows+1 row_ptr: col_ind: values: nnz 9 / 43
18 SpMxV πολλαπλασιασμός αραιού πίνακα με διάνυσμα y = A x, όπου A αραιός Σημαντικός υπολογιστικός πυρήνας λύση ΜΔΕ (GMRES, CG) για (CFD, economic modeling) γράφοι (PageRank) έντονη ερευνητική δραστηριότητα a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 41 a 42 a 43 a 14 a 24 a 34 a 44 x 1 x 2 x 3 = x 4 y 1 = a 1i x i y 2 = a 2i x i y 3 = a 3i x i y 4 = a 4i x i 10 / 43
19 SpMxV πολλαπλασιασμός αραιού πίνακα με διάνυσμα y = A x, όπου A αραιός Σημαντικός υπολογιστικός πυρήνας λύση ΜΔΕ (GMRES, CG) για (CFD, economic modeling) γράφοι (PageRank) έντονη ερευνητική δραστηριότητα a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 a 41 a 42 a 43 a 14 a 24 a 34 a 44 x 1 x 2 x 3 = x 4 y 1 = a 1i x i y 2 = a 2i x i y 3 = a 3i x i y 4 = a 4i x i 10 / 43
20 SpMxV πολλαπλασιασμός αραιού πίνακα με διάνυσμα y = A x, όπου A αραιός Σημαντικός υπολογιστικός πυρήνας λύση ΜΔΕ (GMRES, CG) για (CFD, economic modeling) γράφοι (PageRank) έντονη ερευνητική δραστηριότητα a 11 a 12 a 13 a 14 y x 1 = a 21 x a 1i x i a 21 a 22 a 23 a 24 x 2 y a 31 a 32 a 33 a 34 2 = 1 + a 24 x 4 a 2i x i x 3 y 3 = = a 3i x i a 41 a 42 a 43 a 44 x 4 y 4 = a 4i x i 10 / 43
21 SpMxV για CSR for (i=0; i < N; i++) for (j=row_ptr[i]; j < row_ptr[i+1]; j++) y[i] += values[j] * x[col_ind[j]]; row_ptr: col_ind: x: x 0 x 1 x 2 x 3 x 4 x 5 values: y: y 0 y 1 y 2 y 3 y 4 y 5 11 / 43
22 SpMxV για CSR for (i=0; i < N; i++) for (j=row_ptr[i]; j < row_ptr[i+1]; j++) y[i] += values[j] * x[col_ind[j]]; i=3 row_ptr: (όρια γραμμής) col_ind: x: x 0 x 1 x 2 x 3 x 4 x 5 values: y: y 0 y 1 y 2 y 3 y 4 y 5 11 / 43
23 SpMxV για CSR i=3 row_ptr: (όρια γραμμής) col_ind: for (i=0; i < N; i++) for (j=row_ptr[i]; j < row_ptr[i+1]; j++) y[i] += values[j] * x[col_ind[j]]; (έμμεση πρόσβαση) x: x 0 x 1 x 2 x 3 x 4 x 5 ( ) values: ( ) y: y 0 y 1 y 2 y 3 y 4 y 5 11 / 43
24 Παραδοσιακές προσεγγίσεις βελτιστοποίησης SpMxV SpMxV χρησιμοποιείται συχνά πληθώρα εργασιών παραδοσιακός στόχος: βελτίωση επίδοσης υπολογισμών ειδικευμένα σχήματα αραιής αποθήκευσης (εκμετάλλευση κανονικοτήτων στους πίνακες) Παραδείγματα: διδιάστατα μπλοκ σταθερού μεγέθους BCSR [Im and Yelick 01] μονoδιάστατα μπλοκ μεταβλητού μεγέθους [Pinar and Heath 99] διαγώνια στοιχεία DIAG 12 / 43
25 Σχήμα BCSR Blocked CSR [Im and Yelick 01] όμοιο με CSR: μπλοκ r c αντί στοιχείων παραδοσιακός στόχος: βελτίωση επίδοσης υπολογισμών (register blocking) ειδικές εκδόσεις SpMxV γιά r c πιθανό padding A = brow ptr : bcol ind : ( ) blocks : bval : ( ) 13 / 43
26 Σχήμα BCSR Blocked CSR [Im and Yelick 01] όμοιο με CSR: μπλοκ r c αντί στοιχείων παραδοσιακός στόχος: βελτίωση επίδοσης υπολογισμών (register blocking) ειδικές εκδόσεις SpMxV γιά r c πιθανό padding A = brow ptr : bcol ind : ( ) blocks : bval : ( ) 13 / 43
27 Σχήμα BCSR Blocked CSR [Im and Yelick 01] όμοιο με CSR: μπλοκ r c αντί στοιχείων παραδοσιακός στόχος: βελτίωση επίδοσης υπολογισμών (register blocking) ειδικές εκδόσεις SpMxV γιά r c πιθανό padding A = brow ptr : bcol ind : ( ) blocks : bval : ( ) 13 / 43
28 Σχήμα BCSR Blocked CSR [Im and Yelick 01] όμοιο με CSR: μπλοκ r c αντί στοιχείων παραδοσιακός στόχος: βελτίωση επίδοσης υπολογισμών (register blocking) ειδικές εκδόσεις SpMxV γιά r c πιθανό padding A = brow ptr : bcol ind : ( ) blocks : bval : ( ) 13 / 43
29 Παραλληλοποίηση SpMxV (σύγχρονοι πολυπύρηνοι επεξεργαστές) Διαμερισμός δεδομένων - ανά γραμμές Ισοκατανομή φόρτου εργασίας - με βάση τα μη-μηδενικά στοιχεία thread 0 thread 1 both threads * = thread 0 thread 1 14 / 43
30 Επίδοση SpMxV (CSR) στη βιβλιογραφία αναφέρονται πολλά προβλήματα επίδοσης εκτεταμένη μελέτη επίδοσης σε 100 πίνακες [Goumas et al 09] SpMxV είναι εφαρμογή με έντονες προσβάσεις μνήμης¹ (παραδοσιακές προσεγγίσεις βελτίωσης υπολογισμών είναι άστοχες) ¹για πίνακες μεγαλύτερους από την cache 15 / 43
31 Επίδοση SpMxV (CSR) στη βιβλιογραφία αναφέρονται πολλά προβλήματα επίδοσης εκτεταμένη μελέτη επίδοσης σε 100 πίνακες [Goumas et al 09] SpMxV είναι εφαρμογή με έντονες προσβάσεις μνήμης¹ (παραδοσιακές προσεγγίσεις βελτίωσης υπολογισμών είναι άστοχες) all average εφαρμογή συμπίεσης για βελτίωση επίδοσης SpMxV ¹για πίνακες μεγαλύτερους από την cache 15 / 43
32 Σύνολο εργασίας CSR SpMxV (γιά nnz N) Ανάλυση δεδομένων προς συμπίεση: s idx : s val : nnz : ws : μέγεθος δείκτη στήλης μέγεθος αριθμητικής τιμής μη μηδενικές αριθμητικές τιμές όγκος δεδομένων συνόλου εργασίας ws = δεδομένα δομής αριθμητικές τιμές {}}{{}}{ nnz s idx + nnz s val s idx = 32 bit s val = 64 bit = δ δομής αρ τιμές 16 / 43
33 Ανακεφαλαίωση Συμπίεση για βελτίωση επίδοσης εφαρμογών με έντονες προσβάσεις μνήμη Αραιοί πίνακες και SpMxV CSR, BCSR SpMxV έντονες προσβάσεις στη μνήμη CSR-DU CSR-VI CSX 17 / 43
34 Συμπίεση δεδομένων δομής Καθιερωμένες προσεγγίσεις βελτιστοποίησης: επιτυγχάνουν συμπίεση (εμμέσα) BCSR ένας δείκτης στήλης ανά μπλοκ αλλά: μπορεί να οδηγήσει σε αύξηση όγκου 18 / 43
35 Συμπίεση δεδομένων δομής Καθιερωμένες προσεγγίσεις βελτιστοποίησης: επιτυγχάνουν συμπίεση (εμμέσα) BCSR ένας δείκτης στήλης ανά μπλοκ αλλά: μπορεί να οδηγήσει σε αύξηση όγκου Κωδικοποίηση δέλτα (για δεικτες στηλών): Παράδειγμα: ci δ τιμές δέλτα σε μία γραμμή: > 0 και < colind [Willcock and Lumsdaine 06] 18 / 43
36 Κωδικοποίηση δέλτα για δείκτες στηλών ci δ / 43
37 Κωδικοποίηση δέλτα για δείκτες στηλών α κωδικοποίηση κάθε τιμής ξεχωριστά (fine grain) υψηλό κόστος αποσυμπίεσης Εισάγονται εντολές διακλάδωσεις στον εσωτερικό βρόχο του SpMxV ci δ enc / 43
38 Κωδικοποίηση δέλτα για δείκτες στηλών α κωδικοποίηση κάθε τιμής ξεχωριστά (fine grain) υψηλό κόστος αποσυμπίεσης Εισάγονται εντολές διακλάδωσεις στον εσωτερικό βρόχο του SpMxV ci δ enc β DCSR [Willcock and Lumsdaine 06] 6 εντολές για την υλοποίηση του SpMxV μοτίβα (patterns) από σύνολα εντολών πολύπλοκο, όχι portable, εξαρτάται από τον πίνακα 19 / 43
39 Προτεινόμενη κωδικοποίηση δέλτα για δείκτες στηλών CSR-DU: coarse-grained η γραμμή χωρίζεται σε περιοχές μεταβλητού μεγέθους (περιοχές δέλτα) μέγεθος δέλτα ανά περιοχή ci δ enc DU εσωτερικοί βρόχοι χωρίς διακλαδώσεις μικρότερες δυνατότητες συμπίεσης μέγεθος περιοχής 19 / 43
40 Το σχήμα αποθήκευσης CSR-DU δεδομένα δομής πίνακας ctl: usize uflags body col_ind row_ptr usize 5 3 uflags D8 nr D16 header body (delta values) 4 20 / 43
41 CSR-DU επεκτάσεις αποστάσεις (άλματα) περιοχών μεγάλο μέγεθος δέλτα εξαιτίας αρχικής τιμής πεδίο ujmp στην επικεφαλίδα: απόσταση από προηγούμενη περιοχή εκτός εσωτερικού βρόχου 21 / 43
42 CSR-DU επεκτάσεις συνεχόμενα στοιχεία όταν τα στοιχεία είναι συνεχόμενα τα δεδομένα δομής μπορούν να παραληφθούν περιοχές με συνεχόμενα στοιχεία μέγεθος απόσταση από προηγούμενη περιοχή [Pinar and Heath 99] / 43
43 CSR-DU επεκτάσεις συνεχόμενα στοιχεία όταν τα στοιχεία είναι συνεχόμενα τα δεδομένα δομής μπορούν να παραληφθούν περιοχές με συνεχόμενα στοιχεία μέγεθος απόσταση από προηγούμενη περιοχή [Pinar and Heath 99] κωδικοποίηση παράμετρος seq: ελάχιστος αριθμός συνεχόμενων στοιχείων, για ομαδοποίηση πχ seq=7 τα στοιχεία του σχ τοποθετούνται σε περιοχές δέλτα 22 / 43
44 CSR-DU πειραματική αξιολόγηση Σύστημα: 2 quad-core Harpertown (2GHz, 6MB L2) C0 L1 C1 L1 C2 L1 C3 L1 Μεθοδολογία (SpMxV): σύνολο 50 πινάκων (από πραγματικές εφαρμογές) L2 L2 επαναληπτικά σύγκριση με CSR, BCSR (best) CPU CPU noseq, seq=4, seq=8 23 / 43
45 CSR-DU μείωση όγκου δεδομένων (σε σχέση με το CSR) CSR-DU: πίνακας dense: 249% για noseq 332% για seq μέση: 142% για noseq 193% για seq=8 211% για seq=4 BCSR: αυξάνει τον όγκο σε 28 (από τους 50) πίνακες -132% κατά μο (αύξηση) 162% στους 22 πίνακες που οδηγεί σε μείωση μόνο για 2 πίνακες καλύτερο από CSR-DU 24 / 43
46 CSR-DU μέση επιτάχυνση Speedup csr bcsr csrdu (noseq) csrdu (seq=8) csrdu (seq=4) Threads CSR-DU (seq = 4) 1 πυρήνας: -7% συγκριτικά με CSR 8 πυρήνες: 287% συγκριτικά με CSR, 35% συγκριτικά με BCSR 25 / 43
47 CSR-DU Επιλογή σχήματος Matrices csr bcsr (1x2) bcsr (1x3) bcsr (2x1) bcsr (2x2) bcsr (3x1) csrdu (noseq) csrdu (seq=8) csrdu (seq=4) Threads 1 πυρήνας: CSR-DU: 18 BCSR: 15 CSR:17 8 πυρήνες: CSR-DU: 43 BCSR: 4 CSR:3 26 / 43
48 Ανακεφαλαίωση CSR-DU κωδικοποίηση δέλτα χοντρού κόκκου συμπίεση δεδομένων δομής γενικό σχήμα χωρισμός πίνακα σε περιοχές περιοχές δέλτα κοινό μέγεθος τιμών δέλτα περιοχές με συνεχόμενα στοιχεία ωστόσο: δεδομένα δομής αποτελούν το 1 3 του ws 27 / 43
49 Συμπίεση αριθμητικών τιμών Τυπικά αποτελούν το μεγαλύτερο κομμάτι του ws Η συμπίεση είναι δύσκολη (γενικά): δεν περιέχουν εγγενή πλεονασμό πληροφορίας οι πράξεις ΚΥ οδηγούν σε στρογγυλοποιημένα αποτελέσματα sign exponent (11 bit) fraction (52 bit) / 43
50 Συμπίεση αριθμητικών τιμών Τυπικά αποτελούν το μεγαλύτερο κομμάτι του ws Η συμπίεση είναι δύσκολη (γενικά): δεν περιέχουν εγγενή πλεονασμό πληροφορίας οι πράξεις ΚΥ οδηγούν σε στρογγυλοποιημένα αποτελέσματα sign exponent (11 bit) fraction (52 bit) Σημαντικός αριθμός πινάκων με μικρό αριθμό μοναδικών τιμών (πλεονάζουσα πληροφορία) 28 / 43
51 Το σχήμα CSR-VI (CSR with Values Indexed) Έμμεση πρόσβαση τιμών CSR value structure values: nnz CSR-VI value structure val_ind: vals_unique: uv 29 / 43
52 Το σχήμα CSR-VI (CSR with Values Indexed) Έμμεση πρόσβαση τιμών CSR value structure values: nnz CSR-VI value structure val_ind: vals_unique: uv 29 / 43
53 Το σχήμα CSR-VI (CSR with Values Indexed) Έμμεση πρόσβαση τιμών CSR value structure values: nnz CSR-VI value structure val_ind: vals_unique: Ογκος δεδομένων CSR : nnz s val CSR-VI : uv s val + nnz s vi (s vi : μέγεθος δείκτη τιμής) s vi μικρότερος ακέραιος που μπορεί να δεικτοδοτήσει uv στοιχεία (πχ αν έχω 256 μοναδικές τιμές, s vi = 1 byte) uv 29 / 43
54 Το σχήμα CSR-VI (συζήτηση) Καταλληλότητα πινάκων (total-to-unique) ttu = nnz uv Υλοποίηση/επίδοση SpMxV for (i=0; i < N; i++) for (j=row_ptr[i]; j < row_ptr[i+1]; j++) y[i] += vals_unique[val_ind[j]] * x[col_ind[j]]; επιπλέον (έμμεση) πρόσβαση στη μνήμη τυχαία πρόσβαση στο vals_unique 30 / 43
55 CSR-VI πειραματική αξιολόγηση Σύστημα: 2 4 πυρήνες (ομοίως με CSR-DU) C0 L1 C1 L1 C2 L1 C3 L1 Μεθοδολογία (SpMxV): L2 L πίνακες (ttu 5) CSR-DUVI (συνδυασμός DU,VI) CPU CPU 31 / 43
56 CSR-VI/CSR-DUVI μείωση όγκου δεδομένων CSR-VI: μο: 392 % μέγιστη: 588 % ελάχιστη: 203 % CSR-DUVI: μο: 524 % (noseq) μο: 573 % (seq=4) μέγιστη: 881 % (seq=4) ελάχιστη: 283 % 32 / 43
57 CSR-VI μέση επιτάχυνση Speedup csr csrvi Threads 1 πυρήνας: 124% συγκριτικά με CSR 8 πυρήνες: 517% συγκριτικά με CSR 8 πυρήνες: 1 πίνακας με χειρότερη επίδοση (από CSR) 33 / 43
58 CSR-DUVI μέση επιτάχυνση csr csrduvi (noseq) csrduvi (seq=8) csrduvi (seq=4) Speedup Threads 8 πυρήνες: 123% συγκριτικά με CSR 8 πυρήνες: κανένας πίνακας με χειρότερη επίδοση (από CSR) μεγάλη μείωση όγκου δεδομένων ορισμένοι πίνακες χωράνε (σε σημαντικό ποσοστό) στη L2 34 / 43
59 Ανακεφαλαίωση CSR-DU δεδομένα δομής γενικό σχήμα περιοχές κωδικοποίηση δέλτα συνεχόμενα στοιχεία CSR-VI αριθμητικές τιμές ειδικό σχήμα κοινές τιμές έμμεσες αναφορές Πειραματική αξιολόγηση (Happertown) σημαντικά οφέλη στη συνέχεια: Πλαίσιο CSX προσαρμόσιμος SpMxV πυρήνας 35 / 43
60 CSX: Κίνητρο και προσέγγιση Κανονικότητες και σχήματα αποθήκευσης BCSR, [Pinar and Heath 99], DIAG πολλαπλές κανονικότητες composite formats [Agarwal et al 92] πολλαπλοί πίνακες κάθενας σε διαφορετικό σχήμα A x = (A 0 + A 1 ) x = A 0 x + A 1 x απαιτήσεις υποστήριξη πολλαπλών κανονικοτήτων επεκτασιμότητα προσαρμοσιμότητα 36 / 43
61 CSX: Κίνητρο και προσέγγιση Κανονικότητες και σχήματα αποθήκευσης BCSR, [Pinar and Heath 99], DIAG πολλαπλές κανονικότητες composite formats [Agarwal et al 92] πολλαπλοί πίνακες κάθενας σε διαφορετικό σχήμα A x = (A 0 + A 1 ) x = A 0 x + A 1 x απαιτήσεις υποστήριξη πολλαπλών κανονικοτήτων επεκτασιμότητα προσαρμοσιμότητα προσέγγιση σχήμα CSX (Compressed Sparse extended) επέκταση/γενίκευση περιοχών CSR-DU δημιουργία ειδικευμένου κώδικα SpMxV (στο χρόνο εκτέλεσης) ενοποιημένη ανίχνευση 36 / 43
62 Κανονικότητες CSX x x x περιοχές με γενικό τύπο για κάθε τύπο υλοποίηση της απαραίτητης πράξης (πχ SpMxV) 37 / 43
63 Κανονικότητες CSX x x x x x (y, x + i) (y, x) (y, x + 1) (y, x + 2) περιοχές με γενικό τύπο για κάθε τύπο υλοποίηση της απαραίτητης πράξης (πχ SpMxV) τύποι περιοχών περιοχές δέλτα συνεχόμενα οριζόντια στοιχεία 37 / 43
64 Κανονικότητες CSX x x x x x (y, x + i δ) (y, x) (y, x + δ) (y, x + 2 δ) περιοχές με γενικό τύπο για κάθε τύπο υλοποίηση της απαραίτητης πράξης (πχ SpMxV) τύποι περιοχών περιοχές δέλτα συνεχόμενα οριζόντια στοιχεία με σταθερή απόσταση δ 37 / 43
65 Κανονικότητες CSX x x x x x (y, x + i δ) x x x x x x x x x x x x x x x (y + i δ, x) (y + i δ, x + i δ) (y i δ, x + i δ) περιοχές με γενικό τύπο για κάθε τύπο υλοποίηση της απαραίτητης πράξης (πχ SpMxV) τύποι περιοχών περιοχές δέλτα συνεχόμενα οριζόντια στοιχεία με σταθερή απόσταση δ διαφορετικές κατευθύνσεις ειδικευμένος κώδικας ανάλλογα με τους τύπους περιοχών του πίνακα 37 / 43
66 Ανίχνευση κανονικοτήτων (1, 3) (2, 1) (2, 2) (2, 3) (2, 4) 1 1 (1, 3) (2, 1) (2, 2) (2, 3) (2, 4) ίδια σειρά με την αποθήκευση εύκολη ανίχνευση 38 / 43
67 Ανίχνευση κανονικοτήτων (1, 1) (1, 3) (2, 2) (3, 3) (4, 4) (1, 1) (1, 3) (2, 2) (3, 3) (4, 4) ίδια σειρά με την αποθήκευση εύκολη ανίχνευση 38 / 43
68 Ανίχνευση κανονικοτήτων (1, 1) (1, 3) (2, 2) (3, 3) (4, 4) i =nrows+j i j = min(i, j) (4, 1) (2, 1) (4, 2) (4, 3) (4, 4) (1, 1) (1, 3) (2, 2) (3, 3) (4, 4) (4, 1) (2, 1) (4, 2) (4, 3) (4, 4) sort (2, 1) (4, 1) (4, 2) (4, 3) (4, 4) ίδια σειρά με την αποθήκευση εύκολη ανίχνευση μετασχηματισμός (ανάλλογα με κανονικότητα) ταξινόμηση μετασχηματισμοί για διαφορετικές κανονικότητες (πχ μπλοκ) 38 / 43
69 Κωδικοποίηση πινάκων Η πλειονότητα: δ = 1 HORIZ,DIAG,VERT αλλά: DU8 DU16 DU32 Diagonal (1) Diagonal (11) Horizontal (1) Horizontal (2) Anti-diagonal (1) Vertical (1) ASIC_680ks stomach Chebyshev4 pre2 Si87H76 msdoor rajat31 39 / 43
70 Πειραματική αξιολόγηση stomach Si87H76 FEM_3D_thermal2 Ga41As41H72 cage13 rajat31 CSX (delta) CSX (horiz) CSX (full) G3_circuit F1 atmosmodj fdif202x202x / 43
71 Μελλοντικές κατευθύνσεις Ανακεφαλαίωση Συμπίεση CSR-DU CSR-VI CSX Μελλοντικές κατευθύνσεις: Πλαίσιο για προσαρμόσιμο πυρήνα SpMxV πίνακας (πχ συμμετρία πίνακα, τύπος δεδομένων) υποκείμενη αρχιτεκτονική (πχ αριθμός νημάτων,χαρακτηριστικά) Υποστήριξη διαφορετικών πράξεων αραιών πινάκων CSX Εφαρμογή τεχνικών συμπίεσης και άλλες κλάσεις υπολογισμών γράφοι βάσεις δεδομένων 41 / 43
72 Δημοσιεύσεις Improving the Performance of Multithreaded Sparse Matrix-Vector Multiplication using Index and Value Compression K Kourtis, G Goumas and N Koziris, ICPP08 Optimizing Sparse Matrix-Vector Multiplication Using Index and Value Compression K Kourtis and G Goumas and N Koziris CF08 Understanding the Performance of Sparse Matrix-Vector Multiplication G Goumas, K Kourtis, N Anastopoulos, Vs Karakasis and N Koziris PDP08 Performance Evaluation of the Sparse Matrix-Vector Multiplication on Modern Architectures Georgios Goumas, Kornilios Kourtis, Nikos Anastopoulos, Vasileios Karakasis and Nectarios Koziris The Journal of Supercomputing (October 2009) Υπό κρίση: Exploiting Compression Opportunities to Improve SpMxV Performance on Shared Memory Systems K Kourtis and G Goumas and N Koziris TACO CSX: An Extended Compression Format for SpMxV on Shared Memory Systems Kornilios Kourtis, Vasileios Karakasis, Georgios Goumas, and Nectarios Koziris SC10 42 / 43
73 EOF The First Rule of Program Optimization: Don t do it The Second Rule of Program Optimization (for experts only!): Don t do it yet - Michael A Jackson 43 / 43
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Μελέτη Tεχνικών Συμπίεσης Αραιών Πινάκων
Αντώνιος - Κορνήλιος Ε. Κούρτης
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ KΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Ανάπτυξη Λογισμικού και Τεχνικών Συμπίεσης
Αντώνιος - Κορνήλιος Κούρτης
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ KΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Ανάπτυξη Λογισμικού και Τεχνικών Συμπίεσης
Θέματα Μεταγλωττιστών
Γιώργος Δημητρίου Ενότητα 10 η : Βελτιστοποιήσεις Τοπικότητας και Παραλληλισμού: Εξαρτήσεις και Μετασχηματισμοί Βρόχων Επεξεργασία Πινάκων Παραλληλισμός επιπέδου βρόχου Λόγω παραλληλισμού δεδομένων Επιτυγχάνεται
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη 11η: 09/05/2007 1 Ζητήµατα Μεγάλης-Κλίµακας
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης του PageRank. Αρχιτεκτονική Μηχανής Αναζήτησης
Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό ιδάσκων ηµήτριος Κατσαρός, Ph.D. @ Τµ. Μηχανικών Η/Υ, Τηλεπικοινωνιών & ικτύων Πανεπιστήµιο Θεσσαλίας ιάλεξη η: 09/0/00 Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr Διπλωματικές
Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC
Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC Πλεονεκτήματα MPSoC Είναι ευκολότερο να σχεδιαστούν πολλαπλοί πυρήνες επεξεργαστών από τον σχεδιασμό ενός ισχυρότερου και πολύ πιο σύνθετου μονού επεξεργαστή.
ΠΕΡΙΕΧΟΜΕΝΑ. 1.1. Υλικό και Λογισμικό.. 1 1.2 Αρχιτεκτονική Υπολογιστών.. 3 1.3 Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6
ΠΕΡΙΕΧΟΜΕΝΑ 1. Εισαγωγή στην Δομή, Οργάνωση, Λειτουργία και Αξιολόγηση Υπολογιστών 1.1. Υλικό και Λογισμικό.. 1 1.2 Αρχιτεκτονική Υπολογιστών.. 3 1.3 Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6 1.3.1 Δομή
Οργάνωση Υπολογιστών (ΙI)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Οργάνωση Υπολογιστών (ΙI) (κύρια και κρυφή μνήμη) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Ένα τυπικό
Εφαρµογές µε ανάγκες για υψηλές επιδόσεις Αξιολόγηση επίδοσης Παραλληλοποίηση εφαρµογών
Parallelizing applications for the GRID Γιώργος Γκούµας goumas@cslab.ece.ntua.gr Σύνοψη Παρουσίασηςασης Εφαρµογές µε ανάγκες για υψηλές επιδόσεις Αξιολόγηση επίδοσης Παραλληλοποίηση εφαρµογών Γενικές αρχές
Κύρια μνήμη. Μοντέλο λειτουργίας μνήμης. Ένα τυπικό υπολογιστικό σύστημα σήμερα. Οργάνωση Υπολογιστών (ΙI)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 015-16 Οργάνωση Υπολογιστών (ΙI) (κύρια και ) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Ένα τυπικό υπολογιστικό
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Παραλληλοποίηση και ϐελτιστοποίηση
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr Διπλωματικές
Επιστηµονικός Υπολογισµός Ι
Επιστηµονικός Υπολογισµός Ι Ενότητα 3 : Βασικές Πράξεις Αριθµητικής Γραµµικής Αλγεβρας Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες
Παράλληλος προγραμματισμός: Σχεδίαση παράλληλων προγραμμάτων
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παράλληλος προγραμματισμός: Σχεδίαση παράλληλων προγραμμάτων 9 ο Εξάμηνο Σχεδιασμός παράλληλων
Σποραδικές Μήτρες (Sparse Matrices) Αθανάσιος Μυγδαλ ας ΑΠΘ AΠΘ. 17 Μαρτίου 2010 c Α.Μ.
1 Σποραδικές Μήτρες (Sparse Matrices) Αθανάσιος Μυγδαλ ας ΑΠΘ 17 Μαρτίου 2010 c Α.Μ. /1 30 Τρόποι αποθήκευσης σποραδικών µητρών Υπάρχουν πολλοί τρόποι αποθήκευσης σποραδικών µητρών αναλόγως των δοµικών
QuakeTM: Parallelizing a Complex Sequential Application Using Transactional Memory (Gajinov et al., 2009)
Quake I QuakeTM: Parallelizing a Complex Sequential Application Using Transactional Memory (Gajinov et al., 2009) Είναι όντως χρήσιμη η transactional memory σε μεγάλες εφαρμογές; Παράλληλη υλοποίηση μιας
Επιστηµονικός Υπολογισµός Ι
Επιστηµονικός Υπολογισµός Ι Ενότητα 7 : ιαχείρηση Μητρώων Ειδικής οµής Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative
Βελτιστοποίηση του Υπολογιστικού Πυρήνα Πολλαπλασιασμού Αραιού Πίνακα με Διάνυσμα σε Σύγχρονες Πολυπύρηνες Αρχιτεκτονικές Υπολογιστών
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών Βελτιστοποίηση του Υπολογιστικού Πυρήνα Πολλαπλασιασμού Αραιού Πίνακα
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ
1 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ Παραλληλοποίηση Αλγορίθμου Επίλυσης Αραιών Γραμμικών Συστημάτων ΔΙΠΛΩΜΑΤΙΚΗ
Αρχιτεκτονική Υπολογιστών
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 13: (Μέρος Γ ) Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών
Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων 9 ο Εξάμηνο
Αρχιτεκτονική Υπολογιστών
Γιώργος Δημητρίου Ενότητα 1 η : Βασικές Αρχές Αρχιτεκτονικής Η/Υ Σύγχρονοι Μικροεπεξεργαστές Intel 6-core i7 (Gulftown) 2010, >1 billion transistors Απόδοση Μικροεπεξεργαστών V Μετρήσεις με μετροπρογράμματα
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Ιεραρχία συχνά και το
Ζητήµατα Απόδοσης. Ιεραρχία Μνήµης. Αναγκαιότητα για Ιεραρχία Μνήµης. Processor-DRAM Gap (latency) Ε-85: Ειδικά Θέµατα Λογισµικού
Ε-85: Ειδικά Θέµατα Λογισµικού Προγραµµατισµός Συστηµάτων Υψηλών Επιδόσεων Χειµερινό Εξάµηνο 2009-10 «Ιεραρχία Μνήµης και Τεχνικές Βελτιστοποίησης» Παναγιώτης Χατζηδούκας (Π.Δ. 407/80) Ζητήµατα Απόδοσης
Συνάφεια Κρυφής Μνήµης σε Επεκτάσιµα Μηχανήµατα
Συνάφεια Κρυφής Μνήµης σε Επεκτάσιµα Μηχανήµατα Συστήµατα µε Κοινή ή Κατανεµηµένη Μνήµη Σύστηµα µοιραζόµενης µνήµης 1 n $ $ Bus Mem I/O devices 1 n Σύστηµα κατανεµηµένης µνήµης Mem $ Mem $ Interconnection
Παράλληλα Συστήματα. Γιώργος Δημητρίου. Ενότητα 3 η : Παράλληλη Επεξεργασία. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής
Γιώργος Δημητρίου Ενότητα 3 η : Παράλληλη Επεξεργασία Παράλληλες Αρχιτεκτονικές Παράλληλο σύστημα είναι ένα σύνολο από επεξεργαστικά στοιχεία (processing elements) τα οποία: συνεργάζονται για γρήγορη επίλυση
Προγραμματισμός και Χρήση Ηλεκτρονικών Υπολογιστών - Βασικά Εργαλεία Λογισμικού
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΙΚΟ ΚΕΝΤΡΟ Προγραμματισμός και Χρήση Ηλεκτρονικών Υπολογιστών - Βασικά Εργαλεία Λογισμικού Μάθημα 2ο Aντώνης Σπυρόπουλος v2_061015 Οροι που
Αρχιτεκτονική Υπολογιστών
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 7: Αποκωδικοποίηση Εντολής x86 Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών
Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων
Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Προσομοίωση μεγάλης κλίμακας γραμμικών κυκλωμάτων σε παράλληλες πλατφόρμες Ειδικό Θέμα Ιωαννίδης Κ. Σταύρος Αριθμός Ειδικού Μητρώου:
; Γιατί είναι ταχύτερη η λήψη και αποκωδικοποίηση των εντολών σταθερού μήκους;
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2015-16 Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) (Δομή Εντολών και Παραδείγματα) http://di.ionio.gr/~mistral/tp/comparch/ Μ.Στεφανιδάκης Αρχιτεκτονική
Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής
Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική
ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ. Επίπεδα Αφαίρεσης Σ Β. Αποθήκευση Εγγραφών - Ευρετήρια. ρ. Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, Επίπεδο Όψεων.
ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ Χειµερινό Εξάµηνο 2002 Αποθήκευση Εγγραφών - Ευρετήρια ρ Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ Επίπεδα Αφαίρεσης Σ Β Επίπεδο Όψεων Όψη Όψη
Παράλληλος προγραμματισμός περιστροφικών αλγορίθμων εξωτερικών σημείων τύπου simplex ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ
Παράλληλος προγραμματισμός περιστροφικών αλγορίθμων εξωτερικών σημείων τύπου simplex ΠΛΟΣΚΑΣ ΝΙΚΟΛΑΟΣ Διπλωματική Εργασία Μεταπτυχιακού Προγράμματος στην Εφαρμοσμένη Πληροφορική Κατεύθυνση: Συστήματα Υπολογιστών
Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση. Κεφάλαιο 5. Μεγάλη και γρήγορη: Αξιοποίηση της ιεραρχίας της µνήµης
Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση Κεφάλαιο 5 Μεγάλη και γρήγορη: Αξιοποίηση της ιεραρχίας της µνήµης Ασκήσεις Η αρίθµηση των ασκήσεων είναι από την 4 η έκδοση
Παράλληλη Επεξεργασία
Παράλληλη Επεξεργασία Φροντιστήριο: Εισαγωγή στο OpenMP Εργαστήριο Πληροφοριακών Συστημάτων Υψηλής Επίδοσης Parallel and Distributed Systems Group Τι είναι το OpenMP Πρότυπο Επέκταση στη C/C++ και τη Fortran
Αρχιτεκτονική Υπολογιστών
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Αρχιτεκτονική Υπολογιστών Ενότητα 13: (Μέρος Γ ) Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών
DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης
DIP_06 Συμπίεση εικόνας - JPEG ΤΕΙ Κρήτης Συμπίεση εικόνας Το μέγεθος μιας εικόνας είναι πολύ μεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου
ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ II. χειμερινό εξάμηνο & εαρινό εξάμηνο (σε κίτρινο υπόβαθρο)
I χειμερινό εξάμηνο & ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ II εαρινό εξάμηνο (σε κίτρινο υπόβαθρο). Νικολός Καθηγητής ΚΕΦΑΛΑΙΟ 1 Εισαγωγή στην ομή, Οργάνωση, Λειτουργία και Αξιολόγηση Υπολογιστών Ενότητα 1.1 Υλικό
FX10 SIMD SIMD. [3] Dekker [4] IEEE754. a.lo. (SpMV Sparse matrix and vector product) IEEE754 IEEE754 [5] Double-Double Knuth FMA FMA FX10 FMA SIMD
FX,a),b),c) Bailey Double-Double [] FMA FMA [6] FX FMA SIMD Single Instruction Multiple Data 5 4.5. [] Bailey SIMD SIMD 8bit FMA (SpMV Sparse matrix and vector product) FX. DD Bailey Double-Double a) em49@ns.kogakuin.ac.jp
Εικονική Μνήμη (Virtual Μemory)
ΗΥ 431 Αρχιτεκτονική Παραλλήλων Συστημάτων Διάλεξη 16 Εικονική Μνήμη (Virtual Μemory) Νίκος Μπέλλας Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Απλό πείραμα int *data = malloc((1
Αρχιτεκτονική υπολογιστών
1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 10 : Ομάδες εντολών: Τρόποι Διευθυνσιοδότησης και Μορφοποιήσεις Ευάγγελος Καρβούνης Τρίτη, 19/01/2016 2 Διευθυνσιοδότηση
Μικροεπεξεργαστές - Μικροελεγκτές Ψηφιακά Συστήματα
Μικροεπεξεργαστές - Μικροελεγκτές Ψηφιακά Συστήματα 1. Ποια είναι η σχέση της έννοιας του μικροεπεξεργαστή με αυτή του μικροελεγκτή; Α. Ο μικροεπεξεργαστής εμπεριέχει τουλάχιστο έναν μικροελεγκτή. Β. Ο
ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 8 & 9 11/10/07
ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 8 & 9 11/10/07 Τμήμα θεωρίας: Α.Μ. 8, 9 Κάθε Πέμπτη, 11πμ-2μμ, ΑΜΦ23. Διδάσκων: Ντίνος Φερεντίνος Γραφείο 118 email: kpf3@cornell.edu Μάθημα: Θεωρία + προαιρετικό
Ασκήσεις Caches
Ασκήσεις Caches 1 Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4-way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1
Ασκήσεις Caches. Αρχιτεκτονική Υπολογιστών. 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: Νεκ. Κοζύρης
Αρχιτεκτονική Υπολογιστών 5ο εξάμηνο ΣΗΜΜΥ ακ. έτος: 2014-2015 Νεκ. Κοζύρης nkoziris@cslab.ece.ntua.gr Ασκήσεις Caches http://www.cslab.ece.ntua.gr/courses/comparch/ Άδεια Χρήσης Το παρόν εκπαιδευτικό
Εισαγωγή στους Υπολογιστές
Εισαγωγή στους Υπολογιστές Ενότητα #2: Αναπαράσταση δεδομένων Αβεβαιότητα και Ακρίβεια Καθ. Δημήτρης Ματαράς Πολυτεχνική Σχολή Τμήμα Χημικών Μηχανικών Αναπαράσταση δεδομένων (Data Representation), Αβεβαιότητα
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 Πολυπύρηνοι επεξεργαστές, μέρος 2 Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Cache coherence & scalability! Τα πρωτόκολλα
ΚΕΦΑΛΑΙΟ 2: Χειρισµός εδοµένων
ΚΕΦΑΛΑΙΟ 2: Χειρισµός εδοµένων 2.1 Αρχιτεκτονική Υπολογιστών 2.1 Αρχιτεκτονική Υπολογιστών 2.2 Γλώσσα Μηχανής 2.3 Εκτέλεση προγράµµατος 2.4 Αριθµητικές και λογικές εντολές 2.5 Επικοινωνία µε άλλες συσκευές
Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο
AEN ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΠΛΟΙΑΡΧΩΝ Ηλεκτρονικοί Υπολογιστές Δ Εξάμηνο ΘΕΩΡΙΑ 3 η Διάλεξη ΧΑΣΑΝΗΣ ΒΑΣΙΛΕΙΟΣ ΥΠΟΛΟΓΙΣΤΙΚΟ ΣΥΣΤΗΜΑ Υπολογιστικό σύστημα: Ένα δυναμικό σύστημα που: Χρησιμοποιείται για επίλυση προβλημάτων
Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί
Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί Χαρμανδάρης Βαγγέλης, Τμήμα Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης, Εαρινό Εξάμηνο 2013/14 Κεφάλαιο 3: Θεωρία Παράλληλου Προγραμματισμού
Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Για βελτίωση της απόδοσης
Προγραμματισμός Ι. Προχωρημένα Θέματα. Δημήτρης Μιχαήλ. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο
Προγραμματισμός Ι Προχωρημένα Θέματα Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ανακατεύθυνση Εισόδου/Εξόδου Συνήθως η τυπική είσοδος ενός προγράμματος (stdin) προέρχεται
Ασκήσεις Caches
Ασκήσεις Caches 1 Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4-way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1
Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1
Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Κωδικοποίηση εντροπίας Διαφορική κωδικοποίηση Κωδικοποίηση μετασχηματισμών Στρωματοποιημένη κωδικοποίηση Κβαντοποίηση διανυσμάτων Τεχνολογία
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 7ο μάθημα: Κρυφές μνήμες (cache) - εισαγωγή Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Σύστημα μνήμης! Η μνήμη είναι σημαντικό
Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων 9 ο Εξάμηνο
Άσκηση 1η. Θεωρήστε ένα σύστημα μνήμης με μία cache: 4 way set associative μεγέθους 256ΚΒ,
Ασκήσεις Caches Άσκηση 1η Θεωρήστε ένα σύστημα μνήμης με μία cache: 4 way set associative μεγέθους 256ΚΒ, με cache line 8 λέξεων. Χαρακτηριστικά συστήματος μνήμης: μέγεθος της λέξης είναι 32 bits. 1 byte
Μαθηµατικοί Υπολογισµοί στην R
Κεφάλαιο 3 Μαθηµατικοί Υπολογισµοί στην R Ενα µεγάλο µέρος της ανάλυσης δεδοµένων απαιτεί διάφορους µαθηµατικούς υπολογισµούς. Αυτό το κεφάλαιο εισαγάγει τον αναγνώστη στις διάφορες δυνατότητες που έχει
Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ)
Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) (Δομή Εντολών και Παραδείγματα) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Αρχιτεκτονική
ΟΡΓΑΝΩΣΗ ΚΑΙ ΣΧΕΔΙΑΣΗ Η/Υ
ΟΡΓΑΝΩΣΗ ΚΑΙ ΣΧΕΔΙΑΣΗ Η/Υ Γιώργος Δημητρίου Μάθημα 8 ο ΠΜΣ Εφαρμοσμένη Πληροφορική ΜΟΝΑΔΑ ΜΝΗΜΗΣ Επαρκής χωρητικότητα αποθήκευσης Αποδεκτό μέσο επίπεδο απόδοσης Χαμηλό μέσο κόστος ανά ψηφίο Ιεραρχία μνήμης
Συμπίεση Δεδομένων
Συμπίεση Δεδομένων 2013-2014 JPEG 2000 Δρ. Ν. Π. Σγούρος 2 JPEG 2000 Βασικά χαρακτηριστικά Επιτρέπει συμπίεση σε εξαιρετικά χαμηλούς ρυθμούς όπου η συμπίεση με το JPEG εισάγει μεγάλες παραμορφώσεις Ενσωμάτωση
Τελική Εξέταση, Απαντήσεις/Λύσεις
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (ΗΜΜΥ) HMΜY 212 Οργάνωση Η/Υ και Μικροεπεξεργαστές Εαρινό Εξάμηνο, 2007 Τελική Εξέταση, Απαντήσεις/Λύσεις Άσκηση 1: Assembly για
ΠΛΕ- 027 Μικροεπεξεργαστές 9ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Κρυφές μνήμες εισαγωγή
ΠΛΕ- 027 Μικροεπεξεργαστές 9ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Κρυφές μνήμες εισαγωγή Αρης Ευθυμίου Σύστημα μνήμης Η μνήμη είναι σημαντικό κομμάτι ενός υπολογιστή Επηρεάζει κόστος, ταχύτητα, κατανάλωση
ΠΛΕ- 027 Μικροεπεξεργαστές
ΠΛΕ- 027 Μικροεπεξεργαστές 10ο μάθημα: Αρχιτεκτονική συστήματος μνήμης: Εικονική μνήμη, σχεδίαση αποδοτικής κρυφής μνήμης, προγραμματισμός για κρυφή μνήμη Αρης Ευθυμίου Εικονική μνήμη ως cache Η κύρια
Το εσωτερικό ενός PC. Τεχνολογία Η/Υ & Πληροφοριών - 05 Κεντρική μονάδα Χουρδάκης Μανόλης
Το εσωτερικό ενός PC 1 Το κουτί του PC (περίβλημα) περιέχει όλα τα βασικά μέρη του συστήματος Δύο κατηγορίες κουτιών: Desktop και Tower Mini tower Midi tower Full tower Κεντρική μονάδα Ο τύπος του κουτιού
Αρχιτεκτονική υπολογιστών
1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 5 : Η Εσωτερική Μνήμη Καρβούνης Ευάγγελος Τρίτη, 01/12/2015 Οι τύποι μνήμης με ημιαγωγούς 2 2 Η λειτουργία
http://www.cslab.ece.ntua.gr/diplom/
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ KΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ http://www.cslab.ece.ntua.gr/ ιπλωµατική
Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση. Κεφάλαιο 1. Αφηρηµένες έννοιες και τεχνολογία υπολογιστών
Οργάνωση και Σχεδίαση Υπολογιστών Η ιασύνδεση Υλικού και Λογισµικού, 4 η έκδοση Κεφάλαιο 1 Αφηρηµένες έννοιες και τεχνολογία υπολογιστών Ασκήσεις Η αρίθµηση των ασκήσεων είναι από την 4 η έκδοση του «Οργάνωση
Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ ΠΙΝΑΚΕΣ. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD
Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ ΠΙΝΑΚΕΣ Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD ΕΙΣΑΓΩΓΗ Οι πίνακες είναι συλλογές δεδομένων που μοιράζονται τα ίδια χαρακτηριστικά.
Πανεπιστήμιο Θεσσαλίας Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών
Πανεπιστήμιο Θεσσαλίας Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Αρχιτεκτονική Υπολογιστών Άσκηση 6: Ασκήσεις Εξαμήνου Μέρος Β Νοέμβριος 2016 Στην άσκηση αυτή θα μελετήσουμε την εκτέλεση ενός
Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή
1 Είναι το «μυαλό» του υπολογιστή μας. Αυτός κάνει όλους τους υπολογισμούς και τις πράξεις. Έχει δική του ενσωματωμένη μνήμη, τη λεγόμενη κρυφή μνήμη(cache). Η cache είναι πολύ σημαντική, πολύ γρήγορη,
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΒΕΣ 04: ΣΥΜΠΙΕΣΗ ΚΑΙ ΜΕΤΑ ΟΣΗ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 2007 2008, Χειµερινό Εξάµηνο 13 Νοεµβρίου 2007 Φροντιστηριακή Άσκηση 3: (I) Συµπίεση
J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου
J-GANNO ΓΕΝΙΚΕΥΜΕΝΟ ΠΑΚΕΤΟ ΥΛΟΠΟΙΗΣΗΣ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΣΤΗ ΓΛΩΣΣΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ JAVA Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β,
Παρουσίαση 2 ης Άσκησης:
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παρουσίαση 2 ης Άσκησης: Ανάπτυξη παράλληλου κώδικα και μελέτη επίδοσης του αλγόριθμου
Τεράστιες ανάγκες σε αποθηκευτικό χώρο
ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα: CD-ROM έχει χωρητικότητα 650MB, χωρά 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου, αλλά 30 sec ασυμπίεστου βίντεο. Μαγνητικοί δίσκοι χωρητικότητας
ΜΕΘΟΔΟΙ ΑΕΡΟΔΥΝΑΜΙΚΗΣ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Εργαστήριο Θερμικών Στροβιλομηχανών Μονάδα Παράλληλης ης Υπολογιστικής Ρευστοδυναμικής & Βελτιστοποίησης ΜΕΘΟΔΟΙ ΑΕΡΟΔΥΝΑΜΙΚΗΣ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ (7 ο Εξάμηνο Σχολής Μηχ.Μηχ. ΕΜΠ)
Αρχιτεκτονική υπολογιστών
1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 4 : Κρυφή Μνήμη Καρβούνης Ευάγγελος Δευτέρα, 30/11/2015 Χαρακτηριστικά Θέση Χωρητικότητα Μονάδα Μεταφοράς
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2
ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2 10ο μάθημα: Ορια παραλληλίας επιπέδου εντολής και πολυνηματικοί επεξεργαστές Αρης Ευθυμίου Πηγές διαφανειών: συνοδευτικές διαφάνειες αγγλικης εκδοσης του βιβλιου Ορια
Πρόβλημα 37 / σελίδα 207
Πρόβλημα 37 / σελίδα 207 2.5. Ôåóô áõôïáîéïëüãçóçò Δίνονται οι παρακάτω ομάδες προτάσεων. Σε κάθε μία από αυτές, να κάνετε τις απαραίτητες διορθώσεις ώστε να ισχύουν οι προτάσεις 1. Η αναπαράσταση
Διαφορές single-processor αρχιτεκτονικών και SoCs
13.1 Τα συστήματα και η επικοινωνία μεταξύ τους γίνονται όλο και περισσότερο πολύπλοκα. Δεν μπορούν να περιγραφούνε επαρκώς στο επίπεδο RTL καθώς αυτή η διαδικασία γίνεται πλέον αρκετά χρονοβόρα. Για αυτό
FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2016
FORTRAN & Αντικειμενοστραφής Προγραμματισμός ΣΝΜΜ 2016 M7 Δομές δεδομένων: Πίνακες Δρ. Γεώργιος Παπαλάμπρου Επικ. Καθηγητής ΕΜΠ Εργαστήριο Ναυτικής Μηχανολογίας george.papalambrou@lme.ntua.gr ΕΜΠ/ΣΝΜΜ
Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;
5.1 Επίδοση αλγορίθμων Μέχρι τώρα έχουμε γνωρίσει διάφορους αλγόριθμους (αναζήτησης, ταξινόμησης, κ.α.). Στο σημείο αυτό θα παρουσιάσουμε ένα τρόπο εκτίμησης της επίδοσης (performance) η της αποδοτικότητας
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΟΛΟΚΛΗΡΩΜΕΝΑ ΣΥΣΤΗΜΑΤΑ
Διάλεξη 15 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης
ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 5 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης Νίκος Μπέλλας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πόσο μεγάλη είναι μια μνήμη cache;
Παράλληλη Επεξεργασία Κεφάλαιο 1 Γιατί Παράλληλος Προγραμματισμός;
Παράλληλη Επεξεργασία Κεφάλαιο 1 Γιατί Παράλληλος Προγραμματισμός; Κωνσταντίνος Μαργαρίτης Καθηγητής Τμήμα Εφαρμοσμένης Πληροφορικής Πανεπιστήμιο Μακεδονίας kmarg@uom.gr http://eos.uom.gr/~kmarg Αρετή
Γραφικά Υπολογιστών: Βασικά Μαθηματικά
1 ΤΕΙ Θεσσαλονίκης Τμήμα Πληροφορικής Γραφικά Υπολογιστών: Βασικά Μαθηματικά Πασχάλης Ράπτης http://aetos.it.teithe.gr/~praptis praptis@it.teithe.gr 2 Εισαγωγή Ένα μεγάλο κομμάτι των γραφικών αφορά βασίζονται-
FORTRAN και Αντικειμενοστραφής Προγραμματισμός
FORTRAN και Αντικειμενοστραφής Προγραμματισμός Παραδόσεις Μαθήματος 2016 Δρ Γ Παπαλάμπρου Επίκουρος Καθηγητής ΕΜΠ georgepapalambrou@lmentuagr Εργαστήριο Ναυτικής Μηχανολογίας (Κτίριο Λ) Σχολή Ναυπηγών
Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή
Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή 1. Ηλεκτρονικός Υπολογιστής Ο Ηλεκτρονικός Υπολογιστής είναι μια συσκευή, μεγάλη ή μικρή, που επεξεργάζεται δεδομένα και εκτελεί την εργασία του σύμφωνα με τα παρακάτω
Αρχιτεκτονική υπολογιστών
1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αρχιτεκτονική υπολογιστών Ενότητα 9 : Ομάδες Εντολών: Ιδιότητες και Λειτουργίες Ευάγγελος Καρβούνης Παρασκευή, 15/01/2016 Τι είναι ομάδα εντολών;
Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ ΠΙΝΑΚΕΣ. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD
Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ ΠΙΝΑΚΕΣ Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD ΕΙΣΑΓΩΓΗ Οι πίνακες είναι συλλογές δεδομένων που μοιράζονται τα ίδια χαρακτηριστικά.
Στοιχεία αρχιτεκτονικής μικροεπεξεργαστή
Στοιχεία αρχιτεκτονικής μικροεπεξεργαστή Αριθμός bit δίαυλου δεδομένων (Data Bus) Αριθμός bit δίαυλου διευθύνσεων (Address Bus) Μέγιστη συχνότητα λειτουργίας (Clock Frequency) Τύποι εντολών Αριθμητική
ΑΠΟΤΕΛΕΣΜΑΤΑ ΔΙΑΒΟΥΛΕΥΣΗΣ. Προκήρυξη Διαγωνισμού για την «Προμήθεια Εξοπλισμού Κόμβου Μηχανικής Μάθησης» https://grnet.gr/2018/02/14/rfp /
ΑΠΟΤΕΛΕΣΜΑΤΑ ΔΙΑΒΟΥΛΕΥΣΗΣ Πράξη Προκήρυξη Διαγωνισμού για την «Προμήθεια Εξοπλισμού Κόμβου Μηχανικής Μάθησης» Διάρκεια Διαβούλευσης 14/02/2018-02/03/2018 Τηλέφωνο 2107474274 e-mail Ηλεκτρονική Διεύθυνση
Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών
Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών
Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός
Ανάκληση Πληροφορίας Διδάσκων Δημήτριος Κατσαρός Διάλεξη 16η: 14/05/2014 1 Ζητήματα Μεγάλης-Κλίμακας Υλοποίησης του PageRank 2 Αρχιτεκτονική Μηχανής Αναζήτησης 3 Ευρετήρια (Indexes) Ευρετήρια Περιεχομένου
ΘΕΜΑ : ΣΥΣΤΗΜΑΤΑ ΑΡΙΘΜΗΣΗΣ. ΔΙΑΡΚΕΙΑ: 1 περιόδους. 22/1/ :11 Όνομα: Λεκάκης Κωνσταντίνος καθ. Τεχνολογίας
ΘΕΜΑ : ΣΥΣΤΗΜΑΤΑ ΑΡΙΘΜΗΣΗΣ ΔΙΑΡΚΕΙΑ: 1 περιόδους 22/1/2010 10:11 καθ. Τεχνολογίας 22/1/2010 10:12 Παραδείγματα Τι ονομάζουμε αριθμητικό σύστημα? Το σύνολο από ψηφία (αριθμοί & χαρακτήρες). Που χρησιμεύουν
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια)
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια) Χειμερινό εξάμηνο 2008 Προηγούμενη παρουσίαση... Εξετάσαμε
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr Συστήματα Παράλληλης
Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής
Τεχνολογία Πολυμέσων Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του