Εργαστήριο Υπολογιστικών Συστημάτων

Σχετικά έγγραφα

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

{ i f i == 0 and p > 0

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

Φροντιστήριο 2: Ανάλυση Αλγόριθμου. Νικόλας Νικολάου ΕΠΛ432: Κατανεμημένοι Αλγόριθμοι 1 / 10

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

Δήμος Σωτήριος Υ.Δ. Εργαστήριο Λογικής & Επιστήμης Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών Σ.Η.Μ.Μ.Υ. Ε.Μ.Π.

Το κράτος είναι φτιαγμένο για τον άνθρωπο και όχι ο άνθρωπος για το κράτος. A. Einstein Πηγή:

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

ΨΗΦΙΑΚΑ ΗΛΕΚΤΡΟΝΙΚΑ Σχεδίαση Λογικών Κυκλωμάτων

Μητροπολιτικά Οπτικά Δίκτυα Εισαγωγή

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

Ευρωπαϊκά παράγωγα Ευρωπαϊκά δικαιώματα

Ο Β ΤΟΜΕΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ: Υπολογιστικά Συστήματα και Εφαρμογές Πληροφορικής Pragmatic Computer Science

τους στην Κρυπτογραφία και τα

2. Κατάθεσε κάποιος στην Εθνική Τράπεζα 4800 με επιτόκιο 3%. Μετά από πόσο χρόνο θα πάρει τόκο 60 ; α) 90 ημέρες β) 1,5 έτη γ) 5 μήνες δ) 24 μήνες

ΑΣΕΠ 2000 ΑΣΕΠ 2000 Εμπορική Τράπεζα 1983 Υπουργείο Κοιν. Υπηρ. 1983

Σκιαγράφηση της διάλεξης. Γλώσσες Περιγραφής Υλικού Ι. Ανασκόπηση ϑεμάτων παλαιών εξετάσεων του μαθήματος. Περιεχόμενο εξετάσεων

Τυπικζσ Γλϊςςεσ Περιγραφισ Υλικοφ Διάλεξθ 2

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

«Εξατομικεύοντας την επιλογή των πόρων των ψηφιακών βιβλιοθηκών για την υποστήριξη της σκόπιμης μάθησης» Άννα Μαρία Ολένογλου

Κεφάλαιο 2.4: Τα βασικά στοιχεία ενός Επιχειρηματικού Σχεδίου (Business Plan) Μέσα από αυτό το κεφάλαιο φαίνεται ότι αφενός η σωστή δημιουργία και

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

HY 280. θεμελιακές έννοιες της επιστήμης του υπολογισμού ΑΣΚΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ. Γεώργιος Φρ.

Αλγόριθμοι & Βελτιστοποίηση

1. Η συγκεκριμένη εφαρμογή της λειτουργίας για τη λήψη φορολογικής ενημερότητας βρίσκεται στην αρχική σελίδα της ιστοσελίδας της Γ.Γ.Π.Σ.

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

G περιέχει τουλάχιστον μία ακμή στο S. spanning tree στο γράφημα G.

Συναρτήσεις. Σημερινό μάθημα

Σχέσεις και ιδιότητές τους

17 Μαρτίου 2013, Βόλος

Βελτίωση Εικόνας. Σήμερα!

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

1. Εστω ότι A, B, C είναι γενικοί 2 2 πίνακες, δηλαδή, a 21 a, και ανάλογα για τους B, C. Υπολογίστε τους πίνακες (A B) C και A (B C) και

ΣΤΟ ΙΑΤΡΕΙΟ. Με την πιστοποίηση του αποκτά πρόσβαση στο περιβάλλον του ιατρού που παρέχει η εφαρμογή.

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Β ΤΑΞΗ. ΘΕΜΑ 1ο

Έννοια. Η αποδοχή της κληρονομίας αποτελεί δικαίωμα του κληρονόμου, άρα δεν

ΗΛΕΚΤΡΙΚΗ ΕΝΕΡΓΕΙΑ ΣΤΗ ΚΡΗΤΗ

ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

Κεφάλαιο 2.6: Η Διαδικασία Εντοπισμού Επιχειρηματικών Ευκαιριών. Το έκτο κεφάλαιο πραγματεύεται την ευρύτερη έννοια της

Συγκέντρωση Κίνησης Εισαγωγή Στατική Συγκέντρωση Κίνησης

Αναγνώριση Προτύπων. Σημερινό Μάθημα

(3 ο ) Εξαντλητική αναζήτηση I: μεταθέσεις & υποσύνολα (4 o ) Εξαντλητική αναζήτηση II: συνδυασμοί, διατάξεις & διαμερίσεις

Ψηφιακή Εικόνα. Σημερινό μάθημα!

Περιεχόμενο: Στρατηγικές ελέγχου

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

Μεταγλωττιστές ΙΙ. Βελτιστοποιήσεις για την εκμετάλλευση της παραλληλίας και ενίσχυση της τοπικότητας

Αναγνώριση Προτύπων 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

2. Δίκτυα Πολυπλεξίας Μήκους Κύματος (WDM Δίκτυα)

Programmatismìc epilôth 3D exis sewn ro c atriboôc reustoô se domhmèna plègmata, se kˆrtec grafik n

Σχεδίαση Ψηφιακών Κυκλωμάτων

(7 ο ) ΔΙΑΙΡΕΙ & ΒΑΣΙΛΕΥΕ Ι: «ταξινόμηση» (8 ο ) ΔΙΑΙΡΕΙ & ΒΑΣΙΛΕΥΕ ΙΙ: «κυρτό περίβλημα»

Α) Ανάλογα με τη φύση των κονδυλίων που περιλαμβάνουν οι προϋπολογισμοί διακρίνονται σε:

Η ανισότητα α β α±β α + β με α, β C και η χρήση της στην εύρεση ακροτάτων.

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ Η ΚΑΤΑΝΑΛΩΤΙΚΗ ΑΠΟΦΑΣΗ. Άσκηση με θέμα τη μεγιστοποίηση της χρησιμότητας του καταναλωτή

Εργαστηριακή Άσκηση Θερμομόρφωση (Thermoforming)

ΣΥΝΟΛΑ (προσέξτε τα κοινά χαρακτηριστικά των παρακάτω προτάσεων) Οι άνθρωποι που σπουδάζουν ΤΠ&ΕΣ και βρίσκονται στην αίθουσα

Κεφάλαιο 2.3: Marketing Κοινωνικών Επιχειρήσεων. Στο παρόν κεφάλαιο παρουσιάζονται εν τάχει τα βασικά

Ημέρα 4 η (α) Αγορά και πώληση της εργασιακής δύναμης. (β) Η απόλυτη υπεραξία. Αγορά και πώληση της εργασιακής δύναμης

Περιεχόμενο: Τυπικές τεχνικές αναθεώρησης λογισμικού

ΘΕΜΑ: Διαφορές εσωτερικού εξωτερικού δανεισμού. Η διαχρονική κατανομή του βάρους από το δημόσιο δανεισμό.

ΔΙΚΑΙΩΜΑΤΑ ΠΡΟΣΟΡΜΙΣΗΣ, ΠΑΡΑΒΟΛΗΣ, ΠΡΥΜΝΟΔΕΤΗΣΗΣ ΚΑΙ ΕΛΛΙΜΕΝΙΣΜΟΥ ΣΚΑΦΩΝ ΣΕ ΘΑΛΑΣΣΙΕΣ ΠΕΡΙΟΧΕΣ. (ΛΙΜΑΝΙΑ κ.λπ.) ΤΟΠΙΚΗΣ ΑΡΜΟΔΙΟΤΗΤΑΣ ΛΙΜΕΝΙΚΩΝ

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

ΘΕΜΑ: Aποτελεσματικότητα της νομισματικής και δημοσιονομικής πολιτικής σε μια ανοικτή οικονομία

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

Επίλυση ειδικών μορφών ΣΔΕ

Επαναληπτικές Ασκήσεις

Το υπόδειγμα IS-LM: Εισαγωγικά

Προηγμένα Θέματα Θεωρητικής Πληροφορικής

Βελτιστοποιήσεις για την εκμετάλλευση της παραλληλίας και ενίσχυση της τοπικότητας. Προηγμένα Θέματα Θεωρητικής Πληροφορικής

Συμπεριφοριακή Επιχειρηματικότητα

Συνιστώσες Βιώσιμης Ανάπτυξης

έγγραφο σε κάθε διάσταση αντιστοιχούν στο πλήθος εμφανίσεων της λέξης (που αντιστοιχεί στη συγκεκριμένη διάσταση) εντός του εγγράφου.

Γενικό Λύκειο Μαραθοκάμπου Σάμου. Άλγεβρα Β λυκείου. 13 Οκτώβρη 2016

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

Ημέρα 3 η. (α) Aπό την εργασιακή διαδικασία στη διαδικασία παραγωγής (β) Αξία του προϊόντος και αξία της εργασιακής δύναμης

«ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ»

Κεφάλαιο Η εκθετική κατανομή. Η πυκνότητα πιθανότητας της εκθετικής κατανομής δίδεται από την σχέση (1.1) f(x) = 0 αν x < 0.

Αντικειμενοστραφής. Προγραμματισμού

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Μούλου Ευγενία

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

CSE.UOI : Μεταπτυχιακό Μάθημα

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗ

ΑΣΚΗΣΕΙΣ ΔΙΚΤΥΑ ΠΡΟΣΒΑΣΗΣ ΑΣΚΗΣΗ 1

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

Η διπλωματική εργασία

14 Φεβρουαρίου 2014, Βόλος

Κεφάλαιο 52 Ανακάλυψη και ανάπτυξη νέων. νέων αντινεοπλασματικών φαρμάκων

Transcript:

Ε ό Μ ό Π ί Σ ή Η ό Μ ώ Μ ώ Η/Υ Τ έ Τ ί Π ή Υ ώ Εργαστήριο Υπολογιστικών Συστημάτων www.cslab.ece.ntua.gr Διπλωματική εργασία Μελέτη και υλοποίηση του αριθμητικού υπολογιστικού πυρήνα του Πολλαπλασιασμού Αραιού Πίνακα με Διάνυσμα σε μαζικά πολυνηματικούς επεξεργαστές γραφικών Καθηγητής: Νεκτάριος Κοζύρης (nkoziris@cslab.ece.ntua.gr) Επικοινωνία: Βασίλειος Καρακάσης (bkk@cslab.ece.ntua.gr) Γιώργος Γκούμας (goumas@cslab.ece.ntua.gr) Άτομα: 1 Εισαγωγή Τα τελευταία χρόνια παρατηρείται μία έντονη στροφή της τεχνολογίας των υπολογιστών προς αρχιτεκτονικές πολλών πυρήνων. Η συνεχής αύξηση της διαφοράς ταχύτητας μεταξύ της υπολογιστικής ισχύος των σύγχρονων επεξεργαστών και της κύριας μνήμης οδήγησε στην χρησιμοποιήση ογκωδών κρυφών μνημών, ώστε να κρυφτεί κατά το δυνατόν η χαώδης διαφορά στην επίδοση. Παρόλα αυτά, μία τέτοια λύση μόνο ως προσωρινή μπορεί να χαρακτηριστεί, καθότι δεν μπορεί να κλιμακωθεί σωστά όταν το μέγεθος του προς επίλυση προβλήματος ειδικά όταν αυτό είναι απαιτητικό σε εύρος ζώνης μνήμης γίνεται πολύ μεγάλο. Οι επεξεργαστές γραφικών (GPUs) αποτελούσαν ανέκαθεν μία πανίσχυρη υπολογιστική πλατφόρμα, η οποία, όμως, μπορούσε να χρησιμοποιηθεί σχεδόν αποκλειστικά σε προβλήματα γραφικών. Με την στροφή των επεξεργαστών σε πολυπύρηνες αρχιτεκτονικές, οι επεξεργαστές γραφικών με κάποιες μικρές αλλά καίριες τροποποιήσεις ήρθαν στο προσκήνιο, καθότι πλέον μπορούν με σχετική ευκολία να αναλάβουν και την επίλυση κοινών υπολογιστικών προβλημάτων. Η ϑεμελιώδης διαφορά των επεξεργαστών αυτών σε σχέση με τις πιο διαδεδομένες μέχρι τώρα πολυπύρηνες αρχιτεκτονικές 1

υπολογιστών είναι ότι βασίζονται σχεδόν αποκλειστικά στην παραλληλία σε επίπεδο υλικού, ώστε να καλύψουν την διαφορά επίδοσης με την κύρια μνήμη, σε αντίθεση με τους «κλασικούς» επεξεργαστές πολλαπλών πυρήνων που βασίζονται σε ογκώδεις κρυφές μνήμες. Ενας σύγχρονος επεξεργαστής γραφικών μπορεί να εκτελεί παράλληλα εκατοντάδες νήματα υλικού, επιτυγχάνοντας ασυνήθιστες ταχύτητες επεξεργασίας δεδομένων. Παρόλα αυτά, ο τρόπος προγραμματισμού ενός τέτοιου επεξεργαστή, ώστε να επιτευχθεί η μέγιστη δυνατή επίδοση, δεν είναι μία εύκολη και άμεση διαδικασία. Απαιτείται πολύ καλή εξοικείωση τόσο με το μοντέλο προγραμματισμού, το οποίο συνίσταται στην μέγιστη δυνατή παραλληλία σε επίπεδο υλικού, όσο και με τις λεπτομέρειες τις αρχιτεκτονικής. Ο υπολογιστικός πυρήνας του Πολλαπλασιασμού Αραιού Πίνακα με Διάνυσμα (Sparse Matrix-Vector Multiplication SpMV) συναντάται σε πληθώρα υπολογιστικών προβλημάτων και αποτελεί ένα από τα επτά σημαντικότερα υπολογιστικά προβλήματα των επόμενων δεκαετιών [3]. Το πρόβλημα SpMV είναι εξαιρετικά απαιτητικό σε εύρος ζώνης μνήμης και παρουσιάζει μία πληθώρα εγγενών προβλημάτων επίδοσης στις σύγχρονες αρχιτεκτονικές υπολογιστών [6, 9]. Επομένως, η μεταφορά του σε πιο σύγχρονες ή εξεζητημένες αρχιτεκτονικές υπολογιστών αποτελεί μία μεγάλη πρόκληση. Το ενδιαφέρον της ερευνητικής κοινότητας για την μεταφορά του συγκεκριμένου πυρήνα στους επεξεργαστές γραφικών είναι ήδη αρκετά έντονο, ενώ έχουν ήδη παρουσιαστεί κάποιες πρώτες υλοποιήσεις [4, 5, 8]. Σκοπός Ο σκοπός της συγκεκριμένης διπλωματικής εργασίας είναι αφενός η εξοικείωση του/της ενδιαφερομένου/ης με μία πραγματική αρχιτεκτονική πολλών πυρήνων, όπως είναι οι επεξεργαστές γραφικών της σειράς 8 της NVIDIA, και αφετέρου η μελέτη και αξιολόγηση των προβλημάτων που παρουσιάζονται κατά την υλοποίηση του SpMV σε μία τέτοια αρχιτεκτονική. Κάποια από τα ερωτήματα που πρόκειται να απαντηθούν από την εκπόνηση της συγκεκριμένης εργασίας είναι τα ακόλουθα: Ποια από τα προβλήματα που παρουσιάζει το SpMV σε μία «κλασική» πολυπύρηνη αρχιτεκτονική εξακολουθούν να υφίστανται σε έναν επεξεργαστή γραφικών; Ποια εξαλείφονται; Πώς πρέπει να υλοποιηθεί ο πυρήνας του SpMV, ώστε να εξαχθεί η μέγιστη δυνατή παραλληλία και πώς επηρεάζεται η επίδοση από τις διάφορες αρχιτεκτονικές παραμέτρους; Εχουν νόημα χρήσιμες και αποδοτικές βελτιστοποιήσεις του SpMV, όπως το blocking, σε μία τόσο παράλληλη αρχιτεκτονική, όπως είναι ένας επεξεργαστής γραφικών; 2

Host Multiprocessor Stream processor Input Assembler Thread Execution Manager... Load/Store Global Memory Σχήμα 1: Η αρχιτεκτονική G80 της NVIDIA. Κάθε επεξεργαστής γραφικών είναι μία ο- μάδα πολυ-επεξεργαστών, καθένας εκ των οποίων αποτελείται από οκτώ επεξεργαστές σε ροές. Κάθε πολυ-επεξεργαστής μπορεί να αναλάβει οποιουδήποτε τύπου υπολογιστικά καθήκοντα, γι αυτό και η αρχιτεκτονική αυτή των επεξεργαστών γραφικών ονομάζεται ενοποιημένη (unified). Τελικά, πόσο μπορεί να κερδίσει κανείς σε σχέση με ένα βελτιστοποιημένο κώδικα SpMV για «κλασικές» αρχιτεκτονικές, αναλαμβάνοντας το κόστος της υλοποίησης του συγκεκριμένου υπολογιστικού πυρήνα σε μία τέτοια εξεζητημένη αρχιτεκτονική; Τα πειράματα ϑα διεξαχθούν σε έναν ή δύο επεξεργαστές γραφικών της NVIDIA, συγκεκριμένα στους επεξεργαστές GeForce 8800 Ultra [7] της αρχιτεκτονικής G80. Κάθε τέτοιος επεξεργαστής γραφικών αποτελείται από 16 πολυ-επεξεργαστικά στοιχεία (multi-processors), καθένα εκ των οποίων αποτελείται από οκτώ επεξεργαστές υπολογισμών σε ροές (streaming processors). Συνολικά, επομένως, η αρχιτεκτονική αυτή αποτελείται από 128 επεξεργαστικούς πυρήνες (Σχήμα 1). Η υλοποίηση ϑα γίνει με χρήση του προγραμματιστικού μοντέλου CUDA [2] μέσω του αντίστοιχου κιτ ανάπτυξης λογισμικού (SDK) σε περιβάλλον λειτουργικού συστήματος GNU/Linux. Στάδια Υλοποίησης Η προτεινόμενη διπλωματική εργασία μπορεί να χωριστεί ενδεικτικά στα εξής επιμέρους στάδια: 1. Μελέτη και εξοικείωση με την αρχιτεκτονική πολλών πυρήνων του επεξεργαστή 3

γραφικών της NVIDIA και αρχική εξοικείωση με το περιβάλλον και το μοντέλο προγραμματισμού CUDA. 2. Μελέτη της υλοποίησης του SpMV σε «κλασικές» αρχιτεκτονικές υπολογιστών και μελέτη της σχετικής βιβλιογραφίας, τόσο για το SpMV όσο και για την μεταφορά του σε επεξεργαστές γραφικών. 3. Υλοποίηση του SpMV για τον επεξεργαστή γραφικών. 4. Εκτέλεση πειραμάτων. 5. Αξιολόγηση και ανάλυση της επίδοσης. 6. (Προαιρετικό) Μελέτη μεθόδων blocking για την υλοποίηση του SpMV στον επεξεργαστή γραφικών. Εχουν νόημα; 7. (Προαιρετικό) Μελέτη και ανάλυση επίδοσης της εκτέλεσης του SpMV σε δύο επεξεργαστές γραφικών παράλληλα. 8. Συγγραφή της διπλωματικής εργασίας. Προαπαιτούμενες Γνώσεις Για την εκπόνηση της προτεινόμενης διπλωματικής εργασίας απαιτούνται ή είναι επι- ϑυμητά τα εξής: Καλή γνώση της γλώσσας προγραμματισμού C ή C++. Γνώση αρχιτεκτονικής πολυπύρηνων επεξεργαστών. Γνώση που ϑα αποκτηθεί Με το πέρας της συγκεκριμένης διπλωματικής εργασίας, ο/η ενδιαφερόμενος/η ϑα έχει αποκτήσει πολύ καλή γνώση μιας σύγχρονης μαζικά παράλληλης πολυνηματικής αρχιτεκτονικής καθώς και μεγάλη εξοικείωση με τον τρόπο προγραμματισμού της. Επίσης, ϑα αποκτηθεί πολύτιμη εμπειρία στο πεδίο μελέτης της επίδοσης του υπολογιστικού πυρήνα SpMV, καθώς και στις μεθόδους που χρησιμοποιούνται για την βελτίωση της επίδοσής του, τόσο σε πιο «κλασικές» αρχιτεκτονικές υπολογιστών όσο και σε πιο ε- ξεζητημένες, όπως είναι η αρχιτεκτονική του αντικειμένου μελέτης της προτεινόμενης εργασίας. 4

Αναφορές [1] NVIDIA CUDA Forum. http://forums.nvidia.com/index.php?showforum=62. [2] NVIDIA CUDA Zone. http://www.nvidia.com/object/cuda_home.html. [3] K. Asanovic and et al. The Landscape of Computing Research: A View from Berkeley. Technical Report UCB/EECS-2006-183, EECS Department, University of California, Berkeley, December 2006. [4] M. Christen, O. Schenk, and H. Burkhart. General-purpose sparse matrix building blocks using NVIDIA CUDA technology platform. In Workshop on General Processing on Graphics Processing Units, Boston, MA, USA, October 2007. [5] M. Garland. Sparse matrix computations on manycore GPU s. Design Automation Conference, 2008. DAC 2008. 45th ACM/IEEE, pages 2 6, June 2008. [6] G. Goumas, K. Kourtis, N. Anastopoulos, V. Karakasis, and N. Koziris. Performance Evaluation of the Sparse Matrix-Vector Multiplication on Modern Architectures. The Journal of Supercomputing, (to appear). [7] NVIDIA Corp. NVIDIA GeForce 8800 GPU Architecture Overview. Technical Report TB-02787-001_v01, NVIDIA Corp., November 2006. [8] V. Volkov and J. Demmel. LU, QR and Cholesky Factorizations using Vector Capabilities of GPUs. Technical Report UCB/EECS-2008-49, EECS Department, University of California, Berkeley, May 2008. [9] S. Williams, L. Oilker, R. Vuduc, J. Shalf, K. Yelick, and J. Demmel. Optimization of sparse matrix-vector multiplication on emerging multicore platforms. In Supercomputing 07, Reno, NV, November 2007. [10] General Purpose Computation Using Graphics Hardware. http://www.gpgpu.org. 5