ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Σχετικά έγγραφα
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Νήµατα. ιεργασίες και νήµατα Υλοποίηση νηµάτων Ελαφριές διεργασίες Αξιοποίηση νηµάτων. Κατανεµηµένα Συστήµατα 10-1

Διεργασίες και Νήματα (2/2)

Θέματα διπλωματικών εργασιών σε. Συστοιχίες παράλληλης εξυηρέτησης εφαρμογών Διαδικτύου

Κεφάλαιο 3. Διδακτικοί Στόχοι

ΑΠΟΤΕΛΕΣΜΑΤΑ ΔΙΑΒΟΥΛΕΥΣΗΣ. Προκήρυξη Διαγωνισμού για την «Προμήθεια Εξοπλισμού Κόμβου Μηχανικής Μάθησης» /

ΣΥΣΤΗΜΑΤΑ ΠΑΡΑΛΛΗΛΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ 9o εξάμηνο ΗΜΜΥ, ακαδημαϊκό έτος

Διεργασίες (μοντέλο μνήμης & εκτέλεσης) Προγραμματισμός II 1

Παράλληλα Συστήματα. Γιώργος Δημητρίου. Ενότητα 3 η : Παράλληλη Επεξεργασία. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Παράλληλη Επεξεργασία Κεφάλαιο 1 Γιατί Παράλληλος Προγραμματισμός;

επιφάνεια πυριτίου Αναφορά στο Εκπαιδευτικό Υλικό : 5. Αναφορά στο Εργαστήριο :

ιεργασίες και Επεξεργαστές στα Κατανεµηµένων Συστηµάτων

Εργαστήριο Λειτουργικών Συστήματων 8ο εξάμηνο, Ακαδημαϊκή περίοδος

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Εικονικοποίηση. Λειτουργικά Συστήματα Υπολογιστών 7ο Εξάμηνο,

Αρχιτεκτονική Υπολογιστών

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι

Εικονικοποίηση. Αρχιτεκτονική Υπολογιστών 5ο Εξάμηνο,

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Πολυπύρηνοι επεξεργαστές Multicore processors

Παράλληλη Επεξεργασία

Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC

13.2 Παράλληλος Προγραµµατισµός Γλωσσάρι, Σελ. 1

Εργαστήριο Λειτουργικών Συστήματων 8ο εξάμηνο, Ακαδημαϊκή περίοδος

Εισαγωγή. Κατανεµηµένα Συστήµατα 01-1

Αρχιτεκτονική Υπολογιστών

Μάθημα 7 ο. Αλγόριθμοι Χρονοδρομολόγησης

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Λειτουργικά Συστήματα (διαχείριση επεξεργαστή, μνήμης και Ε/Ε)

Τι είναι ένα λειτουργικό σύστημα (ΛΣ); Μια άλλη απεικόνιση. Το Λειτουργικό Σύστημα ως μέρος του υπολογιστή

Λειτουργικά συστήματα πραγματικού χρόνου

ΠΕΡΙΕΧΟΜΕΝΑ Υλικό και Λογισμικό Αρχιτεκτονική Υπολογιστών Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Η πολυνηματική γλώσσα προγραμματισμού Cilk

Διεργασίες (μοντέλο μνήμης & εκτέλεσης) Προγραμματισμός II 1

Αρχιτεκτονική Υπολογιστών

Παράλληλη Επεξεργασία

Λειτουργικά Συστήματα Η/Υ

Σκοπός Μαθήματος. Λειτουργικά Συστήματα Η/Υ. Γενικές Πληροφορίες. Στόχοι Μαθήματος ΚΕΦΑΛΑΙΟ 1 - ΕΙΣΑΓΩΓΗ. Θεωρία: Εργαστήριο: Κεφάλαιο 1 «Εισαγωγή»

Κατανεμημένα Συστήματα

Αρχιτεκτονική Υπολογιστών

Αμοιβαίος αποκλεισμός

Ε-85: Ειδικά Θέµατα Λογισµικού

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Άσκηση 5: Παράλληλος προγραμματισμός σε επεξεργαστές γραφικών

Εισαγωγή στην Πληροφορική

Για τις λύσεις των προβλημάτων υπάρχει τρόπος εκτίμησης της επίδοσης (performance) και της αποδοτικότητας (efficiency). Ερωτήματα για την επίδοση

Όλες οι υπηρεσίες είναι διαθέσιμες μέσω διαδικτύου.

2. Στοιχεία Αρχιτεκτονικής Παράλληλων Υπολογιστών... 45

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Λειτουργικά Συστήματα Η/Υ

Παράλληλη Επεξεργασία Κεφάλαιο 7 ο Αρχιτεκτονική Συστημάτων Κατανεμημένης Μνήμης

Διαφορές single-processor αρχιτεκτονικών και SoCs

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Εικονική Μνήμη. (και ο ρόλος της στην ιεραρχία μνήμης)

Λειτουργικά Συστήματα (Λ/Σ)

Παρουσίαση 1 ης Άσκησης:

ιεργασίες και νήµατα Προγραµµατισµός ΙΙΙ 1 lalis@inf.uth.gr

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

Μάθημα:Εισαγωγή στα Λειτουργικά Συστήματα

Καρακασίδης Αλέξανδρος Καστίδου Γεωργία Παπαφώτη Μαρία Πέτσιος Κων/νος Στέφανος Σαλτέας Καλογεράς Παναγιώτης. Threads in Java ΝΗΜΑΤΑ ΣΤΗ JAVA

Ανάλυση Επιδόσεων Συστημάτων Πραγματικού Χρόνου

i Throughput: Ο ρυθμός ολοκλήρωσης έργου σε συγκεκριμένο χρόνο

ΔΙΑΧΕΙΡΙΣΗ ΜΝΗΜΗΣ. Λειτουργικά Συστήματα Ι. Διδάσκων: Καθ. Κ. Λαμπρινουδάκης ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ Ι

Σχεδίαση και Υλοποίηση Μηχανισμού Μεταφοράς Δεδομένων από Συσκευές Αποθήκευσης σε Δίκτυο Myrinet, Χωρίς τη Μεσολάβηση της Ιεραρχίας Μνήμης

Παρουσίαση 2 ης Άσκησης:

Εισαγωγή στους υπολογιστές υψηλών επιδόσεων και το σύστημα ARIS του ΕΔΕΤ

Ιεραρχία Μνήμης. Εικονική μνήμη (virtual memory) Επεκτείνοντας την Ιεραρχία Μνήμης. Εικονική Μνήμη. Μ.Στεφανιδάκης

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Απόδοση ΚΜΕ. (Μέτρηση και τεχνικές βελτίωσης απόδοσης)

Αρχιτεκτονική Υπολογιστών

Παράλληλη Επεξεργασία Εργαστηριακή Ασκηση Εαρινού Εξαµήνου 2008


Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Εργαστήριο Λειτουργικών Συστημάτων - Αλγόριθμοι Χρονοπρογραμματισμού. Εργαστηριακή Άσκηση

Μετρικές & Επιδόσεις. Κεφάλαιο V

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

1. ΑΡΧΕΣ ΛΕΙΤΟΥΡΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ ΕΙΣΑΓΩΓΗ

Αρχιτεκτονική Υπολογιστών. ηµήτρης Γκιζόπουλος Καθηγητής

ο ρόλος των αλγορίθμων στις υπολογιστικές διαδικασίες Παύλος Εφραιμίδης Δομές Δεδομένων και Αλγόριθμοι

Εισαγωγή στην Πληροφορική

Τμήμα Λογιστικής. Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. Μάθημα 8. 1 Στέργιος Παλαμάς

Τμήμα Οικιακής Οικονομίας και Οικολογίας. Οργάνωση Υπολογιστών

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή

Διαχείριση ενεργειακών πόρων & συστημάτων Πρακτικά συνεδρίου(isbn: )

ΑρχιτεκτονικήΥπολογιστών. Ι (ένα) Δημήτρης Γκιζόπουλος. Καθηγητής

Παράλληλη Επεξεργασία

Συστήματα πολυμέσων. Εισαγωγή Υλικό συστημάτων πολυμέσων Λογισμικό συστημάτων πολυμέσων Συστήματα πραγματικού χρόνου Χρονοπρογραμματισμός

Αποµακρυσµένη κλήση διαδικασιών

περιεχόμενα υπολογιστικό πρόβλημα αλγόριθμοι παράδειγμα ταξινόμησης ταξινόμηση αλγόριθμοι τεχνολογία αλγορίθμων Παύλος Εφραιμίδης

Σχολή Προγραµµατιστών Ηλεκτρονικών Υπολογιστών (ΣΠΗΥ) Τµήµα Προγραµµατιστών Σειρά 112

Κατανεμημένα Συστήματα

Περίληψη ιπλωµατικής Εργασίας

Μάθημα 7: Αλγόριθμοι Χρονοδρομολόγησης

ΛΟΓΙΣΜΙΚΟ (software)

Transcript:

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ www.cslab.ece.ntua.gr Διπλωματικές Εργασίες Ακ. έτος 2014-2015 Βελτιστοποίηση και δυναµική χρονοδροµολόγηση για τον αλγόριθµο Block-LU στο σύστηµα Intel Xeon Phi Τα πολυ-πύρηνα συστήµατα µε μεγάλο πλήθος πυρήνων (πάνω από 100) που έχουν αρχίσει να εισάγονται στην αγορά έχουν πολύπλοκες αρχιτεκτονικές που βασίζονται σε νησίδες υπολογιστικών πόρων και περιοχών µνήµης. Συνέπεια αυτού είναι αιτήσεις διαφόρων επεξεργαστών για χρήση των πόρων και της µνήµης να απαιτούν διαφορετικό χρόνο για την εξυπηρέτηση τους. Στο επίπεδο των εφαρµογών, αυτό µπορεί να έχει σηµαντικές συνέπειες. Αλγόριθµοι που ισοκατανέµουν στατικά τον φόρτο εργασίας µπορεί τελικά να απαιτούν πολύ διαφορετικούς χρόνους εκτέλεσης µεταξύ επεξεργαστικών στοιχείων, µε συνέπεια την µη βέλτιστη επίτευξη απόδοσης. Στα πλαίσια της διπλωµατικής εργασίας ζητείται η µετατροπή της Block-LU και αναδροµικών αλγορίθµων επίλυσης ώστε τα µεγέθη των block να προσαρµοστούν κατάλληλα στην αρχιτεκτονική του συστήµατος Intel Xeon Phi και η χρονοδροµολόγηση εκτέλεσης των block να γίνεται µε δυναµικό τρόπο, ώστε τελικά ο φόρτος εργασίας να είναι ισοκατανεµηµένος, ανεξάρτητα από τις διαφοροποιήσεις που επιφέρει η αρχιτεκτονική του συστήµατος. Μεταφορά προγραµµατιστικού µοντέλου στο σύστηµα Intel Xeon Phi Το σύστηµα Intel Xeon Phi είναι ένας πολύ-πύρηνος επιταχυντής (accelerator). Σκοπός του είναι η

επιτάχυνση τµηµάτων υπολογισµών σε εφαρµογές, όπως εξάλλου είναι και των καρτών γραφικών (GPUs). Ωστόσο, τόσο η αρχιτεκτονική (σύστηµα κοινής µνήµης), όσο και το προγραµµατιστικό µοντέλο που χρησιµοποιείται τώρα στο σύστηµα αυτό (OpenMP) είναι διαφορετικά σε σχέση µε αυτά των GPUs. Στόχος αυτής της διπλωµατικής εργασίας είναι η µεταφορά µιας υπάρχουσας βιβλιοθήκης χρόνου εκτέλεσης (run-time library) για την δηµιουργία και διαχείριση νηµάτων επιπέδου χρήστη (user-level threads) στο σύστηµα Intel Xeon Phi, η προσαρµογή της ώστε να προσοµοιάζει το µοντέλο προγραµµατισµού CUDA, η αξιολόγηση της απόδοσης εφαρµογών µε χρήση της συγκεκριµένης βιβλιοθήκης και η σύγκριση της απόδοσης όταν για τις εφαρµογές αυτές χρησιµοποιηθεί OpenMP. Κατά συνέπεια, στόχος είναι να διευκρινιστεί κατά πόσο ένα προγραµµατιστικό µοντέλο όπως η CUDA µπορεί να υλοποιηθεί αποδοτικά σε συστήµατα επιταχυντών διαφορετικής αρχιτεκτονικής. Παραλληλοποίηση unbalanced εφαρµογών µε προγραµµατιστικό µοντέλο µαζικού παραλληλισµού Ένα πλήθος σηµαντικών εφαρµογών παρουσιάζει ανοµοιοµορφία ως προς τον χρόνο επεξεργασίας κάθε στοιχείου δεδοµένων (unbalanced applications). Η αποδοτική παραλληλοποίηση τέτοιων εφαρµογών µπορεί να αποτελεί πρόκληση για τα ευρέως χρησιµοποιούµενα, σύγχρονα προγραµµατιστικά µοντέλα, όπως το OpenMP. Για αυτές τις εφαρµογές, για κάθε στοιχείο που πρέπει να επεξεργαστεί η ιδανική λύση θα ήταν η δηµιουργία ενός ξεχωριστού νήµατος. Με την ολοκλήρωση της εκτέλεσης κάθε νήµατος ο αντίστοιχος επεξεργαστής αναλαµβάνει άµεσα την εκτέλεση του επόµενου νήµατος. Αυτό οδηγεί στην αυτόµατη εξισορρόπηση του φόρτου εργασίας µεταξύ επεξεργαστών. Ωστόσο, η διαχείριση ενός τέτοιου πλήθους νηµάτων επιφέρει πολύ µεγάλες επιβαρύνσεις στην διαχείριση του παραλληλισµού και τελικά σε µεγαλύτερο χρόνο εκτέλεσης. Στα πλαίσια της διπλωµατικής εργασίας θα χρησιµοποιηθεί µια υπάρχουσα βιβλιοθήκη χρόνου εκτέλεσης (run-time library), στην οποία έχουν υλοποιηθεί πρωτοπόρες τεχνικές µείωσης του χρόνου διαχείρισης του παραλληλισµού για το συγκεκριµένο είδος εφαρµογών. Σκοπός είναι η επιλογή ενός πλήθους κατάλληλων εφαρµογών, η παραλληλοποίηση τους µε χρήση της προαναφερθείσας βιβλιοθήκης, η αξιολόγηση της αποτελεσµατικότητας της βιβλιοθήκης και ο προσδιορισµός επιπλέον βελτιστοποιήσεων για αυτήν. Τεχνικές βελτιστοποίησης του πυρήνα SpMV και του κόστους προεπεξεργασίας

του αραιού πίνακα σε πολυπύρηνες αρχιτεκτονικές Η δομή αποθήκευσης αραιών πινάκων CSX έχει προταθεί από μέλη του εργαστηρίου με στόχο την επιτάχυνση της εκτέλεσης του υπολογιστικού πυρήνα SpMV σε πολυπύρηνες αρχιτεκτονικές. Η δομή CSX εφαρμόζει δραστικές τεχνικές συμπίεσης δεδομένων στην τοπολογική πληροφορία των στοιχείων του πίνακα με στόχο τη μείωση του memory footprint του πίνακα και, κατ'επέκταση, την βελτίωση επίδοσης του πυρήνα. Στα πλαίσια αυτής της διπλωματικής θα μελετηθούν δυνατότητες περαιτέρω βελτίωσης της επίδοσης του πυρήνα εφαρμόζoντας τεχνικές συμπίεσης στις τιμές του πίνακα (value compression), vectorization σε δομές block και βελτιστοποίησης του βήματος προεπεξεργασίας του πίνακα. Τα αποτελέσματα της εργασίας θα ενσωματωθούν στη βιβλιοθήκη SparseX (http://research.cslab.ece.ntua.gr/sparsex). Επικοινωνία: Αθηνά Ελαφρού, athena@cslab.ece.ntua.gr Διαχείριση πόρων σε συστήματα μεγάλης κλίμακας με πρόβλεψη επίδοσης παράλληλων εφαρμογών Ένα συνηθισμένο πρόβλημα σε πολυεπεξεργαστικά συστήματα μεγάλης κλίμακας είναι η μη αποτελεσματική διαχείριση των υπολογιστικών πόρων. Λόγω της δυσκολίας να προβλεφθεί η παράλληλη επίδοση των παράλληλων εφαρμογών, οι χρήστες συχνά ζητούν περισσότερους υπολογιστικούς πόρους απ' όσους μπορεί αποδοτικά να αξιοποιήσει η εφαρμογή τους, με αποτέλεσμα να προκαλούν κακή κατανομή των πόρων του συστήματος και να υφίστανται μεγάλους χρόνους αναμονής. Στο πλαίσιο αυτής της εργασίας θα μελετηθεί η δυνατότητα εξαγωγής προβλέψεων για την επίδοση παράλληλων εφαρμογών από το ίχνος εκτέλεσής τους, με χρήση profiling εργαλείων, και η αξιοποίηση αυτής της πληροφορίας για αποδοτική δέσμευση και ανάθεση των διαθέσιμων πόρων. Επικοινωνία: Νικέλα Παπαδοπούλου, nikela@cslab.ece.ntua.gr, 210-7722495 Μελέτη κλιμάκωσης και επίδοσης παράλληλων δομών δεδομένων Ένας από τους σημαντικότερους παράγοντες που επηρεάζουν την επίδοση των εφαρμογών σε πολυπύρηνα συστήματα είναι ο συγχρονισμός των προσβάσεων σε κοινή μνήμη από πολλαπλούς επεξεργαστές. Σκοπός αυτής της εργασίας είναι η μελέτη, υλοποίηση και αξιολόγηση διαφορετικών τεχνικών υλοποίησης δομών δεδομένων, που προορίζονται για αποδοτική ταυτόχρονη πρόσβαση από πολλαπλές διεργασίες. Θα μελετηθεί ένα σύνολο τεχνικών και αλγορίθμων που έχουν προταθεί στη σχετική βιβλιογραφία. Παραδείγματα δομών δεδομένων οι οποίες μας ενδιαφέρουν είναι ουρά, στοίβα, πίνακας κατακερματισμού.

Επικοινωνία: Σιακαβάρας Δημήτρης, jimsiak@cslab.ece.ntua.gr, 210-7722495 Σχεδιασμός και Υλοποίηση προγράμματος παρακολούθησης και επιδιόρθωσης μέσω χρονοδρομολόγησης της επίδοσης συστήματος Οι πολυπύρηνες αρχιτεκτονικές αποτελούν σήμερα σχεδόν την αποκλειστική επιλογή σχεδιασμού για κάθε σύγχρονο υπολογιστικό σύστημα. Καθώς γίνεται κοινή χρήση πόρων, όπως ο δίαυλος στην κύρια μνήμη ή οι κρυφές μνήμες, δημιουργείται ανταγωνισμός για την χρήση τους, με αποτέλεσμα σημαντικές καθυστερήσεις στον χρόνο εκτέλεσης των προγραμμάτων. Σύγχρονοι χρονοδρομολογητές, όπως ο CFS του LINUX, δεν αντιμετωπίζουν με κάποιο τρόπο τέτοια προβλήματα, αφού στον σχεδιασμό τους δεν υπάρχει η έννοια του ανταγωνισμού για κοινούς πόρους. Σκοπός της παρούσας διπλωματικής εργασίας είναι η κατασκευή ενός προγράμματος, σε επίπεδο χρήστη, που θα παρακολουθεί την χρήση των κοινών πόρων και κατόπιν εντολής του χρήστη, θα εφαρμόζει μια άλλη πολιτική χρονοδρομολόγησης, από αυτήν του LINUX, για να ελαττωθούν οι κακές επιδράσεις από την κοινή χρήση των πόρων. Σχετικά μαθήματα: Λειτουργικά Συστήματα, Αρχιτεκτονική Υπολογιστών Επικοινωνία: Αλέξανδρος Χαριτάτος, aharit@cslab.ece.ntua.gr Εξαγωγή των δυνατοτήτων παραλληλισμού προγραμμάτων μέσω μετρήσεων των επιδόσεων τους σε πραγματικό χρόνο Ο ανταγωνισμός για κοινούς πόρους, όπως ο δίαυλος στην κύρια μνήμη ή οι κρυφές μνήμες, μεταξύ διεργασιών και νημάτων στις πολυπύρηνες αρχιτεκτονικές αποτελεί έναν σημαντικό λόγο που οριοθετεί την επιτάχυνση σε παράλληλα προγράμματα. Ειδικότερα όταν τέτοια προγράμματα εκτελούνται ταυτόχρονα τα αποτελέσματα του ανταγωνισμού μπορεί να γίνουν δραματικά για τις εκτελούμενες εφαρμογές. Όλοι οι σύγχρονοι επεξεργαστές δίνουν εργαλεία με τα οποία μπορεί να γίνει κατανοητός ο τρόπος εκτέλεσης κάποιου προγράμματος (performance counters). Στην διπλωματική εργασία αυτή θα εξετασθεί πως μέσα από τους performance counters μπορούν να προβλεφθούν τα όρια του παραλληλισμού κάθε προγράμματος, η καλύτερη δυνατή δρομολόγηση νημάτων σε πυρήνες αλλά και το πως δύο προγράμματα θα επηρεαστούν αν δρομολογηθούν ταυτόχρονα. Σχετικά μαθήματα: Λειτουργικά Συστήματα, Αρχιτεκτονική Υπολογιστών Επικοινωνία: Αλέξανδρος Χαριτάτος, aharit@cslab.ece.ntua.gr Εικονικοποίηση Μονάδων Επεξεργασίας Γραφικών (GPUs) και διαμοιρασμός τους σε εικονικές μηχανές Τα τελευταία χρόνια οι μονάδες επεξεργασίας γραφικών (GPUs) γίνονται ολοένα και πιο δημοφιλείς

στο πεδίο των παράλληλων εφαρμογών. Το γεγονός αυτό σε συνδυασμό με την ανάπτυξη των τεχνικών virtualization έχει δημιουργήσει την ανάγκη για χρήση GPUs από διαφορετικές εικονικές μηχανές, ένα δύσκολο πρόβλημα εξαιτίας των εγγενών χαρακτηριστικών των συσκευών αυτών. Στόχος της παρούσας εργασίας είναι η μελέτη και η αξιολόγηση των υπαρχουσών προσεγγίσεων σε αυτό το πρόβλημα και πιθανώς η σχεδίαση και υλοποίηση/τροποποίηση μηχανισμού που θα εκμεταλλεύεται τα τρέχοντα συστήματα για να μοιράσει μια GPU αποδοτικά σε διαφορετικές εικονικές μηχανές. Σχετικά μαθήματα: Λειτουργικά Συστήματα Υπολογιστών Επικοινωνία: Στέφανος Γεράγγελος, sgerag@cslab.ece.ntua.gr, 210-7721532 Αποδοτική επικοινωνία εικονικών μηχανών που βρίσκονται στο ίδιο φυσικό μηχάνημα Η ανάπτυξη και χρήση τεχνικών virtualization παρέχει τη δυνατότητα δημιουργίας εικονικών συστοιχιών (clusters) με Ν εικονικές μηχανές, δεδομένων Μ<Ν φυσικών μηχανημάτων. Αυτό συνεπάγεται την ύπαρξη δύο ή περισσότερων εικονικών μηχανών στο ίδιο φυσικό μηχάνημα. Η παρούσα εργασία έχει στόχο τη βελτίωση της δικτυακής επικοινωνίας ανάμεσα σε τέτοιες εικονικές μηχανές. Θα μελετηθούν υπάρχουσες λύσεις σε διάφορες πλατφόρμες εικονικοποίησης και θα σχεδιαστεί και υλοποιηθεί/τροποποιηθεί μηχανισμός αποδοτικής επικοινωνίας σε σχετικές καταστάσεις. Ενδεικτικά επιθυμητά χαρακτηριστικά του μηχανισμού είναι η επικοινωνία μεταξύ των εικονικών μηχανών με αδιαφανή τρόπο (οι εφαρμογές δε χρειάζεται να γνωρίζουν ότι επικοινωνούν με εικονική μηχανή που βρίσκεται στο ίδιο μηχάνημα) και η αποφυγή επεξεργασίας ανώτερων δικτυακών πρωτοκόλλων (TCP/IP) από τον επεξεργαστή. Σχετικά μαθήματα: Λειτουργικά Συστήματα Υπολογιστών Επικοινωνία: Στέφανος Γεράγγελος, sgerag@cslab.ece.ntua.gr, 210-7721532