ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Σχετικά έγγραφα
Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

Διαχείριση Πολιτισμικών Δεδομένων

ΠΕΡΙΛΗΨΗ Δ.Δ ΔΗΜΗΣΡΑΚΟΠΟΤΛΟ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Βάσεις Δεδομένων Ενότητα 1

Η Ηλεκτροκίνηση στο Ελληνικό Σύστημα Μεταφοράς Ηλεκτρικής Ενέργειας

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

Συστήματα μνήμης και υποστήριξη μεταφραστή για MPSoC

Αρχιτεκτονική Υπολογιστών

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές

Λιβανός Γιώργος Εξάμηνο 2017Β

Υδρονοµέας Σύστηµα υποστήριξης της διαχείρισης υδατικών πόρων

Αυτοματοποιημένη χαρτογραφία

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Η επίδραση της δειγματοληπτικής αβεβαιότητας των εισροών στη στοχαστική προσομοίωση ταμιευτήρα

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική II. Ενότητα 6 : Δομές αρχείων. Δρ. Γκόγκος Χρήστος

Διαχείριση Πολιτισμικών Δεδομένων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ

ΠΑΝΕΠΙΤΗΜΙΟ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Εφαρμογή Συστημάτων Μέτρησης και Βελτίωσης της Απόδοσης στον ευρύτερο Δημόσιο Τομέα

ΟΡΓΑΝΩΣΗ ΚΑΙ ΣΧΕΔΙΑΣΗ Η/Υ

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Χρήση ΕΛΛΑΚ σε περιβάλλον ασύγχρονης & εξ αποστάσεως εκπαίδευσης

Υποδείγματα Ανάπτυξης

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

«Αναβαθμισμένη υπηρεσία ασύγχρονης dτηλεκπαίδευσ ης ΠΣΔ:

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΑΣΚΗΣΗ ΔΕΥΤΕΡΗ

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Eθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών EMΠ

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΑΣΤΙΚΗ ΟΔΟ. Δανάη Βουτσινά

Κεφάλαιο 5. Κεφ. 5 Λειτουργικά Συστήματα 1

Πληροφορική 2. Δομές δεδομένων και αρχείων

Κεφάλαιο 4 Λογισμικό συστήματος. Εφαρμογές Πληροφορικής Κεφ.4 Καραμαούνας Πολύκαρπος 1

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ

Λειτουργικά Συστήματα Η/Υ

Κεφάλαιο 4: Λογισμικό Συστήματος

καθ. Βασίλης Μάγκλαρης

Διδάσκων: Νίκος Λαγαρός

Σύνοψη Προηγούμενου. Λίστες (Lists) Συνδεδεμένες Λίστες: Εισαγωγή (1/2) Συνδεδεμένες Λίστες. Ορέστης Τελέλης

Τμήμα Οικιακής Οικονομίας και Οικολογίας. Οργάνωση Υπολογιστών

Εισαγωγή στη Δασική Πληροφορική

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 1: Ορισμοί βασικών εννοιών: Μια πρώτη μοντελοποίηση. Ευαγγελίδης Γεώργιος Τμήμα Εφαρμοσμένης Πληροφορικής

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΤΙΤΛΟΣ

Στρατηγική Επιλογή Capital B.O.S. Capital B.O.S.

ΕΙΣΑΓΩΓΗ ΣΤΙΣ Β ΣΕ Ε Σ Ι ΟΜΕΝ

Κεφάλαιο 1.6: Συσκευές αποθήκευσης

ΣΥΓΚΡΙΤΙΚΗ ΑΝΑΛΥΣΗ ΣΥΜΠΕΡΙΦΟΡΑΣ ΝΕΩΝ ΟΔΗΓΩΝ ΣΕ ΣΥΝΘΗΚΕΣ ΚΑΝΟΝΙΚΕΣ ΚΑΙ ΠΡΟΣΟΜΟΙΩΣΗΣ ΣΕ ΥΠΕΡΑΣΤΙΚΗ ΟΔΟ ΝΙΚΑΣ ΜΑΡΙΟΣ

ΠΥΡΗΝΑΣ ΕΦΑΡΜΟΓΗΣ Γενικά Συμμόρφωση με πρότυπα (PACS Core)

Δομές Δεδομένων & Αλγόριθμοι

Ιωάννα Ανυφαντή, Μηχανικός Περιβάλλοντος Επιβλέπων: Α. Ευστρατιάδης, ΕΔΙΠ ΕΜΠ. Αθήνα, Ιούλιος 2018

2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π.

Αρχιτεκτονική Υπολογιστών

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΠΛΕ075: Προηγμένη Σχεδίαση Αλγορίθμων και Δομών Δεδομένων. Λουκάς Γεωργιάδης

ΠΑΡΟΥΣΙΑΣΗ ΚΑΤΕΥΘΥΝΣΕΩΝ Διοίκηση Λειτουργιών και Εφοδιαστικής Αλυσίδας

Το µαθηµατικό µοντέλο του Υδρονοµέα

Αναγνώριση Προτύπων Ι

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1

Τεχνολογία μνημών Ημιαγωγικές μνήμες Μνήμες που προσπελαύνονται με διευθύνσεις:

Θέμα: Σκληρός Δίσκος

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

Αγορά Πληροφορικής. Προϊόντα και Υπηρεσίες.

ΘΕΜΑΤΑ ΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ 2006 / 2007

12 o Εργαστήριο Σ.Α.Ε

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Άπληστοι Αλγόριθμοι. Επιμέλεια διαφανειών: Δ. Φωτάκης Τροποποιήσεις: Α. Παγουρτζής. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Υδατικών Πόρων και Περιβάλλοντος. Διαχείριση Υδατικών Πόρων

Διπλωματική Εργασία. Σχεδίαση και ανάπτυξη ιστοχώρου για την αξιολόγηση σεμιναρίων και μαθημάτων

On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Σχεδιασμός και Υλοποίηση ενός πληροφοριακού συστήματος για τους τεχνικούς του φυσικού αερίου

«Γνωριμία με το Εσωτερικό του Ηλεκτρονικού Υπολογιστή»

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Άπληστοι Αλγόριθμοι. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

«Τεχνολογία και Προοπτικές εξέλιξης μικρών υδροστροβίλων» Δημήτριος Παπαντώνης και Ιωάννης Αναγνωστόπουλος

Σχεδιασμός και κατασκευή ενός υβριδικού αμυντικού αυτοματοποιημένου ρομποτικού συστήματος

Υπολογιστική Πολυπλοκότητα

ΕΡΕΥΝΗΤΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΙΝΣΤΙΤΟΥΤΟ ΣΥΣΤΗΜΑΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΥΠΟΛΟΓΙΣΤΩΝ (ΕΠΙΣΕΥ) I-SENSE GROUP

Δυναμικός Προγραμματισμός

ΠΑΡΑΓΟΝΤΕΣ ΕΝΙΣΧΥΣΗΣ ΣΤΗΝ ΑΝΑΠΤΥΞΗ ΤΩΝ LOGISTICS Όσο λοιπόν αυξάνει η σημασία και οι απαιτήσεις του διεθνούς εμπορίου, τόσο πιο απαιτητικές γίνονται

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο Κάθε δομή μπορεί να χρησιμοποιηθεί σε οποιοδήποτε πρόβλημα ή εφαρμογή

Ανάκτηση Πληροφορίας

Λειτουργικά Συστήματα (Λ/Σ)

Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Υδατικών Πόρων και Περιβάλλοντος. Τεχνολογία Συστημάτων Υδατικών Πόρων

Transcript:

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ανάπτυξη μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, με χρήση ενισχυτικής μάθησης, σε ιεραρχικά συστήματα αποθήκευσης ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΘΕΟΔΩΡΟΥ Ι. ΡΕΚΑΤΣΙΝΑ Επιβλέπων : Τιμολέων Σελλής Καθηγητής Ε.Μ.Π. Αθήνα, Ιούλιος 2010

Περίληψη Η διαχείριση αρχείων σε ιεραρχικά συστήματα αποθήκευσης είναι ένα ενεργό πεδίο έρευνας. Λόγω της συνεχούς αύξησης του όγκου των δεδομένων η χρήση ιεραρχικών συστημάτων αποθήκευσης για τη διαχείριση δεδομένων γίνεται όλο και περισσότερο απαραίτητη. Τα συστήματα αυτά έχουν περισσότερες παραμέτρους και πολιτικές που πρέπει να ρυθμιστούν σε σχέση με παραδοσιακά συστήματα αποθήκευσης. Ένας από τους σημαντικότερους παράγοντες της απόδοσης των συστημάτων αυτών είναι ο χρόνος εξυπηρέτησης των εισερχόμενων αιτήσεων προσπέλασης αρχείων. Ο χρόνος εξυπηρέτησης μπορεί να μειωθεί εάν αυξηθεί το πλήθος των αιτήσεων που εξυπηρετούνται από το υψηλότερο και παράλληλα ταχύτερο επίπεδο της ιεραρχίας μνήμης. Δυστυχώς είναι αδύνατο για τους διαχειριστές τέτοιων συστημάτων να ανιχνεύσουν πιθανά μοτίβα προσπέλασης των αρχείων. Επίσης κλασσικές στατικές πολιτικές αντικατάστασης αποτυγχάνουν να μεγιστοποιήσουν την απόδοση του συστήματος καθώς δε λαμβάνουν υπόψη τους σημαντικές παραμέτρους των αρχείων όπως το μέγεθος τους. Έναυσμα για την έρευνα μας αποτέλεσε η βελτίωση των πολιτικών αντικατάστασης που χρησιμοποιεί το ιεραρχικό σύστημα αποθήκευσης CASTOR, το οποίο σχεδιάστηκε και υλοποιήθηκε στο CERN. Η παρούσα εργασία παρουσιάζει δύο νέες προσαρμοστικές πολιτικές αντικατάστασης αρχείων, οι οποίες χρησιμοποιούν μεθόδους Ενισχυτικής Μάθησης για τη ρύθμιση των παραμέτρων τους. Αρχικά προτείνουμε μια γενικευμένη μοντελοποίηση του προβλήματος αντικατάστασης των αρχείων ως πρόβλημα ενισχυτικής μάθησης. Η μοντελοποίηση των δύο προσεγγίσεων που προτείνονται, βασίζεται στην αναγωγή του προβλήματος αντικατάστασης αρχείων στο πρόβλημα stochastic Knapsack και min-knapsack αντίστοιχα. Αφού μοντελοποιήσουμε το πρόβλημα caching ως πρόβλημα ενισχυτικής μάθησης ενσωματώνουμε τις νέες πολιτικές σε ένα προσομοιωτή του συστήματος CASTOR, ο οποίος αναπτύχθηκε ειδικά για την αξιολόγηση των πολιτικών αντικατάστασης. Σύμφωνα με τα πρώτα αποτελέσματα οι νέες πολιτικές επιτυγχάνουν καλύτερη απόδοση από τις ήδη υπάρχουσες στατικές πολιτικές του συστήματος. Λέξεις Κλειδιά: Προσαρμοστική Πολιτική Αντικατάστασης Αρχείων, Γενικευμένο Πρόβλημα Caching, Ιεραρχικά Συστήματα Αποθήκευσης, CERN, CASTOR, Ενισχυτική Μάθηση, Στοχαστικό Πρόβλημα Σακιδίου, Πρόβλημα Ελαχιστοποίησης Σακιδίου

1 Εισαγωγή 1.1 Ιεραρχικά Συστήματα Αποθήκευσης - Διαχείριση Αρχείων Με τη συνεχή αύξηση του όγκου των δεδομένων που παράγεται σε ψηφιακή μορφή, οι αποθήκες δεδομένων αποτελούν ένα πεδίο με έντονο ερευνητικό ενδιαφέρον. Καθημερινά παράγονται petabytes δεδομένων είτε από επιστημονικά πειράματα είτε από εταιρίες πληροφορικής. Η ανάγκη της διατήρησης και διαχείρισης αυτού του όγκου των δεδομένων οδήγησε στη διαδεδομένη χρήση των ιεραρχικών συστημάτων αποθήκευσης (hierarchical storage management systems). Τα ιεραρχικά συστήματα αποθήκευσης εισάγουν ένα νέο επίπεδο στην ιεραρχία της αποθήκευσης δεδομένων. Πέραν της κύριας μνήμης και των δευτερευόντων μέσων αποθήκευσης (μαγνητικοί σκληροί δίσκοι ή δίσκοι στερεάς κατάστασης) χρησιμοποιούνται και τριτογενή μέσα αποθήκευσης, όπως μαγνητικές κασέτες αποθήκευσης ή αφαιρούμενοι σκληροί δίσκοι. Λόγω των πολλαπλών επιπέδων ο αριθμός των παραμέτρων που καθορίζουν τη λειτουργία των συστημάτων αυτών είναι αυξημένος σε σχέση με τα παραδοσιακά συστήματα αποθήκευσης δεδομένων. Σε τόσο περίπλοκα συστήματα είναι αναγκαία η αυτόματη προσαρμογή των παραμέτρων και των πολιτικών λειτουργίας τους, ώστε να μη διαταράσσεται η λειτουργία τους από μεταβολές του εξωτερικού περιβάλλοντός τους. Ένα από τα σημαντικότερα σημεία για την αποδοτική λειτουργία των ιεραρχικών συστημάτων αποθήκευσης είναι η μεταφορά και διαχείριση αρχείων ανάμεσα στα διάφορα επίπεδα. Όπως θα δούμε στη συνέχεια της παρούσας εργασίας 1

γίνονται πολλές προσπάθειες για την ανάπτυξη προσαρμοστικών αλγορίθμων και πολιτικών με σκοπό τη βελτίωση της διαχείρισης των αρχείων σε τέτοια συστήματα. 1.2 Αντικείμενο διπλωματικής Στην παρούσα διπλωματική εργασία επικεντρώνουμε στις πολιτικές αντικατάστασης αρχείων στα υψηλότερα επίπεδα της ιεραρχίας και ερευνούμε τον τρόπο με τον οποίο μια προσαρμοστική πολιτική αντικατάστασης αρχείων μπορεί να ενσωματωθεί σε ένα ιεραρχικό σύστημα. Ισχυριζόμαστε ότι το πεδίο της Ενισχυτικής Μάθησης (Reinforcement Learning) παρέχει τους κατάλληλους αλγορίθμους βελτιστοποίησης για τη μάθηση μιας βέλτιστης πολιτικής αντικατάστασης αρχείων και δείχνουμε πώς το γενικευμένο πρόβλημα της προσωρινής αποθήκευσης αρχείων (file caching problem) μπορεί να μοντελοποιηθεί ως πρόβλημα ενισχυτικής μάθησης. Αφού προτείνουμε δύο διαφορετικές προσεγγίσεις για την υλοποίηση μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, ενσωματώνουμε τους νέους αλγορίθμους στο σύστημα CASTOR (Cern Advanced STORage system), στο οποίο θα εκτελέσουμε τα πειράματά μας ώστε να αξιολογήσουμε την απόδοση των νέων πολιτικών. Πριν τη σχετική μελέτη του προβλήματος αναπτύχθηκε ένας προσομοιωτής του συστήματος CASTOR, αφού η πρόσβαση στο πραγματικό σύστημα ήταν αδύνατη. Το σύστημα CASTOR είναι ένα τυπικό ιεραρχικό σύστημα αποθήκευσης που αναπτύχθηκε στο CERN και χρησιμοποιείται για την αποθήκευση δεδομένων που παράγονται από τα πειράματα του CERN αλλά και προσωπικών αρχείων των επιστημόνων. Στο χαμηλότερο επίπεδο της ιεραρχίας τα δεδομένα αποθηκεύονται σε κασέτες ενώ στο υψηλότερο σε σκληρούς δίσκους. Η σημαντικότερη πρόκληση στην έρευνά μας εισάγεται λόγω του πλήθους των αρχείων που διαχειρίζεται το σύστημα CASTOR και του πλήθους των αιτήσεων που δέχεται από χρήστες. Λόγω της κλίμακας του συστήματος κάθε λειτουργία του πρέπει να τηρεί ορισμένους περιορισμούς πολυπλοκότητας και να χαρακτηρίζεται από επεκτασιμότητα (scalability) ως προς το πλήθος των αρχείων του συστήματος. Τέλος επισημαίνουμε ότι οι αιτήσεις δεν προκύπτουν από κάποια εφαρμογή αλλά από τους ίδιους τους χρήστες, συνήθως χωρίς να ακολουθούν κάποιο δεδομένο μοτίβο. Το γεγονός αυτό καθιστά ιδιαίτερα ενδιαφέρουσα την εφαρμογή προσαρμοστικών μεθόδων διαχείρισης αρχείων στο σύστημα. 1.2.1 Συνεισφορά Στην παρούσα διπλωματική εργασία στόχος μας είναι η ανάπτυξη μιας εξ ολοκλήρου προσαρμοστικής πολιτικής για την αντικατάσταση και διαγραφή αρχείων από το υψηλότερο επίπεδο της ιεραρχίας. 2

Ισχυριζόμαστε ότι το πεδίο της Ενισχυτικής Μάθησης παρέχει τους κατάλληλους αλγορίθμους και τις κατάλληλες μεθόδους για την ανάπτυξη μιας τέτοιας πολιτικής και ερευνούμε την εφαρμογή του στο πρόβλημα της αντικατάστασης αρχείων. Τελικά προτείνουμε μια γενικευμένη μοντελοποίηση του προβλήματος αντικατάστασης αρχείων ως πρόβλημα ενισχυτικής μάθησης και δύο νέους τρόπους επίλυσης του προβλήματος με χρήση μεθόδων ενισχυτικής μάθησης. Η μόνη δημοσίευση σχετική δημοσίευση την παρούσα στιγμή είναι η [23], η οποία όμως δεν προτείνει μια νέα προσαρμοστική πολιτική αλλά ένα ενδιάμεσο μηχανισμό για επιλογή της καταλληλότερης στατικής πολιτικής από ένα σύνολο προκαθορισμένων στατικών πολιτικών. Για την υλοποίηση του μηχανισμού αυτού χρησιμοποιείται ενισχυτική μάθηση. Τέλος ενσωματώνουμε την προτεινόμενη μοντελοποίηση σε μια προσομοίωση του συστήματος CASTOR, την οποία αναπτύξαμε για την εκτέλεση και αξιολόγηση πολιτικών αντικατάστασης αρχείων. Η ενσωμάτωση των νέων μεθόδων σε ένα σύστημα που διαχειρίζεται Petabytes δεδομένων και εκατομμύρια αρχείων αποτελεί μια ιδιαίτερη πρόκληση και μας επιτρέπει να εξετάσουμε κατά πόσο μπορούν να εφαρμοστούν κλασσικές και μη τεχνικές βελτιστοποίησης σε τέτοια συστήματα. Εδώ πρέπει να τονίσουμε ότι παράλληλα με την ανάπτυξη των νέων προσαρμοστικών μεθόδων αναπτύχθηκε και μια νέα στατική πολιτική αντικατάστασης, η οποία λειτουργεί καλύτερα από τις ήδη υπάρχουσες πολιτικές στο σύστημα CASTOR. 1.3 Οργάνωση κειμένου Η παρούσα εργασία χωρίζεται σε 7 κεφάλαια. Στο κεφάλαιο 2 γίνεται μια εισαγωγή στα Ιεραρχικά Συστήματα Αποθήκευσης και περιγράφεται το σύστημα CASTOR πάνω στο οποίο εξετάζουμε την εφαρμογή των νέων προσαρμοστικών πολιτικών αντικατάστασης που προτείνουμε. Εκτός του παραπάνω γίνεται μια βιβλιογραφική αναφορά σε στατικές πολιτικές αντικατάστασης αρχείων αλλά και σχετικές εργασίες που προτείνουν προσαρμοστικές πολιτικές. Στο κεφάλαιο 3 γίνεται μια εισαγωγή στο πεδίο της Ενισχυτικής Μάθησης, αναφέρονται οι σημαντικότερες κατηγορίες αλγορίθμων για διακριτούς και συνεχείς χώρους καταστάσεων. Το κεφάλαιο 4 προσφέρει μια ολοκληρωμένη ανάλυση για το πώς το πρόβλημα αντικατάστασης αρχείων μπορεί να μοντελοποιηθεί ως πρόβλημα ενισχυτικής μάθησης. Παρουσιάζουμε τις διαφορετικές προσεγγίσεις που ακολουθήσαμε και τελικά προτείνουμε δύο προσαρμοστικές πολιτικές αντικατάστασης που βασίζονται στη μέθοδο της ενισχυτικής μάθησης. Στο κεφάλαιο 5 παρουσιάζονται και αναλύονται τα αποτελέσματα των πειραμάτων που εκτελέσαμε., ενώ στο κεφάλαιο 6 επιχειρείται μια σύνοψη της εργασίας και παρουσιάζονται δυνατότητες μελλοντικής έρευνας. Τέλος, το κεφάλαιο 7 παρουσιάζει τη σχετική βιβλιογραφία. 3