9. Φυσική Οργάνωση Αρχείων στο Δίσκο & Ευρετήρια

Σχετικά έγγραφα
Αποθήκευση και Οργάνωση αρχείων. Βάσεις Δεδομένων Μάθημα 2ο Διδάσκων: Μαρία Χαλκίδη

ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ. Επίπεδα Αφαίρεσης Σ Β. Αποθήκευση Εγγραφών - Ευρετήρια. ρ. Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, Επίπεδο Όψεων.

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη

Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1

Ευρετήρια. Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρια 1

Αποθήκευση Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Φροντιστήριο Αποθήκευση σε δίσκο, βασικές οργανώσεις αρχείων κατακερματισμός και δομές ευρετηρίων για αρχεία

Βάσεις Δεδομένων. Αποθήκευση σε δίσκο, βασικές οργανώσεις αρχείων, κατακερματισμός και δομές ευρετηρίων για αρχεία. Φροντιστήριο 7 o

Αποθήκευση εδομένων. ομή ενός Σ Β. Εισαγωγή Το «εσωτερικό» ενός ΜΕΡΟΣ Β : Η (εσωτερική) αρχιτεκτονική ενός Σ Β είναι σε επίπεδα

Αποθήκευση εδοµένων. Μαγνητικοί ίσκοι. Μαγνητικές ταινίες για. Εισαγωγή

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1

Κεφάλαιο 14. Δομές Ευρετηρίων για Αρχεία. Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση,

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6: Δομές ευρετηρίων για αρχεία

Πληροφορική 2. Δομές δεδομένων και αρχείων

Αποθήκευση Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Λειτουργικά Συστήματα Ι. Καθηγήτρια Παπαδάκη Αναστασία

Κεφάλαιο 14. οµές Ευρετηρίων για Αρχεία. ιαφάνεια 14-1

Αποθήκευση εδοµένων. Εισαγωγή. Σχεδιασµό και υλοποίηση µιας βάσης δεδοµένων χρησιµοποιώντας ένα Σ Β

Αποθήκευση εδομένων. Μαγνητικοί ίσκοι. Μαγνητικές ταινίες για. Εισαγωγή

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Κεφ.11: Ευρετήρια και Κατακερματισμός

Αποθήκευση εδομένων. Μαγνητικές ταινίες για. Εισαγωγή. Μέχρι σήμερα, είδαμε το σχεδιασμό και υλοποίηση μιας βάσης δεδομένων χρησιμοποιώντας ένα Σ Β

Κεφάλαιο 13. Αποθήκευση σε ίσκους, Βασικές οµέςαρχείων, και Κατακερµατισµός. ιαφάνεια 13-1

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Αποθήκευση και Οργάνωση αρχείων. Βάσεις Δεδομένων Μάθημα 2ο Διδάσκων: Μαρία Χαλκίδη

Αποθήκευση Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Αποθήκευση Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

ΣΥΣΚΕΥΕΣ ΑΠΟΘΗΚΕΥΣΗΣ (ΜΝΗΜΗ)

Αποθήκευση εδοµένων. Μαγνητικοί ίσκοι. Μαγνητικές ταινίες για. Εισαγωγή. Σχεδιασµό και υλοποίηση µιας βάσης δεδοµένων χρησιµοποιώντας

Λειτουργικά Συστήματα Κεφάλαιο 2 Οργάνωση Συστήματος Αρχείων 2.1 Διαχείριση Αρχείων και Σύστημα Αρχείων(File System)

Τεχνολογία μνημών Ημιαγωγικές μνήμες Μνήμες που προσπελαύνονται με διευθύνσεις:

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Κεφάλαιο 13. Αποθήκευση σε Δίσκους, Βασικές Δομές Αρχείων, και Κατακερματισμός

Οργάνωση Αρχείων. Βάσεις Δεδομένων : Οργάνωση Αρχείων 1. Blobs

Επεξεργασία Ερωτήσεων

Λειτουργικά Συστήματα. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Οργάνωση Αρχείων. Βάσεις Δεδομένων : Οργάνωση Αρχείων 1. Blobs

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Τα δεδομένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο

Το εσωτερικό ενός Σ Β

Κατακερματισμός. 4/3/2009 Μ.Χατζόπουλος 1

Οργάνωση Αρχείων. Διάγραμμα Σχεσιακού σχήματος. Ευρετήρια. Ταξινομημένα ευρετήρια B + δένδρα Ευρετήρια κατακερματισμού

Οργάνωση Υπολογιστών (IΙI)

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

Οργάνωση Αρχείων. Ευρετήρια. Ταξινοµηµένα ευρετήρια B + -δένδρα Ευρετήρια κατακερµατισµού. Αρχεία σωρού ιατεταγµένα αρχεία Αρχεία κατακερµατισµού

Κεφάλαιο 1.6: Συσκευές αποθήκευσης

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων

Δυναμικά Πολυεπίπεδα Ευρετήρια (Β-δένδρα) Μ.Χατζόπουλος 1

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ ΙΙ - UNIX. Συστήματα Αρχείων. Διδάσκoντες: Καθ. Κ. Λαμπρινουδάκης Δρ. Α. Γαλάνη

Αποθήκευση Δεδοµένων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Βάσεις εδοµένων Ευαγγελία Πιτουρά 2

ΗΥ460 Συστήματα Διαχείρισης Βάσεων Δεδομένων Χειμερινό Εξάμηνο 2016 Διδάσκοντες: Βασίλης Χριστοφίδης, Δημήτρης Πλεξουσάκης, Χαρίδημος Κονδυλάκης

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Ευρετήρια. Το ευρετήριο αρχείου είναι ένα διατεταγµένο αρχείο µε σταθερού µήκους εγγραφές

Βασικές συσκευές Ε/Ε. Είσοδος Έξοδος στον υπολογιστή. Ένα τυπικό υπολογιστικό σύστημα σήμερα. Οργάνωση Υπολογιστών (IΙI) Μ.

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων

Ευρετήρια. Το ευρετήριο αρχείου είναι ένα διατεταγµένο αρχείο µε σταθερού µήκους εγγραφές

Βάσεις Δεδομένων ΙΙ Ενότητα 5

Κεφάλαιο 7 Ιεραρχία Μνήμης (Memory Hierarchy)

Αποθήκευση Δεδοµένων

Ευρετήρια. Πρωτεύον ευρετήριο (primary index): ορισμένο στο κλειδί διάταξης του αρχείου. Ευρετήρια. Ευρετήρια. Ευρετήρια

Ευρετήρια. Πρωτεύον ευρετήριο (primary index): ορισμένο στο κλειδί διάταξης του αρχείου. Ευρετήρια. Ευρετήρια. Ευρετήρια

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Αρχείων. Διδάσκoντες: Καθ. Κ. Λαμπρινουδάκης Δρ. Α. Γαλάνη

i Στα σύγχρονα συστήματα η κύρια μνήμη δεν συνδέεται απευθείας με τον επεξεργαστή

Τεχνολογίες Κύριας Μνήμης

Οργάνωση Υπολογιστών (ΙI)

Κύρια μνήμη. Μοντέλο λειτουργίας μνήμης. Ένα τυπικό υπολογιστικό σύστημα σήμερα. Οργάνωση Υπολογιστών (ΙI)

Τμήμα Οικιακής Οικονομίας και Οικολογίας. Οργάνωση Υπολογιστών

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

Ευρετήρια. Ευρετήρια. Βάσεις εδοµένων :ευρετήρια 1

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΑΣΚΗΣΗ ΔΕΥΤΕΡΗ

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Θέμα: Σκληρός Δίσκος

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Ευρετήρια. Βάσεις Δεδομένων : Ευρετήρα 1. Πρωτεύον ευρετήριο (primary index): ορισμένο στο κλειδί διάταξης του αρχείου. Ευρετήρια.

Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή

Κεφ. 10: Δομές Αποθήκευσης

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Βάσεις δεδομένων. (10 ο μάθημα) Ηρακλής Βαρλάμης

Κεφάλαιο 13. Αποθήκευση σε Δίσκους, Βασικές Δομές Αρχείων, και Κατακερματισμός

Κύρια & Περιφερειακή Μνήµη

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική II. Ενότητα 6 : Δομές αρχείων. Δρ. Γκόγκος Χρήστος

Τα µπιτ και η σηµασία τους. Σχήµα bit. ΚΕΦΑΛΑΙΟ 1: Αποθήκευση εδοµένων (1/2) 1.7 Αποθήκευση κλασµάτων 1.8 Συµπίεση δεδοµένων 1.9 Σφάλµατα επικοινωνίας

ΛΥΣΗ ΤΗΣ ΔΕΥΤΕΡΗΣ ΑΣΚΗΣΗΣ Όλγα Γκουντούνα

Κατακερµατισµός. Οργάνωση Αρχείων (σύνοψη) Οργάνωση αρχείων: πως είναι τοποθετημένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Κεφάλαιο 2.4: Εργασία με εικονίδια

Τεχνολογία Πολυμέσων. Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Σύστηµα Αρχείων και Καταλόγων

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Transcript:

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 9. Φυσική Οργάνωση Αρχείων στο Δίσκο & Ευρετήρια Σχεδιασμός Βάσεων Δεδομένων Χρήστος 2017-18

Φυσική Οργάνωση Αρχείων στο Δίσκο Βασικές έννοιες αποθηκευτικών χώρων Ιεραρχία αποθήκευσης και μνήμης Μορφοποιήσεις Σελίδων Τύποι οργάνωσης εγγραφών αρχείων Φυσικά μέσα αποθήκευσης Αρχεία σωρού Μνήμη (κρυφή και κύρια), δίσκος, ταινία Δευτερεύουσες μονάδες αποθήκευσης Χρόνος προσπέλασης (access time) Radom I/O vs. Seuetial I/O Ταξινομημένα αρχεία Τεχνικές κατακερματισμού Ευρετήρια Ενός επιπέδου (πρωτεύοντα,συγκροτημένα, δευτερεύοντα) Πολλαπλών επιπέδων 2

Αρχιτεκτονική Υπολογιστή CPU BUS M DC CPU: Επεξεργαστής Μ: Κύρια μνήμη DC: Ελεγκτής δίσκου (Disk Cotroller) 3

Ιεραρχία Αποθήκευσης Πρωτεύουσα αποθήκευση Περιλαμβάνει τα αποθηκευτικά μέσα που μπορεί άμεσα να χειριστεί η CPU Κύρια μνήμη Μικρότερες αλλά ταχύτερες κρυφές μνήμες Παρέχει γρήγορη προσπέλαση, αλλά περιορισμένη χωρητικότητα αποθήκευσης Δευτερεύουσα αποθήκευση Περιλαμβάνει τα αποθηκευτικά μέσα που δεν μπορεί να χειριστεί άμεσα η CPU (πρέπει πρώτα τα δεδομένα να αντιγραφούν στον πρωτεύοντα αποθηκευτικό χώρο) Μαγνητικοί δίσκοι Οπτικοί δίσκοι Ταινίες (αναφέρεται και ως τριτεύων αποθηκευτικός χώρος) Μεγαλύτερη χωρητικότητα, μικρότερο κόστος ( ), αλλά αργή προσπέλαση 4

Ιεραρχία της Μνήµης CPU Αίτηση για δεδομένα Δεδομένα που ικανοποιούν την αίτηση ΚΡΥΦΗ ΜΝΗΜΗ ΚΥΡΙΑ ΜΝΗΜΗ ΜΑΓΝΗΤΙΚΟΣ ΔΙΣΚΟΣ ΤΑΙΝΙΑ Πρωτεύων αποθηκευτικός χώρος Δευτερεύων αποθηκευτικός χώρος Τριτεύων αποθηκευτικός χώρος 5

Φυσικά Μέσα Αποθήκευσης: Κατηγοριοποίηση Μόνιμη (ovolatile storage) vs. ευμετάβλητη (volatile storage) αποθήκευση Μόνιμη: το περιεχόμενο παραμένει ακόμη κι όταν σταματήσει η παροχή ρεύματος Μονάδες δευτερεύουσας αποθήκευσης Ευμετάβλητη: υπάρχει απώλεια δεδομένων όταν διακοπεί η παροχή ρεύματος Κύρια μνήμη Άμεση (olie access) vs. έμμεση (offlie access) προσπέλαση Άμεση: Τα δεδομένα είναι διαθέσιμα ανά πάσα στιγμή Μαγνητικοί δίσκοι Έμμεση: Αργή πρόσβαση στα δεδομένα (προηγείται φόρτωμα) Ταινίες 6

Πρωτεύων Αποθηκευτικός Χώρος: Μνήµη Σε περίπτωση απώλειας ρεύματος, τα δεδομένα χάνονται Κρυφή μνήμη (cache) Γρηγορότερη και ακριβότερη μορφή αποθήκευσης Κύρια μνήμη Γρήγορη προσπέλαση Τυπική ταχύτητα πρόσβασης 100s (=10-7 s) Περιορισμένη χωρητικότητα Σήμερα χρησιμοποιούνται ευρέως μερικά GB 7

Δευτερεύων Αποθηκευτικός Χώρος: Flash Memory Σε περίπτωση απώλειας ρεύματος, τα δεδομένα παραμένουν (δε χάνονται) Η ανάγνωση γίνεται αρκετά γρήγορα Όχι όμως τόσο γρήγορα όσο στην κύρια μνήμη Η εγγραφή και η διαγραφή είναι αργές Το κόστος ανά μονάδα αποθήκευσης είναι σχεδόν συγκρίσιμο με της κύριας μνήμης (αλλά πέφτει!) Χρησιμοποιείται ευρέως σε ψηφιακές συσκευές (φωτογραφικές μηχανές, κάμερες, κτλ) 8

Δευτερεύων Αποθηκευτικός Χώρος: Μαγνητικός Δίσκος Τα δεδομένα παραμένουν αναλλοίωτα σε περίπτωση διακοπής τροφοδοσίας ρεύματος Τα δεδομένα αποθηκεύονται σε περιστρεφόμενους δίσκους Η ανάγνωση και η εγγραφή γίνεται μαγνητικά Πρόσβαση στα δεδομένα, προϋποθέτει μεταφορά από το δίσκο στην κύρια μνήμη Αποθήκευση στο δίσκο σημαίνει μεταφορά δεδομένων από την κύρια μνήμη στο δίσκο Άμεση προσπέλαση Είναι δυνατή η πρόσβαση στα δεδομένα με οποιαδήποτε σειρά (δεν απαιτείται σειριακή πρόσβαση) Σπάνια χάνονται τα δεδομένα, ακόμη και σε περίπτωση καταστροφής του δίσκου 9

Τριτεύων Αποθηκευτικός Χώρος: Ταινίες Μόνιμη αποθήκευση δεδομένων Χρησιμοποιείται κυρίως για λόγους backup (αντίγραφο ασφαλείας), recovery (επαναφορά από βλάβη) και αρχειοθέτηση δεδομένων Ακολουθιακή (σειριακή) προσπέλαση Πιο αργή από το δίσκο Δεν επιτρέπει την πρόσβαση σε ένα συγκεκριμένο σημείο της ταινίας Πολύ υψηλή χωρητικότητα Τυπικές τιμές (40 300 GB) 10

CPU vs. Disk Speed CPU: 100 à 500 à 1000 MIPS Χρόνος πρόσβασης (access time) στην κύρια μνήμη 10-6 à 10-9 sec Εγγραφή/Ανάγνωση από το δίσκο: 10 30 ms H CPU εκτελεί χονδρικά 10 6 εντολές στη μονάδα χρόνου πρόσβασης σε δίσκο Ο χρόνος πρόσβασης στο δίσκο μειώνεται με αργότερους ρυθμούς από ότι ο χρόνος πρόσβασης στη μνήμη! Το Disk I/O είναι το μείζον θέμα συμφόρησης ενός DBMS Πηγή: cs.ucla.edu 11

Βάσεις Δεδοµένων και Δευτερεύουσες Αποθηκευτικές Μονάδες Οι περισσότερες ΒΔ αποθηκεύονται σε δευτερεύουσες αποθηκευτικές μονάδες, διότι Είναι πολύ μεγάλες για να χωρέσουν στην κύρια μνήμη Σπάνια οδηγούν σε μόνιμη απώλεια αποθηκευμένων δεδομένων (συγκριτικά με την πρωτεύουσα αποθήκευση) Το κόστος αποθήκευσης είναι κατά μία τάξη μεγέθους μικρότερο για τους δίσκους από ότι για την πρωτεύουσα αποθήκευση 12

Δευτερεύουσες Μονάδες Αποθήκευσης Μαγνητίζοντας μια περιοχή του δίσκου, αναπαριστούμε τη δυαδική τιμή 0 ή 1 Δίσκοι απλής (sigle-sided) και διπλής (double-sided) όψης Κεφαλή (head) ανάγνωσης/γραφής Μηχανικός βραχίονας (mechaical arm) Χτένι (comb ή actuator) Άτρακτος (track): ένας κύκλος/τροχιά Κύλινδρος (cylider): άτρακτοι με την ίδια διάμετρο σε διαφορετικές επιφάνειες Μπλοκ (blocks) ή τομείς (sectors): τμήμα της ατράκτου απέναντι από σταθερή γωνία από το κέντρο του δίσκου (τυπικές τιμές 4ΚΒ ή 8ΚΒ) 13

Μέτρα Απόδοσης Δίσκων και Χρόνος Χρόνος εντοπισμού (seek time) Τυπικές τιμές: 3-15 msec Καθυστέρηση περιστροφής (rotatioal delay ή latecy) Τυπικές τιμές: 0-10 msec Κεφαλή Χρόνος μεταφοράς μπλοκ (block trasfer time) Δοθέντος ενός trasfer rate (t) Τυπικές τιμές 1..3 ΜΒ/sec Χρόνος μεταφοράς = (block size) / t Ζητούμενο μπλοκ 14

Χρόνος Προσπέλασης (Access Time) Ολικός χρόνος ή χρόνος προσπέλασης για τον εντοπισμό και τη μεταφορά ενός μπλοκ όταν δίνεται η διεύθυνσή του: Access Time = Seek time + Rotatioal delay + Block trasfer time Αυτά ισχύουν για radom block access Αν μπορούσα να διαβάσω το επόμενο μπλοκ; Χρόνος προσπέλασης ~ (block size) / t Radom I/O: ΑΚΡΙΒΟ! Seuetial I/O: ΦΘΗΝΟΤΕΡΟ! Π.χ. για μπλοκ 1KB, Radom I/O ~ 20msec, Seuetial I/O ~ 1 msec 15

Επιπτώσεις στην Απόδοση εξαιτίας της Δοµής του Δίσκου Ο χρόνος που απαιτείται για τις λειτουργίες της ΒΔ επηρεάζεται σημαντικά από τον τρόπο που τα δεδομένα είναι αποθηκευμένα στο δίσκο Πρέπει να προσέχουμε πώς τοποθετούμε εγγραφές πάνω στο δίσκο Π.χ. όταν δύο εγγραφές χρησιμοποιούνται μαζί, θα πρέπει να τις αποθηκεύσουμε κοντά στο δίσκο Δεν υπάρχει «πιο κοντά» από ότι στο ίδιο μπλοκ Γενικά, αφού διαβαστεί μια τροχιά, μια άλλη κεφαλή γίνεται ενεργή και μια άλλη τροχιά στον ίδιο κύλινδρο διαβάζεται ή γράφεται 16

Μορφοποιήσεις Σελίδων Πώς μια συλλογή εγγραφών μπορεί να τακτοποιηθεί σε μια σελίδα

Τοποθέτηση Αρχείων Εγγραφών στο Δίσκο Τύποι εγγραφών Τα δεδομένα αποθηκεύονται με τη μορφή εγγραφών (records) Κάθε εγγραφή είναι μια συλλογή από σχετιζόμενες τιμές (values) Οι εγγραφές συνήθως περιγράφουν οντότητες και τα γνωρίσματά τους Ένα αρχείο (file) είναι μια ακολουθία από εγγραφές Αρχείο εγγραφών σταθερού μήκους (fixed-legth) Αρχείο εγγραφών μεταβλητού μήκους (variable-legth) 18

Διαφορετικές Μορφές Αποθήκευσης Εγγραφών Εγγραφές σταθερού μήκους 1 31 40 44 48 68 Εργαζόμενος (71 bytes) Όνομα Αρ.Ταυτ. Μισθός Κωδ.Εργ. Τμήμα Ημ.Προσλ. Εγγραφές με πεδία μεταβλητού μήκους 1 12 21 25 29 Smith,Joh A12345 xxxx xxxx T1 Όνομα Αρ.Ταυτ. Μισθός Κωδ.Εργ. Τμήμα Εγγραφές μεταβλητών πεδίων με διαχωριστικούς χαρακτήρες Όνομα=Smith,Joh Αρ.Ταυτ.=A12345 Τμήμα=Τ1 19

Οργάνωση Εγγραφών Εκτεινόμενη οργάνωση (spaed) μπλοκ i εγγραφή 1 εγγραφή 2 εγγραφή 3 εγγραφή 4 Δ μπλοκ i+1 εγγραφή 4 (υπόλ) εγγραφή 5 εγγραφή 6 Δ Μη-Εκτεινόμενη οργάνωση (uspaed) μπλοκ i μπλοκ i+1 εγγραφή 1 εγγραφή 2 εγγραφή 3 εγγραφή 4 εγγραφή 5 εγγραφή 6 20

Οµαδοποίηση Εγγραφών Μέγεθος ενός μπλοκ: Β byte Για ένα αρχείο με εγγραφές σταθερού μήκους: R byte (B R) Μπορούμε να τοποθετήσουμε: bfr = floor(b/r) εγγραφές ανά μπλοκ Παράγοντας ομαδοποίησης (blockig factor) του αρχείου: bfr Αχρησιμοποίητος χώρος: B (bfr*r) byte Για αρχείο με εγγραφές μεταβλητού μήκους Κάθε μπλοκ μπορεί να αποθηκεύει διαφορετικό αριθμό εγγραφών Κατά μέσο όρο bfr εγγραφές ανά μπλοκ Απαιτούνται b = ceil(r/bfr) μπλοκ για ένα αρχείο r εγγραφών 21

Επικεφαλίδα Αρχείου Περιέχει πληροφορίες σχετικά με ένα αρχείο που είναι απαραίτητες στα προγράμματα που προσπελάζουν τις εγγραφές του αρχείου Διευθύνσεις των μπλοκ του αρχείου στο δίσκο Περιγραφές μορφοποίησης Μήκη πεδίων, διάταξη πεδίων σε μια εγγραφή (για σταθερού μεγέθους μη εκτεινόμενες εγγραφές) Κωδικούς τύπων πεδίων, χαρακτήρες διαχωρισμού, κωδικούς τύπου εγγραφών (για μεταβλητού μήκους εγγραφές) 22

Επιπτώσεις στην Απόδοση από τον Τύπο Οργάνωσης Εγγραφών Έστω αρχείο ΕΡΓΑΖΟΜΕΝΟΣ και μια συνθήκη επιλογής όπως (Αρ.Ταυτ= Α123456 ) ή (Τμήμα= Έρευνα ) Όταν πολλές εγγραφές ικανοποιούν τη συνθήκη επιλογής Εντοπίζεται η πρώτη εγγραφή (τρέχουσα εγγραφή curret record) Για να εντοπιστούν οι υπόλοιπες, απαιτούνται επιπλέον πράξεις ανάκτησης Οι επόμενες πράξεις ανάκτησης αρχίζουν από την τρέχουσα εγγραφή και εντοπίζουν την επόμενη εγγραφή Άρα παίζει ρόλο η φυσική διάταξη των εγγραφών! Οργάνωση της ΕΡΓΑΖΟΜΕΝΟΣ κατά Αρ.Ταυτ. ή Τμήμα; 23

Τύποι Οργάνωσης Αρχείων Εγγραφών Πώς μια συλλογή από σελίδες μπορεί να οργανωθεί ως ένα αρχείο

Τύποι Οργάνωσης Αρχείων Εγγραφών Αρχεία μη διατεταγμένων εγγραφών (αρχεία σωρού) heap ή pile file Αρχεία διατεταγμένων εγγραφών (ταξινομημένα αρχεία) ordered ή seuetial file Βασισμένη στον κατακερματισμό hashig 25

Αρχεία µη Διατεταγµένων Εγγραφών (Αρχεία Σωρού) (1/2) Αποτελεί τον απλούστερο τρόπο οργάνωσης Οι εγγραφές τοποθετούνται στο αρχείο με τη σειρά που εισάγονται Εισαγωγή εγγραφής: αποτελεσματική Το τελευταίο μπλοκ του αρχείου αντιγράφεται στη μνήμη, προστίθεται η εγγραφή και το μπλοκ γράφεται στο δίσκο Αναζήτηση εγγραφής: γραμμική αναζήτηση! Για ένα αρχείο με b μπλοκ, κατά μέσο όρο (b/2) μπλοκ θα ανακτηθούν Διαγραφή εγγραφής: δημιουργεί πρόσθετο αχρησιμοποίητο χώρο Εύρεση εγγραφής, αντιγραφή του μπλοκ στη μνήμη, διαγραφή της εγγραφής και το μπλοκ γράφεται στο δίσκο Άλλη τεχνική: σημάδι διαγραφής (deletio marker) Γενικά απαιτείται περιοδικά αναδιοργάνωση (reorgaizatio) 26

Αρχεία µη Διατεταγµένων Εγγραφών (Αρχεία Σωρού) (2/2) Μπορούν να χρησιμοποιηθούν Είτε εκτεινόμενη είτε μη εκτεινόμενη οργάνωση Εγγραφές είτε σταθερού είτε μεταβλητού μήκους Για να διαβαστούν όλες οι εγγραφές σε διάταξη ως προς την τιμή ενός πεδίου Δημιουργείται ένα ταξινομημένο αντίγραφο του αρχείου Χρήση (εξωτερικής) ταξινόμησης με συγχώνευση Για ένα αρχείο μη ταξινομημένων εγγραφών σταθερού μήκους που χρησιμοποιεί μη εκτεινόμενα μπλοκ και συνεχόμενη τοποθέτηση Έστω 0, 1,..., r-1 οι εγγραφές του αρχείου Έστω 0, 1,..., bfr-1 οι εγγραφές ενός μπλοκ Τότε η i-οστή εγγραφή βρίσκεται στο μπλοκ: floor(i/bfr) και είναι η (i mod bfr) εγγραφή στο μπλοκ Άρα οι εγγραφές μπορούν να προσπελαστούν με βάση τη σχετική τους θέση (χρήσιμο για τη δημιουργία ευρετηρίων) 27

Αρχεία Διατεταγµένων Εγγραφών (Ταξινοµηµένα Αρχεία) (1/2) Οι εγγραφές έχουν μια φυσική διάταξη στο δίσκο με βάση κάποιο πεδίο διάταξης (orderig field) Αν το πεδίο διάταξης είναι επίσης πεδίο-κλειδί, τότε λέγεται κλειδί διάταξης (orderig key) Πλεονεκτήματα διατεταγμένων αρχείων Ανάγνωση εγγραφών: εξαιρετικά αποτελεσματική Η εύρεση της επόμενης εγγραφής συνήθως δεν απαιτεί επιπλέον προσπελάσεις μπλοκ Συνθήκες αναζήτησης με βάση την τιμή του κλειδιού διάταξης οδηγούν σε γρηγορότερη προσπέλαση όταν χρησιμοποιείται δυαδική αναζήτηση Για ένα αρχείο με b μπλοκ, μια δυαδική αναζήτηση προσπελάζει συνήθως log 2 (b) μπλοκ 28

Αρχεία Διατεταγµένων Εγγραφών (Ταξινοµηµένα Αρχεία) (2/2) Αναζήτηση που δε βασίζεται στο πεδίο διάταξης, δεν έχει κανένα πλεονέκτημα Εισαγωγή και διαγραφή Ακριβές πράξεις Ειδικά η εισαγωγή απαιτεί μετακίνηση των μισών εγγραφών (κατά μέσο όρο) Πιο αποδοτική εισαγωγή Διατήρηση αχρησιμοποίητου χώρου σε κάθε μπλοκ Αρχείο υπερχείλισης Αυξάνεται η πολυπλοκότητα της αναζήτησης Μπλοκ 1 Μπλοκ 2 Μπλοκ Όνομα Aa Ab Ag Ai Bo Bu Za Zi Zu 29

Τεχνικές Κατακερµατισµού Κατακερματισμένο ή άμεσο αρχείο (hash ή direct file) Πολύ γρήγορη προσπέλαση σε εγγραφές για ορισμένες συνθήκες αναζήτησης Συνθήκη ισότητας σε ένα και μόνο πεδίο κατακερματισμού (hash field) του αρχείου Συνάρτηση κατακερματισμού (hash fuctio) εφαρμόζεται στην τιμή του πεδίου κατακερματισμού μιας εγγραφής και επιστρέφει τη διεύθυνση του μπλοκ Για τις περισσότερες εγγραφές χρειάζεται προσπέλαση ενός μόνο μπλοκ 30

Περίληψη Φυσικής Οργάνωσης Αρχείων Δευτερεύουσες μονάδες αποθήκευσης Το Disk I/O είναι το κύριο κόστος στην επεξεργασία που κάνει ένα DBMS Προσπαθούμε να αποφεύγουμε τα Ι/Ο Ειδικά τις τυχαίες προσπελάσεις στο δίσκο (radom I/O) Τοποθέτηση εγγραφών στο δίσκο Τύποι Οργάνωσης Εγγραφών Αρχείων Αρχεία σωρού Ταξινομημένα αρχεία Τεχνικές κατακερματισμού 31

Ευρετήρια

Δοµές Ευρετηρίων για Αρχεία Δομές προσπέλασης (idex structures) που ονομάζονται ευρετήρια Χρησιμοποιούνται για την επιτάχυνση της ανάκτησης εγγραφών με βάση κάποιες συνθήκες αναζήτησης Ευρετήρια ενός επιπέδου Πρωτεύοντα ευρετήρια Συγκροτημένα ευρετήρια Δευτερεύοντα ευρετήρια Ευρετήρια πολλαπλών επιπέδων 33

Διατεταγµένα Ευρετήρια Ενός Επιπέδου Αναλογίες με ευρετήρια βιβλίων Σημαντικοί όροι δίνονται αλφαβητικά μαζί με τις σελίδες του βιβλίου όπου εμφανίζονται Μια δομή προσπέλασης ευρετηρίου συνήθως ορίζεται επί ενός και μόνο πεδίου του αρχείου, που ονομάζεται πεδίο ευρετηριοποίησης (idexig field) Το ευρετήριο αποθηκεύει κάθε τιμή του πεδίου ευρετηριοποίησης μαζί με μια λίστα από δείκτες στα μπλοκ του δίσκου που περιέχουν εγγραφές με αυτή την τιμή στο αντίστοιχο πεδίο Οι τιμές του ευρετηρίου είναι διατεταγμένες Επιτρέπει δυαδική αναζήτηση 34

Τύποι Διατεταγµένων Ευρετηρίων Πρωτεύον ευρετήριο (primary idex) Ορίζεται επί του πεδίου κλειδιού διάταξης ενός διατεταγμένου αρχείου Το πεδίο κλειδιού διάταξης χρησιμοποιείται για τη φυσική διάταξη των εγγραφών στο δίσκο Κάθε εγγραφή έχει διαφορετική τιμή στο πεδίο αυτό Συγκροτημένο ευρετήριο (clustered idex) Όταν το πεδίο διάταξης δεν είναι πεδίο κλειδί Διαφορετικές εγγραφές μπορεί να έχουν την ίδια τιμή για το πεδίο διάταξης Επειδή ένα αρχείο μπορεί να έχει το πολύ ένα πεδίο φυσικής διάταξης, μπορεί να έχει ένα μόνο πρωτεύον ευρετήριο ή συγκροτημένο ευρετήριο Δευτερεύον ευρετήριο (secodary idex) Μπορεί να οριστεί σε κάθε πεδίο ενός αρχείου που δεν είναι πεδίο διάταξης Εκτός από την πρωτεύουσα μέθοδο προσπέλασης, ένα αρχείο μπορεί να έχει αρκετά δευτερεύοντα ευρετήρια 35

Πρωτεύοντα Ευρετήρια Ένα πρωτεύον ευρετήριο είναι ένα διατεταγμένο αρχείο του οποίου οι εγγραφές έχουν σταθερό μήκος και δύο πεδία 1 ο πεδίο: ίδιου τύπου δεδομένων με το κλειδί διάταξης 2 ο πεδίο: δείκτης προς ένα μπλοκ δίσκου Το πεδίο κλειδιού διάταξης λέγεται πρωτεύον κλειδί (primary key) του αρχείου δεδομένων Για κάθε μπλοκ του αρχείου, υπάρχει μια καταχώρηση ή εγγραφή ευρετηρίου (idex etry ή idex record) Κάθε καταχώρηση του ευρετηρίου έχει την τιμή του πεδίου πρωτεύοντος κλειδιού της πρώτης εγγραφής ενός μπλοκ, και ένα δείκτη προς το μπλοκ αυτό Η i καταχώρηση του ευρετηρίου αναπαρίσταται ως: <K(i),P(i)> 36

Παράδειγµα Πρωτεύοντος Ευρετηρίου Όνομα Κάθε καταχώρηση του ευρετηρίου περιέχει μια τιμή του πεδίου ΟΝΟΜΑ και ένα δείκτη <Κ(1)=Aa,P(1)=διευθ.του μπλοκ 1> Μπλοκ 1 Aa Ab Ag <Κ(2)=Ab,P(2)=διευθ.του μπλοκ 2> Μπλοκ 2 Ai Τιμή Κλειδιού Δείκτης Bo Aa Bu Ai... Μπλοκ Za Za Zi Zu 37

Ιδιότητες Πρωτεύοντος Ευρετηρίου Ο ολικός αριθμός καταχωρήσεων στο ευρετήριο είναι ο ίδιος με τον αριθμό των μπλοκ δίσκου του διατεταγμένου αρχείου Η πρώτη εγγραφή του κάθε μπλοκ λέγεται εγγραφή-άγκυρα (achor record) ή απλά άγκυρα του μπλοκ (block achor) Γενικά το αρχείο ευρετηρίου απαιτεί πολύ λιγότερα μπλοκ από ότι το αρχείο δεδομένων, διότι Οι καταχωρήσεις στο ευρετήριο είναι λιγότερες από τις εγγραφές του αρχείου Κάθε καταχώρηση του ευρετηρίου είναι μικρότερη από μια εγγραφή δεδομένων, άρα σε ένα μπλοκ χωρούν περισσότερες καταχωρήσεις ευρετηρίου από εγγραφές δεδομένων Συνεπώς μια δυαδική αναζήτηση στο ευρετήριο απαιτεί λιγότερες προσπελάσεις μπλοκ από μια δυαδική αναζήτηση στο αρχείο δεδομένων 38

Παράδειγµα 1 Διατεταγμένο αρχείο με r=30.000 εγγραφές Αποθηκευμένες σε δίσκο με μέγεθος μπλοκ B=1.024 byte Εγγραφές σταθερού μήκους και μη εκτεινόμενες, με μήκος εγγραφής R=100 byte Παράγοντας σελιδοποίησης του αρχείου bfr = floor(b/r) = floor(1.024/100) = 10 εγγραφές ανά μπλοκ Το αρχείο απαιτεί b = ceil(r/bfr) = ceil(30.000/10) = 3.000 μπλοκ Μια δυαδική αναζήτηση στο αρχείο δεδομένων θα απαιτούσε περίπου: ceil(log 2 b) = ceil(log 2 3.000) = 12 προσπελάσεις μπλοκ Έστω κλειδί μήκους V=9byte και δείκτης P=6byte Το μέγεθος κάθε καταχώρησης του πρωτεύοντος ευρετηρίου είναι R i =(9+6)=15byte Ο παράγοντας ομαδοποίησης του ευρετηρίου είναι bfr i = floor(b/ R i ) = floor(1.024/15) = 68 καταχωρήσεις ανά μπλοκ Συνολικά 3.000 καταχωρήσεις ευρετηρίου (r i ) (γιατί;) Για το ευρετήριο απαιτούνται b i = ceil(r i /bfr i ) = ceil(3.000/68) = 45 μπλοκ Μια δυαδική αναζήτηση στο ευρετήριο απαιτεί ceil(log 2 b i ) = ceil(log 2 45) = 6 προσπελάσεις μπλοκ Για την αναζήτηση μιας εγγραφής χρειαζόμαστε (6+1)=7 προσπελάσεις μπλοκ 39

Πυκνά vs. Μη Πυκνά Ευρετήρια Ένα πρωτεύον ευρετήριο αποτελεί παράδειγμα ενός μη πυκνού ευρετηρίου (odese idex) Διότι περιλαμβάνει μια καταχώρηση για κάθε μπλοκ του δίσκου Όχι για κάθε εγγραφή του αρχείου Ένα πυκνό ευρετήριο (dese idex) περιέχει μια καταχώρηση για κάθε εγγραφή του αρχείου 40

Εισαγωγή και Διαγραφή Εγγραφών σε Πρωτεύον Ευρετήριο Γενικά για κάθε διατεταγμένο ευρετήριο δημιουργούν προβλήματα Όταν υπάρχει πρωτεύον ευρετήριο, το πρόβλημα επιτείνεται, διότι απαιτείται ενημέρωση και του αρχείου ευρετηρίου Πιθανές λύσεις Χρήση διατεταγμένου αρχείου υπερχείλισης Χρήση συνδεδεμένης λίστας εγγραφών υπερχείλισης για κάθε μπλοκ Ως προς τη διαγραφή Χρήση σημαδιών διαγραφής 41

Συγκροτηµένα Ευρετήρια Όταν οι εγγραφές ενός αρχείου είναι φυσικά διατεταγμένες προς ένα πεδίο που δεν είναι κλειδί και δεν έχει διαφορετική τιμή για κάθε εγγραφή Το πεδίο λέγεται πεδίο συγκρότησης (clusterig field) Το ευρετήριο λέγεται συγκροτημένο ευρετήριο (clusterig idex) Υπάρχει μια καταχώρηση στο συγκροτημένο ευρετήριο για κάθε διακεκριμένη τιμή του πεδίου συγκρότησης Η καταχώρηση περιέχει την τιμή και ένα δείκτη προς το πρώτο μπλοκ με εγγραφή την τιμή αυτή στο πεδίο συγκρότησης Η εισαγωγή και η διαγραφή εξακολουθούν να δημιουργούν προβλήματα Κρατείται ένα ολόκληρο μπλοκ για την τιμή κάθε συστάδας Χρήση επιπλέον μπλοκ που είναι συνδεδεμένα μεταξύ τους Το συγκροτημένο ευρετήριο είναι μη πυκνό ευρετήριο 42

Παράδειγµα Συγκροτηµένου Ευρετηρίου Τμήμα Μπλοκ 1 1 1 1 2 Μπλοκ 2 2 Τιμή Πεδίου Συγκρότησης 1 2 3 Δείκτης Μπλοκ 3 3 3 3 4 3 4 4 43

Δευτερεύοντα Ευρετήρια Ένα δευτερεύον ευρετήριο είναι ένα διατεταγμένο αρχείο του οποίου οι εγγραφές έχουν δύο πεδία 1 ο πεδίο: ίδιου τύπου δεδομένων με κάποιο πεδίο του αρχείου δεδομένων που δεν είναι πεδίο διάταξης, και ονομάζεται πεδίο ευρετηριοποίησης (idexig field) 2 ο πεδίο: δείκτης προς ένα μπλοκ δίσκου ή δείκτης προς εγγραφή Μπορούν να υπάρχουν πολλά δευτερεύοντα ευρετήρια και συνεπώς πεδία ευρετηριοποίησης για το ίδιο αρχείο 44

Δευτερεύον Ευρετήριο σε Πεδίο Κλειδί Ένα τέτοιο πεδίο λέγεται μερικές φορές δευτερεύον κλειδί (secodary key) Μία καταχώρηση ευρετηρίου για κάθε εγγραφή του αρχείου, που περιέχει την τιμή του δευτερεύοντος κλειδιού και ένα δείκτη προς το μπλοκ που έχει αποθηκευτεί η εγγραφή ή προς την ίδια την εγγραφή Ένα δευτερεύον ευρετήριο ως προς πεδίο κλειδί είναι πυκνό ευρετήριο 45

Παράδειγµα Δευτερεύοντος Ευρετηρίου ως προς Μη Διατεταγµένο Πεδίο Κλειδιού 0 1 2 3 4 5 6 7 8 9 11 12 Πεδίο Ευρετηριοποίησης 9 5 7 1 0 6 8 4 2 3 12 11 Μπλοκ 1 Μπλοκ 2 Μπλοκ 46

Ιδιότητες Δευτερεύοντος Ευρετηρίου Χρειάζεται συνήθως περισσότερο χώρο αποθήκευσης και χρόνο αναζήτησης από ένα πρωτεύον ευρετήριο Λόγω του μεγαλύτερου αριθμού καταχωρήσεών του Όμως η βελτίωση του χρόνου αναζήτησης σε σχέση με το πρωτεύον ευρετήριο είναι πολύ μεγαλύτερη Όταν δεν υπάρχει δευτερεύον ευρετήριο, αναγκαστικά χρειάζεται γραμμική αναζήτηση Ενώ όταν δεν υπάρχει πρωτεύον ευρετήριο, μπορεί να γίνει δυαδική αναζήτηση στο αρχείο 47

Παράδειγµα 2 Διατεταγμένο αρχείο με r=30.000 εγγραφές Αποθηκευμένες σε δίσκο με μέγεθος μπλοκ B=1.024 byte Εγγραφές σταθερού μήκους και μη εκτεινόμενες, με μήκος εγγραφής R=100 byte Μια γραμμική αναζήτηση στο αρχείο απαιτεί b/2 = 3.000/2 = 1.500 προσπελάσεις μπλοκ Έστω δευτερεύον ευρετήριο ως προς πεδίο κλειδί μήκους V=9byte και δείκτης P=6byte Το μέγεθος κάθε καταχώρησης του πρωτεύοντος ευρετηρίου είναι R i =(9+6)=15byte Ο παράγοντας ομαδοποίησης του ευρετηρίου είναι bfr i = floor(b/ R i ) = floor(1.024/15) = 68 καταχωρήσεις ανά μπλοκ Συνολικά 30.000 καταχωρήσεις ευρετηρίου (r i ) (γιατί;) Για το ευρετήριο απαιτούνται b i = ceil(r i /bfr i ) = ceil(30.000/68) = 442 μπλοκ Μια δυαδική αναζήτηση στο ευρετήριο απαιτεί ceil(log 2 b i ) = ceil(log 2 442) = 9 προσπελάσεις μπλοκ Για την αναζήτηση μιας εγγραφής χρειαζόμαστε (9+1)=10 προσπελάσεις μπλοκ 48

Δευτερεύον Ευρετήριο σε Πεδίο που δεν Είναι Κλειδί Επιλογές για την υλοποίηση ενός τέτοιου ευρετηρίου Να συμπεριλάβουμε πολλές καταχωρήσεις στο ευρετήριο με την ίδια τιμή K(i) (πυκνό ευρετήριο) Να έχουμε μεταβλητού μήκους εγγραφές στο ευρετήριο, διατηρώντας μια λίστα από δείκτες <P(i,1),,P(i,k)> για το Κ(i) (Χρησιμοποιείται συχνότερα) Να έχουμε μία μόνο καταχώρηση για κάθε τιμή ευρετηριοποίησης, αλλά να χρησιμοποιείται ένα ενδιάμεσο επίπεδο για τη διαχείριση των πολλαπλών δεικτών 49

Ευρετήρια Πολλαπλών Επιπέδων Αποφεύγουν τη δυαδική αναζήτηση των ευρετηρίων ενός επιπέδου Με τίμημα τη δημιουργία ευρετηρίων επί του ίδιου ευρετηρίου 50

Περίληψη Δοµών Ευρετηρίων Συζητήσαμε για Δομές προσπέλασης που ονομάζονται ευρετήρια Χρησιμοποιούνται για την επιτάχυνση της ανάκτησης εγγραφών με βάση κάποιες συνθήκες αναζήτησης Ευρετήρια ενός επιπέδου Πρωτεύοντα ευρετήρια Συγκροτημένα ευρετήρια Δευτερεύοντα ευρετήρια Ευρετήρια πολλαπλών επιπέδων 51