Προηγμένη Ευρετηρίαση Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Σχετικά έγγραφα
Advanced Data Indexing

Advanced Data Indexing

Advanced Data Indexing

Ο ΑΤΔ Λεξικό. Σύνολο στοιχείων με βασικές πράξεις: Δημιουργία Εισαγωγή Διαγραφή Μέλος. Υλοποιήσεις

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΑΣΚΗΣΗ ΔΕΥΤΕΡΗ

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

Δομές Δεδομένων και Αλγόριθμοι

Advanced Data Indexing

Advanced Data Indexing

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Κατακερματισμός. 4/3/2009 Μ.Χατζόπουλος 1

ΛΥΣΗ ΤΗΣ ΔΕΥΤΕΡΗΣ ΑΣΚΗΣΗΣ Όλγα Γκουντούνα

Δομές Δεδομένων. Ενότητα 11: Τεχνικές Κατακερματισμού. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής.

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση

Διδάσκων: Κωνσταντίνος Κώστα

Κατακερματισμός (Hashing)

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Cuckoo Hashing. Αλγόριθμοι και Πολυπλοκότητα. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Τα δεδομένα (περιεχόμενο) μιας βάσης δεδομένων αποθηκεύεται στο δίσκο

ΗΥ240: οµές εδοµένων Χειµερινό Εξάµηνο Ακαδηµαϊκό Έτος Παναγιώτα Φατούρου. Προγραµµατιστική Εργασία 3 ο Μέρος

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Δομές Δεδομένων. Ιωάννης Γ. Τόλλης Τμήμα Επιστήμης Υπολογιστών Πανεπιστήμιο Κρήτης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Διάλεξη 22: Τεχνικές Κατακερματισμού I (Hashing)

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Κατακερματισμός. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΛΥΣΗ ΣΤΗΝ ΕΥΤΕΡΗ ΑΣΚΗΣΗ

Ενότητα 6: Κατακερματισμός Ασκήσεις και Λύσεις

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΓΩΝΙΣΜΑ ΠΕΡΙΟΔΟΥ : ΜΑΪΟΥ

Πίνακες Συμβόλων. εισαγωγή αναζήτηση επιλογή. εισαγωγή. αναζήτηση

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο Κάθε δομή μπορεί να χρησιμοποιηθεί σε οποιοδήποτε πρόβλημα ή εφαρμογή

Φροντιστήριο Αποθήκευση σε δίσκο, βασικές οργανώσεις αρχείων κατακερματισμός και δομές ευρετηρίων για αρχεία

Κεφάλαιο 13. Αποθήκευση σε ίσκους, Βασικές οµέςαρχείων, και Κατακερµατισµός. ιαφάνεια 13-1

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6: Δομές ευρετηρίων για αρχεία

Δυναμικός Κατακερματισμός

Διάλεξη 18: Τεχνικές Κατακερματισμού I (Hashing)

Δυναμικά Σύνολα. Δυναμικό σύνολο. Tα στοιχεία του μεταβάλλονται μέσω εντολών εισαγωγής και διαγραφής. διαγραφή. εισαγωγή

10. Πίνακες Κατακερματισμού

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δομές Αναζήτησης. εισαγωγή αναζήτηση επιλογή. εισαγωγή. αναζήτηση

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Τελικό επαναληπτικό διαγώνισμα Επιμέλεια: Δρεμούσης Παντελής

Δυναμικά Σύνολα. Δυναμικό σύνολο. Tα στοιχεία του μεταβάλλονται μέσω εντολών εισαγωγής και διαγραφής. διαγραφή. εισαγωγή

Ενδεικτικές Ερωτήσεις Θεωρίας

Πανεπιστήµιο Κρήτης Τµήµα Επιστήµης Υπολογιστών. ΗΥ-460 Συστήµατα ιαχείρισης Βάσεων εδοµένων ηµήτρης Πλεξουσάκης Βασίλης Χριστοφίδης

Άσκηση 1 (15 μονάδες) (Επεκτατός Κατακερματισμός)

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εκτενείς Δομές Δεδομένων

BΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΕΞΕΤΑΣΗ ΦΕΒΡΟΥΑΡΙΟΥ 2005

Στην ενότητα αυτή θα µελετηθούν τα εξής επιµέρους θέµατα:

Δομές Δεδομένων. Κατακερματισμός. Δομές Δεδομένων & Αλγόριθμοι. Εργαστήριο Γνώσης και Ευφυούς Πληροφορικής 1

Επεξεργασία Ερωτήσεων

Διάλεξη 14: Δέντρα IV B Δένδρα. Διδάσκων: Παναγιώτης Ανδρέου

Η ιεραρχία της μνήμης

Βάσεις Δεδομένων. Αποθήκευση σε δίσκο, βασικές οργανώσεις αρχείων, κατακερματισμός και δομές ευρετηρίων για αρχεία. Φροντιστήριο 7 o

Πληροφορική 2. Δομές δεδομένων και αρχείων

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Δομές Δεδομένων. Ενότητα 13: B-Δέντρα/AVL-Δέντρα. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Δομές Δεδομένων

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Μπαλτάς Αλέξανδρος 21 Απριλίου 2015

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

Δένδρα Αναζήτησης Πολλαπλής Διακλάδωσης

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Κεφάλαιο 5. ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ -. Σερπάνος 2. Σημείωση

Πίνακες (Μια παλιά άσκηση) Πίνακες Κατακερματισμού (Hash Tables) Πίνακες (Μια παλιά άσκηση) Εισαγωγή. A n

Τα δεδοµένα συνήθως αποθηκεύονται σε αρχεία στο δίσκο Για να επεξεργαστούµε τα δεδοµένα θα πρέπει αυτά να βρίσκονται στη

Άσκηση 3 (ανακοινώθηκε στις 24 Απριλίου 2017, προθεσμία παράδοσης: 2 Ιουνίου 2017, 12 τα μεσάνυχτα).

Άσκηση 1. με κόκκινο χρώμα σημειώνονται οι κρίσιμοι κόμβοι

ΗΥ240: Δομές Δεδομένων Εαρινό Εξάμηνο Ακαδημαϊκό Έτος 2017 Διδάσκουσα: Παναγιώτα Φατούρου Προγραμματιστική Εργασία - 2o Μέρος

Σου προτείνω να τυπώσεις τις επόμενες τέσσερις σελίδες σε ένα φύλο διπλής όψης και να τις έχεις μαζί σου για εύκολη αναφορά.

ΗΥ460 Συστήµατα Διαχείρισης Βάσεων Δεδοµένων Χειµερινό Εξάµηνο 2016 Διδάσκοντες: Βασίλης Χριστοφίδης

ΕΝΟΤΗΤΑ 8 KATAKEΡΜΑΤΙΣΜΟΣ (HASHING)

Οργάνωση Αρχείων. Βάσεις Δεδομένων : Οργάνωση Αρχείων 1. Blobs

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

ΛΕΙΤΟΥΡΓΙΚΑ ΣΥΣΤΗΜΑΤΑ. Συστήματα Αρχείων. Διδάσκoντες: Καθ. Κ. Λαμπρινουδάκης Δρ. Α. Γαλάνη

Κεφάλαιο 14. Δομές Ευρετηρίων για Αρχεία. Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση,

Εισαγωγή στην Επιστήμη των Υπολογιστών

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Οι πράξεις της συνένωσης. Μ.Χατζόπουλος 1

Μάθημα 8: Διαχείριση Μνήμης

Red-black δέντρα (Κεφ. 5)

Κεφάλαιο 5 Ανάλυση Αλγορίθμων

Δομή Ηλεκτρονικού υπολογιστή

Διαδικασιακός Προγραμματισμός

έντρα Πολλαπλής ιακλάδωσης και (a, b)- έντρα

Κεφάλαιο 14. οµές Ευρετηρίων για Αρχεία. ιαφάνεια 14-1

ΗΥ240: Δομές Δεδομένων Εαρινό Εξάμηνο Ακαδημαϊκό Έτος Προγραμματιστική Εργασία - 2o Μέρος

Συναρτήσεις Κατακερματισμού και Πίνακες Κατακερματισμού

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

Μάριος Αγγελίδης

Οργάνωση Υπολογιστών

HY240 : Δομές Δεδομένων. Φροντιστήριο Προγραμματιστικής Εργασίας 2 ο και 3 ο Μέρος

Transcript:

Προηγμένη Ευρετηρίαση Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας 1. Πως δομούνται οι ιεραρχικές μνήμες; Αναφέρετε τα διάφορα επίπεδά τους από τον επεξεργαστή μέχρι τη δευτερεύουσα μνήμη και τα βασικά τους χαρακτηριστικά, κάνοντας και ένα αντίστοιχο ενδεικτικό σχήμα. 2. Ποια είναι η αρχή της τοπικότητας; Τι λέγεται χρονική και τι χωρική τοπικότητα; Αναφέρετε ένα παράδειγμα σε κάθε περίπτωση. 3. Τι λέγεται cache επιτυχία και τι cache αποτυχία; Ποιες είναι οι βασικές πολιτικές τοποθέτησης σε μία cache; Ποιες είναι οι βασικές πολιτικές αντικατάστασης σε μία cache; 4. Ποια είναι η βασική δομή ενός δίσκου με κινητά μέρη; Για τον υπολογισμό του χρόνου προσπέλασης απαιτείται ο χρόνος αναζήτησης, η καθυστέρηση περιστροφής και η ταχύτητα μεταφοράς. Τι μετράει ο καθένας από τους χρόνους αυτούς; Τι λέγεται λογικό μπλοκ; 5. Ποια είναι η δομή του απλού μοντέλου δευτερεύουσας μνήμης; Ποιες είναι οι παράμετροί του; Ποιοι είναι οι βασικοί περιορισμοί του; Σχεδιάστε ένα αντίστοιχο ενδεικτικό διάγραμμα του μοντέλου. 6. Ποια είναι η δομή του μοντέλου των παράλληλων δίσκων (PDM); Ποιες είναι οι παράμετροί του; Ποιοι είναι οι βασικοί περιορισμοί του; Σχεδιάστε ένα αντίστοιχο ενδεικτικό διάγραμμα του μοντέλου. 7. Τι ονομάζεται λωριδοποίηση δίσκων; Δώστε ένα παράδειγμα. Ποιο είναι το Ι/Ο κόστος για την ανάγνωση ή την εγγραφή Ν δεδομένων σε D δίσκους με λωριδοποίηση και χωρίς; 8. Ποιο είναι το Ι/Ο κόστος των στοιχειωδών διαδικασιών (scan, sort, search, output) στο PDM όταν έχουμε έναν δίσκο (D=1) και όταν έχουμε περισσότερους (D>1); 9. Γιατί το Ι/Ο κόστος της ταξινόμησης δεν είναι βέλτιστο όταν εφαρμόζουμε λωριδοποίηση δίσκων; Αναφέρετε ένα αριθμητικό παράδειγμα στο οποίο φαίνεται αυτό. 10. Περιγράψτε τον αλγόριθμο της ταξινόμησης διαχωρισμού (distribution sort) και δώστε ένα μικρό παράδειγμα με ένα στοιχείο διαχωρισμού. Ποιο είναι το Ι/Ο κόστος για την ταξινόμηση Ν στοιχείων με τον αλγόριθμο αυτό χρησιμοποιώντας S στοιχεία διαχωρισμού; Πως εκλέγονται τα στοιχεία διαχωρισμού με την μέθοδο της τυχαίας δειγματοληψίας; 11. Περιγράψτε τον αλγόριθμο συγχώνευσης (merge sort) 2 δρόμων και δώστε ένα μικρό παράδειγμα. Ποιο είναι το Ι/Ο κόστος για την ταξινόμηση Ν στοιχείων με τον αλγόριθμο αυτό χρησιμοποιώντας 2 δρόμους; Ποιο είναι το Ι/Ο κόστος όταν γίνεται συγχώνευση με R>2 δρόμους; 12. Περιγράψτε την τεχνική double buffering. Δώστε και ένα ενδεικτικό διάγραμμα. 13. Ποια είναι η δομή ενός ισοζυγισμένου δυαδικού δέντρου αναζήτησης; Πόσο μεγάλο μπορεί να είναι το ύψος του εάν εισαχθούν σε αυτό Ν στοιχεία (πόσα το πολύ επίπεδα έχει); Ποιο είναι το Ι/Ο κόστος στο δέντρο αυτό για ένα απλό ερώτημα αναζήτησης στοιχείου και ποιο για ένα ερώτημα περιοχής; 14. Σε ένα δέντρο αναζήτησης εξωτερικής μνήμης πως εκμεταλλευόμαστε την τοπικότητα; Πως αποθηκεύεται στον δίσκο ένα τέτοιο δέντρο; Ποιο είναι το μέγιστο ύψος του δέντρου ως προς μπλοκ; Ποιο είναι το Ι/Ο κόστος για ένα απλό ερώτημα αναζήτησης στοιχείου και ποιο για ένα ερώτημα περιοχής; Κατά τη διάρκεια ενημερώσεων στο δέντρο μπορεί να διατηρηθεί η τοπικότητα κάνοντας επαναζυγίσεις με περιστροφές; 15. Τι λέγεται (a,b)-δέντρο; Ποιοι είναι οι περιορισμοί των παραμέτρων του; Δώστε ένα μικρό παράδειγμα ενός (2,4)-Δέντρου. Αν εισαχθούν σε αυτό Ν στοιχεία τι χώρο χρησιμοποιεί για να αποθηκευτεί; Ποιο είναι το μέγιστο ύψος του; Ποιο είναι το Ι/Ο κόστος για ένα απλό ερώτημα

αναζήτησης στοιχείου και ποιο για ένα ερώτημα περιοχής; Αν a,b=θ(β) ποιο είναι το ύψος ως προς μπλοκ και ποιο το Ι/Ο κόστος για ερώτημα απλής αναζήτησης και για ερώτημα περιοχής; 16. Περιγράψτε τον αλγόριθμο της ένθεσης (insert) ενός στοιχείου στο (a,b)-δέντρο. Ποιο είναι το αντίστοιχο Ι/Ο κόστος που απαιτείται; 17. Περιγράψτε τον αλγόριθμο της διαγραφής (delete) ενός στοιχείου στο (a,b)-δέντρο. Ποιο είναι το αντίστοιχο Ι/Ο κόστος που απαιτείται; 18. Τι λέγεται Β-Δέντρο; Τι λέγεται Β + -Δέντρο; Τι λέγεται B-Δέντρο με παράμετρο διακλάδωσης (branching factor) b και παράμετρο φύλλων k; Ποιο είναι το Ι/Ο κόστος για ερώτημα αναζήτησης στοιχείου και ποιο για ένα ερώτημα περιοχής σε Β-Δέντρα; Περιγράψτε πως γίνεται η εισαγωγή Ν στοιχείων σε ένα Β-Δέντρο με την μέθοδο Insertion-Load και πως με την μέθοδο Bulk-Load. Ποιο είναι το αντίστοιχο Ι/Ο κόστος για την κάθε μία από τις μεθόδους αυτές; 19. Τι λέγεται Βαροζυγισμένο B-Δέντρο με παράμετρο διακλάδωσης b και παράμετρο φύλλων k; Ποιοι είναι οι περιορισμοί του; Πως υπολογίζεται το βάρος κάθε κόμβου; Ποιοι περιορισμοί επάγονται για τον βαθμό κάθε κόμβου; Ποιο είναι το μέγιστο ύψος του; Ποιο είναι το Ι/Ο κόστος για ερώτημα αναζήτησης στοιχείου και ποιο για ερώτημα περιοχής σε Βαροζυγισμένα Β-Δέντρα αν k=ω(β); 20. Περιγράψτε τον αλγόριθμο της ένθεσης (insert) ενός στοιχείου στο Βαροζυγισμένο B-Δέντρο με παράμετρο διακλάδωσης b και παράμετρο φύλλων k. Ποιο είναι το αντίστοιχο Ι/Ο κόστος που απαιτείται; Πόσες επαναζυγιστικές πράξεις απαιτούνται μετά από μία ένθεση; Πόσο συχνά συμμετέχει ένας κόμβος σε επαναζυγιστικές πράξεις; 21. Περιγράψτε τον αλγόριθμο της διαγραφής (delete) ενός στοιχείου στο Βαροζυγισμένο B- Δέντρο με παράμετρο διακλάδωσης b και παράμετρο φύλλων k. Ποιο είναι το αντίστοιχο Ι/Ο κόστος που απαιτείται; Πόσες επαναζυγιστικές πράξεις απαιτούνται μετά από μία διαγραφή; Πόσο συχνά συμμετέχει ένας κόμβος σε επαναζυγιστικές πράξεις; 22. Τι λέγεται Διαχρονικό B-Δέντρο με παράμετρο b; Ποια είναι η δομή του; Πως εκτελείται ένα ερώτημα αναζήτησης στο Διαχρονικό B-Δέντρο; Αν b=b ποιο είναι το Ι/Ο κόστος για ερώτημα αναζήτησης στοιχείου και ποιο για ερώτημα περιοχής; Τι χώρος απαιτείται για την αποθήκευση ενός Διαχρονικού B-Δέντρου με b=b; 23. Περιγράψτε τον αλγόριθμο της ένθεσης (insert) ενός στοιχείου στο Διαχρονικό B-Δέντρο με παράμετρο b=β. Στην περιγραφή να αναφέρετε πως αντιμετωπίζονται οι καταστάσεις υπερχείλισης, υποχείλισης, υπερχείλισης μπλοκ καθώς και το πως γίνεται η διάσπαση εκδοχών (version split). 24. Περιγράψτε τον αλγόριθμο της διαγραφής (delete) ενός στοιχείου στο Διαχρονικό B-Δέντρο με παράμετρο b=β. Στην περιγραφή να αναφέρετε πως αντιμετωπίζονται οι καταστάσεις υπερχείλισης, υποχείλισης, υποχείλισης μπλοκ καθώς και το πως γίνεται η διάσπαση εκδοχών (version split). 25. Τι λέγεται Δέντρο Ενδιάμεσης Μνήμης (ΕΜ-Δέντρο); Ποια είναι η δομή του; Πως επιλέγονται οι παράμετροί του; Ποιο είναι το Ι/Ο κόστος που απαιτείται για την εισαγωγή Ν στοιχείων στο ΕΜ- Δέντρο μαζί με τις επαναζυγίσεις που θα χρειαστούν; 26. Περιγράψτε την διαδικασία του αδειάσματος των buffers των κόμβων που βρίσκονται σε επίπεδο >1 σε ένα Δέντρο Ενδιάμεσης Μνήμης (ΕΜ-Δέντρο) και την διαδικασία αδειάσματος των buffers των κόμβων που βρίσκονται σε επίπεδο 1 (στο επίπεδο 0 βρίσκονται τα φύλλα). Ποιος βασικός περιορισμός υπάρχει για να εκτελεστεί η δεύτερη διαδικασία; 27. Ποια είναι η βασική ιδέα του κατακερματισμού; Τι απόδοση πετυχαίνουμε για τις βασικές πράξεις συγκριτικά με τα δέντρα (Ι/Ο κόστος για insert, delete, search); Ποιο είναι το βασικό μειονέκτημα του κατακερματισμού; Συγκρίνετε το Ι/Ο κόστος για ερωτήματα περιοχής σε κατακερματισμένα δεδομένα με το αντίστοιχο κόστος των δενδρικών δομών. Ποια είναι η υπόθεση

του ακεραίου σύμπαντος (Integer Universe) και ποια η υπόθεση της τυχαίας επιλογής (random probing); 28. Περιγράψτε την μέθοδο κατακερματισμού με αλυσίδες (hashing with chaining). Πως γίνεται η Αν n το πλήθος των δεδομένων, m το μέγεθος του πίνακα hash και α=n/m το occupancy ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση ενός στοιχείου που βρίσκεται στην δομή, την αναζήτηση ενός στοιχείου που δεν βρίσκεται στην δομή και την διαγραφή ενός στοιχείου; 29. Περιγράψτε την μέθοδο κατακερματισμού της διαίρεσης και δώστε ένα μικρό αριθμητικό παράδειγμα. Ποια είναι τα βασικότερα μειονεκτήματά της; Πως τα επιλύνουμε; Ποια συνάρτηση hash χρησιμοποιεί η μέθοδος κατακερματισμού του πολλαπλασιασμού; Αντιμετωπίζει πάντα τα μειονεκτήματα της διαίρεσης; Αναφέρετε μία ευνοϊκή τιμή της παραμέτρου της μεθόδου του πολλαπλασιασμού. 30. Περιγράψτε την μέθοδο του καθολικού κατακερματισμού (universal hashing). Πότε μία οικογένεια συναρτήσεων hash έχει την καθολική ιδιότητα; Ποιο φράγμα υπάρχει στην πιθανότητα των συγκρούσεων; Αναφέρετε μία οικογένεια συναρτήσεων hash που έχει την καθολική ιδιότητα και δώστε ένα αριθμητικό παράδειγμα για το πως υπολογίζεται η θέση τοποθέτησης ενός στοιχείου με την οικογένεια αυτή. Πότε μία οικογένεια συναρτήσεων hash είναι k-wise ανεξάρτητη; Δώστε ένα παράδειγμα μίας τέτοιας οικογένειας. 31. Περιγράψτε την μέθοδο του τέλειου κατακερματισμού (perfect hashing - FKS). Πως γίνεται η τοποθέτηση στοιχείων στην δομή αυτή; Ποιο είναι το Ι/Ο κόστος για την αναζήτηση και την διαγραφή ενός στοιχείου; Ποιος είναι ο αναμενόμενος χώρος που απαιτεί η δομή; 32. Περιγράψτε την μέθοδο κατακερματισμού με ανοικτή διευθυνσιοδότηση (hashing with open addressing). Πως γίνεται η εισαγωγή, η αναζήτηση και η διαγραφή ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή, την αναζήτηση και τη διαγραφή ενός στοιχείου στο παράδειγμά σας (χρησιμοποιείστε οποιαδήποτε ακολουθία ελέγχων θέλετε για τις θέσεις του πίνακα). Αν λ η πιθανότητα μία θέση του πίνακα να είναι κατειλημμένη (θεωρείστε ότι όλες οι θέσεις έχουν την ίδια πιθανότητα) ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση και την διαγραφή ενός στοιχείου; 33. Περιγράψτε την μέθοδο κατακερματισμού ανοικτής διευθυνσιοδότησης με γραμμικό έλεγχο (linear probing). Πως γίνεται η εισαγωγή, η αναζήτηση και η διαγραφή ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή, την αναζήτηση και τη διαγραφή ενός στοιχείου στο παράδειγμά σας. Αν λ n πιθανότητα μία θέση του πίνακα να είναι κατειλημμένη (θεωρείστε ότι όλες οι θέσεις έχουν την ίδια πιθανότητα), ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση ενός στοιχείου που βρίσκεται στην δομή, την αναζήτηση ενός στοιχείου που δεν βρίσκεται στην δομή και την διαγραφή ενός στοιχείου; Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματα του γραμμικού ελέγχου; 34. Περιγράψτε την μέθοδο κατακερματισμού ανοικτής διευθυνσιοδότησης με τετραγωνικό έλεγχο (quadratic probing). Πως γίνεται η εισαγωγή, η αναζήτηση και η διαγραφή ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή, την αναζήτηση και τη διαγραφή ενός στοιχείου στο παράδειγμά σας. Αν λ n πιθανότητα μία θέση του πίνακα να είναι κατειλημμένη (θεωρείστε ότι όλες οι θέσεις έχουν την ίδια πιθανότητα), πότε έχουμε αποτυχία εισαγωγής; Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματα του τετραγωνικού ελέγχου; 35. Περιγράψτε την μέθοδο του διπλού κατακερματισμού (double hashing). Πως γίνεται η Αν λ n πιθανότητα μία θέση του πίνακα να είναι κατειλημμένη (θεωρείστε ότι όλες οι θέσεις έχουν την ίδια πιθανότητα), ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση ενός στοιχείου που βρίσκεται στην δομή, την αναζήτηση ενός στοιχείου που δεν βρίσκεται στην δομή και την

διαγραφή ενός στοιχείου; Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματα του διπλού κατακερματισμού; 36. Περιγράψτε την μέθοδο του κατακερματισμού πολλαπλής επιλογής (multiple-choice hashing). Πως γίνεται η εισαγωγή, η αναζήτηση και η διαγραφή ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή, την αναζήτηση και τη διαγραφή ενός στοιχείου στο παράδειγμά σας. Αν d η βασική παράμετρος της μεθόδου, ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση και την διαγραφή ενός στοιχείου; 37. Περιγράψτε την μέθοδο κατακερματισμού του κούκου (cuckoo hashing). Πως γίνεται η Ποιο είναι το Ι/Ο κόστος για την εισαγωγή, την αναζήτηση και την διαγραφή ενός στοιχείου; Πότε η εισαγωγή ενός στοιχείου μπορεί να καταλήξει σε αποτυχία; Πως αντιμετωπίζεται η περίπτωση αυτή; 38. Περιγράψτε την μέθοδο ενός Bloom φίλτρου με βασική παράμετρο k. Πως γίνεται η εισαγωγή και η αναζήτηση ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή και την αναζήτηση ενός στοιχείου στο παράδειγμά σας. Πότε η αναζήτηση δίνει false positives; Γιατί δεν επιτρέπονται οι διαγραφές; Ποια τιμή του k ελαχιστοποιεί την πιθανότητα των false positives; 39. Περιγράψτε την μέθοδο του επεκτάσιμου κατακερματισμού (extendible hashing). Πως γίνεται η εισαγωγή και η αναζήτηση ενός στοιχείου; Σχεδιάστε ένα μικρό παράδειγμα της δομής και περιγράψτε την εισαγωγή και την αναζήτηση ενός στοιχείου στο παράδειγμά σας. Πως αντιμετωπίζονται οι καταστάσεις υπερχείλισης; Πότε γίνεται επέκταση καταλόγου; Δώστε ένα παράδειγμα. 40. Περιγράψτε τα τρία βασικά μοντέλα των ροών. Δώστε ένα μικρό παράδειγμα για το καθένα. Τι σημαίνει για έναν αλγόριθμο ροών ότι θα δώσει την απάντηση με σφάλμα ε και πιθανότητα αποτυχίας δ; 41. Περιγράψτε την δειγματοληψία reservoir sampling και την δειγματοληψία min-wise sampling. Πότε εφαρμόζονται; Ποια είναι η πιθανότητα ενός στοιχείου της ροής να βρίσκεται στο δείγμα για τις μεθόδους αυτές; Ποια είναι τα πλεονεκτήματα και ποια τα μειονεκτήματα της δειγματοληψίας γενικά; Αναφέρετε ένα πρόβλημα ροών το οποίο δεν μπορεί να αντιμετωπιστεί με την δειγματοληψία. 42. Περιγράψτε το Count-Min sketch, την δομή του και τις παραμέτρους του. Πως αυτές συνδέονται με τις παραμέτρους σφάλματος ε και πιθανότητας αποτυχίας δ; Σχεδιάστε ένα μικρό παράδειγμα της δομής του και εξηγήστε πως απεικονίζεται στο sketch ένα στοιχείο που διαβάζεται από τη ροή. Πως γίνεται η εκτίμηση της συχνότητας ενός στοιχείου αν θεωρήσουμε ότι το sketch εφαρμόζεται στο πρόβλημα των συχνών στοιχείων; Πως επιτυγχάνεται η ανεξαρτησία μεταξύ των γραμμών του sketch; Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 43. Περιγράψτε το FM sketch, την δομή του και τις παραμέτρους του, εφαρμόζοντας το στο πρόβλημα του πλήθους των διακριτών τιμών. Σχεδιάστε ένα μικρό παράδειγμα της δομής του και εξηγήστε πως απεικονίζεται στο sketch ένα στοιχείο που διαβάζεται από τη ροή. Πως γίνεται η τελική εκτίμηση του πλήθους των διακριτών τιμών; Πόσα διαφορετικά και ανεξάρτητα FM sketch απαιτούνται ώστε να έχουμε σφάλμα το πολύ ε και πιθανότητα αποτυχίας δ; Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 44. Περιγράψτε τον αλγόριθμο εύρεσης πλειοψηφικού στοιχείου (majority algorithm). Δώστε ένα παράδειγμα εκτέλεσης του αλγορίθμου σε δεδομένα στα οποία υπάρχει πλειοψηφικό στοιχείο και σε δεδομένα στα οποία δεν υπάρχει πλειοψηφικό στοιχείο. Τι ισχύει για την απάντηση που δίνει ο αλγόριθμος σε περίπτωση που διαβαστούν τα δεδομένα της ροής μόνο μία φορά; 45. Περιγράψτε τον αλγόριθμο συχνότητας (frequent algorithm) για το πρόβλημα των k συχνών στοιχείων. Ποια είναι η τιμή του k ώστε ο αλγόριθμος να υπολογίζει τις συχνότητες με σφάλμα ε;

Τι χώρος απαιτείται; (τα δεδομένα της ροής διαβάζονται μόνο μία φορά). Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 46. Περιγράψτε τον αλγόριθμο lossy counting για το πρόβλημα των k συχνών στοιχείων. Ποιος είναι ο απαιτούμενος χώρος αποθήκευσης ώστε οι συχνότητες να υπολογίζονται με σφάλμα ε; (τα δεδομένα της ροής διαβάζονται μόνο μία φορά). Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 47. Περιγράψτε τον αλγόριθμο space saving για το πρόβλημα των k συχνών στοιχείων. Ποιος είναι ο απαιτούμενος χώρος αποθήκευσης ώστε οι συχνότητες να υπολογίζονται με σφάλμα ε; (τα δεδομένα της ροής διαβάζονται μόνο μία φορά). Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 48. Περιγράψτε τον τελικό αλγόριθμο hierarchical search + group testing για το πρόβλημα των k συχνών στοιχείων. Πόσα υποσύνολα S του σύμπαντος U πρέπει να επιλεχθούν ώστε η πιθανότητα να υπάρχουν περισσότερα από ένα συχνά στοιχεία στο ίδιο υποσύνολο να είναι μικρότερη από 1/2; Πως τοποθετούνται τα στοιχεία στα υποσύνολα; Ποια οικογένεια συναρτήσεων hash χρησιμοποιείται; Πόσες φορές επαναλαμβάνουμε την εκλογή των υποσυνόλων και των συναρτήσεων hash ώστε να εξασφαλίσουμε την συνολική πιθανότητα αποτυχίας να είναι το πολύ δ; (τα δεδομένα της ροής διαβάζονται μόνο μία φορά). Ποια είναι η απόδοση του αλγορίθμου (χώρος-χρόνος); Σε ποια μοντέλα ροών μπορεί να εφαρμοστεί; 49. Ποια είναι η δομή ενός αποτυπώματος και ποιες ιδιότητες έχει; Πως ορίζονται οι συναρτήσεις του; Πως υπολογίζεται το αποτύπωμα των k-bits ενός στοιχείου που έχει m-bits; Δώστε ένα αριθμητικό παράδειγμα. Αναφέρετε μία σημαντική εφαρμογή του. 50. Ποια είναι η δομή ενός haar-wavelet; Πως υπολογίζονται τα στοιχεία του; Σχεδιάστε ένα μικρό παράδειγμα και δώστε την έξοδο του wavelet. Πως από το τελικό wavelet αναπαράγονται τα αρχικά δεδομένα; Δώστε το αντίστοιχο διάγραμμα για το παράδειγμά σας. Με βάση ποιο κριτήριο επιλέγονται οι Β<Ν συντελεστές του wavelet για την σύνοψη; Ποια είναι η απόδοση του haarwavelet (χώρος-χρόνος);