Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία

Σχετικά έγγραφα
Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6: Δομές ευρετηρίων για αρχεία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Βάσεις Δεδομένων ΙΙ Ενότητα 12

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems - GIS)

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6: Δομές ευρετηρίων για αρχεία

Σχεδίαση Βάσεων Δεδομένων. Χωρικές Βάσεις Δεδομένων και Μέθοδοι Προσπέλασης Μανώλης Μαραγκουδάκης

Multimedia IR. Εισαγωγή. Εισαγωγή. εικτοδότηση και Αναζήτηση

Multimedia IR. εικτοδότηση και Αναζήτηση. Ανάκτηση Πληροφορίας

R-Trees, kd-trees, QuadTrees. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Διάλεξη 14: Δέντρα IV B Δένδρα. Διδάσκων: Παναγιώτης Ανδρέου

Διάλεξη 14: Δέντρα IV - B-Δένδρα

Διάλεξη 18: B-Δένδρα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Εισαγωγή στην PostgreSQL Spatial 8.1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Βάσεις Δεδομένων ΙΙ Ενότητα 6

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Κεφ.11: Ευρετήρια και Κατακερματισμός

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 2: Εισαγωγή στις Βάσεις Δεδομένων

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

«ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΜΕΘΟ ΩΝ ΚΑΤΑΣΚΕΥΗΣ ΤΟΥ R* TREE ΜΕ ΟΡΟΥΣ ΑΠΟ ΟΤΙΚΟΤΗΤΑΣ ΓΙΑ ΕΡΩΤΗΜΑΤΑ ΚΟΝΤΙΝΟΤΕΡΟΥ ΓΕΙΤΟΝΑ ΣΕ ΠΟΛΥ ΙΑΣΤΑΤΟΥΣ ΧΩΡΟΥΣ Ε ΟΜΕΝΩΝ»

Εισαγωγή στην Oracle Spatial 10g

Θέμα: Ανάπτυξη Βασικής Πλατφόρμας για Υπηρεσίες με Βάση το Προφίλ και τη Θέση (Profile & Location Based Services)

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 7: Αλγόριθμοι για επεξεργασία ερωτήσεων και βελτιστοποίηση

Ισορροπημένα Δένδρα. για κάθε λειτουργία; Ισορροπημένο δένδρο : Διατηρεί ύψος κάθε εισαγωγή ή διαγραφή

Δομές Δεδομένων (Εργ.) Ακ. Έτος Διδάσκων: Ευάγγελος Σπύρου. Εργαστήριο 10 Δυαδικά Δένδρα Αναζήτησης

Βάσεις Δεδομένων ΙΙ Ενότητα 11

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 4: Σχεσιακός Λογισμός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Επεξεργασία Ερωτήσεων

Advanced Data Indexing

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας

Τεχνικές Προσπέλασης σε Πολυδιάστατες Βάσεις εδοµένων µε χρήση ένδρων (R-trees,

Επιλογές σύμφωνα με τις σχέσεις των θέσεων των οντοτήτων στο Χώρο 1

Χωρικές οµές εδοµένων: Αναλυτικά Μοντέλα και Αποδοτικοί Αλγόριθµοι

Γραφικά Υπολογιστών: Αποκοπή στις 3D Διαστάσεις

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΛΥΣΗ ΤΗΣ ΔΕΥΤΕΡΗΣ ΑΣΚΗΣΗΣ Όλγα Γκουντούνα

Διάλεξη 24: B-Δένδρα. Διδάσκων: Παναγιώτης Ανδρέου

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία. Πέτρος Ποτίκας CoReLab 4/5/2006

max 17x x 2 υπό 10x 1 + 7x 2 40 x 1 + x 2 5 x 1, x 2 0.

ΠΑΡΑΡΤΗΜΑ: QUIZ ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων

Διδάσκων: Κωνσταντίνος Κώστα

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΟΝΤΕΛΟΠΟΙΗΣΗ-ΨΗΦΙΑΚΗ ΣΥΝΘΕΣΗ ΕΙΚΟΝΩΝ Διδάσκων: Ν. ΝΙΚΟΛΑΙΔΗΣ

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Προηγμένη Ευρετηρίαση Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

ΕΠΛ 231 Δοµές Δεδοµένων και Αλγόριθµοι 8-1

Μέγιστη ροή. Κατευθυνόμενο γράφημα. Συνάρτηση χωρητικότητας. αφετηρίακός κόμβος. τερματικός κόμβος. Ροή δικτύου. με τις ακόλουθες ιδιότητες

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 7: Αλγόριθμοι για επεξεργασία ερωτήσεων και βελτιστοποίηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ

9. Κόκκινα-Μαύρα Δέντρα

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1

Δυναμικός Κατακερματισμός. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ

Μέθοδοι Πολυδιάστατης Προσπέλασης σε Βάσεις εδοµένων µε χρήση ένδρων

Διαχείριση Χωρικών Δεδομένων

ΜΕΡΟΣ Ι: Εισαγωγικά 1 ΕΙΣΑΓΩΓΗ...3

Εισαγωγικά στοιχεία για παραλληλισμό και ΒΔ Μοντέλα και αρχιτεκτονικές παραλληλισμού Διαμερισμός δεδομένων Παράλληλη επεξεργασία ερωτημάτων

Εισαγωγή Αποκοπή ευθείας σε 2Δ Αποκοπή πολυγώνου σε 2Δ Αποκοπή σε 3Δ. 3ο Μάθημα Αποκοπή. Γραφικα. Ευάγγελος Σπύρου

Άσκηση 3 (ανακοινώθηκε στις 24 Απριλίου 2017, προθεσμία παράδοσης: 2 Ιουνίου 2017, 12 τα μεσάνυχτα).

Διάλεξη 22: Δυαδικά Δέντρα. Διδάσκων: Παναγιώτης Ανδρέου

Εισαγωγή ενός νέου στοιχείου. Επιλογή i-οστoύ στοιχείου : Εύρεση στοιχείου με το i-οστό μικρότερο κλειδί

Δεντρικά Ευρετήρια. Δέντρα Αναζήτησης

Διδάσκων: Παναγιώτης Ανδρέου

Ισορροπημένα Δένδρα. για κάθε λειτουργία; Ισορροπημένο δένδρο : Διατηρεί ύψος κάθε εισαγωγή ή διαγραφή

ΜΟΝΑΔΕΣ ΑΡΙΣΤΕΙΑΣ ΑΝΟΙΧΤΟΥ ΛΟΓΙΣΜΙΚΟΥ

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

1 Διάσχιση κατευθυνόμενων γραφημάτων

Θεματολογία. Χωρικά στοιχεία σε βάσεις δεδομένων;

Λυσεις προβλημάτων τελικής φάσης Παγκύπριου Μαθητικού Διαγωνισμού Πληροφορικής 2007

Επίλυση προβλημάτων με αναζήτηση

έντρα ομές εδομένων 3ο εξάμηνο ιδάσκων: Χρήστος ουλκερίδης ιαφάνειες προσαρμοσμένες από το υλικό της Μαρίας Χαλκίδη

Άσκηση 3 (ανακοινώθηκε στις 14 Μαΐου 2018, προθεσμία παράδοσης: 8 Ιουνίου 2018, 12 τα μεσάνυχτα).

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Τµήµα Πληροφορικής. Δοµές Δεδοµένων - Εργασία 3. Φθινοπωρινό Εξάµηνο Διδάσκων: E. Μαρκάκης. Εφαρµογές των Δέντρων Δυαδικής Αναζήτησης

Αναζήτηση Κατά Πλάτος

Δυναμικές Δομές Δεδομένων Λίστες Δένδρα - Γράφοι

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Ουρές Προτεραιότητας. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Πληροφορική & Τηλεπικοινωνίες. K18 - Υλοποίηση Συστημάτων Βάσεων Δεδομένων Εαρινό Εξάμηνο

Transcript:

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία Ευάγγελος Καρκαλέτσης, Αναστασία Κριθαρά, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών, Ε.Κ.Ε.Φ.Ε. Δημόκριτος Τηλ.: 210-6503197, Fax: 210-6532175, {vangelis, akrithara, petasis}@iit.demokritos.gr Ακαδημαϊκό Έτος: 2015 2016 Τεχνολογίες Πληροφορικής στην Ιατρική και τη Βιολογία, 2015 2016

Οι διαφάνειες αυτού του σεμιναρίου βασίζονται σε διαφάνειες των: Δ. Γουνόπουλος, Ι. Ιωαννίδης http://eclass.uoa.gr/modules/document/document.php?course=d463&opendir=/4c2b32a5i4iq Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 1

Θα μιλήσουμε για Ευρετήρια χωρικών δεδομένων R-δένδρα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 2

Ευρετηρίαση πολυδιάστατων δεδομένων Είναι το σχεσιακό μοντέλο των ΣΔΒΔ κατάλληλο για τα πολυδιάστατα δεδομένα (π.χ. χωρικά δεδομένα); Τα σχεσιακά ΣΔΒΔ παρέχουν απλούς τύπους τιμών, όπως αριθμοί και συμβολοσειρές Έννοια της ολικής διάταξης Τα δένδρα αναζήτησης είναι αποτελεσματικά για αριθμούς Οι έννοιες αυτές δεν έχουν ιδιαίτερο νόημα για τα χωρικά δεδομένα (π.χ. σημεία στο επίπεδο) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 3

Ευρετηρίαση πολυδιάστατων δεδομένων (συνέχεια) Εφαρμογές GIS (χάρτες): Πολεοδομικός σχεδιασμός, βελτιστοποίηση διαδρομής, έλεγχος φωτιάς ή ρύπανσης, κ.λπ. Άλλες εφαρμογές: Σχεδιασμός VLSI, CAD/CAM, μοντελοποίηση ανθρώπινου εγκεφάλου, κλπ.. Παραδοσιακές εφαρμογές: Πολυμεσικές εγγραφές Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 4

Ευρετηρίαση πολυδιάστατων δεδομένων (συνέχεια) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 5

Ευρετηρίαση πολυδιάστατων δεδομένων (συνέχεια) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 6

Ευρετηρίαση πολυδιάστατων δεδομένων (συνέχεια) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 7

Ευρετηρίαση πολυδιάστατων δεδομένων (συνέχεια) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 8

Απλές χωρικές ερωτήσεις και λειτουργίες Το φυσικό μοντέλο παρέχει απλές λειτουργίες που χρειάζονται στην επίλυση χωρικών ερωτήσεων. Συνηθισμένες ερωτήσεις: Point query: Βρες όλα τα αντικείμενα που περικλείουν ένα δοθέν σημείο Range query: Βρες όλα τα αντικείμενα που κείνται μέσα σε μια (συνήθως ορθογώνια) περιοχή Nearest neighbor query: Βρες το πλησιέστερο αντικείμενο σε σχέση με ένα σημείο Spatial Join (μεταξύ δύο συνόλων αντικειμένων): Βρες όλα τα ζεύγη αντικειμένων (ένα από κάθε σύνολο) που ικανοποιούν μια χωρική συνθήκη (συνήθως, overlap) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 9

Παραδείγματα χωρικών ερωτήσεων Point query Range query Nearest neighbor query Spatial Join Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 10

Η διαδικασία «Filter-Refinement» Επεξεργασία μίας χωρικής ερώτησης Q βήμα φιλτραρίσματος (Filter): βρες ένα σύνολο S που σίγουρα περιέχει και τις απαντήσεις του Q Με χρήση προσεγγιστικών χωρικών τύπων και λειτουργιών βήμα εκλέπτυνσης (Refinement): βρες τις ακριβείς απαντήσεις του Q κάνοντας χρήση ενός GIS για την επεξεργασία του S Με χρήση επακριβών χωρικών τύπων και λειτουργιών Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 11

Προσεγγιστικοί χωρικοί τύποι Minimum Bounding Rectangle (MBR) προσεγγίζει γραμμές, πολύγωνα, MBR(obj) είναι το μικρότερο ορθογώνιο παραλληλόγραμμο (παραλληλεπίπεδο κλπ.) που περιβάλλει το αντικείμενο obj και είναι παράλληλο με το καρτεσιανό σύστημα συντεταγμένων Τα MBRs χρησιμοποιούνται κατά κόρον από χωρικά ευρετήρια, π.χ. R-tree Οι αλγόριθμοι για χωρικές λειτουργίες σε MBRs είναι απλοί Τα Χωρικά ΣΔΒΔ επεξεργάζονται MBRs στο βήμα filter (για λόγους επίδοσης) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 12

Παράδειγμα MBR Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 13

Παράδειγμα filter refinement Range queries στο filter βήμα εκτελείται ο (προσεγγιστικός και πιο φθηνός) τελεστής overlap(mbr(a), Q) στο refinement βήμα εκτελείται ο (ακριβής αλλά και χρονοβόρος) τελεστής overlap(a, Q) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 14

Οργάνωση αρχείων & ευρετήρια Επαναχρησιμοποίηση εννοιών σχεσιακού φυσικού μοντέλου η έννοια της διάταξης (ordering) Οι καμπύλες διάσχισης χώρου (space filling curves) ορίζουν μία ολική διάταξη για τα σημεία Αυτή η ολική διάταξη βοηθάει στη χρήση διατεταγμένων αρχείων (ordered files) ή δένδρων αναζήτησης (search trees) π.χ. B-trees Αλλά μπορεί να οδηγήσει σε αναποτελεσματικούς υπολογισμούς! Καινοτόμες τεχνικές Χωρικά ευρετήρια, π.χ. δένδρα περιοχών (R-trees), δένδρα τεταρτημορίων (Quadtree), αρχεία πλέγματος (Gridfile) Παρέχουν καλύτερες αποδόσεις στους υπολογισμούς Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 15

Διατεταγμένα αρχεία Γενικά ένα διατεταγμένο αρχείο ομαδοποιεί τις εγγραφές που προσπελαύνονται από πολλές ερωτήσεις σε κοινούς τομείς δίσκου για τη μείωση του I/O κόστους για επιλεγμένες ερωτήσεις Πρόβλημα: Η διάταξη δεν έχει κάποιο φυσικό νόημα στα χωρικά δεδομένα Είναι αδύνατο να βρεθεί απεικόνιση «1-1» και «επί» που να μετασχηματίζει τα σημεία του 2d χώρου σε μία διάσταση Πιθανή λύση: Μετασχηματισμός των χωρικών αντικειμένων από δύο σε μία διάσταση χρησιμοποιώντας μία «καμπύλη διάσχισης χώρου» (space filling curve). Η λύση μπορεί να εφαρμοστεί μόνο σε διακριτό και όχι συνεχή χώρο. Επιθυμούμε τη διατήρηση των σχέσεων εγγύτητας των αντικειμένων στο μετασχηματισμένο χώρο Παραδείγματα: Z-curve, Hilbert-curve Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 16

Καμπύλες Διάσχισης Χώρου Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 17

Τι είναι μία Z-curve? Μία καμπύλη διάσχισης χώρου Παραγόμενη από διαπλεκόμενα (interleaved) bits x, y συντεταγμένες Εναλλακτική μέθοδος δημιουργίας: συνδέοντας σημεία με z-order Μοιάζει με N ή Z Διάσχιση Z Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 18

Παράδειγμα Z-τιμών Το αριστερό μέρος δείχνει ένα χάρτη με τα χωρικά αντικείμενα A, B, C Το δεξί και κάτω αριστερό μέρος Z-τιμές στα A, B και C Παρατηρήστε ότι το C παίρνει z-values 2 και 8, οι οποίες δεν είναι κοντά Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 19

Ευρετηρίαση χωρικών δεδομένων Τα MBRs χρησιμοποιούνται κατά κόρον από χωρικά ευρετήρια, π.χ. R-δένδρο Το R-δένδρο είναι επέκταση του Β + -δένδρου στις k διαστάσεις, όπου k>1. Στις δύο διαστάσεις τα χωρικά αντικείμενα στο R- δένδρο προσεγγίζονται από το ελάχιστο καλύπτον ορθογώνιο (minimum boundary rectangle MBR). Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 20

R-δένδρο Βασική ιδέα Γενίκευση B-tree σε χωρικά δεδομένα Ιδιότητες των R-trees Κάθε κόμβος αντιστοιχεί σε μία σελίδα του δίσκου Ισοζυγισμένα / Οι κόμβοι είναι ορθογώνια / Το ορθογώνιοπαιδί περιέχεται πλήρως εντός του ορθογωνίου-πατέρα Μπορεί να προκύψει χωρική επικάλυψη μεταξύ των κόμβων Η αναζήτηση γίνεται με κατάβαση στο δένδρο Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 21

R-δένδρα Ομαδοποίησε κοντινά ορθογώνια στους γονείς MBRs. Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 22

R-δένδρα π.χ. με F =4 Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 23

R-δένδρα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 24

R-δένδρα: Οργάνωση κόμβων {(MBR; obj-ptr)} για φύλλα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 25

R-δένδρα: Οργάνωση κόμβων {(MBR; node-ptr)} για μη-φύλλα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 26

R-δένδρα: αναζήτηση εύρους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 27

R-δένδρα: αναζήτηση εύρους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 28

R-δένδρα: αναζήτηση εύρους Παρατηρήσεις: Κάθε κόμβος γονέας καλύπτει πλήρως τα παιδιά του Ένα MBR παιδί μπορεί να καλύπτεται από περισσότερους από έναν πατέρα αποθηκεύεται κάτω από ΜΟΝΟ EΝΑΝ από αυτούς. (π.χ., δεν χρειάζεται εξάλειψη διπλοτύπων) Ένα σημειακό ερώτημα μπορεί να ακολουθεί πολλές διακλαδώσεις. Όλα δουλεύουν για κάθε διάσταση Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 29

π.χ. ορθογώνιο Χ R-δένδρα: εισαγωγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 30

π.χ. ορθογώνιο Χ R-δένδρα: εισαγωγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 31

π.χ. ορθογώνιο Υ R-δένδρα: εισαγωγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 32

R-δένδρα: εισαγωγή π.χ. ορθογώνιο Υ : Επέκτεινε τον κατάλληλο γονέα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 33

R-δένδρα: εισαγωγή π.χ. ορθογώνιο Υ : Επέκτεινε τον κατάλληλο γονέα Πώς μετράμε την καταλληλότητα ; Βρες το κατάλληλο που χρειάζεται την ελάχιστη επέκταση για να συμπεριλάβει το Y. Σε περίπτωση ισοπαλίας, επιλέγουμε το μικρότερο Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 34

π.χ. ορθογώνιο W R-δένδρα: εισαγωγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 35

π.χ. ορθογώνιο W R-δένδρα: εισαγωγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 36

R-δένδρα: εισαγωγή π.χ. ορθογώνιο W : Επικεντρώστε στο P1. Πώς να διαχωριστεί; A1: plane sweep A2: linear split A3: quadratic split A4: exponential split Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 37

R-δένδρα: εισαγωγή & split Επιλέξτε δύο ορθογώνια ως πηγές Αναθέστε κάθε ορθογώνιο R στη πλησιέστερη πηγή Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 38

R-δένδρα: εισαγωγή & split Επιλέξτε δύο ορθογώνια ως πηγές Αναθέστε κάθε ορθογώνιο R στη πλησιέστερη πηγή Πώς μετράμε την εγγύτητα? Αυξάνοντας τη περιοχή (ένταση) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 39

R-δένδρα: εισαγωγή & split Επιλέξτε δύο ορθογώνια ως πηγές Αναθέστε κάθε ορθογώνιο R στη πλησιέστερη πηγή Πώς μετράμε την εγγύτητα? Αυξάνοντας τη περιοχή (ένταση) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 40

R-δένδρα: εισαγωγή & split Επιλέξτε δύο ορθογώνια ως πηγές Αναθέστε κάθε ορθογώνιο R στη πλησιέστερη πηγή Πώς μετράμε την εγγύτητα? Αυξάνοντας τη περιοχή (ένταση) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 41

Πώς επιλέγουμε πηγές ; Linear: Βρες την υψηλότερη και χαμηλότερη πλευρά σε κάθε διάσταση, κανονικοποίησε το διαχωρισμό τους, επέλεξε το ζεύγος με το μεγαλύτερο κανονικοποιημένο διαχωρισμό Quadratic: Για κάθε ζεύγος E1 και E2, υπολόγισε το ορθογώνιο J=MBR(E1, E2) και d= J-E1-E2. Επέλεξε το ζευγάρι με το μεγαλύτερο d. Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 42

R-δένδρα: εισαγωγή & split Επιλέξτε δύο ορθογώνια ως πηγές Αναθέστε κάθε ορθογώνιο R στη πλησιέστερη πηγή Επιλέξτε σε ποιον πατέρα θα εισάγετε το νέο ορθογώνιο ( πλησιέστερο πατέρα) Αν υπερχειλίσει, διαχωρίστε σε δύο, χρησιμοποιώντας (έστω) τον quadratic split αλγόριθμο Διαδώστε το διαχωρισμό προς τα πάνω, αν χρειάζεται ενημερώστε τους MBRs των επηρεαζόμενων πατέρων. Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 43

R-δένδρα: Διαγραφή Διαγραφή ορθογωνίου Αν υπερχειλίσει Προσωρινά διαγράψτε όλα τους συγγενείς(!) Διαγράψτε τον πατρικό κόμβο και Επανα-εισάγετε τους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 44

R-δένδρα: Range αναζήτηση ψευδοκώδικας: Ελέγξτε τη ρίζα για κάθε κλαδί, Αν το MBR τέμνει το ορθογώνιο του ερωτήματος εφάρμοσε αναζήτηση-εύρους ( ή τύπωσε το, αν είναι φύλλο) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 45

R-δένδρα: ΝΝ αναζήτηση Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 46

Πώς; R-δένδρα: ΝΝ αναζήτηση Βρες τον πλησιέστερο γείτονα, εκλέπτυνε... Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 47

R-δένδρα: ΝΝ αναζήτηση depth-first αναζήτηση, στη συνέχεια, αναζήτηση εύρους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 48

R-δένδρα: ΝΝ αναζήτηση depth-first αναζήτηση, στη συνέχεια, αναζήτηση εύρους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 49

R-δένδρα: ΝΝ αναζήτηση depth-first αναζήτηση, στη συνέχεια, αναζήτηση εύρους Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 50

R-δένδρα: ΝΝ αναζήτηση Άλλη προσέγγιση: Ουρές προτεραιότητας, με υποσχόμενα MBRs και την βέλτιστη και χείριστη απόσταση Θεωρούμε μόνο τα P2 και P4, χάριν παραδείγματος Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 51

R-δένδρα: ΝΝ αναζήτηση Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 52

R-δένδρα: Spatial joins Βρες όλους του νομούς που τέμνουν τις λίμνες Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 53

R-δένδρα: Spatial joins Υπέθεσε ότι είναι οργανωμένα σε R-δέντρα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 54

R-δένδρα: Spatial joins Για κάθε πατέρα P1 του δένδρου T1 Για κάθε πατέρα P2 του δένδρου T2 Αν το MBRs τους τέμνει, Επεξεργαστείτε τα αναδρομικά (πχ., ελέγξτε τα παιδιά τους) Βελτιώσεις-παραλλαγές: [Seeger+, sigmod92]: κάνε κάποια προ-επεξεργασία, κάνε planesweeping για να αποφύγετε N1 * N2 ελέγχους για τομές [Lo & Ravishankar, sigmod94]: seeded R-trees (πολλές δημοσιεύσεις πάνω σε spatial joins, χωρίς R-trees: [Koudas+ Sevcik], κτλ.) Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 55

Παραλλαγές των R-δένδρων R+-tree: Δεν επιτρέπεται η επικάλυψη μεταξύ φύλλων και κόμβων, και υιοθετείται η τεχνική της αποκοπής (clipping) R*-tree: Βασίζεται στο αρχικό R-tree με μία παραλλαγή στον αλγόριθμο εισαγωγής του. Packed Hilbert R-tree: Κατασκευή bottom up, έχοντας πρώτα διατάξει τα αντικείμενα που θα εισαχθούν κατά τη σειρά Hilbert Αλγόριθμοι: Αναζήτηση σημείου, εύρους, πλησιέστερου γείτονα Χωρική σύνδεση Τοπολογικές αναζητήσεις Εφαρμογές: Χωρικές Βάσεις Χωροχρονικές Βάσεις - Κινούμενα αντικείμενα Βάσεις πολυμέσων Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 56

Σύνοψη Ευρετήρια χωρικών δεδομένων R-δένδρα Σεμινάριο 6, Δομές ευρετηρίων για αρχεία 57

Αναφορές Christos Faloutsos and Ibrahim Kamel. Beyond Uniformity and Independence: Analysis of R-trees Using the Concept of Fractal Dimension. Proc. ACM PODS, 1994. Yannis Theodoridis and Timos Sellis. A Model for the Prediction of Rtree Performance. Proc. ACM PODS, 1996. Σεμινάριο 4, Δομές ευρετηρίων για αρχεία 58