MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

Σχετικά έγγραφα
Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

ΜΕΡΟΣ Ι: ΓΕΩΓΡΑΦΙΚΑ Ε ΟΜΕΝΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Η ΦΥΣΗ ΤΩΝ ΓΕΩΓΡΑΦΙΚΩΝ Ε ΟΜΕΝΩΝ...

Χωρικές και Πολυμεσικές Βάσεις Δεδομένων (ΠΜΣ) Ενδεικτικές ερωτήσεις-θέματα για την εξέταση της θεωρίας

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία

Επιβλέπων καθηγητής: Βασίλειος Μεγαλοοικονόμου

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Εισαγωγή στη χρήση των Συστηµάτων Γεωγραφικής Πληροφορίας

Multimedia IR. εικτοδότηση και Αναζήτηση. Ανάκτηση Πληροφορίας

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6: Δομές ευρετηρίων για αρχεία

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

R-Trees, kd-trees, QuadTrees. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

Multimedia IR. Εισαγωγή. Εισαγωγή. εικτοδότηση και Αναζήτηση

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αλγόριθμοι Εξόρυξης Χωρικών εδομένων

Βάσεις εδοµένων & Πολυµέσα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αναλυτικές λειτουργίες ΣΓΠ

Efficient and Effective Clustering Methods for Spatial Data Mining (Αποδοτικές και αποτελεσματικές μέθοδοι ομαδοποίησης για εξόρυξη χωρικών δεδομένων)

Κεφ.11: Ευρετήρια και Κατακερματισμός

Ανάγκη Ανάπτυξης Μοντέλων και Δομών Χωρικών Δεδομένων

Μορφές των χωρικών δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ - ΤΜΗΥΠ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΙI

Τεχνικές Προσπέλασης σε Πολυδιάστατες Βάσεις εδοµένων µε χρήση ένδρων (R-trees,

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

Μεθοδολογίες παρεµβολής σε DTM.

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Γεωμετρικός Πυρήνας Παραμετρική Σχεδίαση

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι

GIS: Εισαγωγή στα Γεωγραφικά Συστήµατα Πληροφοριών

Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία. Πέτρος Ποτίκας CoReLab 4/5/2006

ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

Εξόρυξη Γνώσης από εδοµένα (Data Mining)

Απαλλακτική Εργασία Γραφικά & Εικονική Πραγματικότητα. Παπαπαύλου Χρήστος ΑΜ: 6609

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems - GIS)

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Οργάνωση Γεωγραφικών. πληροφοριών

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

ΓΕΩΛΟΓΙΑ - ΓΕΩΓΡΑΦΙΑ Α ΓΥΜΝΑΣΙΟΥ

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Ανίχνευση συστάδων µε τον αλγόριθµο STING για εφαρµογές spatial data mining από συστήµατα χωρικών δεδοµένων

Οι δυναμικές δομές δεδομένων στην ΑΕΠΠ

ΠΛΑΙΣΙΑ. Τα πλαίσια έχουν:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Βάσεις Δεδομένων ΙΙ Ενότητα 12

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΟΝΤΕΛΟΠΟΙΗΣΗ-ΨΗΦΙΑΚΗ ΣΥΝΘΕΣΗ ΕΙΚΟΝΩΝ Διδάσκων: Ν. ΝΙΚΟΛΑΙΔΗΣ

Λογικός Σχεδιασµός Σχεσιακών Σχηµάτων: Αποσύνθεση. Βάσεις εδοµένων Ευαγγελία Πιτουρά 1

Βασικές δοµές δεδοµένων. Ορολογία λιστών. 8.1 Βασικές έννοιες δοµών δεδοµένων 8.2 Υλοποίηση δοµών δεδοµένων 8.3 Μια σύντοµη υπόθεση εργασίας

Πίνακας περιεχοµένων

ΜΕΡΟΣ Ι: Εισαγωγικά 1 ΕΙΣΑΓΩΓΗ...3

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Κ15 Ψηφιακή Λογική Σχεδίαση 2: Δυαδικό Σύστημα / Αναπαραστάσεις

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

έντρα ιδάσκοντες:. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Δομές δεδομένων και ψηφιακή αναπαράσταση χωρικών φαινομένων

Χειρισμός Ανάλυση Δεδομένων

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Συνόψεις για Δεδομένα XML με Ετερογενές Περιεχόμενο

Αναλυτικές λειτουργίες ΓΠΣ

Γιάννης Θεοδωρίδης. Εργαστήριο Πληροφοριακών Συστηµάτων.

ιδάσκοντες: Φ. Αφράτη,. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Ερωτήσεις Χωροχρονικών. Προτύπων-Κινήσεων

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Αλγόριθµοι και Πολυπλοκότητα

Βάσεις εδοµένων. Βασίλειος Βεσκούκης, Εµµ. Στεφανάκης ΣΥΣΤΗΜΑΤΑ ΙΑΧΕΙΡΙΣΗΣ ΒΑΣΕΩΝ Ε ΟΜΕΝΩΝ

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

κυρτών και σύνθετων σωμάτων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Αναζήτηση Κατά Πλάτος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Η κατεύθυνση "Πληροφοριακά Συστήµατα"

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ

Μέθοδοι Πολυδιάστατης Προσπέλασης σε Βάσεις εδοµένων µε χρήση ένδρων

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Αλγόριθµοι Γραφηµάτων

Δομές Δεδομένων και Αλγόριθμοι

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Τι προσφέρουν τα Τµήµατα Πληροφορικής. ... το Εργαστήριο Πληροφοριακών Συστηµάτων του Πα.Πει. Ερευνητικές δραστηριότητες σε GI Ενδεικτικές εργασίες

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

Σύστημα Πλεονάσματος και Αναπαράσταση Αριθμών Κινητής Υποδιαστολής

Κεφάλαιο 14. οµές Ευρετηρίων για Αρχεία. ιαφάνεια 14-1

Σχεδίαση Βάσεων Δεδομένων. Χωρικές Βάσεις Δεδομένων και Μέθοδοι Προσπέλασης Μανώλης Μαραγκουδάκης

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ-ΕΙΣΑΓΩΓΗ

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Transcript:

Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα Κεφαλαίου Σκοπός: Η εισαγωγή σε τεχνικές εξόρυξης χωρικής γνώσης Εισαγωγή Επισκόπηση των χωρικών δεδοµένων Αρχές εξόρυξης χωρικής γνώσης Γενίκευση/ Εξειδίκευση Χωρικοί κανόνες Χωρική κατηγοριοποίηση Χωρική συσταδοποίηση 2 6.1

Χωρικό Αντικείµενο Περιγράφεται από χωρικά και µη χωρικά γνωρίσµατα. Σε αυτά µπορεί να περιλαµβάνεται κάποιος τύπος σχετικός µε θέση: Γεωγραφικό Μήκος και Πλάτος Ταχυδροµικός Κωδικός ιεύθυνση Η ανάκτηση του αντικειµένου θα πρέπει να είναι δυνατή µε χρήση χωρικών ή/και µη χωρικών γνωρισµάτων 3 Εφαρµογές Εξόρυξης Χωρικής Γνώσης Γεωλογία Συστήµατα Γεωγραφικών Πληροφοριών (GIS) Περιβαλλοντολογική Επιστήµη Γεωργία Ιατρική Ροµποτική Οπουδήποτε συνδυάζεται η χρονική µε τη χωρική διάσταση 4 6.2

Χωρικές Ερωτήσεις Η χωρική επιλογή µπορεί να χρησιµοποιεί ειδικές λειτουργίες σύγκρισης: Κοντά Βόρεια, Νότια, Ανατολικά, υτικά Περικλείεται από Επικαλύπτει/ Τέµνει Ερώτησηπεριοχής(εύρους) - βρες τα αντικείµενα που τέµνουν µια δοθείσα περιοχή στην ερώτηση. Ερώτησηπλησιέστερουγείτονα βρες αντικείµενα που είναι κοντά σε ένα συγκεκριµένο αντικείµενο. Σάρωσηαπόστασης βρες αντικείµενα εντός µιας προκαθορισµένης απόστασης από ένα συγκεκριµένο αντικείµενο, µε την απόσταση να αυξάνεται σταδιακά. 5 οµές Χωρικών εδοµένων οµές δεδοµένων που έχουν σχεδιαστεί ειδικά για την αποθήκευση ή τη δεικτοδότηση χωρικών δεδοµένων. Συχνά βασίζονται σε Β-δένδρα ή δυαδικά δένδρα αναζήτησης. Τα γειτονικά (χωρικά) αντικείµενα οµαδοποιούνται σε συστάδες στο δίσκο. Μπορούν να αναπαραστήσουν µια πολύπλοκη χωρική δοµή τοποθετώντας το χωρικό αντικείµενο στη δοµή ενός συγκεκριµένου γεωγραφικού σχήµατος. Τεχνικές: Τετραδικό δένδρο R-δένδρο k-d δένδρο 6 6.3

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.4

Τετραδικό ένδρο Ιεραρχική αποσύνθεση του χώρου σε τεταρτηµόρια (MBRs) Κάθε επίπεδο στο τετραδικό δένδρο αντιστοιχεί σε ένα από τα ιεραρχικά επίπεδα. Κάθε επίπεδο είναι µια πιο ακριβής αναπαράσταση του αντικειµένου. Ο αριθµός των απαιτούµενων επιπέδων εξαρτάται από την επιθυµητή ακρίβεια. 9 Παράδειγµα Τετραδικού ένδρου 10 6.5

R- ένδρο Όπως και στο τετραδικό δένδρο, κάθε επόµενο επίπεδο στο δένδρο δηλώνει µικρότερα ορθογώνια (MBRs). Κάθε επίπεδο µπορεί να περιλαµβάνει διαφορετικό πλήθος ορθογωνίων που είναι επίσης πιθανόν να διαφέρουν και στο µέγεθος. Τα κελιά µπορεί να επικαλύπτονται. Το κελί του χαµηλότερου επιπέδου περιέχει ένα µόνο αντικείµενο. Το δένδρο συντηρείται από αλγορίθµους παρόµοιους µε αυτούς που υπάρχουν για τα Β-δένδρα. 11 Παράδειγµα R- ένδρου 12 6.6

K-D ένδρο Σχεδιάστηκε για να δεικτοδοτήσει δεδοµένα µε πολλά γνωρίσµατα και όχι απαραίτητα χωρικά δεδοµένα. Παραλλαγή του δυαδικού δένδρου αναζήτησης. Κάθε επίπεδο χρησιµοποιείται για να δεικτοδοτήσει µια από τις διαστάσεις του χωρικού αντικειµένου. Κάθε κελί του κατώτατου επιπέδου έχει ένα µόνο αντικείµενο εντός του. Οι διαιρέσεις δεν γίνονται µε χρήση MBR αλλά µε διαδοχικές διαιρέσεις του χώρου της διάστασης. 13 Παράδειγµα K-D ένδρου 14 6.7

Τοπολογικές Σχέσεις Ξένο Έχει επικάλυψη ή τέµνει Είναι ίσο Καλύπτεται από ή βρίσκεται εντός ή περιέχεται σε Καλύπτει ή περιέχει 15 Απόσταση µεταξύ Αντικειµένων Ευκλείδεια Manhattan Επεκτάσεις: 16 6.8

Προοδευτική Βελτίωση ίνει προσεγγιστικές απαντήσεις, προτού αναζητηθούν πιο ακριβείς. Φιλτράρει τα δεδοµένα που δεν είναι εφαρµόσιµα σε ένα πρόβληµα. Τα ιεραρχικά επίπεδα βασίζονται σε χωρικές συσχετίσεις. Τα κατηγορήµατα που εξάγονται βελτιώνονται αναδροµικά έως ότου βρεθούν οι ακριβείς απαντήσεις. 17 Προοδευτική Βελτίωση 18 6.9

Spatial Data Dominant Algorithm 19 STING STatistical Information Grid-based Χρησιµοποιεί µια ιεραρχική τεχνική για τη διαίρεση των χωρικών περιοχών σε ορθογώνια κελιά Κάθε κόµβος στη δοµή πλέγµατος συνοψίζει την πληροφορία για τα στοιχεία εντός της. Μπορεί να θεωρηθεί ως τεχνική ιεραρχικής συσταδοποίησης Παρόµοιο µε το τετραδικό δένδρο 20 6.10

STING 21 Ο Αλγόριθµος STING Build 22 6.11

Ο Αλγόριθµος STING 23 Χωρικοί Κανόνες Κανόνας χωρικού χαρακτηριστικού Στο Dallas το µέσο οικογενειακό εισόδηµα είναι $50,000. Κανόνας χωρικού διαχωρισµού Στο Dallas το µέσο οικογενειακό εισόδηµα είναι $50,000, ενώ στο Plano είναι $75,000. Κανόνας χωρικής συσχέτισης Στο Dallas το µέσο οικογενειακό εισόδηµα για οικογένειες που ζουν κοντά στη White Rock Lake είναι $100,000. 24 6.12

Κανόνες Χωρικών Συσχετίσεων Είτε το πρότερο είτε το απότοκο του κανόνα πρέπει να περιέχει κάποια χωρικά κατηγορήµατα (π.χ. κοντά) Η βάση που εξετάζεται θεωρείται ως ένα σύνολο από χωρικά αντικείµενα. Οι κανόνες µπορούν να δηµιουργηθούν χρησιµοποιώντας τεχνικές προοδευτικής βελτίωσης. 25 Αλγόριθµος Κανόνων Χωρικών Συσχετίσεων 26 6.13

Χωρική Κατηγοριοποίηση Στοχεύει στη διαµέριση συνόλων χωρικών αντικειµένων Μπορεί να γίνει κατηγοριοποίηση µε χρήση µη χωρικών ή/ και χωρικών γνωρισµάτων. Τεχνικές γενίκευσης και προοδευτικής βελτίωσης µπορούν να χρησιµοποιηθούν. 27 Επέκταση του ID3 Γράφος Γειτνίασης Κόµβοι αντικείµενα Ακµές συνδέουν γείτονες Ο ορισµός του «γείτονα» ποικίλει. Μπορεί να οριστεί βάσει οποιασδήποτε συσχέτισης µεταξύ των χωρικών αντικειµένων. Ο ID3 θεωρεί για σκοπούς κατηγοριοποίησης τα µη χωρικά γνωρίσµατα όχι µόνο του αντικείµενου-στόχου αλλά και των γειτονικών αντικειµένων. 28 6.14

ένδρο Χωρικής Απόφασης Παρόµοια προσέγγιση µε αυτή που χρησιµοποιείται στους κανόνες χωρικών συσχετίσεων. Βασίζεται στο ότι τα χωρικά αντικείµενα µπορούν να περιγραφούν βάση των αντικειµένων που είναι κοντά σε αυτά ΕνδιάµεσηΖώνη. Περιγραφή των κλάσεων βασισµένη σε µια συνάθροιση των πιο σχετικών κατηγορηµάτων για κοντινά αντικείµενα. 29 Ο Αλγόριθµος του ένδρου Χωρικής Απόφασης 30 6.15

Χωρική Συσταδοποίηση Εντοπίζουν συστάδες από διαφορετικά σχήµατα. Ένας αλγόριθµος που δουλεύει χρησιµοποιώντας κέντρα βάρους και απλές µετρήσεις απόστασης πιθανόν δεν θα είναι σε θέση να αναγνωρίζει ασυνήθιστα σχήµατα. Οι συστάδες που ανακαλύπτονται πρέπει να είναι ανεξάρτητες της σειράς µε την οποία εξετάστηκαν τα σηµεία στο χώρο. 31 Χωρική Συσταδοποίηση 32 6.16

Επεκτάσεις του CLARANS Προσέγγιση χωρίς την παραδοχή για την κύρια µνήµη του CLARANS. Χρήση τεχνικών χωρικής δεικτοδότησης. Χρήση δειγµατοληψίας και R*-δένδρου ώστε να βρεθούν κεντρικά αντικείµενα. Βελτίωση του τρόπου υπολογισµού του κόστους αλλαγής ενός medoid, εξετάζοντας µόνο τα αντικείµενα στις δυο συστάδες που επηρεάζονται. ιάγραµµα Voronoi 33 Voronoi 34 6.17

SD(CLARANS) Spatial Dominant (Χωρικής Τάξης). Αρχικά συσταδοποιεί τις χωρικές συνιστώσες χρησιµοποιώντας τον CLARANS. Στη συνέχεια, εξετάζει τα µη χωρικά γνωρίσµατα εντός κάθε συστάδας. Χρησιµοποιεί γενίκευση. Χρησιµοποιεί κάποιο εργαλείο µάθησης (όπως το DBLEARN) για να εξάγει την περιγραφή της συστάδας. 35 Ο Αλγόριθµος SD(CLARANS) 36 6.18

DBCLASD Επέκταση του αλγορίθµου DBSCAN Distribution Based Clustering of LArge Spatial Databases (συσταδοποίηση µεγάλων βάσεων χωρικών δεδοµένων βασισµένη σε κατανοµές) Υποθέτει ότι τα στοιχεία εντός µιας συστάδας είναι οµοιόµορφα κατανεµηµένα. Επιχειρεί να προσδιορίσει την κατανοµή που ικανοποιείται από τις αποστάσεις µεταξύ πλησιέστερων γειτόνων. Στοιχεία προστίθενται στη συστάδα, όσο το σύνολο των πλησιέστερων βάσει της απόστασης γειτόνων ικανοποιεί την υπόθεση της οµοιόµορφης κατανοµής. 37 Ο Αλγόριθµος DBCLASD 38 6.19

Συναθροιστική Εγγύτητα ΣυναθροιστικήΕγγύτητα το µέτρο του πόσο κοντά είναι µια συστάδα (ή οµάδα από στοιχεία) σε ένα χαρακτηριστικό (ή σε ένα αντικείµενο στο χώρο) Η σχέση συναθροιστικής εγγύτητας βρίσκει τα κ κοντινότερα χαρακτηριστικά σε µια συστάδα. Ο αλγόριθµός CRH χρησιµοποιεί διαφορετικά σχήµατα: Περικλείοντα κύκλο Ισοθετικό ορθογώνιο Κυρτό περίβληµα 39 CRH 40 6.20