Ορισμός και παραδείγματα χωρικοποίησης Επεξεργασία των δεδομένων προς χωρικοποίηση Τεχνικές χωρικοποίησης δεδομένων Σημασία των χαρτογραφικών εννοιών στην χωρικοποίηση Εφαρμογές 3/20/2014 2
Δυο ορισμοί Ορισμός 1 ος : Κατά Kuhn και Blumenthal (1996) «Η χωρικοποίηση είναι η διαδικασία κατά την οποία, αφηρημένοι χώροι πληροφορίας απεικονίζονται στο φυσικό χώρο με τη βοήθεια χωρικών μεταφορών.» 3/20/2014 3
3/20/2014 4
Σημεία του τοπογραφικού χάρτη Υψόμετρο Απόσταση Κορυφές Βουνά/λόφοι Έγγραφα ή σημεία της επιφάνειας παρεμβολής Πλήθος εγγράφων με όμοιο θέμα Σημασιολογική ομοιότητα μεταξύ θεμάτων εγγράφων Μεγαλύτερη πυκνότητα εγγράφων με συγκεκριμένο θέμα Κατηγορίες εγγράφων με θέμα την κορυφή του βουνού/λόφου (Προσανατολισμός του χάρτη: άνευ σημασίας, αρκεί να διατηρούνται οι σχετικές αποστάσεις ) 3/20/2014 5
Ορισμός 2 ος : Κατά Skupin και Buttenfield (1997) «Η χωρικοποίηση είναι η διαδικασία εκείνη που απεικονίζει πολυδιάστατη πληροφορία, σε χώρο περιορισμένων διαστάσεων.» 3/20/2014 6
3/20/2014 7
Σημεία της απεικόνισης Απόσταση Χρώμα Αυτοκίνητα Ομοιότητα μεταξύ των χαρακτηριστικών των αυτοκινήτων Ομάδα όμοιων αυτοκινήτων (Άξονες της απεικόνισης: άνευ σημασίας, αρκεί να διατηρούνται οι σχετικές αποστάσεις μεταξύ σημείων) 3/20/2014 8
ποικίλης μορφής: κείμενα, στατιστικά δεδομένα, περιεχόμενα βάσεων δεδομένων, σελίδες διαδικτύου, κτλ => Ανάγκη μετασχηματισμού σε στάνταρ δομημένη μορφή πολυδιάστατα: συνήθως, ο αριθμός των χαρακτηριστικών (διαστάσεων) τους ξεπερνούν κατά πολύ τα 3. => Ανάγκη εύρεσης τεχνικής μείωσης των διαστάσεων τους. 3/20/2014 9
Τα δεδομένα συγκεντρώνονται σε πίνακα δεδομένων Στήλες πίνακα = χαρακτηριστικά των δεδομένων ή μεταβλητές Γραμμές πίνακα = περιπτώσεις συνδυασμού χαρακτηριστικών 3/20/2014 10
3/20/2014 11
Ονομαστικός: {Ben Hur, Star Wars, Dinosaur} Ταξινομημένος: <Young, Middle-Aged, Old> Ποσοτικός: [-1.000.000, 1.000.000] 3/20/2014 12
Ποσοτικός <-> Ταξινομημένος: [-1.000.000, 1.000.000] <-> <very cheap, cheap, expensive, very expensive> Ονομαστικός <-> Ταξινομημένος: {Ben Hur, Star Wars, Dinosaur} <-> <Ben Hur, Dinosaur, Star Wars> Ποσοτικός <-> Ονομαστικός: [0,1] <-> {Οn, Off} 3/20/2014 13
PCA (Principal Component Analysis) ή Ανάλυση των κύριων συνιστωσών MDS (Multidimensional Scaling) SOM (Self-Organized Map) ή Αυτοοργανούμενος χάρτης Benediktine Spaces 3/20/2014 14
Σκοπός: η μείωση των διαστάσεων των δεδομένων. Διατήρηση των ομάδων δεδομένων. Στηρίζεται στο γραμμικό συνδυασμό των αρχικών μεταβλητών (μικρότερο σύνολο νέων & ασυσχέτιστων μεταβλητών) Κύριες συνιστώσες = νέες μεταβλητές 3/20/2014 15
Μετασχηματίζουμε τα δεδομένα βάσει του πίνακα διασποράς και των ιδιοδιανυσμάτων του: Υ i = A(Χ i - μ X ) X i : διάνυσμα δεδομένων i μ X : ο μέσος του διανύσματος των δεδομένων A: πίνακας του οποίου οι γραμμές αποτελούνται από τα ιδιοδιανύσματα του πίνακα διασποράς Y i : μετασχηματισμένο διάνυσμα i 3/20/2014 16
Η διεύθυνση τους αντιστοιχεί στις διευθύνσεις κατά τις οποίες μεταβάλλονται περισσότερο τα δεδομένα. Από το σύνολο των ιδιοδιανυσμάτων, κρατάμε μόνο αυτά που αντιστοιχούν στις μεγαλύτερες ιδιοτιμές (λ i.100/σλ i > 75%), χωρίς απώλεια σημαντικού ποσού πληροφορίας. 3/20/2014 17
Κύρια συνιστώσα Μετά την προβολή Τα δεδομένα μεταβάλλονται κυρίως κατά τη διεύθυνση του πρώτου ιδιοδιανύσματος (που αντιστοιχεί στην πρώτη ιδιοτιμή). Η απεικόνιση επιδέχεται απλοποίηση χωρίς να συνεπάγεται απώλεια πολύτιμης πληροφορίας. 3/20/2014 18
Ταξινόμηση των Δήμων της Ελλάδας σύμφωνα με τα κοινωνικά και οικονομικά χαρατκηριστικά τους (απογραφή 2001), Καμαριανάκης, Κοντός (2001) 3/20/2014 19
Απεικονίζει πολυδιάστατα δεδομένα σε δισδιάστατο ή τρισδιάστατο χώρο Η σχετική θέση των δεδομένων στο χώρο απεικόνισης είναι ανάλογη της ομοιότητας των δεδομένων Προϋπόθεση = ορισμός μέτρου ομοιότητας 3/20/2014 20
Μέτρηση ομοιότητας τύπου απόσταση Γενικευμένη Ευκλείδεια απόσταση d ij = Σ(x ia - x ja ) 2 X ia και x ja = προβολές (συντεταγμένες) των σημείων στη διάσταση a (a=1,2,,n). Μέτρηση ομοιότητας τύπου ταίριασμα 1. Π.χ. Α, Β αλφαριθμητικά, A= name, B= names Αποτέλεσμα σύγκρισης Α και Β = [11110] 2. Π.χ. A, B κλάσεις, Α(α,β,γ,δ), Β(β,α,ε,ζ,η,θ) Αποτέλεσμα σύγκρισης Α και Β = [11000000] S 1 A/B= (Αρ. επιτυχημένων ταιριασμάτων / Αρ. Συγκρίσεων) = 4/5 = 0.8 S 2 A/B= (Αρ. επιτυχημένων ταιριασμάτων / Αρ. χαρακτηριστικών) = 2/8 = 0.25 3/20/2014 21
Πίνακας συμμετρικός του οποίου κάθε στοιχείο Σ(i, j), αντιστοιχεί στο αποτέλεσμα της σύγκρισης των δεδομένων i και j. Βουνό Λόφος Ποτάμι Κοιλάδα Παράδειγμα Βουνό Λόφος Ποτάμι Κοιλάδα 1 0.9 0.01 0.2 0.9 1 0.02 0.3 0.01 0.02 1 0.03 0.2 0.3 0.03 1 3/20/2014 22
Ο πίνακας σύγκρισης ορίζει ταυτόχρονα και τις αποστάσεις των σημείων στο χώρο της απεικόνισης. Ομοιότητα = αντιστρόφως ανάλογη της απόστασης Παράγοντας Stress = βαθμός προσέγγισης των σημείων στις αποστάσεις που ορίζει εμμέσως ο πίνακας σύγκρισης. Παράγοντας Stress = f(σ(x Σ ij xτ ij ), Σ(yΣ ij yτ ij )) 3/20/2014 23
1. Αποδίδουμε αρχικά τυχαίες θέσεις στα σημεία. 2. Υπολογίζουμε όλες τις αποστάσεις μεταξύ των σημείων και τις καταχωρούμε σε προσωρινό πίνακα, έστω Τ (n x n). 3. Συγκρίνουμε τις τιμές του πίνακα Τ με αυτές του πίνακα σύγκρισης Σ, υπολογίζοντας παράλληλα την τιμή του παράγοντα Stress. Όσο μικρότερη είναι η τιμή αυτή, τόσο καλύτερη προσέγγιση έχουμε πετύχει. 4. Προσαρμόζουμε τις συντεταγμένες κάθε σημείου προς την κατεύθυνση εκείνη που μειώνει το Stress. 5. Επαναλαμβάνουμε τα βήματα 2, 3 και 4, μέχρις ότου παρατηρήσουμε ότι δεν μειώνεται άλλο η τιμή του Stress. 3/20/2014 24
38 είδη αυτοκινήτων 7 χαρακτηριστικά: Την χώρα παραγωγής (manufacturer country), Τα μίλια ανά γαλόνι (miles per gallon), Το βάρος (weight), (Drive ratio in the highest gear), Την ιπποδύναμη (horsepower), (engine displacement in cubic inches), Τον αριθμό κυλίνδρων (number of cylinder). 3/20/2014 25
Πίνακας δεδομένων: 3/20/2014 26
3/20/2014 27
Εφαρμογή της θεωρίας των νευρωνικών δικτύων Αναπτύχθηκε από τον Teuvo Kohonen στη αρχή της δεκαετίας του 1980. 3/20/2014 28
Συνίσταται σε ένα δισδιάστατο πίνακα «νευρώνων», έστω M = {m 1,, m pxq } Οι νευρώνες, έστω m i = [m i1,, m in ]: Αναφέρονται ως μονάδες ή στοιχεία επεξεργασίας. Έχουν τις ίδιες διαστάσεις με τα διανύσματα εισόδου. Ο αριθμός τους είναι εξαρχής γνωστός και προσδιορίζουν την ανάλυση (resolution) του χάρτη. 3/20/2014 29
Πιθανές τοπολογίες νευρώνων: Ορθογώνια Τοπολογία Εξαγωνική Τοπολογία 3/20/2014 30
Γειτονιές νευρώνων διαφόρων μεγεθών : 3/20/2014 31
Η αρχικοποίηση του SOM γίνεται: τυχαία. βάσει δειγμάτων από τα δεδομένα. Με γραμμική αρχικοποίηση (βάσει των τιμών των ιδιοδιανυσμάτων). 3/20/2014 32
Επαναληπτική διαδικασία με σκοπό τη μύηση των νευρώνων του SOM στα διανύσματα εισόδου. Σε κάθε επανάληψη, συγκρίνεται ένα από τα διανύσματα εισόδου, με όλους τους νευρώνες του SOM. Ο νευρώνας, ο περισσότερο όμοιος προς το διάνυσμα εισόδου, επιλέγεται νικητής και χαρακτηρίζεται ως η πιο ταιριαστή μονάδα (BMU-Best Matching Unit). Ενημερώνεται η BMU έτσι ώστε να πλησιάσει περισσότερο το διάνυσμα εισόδου. Ενημερώνονται οι νευρώνες στη γειτονιά της BMU. 3/20/2014 33
Ενημέρωση της BMU και της γειτονιάς της. 3/20/2014 34
Οι αποστάσεις μεταξύ νευρώνων μπορούν να απεικονιστούν με αποχρώσεις του γκρι μεταξύ γειτονικών νευρώνων. Η αναπαράσταση ενός SOM με τον τρόπο αυτό, αναφέρεται ως U-matrix (Unified distance matrix). Η σκούρα απόχρωση μπορεί να χρησιμοποιηθεί για το συμβολισμό μεγάλων αποστάσεων μεταξύ δεδομένων, ενώ η ανοιχτή, για τις κοντινές αποστάσεις. Η μέθοδος U-matrix είναι πολύ χρήσιμη κατά την ομαδοποίηση δεδομένων σε ομάδες που δεν είναι εκ των προτέρων γνωστές. 3/20/2014 35
3/20/2014 36
Απεικονίζει τα δεδομένα σε τρισδιάστατο χώρο σε συγκεκριμένη θέση και με συγκεκριμένη εμφάνιση. Ο Benedikt, ορίζει τις εγγενείς (intrinsic) και τις εξωγενείς (extrinsic) διαστάσεις του χώρου. Οι εξωγενείς διαστάσεις αντιστοιχούν σε συντεταγμένες στο χώρο απεικόνισης. Οι εγγενείς διαστάσεις αντιστοιχούν στις οπτικές μεταβλητές του Bertin (σχήμα, μέγεθος, χρώμα, μοτίβο, κτλ). 3/20/2014 37
3/20/2014 38
Η χαρτογραφία έχει αναπτύξει πλήθος μεθόδων και τεχνικών για την επεξεργασία και απόδοση των γεωγραφικών πληροφοριών. Η υπάρχουσα τεχνογνωσία, θα μπορούσε να χρησιμοποιηθεί στην χωρικοποίηση. 3/20/2014 40
Απόσταση Προβολή Γενίκευση 3/20/2014 41
Πρώτος νόμος της Γεωγραφίας: «Everything is related to everything else, but closer things are more closely related» (Waldo Tobler) Επέκταση του νόμου αυτού σε μη γεωγραφικές πληροφορίες. Η απόσταση μεταξύ μη γεωγραφικών πληροφοριών είναι ανάλογη της, κατά μια έννοια, ομοιότητάς τους. 3/20/2014 42
Τα μη γεωγραφικά δεδομένα είναι συνήθως πολυδιάστατα και δεν μπορούν να γίνουν άμεσα αντιληπτά από τον άνθρωπο. Χρειάζεται η μείωση των διαστάσεων που υλοποιείται με την προβολή σε χώρο με περιορισμένο αριθμό διαστάσεων. Απαραίτητη είναι η διατήρηση των σχέσεων (ομοιότητας) μεταξύ των απεικονιζόμενων δεδομένων. Τεχνικές προβολής: PCA, MDS, SOM, κτλ 3/20/2014 43
Η μείωση των διαστάσεων μοιάζει με τη δυσκολία που αντιμετωπίζουν οι χαρτογράφοι κατά την προβολή του τρισδιάστατου γεωγραφικού χώρου στο δισδιάστατο χώρο (χαρτί ή οθόνη). Παραδείγματα: Ολόκληρη η επιφάνεια της γης προβάλλεται σε δισδιάστατη επιφάνεια. Το ανώμαλο ανάγλυφο προβάλλεται σε χώρο δυόμισι διαστάσεων. 3/20/2014 44
Συνέπεια της προβολής: οι παραμορφώσεις. Στην χαρτογραφία: πιθανή παραμόρφωση του εμβαδού ή (και) των γωνιών. Παραδείγματα: Μερκατορική προβολή: διατηρεί τις γωνίες, όχι τα εμβαδά -> προτιμάται στους χάρτες πλοήγησης, αλλά όχι στους θεματικούς χάρτες. Προβολή Peters: διατηρεί τα εμβαδά, όχι τις γωνίες. Παραμορφώσεις προβλέψιμες και υπολογίσιμες. 3/20/2014 45
Στην χωρικοποίηση: πιθανή παραμόρφωση των τοπολογικών σχέσεων ή (και) των αποστάσεων. Παραδείγματα: MDS: διατηρεί τις σχετικές αποστάσεις, όχι τις τοπολογικές σχέσεις. SOM: τείνει να διατηρήσει τις τοπολογικές σχέσεις, όχι τις αποστάσεις. Παραμορφώσεις: (σχεδόν πάντα) μη προβλέψιμες και μη υπολογίσιμες. 3/20/2014 46
Σκοπός της: η διατήρηση της ευκρίνειας και της λειτουργικότητας ενός χάρτη, με την προσαρμογή των συμβόλων, κατά την αλλαγή της κλίμακας. Πρόβλημα, ο προσδιορισμός Του αριθμού των αναπαριστώμενων οντοτήτων, Των συμβόλων και του μεγέθους τους, Του μεγέθους της επιφάνειας οπτικοποίησης. 3/20/2014 47
Ο Friedrich Töpfer (1974), στην προσπάθειά του να ποσοτικοποιήσει το πρόβλημα, εφηύρε τον αριθμητικό τύπο: n F =n A (M A /M F ) n F, ο αριθμός των αναπαριστώμενων οντοτήτων στην τελική κλίμακα, n A, ο αριθμός των αναπαριστώμενων οντοτήτων στην αρχική κλίμακα, M A, ο παρονομαστής της κλίμακας του αρχικού χάρτη, M F, ο παρονομαστής της κλίμακας του τελικού χάρτη. 3/20/2014 48
Ο προηγούμενος τύπος χρησιμοποιήθηκε από τον χαρτογράφο André Skupin (1998) στην χωρικοποίηση εγγράφων σε δισδιάστατο χάρτη. Εφαρμόζοντας τη μέθοδο MDS, πήρε το ακόλουθο αποτέλεσμα (πρωτεύων χάρτης) 3/20/2014 49
3/20/2014 50
Από το βασικό χάρτη, με την ομαδοποίηση των περισσότερο όμοιων εγγράφων, προκύπτει η εξής ιεραρχική δεντρική δομή: 3/20/2014 51
Στην ιεραρχική δεντρική δομή: Τα φύλλα του δέντρου αντιστοιχούν στα έγγραφα που συμμετέχουν στο βασικό χάρτη. Τα έγγραφα ενώνονται για να συμμετέχουν στην ίδια ομάδα βάσει της απόστασής τους (χωρική και σημασιολογική) Κάθε καινούργια κλίμακα προκύπτει από την εφαρμογή του νόμου του Töpfer στην προηγούμενη. Τα επίπεδα γενίκευσης αντιστοιχούν σε οριζόντιες γραμμές στη δεντρική δομή. 3/20/2014 52
Για την οπτικοποίηση των αποτελεσμάτων, ο Scupin προτείνει 2 τρόπους: 1. Συγχώνευση των όμοιων εγγράφων με τη δημιουργία μεγαλύτερων κύκλων από τα μικρότερα. 2. Δημιουργία Thiessen πολυγώνων γύρω από τις σημειακές οντότητες και συγχώνευση των πολυγωνικών περιοχών. 3/20/2014 53
1 ος τρόπος γενίκευσης (1:50000): 3/20/2014 54
1 ος τρόπος γενίκευσης (1:100000): 3/20/2014 55
1 ος τρόπος γενίκευσης (1:250000): 3/20/2014 56
2 ος τρόπος γενίκευσης (1:50000): 3/20/2014 57
2 ος τρόπος γενίκευσης (1:100000): 3/20/2014 58
2 ος τρόπος γενίκευσης (1:250000): 3/20/2014 59
Χωρικοποίηση με τη μέθοδο MDS των κατοικημένων νησιών της Ελλάδας, Τομαή, Δάρρα, Κάβουρας, 2004 3/20/2014 60
Kavouras, Kokla, Tomai, 2003 3/20/2014 61
Οι αφηρημένες έννοιες παίρνουν μορφή και υπόσταση, με αποτέλεσμα να γίνονται πιο απτές και άμεσα αντιληπτές. Τα γεωμετρικά σχήματα και οι χωρικές διατάξεις απομνημονεύονται εύκολα από τον ανθρώπινο νου. Οι χωρικές μεταφορές συνδυάζονται εύκολα μεταξύ τους. Οι χωρικές διατάξεις οργανώνουν την πληροφορία στο χώρο, συσχετίζοντάς τη με συγκεκριμένη θέση. Γίνονται άμεσα αντιληπτοί οι περιορισμοί και οι δυνατότητες (affordances) που προσφέρει ένα χωρικοποιημένο περιβάλλον. 3/20/2014 62
Πιθανή σύγχυση του χρήστη Αναμφισβήτητο κόστος εκμάθησης 3/20/2014 63