ΕΡΓΑΣΤΗΡΙΟ 6 ο : Ταξινομήσεις εικόνων μη επιβλεπόμενη ταξινόμηση Μια από τις σημαντικότερες τεχνικές αυτοματοποιημένης ερμηνείας εικόνων, είναι η ταξινόμηση. Με τον όρο ταξινόμηση εννοείται η διαδικασία καταχώρισης κάθε εικονοστοιχείου της εικόνας σε κάποιο βιοφυσικό στοιχείο (π.χ. κάλυψη γης). Για κάθε εικονοστοιχείο δύο χαρακτηριστικά γνωρίζουμε (όπως γενικότερα και σε κάθε ψηφιδωτό αρχείο), τη χωρική θέση του εικονοστοιχείου και τη ραδιομετρική τιμή του (ποσοστό ανάκλασης της ηλιακής ακτινοβολίας σε αριθμητικές τιμές). Στις δορυφορικές εικόνες, κάθε εικονοστοιχείο χαρακτηρίζεται από n ραδιομετρικές τιμές, όπου n = αριθμός των φασματικών διαύλων (μπαντών) που έχει η εικόνα μας. Οι τιμές αυτές αποτελούν τη φασματική δομή του εικονοστοιχείου. Η ταξινόμηση Ψηφιακής Εικόνας (Digital Image classification) χρησιμοποιεί τη φασματική πληροφορία που αντιπροσωπεύεται από τους ψηφιακούς αριθμούς σε μία ή περισσότερες φασματικές ζώνες και επιχειρεί να ταξινομήσει κάθε μεμονωμένο εικονοστοιχείο βασισμένο σε αυτή την φασματική πληροφορία. Αυτός ο τύπος ταξινόμησης ονομάζεται αναγνώριση φασματικού μοτίβου (spectral pattern recognition). Σε κάθε περίπτωση, ο στόχος είναι να ταξινομήσουμε όλα τα εικονοστοιχεία στην εικόνα, σε συγκεκριμένες κατηγορίες ή θέματα (π.χ. νερό, δάσος κωνοφόρων, φυλλοβόλο δάσος, καλαμπόκι, σιτάρι) που έχουν καθοριστεί από το χρήστη. Η προκύπτουσα ταξινομημένη εικόνα αποτελείται από ένα μωσαϊκό εικονοστοιχείων, καθένα από τα οποία ανήκουν σε ένα συγκεκριμένο θέμα, και είναι ουσιαστικά ένας θεματικός "χάρτης" της αρχικής εικόνας. Όταν μιλάμε για κατηγορίες, θα πρέπει να γίνει διάκριση μεταξύ των κλάσεων της πληροφορίας και των φασματικών κλάσεων (information classes and spectral classes). Οι κατηγορίες πληροφοριών (ή βιοφυσικές κατηγορίες) είναι οι κατηγορίες αυτές του ενδιαφέροντος, που στην πραγματικότητα ο αναλυτής προσπαθεί να ταχτοποιήσει στην εικόνα, όπως τα διαφορετικά είδη καλλιεργειών, τους διαφορετικούς τύπους δασών ή είδη δένδρων, τις διαφορετικές γεωλογικές μονάδες ή τύπους πετρωμάτων. Οι φασματικές κατηγορίες είναι ομάδες εικονοστοιχείων που είναι ομοιόμορφα (ή σχεδόν παρόμοια) σε σχέση με τις τιμές φωτεινότητας τους στα διάφορα φασματικά κανάλια των δεδομένων (στατιστικά συσχετιζόμενες ραδιομετρικές τιμές). Ο στόχος είναι να γίνει αντιστοιχία μεταξύ των φασματικών κατηγοριών στα δεδομένα με τις βιοφυσικές κατηγορίες του ενδιαφέροντος. Ο χρήστης επιδιώκει να ομαδοποιήσει τα εικονοστοιχεία σε ομάδες (κλάσεις) ώστε να έχει μια πιο συνοπτική εικόνα για την περιοχή που μελετά. 39
Οι πιο γνωστές μέθοδοι ταξινόμησης είναι: 1. Ανελαστικοί ταξινομητές a. Μη επιβλεπόμενη ταξινόμηση (Unsupervised classification) b. Επιβλεπόμενη ταξινόμηση (Supervised classification) 2. Ελαστικοί ταξινομητές a. Ασαφής λογική ταξινόμηση υπο-εικονοστοιχείων b. Νεωρωνικά δίκτυα 3. Αντικειμενοστραφής ταξινόμηση (object oriented classification) Το ENVI, διαθέτει πολλές ρουτίνες για την αυτοματοποιημένη ταξινόμηση εικόνας, χρησιμοποιώντας επιβλεπόμενες ή αυτοματοποιημένες μεθόδους. Οι μέθοδοι αυτοί διαφοροποιούνται ως προς τα κριτήρια που χρησιμοποιούνται για τον προσδιορισμό των ορίων αποφάσεων για το αν ένα pixel ανήκει σε κάποια κλάση ή όχι. Ανεξάρτητα της μεθόδου Πρώτα υπολογίζεται ένα πλήθος στατιστικών πληροφοριών για κάθε περιοχή ή τάξη. Έπειτα χρησιμοποιώντας τα στατιστικά αυτά, και όρια εμπιστοσύνης που καθορίζει ο χρήστης, το λογισμικό εξάγει τις φασματικές τιμές καθενός εικονοστοιχείου και καθορίζει τη θέση του στο n- διάστατο χώρο ταξινόμησης. Η διαδικασία αυτή συχνά συμπεριλαμβάνει τον υπολογισμό και την εκτίμηση της ομοιότητας που χρησιμοποιείται για συμπεριληφθεί κάθε pixel σε πιθανές κλάσεις. Τα όρια εμπιστοσύνης χρησιμοποιούνται για να καθορίσει ο χρήστης ποια pixel είναι αδύνατο να ταξινομηθούν σε κάποια κατηγορία. Οι απλούστερες μέθοδοι ταξινόμησης του ENVI, είναι οι μη επιβλεπόμενες Iso-Data και K-Means. Αυτές οι μέθοδοι δεν απαιτούν προηγούμενη γνώση για της περιοχής που αποτυπώνεται στην εικόνα. Χρησιμοποιούν πληροφορίες από την ίδια την εικόνα για να καθορίσουν φασματικές ομάδες, που μεταφράζονται ως κλάσεις. Η μέθοδος IsoData, απαιτεί από τον χρήστη να προκαθορίσει ένα εύρος κλάσεων, και έπειτα χρησιμοποιεί διαίρεση, συγχώνευση και διαγραφή για να καθορισθεί ο τελικός αριθμός των κλάσεων. Η μέθοδος K-Means, απαιτεί από το χρήστη να καθορίσει επακριβώς το πλήθος των κλάσεων που επιθυμεί. Και οι δύο μέθοδοι, γενικά θα ταξινομήσουν όλα τα εικονοστοιχεία της εικόνας, αλλά υπάρχει και η δυνατότητα να καθορισθούν όρια εμπιστοσύνης που θα χρησιμοποιηθούν για αφήσουν κάποια εικονοστοιχεία εκτός κλάσεων, δηλαδή αυτά δε θα ταξινομηθούν. Οι καθοδηγούμενες μέθοδοι ταξινόμησης του ENVI, απαιτούν την εισαγωγή πληροφοριών για τις προκαθορισμένες κλάσεις, πριν από την ταξινόμηση. Οι περιοχές εκπαίδευσης ROIs, χρησιμοποιούνται για να εισαχθούν αυτές οι πληροφορίες. Οι μέθοδοι καθοδηγούμενης ταξινόμησης συμπεριλαμβάνουν τις: Parallelepiped, Minimum Distance, Maximum Likelihood, Mahalanobis Distance, Binary Encoding & Neural Net. 40
5.1. Μη επιβλεπόμενη ταξινόμηση Ανοίγουμε την εικόνα Open Image File > Envi Tutorial Data > TM_image και την παρουσιάζουμε σε πραγματικά χρώματα ( True Color ). Στην συγκεκριμένη εργαστηριακή άσκηση θα πραγματοποιηθεί Μη Επιβλεπόμενη Ταξινόμηση. Αυτού του είδους η ταξινόμηση συνήθως την χρησιμοποιούμε ως προ-επεξεργασία για Επιβλεπόμενες ταξινομήσεις. Πριν από την έναρξη της ταξινόμησης θα δούμε τα στατιστικά της εικόνας. Για γίνει αυτό: 5.1.1 Basic Tools > Statistics > Compute Statistics. Από το παράθυρο που εμφανίζεται επιλέγουμε την εικόνα. Μόλις επιλεγεί η εικόνα στο δεξί μέρος του παραθύρου (File Information) εμφανίζονται πληροφορίες σχετικά με την εικόνα. Στην συνέχεια πατάμε οκ. Έπειτα θα εμφανιστεί το παράθυρο Compute Statistics Parameters. Επιλέγουμε το Histogram (Ιστόγραμμα) και το Covariance (Συνδιακύμανση) και οκ. Μόλις εμφανιστεί το παράθυρο Statistics Result, από την εντολή Select Plot επιλέγουμε τις μπάντες. Έτσι το διάγραμμα θα είναι της μορφής : Από το πίνακα που βρίσκετε κάτω από το διάγραμμα, το Correlation μου δείχνει την συσχέτιση των μπαντών. Διαλέγουμε τις μπάντες με την μικρότερη συσχέτιση. Παρατηρούμε πως από τις έξι μπάντες της εικόνας οι τρείς έχουν την μικρότερη συσχέτιση (δεν πλησιάζουν το 1). και αυτές είναι : η μπάντα 1, η μπάντα 4 και η μπάντα 5. Κλείνουμε το διάγραμμα. 41
5.1.2 Unsupervised classification - IsoData. Από το κύριο μενού του προγράμματος επιλέγουμε τη εντολή Classification, έπειτα, μη επιβλεπόμενη ταξινόμηση Unsupervised και στην συνέχεια τη μέθοδο που θα ακολουθήσουμε, για την συγκεκριμένη άσκηση ταξινόμηση με όμοιο cluster (συστάδα), άρα Iso Data. Η μέθοδος αυτή υπολογίζει ομάδες κλάσεων ομαλά κατανεμημένες στο χώρο των δεδομένων (clusters), με μια διαδικασία που περιλαμβάνει υπολογισμό κλάσης, συγκέντρωση εναπομεινάντων pixels, επαναπροσδιορισμό κλάσεων κ.ο.κ χρησιμοποιώντας την τεχνική των ελαχίστων αποστάσεων. Σε κάθε επανάληψη επαναϋπολογίζεται ο μέσος, και επαναταξινομούνται τα pixels σε σχέση με τους νέους μέσους. Η επαναλαμβανόμενη διαίρεση, συγχώνευση και διαγραφή των κλάσεων γίνεται με βάση τα όρια εμπιστοσύνης που θέτει ο χρήστης. Όλα τα εικονοστοιχεία ταξινομούνται στην κοντινότερη προς το καθένα κλάση, εκτός και εάν έχει καθορισθεί κάποια τιμή τυπικής απόκλισης ή όριο απόστασης, οπότε κάποια εικονοστοιχεία θα μείνουν αταξινόμητα εάν δεν πληρούν τα προκαθορισμένα κριτήρια. Επιλέγουμε από το παράθυρο που θα εμφανιστεί την εικόνα και πατάμε. Ανοίγουμε την εντολή Spectral Subject και επιλέγουμε τις μπάντες που είχαμε επιλέξει νωρίτερα. Όπως αναφέραμε παραπάνω, για να μειώσουμε το χρόνο και τον αποθηκευτικό χώρο που απαιτείται θα χρησιμοποιήσουμε τα κανάλια 1,4, και 5. Εδώ θα μπορούσαμε να εκτελέσουμε την ταξινόμηση χρησιμοποιώντας όλα τα κανάλια της εικόνας, σε άλλες όμως περιπτώσεις, όπου ο όγκος της εικόνας μπορεί να φτάσει εκατοντάδες Mb ή και Gb, ο περιορισμός των καναλιών στα απαραίτητα, είναι μια πολύ αποδοτική πρακτική. 42
Στο Available Band List θα είναι πλέον και το αρχείο ταξινομημένο. Το οποίο θα είναι της μορφής: Ας δούμε λίγο την ταξινόμηση μας. Συνδέστε δυναμικά τις δύο εικόνες (δορυφορική και ταξινομημένη) και δείτε τα αποτελέσματα. Παρατηρείστε την αστική και δασική ζώνη. Παρατηρείστε τις υδάτινες επιφάνειες. Στατιστικές Πληροφορίες για το αποτέλεσμα της ταξινόμησης μπορείτε να πάρετε από το κύριο μενού επιλέγοντας Classification > Post Classification > Class Statistics. Στο παράθυρο Classification Input File, δηλώστε το αρχείο με τα αποτελέσματα της ταξινόμησης που επιθυμείτε να εξετάσετε και πατήστε ΟΚ. Στο επόμενο παράθυρο που ανοίγει Statistics Input File, εφόσον δεν έχετε υπολογίσει προηγουμένως στατιστικά από το αρχείο ταξινόμησης, δώστε πάλι ακριβώς το ίδιο αρχείο. Στο επόμενο παράθυρο, το Class Selection επιλέξτε όλες τις κλάσεις δίνοντας το Select All Items και πατήστε ΟΚ. Το αποτέλεσμα περιέχεται στο Class Statistics Results. Στο κάτω τμήμα φαίνονται αναλυτικά τα αποτελέσματα της ταξινόμησης: αριθμός pixels ανά κλάση, ποσοστό % και επιφάνεια σε τετραγωνικά μέτρα. Εάν θέλετε να βλέπετε τις επιφάνειες κάθε κλάσεις σε κάποια άλλη μονάδα μέτρησης, μπορείτε να πατήσετε Options > Class Summary Area Units > Km 2. Εάν θέλετε να μεταφέρετε τα αποτελέσματα σε κάποια άλλη εφαρμογή μπορείτε να τα αντιγράψετε με click & drag. Filename: [Memory1] (512x512x1) Dims: Full Scene (262,144 points) Class Distribution Summary Unclassified: 0 points (0.000%) (0.0000 Meters²) Class 1: 30,897 points (11.786%) (27,807,300.0000 Meters²) Class 2: 19,723 points (7.524%) (17,750,700.0000 Meters²) Class 3: 31,762 points (12.116%) (28,585,800.0000 Meters²) Class 4: 38,444 points (14.665%) (34,599,600.0000 Meters²) Class 5: 42,768 points (16.315%) (38,491,200.0000 Meters²) Class 6: 38,716 points (14.769%) (34,844,400.0000 Meters²) Class 7: 32,012 points (12.212%) (28,810,800.0000 Meters²) Class 8: 27,822 points (10.613%) (25,039,800.0000 Meters²) Για να αποθηκεύσετε τα αποτελέσματα της στατιστικής ανάλυσης, για μελλοντική χρήση πατήστε File > Save all Class Results to ENVI Stats File. Για να κλείσετε το παράθυρο Class Statistics Results πατήστε File > Cancel. Επαναλάβετε την διαδικασία της μη καθοδηγούμενης ταξινόμησης έως ότου καταλήξετε σε αποτέλεσμα που σας ικανοποιεί. Για να αποθηκεύσετε το περιεχόμενο της μνήμης σε μόνιμο μέσο, από το Available Bands List, επιλέξτε το Memory#, κάντε δεξί κλικ και ζητήστε Save Selected File to Disk. 43
5.1.2 Unsupervised classification - Kmeans. Δοκιμάστε μόνοι σας, την ίδια διαδικασία με το Unsupervised > Kmeans. Αλλάξτε τον αριθμό των κλάσεων και τον αριθμό των επαναλήψεων (iterations). Η μη επιβλεπόμενη ταξινόμηση είναι μεν εύκολη διαδικασία (ουσιαστικά απαιτεί από τον αναλυτή να ορίσει μόνο τον αριθμό των φασματικών κλάσεων που επιθυμεί να διαιρεθεί το σύνολο των pixels της εικόνας) μαζί με κάποιο βαθμό στατιστικής ακρίβειας, αλλά χρειάζεται να ξέρουμε καλά την περιοχή μας για να αποφασίσουμε ή να μελετηθεί με εργασία πεδίου. 44