Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr
Μηχανική Μάθηση (Machine learning) Μέθοδος εκπαίδευσης των υπολογιστών να κάνουν (και να βελτιώνουν) προβλέψεις (ή συμπεριφορές) από δεδομένα. Δώσε δεδομένα στον υπολογιστή, να μάθει κάποιες τάσεις (trends) ώστε να μπορεί να κάνει προβλέψεις βασισμένος σε νέα δεδομένα
Δεδομένα?? Μπορεί να είναι οτιδήποτε Παγκόσμιος Ιστός, Βιολογία, Περιβαλλοντικά δεδομένα, Δεδομένα πωλήσεων κλπ
π.χ. Μεγάλος Όγκος Τηλεπισκοπικών Δεδομένων the size of the Climate Change data repositories alone are projected to grow to nearly 350 Petabytes by 2030
Δεδομένα Τηλεπισκόπησης Big Data (3V s) Όγκος δεδομένων (Volume) Ταχύτητα (Velocity) Ποικιλία : metadata, κλίμακες, προβολές, εικόνες, Radar, Lidar (Variety)
Ο μεγάλος όγκος πληροφορίας ευνοεί την εξόρυξη γνώσης με μηχανική μάθηση.
Επιβλεπόμενη Μάθηση Στο διάνυσμα εισόδου x αντιστοιχεί έξοδος y Ταξινόμηση (classification, y :κατηγορία) Παλινδρόμηση (regression, y: αριθμός )
Μη επιβλεπόμενη Μάθηση Δημιουργία εσωτερικών αναπαραστάσεων των εισόδων Ομαδοποίηση (Clustering) Επιθυμητή! (να έχεις ερμηνευμένα δεδομένα είναι δύσκολο και ακριβό)
Τεχνητά Νευρωνικά Δίκτυα Πρόκειται για συστήματα επεξεργασίας πληροφοριών (υπολογιστικά συστήματα), που η δομή τους και η λειτουργία τους εμπνέονται από τις τρέχουσες γνώσεις μας για τα βιολογικά νευρικά συστήματα
Βιολογικό Νευρωνικό Δίκτυο
Νευρώνας Σώμα Άξονας Συνάψεις Η μετάδοση σημάτων μεταξύ των νευρώνων είναι χημικής φύσεως
Νευρώνιο: Επεξεργαστικό στοιχείο x 1 Συναπτικά Βάρη x 2 W 1 W 2 Αθροιστικός Κόμβος Σ Μη γραμμική Συνάρτηση F Απόκριση Y W N Υ=F(Σw i X i ) x N
Αρχιτεκτονικές ΤΝΔ x 3 x 2 w ij y 2 y 1 Μονοστρωματικά πρόσω διάδοσης Recurrent Πλέγματα x 1 Πολυστρωματικό πρόσω διάδοσης
Χαρακτηριστικά των ΤΝΔ Κατανεμημένη επεξεργασία Εύρωστη επεξεργασία Υψηλός βαθμός παραλληλίας Μη γραμμικότητα
Ικανότητα εκμάθησης Από παραδείγματα όχι προγραμματιστικούς κανόνες Εκμάθηση: αλγοριθμική τροποποίηση των συναπτικών βαρών. Ικανότητα γενίκευσης
Είδη Εκμάθησης Εκμάθηση υπό επίβλεψη: Άμεση σύγκριση των αποκρίσεων του ΤΝΔ με συγκεκριμένες γνωστές αποκρίσεις που θεωρούνται σωστές. Η μάθηση αποσκοπεί στην ταύτιση των αποκρίσεων του δικτύου με τις σωστές αποκρίσεις Εκμάθηση χωρίς επίβλεψη: Δεν υπάρχουν a priori σωστές αποκρίσεις. Το δίκτυο καλείται να ομαδοποιήσει τα δεδομένα που του δίνονται βάσει των μεταξύ τους συσχετίσεων
Δίκτυα error back propagation x 3 w ij y 2 Για κάθε πρότυπο p: Στόχοι Τ ip Συνάρτηση σφάλματος: Ε(w) = Σ (Τ ip -y ip ) 2 x 2 x 1 y 1 Ελαχιστοποίηση με επαναληπτικές τεχνικές βελτιστοποίησης (π.χ. gradient descent και πλήθος άλλων)
Αυτο-οργανούμενοι Χάρτες ΕΚΠΑΙΔΕΥΣΗ Υπολογισμός του κόμβου -νικητή Αλλαγή των βαρών του κόμβου-νικητή και των γειτονικών του.
g 1 1 2 g 2 g n n
Ταξινόμηση σε τύπους εδαφoκάλυψης Με Ομαδοποίηση με Self Organizing Maps
Πολυφασματικές εικόνες 1 2 n 100 34 35 56 89 45 80 67 87 98 200 50 100 70 65 76 87 54 76 98 40 56 67 58 20 70 60 50 23 34 25 87 54 23 40 10 46 90 54 26 72 54 59 30 54 45 87 55 23 0 0 0 1 1 1 1 0 0 0 1 1 2 2 3 3 3 3 1 1 1 2 2 2 2 3 3 3 2 2 2 1 1 1 1 1 2 3 1 2 3 1 2 3 1 2 3 1 2 Θεματικός Χάρτης Ταξινόμηση φασματικών υπογραφών
Ταξινομητές Back-propagation-BP LVQ Αυτο-οργανούμενοι χάρτες (SOM) Ασαφής ISODATA k-nn Μεγίστουελαχίστου Στατιστικός ISODATA Επιβλεπόμενοι Μη επιβλεπόμενοι
ΤΑΞΙΝΟΜΗΤΕΣ Νευρωνικoί Ασαφείς Στατιστικοί Πολυτμηματικός ταξινομητής
Εφαρμογή : Εκτίμηση αλλαγών εδαφοκάλυψης με χρήση Νευρωνικών Δικτύων Δεδομένα: Πολυφασματικές εικόνες Landsat των τελευταίων 30 χρόνων Περιοχή Μελέτης: Ζάκυνθος
ΖΑΚΥΝΘΟΣ-Εκπαιδευτικά πεδία
Κάλυψης γης Ζακύνθου Landsat 1984-2011
Εφαρμογή : Εντοπισμός κτιρίων Αστικής Περιοχής Δεδομενα : RGB Lidar
Αρχιτεκτονική Βack Propagation ΝΔ 1o κρυφό επίπεδο : 20 νευρώνια 2 ο κρυφό επίπεδο : 10 νευρώνια Επίπεδο εξόδου 1 νευρώνιο kappa coefficient Overall Accuracy 0.7770 0.8992
Εντοπισμός καμένων εκτάσεων Διασυνοριακή περιοχή Πρεσπών
Πιλοτική Περιοχή Λίμνη Βεγορίτιδα
ΕΚΤΙΜΗΣΗ ΜΕΤΑΒΟΛΩΝ
Ποσοτική ανάλυση αλλαγών Συρρίκνωση της επιφάνειας της λίμνης κατά 20.3 km². 1214 στρέμματα σε αγροτικές καλλιέργειες
Μηχανές Διανυσματικής Υποστήριξης Support Vector Machine (SVM) Αναζητά την διαχωριστική επιφάνεια ανάμεσα σε 2 κατηγορίες με τον καθορισμό ενός υποσυνόλου των εκπαιδευτικών πεδίων (Support Vectors) που περιγράφουν καλύτερα το όριο μεταξύ τους SVM χρησιμοποιεί kernel ώστε να δημιουργήσει προβολές του αρχικού χώρου χαρακτηριστικών σε περισσότερων διαστάσεων χώρους όπου ο διαχωρισμός των κλάσεων θα είναι γραμμικός
SVM Original and Projected Feature Space
SVM Αποτελέσματα RGB Lidar Buildings Non-Buildings
Αποτελέσματα με μη επιβλεπόμενες Τεχνικές VALIDATION AREA GROUND TRUTH SOM MEAN SHIFT
EOLISA (eoli.esa.int)
Χρήσιμα και Ελεύθερα Λογισμικά Orfeo Toolbox ( Monteverdi) WEKA (machine learning ) Beam Visat Sentinel Toolbox Octave
Θέματα Πρακτικών /Διπλωματικών / Μεταπτυχιακών Επεξεργασία τηλεπισκοπικών δεδομένων Ανίχνευση μεταβολών εδαφοκάλυψης Μελέτη χρονοσειρών (εδαφική υγρασία, αλατότητα ωκεανών) Εφαρμογές μεθόδων μηχανικής μάθησης