ΧΡΗΣΗ ΝΕΥΡΩΝΙΚΩΝ ΔΙΚΤΥΩΝ ΓΙΑ ΤΗΝ ΠΡΟΓΝΩΣΗ ΤΗΣ ΣΥΓΚΕΝΤΡΩΣΗΣ ΤΡΟΠΟΣΦΑΙΡΙΚΟΥ ΟΖΟΝΤΟΣ ΣΕ ΑΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Λυμπεροπούλου Κυριακή Α.Μ. 99
Ατμοσφαιρική ρύπανση Νέφος αιθαλομίχλης, που σχηματίζεται όταν έχουμε υψηλή συγκέντρωση ρύπων, όπως μονοξειδίου του άνθρακα, διοξείδιο του θείου και αιωρούμενα σωματίδια, σε συνδυασμό με σχετικά χαμηλή θερμοκρασία και μεγάλη σχετική υγρασία Φωτοχημικό νέφος, που παρουσιάζεται όταν έχουμε υψηλές θερμοκρασίες, μεγάλη ηλιοφάνεια σε ένταση και διάρκεια, μικρή σχετική υγρασία και υψηλή συγκέντρωση οξειδίων του αζώτου, υδρογονανθράκων, και δευτερογενών προϊόντων τους. Χαρακτηριστικός εκπρόσωπος φωτοχημικής ρύπανσης είναι το όζον (Ο 3 ).
Επιπτώσεις της ατμοσφαιρικής ρύπανσης Το όζον σε μεγάλες συγκεντρώσεις προκαλεί σημαντικά προβλήματα στην ανθρώπινη υγεία και το περιβάλλον όπου ζούμε. Υλικά Φυτά Ανθρώπινη υγεία
Όζον (Ο 3 ) Aέριο στοιχείο, άχρωμο µε χαρακτηριστική έντονη οσμή. Το Ο 3 αποτελεί το βασικό δείκτη φωτοχημικής ρύπανσης και η ποσοτική της αξιολόγηση βασίζεται στη μέτρηση της συγκέντρωσής του. Τυπικός δευτερογενής ρύπος. Οι βασικές μονάδες μέτρησης της συγκέντρωσης του όζοντος είναι σε ppb (μέρη ανά δισεκατομμύρια μέρη αέρα) και σε μg/m 3 (μικρογραμμάρια ουσίας ανά κυβικό μέτρο αέρα). Σε κανονικές συνθήκες 1ppb [O 3 ] είναι περίπου ίσο με 2 μg/m 3.
Η προέλευση του όζοντος της τροπόσφαιρας Η ύπαρξη του όζοντος στην τροπόσφαιρα οφείλεται: στη μεταφορά στρατοσφαιρικού όζοντος, στην παραγωγή του από πρωτογενείς ρύπους, καθώς σχηματίζεται ως αποτέλεσμα αλυσίδας χημικών αντιδράσεων: πτητικών οργανικών ενώσεων (Volatile Organic Compounds-VOCs), και οξειδίων του αζώτου (Oxides of Nitrogen-ΝΟx, NO και NO 2 ), υπό συνθήκες έντονης ηλιακής ακτινοβολίας.
Πηγές των πρωτογενών ρύπων που συντελούν στη δημιουργία του Ο 3
Υπόβαθρο όζον Το όζον με τη βοήθεια του ανέμου μπορεί και μεταφέρεται εκατοντάδες χιλιόμετρα μακριά από την περιοχή σχηματισμού του.
Το τροποσφαιρικό όζον στην Ελλάδα-Μεσόγειο Οι μονάδες μέτρησης [Ο 3 ] είναι σε ppb.
Επίπεδα συγκεντρώσεων όζοντος στο Λεκανοπέδιο της Αθήνας 32-59 59-65 65-73 73-78 78-85 85-91 91-97 97-104 104 111 Οι μονάδες μέτρησης [Ο 3 ] είναι σε μg/m 3.
Επίδραση μετεωρολογικών παραμέτρων στη ρύπανση Οι κυριότερες μετεωρολογικές παράμετροι είναι: η διεύθυνση και η ταχύτητα του ανέμου, η ευστάθεια της ατμόσφαιρας και ειδικά για τους φωτοχημικούς ρύπους η ένταση και η διάρκεια της ηλιακής ακτινοβολίας, η ύπαρξη νεφών που εμποδίζουν τις ακτίνες του ήλιου. Άλλες παράμετροι που συντελούν σημαντικά είναι: η βροχόπτωση, η περιεκτικότητα της ατμόσφαιρας σε υδρατμούς, η θερμοκρασία.
Τιμέςορίωνγιατοόζον, σύμφωνα με την οδηγία 2002/3/ΕC Οριακή τιμή Όριο ενημέρωσης Μέση ωριαία τιμή 180 μg/m 3 Όριο συναγερμού Μέση ωριαία τιμή 360 μg/m 3 Όριο συναγερμού Τιμή-στόχος για την προστασία της ανθρώπινης υγείας Μέση ωριαία τιμή για τρεις συνεχόμενες ώρες Μέγιστη ημερήσια μέση 8ωρη τιμή, τηςοποίαςδενπρέπεινα σημειώνεται υπέρβαση περισσότερες από 25 φορές για διάστημα 3 ετών. 240 μg/m 3 120 μg/m 3
Ημερήσιες [Ο 3 ] σε 5 σταθμούς μέτρησης υπό τρεις διαφορετικές καιρικές συνθήκες
Ανάγκη ύπαρξης ακριβέστερου μοντέλου βραχυπρόθεσμης πρόβλεψης Να εξυπηρετήσει τις ανάγκες του κοινού για αξιόπιστη και έγκυρη πληροφόρηση. Να οδηγήσει στη μείωση της έκθεσης του πληθυσμού στα αυξημένα επίπεδα ρύπανσης. Να προειδοποιήσει τις αρχές, τη βιομηχανία και το κοινό ώστε να λάβουν μέτρα περιορισμού των εκπομπών. Να αυξήσει τη δημόσια υποστήριξη στη λήψη μέτρων είτε βραχυπρόθεσμων είτε πιο μακροπρόθεσμου ή διαρθρωτικού χαρακτήρα, τα οποία τις περισσότερες φορές έχουν κοινωνικό και οικονομικό κόστος.
Πλεονεκτήματα των Τεχνητών Νευρωνικών δικτύων Η ικανότητά τους να περιγράφουν σειρές δεδομένων οι οποίες προέρχονται από μη γραμμικές διεργασίες. Η ικανότητά τους να αποκαλύπτουν νέες μη γραμμικές σχέσεις μεταξύ των μεταβλητών και να συσχετίζουν επιμέρους παραμέτρους, κάτι που με τις κλασικές στατιστικές μεθόδους είναι σχεδόν ανέφικτο. Η ικανότητά τους να διαχειρίζονται πολύ καλά σειρές δεδομένων με κενά (ύπαρξη ελλιπών τιμών) και θόρυβο. Η μικρή επίδραση στη συνολική απόδοσή τους η ύπαρξη στις χρονοσειρές ακραίων εσφαλμένων τιμών (outliers). Ο πολύ μικρός υπολογιστικός χρόνος τον οποίο απαιτούν για την εξαγωγή αποτελεσμάτων.
Τι είναι τα Τεχνητά Νευρωνικά Δίκτυα; Είναι προγράμματα για υπολογιστές που προσομοιώνουν τη βιολογική οργάνωση και τη λειτουργία των βιολογικών νευρώνων. Έχουν την ικανότητα να εκτελούν υπολογισμούς με μαζικό παράλληλο τρόπο. Βασικό τους πλεονέκτημα είναι η προσαρμοστικότητα (ευπλαστότητα), όπως συμβαίνει και με τα εγκεφαλικά μας κύτταρα, έτσι ώστε δεν χρειάζεται να επαναπρογραμματιστούν αν αλλάξει το περιβάλλον. Επιπλέον μπορούν να "μαθαίνουν" από μόνα τους αυτό που πρέπει να υπολογίσουν, χάρη σε ειδικά προγράμματα που σταδιακά διορθώνουν τα λάθη τους καθώς μεταβάλλεται η κατάσταση.
Χαρακτηριστικά των Τεχνητών Νευρωνικών Δικτύων Τα τεχνητά νευρωνικά δίκτυα χαρακτηρίζονται από: Την αρχιτεκτονική τους (architecture) δηλαδή τον αριθμό των νευρώνων του δικτύου, τη διάταξη και την αλληλοσύνδεσή τους. Τον τρόπο με τον οποίο μαθαίνουν, επαναφέρουν, συνδέουν, συγκρίνουν και ταξινομούν κάθε νέα πληροφορία που δέχονται με την υπάρχουσα αποθηκευμένη γνώση τους (neurodynamics). Αυτά επηρεάζουν άμεσα, όχι μόνο την ευκολία στη χρήση αλλά και την απόδοση κάθε νευρωνικού δικτύου.
Ο Φυσικός Νευρώνας Ο νευρώνας είναι ένα κύτταρο, το οποίο ανατομικά, αποτελείται από: (α) το σώμα, (β) τους δενδρίτες, (γ) τον άξονα, και (δ) τις συνάψεις που συνδέουν τις διακλαδώσεις του άξονα με τους δενδρίτες άλλων νευρώνων δημιουργώντας έτσι ένα νευρωνικό δίκτυο.
Τεχνητός νευρώνας-το μοντέλο McCulloch-Pitts x 1 x 1 x. x 2 n w 1 w 2 w n + f(u) y u -θ Νευρώνας Ένας νευρώνας με πολλές εισόδους (1,2,,n-1,n), αντίστοιχα βάρη (w1, w2,..., wn), και μία έξοδο y. Η κατάσταση του νευρώνα περιγράφεται από ένα δυαδικό αριθμό: y = 0 ο νευρώνας είναι αδρανής (δεν δίνει σήμα στην έξοδο), y = 1 ο νευρώνας δίνει σήμα στη μέγιστη συχνότητα. Το άθροισμα u του ερεθίσματος (φορτίου) που δέχεται ο νευρώνας είναι: u i = n i = 1 x i w i Αν το άθροισμα u είναι μεγαλύτερο από το κατώφλι (threshold) θ τότε ο νευρώνας δίνει σήμα, διαφορετικά παραμένει αδρανής. Έτσι έχουμε y = f(u θ).
Κατηγορίες Τεχνητών Νευρωνικών Δικτύων Συνήθως οι νευρώνες είναι οργανωμένοι σε επίπεδα: Επίπεδο εισόδου Επίπεδο εξόδου Κρυφά επίπεδα Τα Τεχνητά Νευρωνικά Δίκτυα (ΤΔΝ) διακρίνονται σε: Πλήρως συνδεδεμένα ΤΝ (fully connected). Μερικώς συνδεδεμένα ΤΝ (partially connected).
Κατηγορίες Τεχνητών Νευρωνικών Δικτύων Τα Νευρωνικά Δίκτυα διακρίνονται επίσης, σε: ίκτυα με πρόσθια τροφοδότηση (Feed-forward). ίκτυα με ανατροφοδότηση-ανάδραση (feedback ή recurrent). Νευρωνικά Δίκτυα Neural Networks Δίκτυα με πρόσθια τροφοδότηση Feed-forward networks Δίκτυα με ανατροφοδότηση Reccurent/feedback networks Αντιληπτήρας Perceptron Πολυστρωματικοί αντιληπτήρες Multilayer Perceptron-MLP Δίκτυα Συνάρτησης Ακτινικής Βάσης RBF Δίκτυα Ανταγωνιστικής Μάθησης Competitive networks Χάρτες Kohonen SOM Συσχετιστικά Δίκτυα Hopfield networks Δίκτυα ART
Κατηγορίες Τεχνητών Νευρωνικών Δικτύων Τα Νευρωνικά Δίκτυα διακρίνονται ανάλογα με τον τρόπο μάθησης σε: Εκπαιδευόμενα με επίβλεψη (supervised), Εκπαιδευόμενα χωρίς επίβλεψη (unsupervised), καθώς και σε Μη-εκπαιδευόμενα συσχετιστικά δίκτυα με σταθερά βάρη. Τεχνητά Νευρωνικά Δίκτυα Με επίβλεψη - Perceptron - ADALINE - MLPs - Recurrent - RBF Εκπαιδευόμενα Χωρίς επίβλεψη - Χάρτες Kohonen (SOFM) - Δίκτυα για επιβλεπόμενη κατηγοριοποίηση Vector Quantization - Δίκτυα ART Με σταθερά βάρη - Συσχετιστικά δίκτυα Hopfield - Συσχετιστικές μνήμες BAM
Πολυστρωματικοί αντιληπτήρες πρόσθιας τροφοδότησης (ΜultiLayer Perceptrons ή MLPs) Η αρχιτεκτονική αυτή συνεπάγεται μια πρόσθια κατεύθυνση επεξεργασίας της πληροφορίας. Η έξοδος ενός νευρώνα προσαρμόζεται σύμφωνα με τη συνάρτηση μεταφοράς και προωθείται σαν είσοδος στους νευρώνες του επόμενου επιπέδου αλλάζοντας τα βάρη και τους συντελεστές πόλωσης. Τα συναπτικά βάρη και οι συντελεστές πόλωσης είναι οι παράμετροι που πρέπει να διορθωθούν ώστε να ελαχιστοποιηθεί το σφάλμα.
Generalized Delta Rule (GNR) ή Back Propagation. αλγόριθμος μάθησης μέσω διόρθωσης σφάλματος με ανατροφοδότηση Πρόκειται για μια τεχνική μάθησης με επίβλεψη (superνised). Ο αλγόριθμος Back Propagation χαρακτηρίζεται από δύο στάδια υπολογισμών: Μια πρόσω διάδοση (Forward Pass) όπου η επίδραση του προτύπου που εφαρμόζεται στην είσοδο διαδίδεται στο δίκτυο και παράγεται το αποτέλεσμα στην έξοδο. Μια ανάστροφη διάδοση (Backward Pass) όπου γίνεται αναπροσαρμογή των βαρών και των συντελεστών πόλωσης. Η βασική ιδέα είναι να καθοριστεί το ποσοστό του συνολικού σφάλματος που αντιστοιχεί στα βάρη και στους συντελεστές πόλωσης του κάθε νευρώνα.
Παράμετροι Πολυστρωματικών αντιληπτήρων πρόσθιας τροφοδότησης Ο αριθμός των επιπέδων που απαιτούνται. Ο αριθμός των νευρώνων κάθε επιπέδου. Ο όγκος των δεδομένων που θα χρησιμοποιηθούν για την εκπαίδευση του νευρωνικού δικτύου (training set) και για τον έλεγχο της απόδοσής του (test set). Ο τύπος της συνάρτησης ενεργοποίησης των κρυμμένων επιπέδων. Ο αλγόριθμος εκπαίδευσης. Ο αριθμός των εποχών (epoch) δηλαδή των κυκλικών επαναλήψεων των προτύπων δεδομένων εισόδου κατά την εκπαίδευση έτσι ώστε να δημιουργήσουμε τεχνητά μια ακολουθία με άπειρο μήκος. Το μέγιστο επιτρεπτό λάθος. Ο ρυθμός μάθησης.
Προσδιορισμός των κρυμμένων επιπέδων Το πρώτο πρόβλημα που πρέπει να αντιμετωπιστεί είναι ο αριθμός των κρυμμένων (hidden) επιπέδων και ο αριθμός των νευρώνων αυτών των επιπέδων. Αν ο αριθμός των κρυμμένων επιπέδων είναι πολύ μικρός τότε ο αλγόριθμος διόρθωσης σφάλματος δεν θα καταφέρει να ελαχιστοποιήσει το σφάλμα. Από την άλλη πλευρά, η επιλογή περισσότερων νευρώνων απ' όσους χρειάζονται θα δημιουργήσει ένα δίκτυο χαμηλής απόδοσης. Κατά τη διάρκεια της εκπαίδευσης, το σφάλμα ελαχιστοποιείται αλλά όταν δίνονται νέα δεδομένα, το δίκτυο που έχει "απομνημονεύσει" τα συγκεκριμένα παραδείγματα με τα οποία εκπαιδεύτηκε, δεν μπορεί να αποδώσει ικανοποιητικά εμφανίζοντας μεγάλο σφάλμα που συνήθως οφείλεται σε υπερβολική προσαρμογή (overfitting).
Συνάρτηση ενεργοποίησης του νευρώνα (neuron activation function) Η επιλογή της συνάρτησης μεταφοράς είναι ένας πολύ σημαντικός παράγοντας κατά τη φάση της δημιουργίας ενός νευρωνικού δικτύου. Στους νευρώνες με συνάρτηση ενεργοποίησης την υπερβολική εφαπτομένη, η έξοδος μπορεί να είναι οποιοσδήποτε πραγματικός αριθμός από το -1 έως το 1. Υπερβολική εφαπτομένη (hyperbolic tangent): f(u) = tanh(u) = (1 e u )/(1+e u )
Ρυθμός εκπαίδευσης (learning rate) Ο ρυθμός εκπαίδευσης, καθορίζει το πόσο γρήγορα συγκλίνει ο αλγόριθμος µάθησης, καθώς η διόρθωση των βαρών είναι ανάλογη του ρυθμού εκπαίδευσης. Αν επιλεγεί μεγάλος ρυθμός εκπαίδευσης τότε υπάρχει κίνδυνος συνεχούς ταλάντωσης γύρω από τις βέλτιστες τιµών βαρών. Αν επιλεγεί μικρός ρυθμός εκπαίδευσης τότε η σύγκλιση είναι πολύ αργή ενώ µπορεί να οδηγήσει σε παγίδευση σε τοπικά ελάχιστα.
Δημιουργία ενός μοντέλου πρόβλεψης Τα απαραίτητα βήματα για τη σωστή διαμόρφωση του μοντέλου περιλαμβάνουν: Αξιολόγηση των μεταβλητών που θα ληφθούν υπόψη για τη διαμόρφωση του μοντέλου. Ανάπτυξη του μοντέλου. Εκτίμηση του μοντέλου με τη χρήση κατάλληλων δεικτών.
Επιλογή και ανάλυση των δεδομένων Σταθμός Λυκόβρυση : η χρονική περίοδος που μελετάται είναι από 9/1/1994 έως και 9/5/1999. Σε αυτό το διάστημα ο αριθμός των διαθέσιμων στοιχείων είναι για 1464 ημέρες από τις 1947 του συγκεκριμένου διαστήματος, δηλαδή παρατηρούνται ελλείψεις σε ποσοστό 24,81%. Σε ποσοστό 10,43% η συσκευή μέτρησης της συγκέντρωσης όζοντος στο σταθμό Λυκόβρυση καταγράφει μέση ωριαία συγκέντρωση όζοντος ίση με 4. Σταθμός Μαρούσι : η χρονική περίοδος που μελετάται είναι από 1/1/1993 έως και 3/8/1997. Σε αυτό το διάστημα ο αριθμός των διαθέσιμων στοιχείων είναι για 1252 ημέρες από τις 1703 του συγκεκριμένου διαστήματος, δηλαδή παρατηρούνται ελλείψεις σε ποσοστό 26,48%. Σε ποσοστό 4,02% η συσκευή μέτρησης της συγκέντρωσης όζοντος στο σταθμό Μαρούσι καταγράφει μέση ωριαία συγκέντρωση όζοντος ίση με 4.
Σταθμός Λυκόβρυση Μέση τιμή των μέγιστων ωριαίων [Ο 3 ] ανά ημέρα [O 3 ] μg/m 3 120 100 80 60 40 20 0 Κυριακή Δευτέρα Τρίτη Τετάρτη Πέμπτη Παρασκευή Σάββατο Στο σταθμό της Λυκόβρυσης, η μέση τιμή των μεγίστων τιμών συγκέντρωσης όζοντος ανά ημέρα της εβδομάδας παρουσιάζει πολύ μικρή διακύμανση από 99 μέχρι 106 μg/m 3.
Καθορισμός του επιπέδου ρύπανσης σύμφωνα με τη μέγιστη ωριαία τιμή [O 3 ]. Επίπεδο Ρύπανσης Μέγιστη ωριαία τιμή [Ο 3 ] (μg/m 3 ) Χαμηλό [O 3 ] < 180 Μέτριο 180 <= [O 3 ] <240 Υψηλό 240 <= [O 3 ] <360 Πολύ Υψηλό [O 3 ]>=360
Σταθμός Λυκόβρυση [O 3 ]<180 180=<[O 3 ]<240 240=<[O 3 ]<360 [O 3 ]>=360 1994 219 10 1 1 1995 289 12 5 0 1996 301 8 7 0 1997 282 22 5 1 1998 200 11 10 4 1999 72 4 0 0 ΣΥΝΟΛΟ: 1363 67 28 6 350 300 250 200 150 100 [O3]<180 180=<[O3]<240 240=<[O3]<360 [O3]>=360 50 0 1994 1995 1996 1997 1998 1999
Σταθμός Λυκόβρυση 4,51% Μέτριο επίπεδο 1,91% Υψηλό επίπεδο 0,41% Πολύ υψηλό επίπεδο [O3]<180 180=<[O3]<240 240=<[O3]<360 [O3]>360 93,17% Χαμηλό επίπεδο Η συγκέντρωση όζοντος με τιμή μεγαλύτερη από 180 μg/m 3 παρατηρείται σε 101 περιπτώσεις από τις 1464, κατά την χρονική διάρκεια των έξι ετών και σε ποσοστό μόλις 6,83%.
Σταθμός Λυκόβρυση 160 140 120 100 80 60 40 [O3]<180 180=<[O3]<240 240=<[O3]<360 [O3]>360 20 0 Ιανουάριος Φεβρουάριος Μάρτιος Απρίλιος Μάιος Ιούνιος Ιούλιος Αύγουστος Σεπτέμβριος Οκτώβριος Νοέμβριος Δεκέμβριος [Ο3] μg/m 3 Τα επεισόδια ρύπανσης παρατηρούνται τους μήνες έντονης ηλιοφάνειας (από τέλος Απριλίου μέχρι και αρχές Νοεμβρίου).
Σταθμός Λυκόβρυση Αριθμός επεισοδίων ανά έτος 30 25 20 15 [O3]>=180 10 5 0 1994 1995 1996 1997 1998 Αριθμός επεισοδίων ανά έτος (μέγιστη ωριαία [Ο 3 ] μεγαλύτερη ή ίση από 180 μg/m 3 ), στο διάστημα 1994-1998.
Σταθμός Μαρούσι [O 3 ]<180 180=<[O 3 ]<240 240=<[O 3 ]<360 [O 3 ]>=360 1993 204 7 1 0 1994 280 19 13 0 1995 255 20 8 0 1996 274 22 9 1 1997 126 8 5 0 ΣΥΝΟΛΟ: 1139 76 36 1 300 250 200 150 100 [O3]<180 180=<[O3]<240 240=<[O3]<360 [O3]>=360 50 0 1993 1994 1995 1996 1997
Σταθμός Μαρούσι Υψηλό επίπεδο 2,88% Πολύ υψηλό επίπεδο 0,08% Μέτριο επίπεδο 6,07% [O3]<180 Χαμηλό επίπεδο 90,97% 180=<[O3]<240 240=<[O3]<360 [O3]>=360 Η συγκέντρωση όζοντος με τιμή μεγαλύτερη από 180 μg/m 3 παρατηρείται σε 113 περιπτώσεις από τις 1252, κατά την χρονική διάρκεια των πέντε ετών και σε ποσοστό 9,03%.
Παράμετροι εισόδου Συμβολισμός Μονάδες μέτρησης Το ημίτονο και συνημίτονο της ημέρας του χρόνου (Julian Day) Η μέγιστη ημερήσια θερμοκρασία που προκύπτει από τις μέσες ωριαίες τιμές sinjulianday cosjulianday Μέση ημερήσια ταχύτητα ανέμου WS m/sec Επικρατούσα διεύθυνση ανέμου (ημίτονο και συνημίτονο) Τ max και WDsin και WDcos Μέγιστη ένταση ηλιακής ακτινοβολίας (Global radiation) Glo max MJ/m 2 Συνολική ηλιακή ακτινοβολία στο οριζόντιο επίπεδο Gl tot MJ/m 2 ( ) 0 C ( ) Η μέγιστη ημερήσια σχετική υγρασία που προκύπτει από τις μέσες ωριαίες τιμές Η μέγιστη ημερήσια συγκέντρωση ΝΟ που προκύπτει από τις μέσες ωριαίες τιμές Η μέγιστη ημερήσια συγκέντρωση ΝΟ 2 που προκύπτει από τις μέσες ωριαίες τιμές Η μέγιστη ημερήσια συγκέντρωση Ο 3 που προκύπτει από τις μέσες ωριαίες τιμές RΗ max % NO max μg/m 3 NO 2max μg/m 3 O 3max μg/m 3
Σταθμός Λυκόβρυση Μεταβλητή Forward_method Backward_method sinjulianday + + cosjulianday + + T max + + RΗ max - + Gl tot - - Glo max - - WS - - WDsin - - WDcos - - NO max + + NO 2max - - O 3max + + Με + χαρακτηρίζονται οι παράμετροι οι οποίες λαμβάνονται υπόψη και με - οι παράμετροι οι οποίες διαγράφονται.
Σταθμός Μαρούσι Μεταβλητή Forward_method Backward_method sinjulianday + + cosjulianday - - T max - - RΗ max - - Gl tot - - Glo max - - WS - + WDsin - - WDcos - - NO max - - NO 2max - - O 3max + + Με + χαρακτηρίζονται οι παράμετροι οι οποίες λαμβάνονται υπόψη και με - οι παράμετροι οι οποίες διαγράφονται.
Προεπεξεργασία των δεδομένων Πριν την εισαγωγή των δεδομένων στο νευρωνικό δίκτυο, είναι χρήσιμο να μετασχηματίζουμε τα δεδομένα εκπαίδευσης, ώστε να είναι ομοιόμορφα τα πεδία τιμών τους μέσα στο διάστημα που επιτρέπει η συνάρτηση μεταφοράς. Μέθοδος μετασχηματισμού (κανονικοποίησης των δεδομένων): Ελαχίστης και Μεγίστης τιμής: Γραμμικός μετασχηματισμός του αρχικού συνόλου δεδομένων, έτσι ώστε η νέα ελάχιστη τιμή να είναι -1 και η νέα μέγιστη τιμή να είναι +1. Για να αποφευχθούν όμως ενδεχόμενες ασυνέχειες στα ακρότατα της συνάρτησης (υπερβολική εφαπτομένη) θεωρήθηκε σκόπιμο η κανονικοποίηση των δεδομένων να γίνει στο διάστημα από 0,9 έως 0,9.
Οι βασικές καινοτομίες που εισάγουν τα συγκεκριμένα μοντέλα Οι παράμετροι εισόδου επιλέχθηκαν μέσω της βηματικής πολλαπλής γραμμικής παλινδρόμησης, με την χρήση του πακέτου στατιστικής ανάλυσης SPSS για να διαπιστωθεί ποια δεδομένα επεξηγούν καλύτερα την μεταβλητότητα της μέγιστης ωριαίας συγκέντρωσης όζοντος της επόμενης μέρας. Σαν παραμέτρους εισόδου χρησιμοποιούν τιμές συγκέντρωσης Ο 3 τριών προηγούμενων ημερών και όχι μόνο της αμέσως προηγούμενης μέρας. Σαν μια επιπλέον παράμετρο εισόδου χρησιμοποιούν ένα δείκτη επιπέδου ρύπανσης λόγω Ο 3 με την αντιστοίχηση των επιπέδων ρύπανσης σε τιμές μέσα στο διάστημα [-1,1]. Επίπεδο Ρύπανσης Μέγιστη ωριαία τιμή [O 3 ] (μg/m 3 ) Δείκτης Επιπέδου Ρύπανσης Χαμηλό [O 3 ] <180-0,75 Μέτριο 180 <= [O 3 ] <240-0,25 Υψηλό 240 <= [O 3 ] <360 0,25 Πολύ Υψηλό [O 3 ]>=360 0,75
Οι βασικές καινοτομίες που εισάγουν τα συγκεκριμένα μοντέλα Τα πρότυπα δεδομένα εισόδου, πριν την εισαγωγή τους στο νευρωνικό δίκτυο, μετασχηματίστηκαν ώστε να είναι ομοιόμορφα τα πεδία τιμών τους μέσα στο διάστημα που επιτρέπει η συνάρτηση μεταφοράς, και συγκεκριμένα στο διάστημα [-0,9 0,9]. Για μεγαλύτερη αξιοπιστία, αν και τα δεδομένα δεν χαρακτηρίζονται από πληρότητα, ωστόσο δεν έγινε καμία προσπάθεια συμπλήρωσης των κενών, έτσι ώστε να μην επηρεαστούν τα αποτελέσματα των μοντέλων. Παράλληλα, επιλέχθηκαν τα στοιχεία των ημερών για τις οποίες, οι διαθέσιμες μέσες ωριαίες μετρηθείσες συγκεντρώσεις Ο 3, ΝΟ, ΝΟ 2 ήταν περισσότερες από 16 στις 24. Τέλος, για να αποφευχθεί το πρόβλημα της υπερπροσαρμογής (ovetfitting) αφενός έγιναν πολλές δοκιμές ώστε να οδηγηθούμε στο βέλτιστο αριθμού νευρώνων στο κρυφό επίπεδο και αφετέρου χρησιμοποιήθηκε η συνάρτηση μέτρησης του σφάλματος MSEREG (Mean squared error with regularization).
Σταθμός Λυκόβρυση Μοντέλα Αριθμός επιπέδων Αριθμός νευρώνων ανά επίπεδο Αλγόριθμος εκπαίδευσης Αριθμός εποχών Μέγιστο επιτρεπτό σφάλμα Ρυθμός μάθησης Α 3 10, 10, 1 Trainlm 1.000 1e -3 0,01 Β 3 5, 5, 1 Trainlm 1.000 1e -3 0,01 Γ 3 10, 10, 1 Traingdx 1.000 1e -3 0,01 Δ 3 10, 10, 1 Trainrp 1.000 1e -3 0,01 Ε 3 30, 30, 1 Trainscg 500 1e -3 0,01 Ζ 3 30, 30, 1 Trainscg 1.000 1e -3 0,01 Η 3 10, 10, 1 Trainlm 1.000 1e -3 0,001 Θ 3 10, 10, 1 Trainlm 100 0 0,001
Μοντέλο Α Σταθμός Λυκόβρυση 1 0.8 0.6 0.4 0.2 Best Linear Fit: A = (0.732) T + (-0.138) R = 0.907 Data Points Best Linear Fit A = T A 0-0.2-0.4-0.6-0.8-1 -1-0.5 0 0.5 1 T όπου Α: οι προβλεφθείσες τιμές (predicted) του μοντέλου, και Τ: οι μετρηθείσες τιμές (measured) της μέγιστης ωριαίας [Ο 3 ] τηςεπόμενηςμέρας.
Μοντέλο Ζ Σταθμός Λυκόβρυση 1 0.8 0.6 0.4 0.2 Best Linear Fit: A = (0.748) T + (-0.129) R = 0.918 Data Points Best Linear Fit A = T A 0-0.2-0.4-0.6-0.8-1 -1-0.5 0 0.5 1 T όπου Α: οι προβλεφθείσες τιμές (predicted) του μοντέλου, και Τ: οι μετρηθείσες τιμές (measured) της μέγιστης ωριαίας [Ο 3 ] τηςεπόμενηςμέρας.
Μοντέλο Α Σταθμός Μαρούσι 1 0.8 0.6 0.4 0.2 Best Linear Fit: A = (0.715) T + (-0.0987) R = 0.785 Data Points Best Linear Fit A = T A 0-0.2-0.4-0.6-0.8-1 -1-0.5 0 0.5 1 T όπου Α: οι προβλεφθείσες τιμές (predicted) του μοντέλου, και Τ: οι μετρηθείσες τιμές (measured) της μέγιστης ωριαίας [Ο 3 ] τηςεπόμενηςμέρας.
Μοντέλο Δ Σταθμός Μαρούσι 1 0.8 0.6 0.4 0.2 Best Linear Fit: A = (0.677) T + (-0.116) R = 0.815 Data Points Best Linear Fit A = T A 0-0.2-0.4-0.6-0.8-1 -1-0.5 0 0.5 1 T όπου Α: οι προβλεφθείσες τιμές (predicted) του μοντέλου, και Τ: οι μετρηθείσες τιμές (measured) της μέγιστης ωριαίας [Ο 3 ] τηςεπόμενηςμέρας.
Τρόποι αξιολόγησης ενός μοντέλου πρόβλεψης Η απόδοση ενός μοντέλου πρόβλεψης χαρακτηρίζεται από συγκεκριμένους δείκτες: Το μέσο τετραγωνικό σφάλμα (Root-Mean Square Error) To συντελεστή προσδιορισμού R 2 (coefficient of determination) RMSE = 1 N N ( ) i= 1 P i O i (όπου P i οι τιμές των καθημερινών προβλέψεων, Ο i οι τιμές των παρατηρήσεων (μετρήσεων) και Ν ο αριθμός των παρατηρήσεων-προβλέψεων). 2 Τον λόγο των σωστά προβλεφθέντων επεισοδίων POD ή TPR=A/M Την αποτελεσματοκότητα 1-FPR όπου FPR=(F-A)/(N-M) Τον λόγο των ψεύτικων συναγερμών FAR=(F-A)/F Τον δείκτη απόδοσης SI=TPR-FPR (όπου το Α αντιπροσωπεύει τα σωστά προβλεφθέντα επεισόδια, το F όλα τα προβλεφθέντα επεισόδια, το Μ όλα τα παρατηρηθέντα επεισόδια και το Ν είναι ο συνολικός αριθμός των παρατηρήσεων). R N 2 i= 1 = N i= 1 ( P O ) i ( O i 2 O ) 2
Σύγκριση αποτελεσμάτων με αντίστοιχες εργασίες Σταθμός Μέτρησης Δεδομένα Εκπαίδευσης Melas et al. Λιόσια 1172 (1987-1990) 327 (1995) Kioutsioukis et al. Λιόσια 971 (1994-1997) 205 (1998) Δεδομένα Ελέγχου Απόδοσης Chaloulakou et al. Λιόσια 2/3 από (Απρίλιο έως Οκτώβριο 1992-1998) 1/3 από (Απρίλιο έως Οκτώβριο 1999) Chaloulakou et al. Λυκόβρυση 2/3 από (Απρίλιο έως Οκτώβριο 1994-1998) 1/3 από (Απρίλιο έως Οκτώβριο 1999) Chaloulakou et al. Μαρούσι 2/3 από (Απρίλιο έως Οκτώβριο 1992-1998) 1/3 από (Απρίλιο έως Οκτώβριο 1999) Chaloulakou et al. Ν. Σμύρνη 2/3 από (Απρίλιο έως Οκτώβριο 1992-1998) 1/3 από (Απρίλιο έως Οκτώβριο 1999) Παρούσα Εργασία Μοντέλο Α Λυκόβρυση 731 (Ιανουάριος 1994-Μάρτιος 1996) 731 (Μάρτιος 1996-Μάιος 1999) Μοντέλο Ζ Λυκόβρυση 731 (Ιανουάριος 1994-Μάρτιος 1996) 731 (Μάρτιος 1996-Μάιος 1999) Μοντέλο Α Μαρούσι 625 (Ιανουάριος 1993-Απρίλιος 1995) 624 (Απρίλιος 1995-Αύγουστος 1997) Μοντέλο Δ Μαρούσι 625 (Ιανουάριος 1993-Απρίλιος 1995) 624 (Απρίλιος 1995-Αύγουστος 1997)
Σύγκριση αποτελεσμάτων με αντίστοιχες εργασίες Σταθμός Μέτρησης R R 2 RMSE POD FAR SI Melas et al. Λιόσια 0,80 0,64 27,4 Kioutsioukis et al. Λιόσια 0,87 0,75 24,1 0,67 0,33 Chaloulakou et al. Λιόσια 0,61 0,37 29,6 0,75 0,48 0,63 Chaloulakou et al. Λυκόβρυση 0,70 0,49 39,4 0,74 0,56 0,60 Chaloulakou et al. Μαρούσι 0,67 0,45 29 0,67 0,53 0,50 Chaloulakou et al. Ν. Σμύρνη 0.77 0,59 21,7 0,00 1,00 0,00 Παρούσα Εργασία Μοντέλο Α Λυκόβρυση 0,907 0,82 25,66 0,943 0,014 0,925 Μοντέλο Ζ Λυκόβρυση 0,918 0,84 24,22 0,943 0 0,943 Μοντέλο Α Μαρούσι 0,785 0,62 34,29 0,68 0,234 0,653 Μοντέλο Δ Μαρούσι 0,815 0,66 31,39 0,777 0,211 0,75
Καλύτερη απόδοση των μοντέλων Μικρός αριθμός νευρώνων στο επίπεδο εισόδου καθώς και στο κρυφό επίπεδο (εκτός κι αν ο αλγόριθμος εκπαίδευσης όπως στην περίπτωση του trainscg το επέβαλε). Μικρότερος αριθμός παραμέτρων εισόδου, έτσι ώστε να μην χρησιμοποιούνται παράμετροι οι οποίες εμφανίζουν σημαντική συσχέτιση (correlation) μεταξύ τους. Δεδομένα με λιγότερες ελλείψεις (κενά), υποδεικνύοντας πόσο σημαντική είναι η χρονική αλληλουχία των πρότυπων δεδομένων εισόδου. Μεγάλος όγκος πρότυπων δεδομένων εισόδου.
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης NextO3max
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Ζ 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
ΧΡΗΣΗ ΝΕΥΡΩΝΙΚΩΝ ΔΙΚΤΥΩΝ ΓΙΑ ΤΗΝ ΠΡΟΓΝΩΣΗ ΤΗΣ ΣΥΓΚΕΝΤΡΩΣΗΣ ΤΡΟΠΟΣΦΑΙΡΙΚΟΥ ΟΖΟΝΤΟΣ ΣΕ ΑΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Λυμπεροπούλου Κυριακή Α.Μ. 99
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max A 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max B 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Γ 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Δ 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Ε 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Η 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 NextO3max Θ 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης
Σταθμός Λυκόβρυση Αποτελέσματα ενδεικτικών μοντέλων [Ο 3 ] σε μg/m 3 480 420 360 300 240 180 120 60 0 1 44 87 130 173 216 259 302 345 388 431 474 517 560 603 646 689 732 731 περιπτώσεις ελέγχου απόδοσης NextO3max A B Γ Δ Ε Ζ Η Θ
Η Ελλάδα εμφανίζεται στις πρώτες θέσεις φωτοχημικής ρύπανσης μεταξύ των χωρών της Ε.Ε. ΤΙΜΗ σε μg/m 3 Ελλάδα Λυκόβρυση 463 Ιταλία Παλέρμο 443 Ελλάδα Λυκόβρυση 425 Ελλάδα Μαρούσι 421 Ιταλία Παλέρμο 414 Ελλάδα Λυκόβρυση 410 Γαλλία Νοτρ Νταμ 405 Ελλάδα Μαρούσι 401 Ελλάδα Μαρούσι 389 Ιταλία Ριτσόνε 387 Ελλάδα Λυκόβρυση 367 Ελλάδα Μαρούσι 365 Πηγή: Διεύθυνση Περιβάλλοντος (Έτος 1996)
Σχηματισμός και καταστροφή του όζοντος Ν 2 + Ο 2 2ΝΟ ΝΟ +1/2 Ο 2 ΝΟ 2 ΝΟ 2 +hv ΝΟ + Ο( 3 P) (λ<400nm) Ο( 3 P) +O 2 +M O 3 + M O 3 +NO NO 2 +O 2. RO2 + NO NO 2 +. RO. HO2 + NO NO 2 +. OH
Ημερήσια μεταβολή των συγκεντρώσεων ΝΟ, ΝΟ 2 και Ο 3
Έλεγχος των NΟx ή/και των VOCs σαν μέσο ελάττωσης του σχηματιζόμενου όζοντος