Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο
Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική κατάσταση με παράλληλη κατασκευή έργων Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες
Γραμμικό Υπόδειγμα Ενίσχυση της γνώσης για τις διαδικασίες που εκτελούνται στο φυσικό σύστημα. Αν υπάρχει συσχέτιση μπορούμε να αποφανθούμε για τη συμπεριφορά της εξαρτημένης μεταβλητής αν υπάρχουν μετρήσεις ή υπολογισμός της ανεξάρτητης μεταβλητής Η πιο απλή συσχέτιση είναι η γραμμική σχέση της εξαρτημένης μεταβλητής ως προς σειρά ανεξάρτητων μεταβλητών (γραμμικό υπόδειγμα) απλή γραμμική παλινδρόμηση (μία ανεξάρτητη μεταβλητή) πολυμεταβλητή γραμμική παλινδρόμηση (περισσότερες της μιας ανεξάρτητες μεταβλητές) Η έννοια γραμμικό «υπόδειγμα» αναφέρεται στους συντελεστές των ανεξάρτητων μεταβλητών και όχι στις μεταβλητές (π.χ. συναρτήσεις εκθετικού τύπου μπορούν να χρησιμοποιήσουν το γραμμικό υπόδειγμα με τη χρήση λογαριθμικού μετασχηματισμού)
Εφαρμογές στην Υδρολογία Εύρεση βροχοβαθμίδας Συμπλήρωση ελλειπουσών μετρήσεων από γειτονικούς σταθμούς Γραμμική συσχέτιση βροχής-απορροής Πρόβλεψη κατανάλωσης νερού σε σχέση με μια σειρά παραμέτρων Μεταβολή των χαρακτηριστικών της πλημμύρας ως συνάρτηση της αστικοποίησης (αλλά και άλλων παραμέτρων) Έλεγχος τάσεων σε μια χρονοσειρά μετεωρολογικής / υδρολογικής μεταβλητής Έλεγχος ομογένειας των παρατηρήσεων μιας μετεωρολογικής / υδρολογικής χρονοσειράς Πρόβλεψη απόδοσης των μέτρων μείωσης της κατανάλωσης σε μια σειρά χρήσεων
Απλή γραμμική παλινδρόμηση Έστω Ν το πλήθος ζεύγη παρατηρήσεων διμεταβλητού στατιστικού πληθυσμού Χ και Υ ζητάμε: 1. Την ποσοτική περιγραφή της υφιστάμενης σχέσης, έτσι ώστε να αποκαλύπτεται η σχέση που διέπει τις μεταβλητές προσδιορισμός μαθηματικού τύπου Υ=f(Χ) (Χ). Τη μέτρηση του βαθμού αλληλοεξάρτησης των δύο μεταβλητών υπολογισμός συντελεστών (δείκτες προσαρμογής ή προσδιορισμού) για τη μέτρηση της έντασης της αλληλοεξάρτησης 3. Την πρόβλεψη της μελλοντικής εξέλιξης της μεταβλητής Υ στην περίπτωση που η Χ εκφράζει το χρόνο ή την εκτίμηση της Υ για κάποια τιμή της Χ για την οποία δεν υπάρχει αντίστοιχη παρατήρηση εκτίμηση της Υ από την τιμή Χ μέσω της Υ=f(Χ)
Διπαραμετρική οικογένεια ευθειών απλούστερη συναρτησιακή σχέση η ευθύγραμμη Y= β 0 + β 1 Χ όπου β 0 και β 1 είναι οι παράμετροι της σχέσης ο συντελεστής β 0 είναι ο σταθερός όρος (ntercept( ntercept), ο συντελεστής β 1 αντιπροσωπεύει την κλίση (slope( coeffcent) Προσδιορισμός των αγνώστων παραμέτρων με τη χρήση της μεθόδου ελαχίστων τετραγώνων
Γενική μορφή ευθείας παλινδρόμησης Μη παρατηρημένες ή τυχαίες διακυμάνσεις οδηγούν στη μη επαλήθευση της μαθηματικής σχέσης στην πράξη Οι διακυμάνσεις αυτές συμπεριλαμβάνονται με την πρόσθεση ενός στατιστικά τυχαίου τμήματος στο μοντέλο παλινδρόμησης Γενική μορφή ευθείας: Y = β 0 + β 1 Χ + u β 0 + β 1 Χ : συστηματικό τμήμα u : μη συστηματικό τμήμα (διαταρακτικός( όρος ή σφάλμα)
Διαταρακτικός όρος ή σφάλμα (u)( Η μεταβλητή u είναι μια τυχαία μεταβλητή η οποία κατανέμεται με μέσο όρο μηδέν και διακύμανση σ. Δηλαδή: Ε(u )= 0 και Var(u ) = σ Οι διαταρακτικοί όροι είναι ασυσχέτιστοι μεταξύ τους και επομένως η συνδιακύμανση του διαταρακτικού όρου, της παρατήρησης,, με το διαταρακτικό όρο, οποιασδήποτε άλλης παρατηρήσεως j,, είναι μηδέν. Δηλαδή: Cov(u,u j ) = Ε[(u E(u j ))(u j E(u ))] = Ε(u u j )= 0 αφού Ε(u )= Ε(u j )=0 Η μεταβλητή Χ δεν είναι στοχαστική. Οι τιμές της παραμένουν σταθερές και δεν είναι όλες ίσες μεταξύ τους. Η υπόθεση ότι η μεταβλητή Χ δεν είναι στοχαστική αυτόματα συνεπάγεται ότι δεν συσχετίζεται με το διαταρακτικό όρο και ότι επομένως η συνδιακύμανσή τους είναι απαραίτητα μηδέν. Δηλαδή: Cov(Χ, u ) = 0 ή Ε(Χ u ) = 0 αφού Ε(u )= 0.
Η μεταβλητή Υ είναι συνάρτηση της τυχαίας μεταβλητής u.. Άρα η Υ επίσης τυχαία μεταβλητή. Η κατανομή της Υ είναι κατανομή υπό συνθήκη. Ο μέσος όρος και η διακύμανση της Y δίνονται από τις σχέσεις: Ε(Υ ) = β 0 + β 1 Χ Var(Υ ) = σ
Γραμμικοί αμερόληπτοι εκτιμητές ελαχίστων τετραγώνων Είναι οι καλύτεροι, με την έννοια ότι παρουσιάζουν την ελάχιστη διακύμανση ανάμεσα στους διάφορους γραμμικούς εκτιμητές. Είναι αμερόληπτοι, με την έννοια ότι για τους εκτιμητές ελαχίστων τετραγώνων ισχύουν τα εξής: Ε(b 0 ) = β 0 και Ε(b 1 ) = β 1
Υπολογισμός εκτιμητών b 0 και b 1 Έστω ότι b 0 και b 1 είναι οι εκτιμητές για τους συντελεστές β 0 και β 1, οπότε: Ŷ = b o + b1 X κατάλοιπο (resdual( resdual) ) ή απόκλιση εκτίμηση της άγνωστης τιμής του διαταρακτικού όρου u uˆ = Y Yˆ
Απλό γραμμικό υπόδειγμα
Ο υπολογισμός των εκτιμητών b 0 και b 1 γίνεται όταν ελαχιστοποιείται το άθροισμα των τετραγώνων των καταλοίπων: SSR = ( Υ bo b1 Χ) Στόχος η ελαχιστοποίηση της διαφοράς μεταξύ πραγματικών και προβλεπομένων τιμών û = Y Ŷ = Y - (b0 + b 1 X )
Από την ελαχιστοποίηση προκύπτει σύστημα κανονικών εξισώσεων (normal equatons) Υ =Ν b + b Χ o 1 Από τη λύση του παραπάνω συστήματος παίρνουμε τους εκτιμητές b 0 και b 1 : Υ Χ = b Χ + b Χ b 0 = b 1 = o 1 Ν Χ Χ Χ Υ Χ Χ Υ ( ) Ν Χ Χ Ν ΧΥ Χ Υ ( )
Βαθμός προσαρμογής Συντελεστής προσδιορισμού (μετρά την «προσαρμοστικότητα» ή «προβλεπτικότητα» του μοντέλου παλινδρόμησης). ( Υˆ Υ) R = ( Υ Υ) καλή προσαρμογή -> R πλησιάζει τη μονάδα. αν το μοντέλο δεν εξηγεί καμία από τις διακυμάνσεις στα δεδομένα -> R =0 Συντελεστής συσχέτισης (στα απλά ή διμεταβλητά υποδείγματα ο συντελεστής προσδιορισμού είναι ίσος με το τετράγωνο του συντελεστή συσχέτισης) r= ( Χ ( Χ Τυπικό σφάλμα της εκτίμησης (S( ή s) (τυπική απόκλιση μεταξύ πραγματικών και εκτιμημένων τιμών της Y) S= Χ) Χ)( Υ ( Υ Υˆ ) Ν Υ) ( Υ Υ)
Έλεγχος στατιστικής ανεξαρτησίας Έλεγχος της υπόθεσης H 0 : ρ=0, όπου το r είναι μια εκτιμήτρια του ρ Αν η H 0 αληθεύει, τότε οι δύο μεταβλητές είναι ανεξάρτητες μεταξύ τους. Τεστ ελέγχου t: Η υπόθεση ρ=0 απορρίπτεται αν: t= r 1 r,n- βαθμούς ελευθερίας Ν t t α /, Ν
Έλεγχος στατιστικής σημαντικότητας Οι συνήθεις μορφές των υποθέσεων ελέγχου είναι: H 0 : β 0 = 0 H 0 : β 1 = 0 και H 1 : β 0 0 H 1 : β 1 0 Οι συγκεκριμένοι έλεγχοι μπορούν να πραγματοποιηθούν με το t- test. περίπτωση b 1 περίπτωση b 0 b 1 t s = = b β s 1 1 b 1 s Χ ΝΧ s b o t = b o βo s b = s + o 1 Χ ( ) Ν Χ ΝΧ Η μηδενική υπόθεση απορρίπτεται αν: όπου α το επίπεδο σημαντικότητας. t t α /, Ν
Έλεγχος στατιστικής σημαντικότητας Στα υποδείγματα πολλαπλής παλινδρόμησης ελέγχουμε τη συνολική στατιστική σημαντικότητα του υποδείγματος, με σκοπό να δούμε αν τουλάχιστον μια από τις ερμηνευτικές μεταβλητές είναι στατιστικά σημαντική Σχηματίζουμε τις παρακάτω υποθέσεις H 0 : β 1 = β =... = β k = 0 Η 1 : τουλάχιστον ένας από τους συντελεστές β 0 Το τεστ ελέγχου F δίνεται από τον παρακάτω τύπο: F= R k (1 R ) Ν k 1 Aν F > F κρίσιμο τότε απορρίπτουμε την υπόθεση H0 και τουλάχιστον μία από τις μεταβλητές είναι στατιστικά σημαντική. (η κρίσιμη τιμή της F καθορίζεται για ένα συγκεκριμένο επίπεδο στατιστικής σημαντικότητας (α), με k βαθμούς ελευθερίας για τον αριθμητή και N-k-1 βαθμούς ελευθερίας για τον παρονομαστή)