Στατιστική, Άσκηση 2 (Κανονική κατανομή) Στον πίνακα που ακολουθεί δίνονται οι μέσες παροχές όπως προέκυψαν από μετρήσεις πεδίου σε μια διατομή ενός ποταμού. Ζητείται: 1. Να αποδειχθεί ότι το δείγμα προσαρμόζεται σε κανονική κατανομή 2. Να υπολογιστούν αναλυτικά με τη σχέση παράγοντα συχνότητας οι παροχές που αντιστοιχούν σε περίοδο επαναφοράς Τ=100, Τ=150 και Τ=200 έτη. 3. Ποια είναι η περίοδος επαναφοράς για τιμή παροχής Q=250m 3 /sec 4. Να βρεθούν τα όρια εμπιστοσύνης για τις τιμές του ερωτήματος (2) για επίπεδο εμπιστοσύνης 97% ΕΤΟΣ Q (m 3 /sec) ΕΤΟΣ Q (m 3 /sec) 1970 90 1978 106 1971 83 1979 113 1972 55 1980 125 1973 76 1981 74 1974 159 1982 66 1975 178 1983 98 1976 178 1984 135 1977 120 1985 88
1. Εφόσον ζητείται να αποδειχθεί ότι οι τιμές του δείγματος προσαρμόζονται σε κανονική κατανομή, ακολουθείται η παρακάτω διαδικασία. Α) Τοποθετώ τις τιμές σε πίνακα κατά φθίνουσα σειρά (από τη μεγαλύτερη προς τη μικρότερη) (στήλη 2) Β) Υπολογίζω με τη βοήθεια του τύπου Weibull την περίοδο επαναφοράς για κάθε τιμή της παροχής (στήλη 3). Τ=Ν+1 /m Όπου Τ: περίοδος επαναφοράς σε έτη Ν: το πλήθος του δείγματος m: ο αύξων αριθμός Γ) Υπολογίζω την πιθανότητα μη υπέρβασης της κάθε τιμής (στήλη 4) P=1-1/T Δ) Υπολογίζω το εμβαδό Α της κατανομής (στήλη 5). Α= P-0.5 όταν Ρ>0,5 Α= 0,5-P όταν Ρ<0,5 Ε) Υπολογίζω με τη βοήθεια του πίνακα κανονικής κατανομής του παραρτήματος του βιβλίου «Στοιχεία Τεχνικής Υδρολογίας / κ. Κων/νου Μπέλλου» την ανηγμένη μεταβλητή z (στήλη 6) εφαρμόζοντας τη μέθοδο της γραμμικής παρεμβολής. Ιδιαίτερη προσοχή στις περιπτώσεις του προηγούμενου βήματος (Δ), όταν η τιμή της πιθανότητας μη υπέρβασης είναι μικρότερη του 0,5 (P<0.5), τότε η τιμή της μεταβλητής z παίρνει αρνητικό πρόσημο. * στο τέλος της παρούσας άσκησης, ακολουθεί παράδειγμα υπολογισμού της ανηγμένης μεταβλητής z από τον πίνακα της κανονικής κατανομής με τη μέθοδο της γραμμικής παρεμβολής. Γενικά αναζητώ σχέση γραμμικότητας μεταξύ της τιμής παροχής και του παράγοντα συχνότητας ( για την κανονική κατανομή ανηγμένη μεταβλητή z ) Η σχέση θα είναι της μορφής: Q = a + b*z
Q (m 3 /sec) α/α Q (m 3 /sec) Τ (έτη) Ρ (χ<χ) Α z (1) (2) (3) (4) (5) (6) 1 178 17.00 0.941176 0.441176 1.566 2 178 8.50 0.882353 0.382353 1.187 3 159 5.67 0.823529 0.323529 0.929 4 135 4.25 0.764706 0.264706 0.722 5 125 3.40 0.705882 0.205882 0.542 6 120 2.83 0.647059 0.147059 0.377 7 113 2.43 0.588235 0.088235 0.223 8 106 2.13 0.529412 0.029412 0.073 9 98 1.89 0.470588 0.029412-0.073 10 90 1.70 0.411765 0.088235-0.223 11 88 1.55 0.352941 0.147059-0.377 12 83 1.42 0.294118 0.205882-0.542 13 76 1.31 0.235294 0.264706-0.722 14 74 1.21 0.176471 0.323529-0.929 15 66 1.13 0.117647 0.382353-1.187 16 55 1.06 0.058824 0.441176-1.566 200 180 160 140 120 100 80 R 2 = 0.9518 60 40 y = 42.505x + 109 20 0-2 -1.5-1 -0.5 0 0.5 1 1.5 2 ανηγμένη μεταβλητή z Για το excel: Φτιάχνω το διάγραμμα και πατώντας πάνω σε κάποιο σημείο επιλέγω εμφάνιση της γραμμής τάσης (add trendline), την εμφάνιση της εξίσωσης R 2 (display equation) και του συντελεστή προσδιορισμού (display R squared)
Ο συντελεστής συσχέτισης r δίνεται είτε με υπολογισμό σύμφωνα με τη μαθηματική σχέση που τον εκφράζει, είτε υπολογίζοντας τη ρίζα του συντελεστή προσδιορισμού r 2 ο οποίος προσδιορίστηκε σύμφωνα με τη γραφική μέθοδο. r=0.9518 Για να αποδεχτούμε την τιμή του συντελεστή r και να θεωρήσουμε ότι συσχετίζονται οι τιμές του διαγράμματος, υπολογίζουμε την κρίσιμη τιμή rc. r c 2 / 16 r 0.5 c Eφόσον rc<r η συσχέτιση είναι ικανοποιητική, οπότε θεωρούμε ότι το δείγμα προσαρμόζεται σε κανονική κατανομή. 2. Στο προηγούμενο ερώτημα βρέθηκε η εξίσωση της γραμμικής σχέσης μεταξύ της υδρολογικής μεταβλητής και της ανηγμένης μεταβλητής. Για τον προσδιορισμό της αναλυτικής σχέσης, θεωρώ ότι υπάρχει μια σχέση της μορφής y=ax+b όπου αντικαθιστώντας την υδρολογική μεταβλητή (παροχή Q στην προκειμένη περίπτωση) η σχέση γίνεται Q Q s * z όπου Q: η τιμή της παροχής (m3/sec) Q : η μέση τιμή των παροχών από τα δεδομένα s: η τυπική απόκλιση του δείγματος z: η ανηγμένη τιμής της μεταβλητής στην κανονική κατανομή. Υπολογίζω την μέση τιμή των παροχών από τον πίνακα της εκφώνησης. Q 3 109 m / sec Η τυπική απόκλιση υπολογίζεται σύμφωνα με τον τύπο s n i1 ( Q Q) N 1 S=38.1033m 3 /sec 2
Τελικά, η αναλυτική σχέση παράγοντα συχνότητας, είναι: Q=109+38.1033*z Έτσι για κάθε τιμή ζητούμενης περιόδου επαναφοράς Τ υπολογίζω αρχική την τιμή της πιθανότητα μη υπέρβασης, το εμβαδό Α και τέλος την τιμή του παράγοντα συχνότητας z της κανονικής κατανομής, ώστε αντικαθιστώντας κάθε φορά στην εξίσωση που υπολόγισα να προκύπτει η τιμή της παροχής για τη ζητούμενη περίοδο επαναφοράς. T 1-1/T A z Q 100 0.990 0.490 2.327 197.67 150 0.993 0.493 2.455 202.54 200 0.995 0.495 2.575 207.12 Οι τιμές του z υπολογίζονται με γραμμική παρεμβολή, όπως και στο πρώτο ερώτημα. 3. Για να βρούμε την περίοδο επαναφοράς που αντιστοιχεί σε τιμή παροχής Q=250m 3 /sec θα εφαρμόσουμε την αντίστροφη διαδικασία από αυτήν που εφαρμόσαμε στο δεύτερο ερώτημα. 250=109+38,1033*z Αυτή τη φορά ο άγνωστος στην εξίσωση είναι η ανηγμένη μεταβλητή z η οποία ουσιαστικά εμπεριέχει την τιμή της περιόδου επαναφοράς Τ. Από την παραπάνω εξίσωση προκύπτει ότι Z=3.7 Για την τιμή αυτή του z θεωρώ από τον πίνακα ότι η τιμή του εμβαδού Α προκύπτει Α=0,5 Άρα η πιθανότητα μη υπέρβασης P=1-1/T είναι ίση με τη μονάδα. Αυτό σημαίνει ότι η περίοδος επαναφοράς είναι ίση με το άπειρο. 4. Οι τιμές της παροχής που προέκυψαν από τις περιόδους επαναφοράς του ερωτήματος 2, είναι οι πιθανότερες τιμές Q Τ μεταξύ των τιμών που μπορεί να θεωρηθεί ότι προσαρμόζονται σε μία κανονική κατανομή με παραμέτρους
Μέση τιμή; Q T Τυπική απόκλιση Όπου s T s N z (1 ) 2 2 2 1/2 S: η τυπική απόκλιση του δείγματος Z: η ανηγμένη μεταβλητή της κανονικής κατανομής που προσαρμόζεται στο αρχικό δείγμα. Με τη θεώρηση αυτή το άνω και το κάτω όριο εμπιστοσύνης δίνονται από τις παρακάτω εξισώσεις: Q Q z s * T,max T (1 a)/2 T Q Q z s * T,min T (1 a)/2 T Όπου z (1-α)/2 : η ανηγμένη μεταβλητή της κανονικής κατανομής που αντιστοιχεί στο επιθυμητό επίπεδο εμπιστοσύνης 1-α=0,97 Από τους πίνακες της κανονικής κατανομής και για Α=(1-α)/2 έχω: Α=(1-0,97)/2 Α=0,485 Και από τους πίνακες της κανονικής κατανομής προκύπτει z (1-a)/2 =2.17 Στον παρακάτω πίνακα φαίνονται τα αποτελέσματα του υπολογισμού των άνω και κάτω ορίων εμπιστοσύνης που ζητήθηκαν για τις τιμές του δεύτερου ερωτήματος. T z z (1-a)/2 S T Q T Q min Q max 100 2.327 2.17 18.3418 197.666 157.86 237.467 150 2.455 2.17 19.0838 202.543 161.13 243.955 200 2.575 2.17 19.788 207.116 164.18 250.057
ΜΕΘΟΔΟΣ ΓΡΑΜΜΙΚΗΣ ΠΑΡΕΜΒΟΛΗΣ Αφού έχω υπολογίσει την τιμή του εμβαδού Α, ψάχνω στον πίνακα της κανονικής κατανομής να βρω είτε ακριβώς την τιμή του, ή αν δεν υπάρχει τις τιμές στις οποίες βρίσκεται ανάμεσα. Έστω ότι Α=0,493 Η τιμή του Α που υπολόγισα δεν βρίσκεται στις τιμές του πίνακα. Υπάρχουν όμως οι τιμές Α 1 =0,4931 και Α 2 =0,4929 Για το Α 1 προκύπτει η τιμή του z 1 =2.46, ενώ για το Α 2 προκύπτει z 2 =2.45 (σύμφωνα με το παρακάτω σχήμα) Υπολογίζω τη διαφορά των Α αφαιρώντας από τη μεγαλύτερη τιμή την μικρότερη Α δ =Α 1 -Α 2 και αντίστοιχα υπολογίζω και τη διαφορά των τιμών του z δ =z 1 -z 2 Α δ =0,0002 Z δ =0,01 Και εφαρμόζω την απλή μέθοδο των τριών A1-A2 z1-z2 A1-A x; x=((z1-z2)*(a1-a)) / (A1-A2) 0.002 0.01 0.0001 x x=(0.01*0.0001) / 0.002 x=0.005 Για να βρω τελικά την τιμή του z αφαιρώ αντίστοιχα από την τιμή του z 1 την τιμή του z Έτσι, τελικά, z=2.455. Αντίστοιχα, θα μπορούσα να αφαιρέσω από την τιμή του Α το Α 2. Σ αυτήν την περίπτωση, προσέχω ότι την τιμή του x την προσθέτω στην τιμή του z 2.
δεύτερο δεκαδικό του z εμβαδό Α Ακέραιο μέρος και πρώτο δεκαδικό του z