ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468
Εκτίμηση Παραμέτρων Οι στατιστικές δείγματος που υπολογίζονται από τα δεδομένα που έχουν συλλεχθεί, όπως η δειγματική μέση τιμή και η δειγματική διασπορά, χρησιμοποιούνται για την εκτίμηση των σχετικών παραμέτρων πληθυσμού (μ και σ αντίστοιχα) Γενικά από τις παρατηρήσεις του δείγματος μπορούμε να υπολογίσουμε τη σημειακή εκτίμηση (poit estimatio) και την εκτίμηση διαστήματος (iterval estimatio) της παραμέτρου μιας τ.μ..
Σημειακή Εκτίμηση Η σημειακή εκτίμηση μιας παραμέτρου είναι η στατιστική που υπολογίζουμε από το δείγμα, δηλαδή είναι μια τιμή, που υπολογίζεται με βάση τα δεδομένα του δείγματος και αντιπροσωπεύει την πραγματική τιμή της σχετικής παραμέτρου του πληθυσμού Για παράδειγμα, ο μέσος όρος των 5 τιμών αντοχής θραύσης που μετρήθηκαν σε δείγμα 5 σκυροδεμάτων αποτελεί μια σημειακή εκτίμηση της μέσης αντοχής θραύσης σκυροδέματος
Σημειακή Εκτίμηση Έστω μια τ.μ. με αθροιστική συνάρτηση κατανομής F (x; θ) ή απλά F(x; θ) που εξαρτάται από την παράμετρο θ την οποία θέλουμε να εκτιμήσουμε Έστω ακόμα ότι έχουμε παρατηρήσεις {x, x,..., x } της από ένα δείγμα μεγέθους. Τότε η σημειακή εκτίμηση της θ δίνεται από τη συνάρτηση g(x, x..., x ) των τιμών του δείγματος που λέγεται εκτιμήτρια συνάρτηση Η εκτιμήτρια (estimator) της θ από το δείγμα είναι ˆ g( x,x, x )
Σημειακή Εκτίμηση Επειδή οι παρατηρήσεις {x,..., x } αλλάζουν κάθε φορά που μελετάμε διαφορετικό δείγμα μεγέθους, μπορούμε να υποθέσουμε ότι οι παρατηρήσεις {x,..., x } είναι τιμές των τ.μ. {,..., } που είναι ανεξάρτητες μεταξύ τους κι ακολουθούν την ίδια κατανομή F(x; θ). Άρα η παράμετρος συνάρτηση αυτών των τ.μ.. είναι Για ευκολία θα χρησιμοποιούμε το συμβολισμό {x,..., x } και θεωρητικά (εννοώντας τις τ.μ. {,..., }) και πρακτικά (εννοώντας τις παρατηρούμενες αριθμητικές τιμές αυτών των τ.μ.) Είναι φανερό ότι για διαφορετικά δείγματα (διαφορετικές τιμές {x,..., x }) η εκτιμήτρια συνάρτηση της παραμέτρου η ˆ παίρνει διαφορετικές τιμές, δηλαδή είναι η ίδια τ.μ. με κάποια κατανομή κι έχει μέση τιμή και διασπορά: E( ˆ ˆ ) ˆ ˆ Var ( ˆ ) ˆ
Σημειακή Εκτίμηση Δύο σημαντικές παράμετροι μιας τ.μ. που θέλουμε να εκτιμήσουμε είναι η μέση τιμή μ κι η διασπορά σ Εκτίμηση μέσης τιμής: Είναι φυσικό ως εκτιμήτρια της μ να ορίσουμε τη δειγματική μέση τιμή Εκτίμηση διασποράς: Όπως για τη μέση τιμή έτσι και για τη διασπορά σ η εκτιμήτρια είναι η δειγματική διασπορά s Βέβαια μπορεί κάποιος να ορίσει την εκτιμήτρια της σ ως s~ i x i x i i x i i
Κριτήρια Επιλογής Εκτιμητή Στα πλαίσια του προβλήματος εντοπισμού του κατάλληλου εκτιμητή είναι και ο ορισμός κάποιων κριτηρίων επιλογής ή σύγκρισης εκτιμητών Κριτήριο Επιλογής Έστω T( x,, x) T( x) ένας εκτιμητής και g(θ) η ποσότητα που θέλουμε να εκτιμήσουμε. Ένα κριτήριο επιλογής εκτιμητή είναι η μέση απόκλιση στο τετράγωνο, του εκτιμητή από την προς εκτίμηση ποσότητα E ή η μέση απόλυτη απόκλιση T( x ) g( ) E T( x ) g( ) Χρησιμοποιούμε τον πρώτο τύπο για τον οποίον οι υπολογισμοί είναι ευκολότεροι
Μέσο Τετραγωνικό Σφάλμα ΟΡΙΣΜΟΣ (ΜΤΣ) Ορίζουμε το Μέσο Τετραγωνικό Σφάλμα, το οποίο και επιθυμούμε να είναι μικρό, ως: T ( x ); ET( x ) g( ) ΠΡΟΤΑΣΗ Ισχύει ότι T ( x ); Var T( x ) ET( x ) g( ) ΟΡΙΣΜΟΣ Ο εκτιμητής Τ είναι καλύτερος από τον εκτιμητή Τ με κριτήριο το ΜΤΣ αν και αν επιπλέον ισχύει T x); T ( );, ( x T x); T ( ); ( x για τουλάχιστον μια τιμή του θθ. Τότε ο εκτιμητής Τ λέγεται μη αποδεκτός με κριτήριο το ΜΤΣ
Μέσο Τετραγωνικό Σφάλμα Παράδειγμα θέλουμε να εκτιμήσουμε το ποσοστό θ σε ένα δείγμα μεγέθους, στο οποίο Χ i ~B(,θ). Να εξετάσετε και να συγκρίνετε τους εκτιμητές... ) (... ) ( 0.3 ) (... ) ( 4 3 x T x T x T x T
Μέσο Τετραγωνικό Σφάλμα Το Μέσο Τετραγωνικό Σφάλμα, γράφεται ως: T ( x); E[ T ( x) g( )] Var ( E ) Var[ T ( x) g( )] ( E[ T ( x) g( )]) Var ( T ( x)) Var ( g( )) ( E[ T ( x) g( )]) Var ( T ( x)) ( E[ T ( x) g( )]) Var T ( x) b ( T ( x)) E Ο όρος g( ) E( T( b ( T( x)) x )) ονομάζεται μεροληψία. Αν b ( T( x)) 0 g( ) E( T( x)) 0 τότε ο εκτιμητής Τ ονομάζεται αμερόληπτος
Κριτήρια Επιλογής Εκτιμητών Κριτήρια επιλογής Εκτιμητών: Αμεροληψία Αποτελεσματικότητα Επάρκεια Συνέπεια
Αμερόληπτοι Εκτιμητές ΑΜΕΡΟΛΗΨΙΑ ΟΡΙΣΜΟΣ Μια σ.σ. άγνωστη παράμετρο g(θ) αν: ΠΡΟΤΑΣΗ T( x ) T( x,, x) T( x) E ονομάζεται αμερόληπτος εκτιμητής για την T( x) g( ) T(x) Αν είναι Α.Ε. για την g(θ) τότε η σ.σ. είναι Α.Ε. για την g( )
Αμερόληπτοι Εκτιμητές Ελάχιστης Διασποράς ΚΡΙΤΗΡΙΟ ΕΛΑΧΙΣΤΗΣ ΔΙΑΣΠΟΡΑΣ Είδαμε ότι ενδέχεται να υπάρχουν παραπάνω από ένας Α.Ε για την άγνωστη παράμετρο g(θ) Έστω ότι Τ και Τ είναι δύο Α.Ε. για την παράμετρο g(θ) = θ, οπότε E T ( x ) Αν οι διασπορές τους συγκριθούν για κάθε θ και είναι για παράδειγμα Var T ( x) Var T ( x) είναι λογικό να προτιμήσουμε ως εκτιμητή του θ τον Τ παρά τον Τ Αυτό οφείλεται στο γεγονός ότι λόγω αμεροληψίας Var T ( x) E[ T ], Var T ( x) E[ T και άρα ο Τ είναι πιο κοντά στο θ από τον Τ E T ( x ) ]
Αποτελεσματικοί Εκτιμητές ΟΡΙΣΜΟΣ Μεταξύ δύο αμερόληπτων εκτιμητών Τ και Τ, ο εκτιμητής Τ είναι καλύτερος από τον Τ ως προς την διασπορά αν: Var T x) Var T ( ) ( x ˆ ΟΡΙΣΜΟΣ: Έστω ότι είναι ένας αμερόληπτος εκτιμητής της θ. O λέγεται αποτελεσματικός εκτιμητής της θ εάν για κάθε αμερόληπτο εκτιμητή Var ˆ ) Var( ˆ ( ) ˆ ˆ ισχύει Δηλαδή μεταξύ όλων των αμερόληπτων εκτιμητών της παραμέτρου θ ο μικρότερη διασπορά. ˆ έχει τη
Αποτελεσματικοί Εκτιμητές ˆ f ( ˆ ) f ˆ ˆ ( )
Επαρκείς Εκτιμητές ΕΠΑΡΚΕΙΑ Έστω η τ.μ. Χ = {,..., } με σ.π.π. f(x;θ) και μια σ.σ. της τ.μ. Χ. Λέμε ότι η Τ είναι στατιστικά επαρκής για το θ αν η δεσμευμένη κατανομή της Χ δοθέντος ότι Τ = t είναι ανεξάρτητη του θ για όλα τα t για τα οποία ορίζεται η δεσμευμένη κατανομή. ΘΕΩΡΗΜΑ Έστω,..., τ.δ. από ένα πληθυσμό με σ.π.π. f(x;θ) και έστω L(x,θ) η π. πιθανότητας του δείγματος. Μια σ.σ. είναι επαρκής για την παράμετρο θ, αν και μόνο αν η σ.π.π. του δείγματος μπορεί να γραφεί υπό τη μορφή: T( x,, x) T( x) L( x, ) q( T( x), ) h( x) T( x,,x ) T( x ) όπου q(t(x),θ) είναι μια συνάρτηση που εξαρτάται μόνο από την σ.σ. Τ(x) και h(x) είναι μια συνάρτηση των παρατηρήσεων του δείγματος που δεν εξαρτάται από το θ
Συνεπείς Εκτιμητές ΣΥΝΕΠΕΙΑ Ο εκτιμητής θˆ μέγεθος του δείγματος μεγαλώνει: ονομάζεται συνεπής όταν η διασπορά του τείνει προς το 0 καθώς το limvar ( ˆ) 0 Παράδειγμα ˆ Α.Ε. Var ( ˆ) ( ˆ ) lim Var ( ) lim 0 lim Var άρα συνεπής εκτιμητής του μ Ασκήσεις