ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468
Εκτίμηση Διαστήματος Εμπιστοσύνης Με τις μεθόδους που είδαμε στα προηγούμενα για κάποια σημειακή εκτίμηση μπορεί να γνωρίζουμε εάν ο εκτιμητής έχει τις επιθυμητές ιδιότητες Παρ όλα αυτά, αυτή η γνώση δεν είναι επαρκής για να αντικαταστήσουμε την παράμετρο θ με την εκτίμηση εκτίμηση. Ο εκτιμητής, εφόσον υπάρχει πάντα ένα σφάλμα στην είναι μια τυχαία μεταβλητή, και κάθε δείγμα οδηγεί σε διαφορετική εκτίμηση Είναι επιθυμητό λοιπόν να έχουμε κάποια μέτρηση «ακριβείας», το μέγεθος του δειγματικού λάθους, για τον εκτιμητή
Εκτίμηση Διαστήματος Εμπιστοσύνης Όπως φαίνεται στο σχήμα, τα βασικά χαρακτηριστικά της κατανομής της τ.μ. μέση τιμή της και η διακύμανσή της είναι η Όταν ο εκτιμητής είναι αμερόληπτος και έχει μικρή διακύμανση ένα μεγάλο ποσοστό των εκτιμήσεων που θα κάνουμε βρίσκεται σε μικρή απόσταση από την πραγματική τιμή θ. Στο σχήμα (α) η πιθανότητα το δειγματικό λάθος να είναι μικρότερο από ε είναι μεγαλύτερη από ότι στο (β) Αυτό οφείλεται στο ότι στο (β) η διακύμανση του εκτιμητή είναι σχετικά μεγαλύτερη συγκριτικά με το (α)
Εκτίμηση Διαστήματος Εμπιστοσύνης Επομένως, η ακρίβεια της εκτίμησης ενός αμερόληπτου εκτιμητή εξαρτάται από την διακύμανσή του Αν είναι γνωστή η συνάρτηση κατανομής του εκτιμητή, τότε μπορούμε να υπολογίσουμε την πιθανότητα για κάποιο δειγματικό σφάλμα Σε πολλούς εκτιμητές η διακύμανση εξαρτάται από το μέγεθος του δείγματος και επομένως είναι σημαντικό σε πολλές περιπτώσεις να προσδιορίσουμε το έτσι ώστε να έχουμε όσο μικρή πιθανότητα θέλουμε να κάνουμε ένα μεγάλο δειγματικό λάθος Pr
Εκτίμηση Διαστήματος Εμπιστοσύνης Μπορούμε να προσεγγίσουμε το ζήτημα της εκτίμησης και της ακρίβειας με την κατασκευή των διαστημάτων εμπιστοσύνης (δ.ε.) Η πιθανότητα να βρίσκεται η παράμετρος θ μέσα στο διάστημα εμπιστοσύνης, ονομάζεται βαθμός εμπιστοσύνης και συμβολίζεται με -α ή διαφορετικά 00%(-α) Για τη διαδικασία κατασκευής του δ.ε. θεωρούμε ότι ο εκτιμητής είναι αμερόληπτος, η σ.π.π. του ( ) είναι συμμετρική και η διακύμανσή του είναι γνωστή Pr( ) f
Εκτίμηση Διαστήματος Εμπιστοσύνης Για να κατασκευάσουμε ένα δ.ε. ζητάμε να προσδιορίσουμε την ποσότητα ε την οποία θα προσθέσουμε και θα αφαιρέσουμε τον εκτιμητή διάστημα που προκύπτει, ( ) έτσι ώστε το να περιέχει την παράμετρο θ με μια αρκετά μεγάλη πιθανότητα (πχ 99%, 95%, 90%)
Εκτίμηση Διαστήματος Εμπιστοσύνης Για να προσδιορίσουμε το ε έτσι ώστε το διάστημα που θα εκτιμήσουμε να είναι εμπιστοσύνης -α ακολουθούμε την εξής διαδικασία: o Με βάση την τ.μ. Z φτιάχνουμε μια τ.μ. Ζ από την τυπική κανονική κατανομή E( ).. E( ) o Ζ~Ν(0,) και η σ.π.π της. είναι συμμετρική
Εκτίμηση Διαστήματος Εμπιστοσύνης και επομένως ) Pr( ) Pr( ) Pr( ) Pr( ) Pr( ) Pr( ) Pr( Z
Εκτίμηση Διαστήματος Εμπιστοσύνης και άρα από την Pr( ) ή ποσότητα ε που αφαιρούμε και προσθέτουμε στον εκτιμητή είναι
Διαστήματα Εμπιστοσύνης Οι περιπτώσεις που ακολουθούν αναφέρονται στην κανονική κατανομή αλλά μπορούν να εφαρμοστούν κατά προσέγγιση και σε μη-κανονικούς πληθυσμούς Υποθέτουμε ότι μ είναι η μέση τιμή του πληθυσμού έστω είναι η μέση τιμή του δείγματος και αντίστοιχα σ είναι η διασπορά του πληθυσμού και S διασπορά του δείγματος η οποία υπολογίζεται ως: X μ άγνωστο S X i X i μ γνωστό S X i i
την μέση τιμή μ του πληθυσμού Η σημειακή εκτίμηση της μέσης τιμής μ μιας τ.μ. X είναι η δειγματική μέση τιμή X που είναι κι αμερόληπτη εκτιμήτρια της μ, δηλαδή Παρ όλο που η εκτιμήτρια είναι διαφορετική από δείγμα σε δείγμα, επειδή είναι συνεπής εκτιμήτρια όταν αυξάνεται το μέγεθος του δείγματος πλησιάζει τη μέση τιμή μ. Η διασπορά της λοιπόν θα πρέπει να εξαρτάται από το. Πράγματι έχουμε δείξει ότι X E( X ) X δηλαδή η διασπορά της εκτιμήτριας είναι ανάλογη της διασποράς σ της X κι αντιστρόφως ανάλογη του αριθμού των παρατηρήσεων. Την τυπική απόκλιση της θα την ονομάζουμε σταθερό X σφάλμα (stadard error), γιατί ορίζει το τυπικό σφάλμα εκτίμησης της μ με X X
την μέση τιμή μ του πληθυσμού Έστω {x,x,,x } ένα τ.δ. από έναν πληθυσμό. Το μέγεθος του δείγματος είναι ίσο με. Η μέση τιμή του δείγματος είναι επίσης ότι γνωρίζουμε το -α X και η διασπορά του S. Έστω Τότε διακρίνουμε τις ακόλουθες περιπτώσεις: (Α) Γνωστή διασπορά του πληθυσμού σ Για την τυπική κανονική κατανομή μπορούμε να ορίσουμε ένα διάστημα [ α/, α/ ], στο οποίο θα ανήκει η με κάποια δοθείσα πιθανότητα α
την μέση τιμή μ του πληθυσμού Τα άκρα του διαστήματος, α/ και α/, λέγονται κρίσιμες τιμές. Οι δείκτες α/ και α/ δηλώνουν τις τιμές της αθροιστικής συνάρτησης για α/ και -α/ αντίστοιχα, δηλαδή ισχύει Φ( α/ ) = P( < α/ ) = α/ Φ( α/ ) = P( < α/ ) = α/ Αρα η πιθανότητα να είναι < α/ και > α/ είναι α. Οι δύο σκιασμένες περιοχές στο σχήμα κατέχουν μαζί ποσοστό α% του συνολικού εμβαδού του ολοκληρώματος της συνάρτησης πυκνότητας πιθανότητας
την μέση τιμή μ του πληθυσμού Αντίστοιχα η πιθανότητα να συμβαίνει [ α/, α/ ] είναι α. Γενικά λοιπόν ισχύει Pr( α/ < α/ ) = Φ( α/ ) Φ( α/ ) = α Επειδή η συνάρτηση πυκνότητας πιθανότητας της τυπικής κανονικής κατανομής είναι συμμετρική ως προς το 0 ισχύει α/ = α/ Άρα στην ουσία για να ορίσουμε το διάστημα [ α/, α/ ] χρειαζόμαστε μία μόνο κρίσιμη τιμή Θέλουμε να μετασχηματίσουμε το διάστημα [ α/, α/ ] για πιθανότητα α στο αντίστοιχο διάστημα που περιέχει την παράμετρο μ
την μέση τιμή μ του πληθυσμού Γι αυτό λύνουμε τις σχέσεις ως προς μ και βρίσκουμε τα άκρα του διαστήματος για τη μέση τιμή μ ΠΡΟΣΟΧΗ!!!!!!!! «με πιθανότητα (εμπιστοσύνη) α η μέση τιμή μ βρίσκεται μέσα σ αυτό το διάστημα» «αν χρησιμοποιούσαμε πολλά τέτοια διαστήματα από διαφορετικά δείγματα, ποσοστό ( α)% από αυτά θα περιείχαν τη μ» / x / x / a a /,, / / / x x x a a a x x a a / / «είμαστε ( α)% σίγουροι ότι»
την μέση τιμή μ του πληθυσμού
την μέση τιμή μ του πληθυσμού (Β) Άνωστή διασπορά του πληθυσμού σ και 30
την μέση τιμή μ του πληθυσμού (Γ) Άνωστή διασπορά του πληθυσμού σ και < 30 Αν το δείγμα είναι μικρό, τότε η προσέγγιση δεν είναι καλή και το διάστημα εμπιστοσύνης μπορεί να είναι αρκετά ανακριβές ακόμα και αν γνωρίζουμε ότι η τ.μ. Χ ακολουθεί κανονική κατανομή. t a a,, t Για μικρό και υποθέτοντας ότι η τ.μ. Χ ακολουθεί κανονική κατανομή, η τ.μ. t που ορίζεται ως t x s ~ t η οποία μοιάζει με την τυπική κανονική κατανομή και την προσεγγίζει καθώς αυξάνει ο αριθμός των βαθμών ελευθερίας.
την μέση τιμή μ του πληθυσμού (Γ) Άνωστή διασπορά του πληθυσμού σ και < 30
την μέση τιμή μ του πληθυσμού
Εύρος Διαστήματος Εμπιστοσύνης Πολλές φορές πριν να κάνουμε το πείραμα και συλλέξουμε τις μετρήσεις προκαθορίζουμε ένα συγκεκριμένο εύρος για το δ.ε. ή ζητάμε το εύρος του δ.ε. να μην ξεπερνάει κάποιο ανώτατο όριο για να έχουν νόημα τα αποτελέσματα Για να το πετύχουμε αυτό χωρίς να αλλάξουμε τη σημαντικότητα των στατιστικών αποτελεσμάτων, βρίσκουμε το μέγεθος του δείγματος που μας δίνει αυτό το εύρος του δ.ε. Αυτό υπολογίζεται θέτοντας το εύρος του δ.ε. ίσο με την τιμή που ζητάμε και λύνοντας την εξίσωση ως προς το
Εύρος Διαστήματος Εμπιστοσύνης Για παράδειγμα, ας υποθέσουμε πως το δείγμα είναι μικρό και η τ.μ. X ακολουθεί κανονική κατανομή με άγνωστη διασπορά, (περίπτωση (Γ)) Το εύρος του δ.ε. είναι w t, a / s και λύνοντας ως προς βρίσκουμε ότι για να είναι το εύρος του δ.ε. ίσο με w πρέπει το δείγμα να έχει μέγεθος s t, a / w Και αν το είναι μεγάλο s w a /
την διασπορά σ του πληθυσμού Θυμηθείτε ότι:
την διαφορά δύο μέσων μ μ (Α) Γνωστές διασπορές Έχουμε αποδείξει ότι
την διαφορά δύο μέσων μ μ (Β) Άγνωστές διασπορές και μεγάλο
την διαφορά δύο μέσων μ μ (Γ) Άγνωστές διασπορές και μικρό
την διαφορά δύο μέσων μ μ
Διάστημα εμπιστοσύνης της αναλογίας p Σε αρκετά προβλήματα τα δεδομένα δεν είναι αριθμητικές τιμές μιας τ.μ. του πληθυσμού αλλά δυαδικές τιμές, δηλαδή κάποιο στοιχείο του πληθυσμού έχει μια ιδιότητα (επιτυχία ή ) ή δεν την έχει (αποτυχία ή 0). Ο λόγος των στοιχείων του πληθυσμού που πληρούν την ιδιότητα προς το σύνολο όλων των στοιχείων του πληθυσμού λέγεται αναλογία p. (είναι η πιθανότητα επιτυχίας σε μια δοκιμή όταν αναφερόμαστε σε ακολουθίες Beroulli.) Σε πολλές περιπτώσεις θέλουμε να εκτιμήσουμε την αναλογία p από ένα δείγμα μεγέθους. Η σημειακή εκτίμηση της p είναι απλά p ο λόγος των επιτυχίων m στο δείγμα προς το πλήθος των στοιχείων του δείγματος Γνωρίζουμε ότι για μεγάλο η κατανομή της εκτιμήτριας p είναι κανονική με μέση τιμή p και διασπορά p( p) p m ~ N( p, p( p) )
Διάστημα εμπιστοσύνης της αναλογίας p Ακολουθώντας την ίδια διαδικασία όπως για τη μέση τιμή με γνωστή διασπορά, με τη βοήθεια του μετασχηματισμού ~ p p( p) καταλήγουμε στο διάστημα εμπιστοσύνης για την αναλογία p p p p( p) Αντικαθιστώντας στο τυπικό σφάλμα την αναλογία p με την δειγματική αναλογία έχουμε το διάστημα εμπιστοσύνης για την p από το δείγμα p p p( p)