ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Να κατανοηθεί η έννοια της εκτίµησης σηµείου και της εκτίµησης διαστήµατος. Επίσης να κατανοηθεί η έννοια της δειγµατικής κατανοµής παραµέτρου και να υπολογισθούν µε χρήση της Κεντρικού Οριακού Θεωρήµατος διάφοροι παράµετροι δειγµατικών κατανοµών εκτός της κανονικής. Να εκτιµηθούν τα διαστήµατα εµπιστοσύνης παραµέτρων (π.χ. µέσης τιµής πληθυσµού). Επαφή µε κατανοµές όπως η t-κατανοµή και γνωριµία µε µεθόδους εκτίµησης όπως η µέθοδος των ροπών και της µέγιστης πιθανοφάνειας.
ΕΚΤΙΜΗΤΙΚΗ Εκτίµηση σηµείου (σηµειοκτιµητική) Εκτίµηση διαστήµατος (διαστήµατα εµπιστοσύνης) Μέθοδοι προσέγγισης Μέθοδος των ροπών (method of momets) Μέθοδος µέγιστης πιθανοφάνειας (method of maimum likelihood) Ορισµοί Στατιστικές (συναρτήσεις) συναρτήσεις των µετρήσεων, 2, του δείγµατος Εκτιµήτριες (estimators) συναρτήσεις των µετρήσεων που χρησιµοποιούνται για την εκτίµηση παραµέτρων (π.χ. µέση τιµή) Εκτιµήτριες σηµείου (poit estimators) όταν εκτιµούν σηµεία όπως την µέση τιµή, τη διασπορά, την πιθανότητα. Ιδιότητες καλών εκτιµητριών Αµεροληψία (ubiasedess). Η εκτιµώµενη παράµετρος είναι ίση µε την παράµετρο του πληθυσµού Αποτελεσµατικότητα (efficiecy). Η ακρίβεια ης εκτίµησης είναι µικρή ή και καλύτερα ελάχιστη. 2
ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ (ΚΟΘ-) Ας υποτεθεί ότι επιλέγεται ένα τυχαίο δείγµα, 2,, µεγέθους, από έναν πληθυσµόστονοποίοη µεταβλητή Χ που µελετάται έχει κανονική κατανοµή, N(µ, σ 2 ). Τότε η µέση τιµή τηςείναιµ και η διασπορά σ 2 / (και τυπική απόκλιση σ / ). Επίσης η δειγµατική κατανοµή της είναι κανονική. Παρόµοια η δειγµατική κατανοµήτουαθροίσµατος έχει µέση τιµή µ και διασπορά σ 2 (και τυπική απόκλιση σ) καιέχεικανονικήκατανοµή. (ΚΟΘ-2) Ας υποτεθεί ότι επιλέγεται ένα τυχαίο δείγµα, 2,, µεγέθους, από έναν πληθυσµό στονοποίοη µεταβλητή Χ που µελετάται έχει κάποια κατανοµή (όχι κανονική) µε µέση τιµή µ και διασπορά σ 2. Τότε αν το είναι µεγάλο, ηδειγµατική κατανοµή της είναιπροσεγγιστικά κανονική µε µέση τιµή µ και διασπορά σ 2 / (και τυπική απόκλιση σ / ). Η προσέγγιση γίνεται όλο και καλύτερη καθώς το αυξάνεται. Επίσης η δειγµατική κατανοµή του αθροίσµατος είναιc προσεγγιστικά κανονική µε µέση τιµή µ και i= i διασπορά σ 2 (και τυπική απόκλιση σ). i= i 3
Ποσοστό Ποσοστό Παράδειγµα 4.. Η κατανοµή σχετικών συχνοτήτων 000 παρατηρήσεων µιας διακριτής ΤΜ Χ ακολουθεί την οµοιόµορφη κατανοµή µε τιµές -0 Το ιστόγραµµα των σχετικών συχνοτήτων, αποτελείται από 0 ακίδες ίσου (περίπου) ύψους προς 0,0. Η µέση τιµή και διασπορά είναι: = 5,45 και s 2 = 8,24. Επιλέγουµε 00 δείγµατα των 0 µετρήσεων από αυτή την κατανοµή και υπολογίζουµε την µέση τιµή. 20% 0% 8% 5% 6% 0% 4% 5% 2% 0% 3.65 4.0 4.55 5.00 5.45 5.90 6.35 6.80 7.25 2.00 4.00 6.00 8.00 Μέση τιµή δείγµατος, = 0 =, 2,,..., 0 4
ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ.Ε. για τη µέση τιµή πληθυσµού α) σ 2 γνωστό Αν η κατανοµή των µετρήσεων ακολουθεί κανονική κατανοµή µε Ν(µ, σ 2 ) τότε η ακολουθεί κανονική κατανοµή Ν(µ, σ 2 /). Το 95% διάστηµα εµπιστοσύνης θα δίνεται από την σχέση, 96 σ / < µ < +, 96 σ / Όπου,96= Ζα από πίνακες κανονική κατανοµής β) σ 2 άγνωστο Αν η κατανοµή των µετρήσεων ακολουθεί όχι απαραίτητα κανονική κατανοµή µε Ν(µ, σ 2 ) τότε η ακολουθεί κανονική κατανοµή Ν(µ, σ 2 /). Το 95%διάστηµα εµπιστοσύνης θα υπολογίζεται προσεγγιστικά µε βάση την τιµή της s 2 από την σχέση., 96 s/ < µ < +, 96 s/ t s/ < µ < + t s/, a, a Όπου,96= Ζα από πίνακες κανονική κατανοµής Για κανονική κατανοµή χρησιµοποιούµε τον παρακάτω τύπο Αν ζητηθεί 99% διάστηµα εµπιστοσύνης η τιµή,96 αντικαθιστάται από την τιµή 2,58 5
Παράδειγµα 4.2. Ο δείκτηςνοηµοσύνης ( Ν) µαθητών -4 ετών έχει κανονική κατανοµή µε µέση τιµή 00 και τυπική απόκλιση 6. (α) Ποια είναι η πιθανότητα ο Ν ενός τυχαία επιλεγµένου µαθητού να βρίσκεται µεταξύ 95 και 0; (β) Σ ένα τυχαίο δείγµα 0 µαθητών, ποια είναι η πιθανότητα ο µέση τιµή των Ν τους ευρίσκεται µεταξύ 95 και 0; Χ: δείκτης νοηµοσύνης ατόµου Ν(0, 62) η κατανοµή που ακολουθεί ο δείκτης νοηµοσύνης των παιδιών ηλικίας -4 ετών. Ν(0, 62/0) η κατανοµή τουδείγµατος της µέσης τιµής των 0 ατόµων. 95 00 0 00 ( a) P(95 < X < 0) = P( < Z < ) = P( 0,3 < Z < 0,63) = 6 6 PZ ( < 0,63) PZ ( < 0,3) = 0,7357 [ PZ ( < 0.3)] = 0,7357 + 0,627 = 0,3574 95 00 0 00 ( B) P(95 < X < 0) = P( < Z < ) = P( 0,99 < Z <,98) = 5,06 5,06 PZ ( <,98) PZ ( < 0.99) = 0, 976 [ PZ ( < 0,99)] = 0,85 6
Παράδειγµα 4.3. Σε µια φαρµακοβιοµηχανία έγινε µια χηµική ανάλυση για να ελεγχθεί η δραστικότητα των προϊόντων της. Τα αποτελέσµατα της δραστικότητας 60 κοµµατιών (πειραµατικών µονάδων) του προϊόντος ΑΜΧΤ έδωσαν = 905 και s= 7,85. Υπολογίστε, τα 95% και 99% διάστηµα εµπιστοσύνης της µέσης τιµής δραστικότητας, m, αυτού του προϊόντος. Χ: δραστικότητα του φαρµάκου Ν(905, 7,85 2 ) η κατανοµή που ακολουθεί η δραστικότητα των φαρµάκων. Ν(0, 7,85 2 /60) η κατανοµή τηςµέσης δραστικότητας των φαρµάκων 95%.Ε.: (905 (,96)(7,85) / 60, 905 + (,96)(7,85) / 60 ) = (902,23, 907,77), 99%.Ε.: (905 (2,58)(7,85) / 60, 905 + (2,58)(7,85) / 60 ) = (90,36, 908,64). 7
Η t (studet) κατανοµή είγµα µεγέθους µε µετρήσεις, 2, 3,. Η µεταβλητή ακολουθεί κανονική κατανοµή Ν(µ, σ 2 ) Η τυχαία µεταβλητή Συµβολισµός Τ~t - T µ s Μαθηµατικός τύπος: Ειδική περίπτωση συνάρτησης Γ(Χ) (gamma fuctio) = ακολουθεί µια κατανοµή tµε - β.ε. 0.4 0.3 0.2 0. 0-5 -4-3 -2-0 2 3 4 5 Χαρακτηριστικά: Α) συµµετρική κατανοµή γύρω από 0 Β) όσο οι β.ε. µεγαλώνουν η κατανοµή t τείνει στην κανονική. Γ) υψηλότερες τιµές στις «άκρες» της κατανοµής και «χαµηλότερες προς το κέντρο (σε σχέση µε την κανονική κατανοµή). 5 β.ε. 25 β.ε. 8
Παράδειγµα 4.4. Τα παρακάτω δεδοµένα είναι µετρήσεις εκπνεόµενου όγκου αέρος (ΕΟΑ) από ένα δείγµα 8 φοιτητών: 3,69 4,08 4,50 2,85 4,47 3,83 3,54 4,47 4,4 4,30 3,0 4,6 4,56 5,0 3,57 4,6 4,78 5,00 Αν οι µετρήσεις ακολουθούν κανονική κατανοµή υπολογίστετα95 και99% Ε Χ: εκπνεόµενος όγκος αέρα Β.Ε.= =8-=7 Τιµές t-κατανοµής για 7 β.ε. και α=0,05 και 0,0 είναι: t 7, 0,05 =2, και t 7, 0,0 =2,90 95%.Ε.: (4,28 (2,)(0,6) / 8, 4,28 + (2,)(0,6) / 8 ) = (3,824, 4,432), 99%.Ε.: (4,28 (2,90) (0,6) / 8, 4,28 + (2,90)(0,6) `/ 8 ) = (3,70, 4,546). Οι τιµές της κατανοµής t υπολογίζονται από τον Πίνακα της t-κατανοµής 9
ΜΕΓΙΣΤΗ ΠΙΘΑΝΟΦΑΝΕΙΑ (maimum likelihood) Η εκτίµηση διαφόρων στατιστικών παραµέτρων µπορεί να γίνει µε µέθοδος της µέγιστης πιθανοφάνειας (maimum likelihood) Η συνάρτηση πιθανοφάνειας µια παραµέτρου θ η οποία εκφράζεται από τις τιµές µετρήσεων (, 2, 3, ) Π θ 2 = i= (,,... ) f(, θ ) Ο λογάριθµος της συνάρτησης πιθανοφάνειας χρησιµοποιείται πιο πολύ στην εκτίµηση. Λ ( θ ) = l[ Π ( θ, 2,... )] = l[ f( i, θ)] Η µέγιστη τιµή της παραπάνω συνάρτησης βρίσκεται εφαρµόζοντας γνωστές µαθηµατικές σχέσεις (µηδενισµός ης παραγώγου και αρνητική 2η παράγωγος στο σηµείο µηδενισµού) Λ θ 2 ( θ) Λ( θ) 2 i= = 0 & < 0 θ i 0
Παράδειγµα. Ας υποθέσουµε ότι οι, 2, είναι ένα τυχαίο δείγµα παρατηρήσεων της ΤΜ Χ όπου Χ ακολουθεί την εκθετική κατανοµή µε άγνωστη παράµετρο θ, δηλαδή δηλαδή f()= e -/θ /θ, (0, + ). Θα εκτιµήσουµε τηνπαράµετρο θ µε τηνµέθοδο της µέγιστης πιθανοφάνειας Π ( θ,,... ) = f(, ) = e = e 2 i i / θ i= θ i= i= θ θ / θ θ Λ ( θ) = l[ Π ( θ, 2,... )] = lθ θ Η τιµή της πρώτης παραγώγου που µηδενίζει την υπολογίζεται ως i= Λ( θ ) ˆ θ θ θ i i= = + 0 2 i = θ = = i= Η οποία είναι η µέγιστη πιθανοφάνεια µια και η δεύτερη παράγωγος είναι 0. i ( ) 2 Λθ i= 2 i = = < 0
ΕΚΤΙΜΗΣΕΙΣ ΠΑΡΑΜΕΤΡΩΝ ΚΑΤΑΝΟΜΩΝ ΓΙΑ ΓΝΩΣΤΕΣ ΣΥΝΑΡΤΗΣΕΙΣ ΚΑΤΑΝΟΜΩΝ ιωνυµική Παράµετρος ΕΜΠ 95% Ε Τύπος p pˆ = / pˆ ±, 96 pˆ( pˆ) / Προσεγγιστικός Poisso λ ±, 96 / / Προσεγγιστικός Εκθετική θ ±, 96 / Προσεγγιστικός Κανονική µ ± t s,0,05 / Ακριβές 2
ΕΦΑΡΜΟΓΗ ΤΟΥ ΚΟΘ H ιωνυµική Bi(, p) σ.µ.π. προσεγγίζεται (για µεγάλα ) από την κανονική κατανοµή Ν(p, p(-p)). Πρακτικά, η προσέγγιση αυτή είναι καλή για µεγάλα όταν: αν p < 0,5 τότε p > 5 ή αν p > 0,5 τότε (-p) > 5 Η Poisso Po(λ) σ.µ.π. προσεγγίζεται (για µεγάλα λ) από την κανονική κατανοµή Ν(λ, λ). Πρακτικά, η προσέγγιση αυτή είναι καλή για µεγάλα λ, λ >> 5. Παράδειγµα. Αντιληπτική ικανότητα Κεφ.. Χ: αριθµός χαµηλών επιδόσεων Προσεγγίζουµε µε την ιωνυµική µε µια κανονική µε µέση τιµή p και διασπορά p(-p). ηλαδή Χ~Ν(2,5, 2,375). Υπολογίζουµε την πιθανότητα P(X 7) ή P(X 6,5). Έχουµε: 6,5 2,5 PX ( 6,5) = PZ ( ) = PZ ( 2,60) = PZ ( < 2,60) = 0,9953 = 0,0047 2,375 Η οποία δεν είναι πολύ διαφορετική από αυτή της Βi(50, 0,05) αν και δεν ισχύει η συνθήκη p<0,5 και p>5. 3
ΥΠΟΛΟΓΙΣΜΟΣ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ (ΧΡΗΣΗ EXCEL) 4
ΙΑ ΙΚΑΣΙΕΣ ΚΑΙ ΧΡΗΣΙΜΟΠΟΙΟΥΜΕΝΕΣ ΣΥΝΑΡΤΗΣΕΙΣ ΣΥΝΑΡΤΗΣΕΙΣ ΠΑΡΑ ΕΙΓΜΑ ΑΝΤΙΣΤΡΟΦΗ t TINV =TINV(0.05; F8-) ΠΡΟΣΕΓΓΙΣΗ.Ε. CONFIDENCE =CONFIDENCE(0,05;F7;F8) ΕΠΙΠΛΕΟΝ ΤΕΤΡΑΓΩΝΙΚΗ ΡΙΖΑ SQRT =SQRT(F8) ΜΕΣΗ ΤΙΜΗ AVERAGE =AVERAGE(A2:A9) ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ STDEV =STDEV(A2:A9) 5
ΥΠΟΛΟΓΙΣΜΟΣ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ (ΧΡΗΣΗ SPSS) EXAMINE VARIABLES=ogkos /PLOT NONE /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. 6
ΥΠΟΛΟΓΙΣΜΟΣ ΙΑΣΤΗΜΑΤΟΣ ΕΜΠΙΣΤΟΣΥΝΗΣ (ΧΡΗΣΗ SPSS) Descriptives OGKOS Mea 95% Cofidece Iterval for Mea Lower Boud Upper Boud Statistic Std. Error 4,28,44 3,824 4,432 5% Trimmed Mea Media Variace Std. Deviatio Miimum Maimum Rage Iterquartile Rage Skewess Kurtosis 4,45 4,60,374,6 2,850 5,00 2,250,855 -,458,536 -,42,038 7
ν 0,0 0,05 0,0 ν 6,34 2,706 63,656 2 2,920 4,303 9,925 2 3 2,353 3,82 5,84 3 4 2,32 2,776 4,604 4 5 2,05 2,57 4,032 5 6,943 2,447 3,707 6 7,895 2,365 3,499 7 8,860 2,306 3,355 8 9,833 2,262 3,250 9 0,82 2,228 3,69 0,796 2,20 3,06 2,782 2,79 3,055 2 3,77 2,60 3,02 3 4,76 2,45 2,977 4 5,753 2,3 2,947 5 6,746 2,20 2,92 6 7,740 2,0 2,898 7 8,734 2,0 2,878 8 9,729 2,093 2,86 9 20,725 2,086 2,845 20 2,72 2,080 2,83 2 22,77 2,074 2,89 22 23,74 2,069 2,807 23 24,7 2,064 2,797 24 25,708 2,060 2,787 25 26,706 2,056 2,779 26 27,703 2,052 2,77 27 28,70 2,048 2,763 28 29,699 2,045 2,756 29 60,67 2,000 2,660 60 if,650,960 2,580 if ΠΙΝΑΚΑΣ t - ΚΑΤΑΝΟΜΗΣ (STUDENT) 0,45 0,4 0,35 0,3 0,25 0,2 0,5 0, 0,05 0-4 -3-2 - 0 2 3 4 -t - t - 8