ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης
Από την περασμένη φορά... Πληθυσμός (population): ένα σύνολο ατόμων Παράμετρος (parameter): χαρακτηριστικό του πληθυσμού (π.χ. μ, σ, p) είγμα (sample): ένα μέρος του πληθυσμού Στατιστικό στοιχείο (statistic): υπολογίζεται από το δείγμα Το στατιστικό στοιχείο εξυπηρετεί 2 σκοπούς: για να περιγράψει το δείγμα και γιαναεκτιμήσειτηνπαράμετρο
Από την περασμένη φορά...
Στατιστική Περιγραφική Στατιστική Επαγωγική Στατιστική Εκτιμητική Έλεγχος Υποθέσεων
Στατιστική Περιγραφική Στατιστική Επαγωγική Στατιστική Πόσο καλή είναι η εκτίμηση μας? Πόσο κοντά στην παράμετρο είναι ο εκτιμητής? Εκτιμητική Point Interval Έλεγχος Υποθέσεων
Σημειακή εκτίμηση (point estimation): εκτίμηση παραμέτρου από το στατιστικό στοιχείο ιαστηματική εκτίμηση (interval estimation): κατασκευή ενός διαστήματος το οποίο να περιέχει με μεγάλη πιθανότητα την αληθή τιμή της παραμέτρου
Παράδειγμα 1. αποτελεσματικότητα δίαιτας
Παράδειγμα 1. αποτελεσματικότητα δίαιτας ιαφορετικοί μέσοι όροι (και τ.α.) σε κάθε δείγμα. Ο Μέσος όρος του δείγματος είναι τυχαία μεταβλητή!
Παράδειγμα 1. αποτελεσματικότητα δίαιτας
Ο μέσος όρος του δείγματος (όπως και κάθε άλλο στατιστικό στοιχείο) είναι μια τυχαία μεταβλητή! η γνώση της κατανομής του, που λέγεται δειγματική, (sampling distribution) είναι εξαιρετικά χρήσιμη με βάση αυτή μπορώ να υπολογίσω πόσο σίγουρος είμαι για την ακρίβεια (accuracy) της εκτίμησης (estimation) το κεντρικό οριακό θεώρημα (central limit theorem) μας πληροφορεί για τη μορφή της, ανεξάρτητα από την κατανομή της αρχικής μεταβλητής. http://onlinestatbook.com/stat_sim/sampling_dist/index.html
Προσομοιώσεις Στατιστικών εννοιών και τεχνικών Central limit theorem applet etc. http://onlinestatbook.com/stat_sim/sampling_dist/index.html ιαστήματα εμπιστοσύνης έλεγχος υποθέσεων http://lstat.kuleuven.be/java/ Μέγεθος δείγματος και ισχύς http://www.stat.uiowa.edu/~rlenth/power/ http://hedwig.mgh.harvard.edu/sample_size/size.html
Κεντρικό οριακό θεώρημα 1 2 3 2
Παράδειγμα
Κεντρικό οριακό θεώρημα Χ ~ Ν (μ, σ 2 /n), κατά προσέγγιση για n>30 Ο Χ είναι αμερόληπτος (unbiased) εκτιμητής του μ. ( εν υποεκτιμά ούτε υπερεκτιμά το μ.) o X είναι αποτελεσματικός (efficient) εκτιμητής του μ. (Έχει την μικρότερη διακύμανση από κάθε άλλο αμερόληπτο εκτιμητή του μ.) o X είναι συνεπής (consistent) εκτιμητής του μ. (Όσο αυξάνει το n, τόσο πιο κοντά στο μ βρίσκεται)
Η τυπική απόκλιση του Χ είναι σ/ n και λέγεται τυπικό σφάλμα (standard error). Είναι ένα μέτρο της ακρίβειας της εκτίμησης μας και με βάση αυτό μπορούμε να κατασκευάσουμε το διάστημα εμπιστοσύνης για το μέσο όρο.
Κανονική κατανομή Είναι γνωστό ότι αν μια μεταβλητή ακολουθεί κανονική κατανομή, τότε περίπου το 95% των τιμών της είναι εντός 2 τυπικών αποκλίσεων από τον μέσο όρο. (μ 2σ, μ + 2σ)
Παράδειγμα δίαιτας: Άρα για δείγματα μεγέθους n=25 στο 68% ο δειγματικός μέσος όρος είναι μεταξύ 7 και 9 στο 95% ο δειγματικός μέσος όρος είναι μεταξύ 6 και 10 στο 99% ο δειγματικός μέσος όρος είναι μεταξύ 5 και 11
95% Ε για μέση τιμή Εφόσον ο Χ ~ Ν (μ, σ 2 /n), Στο 95% των δειγμάτων μεγέθους n, ο Χθαείναιμεταξύμ-2σ/ n και μ + 2σ / n Το 95% Ε για το μ είναι: x ± σ 2( ) n
Πώς θα άλλαζε το 95% Ε για το μ, αν αντί για n=25 είχαμε n=100;
Το εύρος του Ε Όταν το n αυξάνει... Μικραίνει Όταν το επίπεδο εμπιστοσύνης αυξάνει... Αυξάνει Όταν η διακύμανση αυξάνει... Αυξάνει Μπορούμε να υπολογίσουμε το n έτσι ώστε για δεδομένο επίπεδο εμπιστοσύνης να έχουμε το επιθυμητό εύρος.
Άσκηση Study compares weight loss of men who only diet compared to those who only exercise 95% confidence intervals for mean weight loss Diet only : 13.4 to 18.0 Exercise only: 6.4 to 11.2 1. Σημαίνει αυτό ότι το 95% των ανδρών που κάνουν δίαιτα χάνουν μεταξύ 13.4 και 18.0 pounds; 2. Με βάση τα στοιχεία αυτά νομίζετε ότι οι δύο μέθοδοι διαφέρουν;
Παράδειγμα 2
Όπως και στην περίπτωση του μέσου όρου, το p είναι επίσης τυχαία μεταβλητή. Όταν το n είναι μεγάλο μπορούμε με το κεντρικό οριακό θεώρημα να κατασκευάσουμε ένα 95% διάστημα εμπιστοσύνης για το p.
Παράδειγμα. Θνητότητα μετά από μη θανατηφόρο έμφραγμα μυοκαρδίου 1. Elwood and Sweetmann (1979) τυχαιοποιημένη κλινική μελέτη σε1239 ασθενείς Ασπιρίνη 8.0% Πλασεμπο 10.7% p>0.05. Διαφορά 2.7% με 95% (-0.5% - 6.0%) 2. Persantine-Aspirin Reinfarction Research study group (1980) τυχαιοποιημένη κλινική μελέτη σε 6292 ασθενείς Ασπιρίνη 9.2 % Πλασεμπο 11.5% p<0.05. Διαφορά 2.3% με 95% (0.8% - 3.8%)
Ε &Στατιστική σημαντικότητα - κλινική σπουδαιότητα Σενάρια σύγκρισης δύο μεθόδων δίαιτας στη μείωση επιπέδων χοληστερόλης (mg/dl). διαφορά στα δείγματα Σενάριο X 95% ΔΕ για μ 1 -μ 2 1 X 2 1 2 (1, 3) 2 30 Πιθανολογούμενο εύρος διαφοράς στον πληθυσμό (20, 40) ΣΣ - ΚΣ ΣΣ + ΚΣ 3 30 4 1 5 2 6 30 (2, 58) (-1, 3) (-58, 62) (-2, 62) ΣΣ με ΕΚΣ ΜΣ - ΚΣ ΜΣ με ΕΚΣ ΜΣ με ΕΚΣ
ΔΕ, ΣΣ και κλινική σπουδαιότητα (ΚΣ) Κλινικά σπουδαία διαφορά Σημαντική, με ενδεχόμενη ΚΣ Σημαντική, αλλά χωρίς ΚΣ Σημαντική, με ΚΣ Μη σημαντική Μη σημαντική, με ενδεχόμενη ΚΣ 0 Κλινικά σπουδαία διαφορά
Το ιαστήματα Εμπιστοσύνης δείχνουν την ακρίβεια της εκτίμησης δίνουν εικόνα για την αληθή τιμή της παραμέτρου χρήσιμο εργαλείο για να δείξουμε την αβεβαιότητα που παραμένει