Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές 0 Στατιτικές υαρτήεις και δειγματοληπτικές καταομές Στο ειαγωγικό κεφάλαιο του Β Μέρους (8 ο Κεφάλαιο εξηγήαμε ότι τη Στατιτική «όλα αρχίζου από τα δεδομέα» Δηλαδή ότι ε υμπεράματα για έα άγωτο πληθυμό (για μια άγωτη καταομή οδηγούματε με βάη «αυτό που παρατηρείται» ε έα τυχαίο δείγμα τιμώ του Στη υέχεια τη Περιγραφική Στατιτική (9 ο Κεφάλαιο προκειμέου α περιγράψουμε με ποοτικούς όρους τη καταομή εός δείγματος ορίαμε διάφορα αριθμητικά περιγραφικά μέτρα (δειγματικό μέο δειγματική διακύμαη ποοτιαία ημεία του δείγματος κά τα οποία όπως ααφέραμε οομάζοται τατιτικά (statistics Έτι «αυτό που παρατηρείται» ε έα τυχαίο δείγμα και με βάη το οποίο θα δούμε τη υέχεια πώς μπορούμε α οδηγηθούμε ε υμπεράματα για το πληθυμό από το οποίο αυτό προέρχεται θα μπορούαμε α το εκφράουμε α το ποοτικοποιήουμε με διάφορα τατιτικά που υπολογίζουμε από αυτό Πράγματι αυτό κάουμε Τα τατιτικά οομάζοται και τατιτικές υαρτήεις ή δειγματουαρτήεις γιατί είαι υαρτήεις του δείγματος δηλαδή υαρτήεις αεξάρτητω και ιόομω τυχαίω μεταβλητώ Επιημαίουμε ότι βαικό χαρακτηριτικό μιας τατιτικής υάρτηης έτω T = T ( είαι ότι για υγκεκριμέη πραγματοποίηη x x x του τυχαίου δείγματος η τιμή της T ( x x x μπορεί α υπολογιθεί όμως κάθε φορά που τη υπολογίζουμε για μια άλλη πραγματοποίηη του τυχαίου δείγματος αλλάζει δηλαδή μια τατιτική υάρτηη είαι τυχαία μεταβλητή Γι αυτό τις τατιτικές υαρτήεις τις υμβολίζουμε με κεφαλαία γράμματα όπως τις τυχαίες μεταβλητές Για παράδειγμα ο δειγματικός μέος όπως είδαμε υπολογίζεται από το δείγμα είαι δηλαδή μια τατιτική υάρτηη-τυχαία μεταβλητή υμβολίζεται με και ορίζεται από το τύπο = i Η υγκεκριμέη τιμή του που κάθε φορά υπολογίζεται από μια πραγματοποίηη x x x του τυχαίου δείγματος υμβολίζεται με x δηλαδή x = x i Δύο άλλες τατιτικές υαρτήεις που γωρίαμε τη Περιγραφική Στατιτική είαι η δειγματική διακύμαη και η δειγματική τυπική απόκλιη που ορίζοται ατίτοιχα από τους τύπους = ( i και = ( i Αυτές οι τρεις τατιτικές υαρτήεις όπως θα διαπιτώουμε τη υέχεια είαι πολύ χρήιμες (ακριβέτερα είαι απαραίτητες τη Στατιτική Συμπεραματολογία όπως και άλλες «πιο ύθετες» για παράδειγμα η τατιτική υάρτηη ( T = Βέβαια η T είαι τατιτική υάρτηη μόο εφόο η παράμετρος μ (η μέη τιμή της Χ είαι γωτή (ή α υποθέουμε/θεωρήουμε κάποια τιμή μ 0 ως τιμή της γιατί μόο τότε μπορούμε α υπολογίουμε τη τιμή της από έα τυχαίο δείγμα Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 3
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές Υπεθυμίζουμε ότι τα αριθμητικά μέτρα που περιγράφου έα πληθυμό (ή αλλιώς τη καταομή μιας τυχαίας μεταβλητής οομάζοται παράμετροι (parameters και είαι ταθεροί αριθμοί Για παράδειγμα η μέη τιμή μ εός πληθυμού είαι έας υγκεκριμέος αριθμός που μπορεί α μας είαι γωτός ή όχι όμως είαι ταθερός και δε μεταβάλλεται Ατίθετα η τιμή μιας τατιτικής υάρτηης όπως για παράδειγμα η τιμή του δειγματικού μέου μας είαι πάτοτε γωτή (αφού υπολογίζεται από το δείγμα όμως όπως εξηγήαμε μια τατιτική υάρτηη είαι τυχαία μεταβλητή Εφόο μια τατιτική υάρτηη είαι τυχαία μεταβλητή έχει κάποια καταομή πιθαοτήτω τω δυατώ τιμώ της Η καταομή πιθαοτήτω τω τιμώ που μπορεί α πάρει μια τατιτική υάρτηη για όλα τα τυχαία δείγματα ίδιου μεγέθους από το ίδιο πληθυμό (ή αλλιώς για όλες τις πραγματοποιήεις εός τυχαίου δείγματος οομάζεται δειγματοληπτική καταομή ή δειγματική καταομή ή καταομή δειγματοληψίας (sampling distribution της τατιτικής υάρτηης Έτι α γωρίζουμε τη καταομή μιας τατιτικής υάρτηης για παράδειγμα της μπορούμε α υπολογίουμε τη πιθαότητα P( a δηλαδή τη πιθαότητα ε μια πραγματοποίηη του τυχαίου δείγματος ο δειγματικός μέος α πάρει τιμή μεγαλύτερη ή ίη του a Επίης θα μπορούμε α υπολογίουμε τη πιθαότητα P( a b ή οποιαδήποτε άλλη πιθαότητα για το δειγματικό μέο Αυτή η δυατότητα α μπορούμε α υπολογίζουμε πιθαότητες που αφορού τατιτικές υαρτήεις αποτελεί όπως θα διαπιτώουμε τις εότητες που ακολουθού ημείο κλειδί τη Στατιτική Συμπεραματολογία Εύλογα επομέως γεάται το ερώτημα: πώς βρίκουμε τη καταομή μιας τατιτικής υάρτηης δηλαδή μια δειγματοληπτική καταομή; Έας τρόπος είαι α αξιοποιήουμε τα υμπεράματα χετικώ τατιτικώ θεωρημάτω ή άλλα πιθαοθεωρητικά αποτελέματα τα οποία για διάφορες περιπτώεις τατιτικώ υαρτήεω μας δίου επακριβώς ή προεγγιτικά τη ατίτοιχη δειγματοληπτική καταομή Έας δεύτερος τρόπος (ιδιαίτερα χρήιμος ότα τα χετικά τατιτικά θεωρήματα δε βοηθού είαι α πάρουμε όλα τα δυατά τυχαία δείγματα μεγέθους για καθέα από αυτά α υπολογίουμε τη τιμή της τατιτικής υάρτηης που μας εδιαφέρει και α κατακευάουμε το ιτόγραμμα χετικώ υχοτήτω όλω αυτώ τω τιμώ Όμως επειδή υήθως ο αριθμός όλω τω τυχαίω δειγμάτω (ιδίου μεγέθους που μπορούμε α πάρουμε από έα πληθυμό είαι πολύ μεγάλος ακόμη και ότα το μέγεθος του πληθυμού δε είαι μεγάλο μπορούμε ατί για όλα τα τυχαία δείγματα α πάρουμε έα αριθμό μόο από αυτά και α εκτιμήουμε/προεγγίουμε (ατί α υπολογίουμε επακριβώς τη δειγματοληπτική καταομή που μας εδιαφέρει Όο μεγαλύτερος είαι ο αριθμός τω τυχαίω δειγμάτω που παίρουμε τόο καλύτερη προφαώς είαι η προέγγιη της δειγματοληπτικής καταομής Ας δούμε τώρα κάποια αποτελέματα της Θεωρίας Πιθαοτήτω και της Στατιτικής χρήιμα τη μελέτη τατιτικώ υαρτήεω τα οποία θα αξιοποιήουμε τα επόμεα Οριμέα από αυτά μας είαι ήδη γωτά από το Α Μέρος Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 3
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές Καταομή του δειγματικού μέου ( Α τυχαίο δείγμα από έα καοικό πληθυμό που έχει μέη τιμή μ και διαπορά δηλαδή α για κάθε i = i τότε όπως είδαμε το Α Μέρος για οποιοδήποτε μέγεθος δείγματος η καταομή της είαι καοική με E ( = μ και Var ( = = Δηλαδή α i i = τότε Ερώτηη: Στο Σχήμα 0 φαίεται η υάρτηη πυκότητας της καταομής εός καοικού πληθυμού με μ = 9 και = 4 και η υάρτηη πυκότητας της δειγματικής μέης τιμής για δείγματα μεγέθους = 4 από αυτό το πληθυμό αυτό Ποια από τις δύο καμπύλες ατιτοιχεί τη υάρτηη πυκότητας της ; 3 7 5 Σχήμα 0 ( Α το τυχαίο δείγμα προέρχεται από οποιαδήποτε καταομή (πληθυμό με μέη τιμή μ και διακύμαη τότε όπως είδαμε το Α Μέρος (ΚΟΘ για μεγάλο μέγεθος δείγματος (ε γέει α 30 η καταομή της είαι κατά προέγγιη καοική με E ( = μ και Var ( = = δηλαδή κατά προέγγιη Α ο πληθυμός είαι καοικός προφαώς η προέγγιη αυτή είαι τέλεια για οποιοδήποτε (βλ προηγούμεη περίπτωη Καταομή του δειγματικού ποοτού Pˆ Έτω τυχαίο δείγμα από έα πληθυμό που ακολουθεί τη καταομή Bernoulli με παράμετρο p (πιθαότητα επιτυχίας και επομέως με μέη τιμή μ = p και διακύμαη = p( p Η τυχαία μεταβλητή + + + δηλαδή ο δειγματικός μέος ο οποίος προφαώς εκφράζει το ποοτό τω επιτυχιώ το δείγμα Pˆ για μεγάλα προεγγίζεται ικαοποιητικά από τη καοική καταομή με μέη τιμή p και διακύμαη p( p (ΚΟΘ Δηλαδή για μεγάλα κατά προέγγιη έχουμε ˆ + + + p( p P = ~ N p Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 33
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές Η προέγγιη αυτή είαι ικαοποιητική α p 5 και ( p 5 ή p( p 0 (θυμηθείτε ότι το πόο μεγάλο πρέπει α είαι το εξαρτάται και από το p Σημείωη 0: Η τιμή του δειγματικού ποοτού Pˆ για υγκεκριμέη πραγματοποίηη x x x του τυχαίου δείγματος υμβολίζεται με pˆ δηλαδή x+ x + + x pˆ = ( Καταομή της τυχαίας μεταβλητής Με βάη όα ααφέραμε προηγουμέως για τη καταομή του δειγματικού μέου η τυχαία μεταβλητή ( προφαώς ακολουθεί τη τυποποιημέη καοική καταομή N (0 α το τυχαίο δείγμα προέρχεται από καοικό πληθυμό ή προεγγίζεται ικαοποιητικά από τη τυποποιημέη καοική καταομή N (0 αεξάρτητα από το α είαι ή δε είαι καοικός ο πληθυμός α το μέγεθος του δείγματος είαι μεγάλο (ε γέει α 30 ( Καταομή της τυχαίας μεταβλητής ( Α τυχαίο δείγμα και μεγάλο (ε γέει α 30 αποδεικύεται (ΚΟΘ και θεώρημα lutsky ότι η καταομή της τυχαίας μεταβλητής ( όπου = και = ( i προεγγίζεται ικαοποιητικά από τη τυποποιημέη καοική καταομή N (0 ( Α τυχαίο δείγμα από καοικό πληθυμό με μέη τιμή μ και διακύμαη δηλαδή α i για κάθε i = τότε η τυχαία μεταβλητή ( ακολουθεί τη t-καταομή με βαθμούς ελευθερίας δηλαδή ( ~ t Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 34
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές Στο ημείο αυτό αξίζει α ααφέρουμε λίγα τοιχεία για τη προέλευη της t- καταομής (καταομή tudent Η t-καταομή ή καταομή tudent προτάθηκε το 908 από το William Gosset Στη χετική εργαία που δημοίευε ("The probable error of a mean" Biometrika 6-5 908 χρηιμοποίηε το ψευδώυμο tudent O Gosset είχε πουδάει Χημεία και Μαθηματικά και εργαζότα το Δουβλίο για τη γωτή ζυθοποιία Guinness ε θέματα τατιτικής υμπεραματολογίας Τα προβλήματα τατιτικής υμπεραματολογίας που μελετούε αφορούα πειράματα το κτήμα της ζυθοποιίας για τη βελτίωη ποικιλιώ κριθαριού!!! Αφετηρία της ιδέας του Gosset ήτα μια απλή παρατήρηη Επειδή ήτα ααγκαμέος α εργάζεται με μικρού μεγέθους δείγματα (και επομέως δε «καλυπτότα» από τη περίπτωη ( που είδαμε προηγουμέως παρατήρηε ότι η ( καταομή της τυχαίας μεταβλητής για μικρά δείγματα έχει με κωδωοειδή μορφή και είαι υμμετρική ως προς το κατακόρυφο άξοα το 0 όπως η Z 0 όμως έχει πιο «παχιές» ουρές Παρατήρηε δηλαδή ότι για μικρά ( δείγματα η Z 0 για πολύ μικρές και πολύ μεγάλες τιμές της προβλέπει μικρότερες πιθαότητες από αυτές με τις οποίες υμβαίου Δείτε το Σχήμα ( 0 όπου φαίεται η Z 0 και το ιτόγραμμα 500 τιμώ της που υπολογίθηκα από 500 δείγματα μεγέθους = 4 το καθέα από μια καοική καταομή Η παρατήρηη του Gosset είαι προφαής Σχήμα 0 Δηλαδή η καταομή t προέκυψε από τη ααζήτηη της καταομής της τυχαίας ( μεταβλητής Η αξία και η χρηιμότητα της t-καταομής τη Στατιτική Συμπεραματολογία ααγωρίθηκε και ααδείχθηκε πολλά χρόια αργότερα από το διακεκριμέο τατιτικό και γεετιτή R A Fisher ("Applications of "tudent's" distribution" Metron 5: 90 04 95 Έκτοτε η t-καταομή είαι γωτή και ως καταομή tudent (tudent distribution Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 35
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές ( Καταομή της τυχαίας μεταβλητής Α τυχαίο δείγμα από καοικό πληθυμό με μέη τιμή μ και διακύμαη δηλαδή α i για κάθε i = τότε για οποιοδήποτε μέγεθος δείγματος η τυχαία μεταβλητή ( = i ακολουθεί τη καταομή χι τετράγωο (chi-square με βαθμούς ελευθερίας δηλαδή ( ~ χ Στη Στατιτική Συμπεραματολογία όπως θα διαπιτώουμε τα επόμεα παρουιάζοται και προβλήματα που ααφέροται όχι ε έα αλλά ε δύο πληθυμούς Σε αυτές τις περιπτώεις μας εδιαφέρου οι καταομές τατιτικώ υαρτήεω που ορίζοται όχι με βάη έα τυχαίο δείγμα αλλά με βάη δύο τυχαία δείγματα έα από κάθε πληθυμό Ας δούμε κάποιες τέτοιες περιπτώεις που θα μας χρειαθού τα επόμεα Στις περιπτώεις που παρουιάζουμε τη υέχεια θεωρούμε ότι έχουμε δύο αεξάρτητα τυχαία δείγματα και Y Y Y έα από κάθε πληθυμό ατίτοιχα (με μεγέθη ατίτοιχα και Επίης με μ και υμβολίζουμε τη μέη τιμή και τη διακύμαη του πληθυμού από το οποίο προέρχεται το δείγμα και με μ και υμβολίζουμε τη μέη τιμή και τη διακύμαη του πληθυμού από το οποίο προέρχεται το δείγμα Y Y Y Τέλος με και υμβολίζουμε το μέο και τη διακύμαη του δείγματος και με Y και το μέο και τη διακύμαη του δείγματος Y Y Y Δηλαδή και i i = ( i = = j j = Y = Y = ( Y j Y j= Καταομή της τυχαίας μεταβλητής Α δύο αεξάρτητα δείγματα προέρχοται από καοικούς πληθυμούς δηλαδή α και Y ~ ( Y Y N μ αποδεικύεται ότι η τυχαία μεταβλητή ακολουθεί τη καταομή F με και βαθμούς ελευθερίας δηλαδή ~ F ; Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 36
Στατιτικές Συαρτήεις και Δειγματοληπτικές Καταομές Καταομή της τυχαίας μεταβλητής Y ( Α δύο αεξάρτητα τυχαία δείγματα και Y Y Y προέρχοται από καοικούς πληθυμούς δηλαδή α και Y ~ ( Y Y N μ αποδεικύεται ότι η καταομή της τυχαίας μεταβλητής Y είαι καοική με Y ~ N μ + μ και επομέως Y ( μ = Z 0 + ( Α δύο αεξάρτητα τυχαία δείγματα και Y Y Y προέρχοται από καοικούς πληθυμούς και επιπλέο οι διακυμάεις τους είαι ίες = = δηλαδή α και Y ~ ( Y Y N μ αποδεικύεται ότι Y ( μ ~ t + + όπου ( + ( = + μια «εκτιμήτρια» με βάη και τα δύο δείγματα της κοιής διακύμαης τω δύο πληθυμώ (3 Α δύο αεξάρτητα τυχαία δείγματα και Y Y Y προέρχοται από πληθυμούς όχι κατ αάγκη καοικούς αλλά οποιουδήποτε και α είαι μεγάλα δείγματα (ε γέει α 30 τότε κατά προέγγιη Y ( μ = Z 0 + (4 Α δύο αεξάρτητα τυχαία δείγματα και Y Y Y προέρχοται ατίτοιχα από πληθυμούς όχι κατ αάγκη καοικούς αλλά οποιουδήποτε και α είαι μεγάλα δείγματα (ε γέει α 30 τότε κατά προέγγιη Y ( μ 0 + Ας δούμε τώρα ( επιτέλους πού μας χρηιμεύου όλα τα παραπάω! Τη έοια της εκτιμήτριας τη δίουμε το κεφάλαιο που ακολουθεί Γεωποικό Παεπιτήμιο Αθηώ/Γ Παπαδόπουλος (wwwauagr/gpapadopoulos 37