2. ΑΠΛΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Simple Random Sampling)
|
|
- Πλούτων Καλογιάννης
- 9 χρόνια πριν
- Προβολές:
Transcript
1 . ΑΠΛΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Simple Radom Samplig) Η στοιχειωδέστερη μορφή δειγματοληψίας κατά πιθανότητα είναι η απλή τυχαία δειγματοληψία. Το σχήμα αυτό χρησιμοποιείται ευρύτατα, κυρίως λόγω της απλότητάς του από την άποψη της στατιστικής συμπερασματολογίας. Πέρα από την αυτοτελή χρήση του, το σχήμα αυτό χρησιμεύει και ως βάση για συνθετότερα δειγματοληπτικά σχήματα, όπως, για παράδειγμα, η στρωματοποιημένη απλή τυχαία δειγματοληψία (stratified simple radom samplig) και η δειγματοληψία κατά ομάδες (cluster samplig). Τα σχήματα αυτά μελετώνται στα κεφάλαια που ακολουθούν.. Απλό Τυχαίο Δείγμα Βασική προϋπόθεση για τον σχηματισμό ενός δείγματος από ένα πληθυσμό είναι ο σαφής καθορισμός του πληθυσμού. Ας υποθέσουμε ότι έχουμε ένα σαφώς καθορισμένο πληθυσμό μεγέθους 5, έστω {,, 3, 4, 5} Τα δυνατά διακεκριμένα δείγματα μεγέθους που μπορούμε να σχηματίσουμε από αυτόν τον πληθυσμό είναι τα εξής 0: {,}, {,3}, {,4}, {,5}, {,3}, {,4}, {,5}, {3,4}, {3,5}, {4,5}. Γενικότερα, αν ο πληθυσμός αποτελείται από Ν μονάδες και επιθυμούμε δείγμα μεγέθους, το πλήθος των δυνατών διακεκριμένων δειγμάτων είναι: Ν! ( )...( + ) = =,!( )! 6
2 όπου! = 3. (Βλέπε π.χ. Ε. Ξεκαλάκη και Ι. Πανάρετου: Πιθανότητες και Στοιχεία Στοχαστικών Ανελίξεων, Αθήνα 993). Η διαδικασία επιλογής ενός δείγματος από τα δυνατά δείγματα ονομάζεται απλή τυχαία δειγματοληψία, αν κάθε ένα από αυτά έχει πιθανότητα ίση με / να επιλεγεί. Στην πράξη δεν είναι πάντα εύκολος ο σχηματισμός όλων των δυνατών διακεκριμένων δειγμάτων, ιδίως όταν το μέγεθος Ν του πληθυσμού είναι πολύ μεγάλο. Στην θέση της διαδικασίας που περιγράφηκε παραπάνω ακολουθείται η εξής εναλλακτική διαδικασία: Μια μονάδα του πληθυσμού επιλέγεται τυχαία, δηλαδή με τρόπο που εξασφαλίζει την ίδια πιθανότητα επιλογής σε κάθε μια από τις Ν μονάδες του πληθυσμού. Η μέθοδος που χρησιμοποιείται για τον σκοπό αυτό αποτελείται από τα εξής βήματα: (α) Αντιστοιχίζουμε σε κάθε μονάδα του πληθυσμού έναν αριθμό από το μέχρι το Ν και (β) διαλέγουμε μια σειρά τυχαίων αριθμών από το μέχρι το Ν με την βοήθεια πινάκων τυχαίων αριθμών. Εύκολα μπορεί να διαπιστωθεί ότι κάθε ένα από τα δυνατά διακεκριμένα τυχαία δείγματα έχει πιθανότητα / να επιλεγεί. Πράγματι, ας θεωρήσουμε ένα τέτοιο δείγμα, δηλαδή ένα τέτοιο σύνολο διακεκριμένων μονάδων. Κατά την πρώτη δοκιμή, η πιθανότητα ότι κάποια από τις συγκεκριμένες μονάδες του δείγματος θα επιλεγεί από τον δοθέντα πληθυσμό είναι. Στην δεύτερη δοκιμή η πιθανότητα ότι κάποια από τις - απομένουσες μονάδες του δείγματος θα επιλεγεί από τις Ν- απομένουσες μονάδες του 7
3 πληθυσμού είναι κ.ο.κ. Επομένως, η πιθανότητα με την οποία και οι μονάδες του επιθυμούμενου δείγματος θα επιλεγούν είναι!( )!... = =. +! Παρατήρηση : Στο παραπάνω δειγματοληπτικό σχέδιο, κάθε μονάδα απομακρύνεται από τον πληθυσμό μετά την επιλογή της στο τυχαίο δείγμα. (Δεν επανατοποθετείται). Για τον λόγο αυτό η δειγματοληψία αυτή ονομάζεται και απλή τυχαία δειγματοληψία χωρίς επανάθεση. Στα επόμενα, εκτός και αν υποδειχθεί διαφορετικά, με τον όρο απλή τυχαία δειγματοληψία εννοούμε απλή τυχαία δειγματοληψία χωρίς επανάθεση. Παρατήρηση : Μπορεί κανείς εύκολα να δει ότι κατά την απλή τυχαία δειγματοληψία χωρίς επανάθεση, η πιθανότητα με την οποία η i μονάδα του πληθυσμού επιλέγεται στην j δοκιμή είναι. Πράγματι, ας θεωρήσουμε την παρακάτω σχηματική παράσταση. Δυνατοί τρόποι επιλογής μιας μονάδας Ν- i μονάδα Ν- Ν-j+ -j -+ Δοκιμή j- j j+ Διαθέσιμες Ν Ν- -j+ -j+ -j -+ μονάδες του πληθυσμού Τότε Ρ(να επιλεγεί η i μονάδα την j δοκιμή) = 8
4 ( )( )...( j+ )..( j)...( + ) =. ( )( )...( j+ )( j+ )...( + ) Παρατήρηση 3: Είναι δυνατόν μετά από κάθε δοκιμή η εκάστοτε επιλεγόμενη μονάδα να επανατοποθετείται στον πληθυσμό. Για παράδειγμα, αν Ν = 5 και =, ένα τέτοιο δειγματοληπτικό σχήμα επιτρέπει τον σχηματισμό δειγμάτων της μορφής {,}, {,}, {3,3}, {4,4} και {5,5}. Στην περίπτωση αυτή, η δειγματοληψία ονομάζεται απλή τυχαία δειγματοληψία με επανάθεση. Ο υπολογισμός της διασποράς και των εκτιμητριών της διασποράς είναι ευχερέστερος όταν η δειγματοληψία είναι με επανάθεση. Για τον λόγο αυτό, η δειγματοληψία με επανάθεση χρησιμοποιείται μερικές φορές στα πιο σύνθετα δειγματοληπτικά σχήματα, αν και εκ πρώτης όψεως δεν φαίνεται και τόσο πρακτικό να επιτρέπουμε τη δυνατότητα επιλογής της ίδιας μονάδας του πληθυσμού δύο ή περισσότερες φορές στο δείγμα.. Επιλογή Απλού Τυχαίου Δείγματος Η επιλογή ενός απλού τυχαίου δείγματος γίνεται συνήθως με την βοήθεια πινάκων τυχαίων αριθμών. Αυτοί είναι πίνακες των ψηφίων 0,,,,9 στους οποίους η πιθανότητα επιλογής σε οποιαδήποτε δοκιμή είναι η ίδια (/0) για το κάθε ψηφίο. Ο πίνακας.., που δίνεται στην συνέχεια, είναι απόσπασμα 000 ψηφίων του πίνακα τυχαίων αριθμών των Sedecor και Cochra (967). Για την επιλογή ενός απλού τυχαίου δείγματος μεγέθους από ένα πληθυσμό μεγέθους Ν, αντιστοιχίζουμε σε κάθε μια από τις μονάδες του πληθυσμού έναν αριθμό από το μέχρι το Ν (διαφορετικό για κάθε μονάδα). Διαλέγουμε τυχαία τόσες στήλες όσα τα ψηφία του Ν και διαβάζουμε προς μια κατεύθυνση, π.χ. προς τα κάτω την συγκεκριμένη ομάδα στηλών επιλέγοντας τους αριθμούς που είναι Ν. Για παράδειγμα, έστω Ν=98 και =5. Έστω ότι διαλέγουμε τις στήλες 0-. 9
5 Πίνακας.. Τυχαίοι αριθμοί
6 Ξεκινώντας από την γραμμή 00 και διαβάζοντας π.χ. προς τα κάτω, οι πρώτοι 5 διακεκριμμένοι αριθμοί είναι 88,, 06, 08, 7. Το μειονέκτημα της μεθόδου αυτής είναι ότι οι τριψήφιοι αριθμοί 99 έως 999 δεν χρησιμοποιούνται (απορρίπτονται). Μια άλλη μέθοδος που απαιτεί λιγότερες απορρίψεις αριθμών είναι η εξής: Αφαιρούμε 00 από τους τριψήφιους αριθμούς μεταξύ 0 και 400, 400 από τους τριψήφιους μεταξύ 40 και 600, 600 από τους τριψήφιους μεταξύ 60 και 800 και 800 από τους τριψήφιους μεταξύ 80 και 999. Φυσικά αφαιρούμε 000 από κάθε τριψήφιο μεταξύ 000 και 00. Στο δείγμα περιλαμβάνουμε τις παραπάνω διαφορές, ενώ απορρίπτουμε τους αριθμούς 000, 99, 00 και όλους τους αριθμούς που μετά την αφαίρεση είναι μεγαλύτεροι του 98. Για παράδειγμα, αν ξεκινήσουμε από την γραμμή 05 του πίνακα και διαβάζουμε προς τα κάτω τους τριψήφιους αριθμούς των στηλών 5-7, επιλέγουμε τους εξής διακεκριμένους αριθμούς:, 57, 30, 59,. Η επιλογή των στοιχειωδών παρατηρήσεων του δείγματος μπορεί να επιτευχθεί, προφανώς με την εφαρμογή οποιουδήποτε κατάλληλου τυχαίου μηχανισμού επιλογής στις μονάδες του πληθυσμού. Η χρήση ενός πίνακα τυχαίων αριθμών αποτελεί μια τέτοια περίπτωση. Σήμερα, βέβαια, που η πρόσβαση στους υπολογιστές είναι ευκολότερη και η χρήση των στατιστικών πακέτων ευρύτατη, μπορεί να χρησιμοποιηθεί η γεννήτρια τυχαίων αριθμών ενός υπολογιστή, ή ενός στατιστικού πακέτου, για την παραγωγή των τυχαίων αριθμών που θα αποτελέσουν τους δείκτες των μονάδων του πληθυσμού που θα περιληφθούν στο δείγμα..3 Ορισμοί και Συμβολισμοί Στις δειγματοληπτικές έρευνες κυρίως μας ενδιαφέρει η μέτρηση (εκτίμηση) ορισμένων παραμέτρων ή χαρακτηριστικών ενός πληθυσμού.
7 Το ενδιαφέρον συγκεντρώνεται συνήθως στα εξής χαρακτηριστικά: (α) Μέση τιμή του πληθυσμού (μ) (β) Συνολικό μέγεθος κάποιου χαρακτηριστικού (π.χ. συνολικό εισόδημα των κατοίκων μιας περιοχής). (γ) Λόγος δυο συνολικών μεγεθών ή δυο μέσων τιμών. (δ) Ποσοστό μονάδων ενός πληθυσμού που ανήκουν σε μια ορισμένη κατηγορία. Έστω πληθυσμός μεγέθους Ν. Οι τιμές των μονάδων του πληθυσμού, όσο αφορά κάποιο υπό μελέτη χαρακτηριστικό, θα συμβολίζονται με μικρά γράμματα π.χ. y, y,,y ενώ οι αντίστοιχες παρατηρήσεις ενός δείγματος μεγέθους με κεφαλαία γράμματα, π.χ. Χ, Χ,, Χ. (Τα κεφαλαία γράμματα αναφέρονται σε τυχαίες μεταβλητές, ενώ τα μικρά σε συγκεκριμένες σταθερές τιμές). Επίσης θˆ παριστάνει μια εκτιμήτρια της παραμέτρου θ ενός πληθυσμού. Ο πίνακας.3. συνοψίζει τον συμβολισμό που θα ακολουθηθεί στα επόμενα. Δύο από τις επιθυμητές ιδιότητες μιας εκτιμήτριας ˆθ της παραμέτρου θ ενός πληθυσμού είναι η συνέπεια και η αμεροληψία. Ορισμός.3.: Μια εκτιμήτρια ˆθ της παραμέτρου θ ενός πληθυσμού λέγεται συνεπής αν η πιθανότητα να απέχει από την θ περισσότερο από οποιαδήποτε δοθείσα ποσότητα τείνει στο μηδέν, καθώς το δείγμα μεγαλώνει, δηλαδή αν, για οποιαδήποτε τιμή ε>0, lim P( θˆ θ >ε ) = 0 (βλέπε Ι. Πανάρετου και Ε. Ξεκαλάκη: Εισαγωγή στην Στατιστική Σκέψη, Τόμος ΙΙ (Εισαγωγή στις Πιθανότητες και στην Στατιστική Συμπερασματολογία), Αθήνα 000). Ορισμός.3.: Μια εκτιμήτρια ˆθ λέγεται αμερόληπτη εκτιμήτρια της παραμέτρου θ ενός πληθυσμού τότε και μόνο τότε αν Ε( ˆθ ) = θ.
8 (Δηλαδή τότε και μόνο τότε αν ο μέσος των τιμών της ˆθ για όλα τα δυνατά τυχαία δείγματα μεγέθους από τον δοθέντα πληθυσμό, είναι ίσος με θ). Πίνακας.3. Πληθυσμός μέση τιμή μ = συνολικό μέγεθος y yi i= = yi i= Δείγμα Xi μ ˆ = X i= = = = Xi i= Ŷ X (μέσος) λόγος δύο συνολικών μεγεθών R y () i i= μ = = () μ yi i= ˆR () Xi () i X = = = () () X X i i= αριθμός μονάδων σε μια κατηγορία Α X (αριθμός μονάδων του δείγματος στην κατηγορία) ποσοστό μονάδων σε μια κατηγορία p = A p ˆ = X Είναι προφανές, ότι ο μέσος X ενός δείγματος από κάποιο πληθυσμό με μέση τιμή μ είναι συνεπής εκτιμήτρια του μ όπως και η Ŷ= X είναι συνεπής εκτιμήτρια του συνολικού μεγέθους y. 3
9 Το θεώρημα που ακολουθεί αποδεικνύει ότι ο μέσος αμερόληπτη εκτιμήτρια της μέσης μ. X αποτελεί Θεώρημα.3.: Ο μέσος X ενός απλού τυχαίου δείγματος μεγέθους από ένα πληθυσμό μεγέθους Ν είναι αμερόληπτη εκτιμήτρια της μέσης τιμής μ του πληθυσμού. Απόδειξη: Αρκεί να δειχθεί ότι Ε( X ) = μ. Ισχύει ότι X (X+ X X ) E(X ) = =, (.3.) όπου το άθροισμα στον αριθμητή του κλάσματος εκτείνεται σε όλα τα δυνατά δείγματα. Για τον υπολογισμό του αθροίσματος αυτού, αρκεί να υπολογισθεί σε πόσα δείγματα ανήκει μια τύχουσα τιμή y i του πληθυσμού: Επειδή υπάρχουν Ν- άλλες μονάδες διαθέσιμες στον πληθυσμό (διαφορετικές της i) και - διαθέσιμες θέσεις στο δείγμα, ο απαιτούμενος αριθμός των δειγμάτων που περιέχουν την τιμή y i της i μονάδας του πληθυσμού είναι ίσος με τον αριθμό των τρόπων που οι - θέσεις του δείγματος μπορούν να καλυφθούν από τις υπόλοιπες Ν- μονάδες του πληθυσμού. Είναι δηλαδή ίσος με. Επομένως, η τιμή κάθε μονάδας του πληθυσμού υπολογίζεται φορές στον αριθμητή του κλάσματος και, κατά συνέπεια, 4
10 Άρα (X+ X X ) = (y+ y y ). (.3.) y y + + y E(X ) = (y+ y + + y ) = =μ. Παρατήρηση: Η παραπάνω απόδειξη μπορεί να θεωρηθεί ότι στηρίζεται στην εξής απλή συλλογιστική: Επειδή κάθε μονάδα του πληθυσμού περιέχεται στον ίδιο αριθμό δειγμάτων, η Ε(Χ + + Χ ) πρέπει να είναι υποπολλαπλάσιο του y + y + + y. Επειδή η πρώτη ποσότητα έχει όρους και η δεύτερη Ν όρους, έπεται ότι ο πολλαπλασιαστής έχει την τιμή. Θεώρημα.3.: Η διασπορά του μέσου δείγματος μεγέθους από ένα πληθυσμό μεγέθους Ν είναι X ενός απλού τυχαίου σ V(X ) = Ν. Απόδειξη: Ισχύει ότι V( X ) = E( X -μ). Αλλά, ( X -μ) = (X -μ) + (Χ -μ) + + ( X -μ) και, επομένως, ( X -μ) = (X -μ) +(Χ -μ) + +( X -μ) +{(X -μ)(χ -μ)+ 5
11 (X -μ)(χ 3 -μ) + + ( X -μ)( X -μ)}. Άρα E(X μ) = E (Xi μ) E (Xi μ)(x j μ) + i=. (.3.3) i<j Επιχειρηματολογία όμοια με αυτή της προηγούμενης παρατήρησης μας οδηγεί στο συμπέρασμα ότι i μ = i μ, i= i= ( ) i μ j μ = ( ) < i j < i j i μ j μ. όρους). E( (X ) ) (y ) E( (X )(X )) (y )(y ) (Η τελευταία σχέση στηρίζεται στο ότι το αριστερό μέλος της έχει όρους, ενώ το δεξί μέλος της έχει Τότε η (.3.3) γίνεται E( X μ ) = ( yi μ) + ( yi μ )(yj μ). i= i<j Προσθέτοντας και αφαιρώντας (y i μ) στο δεξί μέλος της i = παραπάνω ισότητας, έχουμε 6
12 E( X μ ) = ( yi μ ) ( yi μ ) + i= i= = (επειδή ο β προσθετέος είναι 0) ( yi μ). i= ( ) = ( ) Επομένως, σ E(X μ ) =. Πόρισμα : Το τυπικό σφάλμα του μέσου σ X =σ. X είναι Παρατήρηση : Ο λόγος αντιπροσωπεύει την αναλογία δείγματος πληθυσμού και συνήθως συμβολίζεται με f. Η εισαγωγή του συμβολισμού αυτού στους παραπάνω τύπους διευκολύνει την απομνημόνευσή τους: σ V(X ) = ( f), σ σ X = f. 7
13 Παρατήρηση : Είναι προφανές ότι μια αμερόληπτη εκτιμήτρια της τιμής y= yi είναι η στατιστική συνάρτηση Ŷ= X με διασπορά i= ˆ σ σ V(Y) = ( f) και τυπικό σφάλμα σ = f. Ŷ Παρατήρηση 3: Είναι γνωστό ότι η διασπορά του μέσου ενός απλού σ τυχαίου δείγματος μεγέθους από ένα άπειρο πληθυσμό είναι. Η διαφορά που υπάρχει στην περίπτωση του πεπερασμένου πληθυσμού μεγέθους Ν είναι ο παράγοντας -f. Ο παράγοντας αυτός ονομάζεται διόρθωση πεπερασμένου πληθυσμού και ο παρονομαστής του είναι, αν τα αποτελέσματα αναφέρονται στην έκφραση i = λόγος 8 ( y μ) i για την διασπορά σ του πληθυσμού. Προφανώς, όταν ο f = είναι μικρός, η διόρθωση -f είναι κοντά στο και το μέγεθος Ν του πληθυσμού δεν επηρεάζει την διασπορά της εκτιμήτριας X του μ. Για παράδειγμα, αν δυο πληθυσμοί μεγέθους Ν = και Ν = 0000 αντίστοιχα έχουν την ίδια διασπορά σ, ένα απλό τυχαίο δείγμα μεγέθους 500 από κάθε ένα από τους δυο πληθυσμούς θα οδηγήσει σε εκτίμηση της μέσης τιμής του κάθε ενός με το ίδιο περίπου τυπικό σφάλμα. Στην πράξη, η διόρθωση -f αγνοείται όταν f 0.05και πολλές φορές ακόμη και αν f = 0.0. Το αποτέλεσμα είναι να υπερεκτιμάται το τυπικό σφάλμα της εκτιμήτριας X. Παρατήρηση 4: Η συναγωγή συμπερασμάτων και ο υπολογισμός διασπορών και άλλων παραμέτρων ενός πληθυσμού γίνονται ευκολότερα αν ο πληθυσμός είναι άπειρος. Πολλές φορές, είναι δυνατή η
14 χρησιμοποίηση μεθόδων απείρου πληθυσμού ακόμη και σε περιπτώσεις πεπερασμένου πληθυσμού. Για παράδειγμα, η απόδειξη των δυο παραπάνω θεωρημάτων γίνεται απλούστερη με την χρήση της εξής θεωρίας. αν y i ανηκει στο δειγμα Έστω U i = 0 διαφορετικα Η τυχαία μεταβλητή U i ακολουθεί την διωνυμική κατανομή με παράμετρο p =. Δηλαδή Ρ( U = ) = i = -P( U = 0), i P( U =, U i j = ) = P( U = )P( U i j = U = ) = i. Ισχύει προφανώς ότι X = X i = Uiyi. i= i= Τότε E(X ) = E(U i)yi i= και VX ( ) = i ( i) yvu + yy i jcov(u,u) i j. i = i<j Αλλά Ε( U) =. Ρ( U = ) + 0. Ρ( U = 0) = i i i ( = f ), V( U ) = p q = i ( - ) ( = f ( -f )), Cov(U i,u j) = E(UiU j) E(U i) E(U j) 9
15 (αφού Ε( U U i j ) = P( U =, i ( ) = ( ) = ( ) ( ( f)) ( ) = ( ) U = ) + 0 P( U = 0, j i U = ) + j + 0 P( U =, U = 0) + 0 P( U = 0, U = 0) = ) i j i j. Άρα, E(X ) = yi =μ i = και ( ) VX = y i yy + i j ( ) i= i< j f = y i yiy j i < j (προσθαφαιρώντας το y i ) f = y i ( yi) f = { y i μ } ( ) f σ = ( y i μ ) = ( f). ( ) i= 30
16 .4 Εκτίμηση του Τυπικού Σφάλματος Η χρησιμότητα του αποτελέσματος του θεωρήματος.3. για το τυπικό σφάλμα είναι μεγάλη για τους εξής λόγους: (α) Δίνει την δυνατότητα μέτρησης του βαθμού ακρίβειας της εκτίμησης της μέσης τιμής του πληθυσμού και σύγκρισής του με τον βαθμό ακρίβειας που παρέχει οποιαδήποτε άλλη μέθοδος δειγματοληψίας και (β) Δίνει την δυνατότητα εκτίμησης του μεγέθους του δείγματος που απαιτείται σε μια δειγματοληπτική έρευνα, ώστε να επιτευχθεί ο επιθυμητός βαθμός ακρίβειας. Βέβαια, η γνώση του σ είναι απαραίτητη. Στην πράξη όμως αυτό συμβαίνει σπάνια. Για τον λόγο αυτό, απαιτείται μια εκτίμηση του σ από τα δεδομένα του δείγματος και ως τέτοια συνήθως θεωρείται η τιμή της εκτιμήτριας (Xi X ) ˆ * σ = S = i= στην περίπτωση απλού τυχαίου δείγματος. Στην συνέχεια, για απλότητα, θα χρησιμοποιείται ο συμβολισμός S για την εκτιμήτρια ˆσ της διασποράς σ που ορίζεται από την παραπάνω σχέση. Θεώρημα.4.: Στην απλή τυχαία δειγματοληψία χωρίς επανάθεση από πεπερασμένο πληθυσμό μεγέθους Ν, η στατιστική συνάρτηση (Xi X ) S = i= είναι αμερόληπτη εκτιμήτρια της διασποράς σ του πληθυσμού. 3
17 Απόδειξη: S = ( Xi μ) ( X μ ) ( Xi μ) X ( μ ). = i= i= Τότε ο μέσος της διασποράς όλων των δυνατών δειγμάτων μεγέθους σύμφωνα με την επιχειρηματολογία των θεωρημάτων.3. και.3.. θα δίνεται από τον τύπο E(S ) = E( ( Xi μ) E((X μ) ) i= = (yi μ) σ i= ( ) = σ σ σ = [ ( ) ( ) ] ( ) =σ. Πόρισμα: Οι στατιστικές συναρτήσεις S S σ ˆ S = = ( f) X X και S S σˆ Yˆ S Yˆ = = ( f) 3
18 είναι αμερόληπτες εκτιμήτριες των διασπορών του μέσου X και της τυχαίας μεταβλητής Ŷ= X αντίστοιχα. (Για την εκτίμηση των τυπικών σφαλμάτων θεωρούμε τις θετικές τετραγωνικές ρίζες των παραπάνω εκφράσεων). Παράδειγμα: Για κάποιο αίτημα, μαζεύτηκαν υπογραφές που κάλυψαν 676 σελίδες. Κάθε σελίδα είχε χώρο για 4 υπογραφές, αλλά σε πολλές από τις σελίδες υπήρχε αριθμός υπογραφών διαφορετικός του 4. Ένα απλό τυχαίο δείγμα 50 σελίδων επελέγη και ο αριθμός των υπογραφών ανά σελίδα καταγράφηκε. Ο παρακάτω πίνακας συχνότητας συνοψίζει τα αποτελέσματα. (Χ i =αριθμός υπογραφών, ν i =αριθμός σελίδων με Χ i υπογραφές). Χ i ν i 3 4 Χ i Σύνολο ν i 3 50 Να εκτιμηθεί ο συνολικός αριθμός των υπογραφών που μαζεύτηκαν στις 676 σελίδες και να υπολογισθεί το τυπικό σφάλμα της εκτίμησης αυτής. Λύση: Έχουμε = ν = 50 i ν i X = 47 i ν i X = i Άρα X = 47/50 = 9.5 και επομένως η τιμή της εκτιμήτριας Ŷ του συνολικού αριθμού υπογραφών y είναι Ŷ =Ν X =9888. Το τυπικό σφάλμα της Ŷ είναι ίσο με 33
19 όπου S S = f, Ŷ ( ) νixi S = νi( Xi X) = νixi = 9 = 5.3. και f = 50 = , δηλαδή 676 (676)(5.3) S = = 39. Ŷ 50 (Το τυπικό σφάλμα του μέσου του δείγματος είναι S SX = f =.05)..5 Διαστήματα Εμπιστοσύνης Η Ισχύς της Κανονικής Προσέγγισης Έχει αποδειχθεί (βλέπε π.χ. Ε. Ξεκαλάκη και Ι. Πανάρετου: Πιθανότητες και Στοιχεία Στοχαστικών Ανελίξεων, Αθήνα 993) ότι η κανονική κατανομή είναι η οριακή μορφή της κατανομής του μέσου X ενός τυχαίου δείγματος μεγέθους, το οποίο προέρχεται από έναν άπειρο πληθυσμό με πεπερασμένη διασπορά, όταν το τείνει στο. Δηλαδή, αν μ και σ συμβολίζουν την μέση τιμή και την διασπορά του πληθυσμού αντίστοιχα, τότε, όταν το δείγμα είναι αρκετά μεγάλο ( ), 34
20 X Ν (μ, σ ) ή, ισοδύναμα, X μ Ν (0, ). σ/ Το πόσο μεγάλο πρέπει να είναι το μέγεθος του δείγματος ώστε η προσέγγιση της πραγματικής κατανομής του X από την κανονική κατανομή να είναι ικανοποιητική δεν καθορίζεται από κάποιο γενικό κανόνα. Στις περισσότερες εφαρμογές, το δεν συνηθίζεται να είναι μικρότερο του 5 ( 5). Το παραπάνω αποτέλεσμα είναι γνωστό ως κεντρικό οριακό θεώρημα. Η πρακτική αξία του θεωρήματος αυτού είναι μεγάλη εξ αιτίας των δυνατοτήτων που δίνει στον ερευνητή όσο αφορά την συναγωγή στατιστικών συμπερασμάτων. Πράγματι, το γεγονός ότι X μ P z < α σ/ α =, όπου z συμβολίζει το (-α/)-ποσοστιαίο σημείο της Ν(0,) οδηγεί α αμέσως στο συμπέρασμα ότι στο 00(-α)% των περιπτώσεων η πραγματική τιμή του μ ανήκει στο διάστημα με άκρα σ Χ ± z α. (Στην περίπτωση που η διασπορά σ του πληθυσμού είναι άγνωστη και χρησιμοποιείται η εκτίμηση της S X, η κατανομή του λόγου μ είναι σ η t με - βαθμούς ελευθερίας και τα άκρα του 00(-α)% διαστήματος εμπιστοσύνης είναι ως γνωστό 35
21 S Χ ± t-,-α. Εδώ t -,-α/ συμβολίζει το (-α/) ποσοστιαίο σημείο της κατανομής t με - βαθμούς ελευθερίας. Για την περίπτωση της δειγματοληψίας χωρίς επανάθεση από ένα πεπερασμένο πληθυσμό μεγέθους Ν, έχει επίσης αποδειχθεί η ισχύς της κανονικής προσέγγισης της κατανομής του μέσου X κάτω από ορισμένες συνθήκες. Και πάλι, το ερώτημα που αντιμετωπίζει ο ερευνητής είναι πόσο μεγάλο πρέπει να είναι το μέγεθος του δείγματος ώστε η κανονική προσέγγιση να είναι ικανοποιητική. Για πληθυσμούς με μακριά δεξιά ουρά, ένας πρόχειρος κανόνας είναι ο > 5G, όπου η τιμή G είναι γνωστή ως μέτρο ασυμμετρίας του Fisher και ορίζεται από την σχέση 3 G = (y 3 i μ) σ i = ή, ισοδύναμα, G y 3μ y μ 3 3 = 3 i i + σ i = i = (βλέπε π.χ. Ι. Πανάρετου και Ε. Ξεκαλάκη: Εισαγωγή στη Στατιστική Σκέψη, Τόμος Ι (Περιγραφική Στατιστική), Αθήνα 993). Ο κανόνας αυτός στηρίζεται στην υπόθεση ότι οποιεσδήποτε ροπές της κατανομής τάξης μεγαλύτερης του 3 παίζουν αμελητέο ρόλο στον καθορισμό του. Έτσι, υπολογίζοντας (ή εκτιμώντας) το G ενός συγκεκριμένου πληθυσμού, μπορούμε να έχουμε μια ιδέα όσο αφορά το απαιτούμενο δειγματικό μέγεθος. 36
22 Κλάση Πίνακας.5. Κατανομή συχνότητας καλλιεργημένων εκτάσεων (σε εκτάρια) 556 αγροικιών y i (σε κωδικοποιημένη κλίμακα) Συχνότητα ν i ν i y i ν y i 3 i ν i y i Σύνολα Παράδειγμα: Τα (κωδικοποιημένα) δεδομένα του πίνακα.5. αναφέρονται στην έκταση (σε εκτάρια) που χρησιμοποιήθηκε για καλλιέργεια από κάθε μια από 556 αγροικίες στην πολιτεία της Νέας Υόρκης. Τα δεδομένα αυτά προέρχονται από μια σειρά μελετών που έγιναν το 95 και στηρίχθηκαν στην επανειλημμένη χρήση τυχαίων δειγμάτων μεγέθους 00 από τον πληθυσμό αυτών των αγροικιών. Οι μελέτες αυτές είχαν σκοπό την συμπερασματολογία για την κατανομή του X και ορισμένων άλλων χαρακτηριστικών που παρουσιάζουν ενδιαφέρον στις έρευνες διαχείρισης αγροικιών. 37
23 Ο υπολογισμός του G δεν επηρεάζεται από το γεγονός ότι τα δεδομένα είναι κωδικοποιημένα εφ όσον το G είναι καθαρός αριθμός. Έχουμε Ν = νi = 556, νiyi 836.7, μ = = = νiyi = =, νiyi , = = νiyi, σ= μ = =.99 3 ν i(yi - μ) = (.50486) (6.3939) + (.50486) = = 5.4. Άρα G =.9 και, επομένως, 5(.9) = Για δείγματα μεγέθους 00 βρέθηκε ότι η κατανομή του X δεν διαφέρει στατιστικά σημαντικά από την κανονική κατανομή. Κάτω από τις παραπάνω προϋποθέσεις έχει λοιπόν αποδειχθεί ότι η κατανομή του μέσου X ενός απλού τυχαίου δείγματος μεγέθους που έχει επιλεγεί χωρίς επανάθεση από ένα πεπερασμένο πληθυσμό μεγέθους Ν με μέση τιμή μ και διασπορά σ είναι κατά προσέγγιση η 38
24 σ ( μ, ( )). Επομένως, ισχύει ότι X μ σ ( f)/ Ν(0, ) και, άρα, X μ P z < α = α σ ( )/(). Η τελευταία σχέση οδηγεί στο εξής 00(-α)% διάστημα εμπιστοσύνης για την μέση τιμή μ του πληθυσμού f f X z α, X z α σ +. Όταν η διασπορά δεν είναι γνωστή, χρησιμοποιείται μια εκτίμησή της, όπως αυτή δίνεται από την αμερόληπτη εκτιμήτρια S = (Xi X ). i = Τότε, όπως και στην περίπτωση του άπειρου πληθυσμού, X μ S ( f)/ t 39
25 και, επομένως, τα άκρα του 00(-α)% διαστήματος εμπιστοσύνης είναι τα f X ± t, α S. Προφανώς, επειδή Ŷ= X, ένα 00(-α)% διάστημα εμπιστοσύνης για το συνολικό μέγεθος y= yi έχει άκρα i= f Ν( X ± t, α S ). Παράδειγμα: Στο παράδειγμα του δείγματος των υπογραφών, ένα 80% διάστημα εμπιστοσύνης για τον πραγματικό συνολικό αριθμό των υπογραφών που συνελέγησαν έχει άκρα 40 f (X ± t49,0.90 S ). Από τους πίνακες της κατανομής t, βρίσκουμε ότι t 49, 0.90 =.99. Άρα το 80% διάστημα εμπιστοσύνης είναι το (807, 669). (Η ακριβής καταμέτρηση των υπογραφών έδωσε ως αποτέλεσμα y =045)..6 Εκτίμηση ενός Λόγου Έστω πληθυσμός μεγέθους Ν και έστω x i και y i οι τιμές δύο διαφορετικών χαρακτηριστικών της i μονάδας του πληθυσμού, i =,,,. (Για παράδειγμα, x i μπορεί να συμβολίζει το ενοίκιο που πληρώνει η i οικογένεια και y i το εισόδημά της, ή x i μπορεί να αντιπροσωπεύει τις πωλήσεις της i επιχείρησης σε κάποιο μήνα και y i τις πωλήσεις της σε κάποιο προηγούμενο μήνα). Τότε, x = xi και i=
26 y = yi αντιπροσωπεύουν τις συνολικές τιμές των δυο αυτών i= χαρακτηριστικών και πολλές φορές στην πράξη μας ενδιαφέρει να εκτιμήσουμε τον λόγο yi y i/ μ i i= y R = = = =. μx xi x i/ i= i= Δηλαδή, μας ενδιαφέρει να εκτιμήσουμε τον λόγο των συνολικών μεγεθών x και y ή τον λόγο των μέσων τιμών μ x και μ y των δύο χαρακτηριστικών. Η εκτιμήτρια που χρησιμοποιείται για τον σκοπό αυτό είναι η Yi ˆR Y = = i=, X X i i= όπου {Χ, Χ,, Χ }, {Y, Y,, Y }, είναι οι τιμές των μονάδων ενός απλού τυχαίου δείγματος μεγέθους για τα δύο υπό εξέταση χαρακτηριστικά και X, Y οι μέσοι των τιμών αυτών αντίστοιχα. Για την αξιολόγηση της ακριβείας της εκτιμήτριας αυτή και την εξαγωγή συμπερασμάτων, είναι αναγκαίος ο προσδιορισμός της κατανομής της και του τυπικού της σφάλματος. Για μικρές τιμές του η κατανομή της Rˆ δεν είναι κανονική. Αντίθετα, είναι ασύμμετρη προς τα δεξιά (έχει μακριά δεξιά ουρά). Επί πλέον, η Rˆ δεν είναι αμερόληπτη εκτιμήτρια του R. Για μεγάλες όμως τιμές του, η κατανομή της Rˆ τείνει στην κανονική κατανομή και ισχύει το εξής θεώρημα. 4
27 Θεώρημα.6.: Αν { Χ, Χ,, Χ }, { Y, Y,, Y }, X, Y, {x, x,, x Ν }, {y, y,, y Ν } και μ x και μ y ορίζονται όπως προηγουμένως, τότε για αρκετά μεγάλο ( ) η στατιστική συνάρτηση Y ˆR = X είναι αμερόληπτη εκτιμήτρια του λόγου R = μ y / μ x και ισχύει ότι ( ˆ ) VR f = μ x i= i i. (.6.) ( y Rx ) Απόδειξη: Ισχύει ότι Y Y RX ˆR R = R =. X X Αλλά ο μέσος ενός απλού τυχαίου δείγματος είναι συνεπής εκτιμήτρια της μέσης τιμής του πληθυσμού. Άρα, για μεγάλες τιμές του, η τιμή του μέσου X δεν διαφέρει πολύ από την μ x και, επομένως, ισχύει κατά προσέγγιση ότι ˆR R Y RX. μx Κατά συνέπεια, ( ˆ ) ( ) ( y x) ER R EY RX μ Rμ R R 0 μ = x μ = =. x 4
28 Άρα, με την προσέγγιση που θεωρήθηκε, αποδείχθηκε ότι η Rˆ είναι αμερόληπτη εκτιμήτρια του R. Επομένως, V(R) ˆ = E(Rˆ R) E(Y RX ). μ x Αλλά η τυχαία μεταβλητή Y -R X είναι ο μέσος του απλού τυχαίου δείγματος Υ - RX, Υ RX,, Υ RX που προέρχεται από τον πληθυσμό {d, d,, d }, όπου d i = y i - Rx i, i =,,, με μέση τιμή d = μ y - Rμ x = 0. Άρα, και, κατά συνέπεια, Ε( Y -RX ) = d = 0 ( ) μ x V(R) ˆ = V Y RX ( RX ) = E Y σd = d i = i= (yi Rx i) =, ο.ε.δ. i= Μια εκτιμήτρια της V(Rˆ ) είναι η στατιστική συνάρτηση 43
29 ˆ (Yi RX i) S i R = = X ˆ ˆ Yi R XiYi+ R Xi = i= i= i= X. Πίνακας.6. Μέγεθος, ετήσιο εισόδημα και ετήσια δαπάνη για φαγητό 33 οικογενειών (σε δεκάδες ευρώ) Οικογένεια Χ () Χ () Υ Οικογένεια Χ () Χ () Υ Σύνολο
30 Παράδειγμα: Από απλό τυχαίο δείγμα 33 οικογενειών που επελέγη από κάποιο πληθυσμό, συνελέγησαν στοιχεία για το μέγεθος (Χ () ) των οικογενειών, το ετήσιο εισόδημά τους (Χ () ) και την ετήσια δαπάνη τους για φαγητό (Υ). Τα αποτελέσματα συνοψίζονται στον πίνακα.6.. Να εκτιμηθεί (i) η μέση ετήσια δαπάνη για φαγητό ανά οικογένεια, (ii) η μέση ετήσια δαπάνη για φαγητό ανά άτομο και (iii) το ποσοστό του εισοδήματος που δαπανάται για φαγητό. Να υπολογισθεί το τυπικό σφάλμα των εκτιμήσεων αυτών. Λύση: Αγνοώντας την διόρθωση πεπερασμένου πληθυσμού, έχουμε 907. (i) Y 33 = = με τυπικό σφάλμα 33 Yi 33Y33 i 84 (33) (7.49) S = Y = = = (3) (33) (ii) Yi 907. ˆR = = = 7.38 () X 3 i με τυπικό σφάλμα 84 (4.75)(3595.5) + ( )(533) S = = ˆR (33) (3) (3.773) (iii) Yi 00 (907.) ˆR = 00 = % = 37.9% () X 394 i 45
31 με τυπικό σφάλμα S = ˆR Παρατήρηση: Προβλήματα, τα οποία απαιτούν την εκτίμηση του λόγου δύο μεταβλητών, συναντώνται πολύ συχνά στην πράξη. Η συνηθέστερη περίπτωση είναι όταν η δειγματοληπτική μονάδα αποτελείται από ένα σύνολο στοιχειωδέστερων μονάδων και το ενδιαφέρον του ερευνητή εστιάζεται στην εκτίμηση της μέσης τιμής του πληθυσμού ανά στοιχειώδη μονάδα. Τυπικό παράδειγμα αποτελεί η περίπτωση (ii) του προηγούμενου παραδείγματος. Λόγοι δύο μεταβλητών εμφανίζονται επίσης σε προβλήματα στα οποία ενδιαφέρει η μελέτη ενός ποσοτικού χαρακτηριστικού ως ποσοστού ενός άλλου ποσοτικού χαρακτηριστικού (περίπτωση (iii) του προηγούμενου παραδείγματος). Τέλος, προβλήματα σύγκρισης δύο χαρακτηριστικών ενός πληθυσμού ανάγονται επίσης σε προβλήματα εκτίμησης του λόγου δύο κατάλληλων μεταβλητών..7 Εκτίμηση Μέσων Τιμών και Συνολικών Μεγεθών Υποπληθυσμών Ας υποθέσουμε ότι ένα απλό τυχαίο δείγμα μεγέθους επιλέγεται από κάποιο πεπερασμένο πληθυσμό μεγέθους Ν. Έστω Ν 0 ο αριθμός των μονάδων του πληθυσμού που ανήκει σε κάποιο υποσύνολο του πληθυσμού και 0 ο αριθμός των μονάδων του δείγματος που ανήκουν σ αυτό το υποσύνολο. Τότε, αποδεικνύεται η εξής πρόταση: Πρόταση.7.: Το υποσύνολο 0 μονάδων του αρχικού τυχαίου δείγματος αποτελεί ένα απλό τυχαίο δείγμα από τον υποπληθυσμό των 0 Ν 0 μονάδων και ισχύει ότι E =. 0 46
32 Απόδειξη: Για το πρώτο μέρος της πρότασης, αρκεί να δειχθεί ότι όλα τα δυνατά δείγματα μεγέθους 0 είναι ισοπίθανα. Έστω ένα απλό τυχαίο δείγμα μεγέθους από τον αρχικό πληθυσμό. Υπάρχουν δυνατά δείγματα μεγέθους. Σε κάθε ένα από αυτά, 0 μονάδες ανήκουν στον υπ όψη υποπληθυσμό και - 0 δεν 0-0 ανήκουν σ αυτόν με τρόπους. Επομένως, η πιθανότητα με 0-0 την οποία μια οποιαδήποτε επιλογή 0 μονάδων από τις ανήκει στον υπό εξέταση υποπληθυσμό είναι ίση με Άρα, όλα τα (υπο)δείγματα μεγέθους 0 είναι ισοπίθανα. Για την απόδειξη του δεύτερου συμπεράσματος, έστω και Τότε, Επομένως, αν η i μοναδα του δειγματος Xi = ανηκει στον υποπληθυσμο, 0 διαφορετικα αν η i μοναδα του πληθυσμου xi = ανηκει στον υποπληθυσμο 0 διαφορετικα. Χi = 0 και xi = 0 i= i=. 47
33 0 E = E X i = xi = 0 0 i 0 = i=, ο.ε.δ. Αυτό που ουσιαστικά αποδείχθηκε είναι ότι κάθε απλό τυχαίο δείγμα από ένα πληθυσμό περιέχει ένα απλό τυχαίο δείγμα από οποιονδήποτε υποπληθυσμό. Η σημασία αυτού του συμπεράσματος, όσο αφορά τις εφαρμογές, είναι μεγάλη. Παρέχει την δυνατότητα στον ερευνητή να χρησιμοποιήσει πληροφορίες από το δείγμα για την συναγωγή συμπερασμάτων όχι μόνο για ολόκληρο τον πληθυσμό αλλά και για οποιονδήποτε υποπληθυσμό. Για παράδειγμα, με βάση ένα απλό τυχαίο δείγμα από κάποιο πληθυσμό εργαζόμενων ατόμων είναι δυνατή η μελέτη της κατανομής του εισοδήματος σε ολόκληρο τον πληθυσμό αλλά και παράλληλα σε υποπληθυσμούς, όπως οι άνδρες ηλικίας ετών ή οι γυναίκες με δύο παιδιά κ.λ.π. Οι υποπληθυσμοί στους οποίους μπορεί να διαιρεθεί ένας πληθυσμός ονομάζονται συνήθως περιοχές μελέτης. Έστω ο πληθυσμός {y, y,, y } και έστω ότι κάθε μονάδα του πληθυσμού αυτού ανήκει σε ένα από k υποπληθυσμούς. Τότε, Ν=Ν +Ν + +Ν k, όπου j αντιπροσωπεύει το μέγεθος του j υποπληθυσμού. Κατά συνέπεια, αν Χ, Χ,, Χ είναι ένα απλό τυχαίο δείγμα μεγέθους ισχύει ότι = k, όπου j είναι το μέγεθος του τμήματος του δείγματος του οποίου οι (j) μονάδες ανήκουν στην j περιοχή. Έστω ότι y αντιπροσωπεύει την i i (j) i μονάδα της j περιοχής του πληθυσμού και X την i μονάδα του τυχαίου δείγματος που αντιστοιχεί στην j περιοχή. Τότε, η μέση τιμή και η διασπορά του j υποπληθυσμού δίνονται προφανώς από τους τύπους j (j) μ j = yi j i = 48
34 και j (j) j (y i μj) j i = σ =, αντίστοιχα, ενώ, σύμφωνα με την θεωρία που αναπτύχθηκε στα προηγούμενα, οι αμερόληπτες εκτιμήτριές τους είναι οι στατιστικές συναρτήσεις και j (j) X = X j i j i= j (j) j = i j j i = S (X X ), αντίστοιχα. Προφανώς η εκτιμήτρια του τυπικού σφάλματος της εκτιμήτριας X είναι ίση με j Sj j S X = j j j Παρατήρηση: Αν η τιμή του μεγέθους του j υποπληθυσμού, Ν j, δεν είναι γνωστή, μπορεί να χρησιμοποιηθεί στην θέση του λόγου j / Ν j o λόγος / για τον υπολογισμό της διόρθωσης πεπερασμένου πληθυσμού. Αυτό είναι απόρροια του γεγονότος ότι στην απλή τυχαία δειγματοληψία η τιμή j / Ν j είναι αμερόληπτη εκτίμηση της τιμής / (πρόταση.7.). Στην περίπτωση αυτή -/ SX = S j j. j Για την εκτίμηση του συνολικού μεγέθους 49
35 j (j) (j) y = yi, i= χρησιμοποιείται η στατιστική συνάρτηση (j) Ŷ = jsx. j Αυτή, σύμφωνα με την θεωρία των προηγουμένων παραγράφων, είναι αμερόληπτη εκτιμήτρια του y j με τυπικό σφάλμα εκτιμώμενο από την στατιστική συνάρτηση S = (j) j SX Ŷ j Η παραπάνω εκτιμήτρια του y (j) προϋποθέτει γνώση της τιμή του Ν j. Στην πράξη όμως πολύ σπάνια συμβαίνει να είναι γνωστή αυτή η τιμή. Στις περιπτώσεις αυτές ως εκτιμήτρια του μεγέθους y (j) χρησιμοποιείται η συνάρτηση j (j) (j) Ŷ = X i (.7.) i = Η λογική πίσω από την επιλογή αυτής της στατιστικής συνάρτησης ως εκτιμήτριας του y (j) γίνεται ευκολότερα αντιληπτή με την βοήθεια της επιχειρηματολογίας που ακολουθεί. Έστω και 50 (j) αν η i μοναδα του πληθυσμου y i yi = ανηκει στην j περιοχη, i =,,, 0 διαφορετικα (j) αν η i μοναδα του δειγματος X X i i = ανηκει στην j περιοχη, i =,,,. 0 διαφορετικα Τότε { y, y,, y } είναι ένα σύνολο τιμών από τις οποίες Ν j είναι ίσες με τις τιμές των Ν j μονάδων της j περιοχής και Ν- Ν j είναι ίσες με 0.
36 Επίσης X, X,, X είναι μια ακολουθία τυχαίων μεταβλητών, από (j) (j) τις οποίες j ταυτίζονται με τις τιμές X,...,X και - j είναι ίσες με j 0. Άρα j (j) (j) (i) y = yi = yi i= i= j (j) (ii) X = ' X i = X i i= i= Επομένως, μια εκτιμήτρια του συνολικού μεγέθους y (j) είναι η στατιστική συνάρτηση j (j) (j) Ŷ = X ' = X i i = (j) Θεώρημα.7.: Η στατιστική συνάρτηση Ŷ είναι αμερόληπτη εκτιμήτρια του συνολικού μεγέθους y (j) με τυπικό σφάλμα εκτιμώμενο από την στατιστική συνάρτηση όπου S (j) Ŷ = S, (.7.) j (j) X i j (j) i= S = (X i ) (.7.3) i= 5
37 Απόδειξη: Αμεροληψία: Ισχύει ότι j (j) (j) (j) E(Y ˆ ) = E ( X ' ) = E ( X ) = y i = yi = y i= i = i = Υπολογισμός τυπικού σφάλματος: Είναι προφανές ότι η διασπορά των τιμών y,, y είναι ίση με y i i= σ' = (y i) i= j (j) y i j (j) i= = (y i ) i= και, επομένως, μια αμερόληπτη εκτιμήτρια του σ δίνεται από την (.7.3). Κατά συνέπεια, ˆ (j) σ V(Y ) = V(X ) =. Η τελευταία σχέση οδηγεί στην (.7.) και ολοκληρώνει την απόδειξη του θεωρήματος. Παράδειγμα.7.: Από μία λίστα 4 διαφορετικών τύπων δαπανών των νοικοκυριών μιας περιοχής επελέγη ένα απλό τυχαίο δείγμα 80 δαπανών του νοικοκυριού. Από τους 80 τύπους δαπανών 8 5
38 θεωρήθηκαν μη καθοριστικής σημασίας. Το συνολικό ύψος των 5 καθοριστικών δαπανών ήταν ίσο με ευρώ και το άθροισμα των τετραγώνων ίσο με (ευρώ). Να εκτιμηθεί το συνολικό ύψος των δαπανών ενός νοικοκυριού και να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. Λύση: Προφανώς, αν είναι ο αριθμός των καθοριστικών δαπανών στο δείγμα ισχύει ότι =80, =5, 5 5 X () i () = και (X i ) = i= i= Άρα 5 () () 4 () 4 Ŷ = X i X i (343.5) 46 = 80 = 80 = i= i= με τυπικό σφάλμα 80 4 S () = 4 S, Ŷ 80 όπου, από την σχέση (.7.3), (343.5) S = =. 80 Δηλαδή τελικά S () = Ŷ = ΑΣΚΗΣΕΙΣ. Έστω ο πληθυσμός μεγέθους Ν=6 που αποτελείται από τις τιμές 8,3,,,4 και 7. Να υπολογισθεί ο μέσος όλων των δυνατών δειγμάτων 53
39 μεγέθους = και να επαληθευθεί ότι αποτελεί μια αμερόληπτη εκτιμήτρια της μέσης τιμής μ του πληθυσμού με διασπορά σ (-f)/.. Για τον ίδιο πληθυσμό, να υπολογισθεί η διασπορά όλων των δυνατών δειγμάτων μεγέθους 3 και να επαληθευθεί ότι Ε(S )=σ. 3. Ένα απλό τυχαίο δείγμα 30 νοικοκυριών επελέγη από ένα τμήμα 4848 νοικοκυριών κάποιας πόλης. Οι αριθμοί των προσώπων ανά νοικοκυριό στο δείγμα ήταν οι εξής: α) Να εκτιμηθεί ο συνολικός αριθμός των κατοίκων της περιοχής και να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. β) Να υπολογισθεί η πιθανότητα με την οποία η εκτίμηση διαφέρει το πολύ κατά 0% από τον πραγματικό αριθμό. 4. Σκοπός μιας μελέτης είναι η δυνατότητα χρησιμοποίησης ενός τυχαίου δείγματος για την ταχύτερη απογραφή του αποθέματος μιας αποθήκης. Η καταμέτρηση της αξίας των ειδών στα 36 ράφια της αποθήκης έδωσε τα εξής αποτελέσματα (σε ευρώ) Η εκτίμηση της συνολικής αξίας του αποθέματος δεν πρέπει να διαφέρει από την πραγματική αξία περισσότερο από 00 ευρώ εκτός από μια στις 0 περιπτώσεις. Θα συμφωνούσατε ότι ένα απλό τυχαίο δείγμα μεγέθους πληροί τις προϋποθέσεις αυτές; (Δίνεται ότι Σy i =38 και Σy i =3,68). 5. Από μια λίστα 468 σχολών διετούς φοίτησης επελέγη ένα απλό τυχαίο δείγμα 00 σχολών. Το δείγμα περιείχε 54 δημόσιες και 46 ιδιωτικές σχολές. Ο πίνακας που ακολουθεί συνοψίζει τα αποτελέσματα της δειγματοληψίας όσο αφορά τους αριθμούς των φοιτητών (Υ i ) και καθηγητών (Χ i ). 54
40 Σχολές ΣΥ i ΣΥ i ΣΧ i ΣΧ i ΣΧ i Υ i Δημόσιες Ιδιωτικές α) Για κάθε τύπο σχολής, να εκτιμηθεί ο λόγος του αριθμού των φοιτητών προς τον αριθμό των καθηγητών. β) Να υπολογισθούν τα τυπικά σφάλματα των εκτιμήσεων. γ) Για τις δημόσιες σχολές να κατασκευασθεί ένα 90% διάστημα εμπιστοσύνης για την αναλογία φοιτητών / καθηγητών σε ολόκληρο τον πληθυσμό. 6. Στην προηγούμενη άσκηση να ελεγχθεί η υπόθεση ότι οι λόγοι αριθμού φοιτητών προς αριθμό καθηγητών διαφέρουν σημαντικά στους δυο τύπους σχολών. 7. Να εκτιμηθεί ο συνολικός αριθμός των καθηγητών των δημοσίων σχολών της άσκησης 5 α) αν είναι γνωστό ότι ο συνολικός αριθμός των δημοσίων σχολών είναι 5 και β) αν το στοιχείο αυτό δεν είναι γνωστό. Και στις δύο περιπτώσεις να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. 8. Δυο οδοντίατροι Α και Β κάνουν μια έρευνα για την κατάσταση των δοντιών 00 παιδιών ενός χωριού. Ο Α επιλέγει ένα απλό τυχαίο δείγμα 0 παιδιών και μετρά τον αριθμό των χαλασμένων δοντιών για κάθε παιδί με τα εξής αποτελέσματα: αριθμός χαλασμένων δοντιών ανά παιδί αριθμός παιδιών Ο Β χρησιμοποιώντας την ίδια οδοντιατρική τεχνική εξετάζει και τα 00 παιδιά και καταγράφει 60 παιδιά τα οποία δεν έχουν χαλασμένα δόντια. 55
41 Να εκτιμηθεί ο συνολικός αριθμός των χαλασμένων δοντιών όλων των παιδιών του χωριού. α) χρησιμοποιώντας τα αποτελέσματα του Α και β) χρησιμοποιώντας τα αποτελέσματα και των δυο οδοντιάτρων. 9. Ένα απλό τυχαίο δείγμα μεγέθους 3 επιλέγεται με επανάθεση από ένα πληθυσμό μεγέθους Ν. Να δειχθεί ότι οι πιθανότητες Ρ i το δείγμα να περιέχει i διαφορετικές μονάδες του πληθυσμού, i=,,3, δίνονται από τους τύπους Ρ = /Ν, Ρ = 3(Ν-)/Ν, Ρ 3 = (Ν-)(Ν-)/Ν..8 Ποιοτικά Χαρακτηριστικά Πολλές φορές μας ενδιαφέρει να εκτιμήσουμε τον συνολικό αριθμό ή το ποσοστό των μονάδων ενός πληθυσμού οι οποίες εμπίπτουν σε κάποια κατηγορία. Για παράδειγμα, πολλές δειγματοληπτικές έρευνες έχουν σαν σκοπό την εκτίμηση του ποσοστού ανεργίας, του ποσοστού θανατηφόρων τροχαίων ατυχημάτων ή το ποσοστό των ψηφοφόρων μιας πόλης ή χώρας υπέρ κάποιου κόμματος ή νομοθεσίας. Στα πλαίσια προβλημάτων αυτής της μορφής, οι μονάδες ενός πληθυσμού μεγέθους Ν ταξινομούνται σε δυο κατηγορίες: Α αν έχουν το χαρακτηριστικό που μας ενδιαφέρει και Α διαφορετικά. Ο ακριβής αριθμός των μονάδων του πληθυσμού που ανήκουν στην κατηγορία Α, έστω Ν Α, δεν είναι γνωστός, όπως επίσης άγνωστο είναι και το ποσοστό p = A των μονάδων αυτών. Η εκτίμηση αυτών των δυο μεγεθών είναι το αντικείμενο αυτής της ενότητας..8. Εκτίμηση Ποσοστών Έστω πληθυσμός μεγέθους Ν και έστω p το ποσοστό των μονάδων που ανήκουν σε κάποια κατηγορία Α. Ας υποθέσουμε ότι 56
42 επιθυμούμε να εκτιμήσουμε την παράμετρο p με βάση τις πληροφορίες (παρατηρήσεις) ενός απλού τυχαίου δείγματος μεγέθους. Η στατιστική συνάρτηση που φαίνεται να είναι η πιο κατάλληλη για τον σκοπό αυτό είναι η p ˆ = X, όπου Χ παριστάνει τον αριθμό των μονάδων του δείγματος που ανήκουν στην κατηγορία Α. Για τον υπολογισμό του τυπικού σφάλματος της εκτιμήτριας pˆ είναι δυνατόν να εφαρμοσθεί η θεωρία που αναπτύχθηκε στις προηγούμενες παραγράφους για τον μέσο X ενός απλού τυχαίου δείγματος, με την εισαγωγή των εξής βοηθητικών μεγεθών. Έστω αν η i μοναδα του πληθυσμου A y i = 0 διαφορετικα i =,,, και X i αν η i μοναδα του δειγματος A = 0 διαφορετικα i =,,,. Τότε, προφανώς A = yi, X = Xi i= i= p = yi = μ και ˆp = Xi = X. i = i = Άρα το πρόβλημα εκτίμησης του p και του Ν Α είναι ισοδύναμο με το πρόβλημα εκτίμησης της μέσης τιμής και του συνολικού ύψους των 57
43 τιμών ενός πληθυσμού, αντίστοιχα, του οποίου οι τιμές των μονάδων είναι 0 και. Προφανώς, y i = y i = A = p i= i= και X i = Xi = X= pˆ. i= i= Άρα, η διασπορά του πληθυσμού είναι ίση με σ = (yi p) i = y p = i = p p = = p ( p) (.8.) και μια εκτιμήτριά της παρέχεται από την στατιστική συνάρτηση S = p ˆ ( p) ˆ. Θεώρημα.8.: Η στατιστική συνάρτηση pˆ =Χ/ είναι αμερόληπτη εκτιμήτρια της παραμέτρου p και ισχύει ότι 58
44 V(pˆ) = p( p). Απόδειξη: Αρκεί να παρατηρηθεί ότι και Ε( pˆ ) = Ε( X ) = μ = p ( ˆ) = VX ( ) Vp σ = = p( p), (από την (.8.)) ο.ε.δ. Πόρισμα : Η στατιστική συνάρτηση εκτιμήτρια του Ν Α με διασπορά Y ˆ A = pˆ είναι μια αμερόληπτη V(Y ˆ A) = p( p). Θεώρημα.8.: Η στατιστική συνάρτηση p ˆ ( p) ˆ - S ˆp = είναι μια αμερόληπτη εκτιμήτρια της V( pˆ ). Απόδειξη: σˆ S =σ ˆ = ˆp X 59
45 S = p ˆ ( p) ˆ - = ( ) p ˆ ( p) ˆ - =. Πόρισμα : Η στατιστική συνάρτηση ( ) S = p ˆ ( p) ˆ ŶA είναι μια αμερόληπτη εκτιμήτρια της V(Y ˆ A ). Παράδειγμα: Από τους 304 φοιτητές ενός πανεπιστημίου επελέγη ένα απλό τυχαίο δείγμα 00 φοιτητών. Αν 38 από τους φοιτητές αυτούς ήταν υπέρ της εξωτερικής πολιτικής της χώρας τους, να εκτιμηθεί ο συνολικός αριθμός των φοιτητών του πανεπιστημίου που υποστηρίζουν την εξωτερική πολιτική της χώρας τους. Να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. Λύση: Ν = 304, = 00, X = 38. Άρα, pˆ = 0.9 και, επομένως, Yˆ A = pˆ = 578, S = (304) (84) (0.9) (0.8) /99 = 6686 ŶA S = 6686 = 8.8. ŶA 60
46 .8. Κατανομή της Εκτιμήτριας pˆ - Διαστήματα Εμπιστοσύνης για την Παράμετρο p Η ακριβής κατανομή της στατιστικής συνάρτησης pˆ μπορεί να προσδιορισθεί μέσω της κατανομής της τυχαίας μεταβλητής X= Xi, i= όπου X i, i =,,, ορίζονται όπως προηγουμένως. Επειδή P(X i =) = - P(X i =0) = p = A /, έπεται ότι η κατανομή της Χ είναι (α) διωνυμική, στην περίπτωση δειγματοληψίας με επανάθεση, οπότε r r A P(X r) A = = r, r =0,,, ή (β) υπεργεωμετρική, στην περίπτωση δειγματοληψίας χωρίς επανάθεση, οπότε A A P(X = r) = r r, r =0,,, Και στις δύο περιπτώσεις, η συνάρτηση κατανομής της στατιστικής συνάρτησης pˆ προσδιορίζεται από την σχέση F(z) ˆp = P(pˆ z) X = P z = P(X z) z = P(X = x). x= 0 Σημείωση: Το αποτέλεσμα της (α) ισχύει και στην περίπτωση δειγματοληψίας με ή χωρίς επανάθεση από άπειρο πληθυσμό. Μια καλή 6
47 προσέγγιση της κατανομής της Χ (και συνεπώς της pˆ ) παρέχεται από την κανονική κατανομή όταν p 5 και (-p) 5. Συγκεκριμένα, ισχύει στην περίπτωση αυτή ότι X p (0,) σ appr. x ή, ισοδύναμα, ˆp p (0,). σ appr. ˆp Κατά συνέπεια, ένα 00(-α)% διάστημα εμπιστοσύνης για την παράμετρο p έχει άκρα ˆp± z α σ ˆp (.8.) Στην θέση της τυπικής απόκλισης σ ˆp μπορεί να χρησιμοποιηθεί η εκτιμήτριά της, S. Ο λόγος είναι ότι η pˆ σ και, επομένως, για μεγάλο, η ˆp S είναι συνεπής εκτιμήτρια του ˆp S δεν διαφέρει πολύ από την ˆp σ. ˆp Συνήθως, στην ακτίνα του διαστήματος που ορίζεται από τα άκρα (.8.) εφαρμόζεται και η λεγόμενη διόρθωση συνεχείας, η οποία είναι ίση με /(). Άρα τελικά, τα 00(-α)% όρια εμπιστοσύνης για την παράμετρο p δίνονται από τους εξής τύπους: α) Δειγματοληψία με επανάθεση ή δειγματοληψία από άπειρο πληθυσμό (με ή χωρίς επανάθεση) p( ˆ p) ˆ ˆp± z α + (.8.3) β) Δειγματοληψία χωρίς επανάθεση από πεπερασμένο πληθυσμό 6
48 p( ˆ p) ˆ ˆp± z α + (.8.4) Σημείωση: Προφανώς, τα άκρα του 00(-α)% διαστήματος εμπιστοσύνης του Ν Α είναι ίσα με Ν (άκρα του 00(-α)% διαστήματος εμπιστοσύνης του p). Παράδειγμα: Από τα 500 ελαστικά αυτοκινήτων, που κατασκευάσθηκαν από μια εταιρεία σε μια συγκεκριμένη χρονική περίοδο, επελέγη ένα απλό τυχαίο δείγμα μεγέθους 00 που έδειξε ότι 37 από αυτά δεν συμφωνούσαν με τις προδιαγραφές. Να κατασκευασθεί ένα 95% διάστημα εμπιστοσύνης για τον συνολικό αριθμό των ελαστικών που δεν συμφωνούν με τις προδιαγραφές. Λύση: = 00, = 500, pˆ = 0.37 και z =.96. Άρα, από την (.8.4), το ζητούμενο 95% διάστημα εμπιστοσύνης έχει άκρα p( ˆ p) ˆ p ˆ ± z Δηλαδή, (0.37)(0.63) ± Επομένως, το 95% διάστημα εμπιστοσύνης για το συνολικό αριθμό των ελαστικών που δε συμφωνούν με τις προδιαγραφές είναι το διάστημα (40, 30). Παρατήρηση: Είναι προφανές ότι η παραπάνω θεωρία εφαρμόζεται και σε κάθε περιοχή μελέτης του αρχικού πληθυσμού. Ας υποθέσουμε ότι έχουμε την εξής διάταξη: 63
49 Περιοχή μελέτης k Κατηγορία Α Α Α Α Α Α αριθμός μονάδων δείγματος στην κατηγορία Χ -X Χ -X Χ k k -X k Τότε, προφανώς, ισχύει ότι Xi p ˆ ˆp i = i ( p) ˆ i S i ˆp = i i i i (i) X Ŷ i A = i S (i) = i Spˆ. Ŷ i i A Στην περίπτωση που η τιμή του Ν i είναι άγνωστη, ως εκτιμήτρια του Ν (i) A (του αριθμού των ατόμων της i περιοχής μελέτης του πληθυσμού που ανήκουν στην κατηγορία Α) χρησιμοποιείται η συνάρτηση (i) Ŷ A = Xi, της οποίας το τυπικό σφάλμα είναι ίσο με p ˆ i ( p) ˆ i S = Ŷ A, X όπου εδώ ˆp i i =..9 Το Μέγεθος του Δείγματος Το πρώτο ερώτημα με το οποίο βρίσκεται αντιμέτωπος ένας ερευνητής, όταν πρόκειται να κάνει μια δειγματοληπτική έρευνα, είναι πόσο μεγάλο πρέπει να είναι το δείγμα που θα χρησιμοποιήσει. Αν ορισμένοι παράγοντες, όπως το κόστος της δειγματοληψίας μιας μονάδας δεν λαμβάνονται υπ όψη, δεν υπάρχει βασική δυσκολία όσον αφορά τον 64
50 προσδιορισμό του μεγέθους του απαιτούμενου δείγματος. Η τιμή του θα πρέπει προφανώς να εξαρτάται από τον βαθμό ακρίβειας με την οποία ο ερευνητής επιθυμεί να εκτιμήσει την οποιαδήποτε παράμετρο του πληθυσμού. Πιο συγκεκριμένα, θα πρέπει να εξαρτάται από το μέγιστο ανεκτό σφάλμα της εκτίμησης και την πιθανότητα με την οποία αυτό είναι επιτρεπτό..9. Δειγματοληψία για την Εκτίμηση της Μέσης Τιμής ενός Πληθυσμού Για την περίπτωση εκτίμησης της μέσης τιμής μ ενός πληθυσμού με διασπορά σ, το ερώτημα σχετικά με το μέγεθος του δείγματος μπορεί, λαμβάνοντας υπ όψη τα παραπάνω, να διατυπωθεί ως εξής: Πόσο μεγάλο πρέπει να είναι το μέγεθος του δείγματος, ώστε, με πιθανότητα -α, το σφάλμα που κάνει ο ερευνητής εκτιμώντας την άγνωστη μέση τιμή μ με τον μέσο X του δείγματος να μην υπερβαίνει την τιμή e; Το ερώτημα αυτό ισοδυναμεί με το ερώτημα: Ποια είναι η τιμή του για την οποία ισχύει P( X μ e ) = α ; Είναι γνωστό ότι P( X μ e ) = α X μ e P = α. (.9.) σx σ X Η παραπάνω σχέση μπορεί να οδηγήσει στον προσδιορισμό της τιμής του, αν, για το συγκεκριμένο πρόβλημα, μπορεί να υποτεθεί ότι ο πληθυσμός είναι κανονικός ή κατά προσέγγιση κανονικός. Στην περίπτωση αυτή, 65
51 X μ Ν(0,). σx Τότε, η (.9.) ισχύει τότε και μόνο τότε αν e = z-α/ σx ή, ισοδύναμα, τότε και μόνο τότε αν σ e =. z α Λύνοντας την τελευταία εξίσωση ως προς έχουμε σ z = e α/ + σ z α/. (.9.) Από τον τύπο αυτό, είναι προφανές ότι αν Ν (περίπτωση απείρου πληθυσμού), τότε σ z -α/ =. e Αν, δηλαδή, 0, η τιμή του δειγματικού μεγέθους είναι η λύση της εξίσωσης σ e =. z α Στην πράξη, ως πρώτη προσέγγιση του, λαμβάνεται η τιμή 66
52 0 σ z-α/ = e (.9.3) και, ως τελική τιμή του, θεωρείται η τιμή 0 0, αν 0.05 = 0, αν 0 > (.9.4) Παρατήρηση: Αν η διασπορά σ του πληθυσμού είναι άγνωστη, τότε χρησιμοποιείται μια εκτίμησή της βασισμένη σε κάποιο προκαταρκτικό δείγμα μεγέθους 30. Παράδειγμα: Μια εταιρεία θέλει να εκτιμήσει τον μέσο μηνιαίο μισθό των 000 υπαλλήλων της προκειμένου να κάνει συγκρίσεις με τους μέσους μηνιαίους μισθούς άλλων εταιρειών. Αν από παλιά εμπειρία γνωρίζει ότι οι μισθοί των υπαλλήλων της είναι κανονικά κατανεμημένοι με τυπική απόκλιση 00 ευρώ, πόσο μεγάλο πρέπει να είναι το δείγμα ώστε με πιθανότητα 95% η εκτίμηση να μην απέχει από την πραγματική τιμή περισσότερο από 0 ευρώ; Λύση: α = 0.95, Ν = 000, σ = 5. Άρα z -α/ = z =.96 και, επομένως, από την (.9.3), έχουμε 00 (.96) 0 = = Επειδή, όμως 0 96 = = > 0.05,
53 έπεται, από την (.9.4), ότι 0 96 = = = Δειγματοληψία για την Εκτίμηση ενός Ποσοστού Ακολουθώντας την συλλογιστική της προηγούμενης παραγράφου, η τιμή του θα πρέπει να καθορισθεί έτσι ώστε ˆp p e P ( pˆ p e) = α P < = α σpˆ σpˆ e = z α/. σ ˆp Αλλά, p( p) σ ˆp =. Άρα, τελικά, z α/ p( p) =. (.0.) e + z p( p) e 68 α/ Προφανώς, η (.0.) δεν μπορεί να δώσει την λύση, αφού η τιμή του εξαρτάται από την τιμή της άγνωστης παραμέτρου p. Στην πράξη, συνήθως χρησιμοποιείται μια εκτίμηση της παραμέτρου p που βασίζεται σε παλαιότερη εμπειρία. Αν δεν υπάρχουν ενδείξεις όσον αφορά το ποια περίπου είναι η τιμή του p, τότε χρησιμοποιείται η συντηρητική τιμή p=/, η οποία μεγιστοποιεί το γινόμενο p(-p). (Πράγματι, το γινόμενο p(-p) = p-p γίνεται μέγιστο (p-p ) = 0 -p=0 p=/). Στην πράξη, και πάλι χρησιμοποιείται ως πρώτη προσέγγιση της τιμής του η τιμή
54 α/ 0 z p( p) =, e οπότε, τελικά, 0 0, αν 0.05 = 0, αν 0 > (0 ) (.0.) Παράδειγμα: Ένας ανθρωπολόγος θέλει να εκτιμήσει το ποσοστό των κατοίκων ενός απομακρυσμένου νησιού, οι οποίοι ανήκουν σε μια ορισμένη ομάδα αίματος. Το νησί έχει συνολικά 300 κατοίκους. Πόσο μεγάλο πρέπει να είναι το δείγμα που θα χρησιμοποιήσει, αν επιθυμεί να έχει πιθανότητα 90% να εκτιμήσει το πραγματικό ποσοστό με σφάλμα το πολύ ίσο με 5% ; Λύση: e =0.05, -α =0.90, p(-p) =/4. Άρα z -α/ = z 0.95 =.645 και κατά συνέπεια (.645) 0 = = (0.05) Επειδή 0 7 = = > 0.05, 300 έχουμε από την (.0.) ότι 7 = =
55 Σημείωση: Αν στο παράδειγμα αυτό ο ερευνητής είχε λόγους να πιστεύει ότι το ποσοστό p είχε μια τιμή μεταξύ 0% και 35%, τότε θα μπορούσε να είναι λιγότερο συντηρητικός όσον αφορά την τιμή του γινομένου p(-p) διαλέγοντας ως εκτίμηση του p την pˆ =0.35. Στην περίπτωση αυτή το απαιτούμενο δειγματικό μέγεθος θα ελαττωνόταν. Πράγματι, θα είχε σε πρώτη προσέγγιση την τιμή (.645) (0.35)(0.65) 0 = = (0.05) και τελικά (επειδή 0 47 = = > 0.05) = = ΑΣΚΗΣΕΙΣ. Σε ένα απλό τυχαίο δείγμα 00 ατόμων από ένα πληθυσμό 000 ατόμων, 0 άτομα ήταν υπέρ ενός νομοσχεδίου, 57 κατά και 3 δεν εξέφρασαν γνώμη. Να εκτιμηθεί ο συνολικός αριθμός των ατόμων του πληθυσμού που είναι υπέρ του νομοσχεδίου με ένα 95% διάστημα εμπιστοσύνης.. Αποτελούν τα αποτελέσματα της προηγούμενης άσκησης ένδειξη ότι η πλειοψηφία των ατόμων είναι υπέρ του νομοσχεδίου; (α=0.05) 3. Ένα απλό τυχαίο δείγμα 90 νοικοκυριών επελέγη από μια περιοχή κάποιας πόλης που περιείχε 488 νοικοκυριά. Κάθε οικογένεια 70
56 ερωτήθηκε αν ενοικίαζε ή όχι το σπίτι στο οποίο έμενε και αν είχε αποκλειστική χρήση λουτρού ή όχι. Τα αποτελέσματα ήταν τα εξής: Ιδιοκτήτες Ενοικιαστές Αποκλειστικό λουτρό 4 09 κοινό λουτρό 6 34 α) Για την περίπτωση των ενοικιαστών, να εκτιμηθεί το ποσοστό του πληθυσμού με αποκλειστικό λουτρό και να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. β) Να εκτιμηθεί ο συνολικός αριθμός ενοικιαστών του πληθυσμού με κοινό λουτρό και να υπολογισθεί το τυπικό σφάλμα της εκτίμησης. 4. Αν στην προηγούμενη άσκηση ήταν γνωστό ότι 756 οικογένειες του πληθυσμού ενοικιάζουν σπίτια, να δοθεί μια νέα εκτίμηση του αριθμού των ενοικιαστών χωρίς αποκλειστικό λουτρό και να εκτιμηθεί το τυπικό σφάλμα της. 5. Σε μια περιοχή 4000 νοικοκυριών πρόκειται να γίνει μια έρευνα για την εκτίμηση του ποσοστού των νοικοκυριών που διατηρούν δυο αυτοκίνητα. Το πραγματικό ποσοστό υπολογίζεται μεταξύ 5 και 0 τοις εκατό. Αν το τυπικό σφάλμα της εκτίμησης δεν πρέπει να υπερβαίνει το %, με πιθανότητα 90%, πόσο μεγάλο πρέπει να είναι το δείγμα; 6. Μια δειγματοληπτική έρευνα πρόκειται να γίνει για να εκτιμηθεί το ποσοστό των υπαλλήλων μιας εταιρείας οι οποίοι παραπονούνται ότι ο μισθός τους δεν ανταποκρίνεται στην προσφορά εργασίας τους. Πόσο μεγάλο πρέπει να είναι το δείγμα που θα επιλεγεί από τους 480 υπαλλήλους της εταιρείας, αν η εκτίμηση δεν πρέπει να διαφέρει από το πραγματικό ποσοστό περισσότερο από 0.0 με πιθανότητα 90%; 7. Πόσο μεγάλο πρέπει να είναι το δείγμα που απαιτείται για την κατασκευή ενός 95% διαστήματος εμπιστοσύνης για την μέση 7
3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)
3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί
5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)
5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) Συχνά, είναι ταχύτερη και ευκολότερη η επιλογή των μονάδων του πληθυσμού, αν αυτή γίνεται από κάποιο κατάλογο ξεκινώντας από κάποιο τυχαίο αρχικό σημείο
6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)
6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) Από την θεωρία που αναπτύχθηκε στα προηγούμενα κεφάλαια, φαίνεται ότι μια αλλαγή στον σχεδιασμό της δειγματοληψίας και, κατά συνέπεια, στην μέθοδο εκτίμησης
2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ
.5. ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ Η μέθοδος κατασκευής διαστήματος εμπιστοσύνης για την πιθανότητα που περιγράφεται στην προηγούμενη ενότητα μπορεί να χρησιμοποιηθεί για την κατασκευή διαστημάτων
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες
Στατιστική Συμπερασματολογία
4. Εκτιμητική Στατιστική Συμπερασματολογία εκτιμήσεις των αγνώστων παραμέτρων μιας γνωστής από άποψη είδους κατανομής έλεγχο των υποθέσεων που γίνονται σε σχέση με τις παραμέτρους μιας κατανομής και σε
Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης
1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από
Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν
2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.
2.6 ΟΡΙΑ ΑΝΟΧΗΣ Το διάστηµα εµπιστοσύνης παρέχει µία εκτίµηση µιας άγνωστης παραµέτρου µε την µορφή διαστήµατος και ένα συγκεκριµένο βαθµό εµπιστοσύνης ότι το διάστηµα αυτό, µε τον τρόπο που κατασκευάσθηκε,
Γ. Πειραματισμός - Βιομετρία
Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται
Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 2015 Πληθυσμός: Εισαγωγή Ονομάζεται το σύνολο των χαρακτηριστικών που
Στατιστική. Εκτιμητική
Στατιστική Εκτιμητική Χατζόπουλος Σταύρος 28/2/2018 και 01 /03/2018 Εισαγωγή Το αντικείμενο της Στατιστικής είναι η εξαγωγή συμπερασμάτων που αφορούν τον πληθυσμό ή το φαινόμενο που μελετάμε, με τη βοήθεια
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Τυχαίο Δείγμα
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας
ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ
ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται
2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ
.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα
Δειγματοληψία στην Ερευνα. Ετος
ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος
Το Κεντρικό Οριακό Θεώρημα
Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που
Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς
Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Η μηδενική υπόθεση είναι ένας ισχυρισμός σχετικά με την τιμή μιας πληθυσμιακής παραμέτρου. Είναι
Στατιστική Επιχειρήσεων ΙΙ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν
Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )
Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. ) Πίνακας Περιεχομένων Εργασία η... Θέμα ο :... Θέμα ο :... 4 Θέμα 3 ο :...
3. Κατανομές πιθανότητας
3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος
6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ
6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Το 1965, από τον Conover και πάλι προτάθηκε ένας άλλος έλεγχος τύπου Smirnov για k ανεξάρτητα δείγματα. Ο έλεγχος αυτός διαφέρει από τον προηγούμενο
Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής
Ενότητα 2 Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής Ένας από τους βασικούς σκοπούς της Στατιστικής είναι η εκτίμηση των χαρακτηριστικών ενός πληθυσμού βάσει της πληροφορίας από ένα δείγμα.
ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ
Ε. ΞΕΚΑΛΑΚΗ Καθηγήτριας του Τμήματος Στατιστικής του Οικονομικού Πανεπιστημίου Αθηνών ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ B ΕΚΔΟΣΗ ΑΘΗΝΑ 2004 ΠΡΟΛΟΓΟΣ Η συλλογή και επεξεργασία δεδομένων από πεπερασμένους πληθυσμούς
Στατιστική Επιχειρήσεων ΙΙ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #: Επαγωγική Στατιστική - Δειγματοληψία Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ Ενότητα # 7: Δειγματοληψία Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης
Το Κεντρικό Οριακό Θεώρημα
Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής
Το Κεντρικό Οριακό Θεώρημα
Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση
Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ
Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21
ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις
Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες
Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω
Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα
Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια
Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου
Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου Στατιστική Συμπερασματολογία Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων εκτιμήτρια συνάρτηση, ˆ θ σημειακή εκτίμηση εκτίμηση με διάστημα εμπιστοσύνης
Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.
Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ
5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV
5. Ο ΕΛΕΓΧΟΣ SMIRNOV Έστω δύο ανεξάρτητα τυχαία δείγματα, 2,..., n και, 2,..., m n και m παρατηρήσεων πάνω στις τυχαίες μεταβλητές και, αντίστοιχα. Έστω, επίσης, ότι F (), (, ) και F (y), y (, ) είναι
Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς
Διαστήματα εμπιστοσύνης Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς Διαστήματα εμπιστοσύνης Το διάστημα εμπιστοσύνης είναι ένα διάστημα αριθμών
Δειγματοληψία στην εκπαιδευτική έρευνα. Είδη δειγματοληψίας
Δειγματοληψία στην εκπαιδευτική έρευνα Είδη δειγματοληψίας Γνωρίζουμε ότι: Με τη στατιστική τα δεδομένα γίνονται πληροφορίες Στατιστική Δεδομένα Πληροφορία Αλλά από πού προέρχονται τα δεδομένα; Πώς τα
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ
Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών
Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό
Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες
Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού
Στατιστική Συμπερασματολογία
Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών
Στατιστική Επιχειρήσεων ΙΙ
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #3: Εκτιμητική Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν εκπαιδευτικό
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ
ΚΕΦΑΛΑΙΟ 11 ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ Θα εισαγάγουμε την έννοια του τυχαίου αριθμού με ένα παράδειγμα. Παράδειγμα: Θεωρούμε μια τυχαία μεταβλητή με συνάρτηση πιθανότητας η οποία σε
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές
Δειγματικές Κατανομές
Δειγματικές Κατανομές Στατιστική συνάρτηση ή στατιστική Δειγματική κατανομή - Εκτιμητής Τα άγνωστα στοιχεία του πληθυσμού λέγονται παράμετροι. Τα συμπεράσματα για μια παράμετρο εξάγονται με τη βοήθεια
Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών
Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για
10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης
10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης Διαστήματα εμπιστοσύνης για τον μέσο ενός πληθυσμού (Μικρά δείγματα) Άσκηση 10.7.1: Ο επόμενος πίνακας τιμών δείχνει την αύξηση σε ώρες ύπνου που είχαν
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500
Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της
HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη
HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Επιλογή δείγματος Κατερίνα Δημάκη Αν. Καθηγήτρια Τμήμα Στατιστικής Οικονομικό Πανεπιστήμιο Αθηνών 1 Τρόποι Συλλογής Δεδομένων Απογραφική
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα
Εκτίμηση Διαστήματος. Χ. Εμμανουηλίδης, 1. Στατιστική ΙI. Εκτίμηση Διαστήματος Εμπιστοσύνης για τον Μέσο
Στατιστική ΙI Ενότητα : Εκτίμηση Διαστήματος Δρ. Χρήστος Εμμανουηλίδης Aν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Στατιστική ΙΙ, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης, cemma@eco.auth.gr 1 Εκτίμηση
iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος
iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων
X = = 81 9 = 9
Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη
Στατιστική Συμπερασματολογία
Στατιστική Συμπερασματολογία Διαφάνειες 3 ου κεφαλαίου Έλεγχος Σύνθετων Υποθέσεων Σταύρος Χατζόπουλος 13/03/2017, 20/03/2017, 27/03/2017 1 Ιδιότητα Μονότονου Λόγου Πιθανοφανειών Συνήθως, καταστάσεις, όπως
ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,
ΜΕΜ64: Εφαρμοσμένη Στατιστική 1 ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=0, X = 7.5, σ = 16, α = 5%. Πως αλλάζει το διάστημα αν
Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις
2 ΕΡΩΤΗΣΕΙΙΣ ΘΕΩΡΙΙΑΣ ΑΠΟ ΤΗΝ ΥΛΗ ΤΗΣ Β ΤΑΞΗΣ ΜΕΡΟΣ Α -- ΑΛΓΕΒΡΑ Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις Α. 1 1 1. Τι ονομάζεται Αριθμητική και τι Αλγεβρική παράσταση; Ονομάζεται Αριθμητική παράσταση μια παράσταση
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,
Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση
Γ. Πειραματισμός Βιομετρία
Γενικά Πειραματικό σχέδιο και ANOVA Η βασική διαφορά μεταξύ των πειραματικών σχεδίων είναι ο τρόπος με τον οποίο ταξινομούνται ή κατατάσσονται οι πειραματικές μονάδες (πειραματικά τεμάχια) Σε όλα τα σχέδια
Μέθοδος μέγιστης πιθανοφάνειας
Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα
ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C
Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία
Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017
Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης
Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ
ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό
Στατιστική Συμπερασματολογία
Στατιστική Συμπερασματολογία Διαφάνειες 5 ου κεφαλαίου Ελεγχοσυναρτήσεις για τις Παραμέτρους της Κανονικής Κατανομής Σταύρος Χατζόπουλος 08/05/207, 5/05/207 Εισαγωγή Στις παραγράφους που ακολουθούν παρουσιάζονται
Στατιστική Επιχειρήσεων Ι
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 5: Παλινδρόμηση Συσχέτιση θεωρητική προσέγγιση Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων
Στατιστική Συμπερασματολογία
Στατιστική Συμπερασματολογία Διαφάνειες 2 ου κεφαλαίου Σταύρος Χατζόπουλος 20/02/2017, 06/03/2017, 13/03/2017 1 Κεφάλαιο 2. Έλεγχος Απλών Υποθέσεων Τα προβλήματα ελέγχου υποθέσεων απορρέουν από παρατηρήσεις
Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R
Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ
ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε
ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ
ΚΕΦΑΛΑΙΟ 5 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ Α. Περίπτωση Ενός Πληθυσμού Έστω ότι μελετάμε μια ακολουθία ανεξαρτήτων δοκιμών κάθε μία από τις οποίες οδηγεί είτε σε επιτυχία είτε σε αποτυχία με σταθερή
Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη
Σημειακή εκτίμηση και εκτίμηση με διάστημα 11 η Διάλεξη Εκτιμήτρια Κάθε στατιστική συνάρτηση που χρησιμοποιείται για την εκτίμηση μιας παραμέτρου ενός πληθυσμού (π.χ. ο δειγματικός μέσος) Σημειακή εκτίμηση
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ Ι. Δημόπουλος, Καθηγητής, Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών-ΤΕΙ Πελοποννήσου Σχηματική παρουσίαση της ερευνητικής διαδικασίας ΣΚΟΠΟΣ-ΣΤΟΧΟΣ ΘΕΩΡΙΑ ΥΠΟΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ Ερευνητικά
ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων
ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ για τη λήψη αποφάσεων ΠΡΑΓΜΑΤΙΚΟ ΚΟΣΤΟΣ ΣΥΛΛΟΓΗ ΠΛΗΡΟΦΟΡΙΩΝ ΕΚΤΙΜΗΣΗ ΠΑΡΑΜΕΤΡΩΝ ΕΠΙΛΟΓΗ ΚΑΤΑΝΟΜΗΣ Υπολογισμός πιθανοτήτων και πρόβλεψη τιμών από τις τιμές των παραμέτρων και
2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για
2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο
Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.
Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ
cv = κατάλληλη κριτική (κρίσιμη) τιμή από τους πίνακες της Ζ ή t κατανομής
ΕΚΤΙΜΗΣΗ ΔΙΑΣΤΗΜΑΤΟΣ Δ.Ε. της παραμέτρου θ: ˆ θ cv σ < θ < ˆ θ + cv σ ˆ θ ˆ θ θ = η παράμετρος που θέλουμε να εκτιμήσουμε, ˆ θ = η εκτίμηση της θ που προκύπτει από το τ.δ. cv = κατάλληλη κριτική (κρίσιμη)
2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)
.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test) Ο διωνυμικός έλεγχος μπορεί να χρησιμοποιηθεί για τον έλεγχο υποθέσεων αναφερομένων στα ποσοστιαία σημεία μίας τυχαίας μεταβλητής. Στην
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436
ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. 3 η ΠΑΡΟΥΣΙΑΣΗ. Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου
ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ 3 η ΠΑΡΟΥΣΙΑΣΗ Ι. Δημόπουλος Τμήμα Διοίκησης Επιχειρήσεων και Οργανισμών. ΤΕΙ Πελοποννήσου Συλλογή δεδομένων Πρωτογενή δεδομένα Εργαστηριακές μετρήσεις Παρατήρηση Παρατήρηση με συμμετοχή,
Περιγραφική Ανάλυση ποσοτικών μεταβλητών
Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο
ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)
(Συνέχεια) Χαράλαµπος Α. Χαραλαµπίδης 23 Νοεµβρίου 2009 Γεωµετρική κατανοµή Ορισµός Εστω X ο αριθµός των δοκιµών µέχρι την πρώτη επιτυχία σε µια ακολουθία ανεξαρτήτων δοκιµών Bernoulli µε πιθανότητα επιτυχίας
4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή
4.3.3 Ο Έλεγχος των Shapro-Wlk για την Κανονική Κατανομή Ένας άλλος πολύ γνωστός έλεγχος καλής προσαρμογής για την κανονική κατανομή, ο οποίος μπορεί να χρησιμοποιηθεί στην θέση του ελέγχου Lllefors, είναι
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32
Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος
Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς
Στατιστική Ανάλυση ιασποράς με ένα Παράγοντα One-Way Anova Χατζόπουλος Σταύρος Κεφάλαιο 8ο. Ανάλυση ιασποράς 8.1 Εισαγωγή 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς 8.3 Ανάλυση ιασποράς με
6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ
6.2 Ο ΜΟΝΟΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Ο έλεγχος της ενότητας αυτής αποτελεί μία επέκταση του μονόπλευρου ελέγχου Smirnov στην περίπτωση περισσοτέρων από δύο δειγμάτων. Ο έλεγχος αυτός
Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:
Δειγματοληψία Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ συμβολίζουμε την μέση τιμή: Επομένως στην δειγματοληψία πινάκων συνάφειας αναφερόμαστε στον
4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου
4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου Για την εκτίμηση των παραμέτρων ενός πληθυσμού (όπως η μέση τιμή ή η διασπορά), χρησιμοποιούνται συνήθως δύο μέθοδοι εκτίμησης. Η πρώτη ονομάζεται σημειακή εκτίμηση.
159141,9 64 x n 1 n
Πιθανότητες Στατιστική: Λύσεις θεμάτων. Φεβρουάριος 9. Σειρά Α Ζήτημα ο : Μία ομάδα φοιτητών μετρά 64 φορές μία απόσταση s που δεν γνωρίζουν. Τα αποτελέσματα των μετρήσεων εμφανίζονται στον διπλανό πίνακα
6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων
6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά
Κεφάλαιο 9. Έλεγχοι υποθέσεων
Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές
Χ. Εμμανουηλίδης, 1
Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,
TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III
0 TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III Νοέμβριος Eστω,,, τυχαίο δείγμα από κατανομή f( x; ), όπου συμβολίζει άγνωστη παράμετρο (a) Να ορισθεί η έννοια του επαρκούς στατιστικού