ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468
Τυχαίο Δείγμα Ο σημαντικότερος στόχος της Στατιστικής Συμπερασματολογίας είναι η εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Στην Στατιστική Συμπερασματολογία η έννοια πληθυσμός αναφέρεται στο σύνολο όλων των υπό εξέταση μονάδων και η έννοια χαρακτηριστικό αναφέρεται σε κάποια ποσοτική συνήθως μέτρηση που αφορά όλα τα άτομα του πληθυσμού Π.χ. αν ένα εργοστάσιο κατασκευής λαμπτήρων πραγματοποιήσει μια στατιστική μελέτη σχετικά με τον χρόνο ζωής των λαμπτήρων τότε ο πληθυσμός είναι όλοι οι λαμπτήρες που παράγονται ενώ το χαρακτηριστικό είναι ο χρόνος ζωής του κάθε λαμπτήρα
Τυχαίο Δείγμα Θεωρούμε ότι η πιθανοθεωρητική συμπεριφορά του πληθυσμού περιγράφεται από κάποια συνάρτηση κατανομής F, και η αντίστοιχη ποσοτική μέτρηση του χαρακτηριστικού περιγράφεται από την αντίστοιχη τυχαία μεταβλητή που ακολουθεί την κατανομή F Η πλήρης γνώση της F θα σήμαινε και πλήρη γνώση της συμπεριφοράς του πληθυσμού. Π.χ. αν η τ.μ. Χ παριστάνει τον χρόνο ζωής ενός λαμπτήρα και F η κατανομή του, τότε οι τιμές F(x) = Pr( x) παριστάνουν το ποσοστό των λαμπτήρων που έχουν χρόνο ζωής το πολύ x. Άρα αν ο κατασκευαστής γνώριζε την F θα μπορούσε να περιγράψει το χρόνο ζωής κάθε λαμπτήρα και άρα την συμπεριφορά του πληθυσμού
Τυχαίο Δείγμα Αυτό όμως δεν συμβαίνει στην πράξη γιατί η F είναι άγνωστη και μπορούμε μόνο να παρατηρήσουμε ορισμένες τιμές, (μετρήσεις) της τυχαίας μεταβλητής Χ, δηλ. στο παραπάνω παράδειγμα να θέσουμε σε λειτουργία ν λαμπτήρες και να παρατηρήσουμε το χρόνο ζωής τους Χ, Χ,, Χ ν Όλοι αυτοί οι χρόνοι ζωής προέρχονται από την ίδια συνάρτηση κατανομής F και είναι στοχαστικά ανεξάρτητες τ.μ. επειδή θεωρούμε ότι παριστάνουν τον χρόνο ζωής ν διαφορετικών λαμπτήρων ΟΡΙΣΜΟΣ (τυχαίο δείγμα) Αν ένας πληθυσμός έχει αντίστοιχη συνάρτηση κατανομής F, τότε τυχαίο δείγμα καλείται ένα σύνολο ανεξάρτητων και ισόνομων τ.μ. Χ, Χ,, Χ ν με κοινή συνάρτηση κατανομής F. Ο αριθμός ν καλείται μέγεθος του δείγματος
Τυχαίο Δείγμα Η στατιστική χωρίζεται σε δύο κύριους κλάδους: Mη-παραμετρική Παραμετρική στατιστική Στην μη-παραμετρική η F υποτίθεται εντελώς άγνωστη ή ανήκει σε μια πολύ μεγάλη κλάση κατανομών, ενώ στην παραμετρική η F περιορίζεται σε μια παραμετρική οικογένεια κατανομών, έτσι ώστε μόνο κάποια παράμετρος της είναι άγνωστη Για παράδειγμα, αν η F είναι η συνάρτηση κατανομής του χρόνου ζωής των λαμπτήρων, τότε μπορεί να υποτεθεί εκ των προτέρων ότι είναι εκθετική με παράμετρο θ > 0 (άγνωστη) Είναι δηλ. x F( x) F( x; ) e, x 0 και η προσπάθεια μας εστιάζεται στην εκτίμηση της άγνωστης παραμέτρου θ με βάση την πληροφορία που αντλείται από ένα τυχαίο δείγμα Χ, Χ,, Χ ν
Στατιστικές Συναρτήσεις Ας υποθέσουμε ότι έχουμε ένα τυχαίο δείγμα Χ, Χ,, Χ ν, από μια συνάρτηση κατανομής F(x;θ), όπου θ άγνωστη παράμετρος. Ο στόχος μας είναι να εκτιμήσουμε την άγνωστη παράμετρο θ με βάση το τυχαίο δείγμα ΟΡΙΣΜΟΣ (στατιστική συνάρτηση) Μια συνάρτηση των μεταβλητών Χ, Χ,, Χ ν ενός τυχαίου δείγματος που δεν περιέχει άγνωστες παραμέτρους λέγεται στατιστικό ή στατιστική συνάρτηση (σ.σ.) και συμβολίζεται συνήθως με Τ = Τ(Χ, Χ,, Χ ν ) Παραδείγματα Πολλές συναρτήσεις μπορούν να χρησιμοποιηθούν ως εκτιμήτριες μια άγνωστης παραμέτρου και γι αυτό θα πρέπει να γίνει επιλογή με κάποια κριτήρια κάποιας ή κάποιων με «καλή» συμπεριφορά
Δειγματικές Κατανομές Οι σ.σ. ως συναρτήσεις τυχαίων μεταβλητών είναι και αυτές τυχαίες μεταβλητές και οι κατανομές τους ονομάζονται δειγματικές κατανομές ΘΕΩΡΗΜΑ *: Έστω Χ, Χ,, Χ ν τυχαίο δείγμα από ένα πληθυσμό με μέση τιμή μ και διακύμανση σ. Τότε E( ) ΠΟΡΙΣΜΑ : Έστω ένα τυχαίο δείγμα πληθυσμό με μέση τιμή μ και διακύμανση σ και μεγέθους από ένα ένα τυχαίο δείγμα μεγέθους από ένα πληθυσμό με μέση τιμή μ και διακύμανση σ από έναν άλλον ανεξάρτητο πληθυσμό. Τότε E(, Var( ), E( ),,...,, ), Var( ),...,
Κατανομές που απορρέουν από την κανονική ΟΡΙΣΜΟΣ 3 (κατανομή χ ) Έστω. Χ, Χ,, Χ ν ν ανεξάρτητες και ισόνομες τ.μ που ακολουθούν την τυπική κανονική κατανομή Ν(0,). Η κατανομή της τ.μ. είναι η Όταν Y με ν βαθμούς ελευθερίας τότε N(0, ) Συνήθως από τους πίνακες παίρνουμε Pr ( a, ) a E( ) & Var ( )
Κατανομές που απορρέουν από την κανονική ΟΡΙΣΜΟΣ 4 (κατανομή t ή studet) Έστω. ΧΝ(0,) και Υ της τ.μ. λέγεται κατανομή t ν και οι Χ,Υ ανεξάρτητες τ.μ.. Τότε η κατανομή Z Y t N( 0),
Κατανομές που απορρέουν από την κανονική Όταν τότε t N( 0, ) Συνήθως από τους πίνακες παίρνουμε Pr ( t ta, ) a t t a, a, E( t ) 0 & Var ( t ), v v
Κατανομές που απορρέουν από την κανονική ΟΡΙΣΜΟΣ 5 (κατανομή F) Έστω. Χ και Χ και οι Χ, Χ ανεξάρτητες τ.μ.. Τότε η κατανομή της τ.μ. λέγεται κατανομή F,
Κατανομές που απορρέουν από την κανονική Συνήθως από τους πίνακες παίρνουμε a F F Pr, a., ) ( 4 4) ( ) ( ) ( ) ( ) (, F Var & F E,,, F t
Δειγματοληψία από κανονικούς πληθυσμούς ΘΕΩΡΗΜΑ : Έστω Χ, Χ,, Χ τυχαίο δείγμα από έναν κανονικό πληθυσμό με μέση τιμή μ και διακύμανση σ. Τότε (i) (ii) N(, ) ( ) (iii) Οι στατιστικές συναρτήσεις και είναι ανεξάρτητες ΣΗΜΑΝΤΙΚΗ ΥΠΕΝΘΥΜΙΣΗ για την κανονική κατανομή: Έστω Ζ Ν(0, ), (μ,σ) IR x IR +, και Χ = σζ + μ. Τότε EΧ = μ και Var(Χ) = σ. Αποδεικνύουμε ότι η τ.μ. Χ ακολουθεί μία γενική κανονική κατανομή, που συμβολίζεται Χ Ν(μ, σ ) Παραδείγματα
Δειγματοληψία από κανονικούς πληθυσμούς ΘΕΩΡΗΜΑ 3: Έστω Χ, Χ,, Χ τυχαίο δείγμα από έναν κανονικό πληθυσμό με μέση τιμή μ και διακύμανση σ. Τότε η σ.σ. ΠΟΡΙΣΜΑ : Έστω και οι μέσες τιμές και οι διακυμάνσεις δύο τ.δ. μεγέθους και αντίστοιχα από δύο ανεξάρτητους κανονικούς πληθυσμούς με μ και μ και κοινή άγνωστη διακύμανση σ. Τότε η σ.σ. t ) ( ) ( ) - ( - t ) (, ) (, p
Δειγματοληψία από κανονικούς πληθυσμούς ΘΕΩΡΗΜΑ 4: Έστω και οι μέσες τιμές και οι διακυμάνσεις (, ) (, ) δύο τ.δ. μεγέθους και αντίστοιχα από δύο ανεξάρτητους κανονικούς πληθυσμούς με μ και μ και γνωστή διακύμανση σ και σ. Τότε η σ.σ. - - ( ), N(0)
Δειγματοληψία από κανονικούς πληθυσμούς Παράδειγμα Δύο διαφορετικοί τύποι λαμπτήρων (τύπος και τύπος ) έχουν διάρκειες ζωής που ακολουθούν τις κατανομές Ν(48,36) και Ν(5,64) αντίστοιχα (με μονάδα μέτρησης τον μήνα). Αν εξετάσουμε 0 λαμπτήρες τύπου και 5 λαμπτήρες τύπου, ποια είναι η πιθανότητα η μέση διάρκεια ζωής ενός λαμπτήρα τύπου να είναι τουλάχιστον.5 μήνες μεγαλύτερη από τη μέση διάρκεια ζωής ενός λαμπτήρα τύπου ;
Δειγματοληψία από κανονικούς πληθυσμούς ΘΕΩΡΗΜΑ 5: Έστω και οι διακυμάνσεις δύο τ.δ. μεγέθους και αντίστοιχα από δύο ανεξάρτητους κανονικούς πληθυσμούς με μ και μ και διακύμανση σ και σ. Τότε η σ.σ. F, ΠΡΟΤΑΣΗ: Έστω Χ, Χ,, Χ τυχαίο δείγμα από έναν κανονικό πληθυσμό με μέση τιμή p και διακύμανση p. Τότε για μεγάλο : ΓΕΝΙΚΑ τι συμβαίνει αν ο πληθυσμός από τον οποίον παίρνουμε το δείγμα δεν είναι κανονικός? i i N p,p( p)
Κεντρικό Οριακό Θεώρημα ΘΕΩΡΗΜΑ 6: Έστω Χ, Χ,, Χ τυχαίο δείγμα από κάποιον πληθυσμό με μέση τιμή μ και διακύμανση σ. Τότε για πολύ μεγάλο N(0,) i i N(0), (lutsky) - - ( ) N(0),,..., 30
Κεντρικό Οριακό Θεώρημα Ο δειγματικός μέσος αυξάνεται το μέγεθος του δείγματος τείνει να ακολουθεί κανονική κατανομή όσο Αποδεικνύει ότι η κατανομή του δειγματικού μέσου τείνει στην κανονική κατανομή ανεξάρτητα με την κατανομή του πληθυσμού από τον οποίον προέρχεται το δείγμα Ένα δείγμα 30 ή περισσοτέρων παρατηρήσεων κρίνεται επαρκώς μεγάλο για να ισχύει το ΚΟΘ
Κεντρικό Οριακό Θεώρημα 0.04 0.035 0.03 N(, 0 ) 0.05 0.0 0.05 N(, N(, 5 ) ) 0.0 0.005 N(, ) 0 0 4 6 8 0 x 0 4
Κεντρικό Οριακό Θεώρημα 4 x 0-3 3.5 3.5 Τυπική απόκλιση σ του πληθυσμού Κατανομή του N(, ) Τυπική απόκλιση του.5 Κατανομή του πληθυσμού 0.5 0 0 4 6 8 0 x 0 4 Μέση τιμή του πληθυσμού και του μ
Κεντρικό Οριακό Θεώρημα Παράδειγμα Ο όγκος του περιεχομένου μπουκαλιών μιας μάρκας ποτού είναι σημαντικό ποιοτικό χαρακτηριστικό για την βιομηχανία εμφιάλωσης. Η μέση τιμή και η διασπορά του περιεχομένου ανά μπουκάλι σε ένα εργοστάσιο εμφιάλωσης του ποτού είναι μ = 330 ml και σ =.44 ml αντίστοιχα. Ποια είναι η πιθανότητα σε ένα τυχαίο δείγμα = 36 μπουκαλιών η μέση τιμή του περιεχομένου να είναι μικρότερη από 39,53 ml;
Δειγματική Μέση Τιμή και Διασπορά Κ.Ο.Θ. τυχαίο δείγμα Χ, Χ,, Χ στατιστική συνάρτηση (σ.σ.) Τ = Τ(Χ, Χ,, Χ ν ) Δειγματική Μέση Τιμή Δειγματική Διασπορά Κ.Ο.Θ. Χ, Χ,, Χ από κάποιο πληθυσμό με γνωστή μέση τιμή μ και γνωστή διασπορά σ και για 30: i i i i (0) ή (0) ή, N, N, N i i
Ένας πληθυσμός ΚΑΤΑΝΟΜΗ ΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ ΜΕΣΟΥ a) Κανονικός πληθυσμός με γνωστή διασπορά σ E Var b) Κανονικός πληθυσμός με άγνωστη διασπορά i i t b) Μη-κανονικός πληθυσμός με γνωστή διασπορά σ και 30 N( 0), c) Μη-κανονικός πληθυσμός με άγνωστη διασπορά και N( 0),
Ένας πληθυσμός ΚΑΤΑΝΟΜΗ ΤΗΣ ΔΕΙΓΜΑΤΙΚΗΣ ΔΙΑΣΜΟΡΑΣ Κανονικός πληθυσμός με γνωστή διασπορά σ i i Κατά συνέπεια ( ) E E ( ) Var Var 4
Δύο πληθυσμοί ΚΑΤΑΝΟΜΗ ΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ ΜΕΣΟΥ a) Κανονικοί πληθυσμοί με γνωστές διασπορές. Ανεξάρτητα δείγματα τότε, N,, N ) N( -, N(0) ) - ( -,
Δύο πληθυσμοί ΚΑΤΑΝΟΜΗ ΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ ΜΕΣΟΥ b) Κανονικοί πληθυσμοί με άγνωστες διασπορές. Ανεξάρτητα δείγματα i. Αν οι διασπορές είναι ίσες ii. Αν οι διασπορές δεν είναι ίσες t ) - ( - ) ( ) ( ) - ( - t ) ( ) ( p
Δύο πληθυσμοί c) Μη-κανονικοί πληθυσμοί ΚΑΤΑΝΟΜΗ ΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ ΜΕΣΟΥ i. Αν οι διασπορές είναι γνωστές και 30, 30 ii. Αν οι διασπορές είναι άγνωστες και, - - - ( ), - ( ), N(0) N(0)
Δύο πληθυσμοί ΚΑΤΑΝΟΜΗ ΤΗΣ ΔΕΙΓΜΑΤΙΚΗΣ ΔΙΑΣΠΟΡΑ Έστω και οι διακυμάνσεις δύο τ.δ. μεγέθους και αντίστοιχα από δύο ανεξάρτητους κανονικούς πληθυσμούς με μ και μ και διακύμανση σ και σ. Τότε η σ.σ. F,
Κατανομές που απορρέουν από την κανονική (κατανομή χ ) Χ, Χ,, Χ Ν(0,) Y (κατανομή t ή studet) t N(0), (κατανομή F) Χ και Χ και οι Χ, Χ ανεξάρτητες τ.μ F,