ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 017-018 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegean.gr Τηλ: 71035468
ΒΙΒΛΙΟΓΡΑΦΙΑ 1. Πιθανότητες και Στατιστική για Μηχανικούς, Γ. Ζιούτας,, Εκδόσεις "σοφία" Ανώνυμη Εκδοτική & Εμπορική Εταιρεία, Κωδικός Βιβλίου στον Εύδοξο: 1656654. Εισαγωγή στη Στατιστική, Τ. Παπαϊωάννου, Σ.Β. Λουκάς, Εκδόσεις Σταμούλη Α.Ε., Κωδικός Βιβλίου στον Εύδοξο: 745 Προτεινόμενη Βιβλιογραφία 1. Εισαγωγή στις πιθανότητες και τη στατιστική, Δαμιανού Χ., Χαραλαμπίδης Χ., Παπαδάκης Ν., Εκδόσεις Συμμετρία, 010. Πιθανότητες και Στατιστική, Schaum's Outline of PROBABILITY AND STATISTICS), Murray R. Spiegel, Μετάφραση: Σωτήριος Κ. Περσίδης 3. Στατιστική, Υ. Κολυβά-Μαχαίρα, Ε. Μπόρα-Σέντα, Ζήτη 4. Ανάλυση Δεδομένων με τη Βοήθεια Στατιστικών Πακέτων, Ν. Δ. Σσάντας, Φρ. Θ. Μωϋσιάδης, Ντ. Μπαγιάτης, Θ. Φατζηπαντελής,
ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ Εισαγωγή-Επανάληψη Θεωρίας Πιθανοτήτων Περιγραφική Στατιστική Κατανομές Συχνοτήτων Μέτρα θέσης και απόκλισης Συντελεστές ασυμμετρίας και κύρτωσης Εκτιμητική Αμεροληψία, Συνέπεια, Επάρκεια, Πληρότητα, Εκτιμήτριες Μεγίστης Πιθανοφάνειας Αμερόληπτη Εκτιμήτρια Ελαχίστης Διασποράς Μέθοδος των Ροπών-Μέθοδος των Ελαχίστων Τετραγώνων Διαστήματα Εμπιστοσύνης Έλεγχος Υποθέσεων Ανάλυση Παλινδρόμησης Ανάλυση Διακύμανσης
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή ΣΤΑΤΙΣΤΙΚΗ είναι η επιστήμη η οποία ασχολείται με τον σχεδιασμό, τη συλλογή και την ανάλυση αριθμητικών δεδομένων και την εξαγωγή συμπερασμάτων Τα συμπεράσματα αναφέρονται σε άγνωστα χαρακτηριστικά ή ιδιότητες πληθυσμών και εξάγονται με την βοήθεια πληροφοριών που περιέχονται σε δείγματα από αυτούς τους πληθυσμούς Θεωρητικό υπόβαθρο της Στατιστικής αποτελεί η ΘΕΩΡΙΑ ΠΘΑΝΟΤΗΤΩΝ
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Η Στατιστική μαζί με την Θεωρία Πιθανοτήτων χρησιμοποιούνται: Επιχειρήσεις Διοίκηση Βιολογία Γενετική Εκπαίδευση Οικονομικά Ψυχολογία Ιδιαίτεροι κλάδοι που έχουν δημιουργηθεί από την χρησιμοποίηση στατιστικών μεθόδων είναι: Οικονομετρία Βιομετρία Βιοστατιστική Ψυχομετρία
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Η στατιστική ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση πληροφοριών Οι πληροφορίες αυτές, πολύ συχνά αριθμητικές, ονομάζονται παρατηρήσεις ή μετρήσεις ή δεδομένα. Συλλογή επιλογή ενός δείγματος από τον πληθυσμό ένα ομοιογενές σύνολο ατόμων των οποίων εξετάζουμε κάποιο χαρακτηριστικό) Οργάνωση σήμερα σχεδόν πάντα με τη βοήθεια υπολογιστή Παρουσίαση με τη μορφή π.χ. κάποιου πίνακα, ή κάποιου διαγράμματος, χρησιμοποιώντας είτε το σύνολο των μετρήσεων από το δείγμα είτε κάποιο περιγραφικό μέτρο π.χ. τον αριθμητικό μέσο) Ανάλυση στατιστική συμπερασματολογία με τη χρήση κάποιου μοντέλου π.χ. ότι ο πληθυσμός τον οποίο μελετάμε ακολουθεί κάποια κατανομή)
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Η επιλογή ενός δείγματος από κάποιο πληθυσμό αποτελεί αντικείμενο της δειγματοληψίας Για την οργάνωση των δεδομένων χρησιμοποιούμε κάποιο λογιστικό φύλλο π.χ. Excel) ή κάποιο στατιστικό πακέτο π.χ. Minitab, SPSS, Splus,) Με την παρουσίαση περιγραφή των δεδομένων ασχολείται η Περιγραφική Στατιστική Βασικό μαθηματικό εργαλείο της Στατιστικής Συμπερασματολογίας είναι η θεωρία πιθανοτήτων και ειδικότερα οι διάφορες κατανομές πιθανότητας Στη στατιστική, ένας πληθυσμός που εξετάζουμε μπορεί να είναι Πεπερασμένος ή άπειρος Υπαρκτός ή ιδεατός Είδη στατιστικών στοιχείων Χρονοσειρές ή χρονικές σειρές π.χ. οι διάφοροι οικονομικοί δείκτες) Διαστρωματικά στοιχεία π.χ. απογραφές, έρευνες αγοράς κλπ) Μεικτά δεδομέναπου συνδυάζουν τα δύο παραπάνω στοιχεία)
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Βασικός σκοπός της Περιγραφικής Στατιστικής είναι η παρουσίαση των τιμών του δείγματος με τέτοιο τρόπο ώστε να μπορεί να γίνει μια πρώτη ερμηνεία των αποτελεσμάτων Περιγραφική Στατιστική περιλαμβάνει: Πινακοποίηση δεδομένων Παραστάσεις δεδομένων με γραφήματα ή εικόνες Υπολογισμό περιγραφικών μέτρων Περιλαμβάνει έννοιες όπως Διαστήματα εμπιστοσύνης Τεστ σημαντικότητας Παλινδρόμηση Προβλέψεις Συντελεστές συσχέτισης Στοχαστικά μοντέλα κλπ
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Η σύγχρονη στατιστική Συμπερασματολογία ασχολείται κυρίως με την Στατιστική Χρησιμοποιούμε μέτρα που υπολογίζουμε για να κάνουμε γενικεύσεις γεγονός που οδηγεί στην εξαγωγή συμπερασμάτων επαγωγικά συμπερασματολογία ΠΑΡΑΔΕΙΓΜΑ: Ένας δημοσιογράφος κάνει μια σφυγμομέτρηση της κοινής γνώμης και ρωτά 100 ανθρώπους για το αν υποστηρίζουν την αλλαγή ενός νόμου ΑΠΑΝΤΗΣΕΙΣ 75 από τους 100 ΝΑΙ 75 % ΝΑΙ Ποια η διαφορά στις απαντήσεις? Αντιπροσωπευτικό δείγμα
ΣΤΑΤΙΣΤΙΚΗ Εισαγωγή Η Στατιστική Συμπερασματολογία περιλαμβάνει: Εκτιμητική Στατιστικά Τέστ Παλινδρόμηση Ανάλυση Διακύμανσης Πολυμεταβλητή Ανάλυση
ΣΤΑΤΙΣΤΙΚΗ Παράδειγμα Σε μια πόλη μας ενδιαφέρει να μελετήσουμε το οικογενειακό εισόδημα σε χιλ. ανά έτος). Για τη μελέτη αυτή επιλέχθηκαν 0 οικογένειες για τις οποίες καταγράφηκε το ετήσιο οικογενειακό εισόδημα. Οικογενειακό Εισόδημα χιλ. / έτος) 0.0 30.5 40.0 55.1 60.3 74.9 88.4 4.6 33.5 89.6 55.3 78.6 98. 51. 63.7 74. 55.1 69.3 95. 54.9 Να βρεθεί το μέσο ετήσιο οικογενειακό εισόδημα για το παραπάνω δείγμα οικογενειών Αν πάρουμε 0 διαφορετικές οικογένειες, θα αλλάξει το μέσο οικογενειακό εισόδημα; Αν όχι γιατί; Αν ναι, σημαίνει ότι το μέσο ετήσιο οικογενειακό εισόδημα των 0 οικογενειών δεν είναι σταθερό και επομένως είναι τυχαία μεταβλητή. Σε αυτήν την περίπτωση, μπορούμε να βρούμε τι κατανομή ακολουθεί;
ΣΤΑΤΙΣΤΙΚΗ Παράδειγμα Μπορεί να γίνει μια εκτίμηση για το μέσο ετήσιο οικογενειακό εισόδημα στην πόλη με βάση τα παραπάνω δεδομένα; Πόσο καλή είναι η εκτίμηση που έγινε για το μέσο οικογενειακό εισόδημα; Υπάρχει κάποιο σφάλμα στην εκτίμηση μας; Αν ναι, πόσο είναι αυτό; Αν πάρουμε 0 διαφορετικές οικογένειες θα είναι ίδια η εκτίμηση και το σφάλμα; Μπορούμε να υποθέσουμε ότι το μέσο οικογενειακό εισόδημα στην πόλη είναι 6 χιλ ; Πόσο σίγουροι είμαστε για την απάντηση μας σε αυτό το ερώτημα;
ΣΤΑΤΙΣΤΙΚΗ Παράδειγμα Αν για κάθε μια από τις οικογένειες που ερωτήθηκαν έχουμε και την αντίστοιχη ετήσια κατανάλωση ενέργειας σε μονάδες 10 8 Btu) Κατανάλωση Ενέργειας 10 8 Btu /έτος) 1.8 3.0.3 1.9 4.8 5.4 7.6.3 5.5 6.4 9.1 9.0 9.1 8.7 5.6 8.6 7.4 8. 5.5 4.9 μπορούμε να ισχυριστούμε ότι αυτή σχετίζεται με το ετήσιο οικογενειακό εισόδημα; Και αν ναι με ποιόν τρόπο; Υπάρχει κάποια μαθηματική σχέση που να μας δίνει την εξάρτηση της κατανάλωσης ενέργειας από το οικογενειακό εισόδημα; Και αν ναι ποια είναι αυτή; Πόσο κλά περιγράφει η μαθηματική αυτή σχέση την εξάρτηση της κατανάλωσης ενέργειας από το οικογενειακό εισόδημα
ΣΤΑΤΙΣΤΙΚΗ Θεωρία Πιθανοτήτων
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Βασικές έννοιες Πιθανοτήτων Τυχαία Μεταβλητή Διακριτές και συνεχείς τ.μ. και κατανομές Χαρακτηριστικά τ.μ. και κατανομών Μέση τιμή Διακύμανση Ροπές και ροπογεννήτριες Παραμετρικές οικογένειες κατανομών Από κοινού κατανομή Δεμευμένη κατανομή Κατανομές και χαρακτηριστικά αθροισμάτων τ.μ. Κατανομή min και max Κεντρικό Οριακό Θεώρημα
Διακριτές τυχαίες μεταβλητές Μία τυχαία μεταβλητή τ.μ.) ορίζεται με βάση ένα τυχαίο πείραμα ως μία συνάρτηση Χ, η τιμής της οποίας εξαρτάται από το αποτέλεσμα ω αυτού του συγκεκριμένου πειράματος. Παράδειγμα : στο πείραμα με τα ζάρια, το άθροισμα, το γινόμενο και η διαφορά των αποτελεσμάτων ορίζουν διαφορετικές τ.μ. : Χω) = x+y, Yω) = xy, Zω) = x-y, όπου ω = x,y). Μιγαδική τ.μ. : Ζ = Χ+iY όπου Χ,Υ είναι π.τ.μ. Δείκτρια τ.μ. : Α F, ορίζουμε την δείκτρια τ.μ., που συμβολίζεται με 1 Α, ως 1 αν ω Α 1 Α ω) = 0 αν όχι
Διακριτές τυχαίες μεταβλητές Ιδιότητες : 1. 1 Ω = 1 και 1 = 0. 1 Α Β = 1 Α. 1 Β 3. 1 Α Β = 1 Α + 1 Β - 1 Α. 1 Β 4. 1 Α c = 1-1 Α 5. Α B 1 Α 1 B και Α = Β 1 Α = 1 B Μία απλή τ.μ. μπορεί να αναπαρασταθεί με την βηματική συνάρτηση : Χ = Σ 1 i n x i.1 Α i όπου τα γεγονότα Α i είναι μία διαμέριση του δειγματοχώρου Ω.
Κατανομή μίας διακριτής τυχαίας μεταβλητής Έστω μία τ.μ. Χ : Ω Ε ΙR. Για x E, ορίζεται το γεγονός {ω: Χω) = x} η πιο απλά {Χ = x}), για το οποίο συμβολίζουμε με p x) την πιθανότητα του, δηλαδή p x) = PrΧ = x). Ορισμός κατανομή μίας διακριτής τ.μ.) : Το σύνολο αριθμών p x), x E) έτσι ώστε p x) = PrΧ = x) λέγεται κατανομή της τ.μ. Χ. Ιδιότητες : 1. p x) 0. Σ x E p x) = 1 Το πλεονέκτημα στην χρήση μίας κατανομής μίας τ.μ. είναι ότι επιτρέπει κατευθείαν, χωρίς την χρήση του δειγματοχώρου, να υπολογισθούν οι πιθανότητες των γεγονότων που ορίζονται από την τ.μ. Χ.
Κατανομή μίας διακριτής τυχαίας μεταβλητής Παραδείγματα : Ένα ζάρι : η κατανομή της τ.μ. Χω) = ω είναι p ω) = 1/6 για οποιοδήποτε ωω, και λέγεται ομοιόμορφη κατανομή διακριτή περίπτωση). Δύο ζάρια : η κατανομή της τ.μ. Χω) = ω 1 + ω και δίνεται από τον ακόλουθο πίνακα: x 3 4 5 6 7 8 9 10 11 1 px) 1/36 /36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 /36 1/36 Αν υποτεθεί ότι τ.μ. Χ και Υ ορίζονται πάνω στο ίδιο πιθανοθεωρητικό χώρο με τιμές στο Ε 1 και Ε : Ορισμός : Ανεξαρτησία τ.μ.) Οι τ.μ. Χ και Υ λέγονται ανεξάρτητες εάν για οποιαδήποτε x Ε 1 και y Ε, ισχύει: Pr = x, Y = y) = Pr = x) PrY = y)
Μέση τιμή και ροπές Ορισμός : Η μέση τιμή μίας τ.μ., συμβολίζεται με ΕΧ η Ε[Χ]. Αν η τ.μ. Χ είναι διακριτή με τιμές στο Ε και με κατανομή p = p x), x Ε), η μέση τιμή της δίνεται με Ιδιότητες : 1. Ε[αΧ] = αε[χ].. Ε[Χ +Υ] = Ε[Χ] + Ε[Υ]. ΕΧ = Σ x E x px) 3. Εάν Χ 0 τότε Ε[Χ] 0, η εάν Χ Υ, τότε ΕΧ ΕΥ. Παραδείγματα : Η μέση τιμή της δείκτριας τ.μ. : Ε 1 Α = 1. Pr1 Α = 1) + 0. Pr1 Α = 0) = PrA). Η μέση τιμή της απλής τ.μ. Χ = Σ 1 i n x i.1 Α i : ΕΧ = Σ 1 i n x i PrΑ i ).
Μέση τιμή και ροπές Ορισμοί : 1. Η k-οστή ροπή k IN*), ορίζεται με : μ k = E[Χ k ] = Σ x E x k px) εάν η σειρά συγκλίνει απόλυτα.. Η k-οστή κεντρική ροπή k IN*), ορίζεται με : m k = E[ - EΧ) k ] = Σ x E x - E) k px) Η δεύτερη κεντρική ροπή, m, συμβολίζεται επίσης σ Χ) ή Var) και λέγεται διασπορά Variance) της τ.μ. Χ. Μετράει την διασπορά ή την διασπαρμένη μάζα γύρω από την μέση τιμή της τ.μ.. Η τετραγωνική ρίζα της διασποράς λέγεται επίσης τυπική απόκλιση. Πρόταση : Εάν Χ είναι μία τ.μ. με τιμές στο IN, τότε ΕΧ = Σ n 1 Pr n).
Μερικές κλασσικές διακριτές κατανομές Κατανομή του Bernoulli 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0 = 0 = 1 Κατανομή Bernoulli παραμέτρου p = 0,8 Η τ.μ. Χ ακολουθεί μία κατανομή Bernoulli παραμέτρου p 0 < p < 1), και συμβολίζεται : Χ ~ Βp), εάν παίρνει τις τιμές τις μέσα στο {0,1} με Pr = 1) = p και Pr = 0) = 1 p. Το γεγονός {Χ = 1}, λέγεται επιτυχία και το γεγονός {Χ = 0} λέγεται αποτυχία. Η μέση τιμή δίνεται : και η διασπορά ΕΧ = p Var) = σ = p1 p).
Μερικές κλασσικές διακριτές κατανομές Διωνυμική κατανομή Όταν ενδιαφερόμαστε για τον αριθμό επιτυχιών σε μία πεπερασμένη σειρά πειραμάτων του Bernoulli, τότε αυτό μπορεί να περιγραφεί από μία διωνυμική τ.μ.. Ο αριθμός επιτυχιών σε μία σειρά n πειραμάτων Bernoulli μπορεί να είναι : 0, 1, n. Μία τ.μ. Υ έχει μία διωνυμική κατανομή παραμέτρου n,p) n>0 και 0 < p < 1), και συμβολίζεται : Υ ~ Βn,p). H κατανομή της δίνεται από : pk) = PrY = k) = C n k p k 1-p) n-k, k = 0, 1,, n) Αν Υ ~ bn,p), τότε μπορεί να αναπαρασταθεί με το άθροισμα n τ.μ. του Bernoulli παραμέτρου p και ανεξάρτητες : Y = 1 + + + n 0,5 0, 0,15 0,1 0,05 0 0 1 3 4 5 6 7 8 9 10 Διωνυμική κατανομή Η μέση τιμή δίνεται : και η διασπορά ΕY = np VarY) = σ = np1 p).
Μερικές κλασσικές διακριτές κατανομές Γεωμετρική κατανομή 0,45 0,4 0,35 0,3 0,5 0, 0,15 0,1 0,05 0 0 1 3 4 5 6 7 8 9 10 Γεωμετρική καταν ομή Η γεωμετρική κατανομή έχει άμεση σχέση με μία άπειρη σειρά ανεξάρτητων πειραμάτων Bernoulli. Η πραγματοποίηση μίας γεωμετρικής τ.μ., δείχνει την πρώτη στιγμή πραγματοποίησης μίας επιτυχίας. Η τ.μ. Υ ακολουθεί μία γεωμετρική κατανομή παραμέτρου p 0 < p < 1), και συμβολίζεται : Υ ~ Gp), όταν η κατανομή της δίνεται από pk) = PrY = k) = p 1-p) k-1, k > 0) Εάν υποτεθεί μία άπειρη σειρά τ.μ. Bernoulli : 1,, ~ Bp), τότε η γεωμετρική τ.μ. Υ μπορεί να αναπαρασταθεί ως ακολούθως : {Y = n} = { 1 = 0,, n-1 =0, n = 1} Η μέση τιμή δίνεται : ΕY = 1 / p και η διασπορά : VarY) = σ = 1 p) / p.
Μερικές κλασσικές διακριτές κατανομές Κατανομή Poisson 0,5 0, 0,15 0,1 Kατανομή POISSON 0,05 0 0 1 3 4 5 6 7 8 9 10 Μία τ.μ. Χ ακολουθεί μία κατανομή Poisson παραμέτρου λ IR* +, και συμβολίζεται : Χ ~ Pλ), όταν η κατανομή της δίνεται από : pk) = PrΧ = k) = e -λ λ k / k! k IN) Η μέση τιμή δίνεται: ΕΧ = λ και η διασπορά : VarΧ) = σ = λ.
Συνεχής τυχαία μεταβλητή Ορισμός : Τυχαία μεταβλητή απόλυτα συνεχής) Μία πραγματική τ.μ. Χ είναι απόλυτα συνεχής εάν υπάρχει μία συνάρτηση f : IR IR +, έτσι ώστε η κατανομή να δίνεται ως ακολούθως : P Β) = Β f x) dx για οποιοδήποτε διάστημα Β του IR. Η συνάρτηση f λέγεται πυκνότητα πιθανότητας του P ή της τ.μ. Χ. Έχει τις ακόλουθες ιδιότητες : 1. x IR, f x) 0.. IR f x) dx = 1. Παρατηρήσεις : 1. Μία ερμηνεία της πυκνότητας πιθανότητας είναι η ακόλουθη : Prx < x +Δx) = f x) Δx + οδx) ή f x) = lim Δx0 Prx < x +Δx) / Δx. Εκτός από τις διακριτές τ.μ., υπάρχουν και άλλες τ.μ. που δεν είναι απόλυτα συνεχείς.
Συνεχής τυχαία μεταβλητή Ορισμός : Αθροιστική συνάρτηση κατανομής) Η αθροιστική συνάρτηση κατανομής ορίζεται για οποιοδήποτε xir, ως ακολούθως : F Β) = P ] -, x] ) = Pr x ) Συνεπώς, για οποιοδήποτε διάστημα [a, b] του IR, έχουμε : Pr x ]a, b] ) = F b) - F a) Έχει τις ακόλουθες ιδιότητες : 1. Η F είναι αύξουσα στο IR.. F -) = lim x- F x) = 0, και F ) = lim x F x) = 1. 3. F. ) είναι συνεχής δεξιά. Παρατηρήσεις : 1. Εάν η τ.μ. Χ είναι απόλυτα συνεχής, τότε F x) = ] -, x] f u) du. Εάν x είναι ένα σημείο συνέχειας της f, τότε έχουμε : f x) = d/dx [F x)]
Συνεχής τυχαία μεταβλητή Παράδειγμα : η ομοιόμορφη κατανομή στο διάστημα [0, 1]) 1 f 1 F 0 1 0 1 Η πυκνότητα αυτής της κατανομής είναι : fx) = 1 [0, 1] x). Και η αθροιστική συνάρτηση κατανομής μετά από υπολογισμό δίνει : 0 εάν x < 0 F x) = x εάν 0 x 1 1 εάν x > 1
Συνεχής τυχαία μεταβλητή Ορισμός : Μέση τιμή μίας πραγματικής τ.μ. με πυκνότητα) Η μέση τιμή μίας πραγματικής τ.μ. με πυκνότητα ορίζεται : και στην περίπτωση μίας διακριτής τ.μ. έχουμε : όπου px) είναι η κατανομή της Χ. E = IR x fx) dx E = x x px) Ορισμοί : Διασπορά και ροπές μίας πραγματικής τ.μ. με πυκνότητα) Η διασπορά μίας πραγματικής τ.μ. με πυκνότητα ορίζεται όπως και στη διακριτή περίπτωση : Var) = E[ - E) ] = IR x - ΕΧ) fx) dx και η ροπή βαθμού k : μ k = E[ k ] = IR x k fx) dx Μία πιο πρακτική σχέση : Var) = E[ ] E) Μερικές ιδιότητες της διασποράς : 1. Vara + b) = a Var), a,b IR). Αν Χ και Υ είναι ανεξάρτητες τότε Var+Y) = Var) + VarY)
Μερικές κλασσικές συνεχείς κατανομές Ομοιόμορφη κατανομή 1, 1 0,8 0,6 0,4 0, 0 a=1 b= Μία τ.μ. ακολουθεί μία ομοιόμορφη κατανομή σε ένα διάστημα [a, b], που συμβολίζεται Χ U[a, b], εάν η πυκνότητα πιθανότητας δίνεται με : fx) = 1 / b-a) εάν x [a, b] και 0 αλλιώς, Και η αθροιστική συνάρτηση πιθανότητας δίνεται με : Fx) = x-a) / b-a) εάν x [a, b], 0 εάν x a, 1 εάν x b. E = a+b)/ Var) = b-a) / 1
Μερικές κλασσικές συνεχείς κατανομές Γενική κανονική κατανομή -5-4 -3 - -1 0 1 3 4 5 Έστω Ζ Ν0, 1), μ,σ) IR x IR +, και Χ = σζ + μ. Τότε EΧ = μ και VarΧ) = σ. Αποδεικνύουμε ότι η τ.μ. Χ ακολουθεί μία γενική κανονική κατανομή, που συμβολίζεται : Χ Νμ, σ ) Η πυκνότητα πιθανότητας δίνεται με : Και η αθροιστική συνάρτηση κατανομής : f x ) 1 e πσ xμ σ F x) 1 πσ z e uμ σ du
Μερικές κλασσικές συνεχείς κατανομές Τυπική κανονική κατανομή
Μερικές κλασσικές συνεχείς κατανομές Τυπική κανονική κατανομή
Μερικές κλασσικές συνεχείς κατανομές Εκθετική κατανομή 0,07 0,06 0,05 0,04 0,03 0,0 0,01 0 0 10 0 30 40 50 60 70 80 90 100 Η τ.μ. Χ ακολουθεί μία εκθετική κατανομή παραμέτρου λ IR + *, που συμβολίζεται Χ Ελ), εάν η πυκνότητα πιθανότητας δίνεται : Και η αθροιστική συνάρτηση πιθανότητας δίνεται : fx) = λ exp-λx) 1 IR + x) Fx) = 1 - exp-λx). E = 1/λ Var) = 1/λ
Μερικές κλασσικές συνεχείς κατανομές Κατανομή γάμμα Η τ.μ. Χ ακολουθεί μία κατανομή γάμμα παραμέτρων α,β) IR + *x IR + *, που συμβολίζεται Χ γα,β), εάν η πυκνότητα πιθανότητας δίνεται : x 1 1 f x ) x e 1 IR ) x ) 0,03 0,0 0,01 Όπου Γ.) είναι η συνάρτηση γάμμα, που δίνεται με : Εάν α ΙΝ*, Γα) = α-1)! a a 1 ) t e Εάν α ΙΝ*, τότε γα,β) είναι μία κατανομή Erlang. Για α=1, έχουμε Χ Ε1/λ) Εάν Χ γα 1,β) και Υ γα,β) τότε Χ+Υ γα 1 +α,β) 0 0 10 0 30 40 50 60 70 80 90 100 dt E = αβ Var) = αβ 0 t ac
Μερικές κλασσικές συνεχείς κατανομές Κατανομή χι τετράγωνο χn)) : 0,04 Η τ.μ. Χ ακολουθεί μία κατανομή χι τετράγωνο με n βαθμούς ελευθερίας n IN*) που συμβολίζεται Χ χ n), εάν Χ γn/,). Μία τ.μ. Χ χ n) είναι το άθροισμα των τετράγωνων n τυπικών κανονικών και ανεξάρτητων τ.μ., δηλαδή εάν Χ χ n), έχουμε : Χ = Ζ 1 + +Ζ n και Ζ i N0,1). 0,03 0,0 0,01 0 0 10 0 30 40 50 60 70 80 90 100 E = n Var) = n
Μερικές κλασσικές συνεχείς κατανομές Λογάριθμοκανονική κατανομή Η τ.μ. Χ ακολουθεί μία λογάριθμοκανονική κατανομή παραμέτρου μ, σ ) IR + x IR +, εάν Χ = e Y και Υ Νμ, σ ) και η πυκνότητα πιθανότητας δίνεται με : 1 f x ) e σ 1 πσx log xμ IR x ) 0,4 0,35 0,3 0,5 0, 0,15 0,1 0,05 0 0 10 0 30 40 50 60 70 80 90 100 E = e μ+σ / Var) = e μ+σ ) e μ+σ
Μερικές κλασσικές συνεχείς κατανομές Κατανομή Weibull 0,07 Η τ.μ. Χ ακολουθεί μία κατανομή Weibull παραμέτρου β,η) IR + *xir + *, που συμβολίζεται Χ Wβ,η), εάν η πυκνότητα πιθανότητας δίνεται με : 0,06 0,05 0,04 0,03 f x) 1 x β x e 1 η η IR x) 0,0 0,01 0 0 10 0 30 40 50 60 70 80 90 100 και η αθροιστική συνάρτηση πιθανότητας στο IR +, είναι : Fx) = 1 exp[-x/η) β ]. E = η Γ1+1/β) Var) = η [Γ1+/β) Γ1+/β)) ]
Μερικές κλασσικές συνεχείς κατανομές Κατανομή t Έστω Χ ~ Ν0,1), Υ ~ χ ν και Χ,Υ ανεξάρτητες τ.μ. Η κατανομή της τ.μ. : Z Y λέγεται t ν κατανομή με ν βαθμούς ελευθερίας : t ν N0,1) ν Είναι γνωστή και ως κατανομή Student Όσο μεγαλώνουν οι βαθμοί ελευθέριας τόσο περισσότερο η κατανομή προσεγγίζει την τυπική κανονική
Μερικές κλασσικές συνεχείς κατανομές Κατανομή t Συνάρτηση Πιθανότητας Συνάρτηση Κατανομής 1) ν1 ) t f t 1, t x F1 Ft 1) 1 1) 3 x ), ; ; ) F 1 είναι η υπεργεωμετρική συνάρτηση
Μερικές κλασσικές συνεχείς κατανομές Κατανομή t
ΣΧΕΣΕΙΣ ΜΕΤΑΞΥ ΓΝΩΣΤΩΝ ΚΑΤΑΝΟΜΩΝ
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Α 1. Μαθηματική Ελπίδα τ.μ. Χ Η έννοια της Μαθηματικής Ελπίδας ή αναμενόμενης τιμής συνδέεται με την μέση τιμή μίας σειράς μετρήσεων και από μία άποψη είναι η επικρατέστερη τιμή της τ.μ. Χ ) x x f f x), x), av av διακριτή συνεχής
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Α. Μαθηματική Ελπίδα συνάρτησης hχ) [ h )] h x) h x) f f x), x), av av διακριτή συνεχής
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Ιδιότητες Μαθηματικής Ελπίδας 1, 1,, ) η και τότε υπάρχει ) η Αν υπάρχει 6. ) )] [ 5. )] [ )] [ τότε ) ) 0, ) 0 τότεκαι Αν 4. )] [ ) )], [ )] [ )] ) [ 3. )] [ ) ), ) ). ) 1. 1 1 k 1 i k 1 i 1 1 n m E h h E h E h E h h h E c h c E h E h E h h E b h ae b ah E b ae b a E c c E m n i i i i
Β 1. ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Διακύμανση διασπορά) τ.μ. Χ Η μέση τιμή μίας τυχαίας μεταβλητής μας δίνει την θέση ή το «κέντρο βάρους» της κατανομής και έτσι είναι γνωστή ως μέτρο θέσης. f 1 1/100 τ.μ. Χ 1 f τ.μ. Χ 0 50 100 x 0 50 100 Όπως προκύπτει από την παραπάνω μελέτη χρειαζόμαστε ένα μέτρο μεταβλητότητας ή διασποράς των τιμών της τ.μ. γύρω από την μέση τιμή. Επειδή οι αποκλίσεις από την μέση τιμή μπορεί να είναι είτε θετικές είτε αρνητικές, χρησιμοποιούμε τα τετράγωνα των αποκλίσεων. Το μέτρο αυτό ονομάζεται διακύμανση ή διασπορά
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Var) E E) όπου μ ΕΧ E μ) Β. Τυπική Απόκλιση τ.μ. Χ x x ) x ) f f x), x), αν Χ διακριτή αν Χ συνεχής Var) Β 3. Διασπορά και Τυπική Απόκλιση συνάρτησης hχ) Var[ h )] E[ h ) Eh )] h ) Varh )
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ Τ.Μ. ΚΑΙ ΚΑΤΑΝΟΜΩΝ Ιδιότητες Διακύμανσης 1. Var ) E ) E), Var[ h )] E h )) [ Eh )]. Var c) 0 3. Var[ h) b] Var[ h )] Παρατηρήσεις: Εάν η διακύμανση ή η διασπορά είναι 0 τότε η τ.μ. είναι σταθερή. Όσο πιο μικρή είναι η διακύμανση τόσο πιο μικρή είναι και η μεταβλητότητα της Χ. Συνήθως για να υπολογίσουμε την πιθανότητα ενός ενδεχομένου που περιγράφεται από μία τ.μ. Χ χρειαζόμαστε την κατανομή της.. Εάν όμως η κατανομή της δεν είναι γνωστή αλλά γνωρίζουμε την μέση τιμή και την τυπική απόκλιση, η παρακάτω ανισότητα που είναι γνωστή ως ανισότητα Chebychev μας επιτρέπει να υπολογίζουμε φράγματα που δεν εξαρτώνται από τη κατανομή της Χ, για τις πιθανότητες των ενδεχομένων της Χ της μορφής μ kσ, μ + kσ) Pr{ } Var)
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ Η μέση τιμή και η διακύμανση μίας τυχαίας μεταβλητής δεν είναι τα μόνα μέτρα που περιγράφουν τα χαρακτηριστικά γνωρίσματα των κατανομών. Υπάρχουν και άλλα όπως οι ροπές, τα μέτρα λοξότητας και κύρτωσης, μίας κατανομής, η διάμεσος, η κορυφή, τα ποσοστιαία σημεία κλπ. Α. Απλές Ροπές ή Ροπές περί το 0 k E k ) x - x x k k f x), f x), διακριτή συνεχής Λέγεται ροπή k-τάξης περί το μηδέν. Αν μ 1 = μ τότε έχουμε την μέση τιμή της τ.μ.k θετικός ακέραιος)
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ Β. Κεντρικές Ροπές ή Ροπές περί το μ k E ) k x - x x Λέγεται κεντρική ροπή k-τάξης περί το μ. Παρατηρούμε ότι λ 1 = 0 για κάθε κατανομή. Επίσης λ = σ δηλαδή είναι η διακύμανση. Οι κεντρικές ροπές συνδέονται με τις απλές ροπές σύμφωνα με τον γενικό τύπο : k k f x), f x), διακριτή συνεχής k k k k k 1 k k k k1 1 k 1... 1) 1
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ Γ. Τυπικές ή Τυποποιημένες Ροπές k E k, k 1,,3, Όπου μ η μέση τιμή και σ η τυπική απόκλιση. Λέγεται τυπική ή τυποποιημένη ροπή k-τάξης.. Παρατηρούμε ότι α 1 = 0 και α = 1. Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι ροπές α 3 και α 4 α 3 : Μέτρο ή συντελεστής λοξότηταςασυμμετρίας) Αν η κατανομή είναι συμμετρική τότε α 3 = 0. Αν α 3 > 0 τότε η καμπύλη είναι λοξή προς τα δεξιά ενώ αν α 3 < 0 προς τα αριστερά α 4 : Μέτρο ή συντελεστής κύρτωσης Μεγάλες τιμές του α 4 σημαίνουν πολύ κυρτή καμπύλη. Δ. Παραγοντικές Ροπές [ k] E 1)... k 1), k θετικός ακέραιος
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Τυπικές ή Τυποποιημένες Ροπές α 3 = 0 α 3 > 0 α 3 < 0 α 4 > 3 α 4 = 3 α 4 < 3
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ ΚΑΤΑΝΟΜΩΝ 1. Bn,p). HgN,n,p) 3. Geop) 4. NBk,p) q q p q p 4 3 p 9, 9 ) 1,, 1 4 3, ) ) ) 1 ), 1, n N Npq N n N N p q N n N npq np npq npq p q npq np 6pq 1 3, ),, 4 3 kq q kq q p kq p k 6 p 9, ) 1,, 4 3
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ ΚΑΤΑΝΟΜΩΝ 5. Pλ) 6.Uα,β) 7. Expλ) 8. Gα,β) 1 3, 1,, 4 3 5 9 0,, 1 ), 4 3 6 3,,, 4 3 9,, 1, 1 4 3
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΕΣ ΚΑΤΑΝΟΜΩΝ 9. Beα,β) 10.N0,1) 3) ) )] ) 1)[ 3, ) 1 ), 1) ), 4 3 3 0, 1,, 0 4 3
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΘΕΣΗ ΚΑΤΑΝΟΜΗΣ 1. Κορυφή Έστω Χ μία τ.μ.. Κάθε σημείο k για το οποίο ισχύει η σχέση f ή f k) max f k) max f x), x), διακριτή συνεχής λέγεται κορυφή ή επικρατούσα τιμή της τ.μ.. Ποσοστιαία Σημεία Έστω Χ μία τ.μ. με α.σ.κ. Fx). Κάθε σημείο x p οποίο ισχύει Pr x ή Pr x p p x x ) ) λέγεται p-ποσοστιαίο σημείο της Χ ή της κατανομής της Αν p = 0.5,,το σημείο λέγεται διάμεσος και συνήθως συμβολίζεται με m p και Pr F x p x ) 1 ) p, συνεχής p 0 x 1, για το p p, διακριτή
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ ΣΥΝΑΡΤΗΣΕΙΣ Ορισμός Έστω Χ μία τ.μ. Η ροπογεννήτρια συνάρτηση της Χ συμβολίζεται με m x t) ή mt) και ορίζεται ως ακολούθως : m t) E e t ) x e e tx f x), f x), διακριτή συνεχής Όπου f η σ.π. της Χ και t είναι παράμετρος μεταβαλλόμενη στα διαστήματα για τα οποία το άθροισμα ή το ολοκλήρωμα συγκλίνουν απόλυτα. tx Η ροπογεννήτρια υπάρχει πάντα στο σημείο t = 0. Υπάρχουν περιπτώσεις όπου υπάρχει μόνο για το 0 και για καμία άλλη τιμή του t. Αν η ροπογεννήτρια υπάρχει για μία περιοχή του t = 0 τότε έχει παραγώγους κάθε τάξης στην περιοχή αυτή.
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ ΣΥΝΑΡΤΗΣΕΙΣ Ισχύει m t) 1 r1 r r t r!, t c, c) Ισχύει m ab bt t) e m at) Η πιο σημαντική ιδιότητα των ροπογεννητριών είναι το Θεώρημα του μονοσήμαντου : αν οι ροπογεννήτριες συναρτήσεις δύο τ.μ. είναι ίσες τότε οι τ.μ. έχουν την ίδια κατανομή. Το θεώρημα αυτό μας επιτρέπει τον προσδιορισμό των κατανομών τ.μ. με την βοήθεια των ροπογεννητριών συναρτήσεων.
ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ ΣΥΝΑΡΤΗΣΕΙΣ Κατανομή Διωνυμική-Βn,p) Γεωμετρική-Geop) Pascal-NBk,p) Poisson-Pλ) Ομοιόμορφη-Uα,β) Εκθετική-Expλ) Γάμμα-Gα,β) Κανονική-Νμ,σ ) Ροπογεννήτρια m t) pe q) pe m t) 1 qe m t) p m t) e k t e t tk t t 1 qe ) t t e k 1) t e e m t) t ) m t) t m t) 1 t) m t) e t t n