3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ"

Transcript

1 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας µεταβλητής. Για µια διακριτή τυχαία µεταβλητή Χ µε δυνατές τιµές x, x 2 x η µέση τιµή ορίζεται µε τη σχέση E(X) = x P(X = x ) + + x P(X = x ) = Ή αν θέσουµε P(X = x j ) = f(x j ) µε την xj P(X = x j ) () E(X) = x f(x ) + +x f(x ) = xj f(x j ) = x f(x) (2) Στην ειδική περίπτωση που οι πιθανότητες είναι ίσες έχουµε E(X) = (x + x 2 + +x )/ (3) που καλείται αριθµητικός µέσος όρος ή απλά µέσος όρος των x, x 2 x. Για µια συνεχή µεταβλητή Χ µε συνάρτηση πυκνότητας f(x) η αναµενόµενη ή µέση τιµή ορίζεται µε τη σχέση E(X) = x f(x) dx (4) η σχέση αυτή προκύπτει από τη σχέση (2) αν αντικαταστήσουµε το άθροισµα µε ολοκλήρωµα. ΜΕΡΙΚΑ ΘΕΩΡΗΜΑΤΑ ΓΙΑ ΤΗ ΜΕΣΗ ΤΙΜΗ Θεώρηµα 3- : Αν c είναι µια σταθερά τότε E(c X) = c E(X) Θεώρηµα 3-2 : Αν Χ και Υ δύο τυχαίες µεταβλητές, τότε E(X + Y) = E(X) + E(Y)

2 2 Θεώρηµα 3-3 : Αν Χ και Υ δύο ανεξάρτητες τυχαίες µεταβλητές, τότε E(X Y) = E(X) E(Y) Τα παραπάνω θεωρήµατα ισχύουν και για περισσότερες µεταβλητές. Η ΙΑΣΠΟΡΑ ΚΑΙ Η ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ Μια άλλη αξιοσηµείωτη ποσότητα στη θεωρία των πιθανοτήτων και τη στατιστική είναι η διασπορά ή διακύµανση ή µεταβλητότητα που ορίζεται µε τη σχέση : Var(X) = E[(X µ) 2 ] (5) Προφανώς η διασπορά είναι µη αρνητικός αριθµός. Η θετική τετραγωνική της ρίζα καλείται τυπική απόκλιση και ισούται µε σ x = Var(X) = E[(X - µ ) 2 ] (6) Αν Χ είναι µια διακριτή τυχαία µεταβλητή µε συνάρτηση πυκνότητας f(x) τότε η διασπορά δίνεται από τη σχέση σ 2 x = E[(X µ) 2 ] = (xj µ) 2 f(x j ) = (x - µ) 2 f(x) Αν όλες οι πιθανότητες είναι ίσες η σχέση αυτή γράφεται σ 2 = [(x - µ) 2 +(x 2 µ) 2 + +(x µ) 2 ]/ Αν Χ είναι µια συνεχής τυχαία µεταβλητή µε συνάρτηση πυκνότητας f(x) τότε η διασπορά δίνεται από τη σχέση σ 2 x = E[(X µ) 2 ] = (x - µ) 2 f(x) dx (7) Η διασπορά ή τυπική απόκλιση αποτελούν ένα µέτρο του πόσο διεσπαρµένες είναι οι τιµές της τυχαίας µεταβλητής γύρω από τη µέση τιµή. Αν οι διάφορες δυνατές τιµές είναι συγκεντρωµένες κοντά στη µέση τιµή η διασπορά είναι µικρή, ενώ αντίθετα η διασπορά είναι µεγάλη ΜΕΡΙΚΑ ΘΕΩΡΗΜΑΤΑ ΓΙΑ ΤΗ ΙΑΣΠΟΡΑ Θεώρηµα 3-4 : Είναι σ 2 = E[(X µ) 2 ] = E(X 2 )- µ 2 = E(X 2 ) - [E(X)] 2 όπου µ = Ε(Χ) Θεώρηµα 3-5 : Αν c είναι µια σταθερά τότε Var(cX) = c 2 Var(x) Θεώρηµα 3-6 : Η ποσότητα E[(X α) 2 ] γίνεται ελάχιστη όταν α = µ = Ε(Χ) Θεώρηµα 3-7 : Αν Χ και Υ είναι ανεξάρτητες τυχαίες µεταβλητές, τότε

3 22 Var(X + Y) = Var(X) + Var(Y) Var(X - Y) = Var(X) + Var(Y) Γενικά, η διασπορά αθροίσµατος ή διαφοράς ανεξάρτητων µεταβλητών ισούται µε το άθροισµα των διασπορών. ΤΥΠΟΠΟΙΗΜΕΝΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ Έστω Χ µια τυχαία µεταβλητή µε µέση τιµή µ και απόκλιση σ. Ορίζουµε την αντίστοιχη τυποποιηµένη ή τυπική ή ανηγµένη τυχαία µεταβλητή µε τη σχέση X * = (X µ)/σ Η Χ * έχει µια σπουδαία ιδιότητα : Η µέση τιµή είναι ίση µε µηδέν και η διασπορά της ίση µε ένα, δηλ. Ε(Χ * ) = 0 Var(X * ) = Οι τυποποιηµένες µεταβλητές χρησιµοποιούνται συχνά στη σύγκριση διαφορετικών κατανοµών. ΡΟΠΕΣ Αν Χ είναι µια τυχαία µεταβλητή καλείται ροπή r τάξεως της Χ περί τη µέση τιµή µ ή κεντρική ροπή τάξεως r η ποσότητα µ r = E[(X µ) r ], r = 0,, 2 Είναι προφανές ότι µ 0 =, µ = 0 και µ 2 = σ 2 Γενικά είναι µ r = (xj µ) r f(x j ) = (x - µ) r f(x) για διακριτή µεταβλητή (8) µ r = (x - µ) r f(x) dx για συνεχή µεταβλητή (9) Επίσης ορίζουµε τη ροπή τάξεως r της Χ περί την αρχή µε τη σχέση µ r = E (X r ) Στην περίπτωση αυτή ισχύουν οι τύποι (8) και (9) µε µ = 0 Οι ροπές που ορίσαµε συνδέονται µε τη σχέση : r µ r = µ r µ r-µ + + (-) j r µ r-j µ j + +(-) r µ 0 µ r j Αξίζει να σηµειωθεί ότι µ 0 = και µ = µ

4 23 ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ Η ροπογεννήτρια συνάρτηση µιας τυχαίας µεταβλητής Χ ορίζεται µε τη σχέση Μ x (t) = E(e tx ) Που γράφεται Μ x (t) = t e xj f(x j ) = e t xj f(x) για διακριτή µεταβλητή Μ x (t) = t e xj f(x) dx για συνεχή µεταβλητή Αναπτύσσοντας σε σειρά Taylor έχουµε Μ x (t) = + µ t + µ 2 t 2 / 2! + + µ r t r /r! Επίσης ισχύει µ r = d r (Μ x (t) t=0 )/dt r ηλ. η µ r είναι η παράγωγος r τάξεως της Μ x (t) υπολογισµένη στο t=0 ΧΑΡΑΚΤΗΡΙΣΤΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ Αν θέσουµε t = iω στη ροπογεννήτρια λαµβάνουµε τη χαρακτηριστική συνάρτηση Μ x (ωi) = E(e iωx ) Έπεται ότι Μ x (iω) = iω e xj f(x j ) = e iω xj f(x) για διακριτή µεταβλητή Μ x (iω) = Επίσης ισχύει iω e xj f(x) dx για συνεχή µεταβλητή Μ x (iω) = + µ iω - µ 2 ω 2 / 2! + + i r µ r ω r /r! µ r = (-) r i r d r (φ x (ω) ω=0 )/dω r ΙΑΣΠΟΡΕΣ ΚΟΙΝΗΣ ΚΑΤΑΝΟΜΗΣ Τα προηγούµενα µπορούν να γενικευτούν για δύο ή περισσότερες µεταβλητές. Αν Χ και Υ είναι δύο συνεχείς τυχαίες µεταβλητές µε κοινή συνάρτηση πυκνότητας f(x, y) οι αναµενόµενες ή µέσες τιµές των Χ και Υ είναι µ X = E(X) = x f(x, y) dx dy µ Y = E(Y) = και οι διασπορές y f(x, y) dx dy

5 24 σ 2 X = E[(X µ x ) 2 ] = (x - µ x) 2 f(x, y) dx dy σ 2 Y = E[(Y µ Y ) 2 ] = (y µ Y) 2 f(x, y) dx dy Για δύο τυχαίες µεταβλητές Χ και Υ µια άλλη αξιοσηµείωτη ποσότητα είναι η συνδιακύµανση ή συµµεταβλητότητα που ορίζεται µε τη σχέση σ XY = Cov(X, Y) = E[(X µ x ) (Y µ Y )] Χρησιµοποιώντας την κοινή συνάρτηση πυκνότητας έχουµε σ XY = (x - µ x) (y µ Y ) f(x, y) dx dy Οι παραπάνω σχέσεις ισχύουν και για διακριτές µεταβλητές αν αντικαταστήσουµε τα ολοκληρώµατα µε αθροίσµατα. Θεώρηµα 3-8 : σ XY = E(XY)-E(X)E(Y) = E(XY) µ X µ Y Θεώρηµα 3-9 : Αν Χ και Υ είναι δύο ανεξάρτητες τυχαίες µεταβλητές σ XY = Cov(X, Y) = 0 Το αντίστροφο δεν ισχύει πάντα Θεώρηµα 3-0 : Var(X±Y) = Var(X) + Var(Y) Θεώρηµα 3- : σ XY σ XY ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Αν οι Χ και Υ είναι ανεξάρτητες, τότε σ XY = Cov(X, Y) = 0. Αντίθετα, αν Χ=Υ τότε σ XY = Cov(X, Y) = σ X σ Y. Θεωρούµε ως µέτρο της ανεξαρτησίας των δύο µεταβλητών την ποσότητα ρ = σ XY / (σ Y σ X ) που είναι αδιάστατη και καλείται συσχέτισης και λαµβάνει τιµές από έως. Αν ρ=0 δηλ. η συνδιασπορά είναι µηδέν, τότε οι Χ και Υ καλούνται ασυσχέτιστες ή ορθογώνιες. ΜΕΣΗ ΤΙΜΗ, ΙΑΣΠΟΡΑ ΚΑΙ ΡΟΠΕΣ ΥΠΟ ΣΥΝΘΗΚΗ Εάν οι Χ και Υ έχουν κοινή συνάρτηση πυκνότητας f(x, y), τότε, όπως είδαµε στο Κεφ. 2 η συνάρτηση πυκνότητας υπό συνθήκη της Υ δεδοµένης της Χ είναι f (y \ x) = f (x,y) / f (x), όπου f (x) είναι η περιθώρια συνάρτηση πυκνότητας της Χ. Ορίζουµε τώρα τη µέση ή αναµενόµενη τιµή υπό συνθήκη της Υ δεδοµένης της Χ µε τη σχέση

6 25 E(Y Χ=x) = y f(y x) dy όπου το Χ= χ σηµαίνει χ<x x + dx στην περίπτωση συνεχών µεταβλητών. Τα θεωρ. 3-, 3-2 και 3-3 ισχύουν και για µέσες τιµές υπό συνθήκη. ύο χρήσιµες ιδιότητες είναι οι εξής. E(Y Χ=x) = E(Y) 2. E(Y) = E(Y Χ=x) f(x) dx Συχνά είναι βολικότερο να υπολογίζουµε µέσες τιµές χρησιµοποιώντας την ιδιότητα 2 παρά απ ευθείας. Τα γνωστά θεωρήµατα για διασπορές και ροπές ισχύουν και για τα αντίστοιχα µεγέθη υπό συνθήκη. Mε όµοιο τρόπο ορίζουµε τη διασπορά υπό συνθήκη της Υ δεδοµένης της Χ E[(Y- µ ΥΧ ) 2 Χ=x] = (y- µ ΥΧ) 2 f(y x) dy όπου µ ΥΧ = Ε (Y Χ=x) Επίσης ορίζουµε τη ροπή τάξεως r υπό συνθήκη της Υ δεδοµένης της Χ περί κάποια τιµή α µε τη σχέση E[(Y- α) r Χ=x] = (Y- α) r f(y x) dy Τα γνωστά θεωρήµατα για διασπορές και ροπές ισχύουν και για τα αντίστοιχα µε γέθη υπό συνθήκη Η ΑΝΙΣΟΤΗΤΑ ΤΟΥ CHEBYSHEV Ένα σηµαντικό θεώρηµα στη θεωρία πιθανοτήτων και τη στατιστική, που αναφέρεται σε µια γενική ιδιότητα διακριτών ή συνεχών µεταβλητών µε πεπερασµένες µέση τιµή και διασπορά, είναι γνωστό σαν ανισότητα του Chebyshev. Θεώρηµα 3-2 (Ανισότητα του Chebyshev): Εάν η Χ είναι µια τυχαία µεταβλητή (διακριτή ή συνεχής) µε µέση τιµή µ και διασπορά σ 2 πεπερασµένες, τότε για κάθε θετικό αριθµό ε είναι P( X-µ ε) (σ 2 /ε 2 )

7 26 Ο ΝΟΜΟΣ ΤΩΝ ΜΕΓΑΛΩΝ ΑΡΙΘΜΩΝ Το επόµενο θεώρηµα που είναι γνωστό σαν νόµος των µεγάλων αριθµών, είναι µια ενδιαφέρουσα συνέπεια της ανισότητας του Chebyshev. Θεώρηµα 3-3 (Νόµος των µεγάλων αριθµών): Έστω ότι οι τυχαίες µεταβλητές Χ, Χ 2, είναι (τελείως) ανεξάρτητες και έχουν πεπερασµένες µέση τιµή µ και διασπορά σ 2. Εάν S = X + X 2 + +X (=,2,.), τότε lim Ρ( S /- µ ε) = 0 Επειδή S / είναι ο µέσος όρος των Χ,, Χ, τότε το θεώρηµα αυτό λέει ότι η πιθανότητα να διαφέρει ο µέσος όρος S / από τη µέση τιµή µ περισσότερο από ε τείνει στο µηδέν, όταν. Σαν συνέπεια του θεωρήµατος αυτού θα περίµενε κανείς ότι lim ότι µε πιθανότητα είναι S / = µ, αλλά αυτό δεν είναι σωστό. Μπορούµε όµως να δείξουµε lim S / = µ, που συχνά καλείται ισχυρός νόµος των µεγάλων αριθµών, ενώ το θεωρ. 3-3 καλείται ασθενής νόµος των µεγάλων αριθµών ή απλά νόµος των µεγάλων αριθµών. ΑΛΛΕΣ ΠΑΡΑΜΕΤΡΟΙ ΘΕΣΕΩΣ Είδαµε ότι η µέση τιµή µιας τυχαίας µεταβλητής Χ δίνει µια ιδέα των τιµών της κατανοµής, ένα µέτρο της κεντρικής τάσεως, όπως λέµε. Αν και η µέση τιµή χρησιµοποιείται συχνότερα µερικές φορές προτιµώνται δύο άλλες παράµετροι θέσεως. Αυτές είναι η πιθανότερη τιµή και η διάµεση τιµή.. Πιθανότερη τιµή είναι που έχει τη µεγαλύτερη πιθανότητα να συµβεί. Γι αυτή την τιµή f(x) γίνεται µέγιστη. Εάν αυτό συµβαίνει για µια τιµή, τότε λέµε ότι έχουµε µονοκόρυφη κατανοµή. Μερικές φορές όµως αυτό συµβαίνει για περισσότερες από µια τιµές, οπότε έχουµε δικόρυφη, τρικόρυφη, κτλ., πολυκόρυφη κατανοµή.

8 27 2. ιάµεση τιµή ή διχοτόµος τιµή καλείται ή τιµή για την οποία P(Χ χ) = P(X x) = / 2. Στην περίπτωση συνεχούς κατανοµής ή διάµεση τιµή αντιστοιχεί στο σηµείο που χωρίζει την καµπύλη πυκνότητας σε δυο κοµµάτια µε εµβαδό ½ κάτω από το κάθε κοµµάτι. Στην περίπτωση διακριτής κατανοµής. Στην περίπτωση διακριτής κατανοµής ενδέχεται να µην υπάρχει µια µόνο διάµεση τιµή. ΕΚΑΤΟΣΤΙΑΙΑ ΣΗΜΕΙΑ Συχνά είναι βολικό να διαιρούµε το εµβαδό µεταξύ µιας καµπύλης πυκνότητας και του οριζόντιου άξονα µε τετµηµένες, έτσι ώστε το αριστερά µιας τετµηµένης εµβαδό να είναι ένα µέρος του όλου εµβαδού. Το µέρος του εµβαδού καλείται ποσοστό και η αντίστοιχη τετµηµένη - ποσοστιαίο σηµείο ή 00 - στο εκατοστιαίο σηµείο. Έτσι στο χ α είναι το - ποσοστιαίο σηµείο µε αντίστοιχο ποσοστό. Σε πίνακες δίνονται τιµές της χ α. Π.χ. χ. 0 είναι το 0.0- ποσοστιαίο σηµείο ή το 0 το εκατοστιαίο σηµείο, δηλ. η τετµηµένη µε 0.0 ή 0% του εµβαδού προς τα αριστερά. ΑΛΛΕΣ ΠΑΡΑΜΕΤΡΟΙ ΙΑΣΠΟΡΑΣ Όπως υπάρχουν διάφορες παράµετροι θέσεως, υπάρχουν και διάφορες παράµετροι διασποράς, που δίνουν µια περιληπτική, ελλιπή ιδέα του πως είναι κατανεµηµένες οι πιθανότητες στις διάφορες τιµές της τυχαίας µεταβλητής. Εκτός από τη διασπορά (ή την τυπική απόκλιση) έχουµε και τις εξής παραµέτρους διασποράς:. Πλάτος ή έκταση είναι η διαφορά της µεγαλύτερης δυνατής τιµής της µεταβλητής µείον τη µικρότερη δυνατή τιµή. Εάν µια από τις τιµές αυτές είναι άπειρη, το πλάτος δεν ορίζεται. 2. Κεντρικό πλάτος καλείται η διαφορά χ.75 χ.25, ενώ µισοκεντρικό πλάτος καλείται η ποσότητα ½ (χ.75 χ.25 ). 3. Μέση απόλυτη απόκλιση µιας τυχαίας µεταβλητής Χ καλείται η µέση τιµή της Χ µ και συµβολίζεται µε Μ.Α.Α. (Χ). Έτσι έχουµε

9 28 M.A.A.(X) = E[ x-µ ] = x-µ f(x) M.A.A.(X) = E[ x-µ ] = x-µ f(x)dx ΑΣΥΜΜΕΤΡΙΑ ΚΑΙ ΚΥΡΤΩΣΗ. Ασυµµετρία. Συχνά µια κατανοµή δεν είναι σηµαντική, δηλ. δεν υπάρχει τιµή της τυχαίας µεταβλητής ως προς την οποία η συνάρτηση πιθανότητας ή η πυκνότητα πιθανότητας να είναι συµµετρική. Σε τέτοιες περιπτώσεις η κατανοµή παρουσιάζει συχνά µια «ουρά» προς τα δεξιά ή προς τα αριστερά. Μια ποσότητα που µπορεί να χρησιµοποιηθεί σαν µέτρο της ασυµµετρίας, καλείται συντελεστής ασυµµετρίας ή απλά ασυµµετρία ή ακόµα συντελεστής λοξότητας ή λοξότητα. Μια τέτοια ποσότητα είναι η α 3 = Ε[(Χ-µ) 3 ]/σ 3 = µ 3 /σ 3 Που δεν έχει διαστάσεις. Η α 3 είναι θετική ή αρνητική για κατανοµή ασύµµετρη προς τα δεξιά ή προς τα αριστερά αντίστοιχα. Για συµµετρική κατανοµή είναι α 3 = Κύρτωση. Μια κατανοµή µπορεί να είναι «συγκεντρωµένη» κοντά στη µέση τιµή, οπότε η καµπύλη που την παριστάνει παρουσιάζει µια έντονη κύρτωση (καµπούριασµα). Μπορεί όπως µια κατανοµή να µην είναι συγκεντρωµένη κατ αυτό τον τρόπο, όποτε η καµπύλη που την παριστάνει δεν παρουσιάζει σαφή κύρτωση. Μια ποσότητα που µπορεί να χρησιµοποιηθεί σαν µέτρο της κύρτωσης, καλείται συντελεστής κυρτώσεως ή απλά κύρτωση. Μια τέτοια ποσότητα είναι η α 4 = Ε[(Χ-µ) 4 ]/σ 4 = µ 4 /σ 4 που δεν έχει διαστάσεις. Η ποσότητα αυτή συγκρίνεται συνήθως µε το 3, που είναι η αντίστοιχη ποσότητα για την κανονική κατανοµή (Κεφ.4).

10 29 Είναι δυνατό να ορίσουµε συντελεστές ασυµµετρίας και κυρτώσεως χρησιµοποιώντας άλλες παραµέτρους θέσεως και διασποράς. Συνήθως όµως χρησιµοποιούνται οι συντελεστές που ορίσαµε εδώ.