Θεωρια Πιθανοτητων Ι ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (3 ο ) Τμημα Μαθηματικων Αριστοτελειο Πανεπιστημιο Θεσσαλονικης Probability Theory Ι WINTER SEMESTER (3 st ) School of Mathematics Aristotle University of Thessaloniki 5. Δεικτες Παραμετροι Iωαννης Αντωνιου iantonio@math.auth.gr Το παρόν εκπαιδευτικό υλικό υπόκειται σε Αδεια Χρήσης Creative Commons
Βασικοι Στατιστικοι Δεικτες- Παραμετροι Σκοπος-Περιεχομενο Οι βασικοι Δεικτες- Στατιστικες Παραμετροι Θεση Κατανομης (Location) Eξαπλωση- Εκταση Κατανομης (Spread or Dispersion) Σχημα Κατανομης Μέση Τιμή (mean) Ροπες (Moments) Kορυφες (modes) Διάμεσος (median). Ποσοστημορια (Quantiles, Percentiles) Εύρος (range). Διασπορα (variance) Τυπική Απόκλιση (standard deviation) Σχετικο Σφαλμα (relative error) = Mεταβλητοτης Αποστασεις Ποσοστημοριων Λοξότητα (skewness). Κύρτωση (kurtosis). (Shape) Ευρος Τιμων Δεικτων (Ανισοτητες) Σχεση Ροπων και Κατανομης (Προβλημα Ροπων) Υπολογισμοι Προσεγγιστικοι Συναρτησιακα Πιθανοτητος: Πιθανογεννητριες, Ροπογεννητριες
Στατιστικοι Δεικτες- Παραμετροι Οι Στατιστικοι Δεικτες (Παραμετροι) οριζονται: Θεωρητικα από την Κατανομη Πιθανοτητας ρ: θ = θ ρ Εμπειρικα από τα Δεδομενα των Παρατηρησεων θεωρωντας ως Πιθανοτητα την Εμπειρικη Σχετικη Συχνοτητα. θ = D (Data) D : Η Εμπειρικη Εκτιμητρια (Συναρτηση) της Παραμετρου Διαπιστωθηκε όμως ότι οι Εμπειρικες Παραμετροι θ δεν ειναι παντοτε ικανοποιητικες Εκτιμησεις Η Εμπειρικη Τυπικη Αποκλιση δεν είναι Αμεροληπτη. Διορθωση Bessel 1830. Τεθηκαν ως εκ τουτου Κριτηρια Αξιολογησης- Επιλογης Εκτιμησεων από Δεδομενα Παρατηρησεων και προεκυψαν διαφορες Εκτιμητριες των Παραμετρων που συμβολιζονται ως: θ = D (Data) D : Η Εκτιμητρια (Συναρτηση) της Παραμετρου
Δεικτες Θεσης Κατανομης (Location Parameters) Μέση Τιμή (mean) Ροπες (Moments) Kορυφες (modes) Διάμεσος (median). Ποσοστημορια (Quantiles, Percentiles)
Μεση Τιμη ή Αναμενόμενη Τιμή της Μεταβλητης X Mean Value or Expectation Value of the Variable X m = X = Ε Χ m = ν x ν p ν, για Διακριτες Μεταβλητες Προϋπόθεση: ν x ν p ν < + + m = xx x dd = dd x x, για Συνεχεις Μεταβλητες Προϋπόθεση: x dd(x) < Μεση Τιμη Συναρτησης της Μεταβλητης Χ: ΕΕ(Χ) = h(x)dd(x) Προϋπόθεση: h(x) dd(x) <
η Μεταβλητη Αθροισμα Ενδειξεων 2 Ζαριων Το Αθροισμα των ενδειξεων 2 Ζαριων Παρατηρησιμα Γεγονοτα (Κελια) Observable Events (Cells) Μέση Τιμή m= 2 1 36 + 3 2 36 + 4 3 36 + 5 4 36 + 6 5 36 + 7 6 36 + 8 5 36 + 9 4 36 + 10 3 36 + 11 2 36 + 12 1 36 m= 2 36 + 6 36 + 12 36 + 20 36 + 30 36 + 42 36 + 40 36 + 36 36 + 30 36 + 22 36 + 12 36 = 7 Πιθανοτητα Probability 2 Ξ 2 ={ (1,1)} 1/36=3% 3 Ξ 3 ={ (1,2), (2,1)} 2/36=6% 4 Ξ 4 ={ (2,2), (1,3),(3,1)} 3/36=8% 5 Ξ 5 ={ (1,4), (2,3),(3,2), (4,1)} 4/36=11% 6 Ξ 6 ={ (1,5), (2,4),(3,3), (4,2), (5,1)} 5/36=14% 7 Ξ 7 ={ (1,6), (2,5),(3,4), (4,3), (5,2), (6,1)} 6/36=17% 8 Ξ 8 ={ (2,6), (3,5),(4,4), (5,3), (6,2)} 5/36=14% 9 Ξ 9 ={ (3,6), (4,5),(5,4), (6,3)} 4/36=11% 10 Ξ 10 ={ (4,6), (5,5),(6,4)} 3/36=8% 11 Ξ 11 ={ (5,6), (6,5)} 2/36=6% 12 Ξ 12 ={ (6,6)} 1/36=3%
Μεση Τιμη Ιδιοτητες Θεωρημα E1) Γραμμικοτης E[cX]= ce[x], c πραγματικος αριθμος E[X 1 +X 2 ]= E[X 1 ] + E[X 2 ] E2) Θετικοτης E[Χ] 0, εάν Χ 0 E3) Κανονικοποιηση E[1]=1, 1(y)=1, η Μεταβλητη με σταθερη τιμη 1 Ε[Ο]=0, Ο(y)= 0, η Μεταβλητη με σταθερη τιμη 0 E4) E[X 1 ] E[X 2 ], αν X 1 X 2 E5) Ε[Χ] E[ X ] E6) Ε[g(Χ)] g(e[x]), g:χ R, πραγματικη συναρτηση της μεταβλητης Χ Οπου: Ε[g(Χ)] = g(x 1 ) p 1 + g(x 2 )p 2 + για διακριτες μεταβλητες + = g(x)ρ(x)dd για συνεχεις μεταβλητες
Μεση τιμη μεταβλητης Χ με Κατανομή Bernoulli: EE = 0 (1 p) + 1 p = p Πόρισμα. Για τη δείκτρια Μεταβλητη 1 Α E[1 A ] = P(A) Δηλαδή μπορουμε να ορισουμε την Πιθανοτητα από ένα συναρτησιακο Μεσης Τιμης με τη βοήθεια των δείκτριων Μεταβλητων Ορισμος Συναρτησιακο Μεσης Τιμης (Expectation Functional) E: X R: Χ Ε[Χ] με τις Ιδιοτητες: E1) Γραμμικοτης E2) Θετικοτης E3) Κανονικοποιηση Whittle W. 2000, Probability via Expectation, 4th ed., Springer, Berlin
Χ απαριθμητή, με: P(X = x) = p(x) = 3 2x 1 5 x, x = 1, 2,... EE = x 3 2x 1 5 x x=1 = 3 d 5 dd = 3 5 x 2 5 x=1 t 1 t = 3 5 t=2 5 x 1 = 3 d 5 dd 1 1 t 2 t=2 5 t x x=1 = 5 3 t=2 5 = Η προϋπόθεση ικανοποιείται αφού x=1 x 3 2x 1 5 x = x 3 2x 1 x=1 5 x = 5 3 <
Χ απαριθμητή, με: Παραδείγματα P X = x j = p x j = 4,, j = 1, 2,.. 5j όπππ x j = 1 j+1 5j j τότε ΕΕ δεν υπάρχει διότι δεν ικανοποιείται η προϋπόθεση, j = 1, 2,.... j=1 x j P(X = x j = 1 j=1 j+1 5j j 4 5 j = 4 1 j j=1 που αποκλίνει Όμως υπάρχει η τιμή: x j P(X = x j = 1 j=1 j=1 j+1 5j j 4 5 j = 4 1 j+1 1 j j=1 < αρμονική Είναι γνωστό ότι σειρές μη απόλυτα συγκλίνουσες δεν ικανοποιούν την προσεταιριστική ιδιότητα, πράγμα που σημαίνει ότι μεταθέτοντας τους όρους της μπορεί να προκύψει διαφορετικό άθροισμα!! εναλλάσσουσα αρμονική
Παραδείγματα 6x(1 x), 0 < x < 1 Χ απόλυτα συνεχής, με: f(x) = 0, ααααύ τότε: ΕΕ = xx(x)dd = 6x 2 (1 x)dd = 0 1 1 2 Είναι αναμενόμενο, λόγω συμμετρίας, η μέση τιμή να είναι το «μέσον» της κατανομής 1 2 Πολυχρόνης Μωυσιάδης: Θεωρία Πιθανοτήτων Ι: Τυχαίες Μεταβλητές 11
Χ μικτή, με: F X (x) = 0, x < α n 1)(x α n(β α), α x < β 1, x β 1 1 1 n F(x) Από υπολογισμό με τη βοήθεια της σ.κ. ΕΧ= Εμβαδόν σκιαγραφημένου χωρίου= =Εμβ(ορθογωνίου)+Εμβ(τραπεζίου)= α + 1+1 n ή επειδή (παράδειγμα διαφάνειας 16) F X (x) = 1 F n d(x) + n 1 F n c(x), όπου EE = 1 n 2 β α = β+α + β α 2 2n n 1 β 1 + n x 1 β α dd α β = β n + n 1 n Πολυχρόνης Μωυσιάδης: Θεωρία Πιθανοτήτων Ι: Τυχαίες Μεταβλητές α F d (x) = F c (x) = β + α 2 = β + α 2 β 0, x < β 1, x β x α β α, 0, x < α + α x < β 1, x β β α 2n 12
Eστω η τ.μ. Χ με κατανομη: f(x) = 1, 0 x 1 0, ααααύ Ποια η μέση τιμή της τ.μ. Y = ln (X), δηλαδή ποια είναι η Ε[ lnx]; E[ lnx] = ( lnx)f(x)dd 1 = ( lnx) dd 0 = 1 Δεν είναι ανάγκη να βρεθεί η κατανομή της Y = ll (X)
Εστω η τ.μ. Χ με κανονικη κατανομή Ν(0,σ 2 ) f X (x) = 1 x2 e 2σ 2, x R σ 2π Ποια η μέση τιμή της τ.μ. Y = X 2, δηλαδή ποια είναι η Ε[X 2 ]? E X 2 = x 2 f x dd = 2 x 2 1 σ 2π 0 e x2 2σ 2 dd = = 2σ 2π = 2σ 2π x2 x e 2σ 2 0 xx e 0 x 2 2σ 2 σ 2π 1 σ 2π 0 e x2 2σ 2 dd = σ 2
Μεση Τιμη Εκτιμηση από το Δειγμα Μ Μετρησεις: χ 1,, χ Μ Φασμα n Tιμων: x 1,, x n, n M m = χ 1 + + χ Μ Μ = x 1f 1 + + x n f n n = x 1 ρ 1 + + x n ρ n Η Εμπειρικη Μεση Τιμη είναι Αμεροληπτη Εκτιμητρια
Poπη ν-ταξεως, ν=1,2,3, m ν = E[X ν ] = (x 1 ) ν ρ 1 + (x 2 ) ν ρ 2 + + = x ν ρ(x)dd ΣΧΟΛΙΑ 1) m 1 = m = E[X], η πρωτη ροπη είναι η Μεση Τιμη 2) m 2 = E[X 2 ] η «Ισχυς» ή «Ροπη Αδρανειας» ή Μεση Τιμη Τετραγωνου (mean square) της Μεταβλητης X
Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων E[X 2 2 1 ] = 2 + 33 32 2 + 33 42 3 + 33 52 4 5 6 5 4 + 62 + 72 + 82 + 92 + 33 33 33 33 33 112 3 + 33 112 2 + 33 112 1 33 E[X 2 ] = 4 1 2 + 9 + 11 3 + 22 4 5 6 5 4 + 33 + 44 + 66 + 88 + 111 3 + 111 2 + 111 1 33 33 33 33 33 33 33 33 33 33 33 E[X 2 ] = 0. 11 + 0. 5 + 1. 33 + 2. 77 + 5 + 8. 11 + 8. 88 + 9 + 8. 33 + 6. 77 + 4 E[X 2 ] = 54.83 η Ισχυς της Χ
Ροπες Εκτιμηση από το Δειγμα m ν = x 1 ν ρ 1 + + x n ν ρ n Η Εμπειρικες Ροπες είναι Αμεροληπτες Εκτιμητριες
Κορυφες η Επικρατουσες Τιμες (Μοdes) Οι τιμες x=ξ mode στις οποιες η Κατανομη ρ(x) εχει (τοπικα) μεγιστα P(X = δ) P(X = x k ), k = 1,2, αν X απαριθμητή f(δ) f(x), x R αν X απόλυτα συνεχής Μονοκορυφες κατανομες (Unimodal) εχουν 1 μεγιστο Δικορυφες κατανομες (Βimodal) εχουν 2 μεγιστα
Διάμεσος ή Διχοτομος (Median) H τιμη x=ξ 1/2 : P[x< x 1/2 ] 1 2 P[x x 1/2] Η Διαμεσος χωριζει την κατανομη σε 2 μερη με ισες Πιθανοτητες Χρησιμοποιηθηκε από τον G. Fechner Fechner Law 1860: Perception of Stimulus B = k ln B B 0 B 0 = the threshold of stimulus below which no stimulus is perceived B B 0 Keynes, J.M. (1921) A Treatise on Probability, Pt II Ch XVII 5 (p 201)
Διάμεσος (Median)
Σχεση Μεσης Τιμης, Διαμεσου, Κορυφης Θεωρημα Για συμμετρικες κατανομες: Μεση Τιμη = Διαμεσος = Κορυφη Για λιγο ασυμμετρες κατανομες: Μεση Τιμη Κορυφη 3(Μεση Τιμη Διαμεσος) Για ασυμμετρες κατανομες προς τα αριστερα: α 3 > 0 Μεση Τιμη > Διαμεσος > Κορυφη Για ασυμμετρες κατανομες προς τα δεξια: α 3 < 0 Μεση Τιμη < Διαμεσος < Κορυφη
α Ποσοστημοριο, 0<α<1 α Quantile Η τιμη της μεταβλητης x = x α, 0 < α <1 με πιθανοτητα το πολύ α: P[X < x α ] α P[x x α ] αριστερά του x α η πιθανότητα είναι < p και δεξιά του x α η πιθανότητα είναι < 1 p Αν F συνεχης και γνησιως αυξουσα, τοτε το α Ποσοστημοριο είναι η λυση της Εξισωσης: F x = α x α = F 1 α
x 1/4 = x 0.25 το πρωτο τεταρτημοριο x 1/2 = x 0.50 το δευτερο τεταρτημοριο (η διαμεσος) x 3/4 = x 0.75 το τριτο τεταρτημοριο Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων x 1/4 = x 0.25 = 4 x 1/2 = x 0.50 = 7 x 3/4 = x 0.75 = 9
x 0.1, x 0.2,, x 0.9 τα 9 Δεκατημορια (Deciles) Παραδειγμα: τα 9 Δεκατημορια της Κανονικης Κατανομης:
Δεικτες Eξαπλωσης Εκτασης Κατανομης (Spread or Dispersion) Εύρος (range). Διασπορα (variance) Τυπική Απόκλιση (standard deviation) Σχετικο Σφαλμα (relative error) = Mεταβλητοτης Αποστασεις Ποσοστημοριων
Εύρος H εκταση του φασματος: x max x min Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων Eυρος x max x min = 12 2 = 10 Εύρος Δειγματος: x n x 1
Διακυμανση (Fluctuation) ή Εκτροπη (Deviation) H τιμη (Χ m) = (Χ E[X]) ΣΧΟΛΙΟ Η Εκτροπη δειχνει ποσο απεχει η μετρηση από την Μεση Τιμη Συνεπως η Μεση Διακυμανση είναι εκτιμηση της Μεταβλητοτητος της Χ Θεωρημα H μεση Διακυμανση μηδενιζεται: Ε[(Χ E[X])]=0 Αποδειξη Ε[(Χ E[X])]= Ε[Χ] E[Ε[X] = Ε[Χ] Ε[X] = 0 ΣΧΟΛΙΟ Ειμαστε υποχρεωμενοι να ορισουμε άλλες παραμετρους για την Μεταβλητοτητα
Κεντρικη Poπη ν-ταξεως, ν= 1,2,3, c ν = E[(Χ m) ν ] = (x 1 m) ν p 1 + (x 2 m) ν p 2 + + ΣΧΟΛΙΑ 1) c 1 = Ε[(Χ E[X])] = 0 = (x m) ν ρ(x)dd 2) Η c 2 = Ε[(Χ E[X]) 2 ] (η ροπη 2ας ταξεως της Μεταβλητης (Χ m) ) είναι η Μεση Τιμη του Τετραγωνου (mean square) της Διακυμανσης Η απλουστερη εκτιμηση της Μεταβλητοτητας Θεωρημα Oι Κεντρικες Ροπες αρτιας Ταξεως Συμμετρικων ως προς τον Μεσο Κατανομων, μηδενιζονται
Διασπορα (Variance) var(x) = Ε[(X m) 2 ] = (x 1 m) 2 p 1 + (x 2 m) 2 p 2 + + = (x m) 2 ρ(x)dd Θεωρημα. Ιδιοτητες της Διασπορας var[χ] 0 var [X+c] = var[x] Η τυπική απόκλιση δεν μεταβάλλεται άν στις τιμές της μεταβλητής Χ προστεθεί μια σταθερά var [cx]= c 2 var [X], c πραγματικος αριθμος var [X 1 +X 2 ] = var [X 1 ] + var [X 2 ] var [X] = E[X 2 ] (E[X]) 2 = E[X 2 ] m 2 Aποδειξη Από τον ορισμο με Αλγεβρικες Πραξεις
Διασπορα (Variance) var(x) = Ε[(X m) 2 ] = (x 1 m) 2 p 1 + (x 2 m) 2 p 2 + = (x m) 2 ρ(x)dd +
Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων E[(X 7) 2 ] = (2 7) 2 1 33 +(8 7) 2 5 33 E[(X 7) 2 ] = 5 2 1 33 + 42 2 33 + 32 3 33 2 3 4 + (3 7)2 + (4 7)2 + (5 7)2 + (6 33 33 33 7)2 5 + (7 33 7)2 6 + 33 4 3 2 + (9 7)2 + (11 7)2 + (11 7)2 + (11 33 33 33 7)2 1 33 4 5 6 5 + 22 + 12 + 02 + 12 + 33 33 33 33 22 4 + 33 32 3 + 33 42 2 + 33 52 1 33 E[(X 7) 2 ] = 22 1 33 + 11 2 33 + 9 3 33 4 5 5 4 3 + 4 + 1 + 0 + 1 + 4 + 9 + 11 2 + 22 1 33 33 33 33 33 33 33 E[(X 7) 2 ] = 4. 999
Τυπικη Αποκλιση Standard Deviation = the root mean square fluctuation = rms fluctuation σ = var[x] σ 2 = var[x] Η Τυπικη Αποκλιση είναι η συνηθης εκτιμηση των σφαλματων (θεωρουνται ως αποκλισεις από την μεση τιμη) Η τυπική απόκλιση και η διασπορά δίνουν την ίδια πληροφορία για την τ.μ. Χ. Όμως η τυπική απόκλιση μετριέται στις ίδιες μονάδες με τις τιμές της τ.μ. και προτιμάται όταν εκφράζουμε τη μεταβλητότητα της τ.μ. σε σχέση με το εύρος της.
Τυπικη Αποκλιση Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων E[(X 7) 2 ] = 4. 999 σ= vvv[x] = 4. 999 = 2. 22
Η Χ έχει κατανομή Bernoulli. ΕΕ = p σ 2 = ΕΧ 2 (ΕΕ) 2 = p p 2 = p(1 p) σ = p(1 p) EX 2 = 0 2 (1 p) + 1 2 p = p
Χ ομοιόμορφη στο [α,β]: EE = EX 2 = 1, α x β f(x) = β α 0, ααααύ β x dd α + β x f(x) dd = = β α 2 x 2 f(x) dd σ 2 = ΕΧ 2 μ 2 = α2 +α β+β 2 α β = x2 dd β α 3 α α+β 2 = β3 α 3 3(β α) = α2 + α β + β 2 3 2 σ 2 = β α 2 12 σ = β α 3 6
Νόημα της διασποράς Για ίδια μέση τιμή Όσο μεγαλύτερη η διασπορά τόσο πιο διασπαρμένες οι τιμές. Πράσινη: Ν(0, 1) Κόκκινη: Ν(0, 2 2 ) Μπλε: Ν(0, 0.5 2 ) y 0.0 0.2 0.4 0.6 0.8 µ=0, s=1 µ=0, s=2 µ=0, s=1/2-6 -4-2 0 2 4 6 x Όσο μεγαλύτερη η διασπορά, τόσο πιο αργά οι ουρές της κατανομής συγκλίνουν στις αντίστοιχες ασύμπτωτους y 0.0 0.2 0.4 0.6 0.8 1.0 µ=0, s=1 µ=0, s=2 µ=0, s=1/2-6 -4-2 0 2 4 6 x
Μεγιστη Εκτροπη (Maximum Deviation) Ανισοτητα Samuelson-Laguerre Η Εκτροπη εκαστης Μετρησης χ κ του Δειγματος χ 1,, χ Μ είναι το πολυ σ Μ 1: χ κ m σ Μ 1 σ Μ 1 χ κ m σ Μ 1 Για καθε κ = 1,2,,Μ, οπου: m = χ 1 + + χ Μ η Μεση Τιμη του Δειγματος σ = Μ χ 2 κ=1 κ x Μ η Τυπικη Αποκλιση του Δειγματος Ισοτης: σ Μ 1 = χ κ m οι Μ 1 μικροτερες μετρησεις είναι ισες χ κ x = σ Μ 1 οι Μ 1 μεγαλυτερες μετρησεις είναι ισες Samuelson P. 1968, How Deviant Can You Be?, Journal of the American Statistical Association 63, 324, 1522 1525
Πως συγκρινουμε τα σφαλματα διαφορετικων Μεταβλητων? Σχετικο η Ποσοστιαιο Σφαλμα (από την Μεση Τιμη) ή Συντελεστης Μεταβλητοτητος (από την Μεση Τιμη) Relative Deviation σ m = vaa[x] Ε[Χ] ΣΧΟΛΙΟ σ μικρο οι τιμες της X είναι πλησιον της μεσης τιμης m με μεγαλη πιθανοτητα m σ m μεγαλο οι τιμες της X είναι μακραν της μεσης τιμης m με μεγαλη πιθανοτητα Ο Συντελεστής Μεταβλητοτητος εκφράζεται επί τοις εκατό και είναι ανεξάρτητος από τις μονάδες μέτρησης. Εκφράζει ένα μέτρο σχετικής διασποράς των τιμών της μεταβλητής. Ένα δείγμα τιμών μιας μεταβλητής θεωρείται ομοιογενές όταν ο Συντελεστής Μεταβλητοτητος είναι μικρότερος ή ίσος του 10%. Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων σ m = vvv[x] Ε[Χ] = 2.23 7 = 0.319
Κεντρικες Ροπες Εκτιμηση από το Δειγμα Εμπειρικες Κεντρικες Ροπες: c ν = x 1 m ν ρ 1 + + x n m ν ρ n Εμπειρικη Διασπορα: σ 2 = (χ 1 m ) 2 + +(χ Μ m ) 2 Μ = (χ 1 m ) 2 ρ 1 + + (χ n m ) 2 ρ n Εμπειρικη Τυπικη Αποκλιση: σ = (χ 1 m ) 2 + +(χ Μ m ) 2 Μ = (χ 1 m ) 2 ρ 1 + + (χ n m ) 2 ρ n Η Εμπειρικες Κεντρικες Ροπες δεν είναι Αμεροληπτες Εκτιμητριες
Αμεροληπτη Τυπικη Αποκλιση: s = (χ 1 m ) 2 + +(χ Μ m ) 2 Μ 1 m = η Εμπειρικη Μεση Τιμη Η διoρθωση (Μ 1 αντι Μ) Bessel 1830 lim Μ s(m) σ = 0
Oρισμος Σχετικό Σφάλμα Δειγματος σ m Oρισμος Αμεροληπτο Σχετικό Σφάλμα (relative error) Δειγματος s m Oρισμος Τυπικό Σφάλμα Μεσης Τιμης Δειγματος (Standard Error of the Mean) SE= s N = (χ 1 m ) 2 + +(χ Μ m ) 2 Μ(Μ 1)
Αποστασεις Ποσοστημοριων =Ενδοποσοστημοριακό Ευρος (interquantile range). x α x 1 α Η απόσταση των συμπληρωματικών α-ποσοστημορίων x α και x 1 α Το Ενδοποσοστημοριακό Ευρος αποτελει εκτιμηση της εξαπλωσης-εκτασης των τιμών της μεταβλητης Χ. x 0.75 x 0.25 το ενδοτεταρτημοριακό ευρος (interquartile range). x 0.90 x 0.10 το ενδοδεκατημοριακό ευρος (interdecile range).
Δεικτες Σχηματος Κατανομης (Shape Parameters) Λοξότητα (skewness). Κύρτωση (kurtosis).
Λοξότητα (skewness) λ = c 3 σ 3 = Ε Χ m σ 3 c 3 = E[(Χ m) ν ] η Κεντρικη Poπη 3ης -ταξεως,
Κύρτωση (Kurtosis) k = c 4 σ4 3 k > 0 Λεπτοκυρτη κατανομη k = 0 Μεσοκυρτη κατανομη, προσεγγιζεται από την κανονικη Κατανομη k < 0 Πλατυκυρτη κατανομη
Ευρος Τιμων Δεικτων (Ανισοτητες) Εκτιμησεις Διαστηματων Τιμων Πιθανοτητων Όταν ο αμεσος υπολογισμος είναι δυσκολος Θεωρημα. Ανισοτητα Chebychev P[ X α ] = Ε φ(x) φ(α), α>0 υπο τις παραδοχες: φ: R (0, ) φ x Αποδειξις > φ(α), αν x > α Ε φ(x) <
Θεωρημα. Ανισοτητα Chebychev P[ Χ α ] = σ2 α2, α>0 P[ X m α ] = σ2 α2, α>0 σ 2 α 2, α>0 είναι το ποσοστο τιμων της Μεταβλητης Χ με αποσταση από τη μεση τιμη τουλαχιστον α Αποδ. P[ Χ α ] = Ε φ(χ) φ(α) = σ2 α2, με φ Χ = Χ2 Για Ζ=Χ α προκυπτει η δευτερη ανισοτης Παραδειγμα: X = Το Αθροισμα των ενδειξεων 2 Ζαριων P[ X 7 5 ] = 4.999 5 2 = 0. 1111
Εφαρμογες Νομοι Μεγαλων Αριθμων Παραδειγμα Εστω η Μεταβλητη Χ με Πιθανοτητα
Παραδειγμα: Εστω η Μεταβλητη Χ με Ομοιομορφη Κατανομη Μπορουμε να υπολογισουμε απ' ευθειας την Πιθανοτητα (0 α 1 2 ) Ενώ η Ανισοτητα Chebychev δινει:
Παραδειγμα: Για καθε Μεταβλητη Χ με πεπερασμενη μεση τιμη και μηδενικη διασπορα: P[X=μ]=1
Παραδειγμα: Κάθε Μεταβλητη με πεπερασμενη Μεση Τιμη και Τυπικη Αποκλιση απεχει 2 Τυπικες Αποκλισεις από την Μεση Τιμη με Πιθανοτητα τουλαχιστον 75%
Ανισοτητα Jensen Για κάθε Κυρτη Πραγματικη Συναρτηση και κάθε Μεταβλητη με πεπερασμενη Μεση Τιμη: E[φ Χ ] φ(ε Χ )
Ανισοτητα Jensen Εφαρμογες Ανισοτητα Ροπων Ανισοτητα Αριθμητικου Γεωμετρικου Μεσου Εντροπια θεωρια Πληροφοριας Ασκησεις Ολυμπιαδων
Σχεση Ροπων και Κατανομης (Προβλημα Ροπων) Το Πρόβλημα ροπών Ευρεση της Κατανομης από τις Ροπες Αν είναι γνωστή η κατανομή της Μεταβλητης Χ, δηλ. είναι γνωστή η f(x) ή η F(x), τότε μπορούμε καταρχήν να υπολογίσουμε τις ροπές m ν, εφόσον υπάρχουν και χαρακτηριζουμε καποιες ιδιοτητες της κατανομης. Ισχυει το αντιστροφο? Αν είναι γνωστές οι ροπές m 1, m 2, μιας τ.μ. Χ, μπορεί να προσδιοριστεί η κατανομή της μονοσήμαντα; υπο προυποθεσεις (moment problem). Η απάντηση είναι εν γένει αρνητική, διότι υπάρχουν διαφορετικές κατανομές με όλες τις ροπές ίσες Συνηθως στην πραξη αρκουν οι 4 πρωτες ροπες για προσεγγιση της κατανομης
Το Πρόβλημα ροπών Ευρεση της Κατανομης από τις Ροπες ΘΕΩΡΗΜΑ Αν m 1, m 2,, είναι οι ροπές μιας τ.μ., τότε υπάρχει μία μόνο σ.κ. με αυτές τις ροπές, αν μία από τις παρακάτω συνθήκες ικανοποιείται: Akhiezer N. 1965, The classical moment problem and some related questions in analysis, Hafner, New York
Υπολογισμοι Προσεγγιστικοι Μπορουμε να υπολογισουμε την Μεση Τιμη και την διασπορα της φ(χ) από την Μεση Τιμη μ και την Διασπορα σ 2 της Χ Τυπος Taylor σ 2 μικρη
Εφαρμογη Εστω Υ = lnχ
Συναρτησιακα Πιθανοτητος: Πιθανογεννητριες, Ροπογεννητριες Mπορουμε να υπολογισουμε Παραμετρους από Συναρτησιακα της Πιθανοτητος Γνωριζοντας το Συναρτησιακο Καθοριζεται μονοσημαντως η Πιθανοτητα Πιθανογεννητρια Probability Generating Function Π z = E z x = p(x)z x x=0 Ροπογεννητρια Moment Generating Function Laplace Transform of the DF Χαρακτηριστικη Συναρτηση Characteristic Functional Fourier Transform of the DF M k = E e tx = p(x)e tx x=0 = ddρ x e tx C(k) = ddρ x e iii
Πιθανογεννήτριες Π X ( z ) =Π ( z ) = Ez ( ), z Χρησιμοποιείται κυρίως όταν Χ είναι απαριθμητή, με τιμές 0, 1, 2,. και πιθανότητες p x = P X = x, x = 0, 1, 2,.. οπότε γράφεται ως δυναμοσειρά: Επειδή p(x)=π(1)=ε(1)=1 η δυναμοσειρά συγκλίνει απόλυτα τουλάχιστον στο x=0 [ 1,1] και επομένως στο διάστημα αυτό η παράγωγός της όρον-προς-όρον είναι δυναμοσειρά συγκλίνουσα (απόλυτα) στο [-1,1]. Το ίδιο ισχύει για το ολοκλήρωμα. Προκύπτουν εύκολα οι σχέσεις: x 1 2 2 σ =Π (1) +Π (1) ( Π (1)) X ( X x Π ( z) = Ez ( ) = ( ) Π ) (0) «γεννά» pxz pk ( ) = k! x= 0 EX ( ) =Π (1) = pxxz ( ) = xpx ( ) = xpx ( ) x= 1 z= 1 x= 1 x= 0 ( k ) Παραγοντική ροπή k τάξης EX ( X 1) ( X k + 1) = Π (1) k πιθανότητες
Πιθανογεννητρια Αθροισματος Ανεξαρτητων Μεταβλητων Θεωρημα Η Πιθανογεννητρια του Αθροισματος Χ 1 + Χ 2 δυο Ανεξαρτητων Μεταβλητων Χ 1, Χ 2 Είναι το Γινομενο των αντιστοιχων Πιθανογεννητριων Π z = Π 1 (z) Π 2 (z)
Ροπογεννητριες M k = E e tt = p(x)e tt x=0 = ddρ x e tt
Η Ροπογεννητρια καθοριζει μονοσημαντως την Κατανομη
Ροπογεννητρια Αθροισματος Ανεξαρτητων Μεταβλητων Θεωρημα Η Ροπογεννητρια του Αθροισματος Χ 1 + Χ 2 δυο Ανεξαρτητων Μεταβλητων Χ 1, Χ 2 Είναι το Γινομενο των αντιστοιχων Ροπογεννητριων M t = M 1 (t) M 2 (t) Αποδειξις Όπως το αντιστοιχο Θεωρημα στις Πιθανογεννητριες