Στατιστική Ι- Γεώργιος Κ. Τσιώτας Τμήμα Οικονομικών Επιστημών Σχολή Κοινωνικών Επιστημών Πανεπιστήμιο Κρήτης 7 Οκτωβρίου 2016
Περιγραφή 1 Μέσος Διάμεσος Τεταρτημόρια
Περιγραφή 1 Μέσος Διάμεσος Τεταρτημόρια
Μέσος Μέσος Περιγραφή Ο Μέσος(ή Αριθμητικός Μέσος) εκφράζει τον σταθμισμένο μέσο όρο των τιμών μιας τυχαίας μεταβλητής μέσω δειγματοληψίας Πως το εκτιμούμε; 1 Άποδειγματοληψία N = N i=1 f i N i=1 E(x) = x = f ix i N i=1 f i 2 όπου f i εκφράζουντιςσυχνότητεςκάθε x i δειγματικούσημείου N i=1 E(x) = x = x i N γιαμικράσυνήθωςδείγματα(εδώηκαθετιμή x i σταθμίζεταιμε 1). βεαμερ-τυ-λογ
Μέσος Σημαντικό! ΟΜέσος xεκφράζειτομέτροπουελαχιστιποιείωςπρος x 0 τομέσο σταθμισμένο τετραγωνικό σφάλμα: n i=1 min{ f i(x i x 0 ) 2 N i=1 f }, i έτσι x 0 x
Διάμεσος Διάμεσος Περιγραφή ΗΔιάμεσοςείναιέναμέτροθέσηςπουεκφράζειτηντιμήτηςτυχαίας μεταβλητής για την οποία έχουμε αθροιστική πιθανότητα τουλάχιστόν ίση με το 50% της συνολικής του δείγματος μας. M = {x i : F(x i ) N/2} Πως το εκτιμούμε την Διάμεσο σε μικρό πληθος N παρατηρήσεων; 1 Θέτουμε τις τυχαίες μεταβλητές σε αύξουσα διάταξη. 2 Εάνέχουμεάρτιοπλήθος N,ηΔιάμεσος Mορίζεταιωςομέσοςόρος τωνπαρατηρήσεων: N 2 και N 2 + 1. 3 Εάνέχουμεπεριττόπλήθος N,ηΔιάμεσος Mορίζεταιωςηπαρατήρηση: N 1 2 + 1.
Διάμεσος Παράδειγμα: μικρού μεγέθους ΝαπροσδιορίσετετηΔιάμεσοτων 1, 2, 3, 4καθώςκαιαυτήτων 1, 2, 1000, 100, 3αριθμών. Λύση: Ηπρώτησειράείναισεαύξουσαδιάταξη.Τοπλήθοςτωντ.μ.είναι άρτιο(n = 4),έτσιωςδιάμεσοςορίζεταιωςομ.ο.της2ηςκαιτης3ης παρατήρησης: 1 M 2 3 4 M = 2+3 2 = 2, 5.Φέρνουμετηδεύτερησειράσεαύξουσαδιάταξη.Τοπλήθος τωντ.μ.είναιπεριττό(n = 5),έτσιωςδιάμεσοςορίζεταιη3ηπαρατήρηση: M = 3. 1 2 M 3 100 1000
Τεταρτημόρια Τεταρτημόρια Περιγραφή Το k-τεταρτημόριο είναι ένα μέτρο θέσης που εκφράζει την τιμή της τυχαίας μεταβλητ ς για την οποία έχουμε αθροιστική πιθανότητα τουλάχιστόν ίση με το k N/4τηςσυνολικήςτουδείγματοςμας Πως το εκτιμούμε; 1 Πρώτο Τεταρτημόριο Q 1 = {x : F(x) N/4} 2 Δεύτερο Τεταρτημόριο ή Διάμεσος 3 Τρίτο Τεταρτημόριο Q 3 = {x : F(x) 3 N/4}
Τεταρτημόρια Εκτίμηση Διαμέσου στην περίπτωση ταξινομημένων δεδομένων Q 2 = l i + δ i f i [ N 2 F i 1], 1 l i,κατώτεροόριοκλάσηςγιατοοποίοισχύει F(x) N/2 2 δ i εύροςτηςκλάσης 3 f i ησυχνότηταγιατηνκλάσηγιατηνοποίαισχύει F(x) N/2 4 F i 1 Ηαθροιστικήσυχνότητατης i 1κλάσηςγιατηνοποίαισχύει F(x) N/2
Τεταρτημόρια Εκτίμηση Πρώτου και Τρίτου Τεταρτημόριου στην περίπτωση ταξινομημένων δεδομένων Q 1 = l i + δ i f i [ N 4 F i 1], Q 3 = l i + δ i [ 3 N F i 1 ], f i 4
Περιγραφή Το P%ποσοστιμόριοθααντιπροσωπεύειτην (N+1) P 100 παρατήρηση σε αύξουσα διάταξη. Παράδειγμα: Να βρεθούν τα πιο κάτω ποσοστιμόρια των αριθμών: 0, 0, 5, 7, 8, 9, 12, 14, 22, 33 Αφού φέρουμε τους αριθμούς σε αύξουσα διάταξη, θα έχουμε: 1 Το 25%ποσοστιμόριοορίζεταιωςο: 11 25/100 = 2, 75αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 0και 5,έτσιώστε: Q 1 = P 25 = 0+0, 75 (5 0) = 3, 75 2 Το 40%ποσοστιμόριοορίζεταιωςο: 11 40/100 = 4, 4αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 7και 8,έτσιώστε: P 40 = 7+0, 40 (8 7) = 7, 4 3 Το 50%ποσοστιμόριοορίζεταιωςο: 11 50/100 = 5, 5αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 8και 9,έτσιώστε: Q 2 = P 50 = 8+0, 50 (9 8) = 8, 5 βεαμερ-τυ-λογ
Παράδειγμα: Να βρεθούν τα πιο κάτω ποσοστιμόρια των αριθμών: 0, 0, 5, 7, 8, 9, 12, 14, 22, 33(συν.) 1 Το 75%ποσοστιμόριοορίζεταιωςο: 11 75/100 = 8, 25αριθμός. Επομένως θα βρίσκεται ανάμεσα στις τιμές 14 και 22, έτσι ώστε: Q 3 = P 75 = 14+0, 25 (22 14) = 16 2 Το 90%ποσοστιμόριοορίζεταιωςο: 11 90/100 = 9, 9αριθμός. Επομένως θα βρίσκεται ανάμεσα στις τιμές 22 και 33, έτσι ώστε: P 90 = 22+0, 9 (33 22) = 31, 9.
Επικρατούσα Τιμή Περιγραφή Επικρατούσα Τιμή εκφράζει την τιμή της τυχαίας μεταβλητής κατά την οποία επιτυγχάνουμε τη μεγαλύτερη συχνότητα Πως το εκτιμούμε; m = {x : f(x) = max(f 1,...,f n)} Προβλήματα στην εκτίμηση της m 1 ΗΕπικρατούσαΤιμήεπηρεάζεταιαπότοναριθμόκατοεύροςτων κλάσεων. Μια πιθανή αύξηση του εύρους αυτής θα μετέβαλε πολλές φορές και την τιμή του. Οταν δεν ορίζουμε κλάσεις, η επικρατούσα τιμή αποτελεί ένα πιο αντικειμενικό μέτρο. 2 ΗίδιαΕπικρατούσαΤιμήμπορείναδοθείσεδύοήπερισσότερεςτυχαίες μεταβλητές. Σε αυτήν την περίπτωση έχουμε δι-κόρυφες ή πολυ-κόρυφες κατανομές συχνοτήτων. βεαμερ-τυ-λογ
Παράδειγμα: Αριθμ ος γεννήσεων ανά ώρα εντός ενός 24ώρου x i f i F i f i x i 1 6 6 6 1=6 2 6 12 6 2=12 3 4 16 4 3 =12 4 3 19 3 4=12 5 2 21 2 5=10 6 2 23 2 6=12 10 1 24 1 10=10 7 i=1 f ix i = 74 x = 1 N 7 i=1 f i x i = 1 74 (6 1+6 2+4 3+3 4+2 5+2 6+1 10)= = 3, 0833. 24 24
Παράδειγμα: Αριθμ ος γεννήσεων ανά ώρα εντός ενός 24ώρου Τεταρτημόρια, Επικρατούσα τιμή 1 Το 25%ποσοστιμόριοορίζεταιωςο: 25 25/100 = 6, 25αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 1και 2,έτσιώστε: Q 1 = P 25 = 1+0, 25 (2 1) = 1, 25 2 Το 50%ποσοστιμόριοορίζεταιωςο: 25 50/100 = 12, 5αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 2και 3,έτσιώστε: Q 2 = P 50 = 2+0, 50 (3 2) = 2, 5 3 Το 75%ποσοστιμόριοορίζεταιωςο: 25 75/100 = 18, 75αριθμός. Επομένωςθαβρίσκεταιανάμεσαστιςτιμές 3και 4,έτσιώστε: 4 Η επικρατούσα(ες) τιμή(ές) Q 3 = P 75 = 3+0, 75 (4 3) = 3, 75 m = {1, 2} βεαμερ-τυ-λογ
Παράδειγμα: Τιμές αμόλυβδης βενζίνης για τους 51 νομούς της χώρας τιμές x i κεντρικές x i f i F i f i x i [1, 65, 1, 67) 1,66 7 7 7 1,66= 11,62 [1, 67, 1, 69) 1,68 16 23 Q 1 16 1,68 =26,88 [1, 69, 1, 71) 1,70 13 36 Q 2 13 1,70 =22,10 [1, 71, 1, 73) 1,72 5 41 Q 3 5 1,72 =8,60 [1, 73, 1, 75) 1,74 4 45 4 1,74=6,96 [1, 75, 1, 77) 1,76 1 46 1 1,76 =1,76 [1, 77, 1, 79) 1,78 5 51 5 1,78=8,9 7 i=1 f ix i = 86, 82 Γίνεται ο προσδιορισμός των κεντρικών τιμών της κάθε κλάσης ως: x i = (1, 65+1, 67)/2 = 1, 66, (1, 67+1, 69)/2 = 1, 68,...
Παράδειγμα: Τιμές αμόλυβδης βενζίνης για τους 51 νομούς της χώρας (συν.) Μέσος, Διάμεσος, Τεταρτημόρια Ετσι, έχουμε τα μέτρα: x = 1 N 7 i=1 f i x i = 1 (7 1, 66+16 1, 68+13 1, 70+5 1, 72+4 1, 74 51 + 1 1, 76+5 1, 78) = 86, 82 51 = 1, 7023. Q 1 = l i + δ i [ N f i 4 F 0, 02 i 1] = 1, 67+ 16 [51 7] = 1, 6771, 4 Q 2 = l i + δ i [ N f i 2 F 0, 02 i 1] = 1, 69+ 13 [51 23] = 1, 6938, 2 Q 3 = l i + δ i [ 3 N 0, 02 F i 1 ] = 1, 71+ [3 51 36] = 1, 719, f i 4 5 4 m = 1, 68 βεαμερ-τυ-λογ
f βεαμερ-τυ-λογ Ραβδόγραμμα: Τιμές αμόλυβδης βενζίνης για τους 51 νομούς της χώρας 13 0 2 4 6 8 10 12 0 7 5 4 1 5 1.60 1.65 1.70 1.75 1.80 x
Γενικές παρατηρήσεις πάνω στα μέτρα θέσης Ερωτήματα και Παρατηρήσεις Πιστεύτε ότι τα μέτρα θέσης αντιπροσωπεύουν τα δεδομένα μας; Τα βασικά μέτρα θέσης: μέσος, τεταρτημόρια, επικρατούσα τιμή δεν αποτελούν υποκατάστατα του ενός με τα άλλα καθώς αντιπροσωπεύουν διαφορετικά χαρακτηριστικά των δεδομένων. Η υποκατάσταση τους ισχύει μόνο όταν υπάρχει συμμετρία(όταν μέσος, διάμεσος, επικρατούσα τιμή ταυτίζονται). Η εκτίμηση του μέσου είναι πιο δύσκολη αλγεβρικά από ότι είναι αυτή της διαμέσου ή της επικρατούσας τιμής. Για την καλύτερη ερμηνεία των δεδομένων απαιτείται η χρήση μέτρων διασποράς.