Περιγραφική Στατιστική
Παράδειγμα Γίνεται μια μελέτη για τους τραυματισμούς στο μάτι (σοβαροί ή όχι τόσο σοβαροί) κατά τη διάρκεια αγώνων τέννις, squash, badminton και ρακέτας. Σοβαρός Τραυματισμός Επιπόλαιος Τραυματισμός Ηλικία Άντρας Γυναίκα Άντρας Γυναίκα < 30 7 4 5 30-50 9 0 0 27 > 50 4 0 4 Σύνολο 20 8 33
Παράδειγμα 2 Πραγματοποιείται μια μελέτη για την επίδραση του αλκοόλ στα επίπεδα χοληστερόλης. Χ μετράει το ποσό του αλκοόλ το οποίο μετριέται ανά εβδομάδα και ανά άτομο. i Όρια f i F i F i /n 0-2.5 20 20 0.28 2 2.5-5.0 372 573 0.62 3 5.0-7.5 260 833 0.902 4 7.5-0 80 93 0.989 5 0 0 923.000
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ. Κυκλικά Διαγράμματα (Pies) 2. Ραβδογράμματα 3. Ιστογράμματα f i f i /n A 9 0.543 B 6 0.457 A B
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ. Κυκλικά Διαγράμματα (Pies) 2. Ραβδογράμματα 3. Ιστογράμματα f i f i /n A 9 0.543 B 6 0.457 0.560 0.540 0.520 0.500 0.480 0.460 0.440 0.420 0.400 A B
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ. Κυκλικά Διαγράμματα (Pies) 2. Ραβδογράμματα 3. Ιστογράμματα Τάξεις f i f i /n% 0-9 5 7.7% 0-9 6.9% 20-29 20 30.8% 30-39 9 3.8% 40-49 3 20.0% 50-59 7 0.8% 25 20 5 0 5 0 0 -- 9 0 -- 9 20 -- 29 30 -- 39 40 -- 49 50 -- 59
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ. Κυκλικά Διαγράμματα (Pies) 2. Ραβδογράμματα 3. Ιστογράμματα (Πολύγωνο Συχνοτήτων) Τάξεις f i f i /n% 0-9 5 7.7% 0-9 6.9% 20-29 20 30.8% 30-39 9 3.8% 40-49 3 20.0% 50-59 7 0.8% 25 20 5 0 5 0 0 -- 9 0 -- 9 20 -- 29 30 -- 39 40 -- 49 50 -- 59
ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ. Κυκλικά Διαγράμματα (Pies) 2. Ραβδογράμματα 3. Ιστογράμματα (Κατανομή) Τάξεις f i f i /n% 0-9 5 7.7% 0-9 6.9% 20-29 20 30.8% 30-39 9 3.8% 40-49 3 20.0% 50-59 7 0.8% 25 20 5 0 5 0 0 -- 9 0 -- 9 20 -- 29 30 -- 39 40 -- 49 50 -- 59
Σχέση Μέσου - Διαμέσου - Κορυφής 0.4 0.3 0.2 0. Αν η κατανομή είναι συμμετρική τότε αυτά συμπίπτουν -2-2 0.2 0. 0.08 0.06 0.04 0.02 x Αν η κατανομή x είναι θετικά Ασύμμετρη (Μ <m < ) x 2 4 6 8 0 2 4 0.8 0.6 0.4 0.2 Αν η κατανομή είναι αρνητικά Ασύμμετρη (Μ > m > ) x 0.2 0.4 0.6 0.8.2
Ποσοστημόρια (Percentiles) Ορισμός Είναι εκείνη η τιμή των διατεταγμένων δεδομένων, όπου τουλάχιστον το 00 p% αυτών των δεδομένων είναι κάτω από αυτήν την τιμή και το 00 (-p)% είναι τουλάχιστον πάνω από αυτήν την τιμή.
Ποσοστημόρια (Percentiles) Ειδικές Περιπτώσεις. Πρώτο τεταρτημόριο (quartile) Q αφήνει δεξιά το 75% των παρατηρήσεων 2. Τρίτο τεταρτημόριο Q 3 αφήνει δεξιά το 25% των παρατηρήσεων 3. Διάμεσος (Q 2 ) 4. Δεκατημόρια (D k ) k(n + 0 ) n + 4 3( n + 4 ) 5. Εκατοστημόρια (P k ) k(n + 00 )
Ποσοστημόρια (Percentiles) Παράδειγμα 4, 6, 7, 5, 8, 20, 25 n= 7, 7 + = 2 Q = 6 4 3(7 + ) 4 = 6 Q 3 = 20
Ποσοστημόρια (Percentiles) Παράδειγμα 2 4, 6, 7, 5, 8, 20, 23, 25 n= 8, 8 + 4 = 2.25 Q = 6.25 (Πάω στη 2 η παρατήρηση και παίρνω το 25% της απόστασής της από την 3 η.) 3(8 + ) 4 = 6.75 Q 3 = 22.25 (Πάω στη 6 η παρατήρηση και παίρνω το 75% της απόστασής της από την 7 η.)
Ομαδοποιημένα Δεδομένα Το q ποσοστημόριο εντοπίζεται στην κλάση που περιέχει την qn παρατήρηση, δηλαδή εάν, F i- < q n F i τότε το ποσοστημόριο βρίσκεται στην i-τάξη και δίνεται από τον τύπο: P h i = ai + i fi ( qn F )
Παράδειγμα Τάξεις f i f i /h i F i 0-5 3 0,6 3 5-0 7,4 0 0-20 6,6 26 20-35 8,2 44 35-60 2 0,8 56 60-00 4 0, 60 Να υπολογιστούν η διάμεσος, Q 3, d 7, P 5. 2 Q 2 = m, q =, q n = 60 = 30 2 5 8 Q 2 = 20 + (30-26) = 23.33 P h i = ai + i fi ( qn F )
Παράδειγμα Τάξεις f i f i /h i F i 0-5 3 0,6 3 5-0 7,4 0 0-20 6,6 26 20-35 8,2 44 35-60 2 0,8 56 60-00 4 0, 60 Να υπολογιστούν η διάμεσος, Q 3, d 7, P 5. 3 4 3 4 q =, q n = 60 = 45 25 2 Q 3 = 35 + (45-44) = 37.08 P h i = ai + i fi ( qn F )
Παράδειγμα Τάξεις f i f i /h i F i 0-5 3 0,6 3 5-0 7,4 0 0-20 6,6 26 20-35 8,2 44 35-60 2 0,8 56 60-00 4 0, 60 Να υπολογιστούν η διάμεσος, Q 3, d 7, P 5. 7 0 7 0 q =, q n = 60 = 42 5 8 d 7 = 20 + (42-26) = 33.3 P h i = ai + i fi ( qn F )
Παράδειγμα Τάξεις f i f i /h i F i 0-5 3 0,6 3 5-0 7,4 0 0-20 6,6 26 20-35 8,2 44 35-60 2 0,8 56 60-00 4 0, 60 Να υπολογιστούν η διάμεσος, Q 3, d 7, P 5. 5 00 5 00 q =, q n = 60 = 3 5 3 P 5 = 0 + (3-0) = 5 P h i = ai + i fi ( qn F )
0.2 Ασυμμετρία (skewness) Πολλές φορές μας ενδιαφέρει να ελέγξουμε την ασυμμετρία της κατανομής n 3 ' ( xi x) m3 n i= g = = 3 ' 2 2 ( ) 3 n m2 2 ( xi x) n i= 0. 0.08 0.06 0.04 Αν g > 0 θετικήασυμμετρία 0.02 2 4 6 8 0 2 4 0.8 0.6 0.4 0.2 x Αν g <0 αρνητική ασυμμετρία 0.2 0.4 0.6 0.8.2
Κύρτωση (Kurtosis) 0.4 g n = n n 4 ' ( xi x) m4 i= 2 = 3 ' 2 n 2 ( m2 ) 2 ( xi x) i= 3 0.3 0.2 0. -4-2 2 4 0.4 0.3 0.2 0. Αν g 2» οι ουρές της κατανομής είναι πλατιές. (outliers) Αν g 2 «οι ουρές της κατανομής είναι κοντές. -4-2 2 4
Box Plots -00 36 42-5 2 35 38 5 4 38 53-6 34-23 -3 8 29-33 -2 2 9-5 95 5 0-6 92 3 30-7 -60 25 27-9 33 23 00-4 -33 Statistics var Mean 2.08 Median 9.50 Variance,428.328 Skewness -0.080 Kurtosis.898 Minimum -00 Maximum 00 Percentiles 25-8.00 50 9.50 75 33.75
var Box Plots -00 36 42-5 2 35 38 5 4 38 53-6 34-23 -3 8 29-33 -2 2 9-5 95 5 0-6 92 3 30-7 -60 25 27-9 33 23 00-4 -33 00 50 0-50 A A -00 A