ο Φυλλάδιο Ασκήσεων Εφαρμογές
2 ο Φυλλάδιο Ασκήσεων Εφαρμογή 1 ΣΥΓΚΡΙΣΗ ΤΗΣ ΗΛΙΚΙΑΣ ΤΩΝ ΕΡΓΑΖΟΜΕΝΩΝ ΣΕ ΔΥΟ ΕΠΙΧΕΙΡΗΣΕΙΣ Παρακάτω βλέπουμε τα ιστογράμματα και τα πολύγωνα των σχετικών (%) και σχετικών αθροιστικών συχνοτήτων (%) καθώς και τις εκτιμήσεις των αριθμητικών μέτρων, όπως αυτές προκύπτουν από τα ομαδοποιημένα δεδομένα. Χρησιμοποιώντας αυτά τα στοιχεία, περιγράψτε τις κατανομές της ηλικίας των εργατών ξεχωριστά για κάθε επιχείρηση. ΕΠΙΧΕΙΡΗΣΗ Α 40 5 0 29 6 100,00 80,00 72,00 91,00 95,00 98,00 99,40 100,00 25 20 15 19 60,00 40,00 6,00 10 5 0 6 4 1 1,4 0,6 15-20 20-25 25-0 0-5 5-40 40-45 45-50 50-60 60-70 Ηλικία σε έτη 20,00 0,00-20,00 7,00 1,00 15-20 20-25 25-0 0-5 5-40 40-45 45-50 50-60 60-70 Ηλικία σε έτη Ιστόγραμμα Σχετικών ( % ) Συχνοτήτων Αριθμητικός Μέσος X = 2.61 Τι παρατηρούμε: Διάμεσος Μ d = Q 2 = 1.94 Επικρατούσα Τιμή M o = 1.46 Διασπορά s 2 = 44.50 Τυπική Απόκλιση s = 6.67 Συντελεστής Μεταβλητότητας Συντελεστής Ασυμμετρίας Τυπικό σφάλμα Συντελεστής Κύρτωσης Τυπικό σφάλμα cv % = 20 % γ = 1. s. e. (γ) = 0.42 α =.78 s. e. (α) = 0.5 Ελάχιστη τιμή min = 17 Μέγιστη τιμή max = 67 1 ο τεταρτημόριο Q 1 = 25.42 ο τεταρτημόριο Q = 6.28 Πίνακας Αριθμητικών Περιγραφικών Μέτρων Υπολογισμοί από Ομαδοποιημένα Δεδομένα Ιστόγραμμα Σχετικών Αθροιστικών ( % ) Συχνοτήτων 1. Έχουμε ένα μονοκόρυφο ιστόγραμμα, το οποίο φαίνεται να έχει θετική ασυμμετρία. 2. Τη σχετική θέση των μέτρων κεντρικής τάσης Εδώ M o = 1.46 <M d = 1.94 <X = 2.61. Για άλλη μια φορά έχουμε ένδειξη θετικής ασυμμετρίας, χωρίς όμως o αριθμητικός μέσος να είναι ιδιαίτερα απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή.. Ο συντελεστής ασυμμετρίας είναι γ = 1. > 0 και 2 s. e. (γ) = 2 0.42 = 0.84. Καθώς γ > 2 s. e. (γ) και γ > 0 η κατανομή εμφανίζει θετική ασυμμετρία. 4. Ο συντελεστής κύρτωσης είναι α =.78 > 0 και 2 s. e. (α) = 2 0.5 = 0.70 Καθώς, α > 2 s. e. (α) και α > 0 η κατανομή είναι λεπτόκυρτη. 5. R = 67 17 = 50 και 6s = 6 6.67 = 40.02. Επομένως, R 6s και δεν προκύπτει κανονικότητα. 6. IQR = 6.28 25.42 = 10.86 και s 6.67 8.89. 4 4 Επομένως, IQR 4 s και δεν προκύπτει κανονικότητα. 7. Ο συντελεστής μεταβλητότητας είναι 20% > 10% και είναι μεγάλος. 8. Στο ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, παρατηρούμε την «ταχύτητα» με την οποία συγκεντρώνονται οι τιμές της μεταβλητής. Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής Διαπιστώσεις για την ηλικία των εργαζομένων στην επιχείρηση Α Κανονικότητα Η κατανομή των ηλικιών των εργαζομένων στην επιχείρηση Α, δεν φαίνεται να ακολουθεί την Κανονική κατανομή, καθώς: Έχει θετική ασυμμετρία, αφού se Είναι λεπτόκυρτη, αφού και se R 50 6s 40.02 και 4 IQR 10.86 s 8.89 1. 2.. 0.84 και 1. 0.78 2.. 0.70 και.78 0 Ασυμμετρία και Κύρτωση Η θετική ασυμμετρία που εμφανίζει η κατανομή, οφείλεται στην παρουσία μεγάλων τιμών της μεταβλητής. Καθώς όμως αυτές έχουν χαμηλές συχνότητες (όπως διακρίνουμε από το διάγραμμα σχετικών συχνοτήτων), δεν φαίνεται να επηρεάζουν σημαντικά τη μέση τιμή. Η κατανομή είναι λεπτόκυρτη, με ιδιαίτερα αυξημένο τον συντελεστή κύρτωσης, επομένως η συγκέντρωση των τιμών γύρω από την κορυφή της κατανομής είναι μεγάλη. Μέτρα Κεντρικής Τάσης Η μέση ηλικία των εργαζομένων στην επιχείρηση Α, εκτιμάται σε 2 έτη και 7 μήνες. Οι μισοί από τους εργαζόμενους έχουν ηλικία μικρότερη από, περίπου, 2 έτη. Το μεγαλύτερο ποσοστό των εργαζομένων ( 6%) έχει ηλικία, περίπου, 1.5 έτη. Τεταρτημόρια Το ¼ των εργαζομένων έχουν ηλικία μικρότερη από, περίπου, 25.42 έτη. Το ¼ των εργαζομένων έχουν ηλικία μεγαλύτερη από, περίπου, 6.28 έτη. Το 50% των εργαζομένων έχει ηλικία από 25.42 6.28 έτη, περίπου. Μεταβλητότητα Ο συντελεστής μεταβλητότητας είναι αυξημένος (cv% =20% > 10%) και επομένως, καθώς ο συντελεστής ασυμμετρίας είναι μεγαλύτερος από μηδέν, γνωρίζουμε ότι στην επιχείρηση Α υπάρχουν και εργαζόμενοι με ηλικίες αρκετά μεγαλύτερες από τα 1.94 έτη, που είναι η μέση ηλικία. Αθροιστικές Συχνότητες Από το ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, προκύπτει ότι 72% (δηλαδή περισσότερο από τα 2/) των εργαζομένων έχουν ηλικία κάτω από 5 έτη και μόνον το 28% είναι πάνω από 5. Σημειώσεις Στατιστικής
4 ο Φυλλάδιο Ασκήσεων Δεν θα ήταν επομένως άτοπο, να ισχυριστούμε ότι το εργατικό δυναμικό της επιχείρησης Α είναι νεαρό ως προς την ηλικία. ΕΠΙΧΕΙΡΗΣΗ Β 25,00 20,00 18,00 2,00 20,00 100,00 90,00 80,00 70,00 68,00 80,00 9,00 100,00 15,00 12,00 1,00 60,00 50,00 48,00 10,00 7,00 7,00 40,00 0,00 25,00 5,00 0,00 20-25 25-0 0-5 5-40 40-45 45-55 55-65 Ηλικία σε έτη 20,00 10,00 0,00 7,00 20-25 25-0 0-5 5-40 40-45 45-55 55-65 Ηλικία σε έτη Ιστόγραμμα Σχετικών ( % ) Συχνοτήτων Ιστόγραμμα Αθροιστικών ( % ) Συχνοτήτων Αριθμητικός Μέσος X = 7.0 Τι παρατηρούμε: Διάμεσος M e = 5.5 Επικρατούσα Τιμή M o =.1 Διασπορά s 2 = 98.70 Τυπική Απόκλιση s = 9.9 Συντελεστής Μεταβλητότητας Συντελεστής Ασυμμετρίας Τυπικό σφάλμα Συντελεστής Κύρτωσης Τυπικό σφάλμα cv % = 27 % γ = 0.69 s. e. (γ) = 0.1 α = 0.21 s. e. (α) = 0.7 Ελάχιστη τιμή min = 20 Μέγιστη τιμή max = 65 1 ο τεταρτημόριο Q 1 = 0 ο τεταρτημόριο Q = 4.5 Πίνακας Αριθμητικών Περιγραφικών Μέτρων Υπολογισμοί από Ομαδοποιημένα Δεδομένα 1. Έχουμε ένα μονοκόρυφο ιστόγραμμα, το οποίο φαίνεται να έχει θετική ασυμμετρία. 2. Τη σχετική θέση των μέτρων κεντρικής τάσης Εδώ M o =.10 < M e = 5.5 <X = 7.0. Για άλλη μια φορά έχουμε ένδειξη θετικής ασυμμετρίας, με τον αριθμητικό μέσο να είναι αρκετά απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή.. Ο συντελεστής ασυμμετρίας είναι γ = 0.69 > 0 και 2 s. e. (γ) = 2 0.1 = 0.62. Καθώς, 9. γ > 2 s. e. (γ) και γ > 0 η κατανομή εμφανίζει θετική ασυμμετρία. 4. Ο συντελεστής κύρτωσης είναι α =- 0.21 < 0 και 2 s. e. (α) = 2 0.7 = 0.74 Επομένως, α < 2 s. e. (α) και η κατανομή είναι μεσόκυρτη. 5. R = 65 20 = 45 και 6s = 6 9.9 = 59.58. Επομένως, R 6s και δεν προκύπτει κανονικότητα. 6. IQR = 41.5 0 = 11.5 και s 9.9 1.24. Επομένως, 4 4 IQR 4 s και δεν προκύπτει κανονικότητα. 7. Ο συντελεστής μεταβλητότητας είναι 27% > 10% και είναι μεγάλος. Στο ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, παρατηρούμε την «ταχύτητα» με την οποία συγκεντρώνονται οι τιμές της μεταβλητής. Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 5 Διαπιστώσεις για την ηλικία των εργαζομένων στην επιχείρηση Β Κανονικότητα Η κατανομή των ηλικιών των εργαζομένων στην επιχείρηση Β, δεν φαίνεται να ακολουθεί την Κανονική κατανομή, καθώς: Έχει θετική ασυμμετρία, αφού 0.69 0 R 45 6s 59.58 4 IQR 11.5 s 1.24 και se 0.69 2.. 0.62 Ασυμμετρία και Κύρτωση Η θετική ασυμμετρία που εμφανίζει η κατανομή, οφείλεται στην παρουσία μεγάλων τιμών της μεταβλητής. Καθώς αυτές έχουν υψηλές συχνότητες (όπως διακρίνουμε από το διάγραμμα σχετικών συχνοτήτων), φαίνεται να επηρεάζουν σημαντικά τη μέση τιμή. Επομένως, εξαιτίας της θετικής ασυμμετρίας αλλά και των υψηλών συχνοτήτων στις μεγάλες κλάσεις, ο αριθμητικός μέσος δείχνει να είναι αρκετά απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή, και θεωρείται ακατάλληλος για χρήση ως μέτρο κεντρικής τάσης. Η κατανομή είναι μεσόκυρτη, αφού se 0.21 2.. 0.74 Μέτρα Κεντρικής Τάσης Η μέση ηλικία των εργαζομένων στην επιχείρηση Β, εκτιμάται σε 7 έτη και 4 μήνες. Οι μισοί από τους εργαζόμενους, εκτιμάται ότι έχουν ηλικία μικρότερη από 5.5 έτη. Το μεγαλύτερο ποσοστό των εργαζομένων ( 2%), εκτιμάται ότι έχει ηλικία.1 έτη. Τεταρτημόρια Το ¼ των εργαζομένων, εκτιμάται ότι έχουν ηλικία μικρότερη από 0 έτη. Το ¼ των εργαζομένων, εκτιμάται ότι έχουν ηλικία μεγαλύτερη από 4.5 έτη Το 50% των εργαζομένων, εκτιμάται ότι έχει ηλικία από 0 4.5 έτη. Μεταβλητότητα Ο συντελεστής μεταβλητότητας είναι αυξημένος (cv% = 27% >> 10%), και καθώς ο συντελεστής ασυμμετρίας είναι μεγαλύτερος από μηδέν, γνωρίζουμε ότι στην επιχείρηση Β υπάρχουν εργαζόμενοι που έχουν ηλικίες αρκετά μεγαλύτερες από 7. έτη, που είναι η μέση ηλικία. Αθροιστικές Συχνότητες Από το ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, προκύπτει ότι 48% των εργαζομένων στην επιχείρηση Β έχουν ηλικία κάτω από 5 έτη και 52% (δηλαδή περισσότεροι από τους μισούς) έχουν ηλικία πάνω από 5 έτη. Σημειώσεις Στατιστικής
6 ο Φυλλάδιο Ασκήσεων Εφαρμογή 2 ΔΕΙΚΤΗΣ ΜΑΖΑΣ ΣΩΜΑΤΟΣ Υπολογίσαμε το δείκτη μάζας σώματος, από ένα δείγμα 120 ενήλικων ανδρών. Παρακάτω βλέπουμε τα ιστογράμματα και τα πολύγωνα των σχετικών, και σχετικών αθροιστικών συχνοτήτων (%) καθώς και τις εκτιμήσεις των αριθμητικών μέτρων. Χρησιμοποιώντας αυτά τα στοιχεία, θα περιγράψουμε την κατανομή για τον δείκτη μάζας σώματος των ενηλίκων ανδρών. 25,00 20,00 21,67 22,50 25,00 20,00 21,67 22,50 15,00 10,00 5,00 0,00 2,50 17,5-20,0 1, 20,0-22,5 22,5-25,0 25,0-27,5 15,00 27,5-0,0 10,8 0,0-2,5 5,8 2,5-5,0 5,00 5,0-7,5, 7,5-40,0 Δείκτης Μάζας Σώματος (Kgr/m 2 ) 15,00 10,00 5,00 0,00 17,5-20,0 1, 2,50 20,0-22,5 22,5-25,0 25,0-27,5 27,5-0,0 15,00 10,8 5,8 5,00, 0,0-2,5-5,0-7,5-2,5 5,0 7,5 40,0 Δείκτης Μάζας Σώματος Ιστόγραμμα και Πολύγωνο Σχετικών Συχνοτήτων ( % ) 100,00 80,00 60,00 40,00 20,00 0,00 2,50 17,5-20,0 15,8 20,0-22,5 7,50 22,5-25,0 60,00 25,0-27,5 75,00 27,5-0,0 85,8 0,0-2,5 91,67 96,67 100,00 2,5-5,0 5,0-7,5 7,5-40,0 100 80 60 40 20 0 91,67 96,67 100,00 85,8 75,00 60,00 7,50 15,8 2,50 17,5 20 22,5 25 27,5 0 2,5 5 7,5 40 Ιστόγραμμα και Πολύγωνο Σχετικών Αθροιστικών Συχνοτήτων ( % ) Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 7 ΑΠΟΤΕΛΕΣΜΑΤΑ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ SPSS Ιστόγραμμα Συχνοτήτων και Έλεγχος Κανονικότητας Ιστόγραμμα Συχνοτήτων και Καμπύλη την Κανονικής Κατανομής Παρατηρούμε μια σχετικά ικανοποιητική προσαρμογή στην Κανονική Κατανομή. Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. BMI 0,082 120 0,055 0,96 120 0,002 a. Lilliefors Significance Correction 0 1 : H κατανομή δεν διαφέρει από την Κανονική : Η κατανομή είναι διαφορετική της Κανονικής Επειδή το δείγμα μας είναι μεγαλύτερο των 50 παρατηρήσεων, η Κανονικότητα ελέγχεται από το στατιστικό Kolmogorov Smirnov. Επειδή Sig. = 0.055 > 0.05, η υπόθεση 0 της Κανονικότητας δεν μπορεί να απορριφθεί, και αποδεχόμαστε ότι τα δεδομένα μας προέρχονται από Κανονικό πληθυσμό. Σημειώσεις Στατιστικής
8 ο Φυλλάδιο Ασκήσεων Πίνακας Στατιστικών BMI N Statistics Valid 120 Missing 0 Mean Αριθμητικός Μέσος, X 27,10 Median Διάμεσος, M e 26,56 Mode Επικρατούσα Τιμή, M o 26,27 Std. Deviation Τυπική Απόκλιση, s 4,61 Variance Διασπορά, 2 s 21,21 Coefficient of variation Συντελεστής μεταβλητότητας, cv % 17,01% Skewness Συντελεστής ασυμμετρίας, 0,61 Std. Error of Skewness τυπικό σφάλμα του συντελεστή ασυμμετρίας, se.. 0,22 Kurtosis Συντελεστής κύρτωσης, -0,15 Std. Error of Kurtosis τυπικό σφάλμα του συντελεστή se.. κύρτωσης, 0,44 Range Εύρος, R 20,50 Minimum Ελάχιστη Τιμή, min 18,0 Maximum Μέγιστη Τιμή, max 8,80 Percentiles (εκατοστημόρια) 25 1 ο τεταρτημόριο - Q 1 2,6 50 2 ο τεταρτημόριο - Q 2 26,56 75 ο τεταρτημόριο - Q 29,96 Interquartile Range Ενδοτεταρτημοριακό εύρος, IQR 6, Τι παρατηρούμε: 1. Έχουμε ένα μονοκόρυφο ιστόγραμμα, το οποίο φαίνεται να έχει θετική ασυμμετρία. 2. Τη σχετική θέση των μέτρων κεντρικής τάσης Εδώ M o = 26.27 < M e = 26.56 <X = 27.10 Για άλλη μια φορά έχουμε ένδειξη θετικής ασυμμετρίας, χωρίς όμως ο αριθμητικός μέσος να είναι ιδιαίτερα απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή.. Ο συντελεστής ασυμμετρίας είναι γ = 0.61 > 0 και 2 s. e. (γ) = 2 0.22 = 0.44. Καθώς, γ > 2 s. e. (γ) και γ > 0 η κατανομή εμφανίζει θετική ασυμμετρία. 4. Ο συντελεστής κύρτωσης είναι α =- 0.15 < 0 και 2 s. e. (α) = 2 0.44 = 0.88 Καθώς, α = 0.15 < 2 s. e. (α) και η κατανομή είναι μεσόκυρτη. Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 9 5. R = 28.80 18.0 = 20.50 και 6s = 6 4.61 = 27.66. Επομένως, R 6s και δεν προκύπτει κανονικότητα. 6. IQR = 29.96 2.6 = 6. και s 4.61 4.15. Επομένως, IQR 4 s και η 4 4 κατανομή δεν μπορεί προκύπτει κανονικότητα. 7. Ο συντελεστής μεταβλητότητας είναι 17.01% > 10% και σχετικά αυξημένος. 8. Στο ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, παρατηρούμε την «ταχύτητα» με την οποία συγκεντρώνονται οι τιμές της μεταβλητής. Διαπιστώσεις για την Κατανομή του Δείκτη Μάζας Σώματος Κανονικότητα Η Κατανομή του Δείκτη Μάζας Σώματος, των ενηλίκων ανδρών, μπορεί να θεωρηθεί Κανονική, καθώς: Από τον Έλεγχο Kolmogorov Smirnov, έχουμε sig. 0.055 0.05 και, συνεπώς, η υπόθεση της Κανονικότητας δεν μπορεί να απορριφθεί. Ασυμμετρία και Κύρτωση Η κατανομή εμφανίζει θετική ασυμμετρία, αφού 0 και se 0.61 2.. 0.44. Η θετική ασυμμετρία οφείλεται στην παρουσία κάποιων μεγάλων τιμών της μεταβλητής. Αποτέλεσμα είναι ο αριθμητικός μέσος να είναι ελαφρώς απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή. Η κατανομή είναι μεσόκυρτη, αφού se 0.15 2.. 0.88. Μέτρα Κεντρικής Τάσης Ο μέσος δείκτης μάζας σώματος των ενηλίκων ανδρών εκτιμάται σε 27,10 Kgr/m 2 Οι μισοί από τους ενηλίκους άνδρες, εκτιμάται ότι έχουν δείκτη μάζας σώματος μεγαλύτερο από 26,55 Kgr/m 2. Το μεγαλύτερο ποσοστό των ενηλίκων ανδρών ( 22,5%), εκτιμάται ότι έχουν δείκτη μάζας σώματος 26,27 Kgr/m 2. Τεταρτημόρια Το 25% των ενηλίκων ανδρών, έχουν δείκτη μάζας σώματος μικρότερο από, περίπου, 2,625 Kgr/m 2. Το 25% των ενηλίκων, έχουν δείκτη μάζας σώματος μεγαλύτερο από, περίπου, 29,95 Kgr/m 2. Το 50% των ενηλίκων ανδρών έχουν δείκτη μάζας σώματος από 2,625 Kgr/m 2 έως 29,95 Kgr/m 2, περίπου. Σημειώσεις Στατιστικής
10 ο Φυλλάδιο Ασκήσεων Μεταβλητότητα Ο συντελεστής μεταβλητότητας είναι σχετικά αυξημένος (cv% = 17.01 % > 10%. Αθροιστικές Συχνότητες Το 7,5% των ενήλικων ανδρών έχουν δείκτη μάζας σώματος μικρότερο του 25, ενώ το υπόλοιπο 100 7,5 = 62,5% μεγαλύτερο από 25. Επομένως, περίπου 62,5 % των ενηλίκων ανδρών έχουν μεγαλύτερο από το φυσιολογικό βάρος. Επίσης, παρατηρούμε ότι 75% έχουν δείκτη μάζας σώματος μικρότερο του 0 και, συνεπώς, 25% έχουνε δείκτη μάζας σώματος μεγαλύτερο του 0. Επομένως, το 25% των ενήλικων ανδρών είναι υπέρβαροι. Μαρίνα Σύρπη
Σχετική Αθροιστική Συχνότητα (%) Σχετική Συχνότητα (%) Εφαρμογές της Περιγραφικής Στατιστικής 11 Εφαρμογή ΠΟΣΟΣΤΙΑΙΑ ΚΑΤΑΝΟΜΗ ΤΩΝ ΝΟΙΟΚΥΡΙΩΝ ΑΝΑΛΟΓΑ ΜΕ ΤΗ ΔΥΝΑΤΟΤΗΤΑ ΠΡΟΣΒΑΣΗ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΣΤΗΝ ΠΕΡΙΦΕΡΕΙΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Ιστόγραμμα και Πολύγωνο Σχετικών Συχνοτήτων Παρακάτω βλέπουμε την κατανομή του ποσοστού των νοικοκυριών με πρόσβαση στο διαδίκτυο, για τους 8 Δήμους της Περιφέρειας Κεντρικής Μακεδονίας (Π.Κ.Μ.), 0,00 25,00 2,68 26,2 20,00 18,42 18,42 15,00 10,00 10,5 5,00 2,6 0,00 0-10 10-20 20-0 0-40 40-50 50-60 60-70 ΠΗΓΗ: ΕΛΣΤΑΤ 2011 Ποσοστό νοικοκυριών με πρόσβαση στο διαδίκτυο (%) Ιστόγραμμα Σχετικών Συχνοτήτων ( % ) 100 97,7 100,00 90 80 70 60 68,42 78,95 50 40 42,11 0 20 10 0 0 18,42 0-10 10-20 20-0 0-40 40-50 50-60 60-70 Ποσοστό νοικοκυριών με πρόσβαση στο διαδίκτυο (%) ΠΗΓΗ: ΕΛΣΤΑΤ 2011 Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων ( % ) Σημειώσεις Στατιστικής
12 ο Φυλλάδιο Ασκήσεων ΜΕΤΑΒΛΗΤΗ: Ποσοστό νοικοκυριών με πρόσβαση στο διαδίκτυο (%) ΠΛΗΘΥΣΜΟΣ: Οι Δήμοι της Περιφέρειας Κεντρικής Μακεδονίας ΑΠΟΤΕΛΕΣΜΑΤΑ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ SPSS Ιστόγραμμα Συχνοτήτων και Έλεγχος Κανονικότητας Ιστόγραμμα Συχνοτήτων και Καμπύλη την Κανονικής Κατανομής Παρατηρούμε μια σχετικά ικανοποιητική προσαρμογή στην Κανονική Κατανομή. Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. Πρόσβαση_ΠΚΜ 0,090 8 0,200 * 0,964 8 0,26 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. 0 1 : H κατανομή δεν διαφέρει από την Κανονική : Η κατανομή είναι διαφορετική της Κανονικής Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 1 Επειδή το δείγμα μας είναι μικρότερο των 50 παρατηρήσεων, η Κανονικότητα ελέγχεται από το στατιστικό Shapiro - Wilk. Επειδή Sig. = 0,26 > 0,05, η υπόθεση 0 της Κανονικότητας δεν μπορεί να απορριφθεί, και αποδεχόμαστε ότι τα δεδομένα μας προέρχονται από Κανονικό πληθυσμό. Πίνακας Στατιστικών Πρόσβαση_ΠΚΜ Statistics N Valid 8 Missing 0 Mean Αριθμητικός Μέσος, X 4,75 Median Διάμεσος, M e 2,40 Mode Επικρατούσα Τιμή, M o 2, Std. Deviation Τυπική Απόκλιση, s 14,2 Variance Διασπορά, 2 s 204,98 Coefficient of variation Συντελεστής μεταβλητότητας, cv % 41,19% Skewness Συντελεστής ασυμμετρίας, 0,6 Std. Error of Skewness τυπικό σφάλμα του συντελεστή ασυμμετρίας, se.. 0,8 Kurtosis Συντελεστής κύρτωσης, -0,61 Std. Error of Kurtosis τυπικό σφάλμα του συντελεστή se.. κύρτωσης, 0,75 Range Εύρος, R 44,10 Minimum Ελάχιστη Τιμή, min 12,90 Maximum Μέγιστη Τιμή, max 67,00 Percentiles (εκατοστημόρια) 25 1 ο τεταρτημόριο - Q 1 24,10 50 2 ο τεταρτημόριο - Q 2 2,40 75 ο τεταρτημόριο - Q 44,08 Interquartile Range Ενδοτεταρτημοριακό εύρος, IQR 19,98 Τι παρατηρούμε: 1. Έχουμε ένα μονοκόρυφο ιστόγραμμα, στο οποίο δεν διακρίνεται το είδος της ασυμμετρίας. 2. Τη σχετική θέση των μέτρων κεντρικής τάσης Σημειώσεις Στατιστικής
14 ο Φυλλάδιο Ασκήσεων Εδώ M o = 2. < M e = 2.40 <X = 4.75 Έχουμε ένδειξη θετικής ασυμμετρίας, με τον αριθμητικό μέσο να είναι λίγο απομακρυσμένος από τη διάμεσο και την επικρατούσα τιμή.. Ο συντελεστής ασυμμετρίας είναι γ = 0.6 > 0 και 2 s. e. (γ) = 2 0.8 = 0.76. Επομένως, γ < 2 s. e. (γ), και η κατανομή δεν εμφανίζει ασυμμετρία. 4. Ο συντελεστής κύρτωσης είναι α = - 0.61 < 0 και 2 s. e. (α) = 2 0.75 = 1.5 Επομένως, α < 2 s. e. (α) και η κατανομή είναι μεσόκυρτη. 5. R = 67 12.90 = 44.10 και 6s = 6 14.2 = 85.92. Επομένως, R 6s και δεν προκύπτει κανονικότητα. 6. IQR = 44.08 24.10 = 19.98 και s 14.2 19.09. 4 4 Επομένως, IQR 4 s και η κατανομή εμφανίζει κανονικότητα. 7. Ο συντελεστής μεταβλητότητας είναι 41.19% > 10% και είναι πολύ αυξημένος. 8. Στο ιστόγραμμα των σχετικών αθροιστικών συχνοτήτων, παρατηρούμε την «ταχύτητα» με την οποία συγκεντρώνονται οι τιμές της μεταβλητής. Διαπιστώσεις για την Κατανομή του ποσοστού των νοικοκυριών με πρόσβαση στο Διαδίκτυο, στους Δήμους της Περιφέρειας Κεντρικής Μακεδονίας Κανονικότητα Η κατανομή του ποσοστού των νοικοκυριών με πρόσβαση στο διαδίκτυο, για τους Δήμους της ΠΚΜ φαίνεται να ακολουθεί την Κανονική Κατανομή, καθώς: Από τον Έλεγχο Shapiro Wilk, έχουμε sig. 0.26 0.05 και, συνεπώς, η υπόθεση της Κανονικότητας δεν μπορεί να απορριφθεί. 4 IQR 19.98 s 19.09 Ασυμμετρία και Κύρτωση Η κατανομή μπορεί να θεωρηθεί συμμετρική, καθώς 0.6 2 se.. 0.76. Η κατανομή είναι μεσόκυρτη, καθώς se 0.61 2.. 1.5. Επομένως, έχουμε μία ακόμα ένδειξη Κανονικότητας της κατανομής. Μέτρα Κεντρικής Τάσης «Στους Δήμους της Π.Κ.Μ., το μέσο ποσοστό των νοικοκυριών με πρόσβαση στο διαδίκτυο, εκτιμάται σε 4,75%.» «Στους μισούς από τους Δήμους της Π.Κ.Μ. το ποσοστό των νοικοκυριών με πρόσβαση στο διαδίκτυο δεν υπερβαίνει το 2,40%, περίπου». «Στους περισσότερους από τους Δήμους της ΠΚΜ ( 26,2% ), το ποσοστό των νοικοκυριών με πρόσβαση στο διαδίκτυο είναι περίπου 2, %». Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 15 Τεταρτημόρια «Στο ¼ των Δήμων της Π.Κ.Μ. το ποσοστό των νοικοκυριών με πρόσβαση στο διαδίκτυο δεν υπερβαίνει το 24,1%, περίπου». «Στα ¾ των Δήμων της Π.Κ.Μ. το ποσοστό των νοικοκυριών με πρόσβαση στο διαδίκτυο δεν υπερβαίνει το 44,075 %, περίπου». «Στους μισούς από τους Δήμους της Π.Κ.Μ. τα ποσοστά των νοικοκυριών με πρόσβαση στο διαδίκτυο είναι από από 24,1% έως 44,075%» Μεταβλητότητα Ο συντελεστής μεταβλητότητας είναι σχετικά αυξημένος (cv% = 41,19 % > >10% και είναι ιδιαίτερα αυξημένος. Καθώς η κατανομή είναι συμμετρική, γνωρίζουμε ότι υπάρχουν Δήμοι στους οποίους το ποσοστό των νοικοκυριών με πρόσβαση στο Διαδίκτυο είναι πολύ μικρότερο του μέσου ποσοστού αλλά και Δήμοι στους οποίους το αντίστοιχο ποσοστό είναι πολύ μεγαλύτερο του μέσου. Σημειώσεις Στατιστικής
16 ο Φυλλάδιο Ασκήσεων Εφαρμογή 4 ΠΟΣΟΣΤΙΑΙΑ ΚΑΤΑΝΟΜΗ ΤΩΝ ΝΟΙΟΚΥΡΙΩΝ ΑΝΑΛΟΓΑ ΜΕ ΤΗ ΔΥΝΑΤΟΤΗΤΑ ΠΡΟΣΒΑΣΗ ΣΤΟ ΔΙΑΔΙΚΤΥΟ ΣΤΗΝ ΠΕΡΙΦΕΡΕΙΑ ΑΤΤΙΚΗΣ Ιστόγραμμα και Πολύγωνο Σχετικών Συχνοτήτων Παρακάτω βλέπουμε την κατανομή του ποσοστού των νοικοκυριών με πρόσβαση στο διαδίκτυο, για τους 66 Δήμους της Περιφέρειας Αττικής (Π.Α.) 5,00 1,82 0,00 25,00 20,00 21,21 19,70 15,00 15,15 10,00 7,58 5,00 1,52,0 0,00 0-10 10-20 20-0 0-40 40-50 50-60 60-70 70-80 ΠΗΓΗ ΕΛΣΤΑΤ, 2011 Ιστόγραμμα Σχετικών Συχνοτήτων ( % ) 100 90 92,42 100,00 80 70 72,7 60 50 40 40,91 0 20 10 0 19,70 0 1,52 4,55 0-10 10-20 20-0 0-40 40-50 50-60 60-70 70-80 ΠΗΓΗ: ΕΛΣΤΑΤ 2011 Ιστόγραμμα Σχετικών Αθροιστικών Συχνοτήτων ( % ) Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 17 ΜΕΤΑΒΛΗΤΗ: ΠΛΗΘΥΣΜΟΣ: ΑΠΟΤΕΛΕΣΜΑΤΑ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ SPSS Ιστόγραμμα Συχνοτήτων και Έλεγχος Κανονικότητας Ιστόγραμμα Συχνοτήτων και Καμπύλη την Κανονικής Κατανομής Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. ΠΡΟΣΒΑΣΗ_ΠΑ,118 66,02,972 66,140 a. Lilliefors Significance Correction Σημειώσεις Στατιστικής
18 ο Φυλλάδιο Ασκήσεων Πίνακας Στατιστικών ΠΡΟΣΒΑΣΗ_ΠΑ Statistics N Valid 66 Missing 0 Mean Αριθμητικός Μέσος, X 52,09 Median Διάμεσος, M e 52,75 Mode Επικρατούσα Τιμή, M o 55,22 Std. Deviation Τυπική Απόκλιση, s 12,55 Variance Διασπορά, 2 s 157,55 Coefficient of variation Συντελεστής μεταβλητότητας, cv % 24,1% Skewness Συντελεστής ασυμμετρίας, -0,49 Std. Error of Skewness τυπικό σφάλμα του συντελεστή ασυμμετρίας, se.. 0,295 Kurtosis Συντελεστής κύρτωσης, 0,057 Std. Error of Kurtosis τυπικό σφάλμα του συντελεστή se.. κύρτωσης, 0,582 Range Εύρος, R 57,50 Minimum Ελάχιστη Τιμή, min 16,80 Maximum Μέγιστη Τιμή, max 74,0 Percentiles (εκατοστημόρια) 25 1 ο τεταρτημόριο - Q 1 47,48 50 2 ο τεταρτημόριο - Q 2 52,75 75 ο τεταρτημόριο - Q 60, Interquartile Range Ενδοτεταρτημοριακό εύρος, IQR 12,85 Μαρίνα Σύρπη
Εφαρμογές της Περιγραφικής Στατιστικής 19 Διαπιστώσεις για την Διαδίκτυο, στους Δήμους της Περιφέρειας Αττικής Κατανομή του ποσοστού των νοικοκυριών με πρόσβαση στο Κανονικότητα Ασυμμετρία και Κύρτωση Μέτρα Κεντρικής Τάσης Τεταρτημόρια Μεταβλητότητα Σημειώσεις Στατιστικής