ΠΕΡΙΛΗΨΗ ΠΑΡΑΓΡΑΦΟΥ 6, Σελ 30-39, ΣΤΑΤΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ, Δ ΙΩΑΝΝΙΔΗ, Εκδόσεις Ζήτη (Μέτρα θέσης ή Κεντρικής τάσης) ΑΡΙΘΜΗΤΙΚΟΙ ΤΡΟΠΟΙ ΠΑΡΟΥΣΙΑΣΗΣ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Είναι πολύ χρήσιμο όταν γίνεται μια έρευνα να μπορούμε να έχουμε μια «συνοπτική» πληροφορία για τα δεδομένα μας Γύρω από ποιους αριθμούς συγκεντρώνονται τα δεδομένα μας και με τι τρόπο ; Μπορούμε να τους υπολογίσουμε ; Απαντήσεις σε αυτά τα ερωτήματα θα έχουμε όταν υπολογίζουμε με βάσει τα δεδομένα μας τα Μέτρα θέσης (ή Κεντρικής Τάσης) και τα Μέτρα Απόκλισης Μέτρα θέσης (ή Κεντρικής τάσης) Θα δώσουμε τους ορισμούς με τη σειρά που παρατίθενται τον Αριθμητικό Μέσο, τη Διάμεσο, Επικρατούσα Τιμή, το Γεωμετρικό Μέσο, και τέλος τον Αρμονικό Μέσο Αριθμητικός Μέσος O αριθμός που χαρακτηρίζει το κέντρο των μετρήσεων μας και υπολογίζεται διαιρώντας το άθροισμα των μετρήσεων με το πλήθος τους Μη Ομαδοποιημένα Δεδομένα Αν έχουμε τα δεδομένα x, x,, x τότε ο (απλός) αριθμητικός μέσος x = ( x + x + + x ) Ομαδοποιημένα Δεδομένα κατά διακριτές τιμές Aν έχουμε τα δεδομένα x, x,, x, από τα οποία h το πλήθος παίρνουν την τιμή, h το πλήθος
παίρνουν την τιμή,, και hκ το πλήθος παίρνουν την τιμή να υπολογισθεί και με τον επόμενο τύπο τότε, ο αριθμητικός μέσος μπορεί x ( h h h ) k k h, h,, hk = + + + Αν αντί για τις απόλυτες συχνότητες,,χρησιμοποιούσαμε τις σχετικές, f, f,, f k τότε ο τύπος θα γραφόταν ισοδύναμα x = f + f + + f k k) Ουσιαστικά εφαρμόζουμε τον προηγούμενο τύπο, τακτοποιώντας με ομαδοποίηση τις μετρήσεις μας Εδώ, οι υπολογισμοί μας οδηγούν σε ακριβές αποτέλεσμα Ομαδοποιημένα Δεδομένα κατά διαστήματα Aν έχουμε τα δεδομένα x, x,, x, από τα οποία h το πλήθος [, ), h το πλήθος [, ),, και hκ το πλήθος 3 [ k, k+) τότε, ο αριθμητικός μέσος μπορεί να υπολογισθεί και με τον επόμενο τύπο x ( mh mh mkhk ) = + + +, όπου mm m τα αντίστοιχα,,, k μέσα των διαστημάτων [, ),, [ k, k+) Οι μέσοι mm,,, mk είναι τα ημιαθροίσματα των άκρων των διαστημάτων [, ),, [ ) Δηλ, + + m =,, m = k k+ k k, k+ Αν αντί για τις απόλυτες συχνότητες, h, h,, hk,χρησιμοποιούσαμε τις σχετικές, τότε ο τύπος θα γραφόταν ισοδύναμα x = mf + mf + + mf k k) Εδώ, οι υπολογισμοί μας οδηγούν σε προσεγγιστικό αποτέλεσμα f, f,, f k
Διάμεσος O αριθμός που χαρακτηρίζει το μέσο των διατεταγμένων μετρήσεων στο δείγμα μας (Οι μισές από τις μετρήσεις μας βρίσκονται αριστερά του, και οι υπόλοιπες δεξιά του) Μη Ομαδοποιημένα Δεδομένα Αν έχουμε τα δεδομένα x, x,, x διατάσσοντας τα κατά σειρά μεγέθους τοποθετούμε πρώτα τον μικρότερο, έπειτα τον αμέσως μεγαλύτερο και συνεχίζοντας φτάνουμε στον μεγαλύτερο Το τελευταίο το γράφουμε με σύμβολα Ελάχιστος= x() x() x()=μέγιστος Αν ο αριθμός είναι ακέραιος αριθμός τότε η διάμεσος υπολογίζεται από τον τύπο ( ) ), ενώ αν ο αριθμός δεν είναι / 0,5 ( ([ ]) ([ ]) x = x = x + x + ) ακέραιος αριθμός τότε η διάμεσος υπολογίζεται από τον τύπο x ( = x ) = x, όπου [α] παριστάνει τον μεγαλύτερο αριθμού / 0,5 [ ] ακέραιο που δεν είναι μεγαλύτερος του Έτσι η διάμεσος των {0,,} είναι επειδή : =3, ενώ η διάμεσος των {0,,,3} είναι το,5 : επειδή = Εδώ, οι υπολογισμοί μας οδηγούν σε ακριβές αποτέλεσμα Ομαδοποιημένα Δεδομένα κατά διακριτές τιμές
Σε αυτή την περίπτωση εργαζόμαστε όπως στην προηγούμενη Ομαδοποιημένα Δεδομένα κατά διαστήματα Aν έχουμε τα δεδομένα x, x,, x, από τα οποία h το πλήθος [, ), h το πλήθος περιέχει την διάμεσο [, ),, και hκ το πλήθος 3 τότε το διάστημα [ k, k+) j-, j x / εφόσον [ ) H j h h hj hj h h = + + + + + + και η διάμεσος μπορεί να υπολογισθεί σύμφωνα με τον επόμενο τύπο h x = x = + ( H ) j / 0,5 j j j j Αν αντί για τις απόλυτες συχνότητες, h, h,, hk,χρησιμοποιούσαμε τις σχετικές, τότε ο τύπος θα γραφόταν ισοδύναμα f, f,, f k f x = x = + ( F j / 0,5 j j j j ), όπου Fj = f+ f + + f j Εδώ, οι υπολογισμοί μας οδηγούν σε προσεγγιστικό αποτέλεσμα
Επικρατούσα Τιμή Μη Ομαδοποιημένα Δεδομένα Μεταξύ των μεμονωμένων μετρήσεων x, x,, x, η τιμή εκείνη που εμφανίζεται πιο συχνά ονομάζεται επικρατούσα τιμή Εδώ, οι υπολογισμοί μας οδηγούν σε ακριβές αποτέλεσμα Ομαδοποιημένα Δεδομένα κατά διακριτές τιμές Σε αυτή την περίπτωση εργαζόμαστε όπως στην προηγούμενη Ομαδοποιημένα Δεδομένα κατά διαστήματα Aν έχουμε τα δεδομένα x, x,, x, από τα οποία h το πλήθος [, ), h το πλήθος [, ),, και hκ το πλήθος 3 τότε το διάστημα [ k, k+) j-, j [ ) περιέχει την επικρατούσα τιμή, d, εφόσον συγκεντρώνει τις περισσότερες μετρήσεις και η επικρατούσα τιμή μπορεί να υπολογισθεί σύμφωνα με τον επόμενο τύπο hj hj d = j + ( j j ) h h h j j j+ Αν αντί για τις απόλυτες συχνότητες, h, h,, hk,χρησιμοποιούσαμε τις σχετικές, τότε ο τύπος θα γραφόταν ισοδύναμα f, f,, f k f j f j d = j + ( j j ) f f f j j j+
Εδώ, οι υπολογισμοί μας οδηγούν σε προσεγγιστικό αποτέλεσμα Παράδειγμα 6: Ρωτήθηκαν 30 υπάλληλοι μιας επιχείρησης για την ηλικία τους και καταγράψαμε τις εξής ηλικίες,,0,, 3, 5,,,, 3,,5,3, 30,0, 3, 3, 6, 9,3,, 50, 50, 33,60,0,0,50,, α) Να υπολογισθεί ο μέσος χρόνος ηλικίας των υπάλληλων χρησιμοποιώντας τον αριθμητικό μέσο, την διάμεσο και την επικρατούσα τιμή β) Ποια είναι η μέση ηλικία, αν ομαδοποιήσουμε τις ηλικίες ανά 0 χρόνια Για τα ανοικτά διαστήματα, πρώτο και τελευταίο, λάβατε σαν κεντρικές τιμές 8 και 63, αντίστοιχα Λύση: α) ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ Εδώ το γνώρισμα είναι η ηλικία, και έχουμε τις εξής, δυνατές τιμές
=9, = 0, 3 =, = 3, 5 =, 6 = 30, 7 = 3, 8 = 33, 9 = 3, 0 = 0, =, = 3 = 3, =, 5 = 50, 6 = 5, 7 = 60 και 8 = 6 Οι απόλυτες συχνότητες εμφάνισης των δυνατών τιμών είναι, κατά αντιστοιχία,,3,,,,,,,,,,,,3,,, και Ο αριθμητικός μέσος μπορεί να υπολογισθεί από τύπο x h h 8h8 = ( + + + ) = 30 30 (9 0 6) ΔΙΑΜΕΣΟΣ + + + =36,3 Επειδή το δείγμα μεγέθους είναι =30, 30/=5 ακέραιος, η διάμεσος θα βρίσκεται μεταξύ της 5 ης και 6 ης τιμής διατεταγμένης τιμής Διατάσσοντας τις τιμές με σειρά μεγέθους, έχουμε x = 9, x = 0, x = 0, x = 3, x = 0, x = 6 () () (3) (5) (6) (30) Εφαρμόζοντας τον τύπο, έχουμε / 0,5 (3+0)=37 ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ x ( = x ) = x + x ( ) ( + ) = Η πιο συχνά εμφανιζόμενη τιμή είναι το 50 εμφανίζεται 3 φορές ( απόλυτη συχνότητα 3) Οι τιμές που υπολογίσαμε είναι ακριβείς Παρατηρούμε ότι 36,3<37<50, που μας δείχνει ότι τα δεδομένα μας παρουσιάζουν μια συγκέντρωση προς τα δεξιά δημιουργώντας μια αριστερή ουρά από δεδομένα β) Τακτοποιούμε τα δεδομένα σύμφωνα με το επόμενο πίνακα, όπου δίνονται τα διαστήματα ηλικιών, κεντρικές τιμές διαστημάτων, απόλυτες συχνότητες και απόλυτη αθροιστική συχνότητα
ΔΙΑΣΤΗΜΑΤΑ ΗΛΙΚΙΩΝ Κεντρικές Τιμές ΑΠΟΛΥΤΕΣ ΣΥΧΝΟΤΗΤΕΣ Κάτω των 0 8 [0,30) 5 9 0 [30,0) 35 5 5 [0,50) 5 8 3 [50,60) 55 5 8 [60,70) 65 30 ΑΡΙΘΜΗΤΙΚΟΣ ΜΕΣΟΣ ΑΠΟΛΥΤΗ ΑΘΡΟΙΣΤΙΚΗ ΚΑΤΑΝΟΜΗ Ο αριθμητικός μέσος μπορεί να υπολογισθεί σύμφωνα x 30 mh mh m6h6 30 = ( + + + = (8 + 5 9 + 35 5 + 5 5 + 55 5 + 63 = 39, ΔΙΑΜΕΣΟΣ Επειδή το δείγμα μας είναι =30, τότε = 5, η διάμεσος θα βρίσκεται στο τρίτο διάστημα [ 3, ) [30,0) =, και μπορεί να υπολογισθεί σύμφωνα h x ( = x ) = + ( H ) / 0,5 3 3 3 = 0 30 30 = 30 + ( 0) = 0 5 ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ Η πιο συχνά εμφανιζόμενη τιμή είναι το 50 και περιέχεται στο 5 ο διάστημα,[ 50,60) Οι τιμές που υπολογίσαμε είναι κατά προσέγγιση Παρατηρούμε ότι 39,<0<50, που μας δείχνει ότι τα δεδομένα μας παρουσιάζουν μια συγκέντρωση προς τα δε
Ποσοστιαία σημεία Αν έχουμε τον αριθμό p μεταξύ του 0 και (0<p<) και εφόσον έχουμε διατάξει τα δεδομένα μας, τότε ονομάζομε p ο ποσοστιαίο σημείο τον αριθμό x p που αφήνει 00p% αριστερά του και 00(-p)% δεξιά του μετρήσεις Μη Ομαδοποιημένα Δεδομένα Αν έχουμε τα δεδομένα x, x,, x διατάσσοντας τα κατά σειρά μεγέθους τοποθετούμε πρώτα τον μικρότερο, έπειτα τον αμέσως μεγαλύτερο και συνεχίζοντας φτάνουμε στον μεγαλύτερο Το τελευταίο το γράφουμε με σύμβολα Ελάχιστος= x() x() x()=μέγιστος ο Αν ο αριθμός p είναι ακέραιος αριθμός τότε το p ποσοστιαίο σημείο υπολογίζεται από τον τύπο = + ), ενώ αν ο αριθμός p δεν είναι ακέραιος ( x x x + p ([ p]) ([ p ]) αριθμός τότε το p τον τύπο x = p x([ p]) ο ποσοστιαίο σημείο υπολογίζεται από, όπου [α] παριστάνει τον μεγαλύτερο ακέραιο που δεν είναι μεγαλύτερος του αριθμού Ομαδοποιημένα Δεδομένα κατά διακριτές τιμές Σε αυτή την περίπτωση εργαζόμαστε όπως στην προηγούμενη Ομαδοποιημένα Δεδομένα κατά διαστήματα
Aν έχουμε τα δεδομένα x, x,, x, από τα οποία h το πλήθος [, ), h το πλήθος παίρνουν τιμές στο [, ),, και hκ το πλήθος 3 τότε το διάστημα [ k, k+) j-, j [ ) περιέχει το p ο ποσοστιαίο σημείο εφόσον H = h + h + + h p h + h + + h και j j j μπορεί να υπολογισθεί σύμφωνα με τον επόμενο τύπο h x = + ( p H ) j p j j j j Αν αντί για τις απόλυτες συχνότητες, h, h,, hk,χρησιμοποιούσαμε τις σχετικές, τύπος θα γραφόταν ισοδύναμα f, f,, f k τότε ο f x p, όπου j p = j + ( Fj ) Fj = f + f + + f j j j Εδώ, οι υπολογισμοί μας οδηγούν σε προσεγγιστικό αποτέλεσμα Αν p =, θα μιλάμε για το 5 ποσοστιαίο σημείο, θα το ονομάζομε πρώτο τεταρτημόριο και θα το συμβολίζομε με x = x ή / 0,5 Q Αν p = =, θα μιλάμε για το 50 ποσοστιαίο σημείο, θα το ονομάζομε δεύτερο τεταρτημόριο(ή διάμεσο) και θα το συμβολίζομε με x / = x 0,5 ή Q 3 Αν p =, θα μιλάμε για το 75 ποσοστιαίο σημείο, θα το ονομάζομε τρίτο τεταρτημόριο και θα το συμβολίζομε με x = x ή 3/ 0,75 Q 3
Παράδειγμα 6: Να υπολογισθούν τα ποσοστιαία σημεία, των παρακάτω δεδομένων:,,, 5, 6, 8, 9, 5, 5, 5, 5, 56, 57, 6, 6, 6, 68, 69, 7, 75, 83, 87, 9 Λύση Επειδή =, 5 00 = 6 και (- 5 00 )=8, και επομένως 6 μετρήσεις πρέπει να βρίσκονται κάτω του 8 και 8 κάτω Συνεπώς, εδώ x = x = Q = / 0,5 8 Ανάλογα, η διάμεσος( x / = x 0,5 = Q, ενώ x3/ = x0,75 = Q3 = 68,5