Κεφάλαιο 4 Δείκτες Κεντρικής Τάσης 1
Οι Δείκτες Κεντρικής Τάσης Είναι αριθμητικές τιμές που δείχνουν το ΚΕΝΤΡΟ της κατανομής Η Δεσπόζουσα Τιμή (Δσπ) Η Διάμεσος (Δμ ή δ) Ο Μέσος Όρος (Μ.Ο) 2
Η Δεσπόζουσα Τιμή ή επικρατούσα τιμή (Mode) Είναι η τιµή που συναντάται τις περισσότερες φορές σε µια κατανοµή. Είναι δηλαδή, η τιµή µε τη µεγαλύτερη συχνότητα Χρησιµοποιείται συνήθως για την περιγραφή κατηγορικών (ποιοτικών) µεταβλητών Μπορεί να υπάρχουν δύο ή και περισσότερες δεσπόζουσες τιµές σε µια κατανοµή (δίκορφη, ή πολύκορφη κατανοµή) 3
Παράδειγμα Υπολογισμού της Δεσπόζουσας τιμής μιας κατανομής Τιμές Συχνότητα (f) 1 2 2 0 3 3 4 6 5 10 6 11 7 7 8 6 9 3 10 2 Σύνολο Ν=50 Η δεσπόζουσα τιμή αυτής της κατανομής είναι το 6 με συχνότητα εμφ 4
Η Δεσπόζουσα Τιμή (Mode) Εάν έχουµε οµαδοποιηµένη µεταβλητή τότε είναι το σηµείο τοµής των ευθυγράµµων τµηµάτων τα οποία ορίζονται από α) ΑΒ, όπου Α το άνω δεξί άκρο της κλάσης µε τη µεγαλύτερη συχνότητα και Β το άνω δεξί άκρο της προηγούµενης κλάσης. β) ΓΔ, όπου Γ το άνω αριστερό άκρο της κλάσης µε τη µεγαλύτερη συχνότητα και Δ το άνω αριστερό άκρο της επόµενης κλάσης. Εάν έχουµε οµαδοποιηµένη µεταβλητή τότε η δεσπόζουσα τιµή είναι κατά προσέγγιση η µέση τιµή του διαστήµατος µε τη µεγαλύτερη συχνότητα 5
Πλεονεκτήματα - Μειονεκτήματα Πλεονεκτήματα Μειονεκτήματα Δείχνει την πιο συχνή τιμή της κατανομής Μένει ανεπηρέαστη από ακραίες τιμές Μπορεί να υπολογιστεί όταν οι ακραίες τιμές είναι άγνωστες Δίνει περισσότερες πληροφορίες από το μέσο όρο για την κατανομή, όταν αυτή έχει τη μορφή U Δεν λαμβάνει υπόψη την ακριβή τιμή του κάθε στοιχείου Δεν μπορεί να χρησιμοποιηθεί για να υπολογιστούν παράμετροι του πληθυσμού Δεν είναι πολύ χρήσιμη για μικρό αριθμό δεδομένων Δεν μπορεί να υπολογιστεί με ακρίβεια όταν έχουμε ομαδοποιημένη κατανομή 6
Η Διάμεσος (Median) Είναι η τιµή που χωρίζει την κατανοµή σε δύο ίσα τµήµατα Για να υπολογίσουµε τη διάµεσο µιας κατανοµής θα πρέπει πρώτα να ιεραρχήσουµε τις τιµές της (αρχίζοντας από τη µικρότερη) Στη συνέχεια επιλέγουµε την τιµή που βρίσκεται στη µεσαία θέση της κατανοµής Διάµεσος δ ενός δείγµατος παρατηρήσεων, οι οποίες έχουν διαταχθεί κατά αύξουσα τάξη, είναι η µεσαία παρατήρηση εάν το πλήθος των παρατηρήσεων είναι περιττό ή ο µέσος όρος των δύο µεσαίων παρατηρήσεων εάν το πλήθος είναι άρτιο. 7
Παράδειγμα υπολογισμού της Διαμέσου όταν έχουμε περιττό αριθμό τιμών Διάμεσος Τιμές: 18 25 21 4 13 15 28 17 22 Ιεραρχημένες Τιμές: 4 13 15 17 18 21 22 25 28 Θέση Ταξινόμησης: 1 2 3 4 5 6 7 8 9 Μεσαία Θέση
Η Διάμεσος (Median) Η διάµεσος είναι η τιµή της µεταβλητής στη θέση (Ν+1)/2 Π.χ., σε δείγµα 49 τιµών της µεταβλητής, η διάµεσος θα βρεθεί στη θέση (49+1)/2=25 η θέση σε δείγµα 50 τιµών της µεταβλητής η διάµεσος θα βρεθεί στη 25.5 η θέση, οπότε θα είναι η τιµή (25 η + 26 η )/2 Στην περίπτωση οµαδοποιηµένων µεταβλητών η διάµεσος βρίσκεται από το ιστόγραµµα των αθροιστικών συχνοτήτων. Δηλαδή η διάµεσος είναι το σηµείο τοµής του ευθυγράµµου τµήµατος, που ενώνει το άνω δεξί άκρο της κλάσης που περιέχει τη διάµεσο µε το άνω δεξί άκρο της προηγούµενης κλάσης, και της ευθείας y=ν/2 9
Η Διάμεσος (Median) Στην περίπτωση ομαδοποιημένων μεταβλητών, αλγεβρικά, η διάμεσος δίνεται από τον τύπο: L i το κατώτερο όριο της κλάσης που περιέχει την διάμεσο, f i η συχνότητα και h i το πλάτος της κλάσης αντίστοιχα, F i-1 η αθροιστική συχνότητα της προηγούμενης κλάσης N το μέγεθος του δείγματος. 10
Η Διάμεσος (παράδειγμα) L i το κατώτερο όριο της κλάσης που περιέχει την διάμεσο, f i η συχνότητα και h i το πλάτος της κλάσης αντίστοιχα, F i-1 η αθροιστική συχνότητα της προηγούμενης κλάσης N το μέγεθος του δείγματος. Υπολογισµός διαµέσου: Είναι N/2 =70/2=35. Η 35η παρατήρηση βρίσκεται στην κλάση 4-5. Άρα η διάµεσος είναι 11
Πλεονεκτήματα - Μειονεκτήματα Πλεονεκτήματα Είναι πιο εύκολο να υπολογιστεί σε σχέση με τον μέσο όρο Δεν επηρεάζεται από τις ακραίες τιμές, οπότε είναι ο καλύτερος δείκτης κεντρικής τάσης σε ασύμμετρη κατανομή Μπορεί να υπολογιστεί ακόμη και όταν δεν γνωρίζουμε τις ακραίες τιμές Μειονεκτήματα Δεν λαμβάνει υπόψη την ακριβή τιμή του κάθε στοιχείου Δεν μπορεί να χρησιμοποιηθεί για να υπολογιστούν παράμετροι του πληθυσμού Εάν οι τιμές της κατανομής είναι λίγες τότε η διάμεσος δεν τις αντιπροσωπεύει με ακρίβεια 12
Μέσος Όρος (Mean or Average) Η µέση τιµή της κατανοµής, που ορίζεται ως το πηλίκο του συνόλου των τιµών µιας κατανοµής µε τον αριθµό των ατόµων που συµµετέχουν σε αυτή Είναι η πιο αντιπροσωπευτική τιµή της κατανοµής, και υπολογίζεται µε τη χρήση του παρακάτω τύπου: 13
Μέσος Όρος (παράδειγμα) This image cannot currently be displayed. Τιµές: 15 18 16 24 27 19 22 15 + 18 + 16 + 24 + 27 + 19 + 22 X = = 7 20.14 14
Μέσος Όρος εάν οι τιµές χ i έχουν συχνότητες ν i, i=1, 2,..., µ τότε η µέση τιµή δίνεται από τον τύπο: Όπου: 15
Μέσος Όρος Για οµαδοποιηµένες τιµές η µέση τιµή δίνεται από τον τύπο: Όπου: Ο το κέντο κάθε κλάσης Όπου: Ο το κέντο κάθε κλάσης 16
Πλεονεκτήματα - Μειονεκτήματα Πλεονεκτήματα Μειονεκτήματα Είναι εύκολος στον υπολογισμό του Είναι ευαίσθητος στις τιμές των δεδομένων της κατανομής Αντικατοπτρίζει πιο πιστά την κεντρική τιμή της κατανομής σε σχέση με τους άλλους δείκτες Μπορεί να χρησιμοποιηθεί για τον υπολογισμό των παραμέτρων του πληθυσμού (παραμετρικά τεστ) Επειδή υπολογίζεται αλγεβρικά, η τιμή του είναι πιθανό να μην ανήκει στις τιμές της κατανομής Είναι πολύ ευαίσθητος στις ακραίες τιμές 17
Ποιος δείκτης είναι ο καταλληλότερος; Όταν η κατανοµή των δεδοµένων µας είναι συµµετρική, τότε οι τιµές και των τριών δεικτών είναι ίδιες, αλλά προτιµάµε τον µέσο όρο Όταν η κατανοµή των δεδοµένων µας είναι ασύµµετρη τότε καταλληλότερος δείκτης είναι η διάµεσος Όταν υπάρχει ανάγκη για µια γρήγορη και κατά προσέγγιση εκτίµηση της κεντρικής τάσης, τότε µπορούµε να χρησιµοποιήσουµε τη δεσπόζουσα τιµή 18
Ποιος δείκτης είναι ο καταλληλότερος; Εάν τα δεδοµένα µας έχουν µετρηθεί σε κατηγορική κλίµακα, τότε καταλληλότερος δείκτης είναι η δεσπόζουσα τιµή Εάν τα δεδοµένα µας έχουν µετρηθεί σε ιεραρχική κλίµακα, τότε καταλληλότερος δείκτης είναι η διάµεσος Εάν τα δεδοµένα µας έχουν µετρηθεί σε κλίµακα ίσων διαστηµάτων ή σε αναλογική, τότε καταλληλότερος δείκτης είναι ο µέσος όρος 19
Η παρούσα παρουσίαση βασίστηκε σε υλικό από τα βιβλία: Π. A. Ρούσσος, Γ. Τσαούσης: Στατιστική εφαρμοσμένη στις Κοινωνικές Επιστήμες, Αθήνα: εκδ. Ελληνικά Γράμματα, 2006 επιμέλεια: Κωνσταντίνος Π. Χρήστου και υλικό από το διαδίκτυο 20