1
2
3
1 2 2 0 3 3 4 6 5 10 6 11 7 7 8 6 9 3 10 2 4
Εάν έχουµε οµαδοποιηµένη µεταβλητή τότε είναι το σηµείο τοµής των ευθυγράµµων τµηµάτων τα οποία ορίζονται από α) ΑΒ, όπου Α το άνω δεξί άκρο της κλάσης µε τη µεγαλύτερη συχνότητα και Β το άνω δεξί άκρο της προηγούµενης κλάσης. β) ΓΔ, όπου Γ το άνω αριστερό άκρο της κλάσης µε τη µεγαλύτερη συχνότητα και Δ το άνω αριστερό άκρο της επόµενης κλάσης. Εάν έχουµε οµαδοποιηµένη µεταβλητή τότε η δεσπόζουσα τιµή είναι κατά προσέγγιση η µέση τιµή του διαστήµατος µε τη µεγαλύτερη συχνότητα 5
Δείχνει την πιο συχνή τιµή της κατανοµής Μένει ανεπηρέαστη από ακραίες τιµές Μπορεί να υπολογιστεί όταν οι ακραίες τιµές είναι άγνωστες Δίνει περισσότερες πληροφορίες από το µέσο όρο για την κατανοµή, όταν αυτή έχει τη µορφή U Δεν λαµβάνει υπόψη την ακριβή τιµή του κάθε στοιχείου Δεν µπορεί να χρησιµοποιηθεί για να υπολογιστούν παράµετροι του πληθυσµού Δεν είναι πολύ χρήσιµη για µικρό αριθµό δεδοµένων Δεν µπορεί να υπολογιστεί µε ακρίβεια όταν έχουµε οµαδοποιηµένη κατανοµή 6
7
Διάµεσος Μεσαία Θέση
Η διάµεσος είναι η τιµή της µεταβλητής στη θέση (Ν+1)/2 Π.χ., σε δείγµα 49 τιµών της µεταβλητής, η διάµεσος θα βρεθεί στη θέση (49+1)/2=25 η θέση σε δείγµα 50 τιµών της µεταβλητής η διάµεσος θα βρεθεί στη 25.5 η θέση, οπότε θα είναι η τιµή (25 η + 26 η )/2 Στην περίπτωση οµαδοποιηµένων µεταβλητών η διάµεσος βρίσκεται από το ιστόγραµµα των αθροιστικών συχνοτήτων. Δηλαδή η διάµεσος είναι το σηµείο τοµής του ευθυγράµµου τµήµατος, που ενώνει το άνω δεξί άκρο της κλάσης που περιέχει τη διάµεσο µε το άνω δεξί άκρο της προηγούµενης κλάσης, και της ευθείας y=ν/2 9
Στην περίπτωση οµαδοποιηµένων µεταβλητών, αλγεβρικά, η διάµεσος δίνεται από τον τύπο: δ = L i + N 2 F i 1 f i h i L i το κατώτερο όριο της κλάσης που περιέχει την διάµεσο, f i η συχνότητα και h i το πλάτος της κλάσης αντίστοιχα, F i-1 η αθροιστική συχνότητα της προηγούµενης κλάσης N το µέγεθος του δείγµατος. 10
δ = L i + N 2 F i 1 Υπολογισµός διαµέσου: Είναι N/2 =70/2=35. Η 35η παρατήρηση βρίσκεται στην κλάση 4-5. Άρα η διάµεσος είναι f i h i L i το κατώτερο όριο της κλάσης που περιέχει την διάµεσο, f i η συχνότητα και h i το πλάτος της κλάσης αντίστοιχα, F i-1 η αθροιστική συχνότητα της προηγούµενης κλάσης N το µέγεθος του δείγµατος. δ = 4 + 35 24 29 1 = 4 + 0.03 11= 4.38 11
Είναι πιο εύκολο να υπολογιστεί σε σχέση µε τον µέσο όρο Δεν επηρεάζεται από τις ακραίες τιµές, οπότε είναι ο καλύτερος δείκτης κεντρικής τάσης σε ασύµµετρη κατανοµή Μπορεί να υπολογιστεί ακόµη και όταν δεν γνωρίζουµε τις ακραίες τιµές Δεν λαµβάνει υπόψη την ακριβή τιµή του κάθε στοιχείου Δεν µπορεί να χρησιµοποιηθεί για να υπολογιστούν παράµετροι του πληθυσµού Εάν οι τιµές της κατανοµής είναι λίγες τότε η διάµεσος δεν τις αντιπροσωπεύει µε ακρίβεια 12
x = x 1 + x 2 +...+ x ν N ν i=1 = 1 N x i 13
14
εάν οι τιµές χ i έχουν συχνότητες ν i, i=1, 2,..., µ τότε η µέση τιµή δίνεται από τον τύπο: x = ν 1 x 1 + ν 2 x 2 +...+ ν µ x µ N µ = 1 N ν i x i = i=1 µ x i f i i=1 Όπου: f i = ν i ν 15
Είναι εύκολος στον υπολογισµό του Είναι ευαίσθητος στις τιµές των δεδοµένων της κατανοµής Αντικατοπτρίζει πιο πιστά την κεντρική τιµή της κατανοµής σε σχέση µε τους άλλους δείκτες Μπορεί να χρησιµοποιηθεί για τον υπολογισµό των παραµέτρων του πληθυσµού (παραµετρικά τεστ) Επειδή υπολογίζεται αλγεβρικά, η τιµή του είναι πιθανό να µην ανήκει στις τιµές της κατανοµής Είναι πολύ ευαίσθητος στις ακραίες τιµές 16
17
18
Η παρούσα παρουσίαση βασίστηκε σε υλικό από τα βιβλία: Π. A. Ρούσσος, Γ. Τσαούσης: Στατιστική εφαρµοσµένη στις Κοινωνικές Επιστήµες, Αθήνα: εκδ. Ελληνικά Γράµµατα, 2006 και υλικό από το διαδίκτυο επιµέλεια: Κωνσταντίνος Π. Χρήστου 19