Εισαγωγή στη Στατιστική- Κοινωνικές Στατιστικές Διάλεξη 13-3-2015
Υπολογισμός Σταθμικού Μέσου Αριθμητικού X weighted n 1 n 1 w i w X i i
Παράδειγμα Υποψήφιος της Δ' Δέσμης πήρε στις εξετάσεις τους εξής βαθμούς: Μάθημα Βαθμοί (Χ i ) Συντελεστής Στάθμισης (w i ) X i w i Μαθηματικά 14 0.8 11.2 Εκθεση 16 0.8 12.8 Ιστορία 18 1.95 35.1 Πολιτική Οικονομία 17 1.95 33.15 Σταθμικός Απλός 65 5.5 92.25 16.77 16.25
Για τον υπολογισμό του Σταθμικού Μέσου Αριθμητικού ακολουθούμε τα εξής βήματα: Δημιουργούμε στήλη για να τοποθετήσουμε τα ζεύγη γινομένων fixi Αθροίζουμε τα επιμέρους γινόμενα για να βρούμε το w i X i
Αθροίζουμε στη στήλη των συντελεστών στάθμισης για να βρούμε το wi Διαιρούμε για να βρούμε το X weighted n 1 n 1 w i w X i i
Εφαρμογή Εύρεσης ΜΑ Κατανομής Πίνακας 1 Συχνοτήτων Κατανομή Ετήσιου Ισοδύναμου Εισοδήματος Νοικοκυριών Χώρας Α Τάξεις Εισοδήματος (χιλ. Ευρώ) Συχνότητα (σε χιλιάδες νοικοκυριά),fi 0-10 60 10-20 70 20-30 80 30-40 90 40-50 50 50-60 40 60-70 22 70-80 15 80-90 8
Για τον υπολογισμό του Μέσου Αριθμητικού της Κατανομής Συχνοτήτων ακολουθούμε τα εξής βήματα: Βρίσκουμε τους Κεντρικούς Όρους Xi ΑΦΟΥ έχουμε δημιουργήσει στήλη για να τους τοποθετήσουμε Δημιουργούμε στήλη για να τοποθετήσουμε τα ζεύγη γινομένων fixi
Αθροίζουμε τα επιμέρους γινόμενα για να βρούμε το n f i i 1
Αθροίζουμε στη στήλη των συχνοτήτων τις συχνότητες για να βρούμε το n 1 f i
Υπολογίζουμε τον ΜΑ σύμφωνα με τον τύπο X n 1 n 1 f i f X i i
Πίνακας 1 Κατανομή Ισοδύναμου Εισοδήματος Νοικοκυριών Ετήσιου Εισοδήματος Χώρας Α Τάξεις Εισοδήματος (χιλ. Ευρώ) Συχνότητα (σε χιλιάδες νοικοκυριά),fi Κεντρικός Ορος Xi fixi 0-10 60 5 300 10-20 70 15 1050 20-30 80 25 2000 30-40 90 35 3150 40-50 50 45 2250 50-60 40 55 2200 60-70 22 65 1430 70-80 15 75 1125 80-90 8 85 680 435 14185 32.61
Διάμεσος (Median), M Σε μία σειρά δεδομένων η Διάμεσος M βρίσκεται στο μέσον των παρατηρήσεων όταν αυτές είναι τοποθετημένες κατά τάξη μεγέθους (αύξουσα ή φθίνουσα). Εφαρμογή Σε έρευνα που έγινε ένα μεσημέρι στα 2 καταστήματα ταχείας εστίασης που βρίσκονται γειτνιάζουν άμεσα με το πανεπιστήμιο. Από το σύνολο των δεδομένων της έρευνας, επελέγη δείγμα 9 ατόμων και βρέθηκαν τα ακόλουθα ποσά σε Ευρώ που ξόδεψαν οι φοιτητές και οι φοιτήτριες. Σε ευρώ: 4, 14, 2, 6, 6, 4, 24, 10, 12
Για να βρούμε τη Διάμεσο Μ εργαζόμαστε ως εξής: Βήμα 1ο: Τοποθετούμε τα δεδομένα κατά τάξη μεγέθους 2, 4, 4, 6, 6, 10, 12, 14, 24 Βήμα 2ο: Εφαρμόζουμε τον τύπο όπου Ν ο αριθμός των παρατηρήσεων. Στην προκειμένη περίπτωση Μ=(9+1):2=5 Άρα η Διάμεσος των δεδομένων βρίσκεται στην 5η θέση. Άρα η Διάμεσος είναι 6 (ΠΡΟΣΟΧΗ! ΟΧΙ 5!!). Τεχνική παρατήρηση: Εάν ο αριθμός των παρατηρήσεων είναι άρτιος αριθμός π.χ 10, τότε Μ=(10+1)/2=11/2=5,5. Στην περίπτωση αυτή η Διάμεσος βρίσκεται μεταξύ της 5ης και της 6ης θέσης και θα πρέπει να βρούμε το Μέσο Αριθμητικό των δύο μεσαίων παρατηρήσεων για εντοπίσουμε τη Διάμεσο.
Η Διάμεσος λοιπόν υποδηλώνει ότι οι μισές παρατηρήσεις των δεδομένων μας είναι μικρότερες τις Διαμέσου και οι άλλες μισές μεγαλύτερες. Συνεπώς δεν επηρεάζεται από τις ακραίες τιμές της κατανομής. Δηλαδή, στο παραπάνω παράδειγμα εάν η τιμή 24 ήταν π.χ. 40, η Διάμεσος πάλι 6 θα ήταν. Εάν όμως υπολογίσουμε και για τις 2 περιπτώσεις τον Μέσο Αριθμητικό, θα διαπιστώσουμε ότι είναι διαφορετικός.
Διασπορά Η παραπάνω διαπίστωση μας οδηγεί στο ερώτημα του βαθμού αντιπροσωπευτικότητας του Μέσου Αριθμητικού. Ενας εύκολος τρόπος να εκτιμήσουμε τον βαθμό αυτόν είναι το Ευρος Μεταβολής (Range) που, απλά, αποτελεί τη διαφορά ανάμεσα στη μικρότερη και τη μεγαλύτερη τιμή των δεδομένων. Εφαρμογή Στο παραπάνω παράδειγμα, το Εύρος Μεταβολής είναι: 24-2=22. Εν προκειμένω είναι μία μεγάλη τιμή που θέτει ερωτηματικά για την αντιπροσωπευτικότατα του Μέσου Αριθμητικού.
Εφαρμογή Στο παράδειγμα των χρημάτων που ξόδεψαν οι φοιτήτριες και οι φοιτητές, σε ευρώ 4, 14, 2, 6, 6, 4, 24, 10, 12 ή 2, 4, 4, 6, 6, 10, 12, 14, 24 το Εύρος Μεταβολής είναι: 24-2=20. Εν προκειμένω είναι μία μεγάλη τιμή που θέτει ερωτηματικά για την αντιπροσωπευτικότητα του Μέσου Αριθμητικού.
2. Ένα άλλο μέτρο, περισσότερο ακριβές είναι η Διακύμανση (Variance) και η Τυπική Απόκλιση (standard Deviation) που αποτελεί την τετραγωνική ρίζα της Διακύμανσης. Όπως μας πληροφορούν και οι όροι τα μέτρα αυτά μετρούν τη διασπορά των διαφόρων τιμών από το μέσο. Όσο μεγαλύτερη είναι η διακύμανση ή η Τυπική Απόκλιση τόσο μεγαλύτερη είναι η διασπορά και τόσο λιγότερο αντιπροσωπευτικός είναι ο Μέσος.
Για την ύλη του μαθήματος δεν υπάρχει απαίτηση υπολογισμού της Διακύμανσης. Θα πρέπει όμως να γνωρίζουμε ότι αυτή είναι 0 όταν οι τιμές της σειράς είναι ίσες. Διότι, εάν ένας φοιτητής έχει π.χ 7 σε όλα τα μαθήματα, ο Μέσος Αριθμητικός είναι 7 και βέβαια είναι πλήρως αντιπροσωπευτικός της επίδοσής του. Οσο διαφοροποιούνται οι βαθμοί τόσο ο Μέσος Αριθμητικός «χάνει» την αντιπροσωπευτικότητά του, ιδιαιτέρως όταν έχουμε ακραίες τιμές
Τύπος ή Επικρατούσα Τιμή (Τ 0 ) (Mode) Ο Τύπος ή Επικρατούσα Τιμή μιας σειράς δεδομένων είναι η μία και μοναδική τιμή της σειράς με τη μεγαλύτερη συχνότητα εμφάνισης.
Εφαρμογή Ρίχνουμε 10 φορές ένα ιδανικό (και όχι κάλπικο) ζάρι και καταγράφουμε τα ακόλουθα αποτελέσματα: 5, 4, 5, 1, 5, 6, 2, 1, 4, 2 Επομένως έχουμε τον πίνακα: Ο Τ 0 είναι το 5 γιατί έρχεται 3 φορές. (ΠΡΟΣΟΧΗ: όχι το 3!) Ενδεχόμενα 1 2 3 4 5 6 Συχνότητες 2 2 0 2 3 1