Mέτρα (παράμετροι) θέσεως Είδη παραμέτρων Σκοπός μέτρων θέσεως Μέτρα θέσεως Αριθμητικός μέσος Επικρατούσα τιμή Διάμεσος Τεταρτημόρια
Σύντομη περιγραφή Το πρώτο βήμα της ανάλυσης των δεδομένων, είναι η σύντομη περιγραφή τους. Για την περιγραφή τους χρησιμοποιούνται διάφοροι υπολογισμοί που προκύπτουν από τα δεδομένα και εκφράζουν με ένα αριθμό (παράμετρο) όλο το πλήθος των δεδομένων, ως προς κάποια χαρακτηριστικά τους που μας ενδιαφέρουν. Οι υπολογισμοί αυτοί αφορούν αριθμούς, χρησιμοποιούνται μόνο για ποσοτικά δεδομένα. (Δεδομένα δηλαδή που περιγράφονται από μεταβλητές ποσοτικές και όχι από ποιοτικές μεταβλητές.)
παραδείγματα Συχνά τα μέσα μαζικής ενημέρωσης ή εμείς στην καθημερινή μας ζωή σχολιάζουμε ερωτήματα όπως τα παρακάτω: Ποιο είναι το μέσο κόστος ζωής στην Ελλάδα; Ποιο είναι το μέσο εισόδημα των Ελλήνων; Πόσα χρήματα καταναλώνει την εβδομάδα ένας φοιτητής; Ποια είναι η τιμή του πετρελαίου θέρμανσης; Αυξήθηκε ή όχι η τιμή της ντομάτας; Η βαθμολογία ενός καθηγητή στις εξετάσεις του μαθήματος Στατιστικής ήταν επιεικής ή αυστηρή; Ποια είναι η μέση θερμοκρασία στην πόλη μας αυτό το μήνα; Ποιος είναι ο ημερήσιος τζίρος εμπορικών καταστημάτων;
Δυσκολίες απάντησης Ας θεωρήσουμε τη τιμή της ντομάτας. Για να απαντήσουμε αν αυξήθηκε ή όχι η τιμή της ντομάτας, χρειάζεται να ξέρουμε την περσινή τιμή και την τωρινή τιμή της. Στο μανάβικο της γειτονιάς μας το κιλό ντομάτας πωλείται σήμερα 2,5 ευρώ, χθες πωλούνταν 2,8 ευρώ και πέρυσι η τιμή πώλησης ήταν 2,6 ευρώ. Στη λαϊκή Αγορά της γειτονιάς μας η τιμή πέρυσι ήταν 2,3 ευρώ και σήμερα είναι 2 ευρώ ενώ την προηγούμενη εβδομάδα ήταν 2,5 ευρώ. Με όλα τα στοιχεία αυτά δεν μπορούμε να δώσουμε μια γρήγορη απάντηση για το αν τελικά μεταβλήθηκε η τιμή της ντομάτας φέτος.
Είδη παραμέτρων Πρέπει να ορίσουμε κάποιες παραμέτρους που θα μας επιτρέπουν να εκφράζουμε μεγάλο πλήθος δεδομένων με μια αντιπροσωπευτική τιμή, ώστε στη συνέχεια να μπορούμε ευκολότερα να κάνουμε συγκρίσεις. Ανάλογα με το τι θέλουμε να αντιπροσωπεύει η τιμή αυτή, μπορούμε να υπολογίσουμε παραμέτρους που αντιπροσωπεύουν την θέση (σε μια κλίμακα μετρήσεων) των ποσοτικών δεδομένων και οι οποίες ονομάζονται μέτρα θέσεως ή το εύρος διασποράς των τιμών των ποσοτικών δεδομένων οι οποίες ονομάζονται μέτρα διασποράς ή ακόμη το σχήμα του διαγράμματος που περιγράφει όλα τα ποσοτικά δεδομένα κι οι οποίες ονομάζονται μέτρα ασυμμετρίας και κύρτωσης.
ΜΕΤΡΑ ΘΕΣΕΩΣ Αντιπροσωπεύουν και περιγράφουν με έναν αριθμό τη θέση των ποσοτικών δεδομένων μας σε μια κλίμακα μέτρησης. Η επιλογή της τιμής που θα αντιπροσωπεύσει τα ποσοτικά δεδομένα, μπορεί να γίνει με διάφορους τρόπους. Ανάλογα με τον τρόπο που υπολογίζεται αυτή η αντιπροσωπευτική τιμή έχουμε τον αριθμητικό μέσο (μέσο όρο) την επικρατούσα τιμή τη διάμεσο τα τεταρτημόρια
Αριθμητικός μέσος Συμβολίζεται με μ ή X Είναι μια τιμή που εκφράζει την «ισότητα-ομοιομορφία» στα δεδομένα μας. Αν όλα είχαν την ίδια τιμή αυτή θα ήταν ο αριθμητικός μέσος (ή μέση τιμή) Η τιμή αυτή κάποιες φορές δεν εμφανίζεται ποτέ στα πραγματικά δεδομένα. Πλεονεκτήματα Αντιπροσώπευση Εύκολος υπολογισμός Μειονεκτήματα Κάποιες φορές δεν έχει φυσικό νόημα. Επηρεάζεται από ακραίες τιμές
Ιδιότητες αριθμητικού μέσου 1η Ιδιότητα: Το αλγεβρικό άθροισμα των αποκλίσεων όλων των τιμών της μεταβλητής Χ από τον αριθμητικό μέσο είναι 0. n Xi X 0 i1 2η Ιδιότητα: Αν οι τιμές της μεταβλητής Χ είναι σταθερές, αν δηλαδή: Χ 1 =Χ 2 = =Χ n =α, τότε ο αριθμητικός μέσος Xισούται κι αυτός με α 1 1 X Xi nα α 3η Ιδιότητα: Ο αριθμητικός μέσος έχει n πάντοτε n τιμή που βρίσκεται μεταξύ της μικρότερης και μεγαλύτερης τιμής της μεταβλητής. min Xi max Y α βx n n 2 Xi α Xi X i1 i1 2 min X 4η Ιδιότητα: Αν α και β πραγματικοί αριθμοί και max ο αριθμητικός μέσος της μεταβλητής Χ, τότε ο αριθμητικός μέσος της μεταβλητής: Υ=α+βΧ είναι: 5η Ιδιότητα: Το άθροισμα των τετραγώνων των αποκλίσεων όλων των τιμών Χ X i της μεταβλητής X από τον αριθμητικό τους. μέσο είναι μικρότερο του ίδιου αθροίσματος από οποιονδήποτε άλλον αριθμό δηλαδή, το άθροισμα είναι ελάχιστο όταν α= X X
Σταθμισμένος μέσος Αν στις τιμές Χ1, Χ2,,Χκ της μεταβλητής Χ αντιστοιχούν οι συντελεστές βαρύτητας, σταθμίσεις: Π1, Π2,,Πκ, τότε ο σταθμικός ή σταθμισμένος αριθμητικός μέσος δίνεται από την σχέση: X k i1 k i1 ixi i Ποια η μέση αξιολόγηση ενός μαθητή που έλαβε στο μάθημα των Νέων Ελληνικών 12, των Αρχαίων 16, των Μαθηματικών 18 και της Φυσικής, 14 όταν οι συντελεστές βαρύτητας των μαθημάτων αυτών είναι: 4, 4, 2, 1 X 412 416 4 4 218114 2 1 162 11 14.7
Επικρατούσα τιμή (ή τύπος) Συμβολίζεται με Τ Είναι η τιμή που εμφανίζεται πιο συχνά στα δεδομένα μας. Είναι δηλαδή η τιμή με την μεγαλύτερη συχνότητα. Πλεονεκτήματα Εύκολος υπολογισμός Μειονεκτήματα Δεν υπάρχει πάντα μια τιμή με την μεγαλύτερη συχνότητα αλλά πολλές τιμές με την ίδια συχνότητα.
Διάμεσος Συμβολίζεται με Μ Είναι η τιμή που διαχωρίζει τα δεδομένα μας στη μέση. Είναι δηλαδή η τιμή κάτω από την οποία βρίσκονται τα μισά δεδομένα και πάνω από αυτή τα άλλα μισά. Πλεονεκτήματα Μειονεκτήματα Δεν επηρεάζεται από Δεν αντιπροσωπεύει όλα τα ακραίες τιμές δεδομένα Εύκολος υπολογισμός
Τεταρτημόρια (πρώτο και τρίτο) Πρώτο τεταρτημόριο Q1 Είναι η τιμή που διαχωρίζει τα δεδομένα μας σε ένα τέταρτο των «χαμηλών». Είναι δηλαδή η τιμή κάτω από την οποία βρίσκεται το ένα τέταρτο των δεομένων και πάνω από αυτή τα υπόλοιπα τρία τέταρτα. Τρίτο τεταρτημόριο Q3 Είναι η τιμή που διαχωρίζει τα δεδομένα μας σε ένα τέταρτο των «υψηλών». Είναι δηλαδή η τιμή πάνω από την οποία βρίσκεται το ένα τέταρτο των δεομένων και κάτω από αυτή τα υπόλοιπα τρία τέταρτα. Πλεονεκτήματα Δεν επηρεάζονται από ακραίες τιμές Εύκολος υπολογισμός Χρησιμότητα ερμηνείας Μειονεκτήματα Δεν αντιπροσωπεύουν όλα τα δεδομένα
Βήματα εύρεσης διαμέσου τεταρτημορίων Απλά δεδομένα 1. τοποθετώ τα δεδομένα σε αύξουσα σειρά 2. βρίσκω αυτό που είναι στη Θέση n/2 για τη διάμεσο Θέση n/4 για το 1 ο τεταρτημόριο Θέση ¾n για το 3 ο τεταρτημόριο Δεδομένα με πίνακα συχνοτήτων 1. Υπολογίζω τη στήλη με την αθροιστική συχνότητα 2. Βρίσκω την τιμή (ή το διάστημα) όπου η αθροιστική συχνότητα ξεπερνά την τιμή n/2 για τη διάμεσο n/4 για το 1 ο τεταρτημόριο ¾n για το 3 ο τεταρτημόριο 3. Εντοπίζω την αντίστοιχη τιμή διαμέσου, ή τεταρτημορίου είτε άμεσα (Χ i αν δεν υπάρχουν διαστήματα) είτε με τον παρακάτω τύπο (i διάστημα): M = x i-1 +d/f i (n/2-f i-1 ) Q 1 = x i-1 +d/f i (n/4-f i-1 ) Q 3 = x i-1 +d/f i (3n/4-F i-1 )
Άσκηση Υπολογίστε τα μέτρα θέσεως για τα παρακάτω δεδομένα: Ημέρες άδειας 3, 4, 5, 2, 7, 3, 4, 5, 9, 8, 2, 1, 1, 3, 4, 4, 1, 5, ΜΙΣΘΟΣ 160 220 280 350 Αριθμός Υπαλλήλων 56 12 5 3 Ώρες 25-30 30-35 35-40 40-45 45-50 50-55 55-60 60-65 65-70 Αρ.Εργ 2 9 24 31 22 13 3 3 3
Λύση για μισθούς μέση τιμή Xi fi fixi 160 56 8960 220 12 2640 280 5 1400 350 3 1050 Αθροίσματα 76 14050 X 1 n fixi 14050 76 184.87
Λύση για μισθούς διάμεσος, τεταρτημόρια Xi fi Fi ξεπερνά 160 56 56 >38 >19 220 12 68 >57 280 5 73 350 3 76 Αθροίσματα 76 n 76 38 2 2 n 76 19 4 4 n 76 3 3 57 4 4 M 160 Q1 160 Q3 220
Λύση για ώρες μέση τιμή Χ f i X i f i X i 25-30 2 27.5 55.0 30-35 9 32.5 292.5 35-40 24 37.5 900.0 40-45 31 42.5 1317.5 45-50 22 47.5 1045.0 50-55 13 52.5 682.5 55-60 3 57.5 172.5 60-65 3 62.5 187.5 65-70 3 67.5 202.5 Σύνολο 110 4855.0 X k i fixi 1 4855 44.136 k 110 fi i1 44.1
Λύση για ώρες διάμεσος τεταρτημόρια Χ f i F i ξεπερνά 25-30 2 2 30-35 9 11 35-40 24 35 >n/4 =27.5 40-45 31 66 >n/2=55 45-50 22 88 >3n/4=82.5 50-55 13 101 55-60 3 104 60-65 3 107 65-70 3 110 Σύνολο 110 n 110 55 M 40 5/ 31(55 35) 43,2ώ 2 2 n 110 27,5 Q1 35 5/ 24(27,5 11) 38,4ώ 4 4 n 110 3 3 82,5 Q3 45 5/ 22(82,5 66) 48,75ώ 4 4