ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα) Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017
3.1. Ανάπτυξη πίνακα συχνοτήτων (Παράδειγμα) Παράδειγμα: Να συμπληρωθεί και να ερμηνευθεί ο παρακάτω πίνακας συχνοτήτων ο οποίος παρουσιάζει τον αριθμό παιδιών σε 50 οικογένειες. Αριθμός παιδιών (Χ) Συχνότητα (f) Σχετική Συχνότητα (f%) Αθροιστική συχνότητα (F) Σχετική αθροιστική συχνότητα (F%) 0 2 ; ; 4% 1 10 ; ; ; 2 ; 50% 37 ; 3 8 ; ; ; 4 5 ; ; 100% Σύνολο ; 100% --- --- Σημείωση: Η λύση θα δοθεί στην παράδοση του μαθήματος
3.2. Αριθμητικά περιγραφικά μέτρα Τα αριθμητικά περιγραφικά μέτρα που αναφέρονται σε ένα δείγμα υπολογίζονται ως τιμές στατιστικών συναρτήσεων που μας δίνουν μια καλή θεωρητική εικόνα για τον τρόπο με τον οποίο κατανέμονται τα στοιχεία του δείγματος μας Δυο είναι κυρίως τα χαρακτηριστικά ενός δείγματος που μπορούν να μας δώσουν μια καλή συνοπτική εικόνα για το δείγμα Το ένα είναι κάποια τιμή γύρω από την οποία τα δεδομένα τείνουν να συσσωρεύονται. Μέτρα που αναφέρονται στον καθορισμό μιας τέτοιας τιμής ονομάζονται μέτρα θέσης ή κεντρικής τάσης Μια άλλη αναφέρεται στην μεταβλητότητα τον δεδομένων. Στον καθορισμό δηλαδή της διασποράς των δεδομένων γύρω από κάποιο μέτρο αριθμητικής θέσης και ονομάζονται μέτρα διασποράς ή μεταβλητότητας
3.2. Αριθμητικά περιγραφικά μέτρα Τα πιο σημαντικά αριθμητικά περιγραφικά μέτρα είναι: α) Μέτρα θέσης ή κεντρικής τάσης: - Μέσος όρος - Διάμεσος - Επικρατούσα τιμή β) Μέτρα σχετικής θέσης: - Τεταρτημόρια γ) Μέτρα διασποράς ή μεταβλητότητας: - Εύρος - Διακύμανση - Τυπική απόκλιση - Συντελεστής μεταβλητότητας
3.3. Μέτρα θέσης ή κεντρικής τάσης - Μέσος όρος (mean): η μέση τιμή ενός συνόλου τιμών Υπολογίζεται με τον τύπο: X n i= = 1 n X i - Επικρατούσα τιμή (mode): η πιο συχνά εμφανιζόμενη τιμή. Ένα σύνολο τιμών μπορεί να έχει περισσότερες από μια επικρατούσες τιμές - Κεντρική τιμή ή διάμεσος (median): είναι η τιμή που βρίσκεται στο μέσο μιας κατανομής, αν οι τιμές ταξινομηθούν κατά σειρά μεγέθους, για παράδειγμα από τη μικρότερη προς τη μεγαλύτερη. Η διάμεσος του δείγματος συμβολίζεται με δ ή Δ. Είναι το σημείο της κατανομής των παρατηρήσεων κάτω από το οποίο βρίσκεται το 50% των παρατηρήσεων και πάνω από αυτό το υπόλοιπο 50% των παρατηρήσεων. Εκφράζει την κεντρική θέση της κατανομής των παρατηρήσεων και γι αυτό στη βιβλιογραφία συναντάται και ως μέσος θέσης (position average).
3.4. Μέτρα σχετικής θέσης - Τεταρτημόρια (quartiles): Είναι οι τιμές μιας κατανομής οι οποίες δείχνουν τα σημεία αποκοπής για το κατώτερο 25%, 50% και 75% των τιμών Τα τεταρτημόρια υποδιαιρούν την κατανομή των παρατηρήσεων σε «ίσα» τμήματα, όχι με όρους μονάδων μέτρησης των παρατηρήσεων (δηλαδή, απόστασης), αλλά με όρους ποσοστών. Δηλαδή, τα τμήματα αυτά είναι «ίσα» με την έννοια ότι περιέχουν ίσα ποσοστά παρατηρήσεων Τα τεταρτημόρια επομένως είναι μέτρα σχετικής θέσης και όχι σχετικής απόστασης
3.4. Μέτρα σχετικής θέσης Παράδειγμα Τα παρακάτω δεδομένα αναφέρονται στις ώρες απουσίας 28 νοσηλευτών από την εργασία τους το τελευταίο τρίμηνο του 2008. Οι ώρες απουσίας είναι: 15, 11, 11, 11, 22, 9, 11, 7, 11, 12, 12, 16, 8, 11, 15, 9, 10, 14, 9, 10, 11, 10, 6, 17, 11, 10, 8, 11 Λύση Ταξινομώντας τα δεδομένα από το μικρότερο στο μεγαλύτερο βρίσκουμε κατά προσέγγιση τις τιμές των τεταρτημορίων: Πρώτο: Q1= 9,5. Τρίτο: Q3= 12 και δεύτερο (ή διάμεσος) Q2 (ή δ) =11. min-q1:25% Q1-Q2 (ή δ):25% Q2 (ή δ) Q3:25% Q3-max: 25% Παρατηρείστε ότι μεταξύ των άνισων αποστάσεων (6 μέχρι 9,5) και (9,5 μέχρι 11) και (11 μέχρι 12) και (12 μέχρι 22) βρίσκονται ίδια ποσοστά παρατηρήσεων (25%).
3.5. Μέτρα διασποράς ή μεταβλητότητας - Διακύμανση ή διασπορά (variance): Μετρά το πόσο διαφέρουν κατά μέσο όρο οι τιμές μιας μεταβλητής από το μέσο όρο τους. Είναι το τετράγωνο της τυπικής απόκλισης και επομένως σχετίζεται άμεσα με αυτή. (οι μονάδες μέτρησης στο τετράγωνο). Υπολογίζεται με τον τύπο: - Τυπική απόκλιση (std. deviation) : η ρίζα της διακύμανσης. Για την ακρίβεια είναι η τυπική μονάδα μέτρησης - Εύρος (Range): Η αριθμητική διαφορά μεταξύ μέγιστης και ελάχιστης τιμής. - Συντελεστής μεταβλητότητας (Coefficient of Variance ή C.V.): Μετρά το άπλωμα των τιμών σε σχέση με το μέσο, είναι καθαρός αριθμός, δεν έχει μονάδες μέτρησης. Είναι χρήσιμος για τη σύγκριση δυο ή περισσοτέρων συνόλων δεδομένων που έχουν μετρηθεί με τις ίδιες ή διαφορετικές μονάδες μέτρησης. Υπολογίζεται με τον τύπο:
3.5. Μέτρα διασποράς ή μεταβλητότητας Η διακύμανση, ως μέτρο μεταβλητότητας, δε διαφέρει ουσιαστικά από την τυπική απόκλιση. Παρότι, έχει το μειονέκτημα ότι δεν εκφράζεται στις ίδιες μονάδες με την μεταβλητή της οποίας τη μεταβλητότητα μετράει, εντούτοις, χρησιμοποιείται ευρύτατα στη Στατιστική Συμπερασματολογία για τις καλές της μαθηματικές ιδιότητες. Συνοπτικά, η διακύμανση και η τυπική απόκλιση έχουν τα ακόλουθα πλεονεκτήματα και μειονεκτήματα: Πλεονεκτήματα Για τον υπολογισμό τους, λαμβάνονται υπόψη όλες οι παρατηρήσεις. Έχουν μεγάλη εφαρμογή στη στατιστική συμπερασματολογία Με βάση την τυπική απόκλιση και τη Μειονεκτήματα Το κυριότερο μειονέκτημα της διασποράς είναι ότι δεν εκφράζεται στις ίδιες μονάδες με τη μεταβλητή. Το μειονέκτημα αυτό παύει να υπάρχει με τη χρησιμοποίηση της τυπικής απόκλισης μέση τιμή, μπορούν να ορισθούν διαστήματα τιμών.
Βιβλιογραφία (Εύδοξος) 1. Ιατρική στατιστική και στοιχεία βιομαθηματικών, Τόμος Α', Παπαϊωάννου Τάκης, Φερεντίνος Κοσμάς. 2. Θεμελειώδεις έννοιες στη βιοστατιστική, Bowers D. 3.Οικονομικά της Υγείας: Θεωρία, Προοπτική και Συστηματική Μελέτη, Santerre R. 4. Βιομετρία -Βιοστατιστική, Δημόπουλος Παναγιώτης Γ.