Σχετικές πληροφορίες: http://dlib.ionio.gr/~spver/seminars/statistics/ Πίσω στα βασικά Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες Σπύρος Βερονίκης Μέρος 1: Βασικές έννοιες Μια σύντομη εισαγωγή σε βασικές αρχές και μεγέθη στατιστικής. Χρήση στατιστικών μοντέλων για την τεκμηρίωση απαντήσεων σε ερευνητικά ερωτήματα και υποθέσεις. Μάρτιος 2011 σελ. 1/19
Πραγματικότητα, μοντέλα και έλεγχος προσαρμογής Συχνά ενδιαφερόμαστε να ανακαλύψουμε σχέσεις μεταξύ μεγεθών και να ερμηνεύσουμε τους τρόπους με τους οποίους αλληλεπιδρούν (π.χ. εξάρτηση ύψους βάρους). Προκειμένου να το επιτύχουμε συλλέγουμε δεδομένα τα οποία στη συνέχεια αναλύουμε για να καταλήξουμε σε συμπεράσματα. Για την αναπαράσταση και ανάλυση των δεδομένων αυτών συχνά δημιουργούμε στατιστικά μοντέλα. Έτσι μπορούμε στη συνέχεια να χρησιμοποιήσουμε τα μοντέλα αυτά (ως ισοδύναμα της πραγματικής κατάστασης) και να προβούμε σε προβλέψεις/εκτιμήσεις μεγεθών. Τα μοντέλα μπορεί να αναπαριστούν διαδικασίες (συμπεριφορές) για τις οποίες μπορούμε να προβλέψουμε πώς εκφράζονται υπό ορισμένες συνθήκες. Όσο ακριβέστερα είναι τα μοντέλα που δημιουργούμε τόσο πιο ακριβής θα είναι και οι προβλέψεις οι οποίες διατυπώνονται. Ας δούμε το παράδειγμα του κύκλου. Προκειμένου να αναπαραστήσουμε σωστά έναν κύκλο, χρησιμοποιούμε ένα πλήθος σημείων τα οποία στη συνέχεια ενώνουμε με μια γραμμή. Τα σημεία αυτά πρέπει να ισαπέχουν από ένα σημείο Κ (το κέντρο του κύκλου). Με λίγες καταγραφές (π.χ. 4) έχουμε ένα μοντέλο (ορθογώνιο) το οποίο δεν κυκλικό. Έτσι, το μοντέλο αυτό δεν μπορεί να θεωρηθεί ισοδύναμο ενός κύκλου, δηλαδή είναι ακατάλληλο για την αναπαράσταση ενός κύκλου. Λαμβάνοντας περισσότερα σημεία (π.χ. 6) έχουμε μια ικανοποιητικότερη αναπαράσταση ενός κύκλου, η οποία ωστόσο αποκλίνει από την πραγματική κατάσταση. Η χρήση του μοντέλου αυτού ως ισοδύναμου, θα οδηγούσε σε προβλέψεις η οποίες θα ήταν μάλλον ανακριβείς. Λαμβάνοντας ακόμη περισσότερα σημεία (π.χ. 8) προσεγγίζεται η γεωμετρική μορφή του κύκλου ακόμη καλύτερα, οπότε και το μοντέλο μας προσεγγίζει ακόμη περισσότερο την πραγματική κατάσταση. Όσο περισσότερα τα δεδομένα που συλλέγονται, τόσο ακριβέστερο το μοντέλο που δημιουργείται και άρα τόσο μεγαλύτερες οι πιθανότητες εύστοχων προβλέψεων οι οποίες πηγάζουν από το μοντέλο που δημιουργήσαμε. Σημειώνεται στο σημείο αυτό πως συχνά τα μοντέλα είναι χρονο-μεταβαλλόμενα, οπότε και απαιτείται η διαρκής ενημέρωσή τους. Μάρτιος 2011 σελ. 2/19
Πληθυσμός και δείγματα Πληθυσμός: είναι το σύνολο των μονάδων (ανθρώπων) από τις οποίες προέρχονται οι καταγραφές και στις οποίες εφαρμόζονται τα στατιστικά μας μοντέλα. Δείγμα: είναι ένα υποσύνολο του πληθυσμού από το οποίο λαμβάνονται μετρήσεις προκειμένου να δημιουργηθεί/ελεγχθεί ένα στατιστικό μοντέλο. Τα συμπεράσματα από τη μελέτη του δείγματος γενικεύονται (υπό προϋποθέσεις) στον ευρύτερο πληθυσμό. Οι λόγοι για τους οποίους ασχολούμαστε με δείγματα και όχι με τον πληθυσμό είναι πρακτικοί (συντομότερος χρόνος μελέτης, μικρότερο κόστος). Από ένα πληθυσμό μπορούν να προκύψουν πολλαπλά δείγματα (επειδή περιλαμβάνουν διαφορετικές μονάδες του πληθυσμού). Δημιουργείται έτσι ένα ερώτημα για το κατά πόσο ένα δείγμα είναι αντιπροσωπευτικό του πληθυσμού. Για παράδειγμα, ένα προσθέτουμε 1 μονάδα για κάθε άτομο του πληθυσμού το οποίο είναι χαρούμενο, αφαιρούμε 1 μονάδα για κάθε άτομο το οποίο είναι λυπημένο και δεν προσθαφαιρούμε τίποτα για τα άτομα στην ενδιάμεση κατάσταση, τότε δημιουργείται ένα μέγεθος (βαθμός ευτυχίας του πληθυσμού) ο οποίος και τον χαρακτηρίζει (π.χ. μ=3). Τότε, για να θεωρείται κάθε δείγμα (υποσύνολο του πληθυσμού) αντιπροσωπευτικό, θα πρέπει ο βαθμός ευτυχίας του υποσυνόλου να έχει την ίδια τιμή, δηλαδή να διατηρούνται οι αναλογίες μεταξύ των 3 ομάδων. Λόγω της τυχαίας επιλογής των μελών του δείγματος, αυτό δεν συμβαίνει πάντα κι έτσι ο δείκτης που χαρακτηρίζει το σύνολο (δείγμα) μπορεί να λαμβάνει διάφορες τιμές. Η αντιπροσωπευτικότητα κάθε δείγματος εκφράζεται από το τυπικό σφάλμα (standard error, SE), δηλαδή τη διαφορά μεταξύ της μέσης τιμή του ενός χαρακτηριστικού μεγέθους (που μας ενδιαφέρει) μεταξύ όλων των δυνατών δειγμάτων και της αντίστοιχης τιμής του πληθυσμού. Όταν το τυπικό σφάλμα είναι μηδενικό, τότε το δείγμα είναι ακριβής μικρογραφία του πληθυσμού. Εγείρεται όμως ένα ερώτημα: πώς θα υπολογίσω στο πλαίσιο της μελέτης μου τη μέση τιμή κάθε δυνατού δείγματος, εφ' όσον πρόκειται να δημιουργήσω μόνον ένα δείγμα; Επειδή αυτό είναι αδύνατον, βασιζόμαστε σε μια ικανοποιητική εκτίμηση του τυπικού σφάλματος βάσει των χαρακτηριστικών του Μάρτιος 2011 σελ. 3/19
δείγματος το οποίο έχουμε. Τα χαρακτηριστικά αυτά είναι η τυπική απόκλιση (s) της μέσης τιμής του μεγέθους (όπως αυτή προκύπτει από το δείγμα) και το μέγεθος του δείγματος, Ν. Η σχέση η οποί α δίνει την εκτίμηση του τυπικού σφάλματος είναι: SE=AVG X X Pop = s N Η τιμή του τυπικού σφάλματος πρέπει να είναι κατά το δυνατόν μηδενική. Σε περίπτωση που δεν συμβαίνει αυτό, πρέπει να αυξήσουμε το μέγεθος του δείγματος (Ν). Όταν η τιμή γίνει ικανοποιητικά μικρή, τότε το δείγμα θεωρείται αντιπροσωπευτικό του πληθυσμού και τα συμπεράσματα που διατυπώνονται από τη μελέτη του δείγματος μπορούν να γενικευθούν στον ευρύτερο πληθυσμό. Μάρτιος 2011 σελ. 4/19
Μεταβλητές Οι μεταβλητές είναι μαθηματικά μεγέθη τα οποία αναπαριστούν μεγέθη παραγόντων του περιβάλλοντος που διερευνούμε (π.χ. φύλο, ηλικία, χρόνος, κ.α). Μεταξύ των μεγεθών που μελετούμε γίνεται ένα βασικός διαχωρισμός ο οποίος αντικατοπτρίζεται και στις μεταβλητές που τα αναπαριστούν: υπάρχουν μεγέθη τα οποία επηρεάζουν και μεγέθη τα οποία επηρεάζονται, δηλαδή μια σχέση αιτίου και αιτιατού. Οι μεταβλητές που αναπαριστούν τα αίτια συχνά ονομάζονται ανεξάρτητες ενώ οι μεταβλητές οι οποίες επηρεάζονται ονομάζονται εξαρτημένες, επειδή ακριβώς οι τιμές τους εξαρτώνται από τις τιμές των πρώτων. Για παράδειγμα μεταξύ ηλικίας και σωματικού βάρους, είναι γνωστό πως υπάρχει συσχέτιση και πως καθώς αυξάνεται η ηλικία μας αυξάνεται και το βάρος μας (τουλάχιστον στα πρώτα χρόνια της ζωής μας). Η ηλικία είναι η ανεξάρτητη μεταβλητή (οι τιμές της αυξάνονται ανεξέλεγκτα) και το σωματικό βάρος είναι η εξαρτημένη. Το σωματικό βάρος δεν είναι ανεξάρτητη μεταβλητή η οποία επηρεάζει την ηλικία μας, δηλαδή δεν γινόμαστε νεότεροι χάνοντας βάρος (αν και σίγουρα νιώθουμε καλύτερα!). Ένας άλλος διαχωρισμός μεταξύ των μεταβλητών γίνεται βάση των τιμών οι οποίες μπορούν να λάβουν καθώς και της φύσης των μεγεθών που αναπαριστούν: διακρίνονται σε ονομαστικές (nominal), τακτικές (ordinal), και ποσοτικές (interval). Οι ονομαστικές μεταβλητές χρησιμοποιούνται για να αναπαραστήσουν (εκφράσουν) κατηγορίες, όπως το φύλο (άνδρας ή γυναίκα), την απόκριση σε μια ερώτηση (ναι ή όχι), την εργασιακή κατάσταση (άνεργος, εργαζόμενος, ημι-απασχολούμενος) κλπ. Η αναπαράσταση μπορεί να γίνει και με αριθμούς (π.χ. 0= όχι και 1=ναι). Πέραν της διάκρισης των κατηγοριών οι ονομαστικές μεταβλητές δεν παρέχουν κάποια πληροφορία διαβάθμισης της έντασης μεταξύ διαδοχικών τιμών του μεγέθους που αναπαριστούν. Οι τακτικές μεταβλητές χρησιμοποιούνται για να αναπαραστήσουν δεδομένα στα οποία υπάρχει η έννοια της διαβάθμισης. Οι τιμές των τακτικών μεταβλητών αποδίδονται ανάλογα με τη διαβάθμιση στην ένταση (περισσότερο ή λιγότερο) του μεγέθους το οποίο καταγράφουν. Για παράδειγμα, μπορούμε να διατάξουμε τους αναγνώστες ενός βιβλίου βάσει των απαντήσεών τους στο Μάρτιος 2011 σελ. 5/19
ερώτημα πόσο ικανοποιημένοι είστε από τη χρήση μιας υπηρεσίας; αποδίδοντας στην μεταβλητή ικανοποίηση τις τιμές καθόλου, λίγο, αρκετά και πολύ. Χρησιμοποιώντας αυτές τις διατεταγμένες κατηγορίες μπορούμε να διαχωρίσουμε ομάδες ανθρώπων οι οποίοι ήταν λιγότερο ικανοποιημένοι από εκείνες που ήταν πολύ ικανοποιημένοι. Ωστόσο, ο διαχωρισμός αυτός δεν μας παρέχει ακριβή πληροφορία για τις διαφορές ικανοποίησης μεταξύ των ατόμων: είναι ένας χονδρικός διαχωρισμός. Οι ποσοτικές μεταβλητές (οι οποίες λαμβάνουν αυστηρώς αριθμητικές τιμές, δηλαδή νούμερα) χρησιμοποιούνται όταν είναι δυνατός ο αντικειμενικός διαχωρισμός μεταξύ των διαβαθμίσεων των τιμών τους. Χρησιμοποιούνται δηλαδή όταν οι τιμές τους μπορούν να μετρηθούν σε μια κλίμακα όπου οι αποστάσεις μεταξύ διαδοχικών τιμών είναι ισαπέχουσες. Για παράδειγμα, το ύψος ενός ατόμου μπορεί να εκφραστεί με μια ποσοτική μεταβλητή, επειδή άτομα διαφορετικού ύψους μπορούν να διαχωριστούν αποδίδοντάς τους διαφορετικές τιμές (πχ. 167εκ, 173εκ., κλπ). Επιπλέον, γνωρίζουμε πως η διαφορά μεταξύ δύο ατόμων ύψους 150 και 160εκ. είναι ακριβώς ίση με τη διαφορά ύψους δύο άλλων ατόμων με ύψη 175 και 185εκ. Στις κοινωνικές επιστήμες συχνά μας απασχολούν μεγέθη (παράγοντες) οι οποίοι δεν είναι εύκολα μετρήσιμοι και ως εκ τούτου είναι δύσκολο να αποφανθούμε για το αν πρέπει να εκφραστούν με τακτικές ή ποσοτικές μεταβλητές. Για παράδειγμα, η ικανοποίηση, η ευτυχία, η επιθετικότητα, η ευημερία, κ.α. Δεν μπορούν να αποτιμηθούν αντικειμενικά όπως ο χρόνος, η ηλικία, ο μισθός, ο πληθυσμός, κ.α. Η εύρεση μετρικών αποτίμησης υψηλής ακρίβειας και αξιοπιστίας για τα μεγέθη της πρώτης ομάδας αποτελεί ακόμη και σήμερα ανοικτό ερευνητικό πεδίο. Συνήθως, αποτιμώνται είτε με υποκειμενικές ψυχομετρικές κλίμακες, είτε εξάγοντας τις τιμές τους μετρώντας άλλα μεγέθη τα οποία γνωρίζουμε πως τις επηρεάζουν. Μάρτιος 2011 σελ. 6/19
Βασικές έννοιες: Η μέση τιμή Μέση τιμή: είναι μια υποθετική τιμή η οποία υπολογίζεται βάση των μετρήσεων από το δείγμα. Είναι μια ισοδύναμη τιμή η οποία αναπαριστά κατά προσέγγιση ό,τι και το σύνολο των τιμών του δείγματος. Έτσι, είναι το απλούστερο μεταξύ των στατιστικών μοντέλων για τη συνοπτική περιγραφή των μετρήσεων. Στο παράδειγμα του σχήματος απεικονίζεται το πλήθος των ατόμων (κατακόρυφος άξονας) τα οποία βοήθησαν κατά τη διάρκεια μιας ημέρας 5 διαφορετικοί βιβλιοθηκονόμοι μιας βιβλιοθήκης (οριζόντιος άξονας). Προκειμένου να αναπαραστήσουμε την ημερήσια εξυπηρέτηση της βιβλιοθήκης, χρησιμοποιούμε το μοντέλο του μέσου βιβλιοθηκονόμου (ο οποίος φυσικά είναι ανύπαρκτος), ο οποίος δύναται να εξυπηρετεί καθημερινά 2.6 άτομα!. Όπως λέγαμε και νωρίτερα, το μοντέλο αυτό πρέπει να ελεγχθεί για την ακρίβειά του. Η ακρίβεια (accuracy) του μοντέλου μέσης τιμής ελέγχεται εξετάζοντας την απόσταση (deviance) κάθε μέτρησης από τη μέση τιμή. Αθροίζοντας τις αποστάσεις των μετρήσεων σχηματίζουμε μια εικόνα για το μέγεθος του συνολικού σφάλματος (ή ανακρίβειας). Συχνά, αθροίζουμε τα τετράγωνα των επιμέρους αποστάσεων (Sum of Squares, SS), προκειμένου να υπερβούμε την αντιστάθμιση από τις αρνητικές επιμέρους αποστάσεις. Ωστόσο, η τιμή του αθροίσματος τετραγώνων εξαρτάται από το πλήθος των μετρήσεων, οπότε για να υπερβούμε το πρόβλημα αυτό πρέπει να κάνουμε μια αναγωγή στο πλήθος των μετρήσεων. Η αναγωγή αυτή εκφράζεται από τη διασπορά ή διακύμανση. Η διασπορά ή διακύμανση (variance) είναι ένα μέγεθος αποτίμησης της ακρίβειας του μοντέλου (προς τα πραγματικά δεδομένα) και υπολογίζεται από τη σχέση s 2 = SS/(N-1). Ωστόσο, επειδή οι μονάδες μέτρησής της είναι τετραγωνισμένες και δεν έχουν φυσική σημασία (π.χ. πώς μπορούν να ερμηνευθούν 1.3 τετραγωνισμένα άτομα ) συχνά χρησιμοποιείται ένα αποτετραγωνισμένο μέγεθος, το οποίο καλείται τυπική απόκλιση (standard deviation ). Η τιμή αυτή εκφράζει τη μέση απόκλιση των καταγεγραμμένων τιμών από την υπολογισμένη μέση τιμή 2.6. Σημειώνεται πως διαφορετικά δείγματα μπορεί να έχουν την ίδια μέση τιμή, όχι όμως την ίδια τυπική απόκλιση. Για το λόγο αυτό η Μάρτιος 2011 σελ. 7/19
τιμή της τυπικής απόκλισης αναγράφεται πάντα δίπλα στην μέση τιμή και ακριβέστερα είναι εκείνα τα μοντέλα μέσης τιμής τα οποία έχουν την μικρότερη τυπική απόκλιση. Η μέση τιμή είναι το απλούστερο μοντέλο το οποίο μπορεί να αναπαραστήσει ένα σύνολο δεδομένων. Τα πάντα στη στατιστική συνοψίζονται στην εξής εξίσωση: Εκτίμηση i = (Μοντέλο) i + σφάλμα i Μάρτιος 2011 σελ. 8/19
Κατανομές συχνοτήτων Έχοντας συλλέξει ένα πλήθος μετρήσεων (καταγραφών) είναι πολύ χρήσιμο να δει κανείς πόσες φορές αποτυπώθηκε κάθε τιμή του μεγέθους που καταγράφηκε. Η πληροφορία αυτή μπορεί να παρουσιαστεί με γραφικό τρόπο (χρησιμοποιώντας ράβδους το ύψος των οποίων είναι ανάλογο της συχνότητας εμφάνισης). Τέτοιου είδους γραφήματα ονομάζονται ιστογράμματα και αποτυπώνουν την κατανομή των συχνοτήτων εμφάνισης των τιμών. Τα γραφήματα αυτά είναι χρήσιμα για την ποιοτική εκτίμηση των ιδιοτήτων της κατανομής συχνοτήτων. Για παράδειγμα, μπορεί κανείς να δει εάν κάποια ή κάποιες τιμές κυριαρχούν (εμφανίζονται πολύ συχνότερα από κάποιες άλλες). Οι τιμές αυτές ονομάζονται ρυθμοί (modes) της κατανομής. Οι μορφές και τα σχήματα των κατανομών μπορούν να ποικίλουν. Για την περιγραφή της διαφοροποίησής τους χρησιμοποιούνται ορισμένα χαρακτηριστικά (ή ιδιότητες) όπως π.χ. η συμμετρία. Ιδανικά, οι μετρήσεις μας θα κατανέμοντας συμμετρικά γύρω από τη μέση τιμή, δημιουργώντας έτσι ένα ιστόγραμμα με μορφή καμπάνας. Αυτού του είδους η κατανομή είναι γνωστή και ως κανονική κατανομή (normal distribution). Οι τιμές οι οποίες βρίσκονται μακρύτερα από τη μέση τιμή (αυτές δηλαδή με τις μεγαλύτερες αποκλίσεις) είναι και αυτές οι οποίες εμφανίζονται λιγότερο συχνά. Μια κατανομή μπορεί να διαφοροποιείται από την κανονική εφ' όσον είναι ασύμμετρη ως προς τη μέση τιμή (skewed) είτε έχει διαφορετική καμπυλότητα (kurtosis). Ασύμμετρες ονομάζονται οι κατανομές στις οποίες η μέση τιμή διαφοροποιείται σημαντικά από τη γεωμετρικά ενδιάμεση τιμή των καταγεγραμμένων τιμών. Η γεωμετρικά ενδιάμεση τιμή (median) υπολογίζεται ως εξής: median = (min + max)/2. Έτσι δημιουργείται μια ουρά (skewness) στην κατανομή. Όταν η ουρά είναι προς την πλευρά των υψηλότερων τιμών, η κατανομή λέγεται πως είναι θετικώς κεκλιμένη (positevely skewed). Στην αντίθετη περίπτωση χαρακτηρίζεται ως αρνητικώς κεκλιμένη Μάρτιος 2011 σελ. 9/19
(negatively skewed). Όσον αφορά στην καμπυλότητα (kurtosis), μια κατανομή μπορεί να είναι αρκετά επίπεδη (platykurtic), δηλαδή μεταξύ των καταγεγραμμένων τιμών δεν παρατηρούνται σημαντικές διαφοροποιήσεις στη συχνότητα εμφάνισης. Αντιστρόφως, μια κατανομή χαρακτηρίζεται ως έντονης καμπυλότητας (leptokurtic) όταν μια ομάδα τιμών (κοντά στην μέση τιμή) εμφανίζει πολύ υψηλή συχνότητα εμφάνισης σε σχέση με το υπόλοιπο σώμα των καταγεγραμμένων τιμών. Οι τιμές ασυμμετρίας (skewness) και καμπυλότητας (kurtosis) υπολογίζονται από εξειδικευμένα λογισμικά. Στην περίπτωση της κανονικής κατανομής είναι αμφότερες μηδενικές. Για να αποφανθούμε με αντικειμενικό τρόπο αν μια κατανομή διαφοροποιείται από την κανονική, χρησιμοποιούμε ένα μαθηματικό έλεγχο (κριτήριο Kolmogorov-Smirnov ή κριτήριο Shapiro-Wilk) για τα οποία θα μιλήσουμε παρακάτω. Μάρτιος 2011 σελ. 10/19
Το παράδειγμα της τυπικής κανονικής κατανομής Οι κατανομές συχνοτήτων είναι σημαντικές επειδή εκφράζουν την πιθανότητα εμφάνισης μιας εκ των καταγεγραμμένων τιμών. Για παράδειγμα, το ιστόγραμμα του σχήματος απεικονίζει τη συχνότητα επίσκεψης σε μια βιβλιοθήκη ατόμων διαφόρων ηλικιακών ομάδων κατά τη διάρκεια μιας εβδομάδας. Καταγράφηκαν συνολικά 171 επισκέψεις και φαίνεται πως οι ηλικίες με τη μεγαλύτερη επισκεψιμότητα ήταν αυτές μεταξύ 25 και 30. Το γράφημα επίσης μας λέει πως πολύ λίγα άτομα ηλικίας άνω των 70 ετών επισκέφθηκαν την βιβλιοθήκη κατά την εβδομάδα καταγραφής. Έχοντας αυτό το ιστορικό καταγραφής (πληροφορία) μπορούμε να κάνουμε προβλέψεις σε ερωτήματα της μορφής: Πόσο πιθανόν είναι να επισκεφθεί τη βιβλιοθήκη την τρέχουσα εβδομάδα ένα άτομο ηλικίας 70 ετών; Κοιτάζοντας το γράφημα μπορεί κανείς να δει πως είναι μάλλον απίθανο αφού την εβδομάδα καταγραφής μόλις 2-3 άτομα (από τα 171) ήταν αυτής της ηλικίας (και θεωρώντας πως δεν συνέβη εν τω μεταξύ κάτι που διαφοροποίησε σημαντικά την κατάσταση). Έαν πάλι το ερώτημα ήταν Πόσο πιθανόν είναι να επισκεφθεί τη βιβλιοθήκη κατά την τρέχουσα εβδομάδα ένα άτομο ηλικίας περίπου 30 ετών; η απάντηση είναι αρκετά πιθανόν αφού 32 από τα 171 άτομα (της εβδομάδας καταγραφής) ήταν αυτής της ηλικίας. Έτσι, χρησιμοποιώντας τις τιμές των συχνοτήτων εμφάνισης μπορούμε να εκτιμήσουμε την πιθανότητα εμφάνισης μιας συγκεκριμένης τιμής (ή ομάδας τιμών). Οι πιθανότητα εμφάνισης αποτιμάται με δεκαδικούς αριθμούς στο διάστημα 0 έως 1. Το μηδέν εκφράζει την αδιαμφισβήτητη πιθανότητα απουσίας εμφάνισης (δεν υπάρχει περίπτωση να προκύψει η συγκεκριμένη τιμή) ενώ το 1 εκφράζει την απόλυτη βεβαιότητα εμφάνισης μιας τιμής. Οι ενδιάμεσες δεκαδικές τιμές εκφράζουν τις ενδιάμεσες καταστάσεις. Για παράδειγμα, εάν η τιμή της πιθανότητας εμφάνισης μια ορισμένης τιμής (π.χ. άτομο ηλικίας 28 ετών) εκτιμηθεί ως 0.13 τότε ισχυριζόμαστε πως υπάρχει 13% πιθανότητα επίσκεψης ενός ατόμου ηλικίας 28 ετών κατά την τρέχουσα εβδομάδα. Ισοδύναμα, από τα πρώτα 100 άτομα τα οποία θα εισέλθουν στην βιβλιοθήκη κατά την τρέχουσα εβδομάδα, 13 αναμένεται να Μάρτιος 2011 σελ. 11/19
είναι ηλικίας 28 ετών. Αναγωγή κανονικής κατανομής στην τυπική κανονική κατανομή Οι τιμές των πιθανοτήτων υπολογίζονται από μαθηματικούς τύπους (ή πίνακες) βάσει της μορφής της κατανομής. Η τυπική κανονική κατανομή είναι μια κατανομή η οποία έχει μέση τιμή μηδέν και τυπική απόκλιση 1. Για την κατανομή αυτή έχουν υπολογιστεί οι πιθανότητες εμφάνισης κάθε τιμής γύρω από τη μέση τιμή. Ωστόσο, σπανίως τα δεδομένα που συλλέγουμε θα έχουν μέση τιμή μηδέν και τυπική απόκλιση 1 (για παράδειγμα ή μέση τιμή μπορεί να είναι 567 και η τυπική απόκλιση 52.98). Όμως κάθε σύνολο δεδομένων Χ μπορεί να μετασχηματιστεί σ' ένα άλλο σύνολο δεδομένων z με μέση τιμή μηδέν και τυπική απόκλιση 1, χρησιμοποιώντας τη σχέση: z= (X- μ)/s Έτσι, η κατανομή αυτή καθίσταται ιδιαίτερα σημαντική, επειδή κάθε άλλη κανονική κατανομή με διαφορετική μέση τιμή και τυπική απόκλιση μπορεί να αναχθεί στην τυπική κανονική κατανομή και κατά συνέπεια να εκτιμηθεί η πιθανότητα εμφάνισης μιας τιμής παραπλήσιας της μέσης τιμής. Παράδειγμα: Ποιά είναι η πιθανότητα να επισκεφθούν τη βιβλιοθήκη την τρέχουσα εβδομάδα άτομα ηλικίας άνω των 60 ετών; Γνωρίζουμε από το ιστορικό καταγραφής πως η μέση τιμή είναι 36 και η τυπική απόκλιση 13. Χρησιμοποιούμε τον τύπο μετασχηματισμού για να βρούμε την ισοδύναμη z τιμή του αριθμού 70. Είναι z(60)= (60-36)/13= 1.84. Ανατρέχοντας στους πίνακες εκτίμησης της πιθανότητας εμφάνισης των τιμών γύρω από τη μέση τιμή μιας τυπικής κανονικής κατανομής, βρίσκουμε πως η πιθανότητα εμφάνισης τιμών μεγαλύτερων από 2.62 είναι p=.0329 ή 3.29%. Αντιστοίχως, βρίσκουμε πως οι πιθανότητα εμφάνισης τιμών μικρότερων από 1.84 (δηλαδή ατόμων με ηλικία μικρότερη από 60 ετών) είναι p=.9671 ή Μάρτιος 2011 σελ. 12/19
96.71% Υπάρχουν ορισμένα όρια τιμών z τα οποία συναντάμε συχνά: πρόκειται για τις τιμές μεταξύ: α) -1.96 και 1.96 τα οποία εκφράζουν πιθανότητα εμφάνισης 95% β) -2.58 και 2.58 τα οποία εκφράζουν πιθανότητα εμφάνισης 99% γ) -3.29 και 3.29 τα οποία εκφράζουν πιθανότητα εμφάνισης 99.9% Μάρτιος 2011 σελ. 13/19
Γραμμικά μοντέλα Γραμμικά μοντέλα ονομάζονται αυτά τα οποία μπορούν να αναπαραστήσουν την εξάρτηση μεταξύ δύο μεγεθών (μεταβλητών) με μια εξίσωση, της οποίας η γραφική απεικόνιση είναι μια γραμμή. Ωστόσο, πρέπει να γίνεται διαχωρισμός με βάση το εάν η γραμμή αυτή είναι ευθεία (πραγματικώς γραμμικά μοντέλα) ή καμπύλη (μη-γραμμικά μοντέλα). Παράδειγμα Ας υποθέσουμε πως ενδιαφερόμαστε να δούμε εάν υπάρχει εξάρτηση (και τι είδους) μεταξύ του πλήθους κεφαλαίων στατιστικής τα οποία διαβάζει κανείς και της συμπάθειας προς τη στατιστική διαβάζοντας τα κεφάλαια αυτά (ως επακόλουθο της ανάγνωσης). Συγκεντρώνουμε ένα δείγμα ατόμων από το οποίο ζητάμε να αναφέρει πόσα κεφάλαια στατιστικής έχει διαβάσει (π.χ. 1, 2,...10) και πώς του φαίνεται η στατιστική, συνεπεία της ανάγνωσης των κεφαλαίων αυτών. Η συμπάθεια αυτή αποτιμάται υποκειμενικά σε μια κλίμακα 0 έως 100. Έχοντας συλλέξει τις μετρήσεις αυτές, τις αποτυπώνουμε σ' ένα διάγραμμα δύο αξόνων. Κάθε σημείο του γραφήματος προσδιορίζεται από τις δύο τιμές κάθε εγγραφής. Το σύνολο αυτό των δεδομένων μπορεί να περιγραφεί από το γραμμικό μοντέλο της μέσης τιμής (κόκκινη γραμμή). Ωστόσο, επειδή παρατηρούμε πως οι τιμές της συμπάθειας προς τη στατιστική δεν παραμένουν σταθερές καθώς αυξάνεται το πλήθος των κεφαλαίων που έχουν διαβαστεί, διαφαίνεται πως το μοντέλο της μέσης τιμής δεν προσεγγίζει ικανοποιητικά τα δεδομένα, με αποτέλεσμα να είναι ανακριβές (όπως ακριβώς το τετράγωνο είναι μια ανακριβής αναπαράσταση ενός κύκλου). Η μπλε διακεκομμένη γραμμή αναπαριστά ένα δεύτερο γραμμικό μοντέλο το οποίο όμως λαμβάνει υπόψιν την τιμή των διαβασμένων κεφαλαίων προκειμένου να προβλέψει το βαθμό συμπάθειας προς τη στατιστική. Παρατηρούμε πως το μοντέλο αυτό περιγράφει καλύτερα τις καταγεγραμμένες μετρήσεις. Οι αποστάσεις δηλαδή των σημείων από το γραμμικό μοντέλο είναι Μάρτιος 2011 σελ. 14/19
μικρότερες και άρα το μοντέλο είναι ακριβέστερο. Όπως διαφαίνεται ένα σύνολο δεδομένων μπορεί να περιγραφεί από περισσότερα από ένα μοντέλα. Ωστόσο, είναι σημαντικό να μπορούμε να αποτιμήσουμε την ακρίβεια προσαρμογής του μοντέλου στα δεδομένα (data fitting) προκειμένου να μπορούμε να καταλήξουμε στο καλύτερο μοντέλο, αυτό δηλαδή με την μεγαλύτερη ερμηνευτική ισχύ και ικανότητα αναπαραγωγής της πραγματικής κατάστασης. Σημειώνεται πως τα δύο μοντέλα του σχήματος είναι αμιγώς γραμμικά, δηλαδή προσεγγίζουν τις καταγεγραμμένες τιμές με ευθείες γραμμές. Ωστόσο, δεν είναι όλα τα μοντέλα αυτής της μορφής. Υπάρχουν και μοντέλα τα οποία είναι μη-γραμμικά δηλαδή αναπαριστούν τα δεδομένα των μετρήσεων με μη-ευθείες γραμμές. Στην περίπτωση αυτή οι γραμμές είναι καμπύλες. Χαρακτηριστικό παράδειγμα είναι το μοντέλο το οποίο περιγράφει τη σχέση μεταξύ ηλικίας και ύψους ενός ανθρώπου. Είναι ενδιαφέρον να σημειωθεί στο χώρο των κοινωνικών/ανθρωπιστικών επιστημών χρησιμοποιούνται κατά κόρο γραμμικά μοντέλα ευθείας γραμμής. Έτσι, τα μοντέλα της οικογένειας αυτής τα οποία προσαρμόζουν ικανοποιητικά ένα σύνολο δεδομένων αναγνωρίζονται ως έγκυρα και δημοσιεύονται. Στην περίπτωση που δεν αναπαριστούν ικανοποιητικά το σύνολο δεδομένων (είναι δηλαδή ανακριβή) τότε απορρίπτονται και μαζί μ' αυτά συνήθως χάνονται και τα δεδομένα. Ωστόσο, πρέπει να διερευνηθεί μήπως μια άλλη οικογένεια μοντέλων (π.χ. μη-γραμμικά) μπορεί να προσεγγίσει καλύτερα το σύνολο των δεδομένων, δίνοντας μια νέα, διαφορετική προοπτική αναπαράστασης η οποία χρήζει δημοσιότητας. Γενικά, η γραφική αναπαράσταση των συσχετίσεων μεταξύ μεταβλητών μπορεί να δώσει μια καλή εικόνα για το είδος της εξάρτησης μεταξύ τους (γραμμική ή όχι) και γι' αυτό προτείνεται ανεπιφύλακτα. Μάρτιος 2011 σελ. 15/19
Πώς μπορούμε να γνωρίζουμε εάν το μοντέλο μας αναπαριστά την πραγματική κατάσταση; Μέχρι στιγμής είδαμε πως για πρακτικούς λόγους συλλέγουμε μετρήσεις από ένα δείγμα του πληθυσμού και όχι από το σύνολο του πληθυσμού. Ωστόσο, πρέπει να βεβαιωθούμε πως το τυπικό σφάλμα (το οποίο οφείλεται στη δειγματοληψία και στα χαρακτηριστικά του δείγματος) παραμένει χαμηλό. Είδαμε επίσης πώς χρησιμοποιείται η μέση τιμή ως μοντέλο αναπαράστασης ενός συνόλου δεδομένων και πώς ελέγχεται η ακρίβεια του μοντέλου αυτού. Όπως αναφέρθηκε παραπάνω, το μοντέλα περιγράφουν εξαρτήσεις μεταξύ δύο (ή περισσότερων) μεταβλητών. Για να δημιουργηθούν τα μοντέλα πρέπει οι εξαρτήσεις αυτές (μεταξύ των μεταβλητών) να εντοπιστούν στον πληθυσμό και να ποσοτικοποιηθούν. Προκειμένου να τις εκφράσουμε ποσοτικοποιήσουμε και να αποφανθούμε για το εάν έχουν κάποια σημασία εργαζόμαστε ως εξής: 1. Διατυπώνουμε μια ερευνητική υπόθεση. Συνήθως διατυπώνουμε μια πρόβλεψη πως υπάρχει κάποιου είδους συσχέτιση (εξάρτιση) μεταξύ των μεταβλητών. 2. Συλλέγουμε μερικά χρήσιμα δεδομένα από ένα επαρκές δείγμα του πληθυσμού με κατάλληλη πειραματική διαδικασία. 3. Προσαρμόζουμε ένα μαθηματικό μοντέλο στα δεδομένα τα οποία συλλέξαμε. Το μοντέλο αυτό θα χρησιμοποιηθεί για τον έλεγχο της πρόβλεψης που διατυπώσαμε. Εάν το μοντέλο δεν κρίνεται επαρκές (δεν ερμηνεύει δηλαδή την καταγεγραμμένη διακύμανση), το τροποποιούμε. 4. Τελικώς, χρησιμοποιούμε το μοντέλο για να ελέγξουμε την εγκυρότητα της πρόβλεψης, δηλαδή της ερευνητικής υπόθεσης που διατυπώσαμε. Ο έλεγχος των ερευνητικών ερωτημάτων (research questions) ανάγεται στον έλεγχο των ερευνητικών υποθέσεων οι οποίες απορρέουν. Μεταξύ των υποθέσεων (προς έλεγχο) υπάρχει η πειραματική υπόθεση (experimental hypothesis), δηλαδή η πρόβλεψη πως λόγω μιας πειραματικής επέμβασης (διαφοροποίησης) σε μια ανεξάρτητη μεταβλητή, μια άλλη μεταβλητή Μάρτιος 2011 σελ. 16/19
(εξαρτημένη) θα επηρεαστεί. Αυτή συχνά ονομάζεται πειραματική υπόθεση. Για παράδειγμα, από τον έλεγχο του ερευνητικού ερωτήματος Σχετίζεται το διάβασμα με τον πονοκέφαλο απορρέει η πειραματική υπόθεση πως Όσο περισσότερο διαβάζει κανείς, με τόσο περισσότερο πονοκέφαλο θα καταλήξει. Το αντίθετο ενδεχόμενο, δηλαδή να μην υπάρχει καμιά επίδραση εκφράζεται από την μηδενική υπόθεση (null hypothesis). Στο παράδειγμά μας, η μηδενική υπόθεση που απορρέει είναι πως Το διάβασμα δεν έχει καμιά επίδραση στην εκδήλωση πονοκεφάλου. Τα δεδομένα της πάνω εικόνας υποδεικνύουν πως το πλήθος των αναγνωσμένων κεφαλαίων ενός βιβλίου ΔΕΝ φαίνεται να συσχετίζεται με την ένταση πονοκεφάλου η οποία καταγράφεται. Δηλαδή, είτε τα διαβασμένα κεφάλαια είναι λίγα (1-2) είτε πολλά (περισσότερα από 4), ο πονοκέφαλος καταγράφεται τόσο σε χαμηλά όσο και σε υψηλά επίπεδα. Δεν διακρίνεται δηλαδή κάποια αυξητική ή άλλου είδους τάση η οποία να υποδηλώνει συσχέτιση (ή εξάρτηση). Όμως στο παράδειγμα της κάτω εικόνας διαφαίνεται ενός είδους εξάρτηση και μάλιστα ανάλογη, δηλαδή καθώς αυξάνεται το πλήθος των αναγνωσμένων κεφαλαίων, αυξάνεται και η ένταση του πονοκεφάλου που καταγράφεται. Στα δεδομένα αυτά μπορούμε να προσαρμόσουμε (δηλαδή να υπολογίσουμε από την ανάλυσή τους) ένα γραμμικό μοντέλο (π.χ. Ένταση = 1*κεφάλαια). Το μοντέλο υποδηλώνει μια γραμμική και ανάλογη εξάρτηση μεταξύ των δύο μεταβλητών. Εφ' όσον έχει γίνει αποδεκτό, τότε μπορούμε ερμηνεύοντάς το να απορρίψουμε τη μηδενική υπόθεση και να αποδεχθούμε την πειραματική. Ερώτηση: Πώς μπορούμε να μετρήσουμε την ένταση του πονοκεφάλου; Απάντηση: α) Περιγραφικά, κατά δήλωση των ατόμων (π.χ. χαμηλή, μέτρια, ισχυρή, πολύ ισχυρή, κλπ) β) Αριθμητικά: π.χ. Καταγράφοντας πόσα γραμμάρια DEPON απαιτούνται προκειμένου ο πονοκέφαλος να υποχωρήσει εντός 15 Μάρτιος 2011 σελ. 17/19
λεπτών. Η μεθοδολογία αυτή συχνά αναφέρεται και ως συμπερασματική στατιστική (inferential statistics), επειδή μας επιτρέπει να εξάγουμε κάποια συμπεράσματα επιβεβαιώνοντας ή απορρίπτοντας τις ερευνητικές υποθέσεις. Φυσικά, δεν μπορούμε να είμαστε απόλυτα σίγουροι για την επαλήθευση ή απόρριψη μιας ερευνητικής υπόθεσης. Ωστόσο, βασιζόμαστε στον υπολογισμό πιθανοτήτων για να εκφράσουμε κατά πόσο είναι πιθανόν τα συμπεράσματα αυτά να προέκυψαν τυχαία ή να αποτυπώνουν την πραγματική κατάσταση. Όσο η πιθανότητα σφάλματος ελαττώνεται τόσο περισσότερο σίγουροι μπορούμε να είμαστε πως τα αποτελέσματα της ανάλυσής μας δεν είναι τυχαίο εύρημα και πως πράγματι περιγράφουν την πραγματική κατάσταση, προσεγγίζουν δηλαδή το πραγματικό μοντέλο. Μάρτιος 2011 σελ. 18/19
Παραπομπές & Βιβλιογραφία Field, A. (2005) Discovering Statistics Using SPSS : and sex, drugs and rock 'n roll, 2 nd ed., Sage Publication StatSoft, Inc. (2011). Electronic Statistics Textbook. Tulsa, OK: StatSoft. WEB: http://www.statsoft.com/textbook/ Spiegel, M. (1975). Πιθανότητες και Στατιστική. Schaum's Outline Series, McGraw-Hill. Μάρτιος 2011 σελ. 19/19