Τι είναι η στατιστική μέθδς Χ² Η Στατιστική είναι η επιστήμη των πιθατήτων. Ο βαθμς τυχαιτητας ενς απτελέσματς πρσδιρίζεται απ την σύγκρι των απτελεσμάτων ενς πειράματς, με πργενέστερα απτελέσματα πυ ήδη έχυν θεωρητική επαλήθευ. Αυτά τα μεία αναφράς είναι γνωστά ως «πίνακες καταμής συχτήτων σε επίπεδα μαντικτητας». Μια παραδσιακή μέθδς εξακρίβως τι τ απτέλεσμα δεν ήταν τυχαί, είναι η επίτευξη τυ μέσυ ρυ μεταξύ τυ απλυτα σωστύ (100%) και τυ εντελώς τυχαίυ (50%). Δηλαδή τιδήπτε δείχνει κάτω απ 75% δηλώνει τι τ απτέλεσμα ενδέχεται να είναι τυχαί. την μέθδ Χί εις τ ω (chi-square) μπρύμε να εξετάσυμε δεκάδες μεταβλητές ταυτχρνα. Πι συγκεκριμένα, στατιστικς έλεγχς με την μέθδ Χ² είναι μια διαδικασία πυ μας επιτρέπει να αξιλγήσυμε αν και κατά πσ υπάρχει αιτιώδης σχέ μεταξύ δύ ή περισστερων μεταβλητών. Ειδικά ταν θέλυμε να γνωρίσυμε αν η υψηλή τιμή μιας μεταβλητής σχετίζεται με μια υψηλή ή χαμηλή τιμή μιας άλλης μεταβλητής. Έτσι χρησιμπιύμε την μέθδ Χ² για να βρύμε τις φυσιλγικές καταμές και για να ανακαλύψυμε αν η ανεξαρτησία ή μη, μεταξύ δύ ή περισστερων μεταβλητών, είναι στατιστικά μαντική ή χι. Η στατιστική δκιμασία Χ² για κάθε μία μεταβλητή, στην υσία εξετάζει αν υπάρχει διαφρά μεταξύ των δεδμένων πυ έχυν συλλεχθεί κατά την διάρκεια της έρευνας (πραγματικές συχντητες) και αυτών πυ θα περιμέναμε να εμφανιστύν αν ίσχυε η μηδενική υπθε (αναμενμενες συχντητες). Αυτ στην πράξη μαίνει τι, αν ι Πραγματικές συχντητες είναι τυχαίες, θα πρέπει να πλησιάζυν αρκετά τις Αναμενμενες συχντητες. απλά λγια, τ Χ² αντανακλά τ μέγεθς των διαφρών μεταξύ των Πραγματικών συχτήτων και των Αναμενμενων συχτήτων. Όσ μεγαλύτερη είναι αυτή η διαφρά, τσ πιθαντερ είναι να πρκύψει στατιστικώς μαντικ απτέλεσμα. Κντλγίς, υπλγισμς τυ Χ² στηρίζεται στην μέτρη της διαφράς μεταξύ Παρατηρύμενων Τιμών Συχτήτων και Αναμενμενων Τιμών Συχτήτων. Και με απλά λγια η συνάρτη είναι Χ²= (Π-Α)² /Α Πως υπλγίζυμε τ Χ² Ας υπθέσυμε τι έχυμε 100 μφυλφιλυς άνδρες ασθενείς με AIDS πυ απεβίωσαν λγω αυτής της ασθένειας. Και ας υπθέσυμε τι έχυμε 100 περίπυ συμηλίκυς (άνδρες και γυναίκες) απ τν γενικ πληθυσμ, τυς πίυς γνωρίζυμε πρσωπικά και είμαστε βέβαιι τι δεν έχυν AIDS ύτε σεξυαλικές παρεκκλίσεις, είναι καλά στην υγεία τυς, γι' αυτ θα τυς χρησιμπιήσυμε ως δείγμα ελέγχυ στην έρευνά μας. Ας υπθέσυμε επίς τι στα ωρσκπια των 100 μφυλφιλων ανδρών πυ ασθένησαν και απεβίωσαν απ AIDS βρήκαμε να ξεχωρίζει η γενεθλιακή Αφρδίτη σε με Πλύτωνα 10 φρές, ενώ στ δείγμα ελέγχυ 4 φρές. Τα ύμερα αυτά μπρεί να φαίνται μικρά αλλά δεν είναι. Και εξηγύμαι: στην παραδσιακή αστρλγία εξετάζυμε συλικά 640 πιθαύς γεωκεντρικύς συνδυασμύς, εκ των πίων ι 222 συνδυασμί είναι ψεις. Πι συγκεκριμένα, έχυμε ΠΕΝΤΕ κύριες ψεις (Σύδ,, ω,, ), ΕΠΙ ΔΥΟ ωριαία μεία (Ωρσκπ, συράνημα), ΕΠΙ ΔΕΚΑ πλανήτες (Ήλι, Σελήνη, Ερμή, Αφρδίτη, Άρη, Δία, Κρ, Ουραν, Πσειδώνα, Πλύτωνα) =222 πιθαύς γεωκεντρικύς συνδυασμύς ψεων. Τσ είναι τ πλήθς των ψεων, αλλά σε ένα ωρσκπι πτέ δεν θα συμβύν ταυτχρνα λι ι συνδυασμί. Καταλαβαίνετε μως τι, αφύ έχυμε πάντα 222 πιθαύς συνδυασμύς ψεων, σε ένα τσ μικρ δείγμα έρευνας -μνάχα 100 περιπτώσεων-, αν μια ψη επαναληφθεί 10 φρές, θα πρέπει να την αντιμετωπίζυμε ως μαντική. Αλλά χάρη παραδείγματς τετραπλασιάζω την αναλγία κι έτσι θα έχυμε 16 πρς 40. Ο σκπς μας είναι να μάθυμε αν η γενεθλιακή Αφρδίτη σε με Πλύτωνα είναι ψη
στατιστικά μαντική, ή αν αυτές ι δύ μεταβλητές είναι ανεξάρτητες. Αν ι πιθαντητες δείξυν πως είναι ανεξάρτητες, ττε θα πρέπει να είναι περίπυ ίδι τ πλήθς των ατμων σε κάθε κελί τυ παρακάτω πίνακα. Εάν στην μέτρη φανεί τι Πραγματικς αριθμς είναι πλύ διαφρετικς, ττε σχετίζνται ι δύ μεταβλητές. Για να τα συγκεκριμεπιήσυμε λα αυτά, θα χρειαστεί να τα τπθετήσυμε σε ένα πίνακα: αυτή την ψη αυτή την ψη Σύλ Aids 40 60 100 Normal 16 84 100 Σύλ 56 144 200 Στν πίνακα βλέπυμε τι η λική πιθαντητα να έχει κάπις AIDS είναι 100 / 200 =0,5 Η λική πιθαντητα να έχει γενεθλιακή Αφρδίτη Πλύτωνα είναι 56 / 200 =0,28 Η διπλή πιθαντητα να έχει κάπις AIDS και την ανωτέρω ψη, είναι 0,5x0,28 =0,14 Συνεπώς η Αναμενμενη τιμή είναι 0,14x200 =28 Ένας πι γρήγρς και εύκλς τρπς υπλγισμύ των Αναμενμενων τιμών για κάθε κελί τυ πίνακα, είναι να πλλαπλασιάσυμε την συλική ριζντια γραμμή με τ σύλ της κάθετης στήλης, και στην συνέχεια τα διαιρύμε με τ τελικ σύλ. Έτσι, η Αναμενμενη τιμή για τ πρώτ κελί AIDS είναι (100x56) / 200 =28, για τ δεύτερ κελί AIDS είναι (100x144) /200 =72, για τ πρώτ κελί Normal είναι (56x100) /200 =28, και για τ δεύτερ κελί Normal είναι (144x100) /200 =72 (τα ύμερα δείχυν να επαναλαμβάνται επειδή εξετάζυμε ακριβώς 100 άτμα απ κάθε μάδα). Όλα αυτά θα τα αντιληφθύμε καλύτερα αν τα τπθετήσυμε εκ νέυ μέσα στν πίνακα, ως εξής: αυτή την ψη αυτή την ψη Σύλ Aids 40 (28) 60 (72) 100 Normal 16 (28) 84 (72) 100 Σύλ 56 144 200 Ο παρακάτω τύπς περιγράφει μια ακμη λειτυργία πυ φείλυμε να εκτελέσυμε σε κάθε κελί, για να βρύμε έναν νέ αριθμ. Όταν λι ι νέι αριθμί αθριστύν, τ απτέλεσμα πυ πρκύπτει θα μας φανερώσει την αντίστρφη πιθαντητα Χ² ως εξής: Χ² = (40-28)² /28 + (60-72)² /72 + (16-28)² /28 + (84-72)² /72 = 5,14+2+5,14+2 =14,28 Σε γενικές γραμμές, σ πι μεγάλς πρκύπτει τελικς αριθμς της αντίστρφης πιθαντητας Χ² ι Αναμενμενες τιμές είναι πλύ διαφρετικές απ τις Πραγματικές τιμές, και συνεπώς, τσ πιθαντερ είναι ι μεταβλητές πυ εξετάσαμε να μην είναι τυχαίες, αλλά να συνδένται. Τ Χ² έχει βαθμύς ελευθερίας, τύπς της πίας είναι (αριθμς γραμμών -1) x (αριθμς στηλών -1) πυ στ παράδειγμα τ πί σας έδειξα είναι (2-1) x (2-1) = 1x1 = 1 βαθμς ελευθερίας. Έτσι κιτάμε τν ακλυθ πίνακα. ΕΝΑ ΑΠΟΤΕΛΕΣΜΑ ΑΠΟ ΤΗΝ ΔΕΥΤΕΡΗ ΣΤΗΛΗ 0,1 ΚΑΙ ΠΕΡΑ, ΑΡΧΙΖΕΙ ΝΑ ΘΕΩΡΕΙΤΑΙ ΟΛΟΕΝΑ ΠΙΟ ΔΥΣΚΟΛΑ ΑΜΦΙΣΒΗΤΗΣΙΜΟ. Οπτε με αντίστρφη πιθαντητα Χ² =14,28 και ΕΝΑ βαθμ ελευθερίας, βλέπυμε την τελευταία στήλη 0,001 σε επίπεδ μαντικτητας, πυ μαίνει τι μπρύμε να απρρίψυμε την μηδενική
υπθε. άλλα λγια, δείχνει να είναι στατιστικά μαντική η γενεθλιακή ψη Αφρδίτης Πλύτωνα στυς μφυλφιλυς άνδρες πυ απεβίωσαν απ AIDS, και μπρύμε να την υιθετήσυμε ως δείκτη αστρλγικής πρδιάθες για τέτιες περιπτώσεις. Πίνακας καταμής συχτήτων με επίπεδα μαντικτητας: Τέλς, για συς ενδιαφέρει, σε ένα άλλ πείραμα πυ έκανα μεταγενέστερα, με πλύ μεγαλύτερ δείγμα, εξετάζντας μ τν γενικ πληθυσμ (ετερφυλφιλυς άνδρες και γυναίκες), εμφανίστηκε η γενεθλιακή ψη Ερμής ω Πλύτωνα ως στατιστικά μαντική στην πρδιάθε για AIDS. Παράδειγμα με πλλές μεταβλητές Χ² Έστω τι έχυμε 6.418 σεισμύς απ 4R και άνω, πυ έχυν συμβεί εντς 50 ετών στν ελλαδικ χώρ, και θέλυμε να δύμε αν στα ωρσκπιά τυς, ι ψεις μεταξύ Άρη Ουραύ είναι
στατιστικά μαντικές ή χι. Για να τ διερευνήσυμε παίρυμε άλλα 6.418 εντελώς τυχαία ελληνικά ωρσκπια, σε άλλες χρνιές, ώρες και ημερμηνίες, διεσπαρμένα κατά μισ αιώνα πίσω. Αυτ είναι τ δείγμα ελέγχυ. Ταξινμη Πραγματικών Τιμών Όψεις Άρη - Ουραν ύ Σεισμ ί Δείγμα τα Σύλ Σύδ Σύδ ω ω 37 6381 35 6383 52 6366 70 6348 64 6354 40 6378 26 6392 21 6397 6418 43 6375 30 6388 52 6366 126 6292 57 6361 45 6373 38 6380 47 6371 6418 80 12756 65 12771 104 12732 196 12640 121 12715 85 12751 64 12772 68 12768 12836 Για να υπλγίσυμε εύκλα και γρήγρα τις Αναμενμενες τιμές για κάθε κελί αυτύ τυ πίνακα, πλλαπλασιάζυμε την συλική ριζντια γραμμή με τ σύλ της κάθετης στήλης, και στην συνέχεια την διαιρύμε με τ γενικ σύλ. Ας πάρυμε πρώτα τυς σεισμύς: για την Σύδ έχυμε (6418x80) / 12836 =40 χωρίς ψη Συνδυ έχυμε (6418x12756) /12836 =6378 Ας πάρυμε τώρα τα δείγματα: με ψη Συνδυ έχυμε (6418x80) / 12836 =40 χωρίς ψη Συνδυ έχυμε (6418x12756) /12836 =6378 ΟΙ ΑΝΑΜΕΝΟΜΕΝΕΣ ΤΙΜΕΣ ΠΑΝΤΑ ΕΜΦΑΝΙΖΟΝΤΑΙ ΙΔΙΕΣ ΟΤΑΝ ΕΧΟΥΜΕ ΙΣΑΡΙΘΜΟ ΠΛΗΘΟΣ ΔΕΙΓΜΑΤΟΣ Επαναλαμβάυμε την ίδια διαδικασία για λες τις υπλιπες ψεις και μη ψεις, τσ για τυς σεισμύς, σ και για τα δείγματα, και τα απτελέσματα πυ βρίσκυμε είναι ι Αναμενμενες τιμές τις πίες τπθετύμε μέσα σε ένα νέ πίνακα για να έχυμε καθαρή εικνα, ως εξής: Όψεις Άρη - Ουραν ύ Σεισμ ί Δείγμα τα Σύλ Σύδ Σύδ ω Ταξινμη Αναμενμενων Τιμών ω 40 6378 32,5 6385,5 52 6366 98 6320 60,5 6357,5 42,5 6375,5 32 6386 34 6384 6418 40 6378 32,5 6385,5 52 6366 98 6320 60,5 6357,5 42,5 6375,5 32 6386 34 6384 6418 80 12756 65 12771 104 12732 196 12640 121 12715 85 12751 64 12772 68 12768 12836 Τώρα πυ έχυμε βρει λες τις Πραγματικές τιμές και λες τις Αναμενμενες τιμές, εκτελύμε τν παρακάτω τύπ συγκρίντας τα 32 κελιά για να βρύμε τις τελικές τιμές, ως εξής: 37-40)² /40=0,225 + (6381-6378)² /6378=0,0014 + (35-32,5)² /32,5=0,19 + (6383-6385,5)² /6385,5=0,0009 + (52-52)² /52=0 + (6366-6366)² /6366=0 + (70-98)² /98=8 + (6348-6320)² /6320=0,124 + (64-60,5)² /60,5=0,202 + (6354-6357,5)² /6357,5=0,0019 + (40-42,5)² /42,5=0,147 + (6378-6375,5)² /6375,5=0,00098 + (26-32)² /32=1,125 + (6392-6386)² /6386=0,0056 + (21-34)² /34=4,97 + (6397-6384)² /6384=0,026 + (43-40)² /40=0,225 + (6375-6378)² /6378=0,0014 + (30-32,5)² /32,5=0,19 + (6388-6385,5)² /6385,5=0,00097 + (52-52)² /52=0 + (6366-6366)² /6366=0 + (126-98)² /98=8 + (6292-6320)² /6320=0,124 + (57-60,5)² /60,5=0,202 + (6361-6357,5)² /6357,5=0,0019 + (45-42,5)² /42,5=0,147 + (6373-6375,5)² /6375,5=0,00098 + (38-32)² /32=1,125 + (6380-6386)² /6386=0,0056 + (47-34)² /34=4,97 + (6371-6384)² /6384 =0,026 45 45 Άρα τ αντίστρφ Χ² ισύται με τ άθρισμα λων αυτών, πυ είναι αριθμς 30 Στ παράδειγμα πυ κάναμε ι βαθμί ελευθερίας είναι (αριθμς γραμμών -1) x (αριθμς στηλών - 1) δηλαδή (2-1) x (16-1) = 1x15 = 15 βαθμί ελευθερίας. Έτσι κιτάζυμε ξανά τν πίνακα μαντικτητας με αντίστρφη πιθαντητα Χ² =30 και ΔΕΚΑΠΕΝΤΕ βαθμύς ελευθερίας, πτε 45 45 Σύλ Σύλ
βλέπυμε την 5η στήλη 0,10 πυ μαίνει τι μπρύμε να απρρίψυμε την μηδενική υπθε, αφύ η στατιστική επιβεβαιώνει τι είναι μαντικές ι ψεις τυ Άρη με τν Ουραν κατά την εκδήλω σεισμών. Αλλά χι λες. Μ αυτές πυ έδωσαν υψηλές Αναμενμενες τιμές, πως τ (120 μίρες) και τ Ενάμισι ω (135 μίρες). Διρθω YATES Την διρθω Γέιτς (Yates' correction) πρέπει να την κάυμε ταν τ δείγμα μας είναι μικρ, γύρω στις 50 περιπτώσεις, και έχυμε μ έναν βαθμ ελευθερίας. Η διρθω Γέιτς υπλγίζεται σύμφωνα με τν τύπ X²= ([Π-Α]-0,5)² /Α απλά λγια μαίνει τι, η διαφρά μεταξύ Πραγματικής συχντητας και Αναμενμενης συχντητας για κάθε κελί μειώνεται κατά 0,5 πρτύ υψωθεί εις τ ω. Αυτ έχει ως απτέλεσμα μικρτερη τιμή τυ Χ² και κατά συνέπεια, μικρτερες πιθαντητες σφάλματς. Περισστερα μπρείτε να δείτε στ μεγάλ αρχεί της ανάλυς των απτελεσμάτων (My_Results.xls) Michael Vrontakis