Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 17 ου Πανελληνίου Συνεδρίου Στατιστικής (004), σελ. 307-315 ΚΑΘΟΡΙΣΜΟΣ ΜΕΓΕΘΟΥΣ ΕΙΓΜΑΤΟΣ ΣΤΗΝ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΑΝΤΙΣΤΟΙΧΙΩΝ (AFC) Γεώργιος Μενεξές, Γιάννης Παπαδηµητρίου Τµήµα Εφαρµοσµένης Πληροφορικής, Πανεπιστήµιο Μακεδονίας ΠΕΡΙΛΗΨΗ Η Παραγοντική Ανάλυση των Αντιστοιχιών (AFC) µπορεί να θεωρηθεί, κυρίως, ως µία περιγραφική µέθοδος διερεύνησης της σχέσης δύο ή περισσότερων κατηγορικών µεταβλητών. Στην περίπτωση δύο µεταβλητών, όπου η συλλογή των αντίστοιχων δεδοµένων έχει γίνει µε απλή τυχαία δειγµατοληψία, η στατιστική σηµαντικότητα της αδράνειας του πίνακα συµπτώσεων µπορεί να ελεγχθεί µέσω της χ κατανοµής. Στην παρούσα εργασία, θεωρούµε την αδράνεια ως ένα δείκτη ολικού µεγέθους του αποτελέσµατος και µε βάση αυτή µπορούµε να υπολογίσουµε την παρατηρούµενη ισχύ του στατιστικού ελέγχου ανεξαρτησίας χ. Εισάγουµε την έννοια της «δυναµικής αδράνειας» ενός πίνακα συµπτώσεων δύο µεταβλητών και προτείνουµε µεθοδολογία για την a priori και post-hoc Ανάλυση Ισχύος του στατιστικού ελέγχου χ χρησιµοποιώντας την τετραγωνική ρίζα της αδράνειας και τη δυναµική αδράνεια ως δείκτες µεγέθους του αποτελέσµατος. Με την µεθοδολογία που προτείνουµε είναι δυνατή η εκτίµηση του ελάχιστου απαιτούµενου µεγέθους δείγµατος σε δειγµατοληπτική ή πειραµατική έρευνα, όπου στα δεδοµένα θα εφαρµοστεί η AFC. ΕΙΣΑΓΩΓΗ Η AFC (Benzécri 199, Greenacre 1993, Gifi 1996) θεωρείται, κυρίως, ως µία περιγραφική µέθοδος διερεύνησης της σχέσης δύο ή περισσότερων κατηγορικών µεταβλητών. Χαρακτηριστικό της µεθόδου είναι ότι τα δεδοµένα ενός δείγµατος αντιµετωπίζονται σαν να αποτελούν ολόκληρο τον υπό εξέταση πληθυσµό. Όµως, στην περίπτωση δύο µεταβλητών, όπου η συλλογή των αντίστοιχων δεδοµένων έχει γίνει µε απλή τυχαία δειγµατοληψία, η στατιστική σηµαντικότητα της αδράνειας I F του αντίστοιχου πίνακα συµπτώσεων απολύτων συχνοτήτων F µπορεί να ελεγχθεί µέσω της χ κατανοµής (Lebart et al., 000). Έτσι, πολλοί συγγραφείς (Weller & Romney 1990, Greenacre 1993, Van de Geer 1993, 307
Clausen 1998) συνδυάζουν την εφαρµογή της AFC µε τον έλεγχο ανεξαρτησίας χ. Είναι γνωστό ότι η I F εκφράζει µια γενικευµένη διασπορά και, πιο συγκεκριµένα, το σταθµισµένο µέσο όρο των τετραγώνων των χ αποστάσεων των προφίλ γραµµών (ή ισοδύναµα των προφίλ των στηλών) από το κέντρο βάρους τους (βλέπε Greenacre, 1993). Υπολογιστικά, όµως, η I F δίνεται και από την παρακάτω σχέση (Blasius & Greenacre, 1994): Q I F =, [1] n όπου Q είναι το στατιστικό χ που υπολογίζεται από τον F και n το γενικό σύνολο του F, δηλαδή το µέγεθος του δείγµατος. Κατά παράδοση, ο στατιστικός έλεγχος υποθέσεων στην επιστηµονική έρευνα έχει να επιδείξει µια σαφή προτίµηση στη χρησιµοποίηση της στατιστικής σηµαντικότητας ως κριτηρίου απόρριψης ή όχι της µηδενικής υπόθεσης H 0 (Τσάντας κ.ά., 1999) µε αποτέλεσµα να δοθεί µεγαλύτερη έµφαση στον έλεγχο και στη διαχείριση του Σφάλµατος Τύπου Ι. Όµως, τα τελευταία χρόνια, και ιδιαίτερα µετά τις εργασίες του Cohen (196, 1965, 1988) σχετικά µε την Ανάλυση Ισχύος (Α.Ι.) των στατιστικών ελέγχων στις Επιστήµες της Συµπεριφοράς, η προσοχή των ερευνητών αρχίζει να στρέφεται και στον έλεγχο του Σφάλµατος Τύπου ΙΙ και στην αναγκαιότητα ανάλυσης της ισχύος των στατιστικών ελέγχων (Cohen 1988, Murphy & Myors 1998). Σε πρακτικό επίπεδο η Α.Ι., µεταξύ άλλων, µπορεί να απαντήσει στα δύο παρακάτω βασικά ερωτήµατα: α) Ποιο είναι το ελάχιστο µέγεθος δείγµατος n ώστε, σε επίπεδο σηµαντικότητας α και για επίπεδο ισχύος γ, ο στατιστικός έλεγχος που θα εφαρµοστεί να διαγνώσει ως στατιστικά σηµαντικό ένα µέγεθος αποτελέσµατος (Effect Size-E.S.) d; Στην περίπτωση αυτή, το d, π.χ. 0,0, αποτελεί µια εκτίµηση του µικρότερου E.S. που έχει πρακτική ή κλινική σηµαντικότητα για τον ερευνητή και έχει αξία να ανιχνευθεί ως στατιστικά σηµαντικό. Το E.S. µπορεί να οριστεί γενικά ως η έκταση ή η ένταση του υπό εξέταση φαινοµένου (Cohen & Cohen, 1983). Από στατιστική σκοπιά, το E.S. µπορεί να θεωρηθεί ως ο βαθµός απόκλισης του παρατηρούµενου αποτελέσµατος, όπως αυτό δηλώνεται στην εναλλακτική υπόθεση Η 1, από το αποτέλεσµα που δηλώνεται κάτω από την ορθότητα της Η 0 (Kramer & Rosental, 1999). Η λειτουργικότητα του E.S., µέσα στο πλαίσιο της Α.Ι., έγκειται στο γεγονός ότι είναι συνήθως καθαρός αριθµός, απαλλαγµένος από µονάδες µέτρησης, και κυρίως ανεξάρτητος από το µέγεθος του δείγµατος (Cohen, 1988). Στην συγκεκριµένη περίπτωση, η ένταση της σχέσης δύο κατηγορικών µεταβλητών, όπως αυτή εκφράζεται µέσω του στατιστικού Q δεν είναι ανεξάρτητη από το µέγεθος δείγµατος και εποµένως δε µπορεί να χρησιµοποιηθεί ως δείκτης E.S.. Το µέγεθος αποτελέσµατος E.S. µπορεί να µετρηθεί µε δύο τρόπους (Cohen 1988, Kramer & Rosental 1999, Murphy & Myors 1998): α) ως διαφορά µέσων όρων ή ποσοστών, τυποποιηµένη ή µη (π.χ. Cohen's d, Hedges's g, Glass's delta), ή β) ως συντελεστής συσχέτισης - συνάφειας ή συνάρτήσης του (π.χ. r, r, η, ω, φ). Ουσιαστικά το E.S. προκαθορίζεται από τον ερευνητή, που σχεδιάζει τη µελέτη, κάτω από «ενδιαφέρουσες» εναλλακτικές υποθέσεις. β) οθέντος του µεγέθους δείγµατος n, του επιπέδου σηµαντικότητας α και του παρατηρούµενου E.S., ποια είναι ισχύς γ του στατιστικού ελέγχου; 308
Η απάντηση στο ερώτηµα α) αποτελεί την a priori προσέγγιση στην ανάλυση ισχύος ενώ η απάντηση στο ερώτηµα β) την post-hoc. Μέσα στο πλαίσιο της Α.Ι. των στατιστικών ελέγχων, που προτείνει ο Cohen (1988), είναι δυνατός και ο a priori υπολογισµός του ελάχιστου απαιτούµενου µεγέθους δείγµατος, ώστε ο στατιστικός έλεγχος ανεξαρτησίας χ δύο κατηγορικών µεταβλητών, σε επίπεδο σηµαντικότητας α, µε ισχύ γ, να ανιχνεύσει ένα προκαθορισµένο, από τον ερευνητή, E.S. ως στατιστικά σηµαντικό. Το θέµα της Α.Ι. του στατιστικού ελέγχου χ έχει απασχολήσει και άλλους ερευνητές (Meng & Chapman 1966, Nathan 197, Guenther 1977, Lachin 1977). Οι µεθοδολογίες που προτείνουν φαίνεται να λύνουν τοπικά το πρόβληµα (π.χ. για συγκεκριµένα δειγµατοληπτικά ή πειραµατικά σχέδια και συγκεκριµένες εναλλακτικές υποθέσεις) και όχι µέσα σε ένα γενικό µεθοδολογικό πλαίσιο, όπως η πρόταση του Cohen, η οποία, επιπλέον, όπως θα δειχθεί στη συνέχεια, επιτρέπει τη σύνδεση της Α.Ι. µε την αδράνεια του πίνακα συµπτώσεων απολύτων συχνοτήτων δύο κατηγορικών µεταβλητών. Στην παρούσα εργασία, θεωρούµε την αδράνεια ως ένα δείκτη ολικού µεγέθους του αποτελέσµατος και µε βάση αυτή υπολογίζουµε την παρατηρούµενη ισχύ (observed power) του στατιστικού ελέγχου ανεξαρτησίας χ. Εισάγουµε την έννοια της «δυναµικής αδράνειας» ενός πίνακα συµπτώσεων δύο κατηγορικών µεταβλητών και προτείνουµε µεθοδολογία για την a priori και post-hoc Α.Ι. του στατιστικού ελέγχου χ χρησιµοποιώντας την τετραγωνική ρίζα της αδράνειας και τη δυναµική αδράνεια ως δείκτες µεγέθους του αποτελέσµατος. Με την µεθοδολογία που προτείνουµε είναι δυνατή η εκτίµηση του ελάχιστου απαιτούµενου µεγέθους δείγµατος σε δειγµατοληπτική ή πειραµατική έρευνα, όπου στα δεδοµένα θα εφαρµοστεί η AFC. ΑΝΑΛΥΣΗ ΙΣΧΥΟΣ ΚΑΤΑ COHEN ΣΕ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ ΥΟ ΜΕΤΑΒΛΗΤΩΝ Έστω F ο πίνακας συµπτώσεων απολύτων συχνοτήτων δύο κατηγορικών µεταβλητών Χ και Υ µε k και l κλάσεις (κατηγορίες) αντίστοιχα. Το γενικό στοιχείο του πίνακα F είναι f ij µε i=1,,k και j=1,,l. Έστω, επίσης, ότι ισχύουν οι προϋποθέσεις εφαρµογής του στατιστικού ελέγχου ανεξαρτησίας χ. Τότε ο στατιστικός έλεγχος που πραγµατοποιείται είναι ο παρακάτω: H 0 : Οι Χ και Υ είναι ανεξάρτητες vs Ha: όχι H 0 σε επίπεδο σηµαντικότητας α Η H 0 απορρίπτεται αν Q > χ, όπου Q είναι το στατιστικό χ που αντιστοιχεί α στον πίνακα F και χ η κρίσιµη τιµή της χ κατανοµής σε επίπεδο α σηµαντικότητας α και (k-1)(l-1) βαθµούς ελευθερίας (β.ε.). Παρατήρηση 1: Αν H 0 είναι αληθής τότε το Q ακολουθεί ασυµπτωτικά την κατανοµή χ µε (k-1)(l-1) β.ε. Αν, όµως, η Ha είναι αληθής τότε το Q ακολουθεί οριακά τη µη κεντρική χ κατανοµή, µε παράµετρο µη κεντρικότητας ή εκκεντρότητας λ και (k-1)(l-1) β.ε. (Cochran 195, Chapman & Nam 1968, Lachin 1977, Guenther 1977). Γενικά, για την παράµετρο λ ισχύει (Lachin, 1977): 309
λ=nf(θ 0, θ a ) [] όπου n είναι το µέγεθος δείγµατος και f η συνάρτηση των διανυσµάτων των παραµέτρων θ 0 και θ a που εµπλέκονται στο στατιστικό έλεγχο χ κάτω από την ισχύ των H 0 και Ha αντίστοιχα. Από µια άλλη σκοπιά, η f µπορεί να θεωρηθεί ως ο βαθµός απόκλισης του παρατηρούµενου αποτελέσµατος από την κατάσταση που δηλώνεται µέσω της H 0 και συνεπώς αποτελεί συνάρτηση του αντίστοιχου E.S. του στατιστικού ελέγχου. Από την [] προκύπτει: n=λ / f(θ 0, θ a ) [3] Συνεπώς, αν εκτιµηθεί η παράµετρος λ και το αντίστοιχο E.S. τότε από τη σχέση [3] µπορεί να υπολογιστεί το ελάχιστο µέγεθος δείγµατος που απαιτείται ώστε, σε επίπεδο σηµαντικότητας α και για επίπεδο ισχύος γ, ο στατιστικός έλεγχος χ να διαγνώσει ως στατιστικά σηµαντικό το αντίστοιχο E.S.. Στα παρακάτω, για λόγους οικονοµίας, πολλά από τα βήµατα των αποδείξεων παραλείπονται. Post-hoc Ανάλυση Ισχύος. Λαµβάνοντας υπόψη την Παρατήρηση 1, το παρατηρούµενο Σφάλµα Τύπου ΙΙ β obs υπολογίζεται ως εξής: = ( ) < < β obs = P Q χ / Ha αληϑης P χ λ χ, [4] ( k 1 )( l 1 );a nc( k 1 )( l 1 ) ( k 1 )( l 1 ); a λ είναι η τιµή της µη κεντρικής χ κατανοµής µε παράµετρο λ και (k- χ nc l 1) όπου ( ) 1)(l-1) β.ε.. Η παρατηρούµενη ισχύς γ obs του ελέγχου χ δίνεται από την παρακάτω σχέση: γ = = ( ) obs 1 β obs P χ λ χ [5] nc( k 1)( l 1) a Για τον υπολογισµό της γ obs θα πρέπει να εκτιµηθεί η παράµετρος λ. Σύµφωνα µε τον Cohen (1988) ισχύει: λ=nw, [6] όπου n είναι το µέγεθος του δείγµατος και w µια εκτίµηση του E.S. όπως ορίζεται από τον Cohen για τον έλεγχο ανεξαρτησίας χ δύο µεταβλητών. Το E.S. w εκτιµάται γενικά από την παρακάτω σχέση: kl ( ) = p1 i p0i w, [7] i p0i όπου p 1i και p 0i είναι οι σχετικές συχνότητες του κελιού i του πίνακα συµπτώσεων κάτω από την ισχύ των H 0 και Ha αντίστοιχα. Στην συγκεκριµένη περίπτωση του πίνακα F µπορεί να δειχθεί ότι: w = I F [8] και λ=q [9] 310
Συνεπώς η παρατηρούµενη ισχύς του ελέγχου ανεξαρτησίας χ θα δίνεται από την παρακάτω σχέση: γ = ( ) obs P χ ni χ = ( 1)( 1) F P ( ) χ Q χ [10] nc k l a nc l 1) a Στην πράξη ο αριθµητικός υπολογισµός της [10] γίνεται µε τη βοήθεια πινάκων της µη κεντρικής χ κατανοµής (Haynam et al., 1970) ή τη χρήση λογισµικών όπως το SAS και το SPSS που διαθέτουν ειδικές συναρτήσεις για τους σχετικούς υπολογισµούς. A priori Ανάλυση Ισχύος. Από τις σχέσεις [3], [6] και [8] είναι δυνατός ο a priori υπολογισµός του ελάχιστου απαιτούµενου µεγέθους δείγµατος όταν είναι γνωστή µια εκτίµηση της παραµέτρου λ και του E.S. w. Στην περίπτωση αυτή, το µέγεθος του δείγµατος δίνεται από την παρακάτω σχέση: λ λ n = w = [11] I F Για τη χ κατανοµή, οι τιµές της παραµέτρου λ (α, β, u) που αντιστοιχούν σε ισχύ γ=1-β και σε επίπεδο σηµαντικότητας α, µε u βαθµούς ελευθερίας, υπάρχουν σε πίνακες (Haynam et al. 1970, Pearson & Hartley 197) ή υπολογίζονται µε τη βοήθεια λογισµικών. Το πρόβληµα είναι να προκαθοριστεί µια εκτίµηση του w ή της I F που να έχει κλινική ή πρακτική σηµαντικότητα για τον ερευνητή στο πλαίσιο της µελέτης που πρόκειται να πραγµατοποιηθεί. ΠΡΟΚΑΘΟΡΙΣΜΟΣ ΤΟΥ E.S. Ο προκαθορισµός του w ή της I F µπορεί να επιτευχθεί είτε από πιλοτικές έρευνες είτε από µετα-αναλύσεις προηγούµενων συγκρίσιµων ερευνών στο ίδιο ερευνητικό αντικείµενο. Επίσης, µπορούν να χρησιµοποιηθούν οι συµβάσεις κατά Cohen σχετικά µε το τι µπορεί να θεωρηθεί ως «µικρό», «µεσαίο» και «µεγάλο» µέγεθος του αποτελέσµατος στο πλαίσιο του στατιστικού ελέγχου χ (βλέπε τον παρακάτω πίνακα). Συµβάσεις κατά Cohen και αντιστοιχία µεταξύ w και I F Μικρό E.S. Μέτριο E.S. Μεγάλο E.S. w=0,10 w=0,30 w=0,50 I F =0,01 I F =0,09 I F =0,5 Πιο ενδιαφέρουσα φαίνεται να είναι η σύνδεση του w ή της I F µε δείκτες συνάφειας που βασίζονται στο στατιστικό Q. ύο είναι οι βασικοί λόγοι που οδηγούν στην παραπάνω πρόταση: α) Οι δείκτες αυτοί µπορούν να υπολογιστούν σχετικά εύκολα από δηµοσιευµένα αποτελέσµατα αντίστοιχων ερευνών και β) εκφράζουν την ένταση ή το βαθµό της συνάφειας µεταξύ των µεταβλητών σε µια κλίµακα από 0 έως µια µέγιστη τιµή 1. Ένας από τους πιο συχνά χρησιµοποιούµενους δείκτες συνάφειας για πίνακες συµπτώσεων δύο µεταβλητών είναι ο δείκτης Cramer s V. Ο δείκτης Cramer s V δίνεται από τη σχέση: Q V =, [1] ns 311
όπου s=min(k-1, l-1). Η σχέση [1] λόγω των σχέσεων [1] και [8] γράφεται: w I F V = = [13] s s Από τη σχέση [13] w = V s [14] Συνεπώς, ισχύει η σχέση: I F = V s [15] ΥΝΑΜΙΚΗ Α ΡΑΝΕΙΑ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ ΥΟ ΜΕΤΑΒΛΗΤΩΝ Στο χώρο της Ανάλυσης εδοµένων κεντρικό ρόλο παίζει η έννοια της αδράνειας. Ειδικότερα, η αδράνεια ενός πίνακα συµπτώσεων δύο µεταβλητών εκφράζει µια γενικευµένη διασπορά, αλλά ταυτόχρονα µπορεί να θεωρηθεί ως ένας δείκτης της περιεχόµενης στον πίνακα πληροφορίας. Επίσης, στα προηγούµενα δείχθηκε ότι η αδράνεια, µέσω της σχέσης που τη συνδέει µε το w, µπορεί να θεωρηθεί και ως ένας δείκτης µεγέθους του αποτελέσµατος που εκφράζει την ένταση της συνάφειας µεταξύ δύο κατηγορικών µεταβλητών. Η µέγιστη τιµή της αδράνειας στην περίπτωση των δύο µεταβλητών είναι ίση µε s=min(k-1, l-1). Ορισµός: Αν I F είναι η αδράνεια του πίνακα συµπτώσεων F και I max =s η µέγιστη δυνατή αδράνεια του F µε µόνο περιορισµό τον αριθµό γραµµών και στηλών του πίνακα για δοσµένο µέγεθος δείγµατος n, τότε ορίζουµε ως δυναµική αδράνεια I D του πίνακα F το λόγο: I F I = [16] D I max Η δυναµική αδράνεια εκφράζει την αδράνεια του F ως ποσοστό της µέγιστης δυνατής αδράνειας που θα µπορούσε να έχει ο F στην περίπτωση που οι δύο µεταβλητές θα παρουσίαζαν τη µέγιστη δυνατή συσχέτιση. Η σχέση [16], µέσω της [1] µπορεί να γραφεί και ως εξής: Q I D = = V [17] ns Συνεπώς, η δυναµική αδράνεια του πίνακα συµπτώσεων είναι ίση µε το τετράγωνο του συντελεστή συνάφειας Cramer s V. Η ποσότητα I D 100 εκφράζει τη I F ως ποσοστό % της I max. Για τους επιστήµονες που στις έρευνές τους χρησιµοποιούν µεθόδους της Ανάλυσης εδοµένων και είναι εξοικειωµένοι µε την έννοια της αδράνειας η δυναµική αδράνεια µπορεί να αποτελέσει µια εναλλακτική προσέγγιση στον προκαθορισµό του µεγέθους του αποτελέσµατος. Στη συνέχεια δίνουµε τις σχέσεις που συνδέουν τη I D µε το w και τη I F. Από τις σχέσεις [14] και [17] w = si D [18] Από τη σχέση [17] I = si [19] F D Παρατήρηση. Σε πρακτικές εφαρµογές, για τον a priori καθορισµό του µεγέθους του δείγµατος, είναι χρήσιµο να πραγµατοποιείται σχετικός έλεγχος ευαισθησίας, 31
δίνοντας όρια για το E.S., και ανάλυση κόστους-ωφέλειας για την εξισορρόπηση των διαθέσιµων πόρων σε σχέση µε τους στόχους της έρευνας. ΑΡΙΘΜΗΤΙΚΑ ΠΑΡΑ ΕΙΓΜΑΤΑ Στα παραδείγµατα που ακολουθούν οι απαραίτητοι αριθµητικοί υπολογισµοί πραγµατοποιήθηκαν µε τη βοήθεια του επιπρόσθετου του EXCEL π-face, το οποίο είναι διαθέσιµο στη διεύθυνση: ftp://ftp.stat.uiowa.edu/pub/rlenth/piface/. Το π-face διαθέτει εκτός άλλων και τις συναρτήσεις: 1) ChiPower και ) ChiPowerNC. Η συνάρτηση ChiPower δέχεται ως ορίσµατα το επιθυµητό επίπεδο σηµαντικότητας του ελέγχου χ, την παράµετρο µη κεντρικότητας λ και τους αντίστοιχους βαθµούς ελευθερίας. Η συνάρτηση επιστρέφει την παρατηρούµενη ισχύ του ελέγχου και εποµένως µπορεί να χρησιµοποιηθεί για την post-hoc προσέγγιση της Α.Ι.. Η συνάρτηση ChiPowerNC δέχεται ως ορίσµατα το επιθυµητό επίπεδο σηµαντικότητας του ελέγχου χ, την επιθυµητή ισχύ του ελέγχου και τους αντίστοιχους βαθµούς ελευθερίας. Επιστρέφει την παράµετρο µη κεντρικότητας λ και εποµένως µπορεί να χρησιµοποιηθεί στην a priori προσέγγιση της Α.Ι.. Παράδειγµα 1: Post hoc Ανάλυση Ισχύος: Έστω δύο κατηγορικές µεταβλητές X και Y µε τρεις κλάσεις η κάθε µία. Το µέγεθος του δείγµατος είναι n=80. Ο στατιστικός έλεγχος χ έδωσε Q=14,3. Η τιµή του Q για 4 β.ε. είναι στατιστικά σηµαντική σε ε.σ. α=0,05 (p<0,05). Το πρόβληµα που τίθεται είναι να υπολογιστεί η παρατηρούµενη ισχύς γ obs του ελέγχου χ που αντιστοιχεί σε ε.σ. α=0,05. Η αδράνεια I του αντίστοιχου πίνακα συµπτώσεων των δύο µεταβλητών είναι I=0,179. Από τη σχέση [8] προκύπτει ότι η αδράνεια I αντιστοιχεί σε µέγεθος αποτελέσµατος w=0,43 (τείνει προς µεγάλο E.S. σύµφωνα.µε τις συµβάσεις κατά Cohen). Από τη σχέση [9] µπορεί να εκτιµηθεί η παράµετρος µη κεντρικότητας λ, η οποία είναι λ=14,3. Κάνοντας χρήση της σχέσης [10] και µε τη βοήθεια της συνάρτησης ChiPower η παρατηρούµενη ισχύς του ελέγχου εκτιµάται σε γ obs =0,875. Συνεπώς, η πιθανότητα ο έλεγχος χ να ανιχνεύσει ένα E.S. ίσο µε το παρατηρούµενο ως στατιστικά σηµαντικό, σε ε.σ. α=0,05, είναι περίπου 87,5%. Παράδειγµα : A priori Ανάλυση ισχύος: Έστω ότι κατά το στάδιο σχεδιασµού µιας έρευνας το ενδιαφέρον εστιάζεται στον έλεγχο της συνάφειας δύο κατηγορικών µεταβλητών X και Y µε τρεις και τέσσερις κλάσεις αντίστοιχα. Από προηγούµενη εµπειρία είναι γνωστό ότι ένα E.S. που αντιστοιχεί σε δυναµική αδράνεια τουλάχιστον της τάξης του 0,0 έχει κλινική ή πρακτική σηµαντικότητα σύµφωνα µε τους στόχους και το θεωρητικό πλαίσιο της έρευνας. Το πρόβληµα που τίθεται είναι να εκτιµηθεί το ελάχιστο απαιτούµενο µέγεθος δείγµατος n ώστε ο στατιστικός έλεγχος χ (για 6 β.ε.), σε ε.σ. α=0,10 και µε ισχύ γ=0,99 να ανιχνεύσει το προκαθορισµένο E.S. ως στατιστικά σηµαντικό. Από τις σχέσεις που δείχθηκαν στα προηγούµενα, για s=, προκύπτει ότι η I D =0,0 αντιστοιχεί σε αδράνεια I 0,04, σε w 0,0 και σε δείκτη Cramer s V 0,14. Με τη βοήθεια της συνάρτησης ChiPowerNC υπολογίζεται η παράµετρος µη κεντρικότητας λ=4,65. Εποµένως, από τη σχέση [11] το ζητούµενο µέγεθος δείγµατος υπολογίζεται σε n=617 δειγµατοληπτικές µονάδες. Αν το επιθυµητό επίπεδο ισχύος του 313
ελέγχου µειωθεί σε 0,95 τότε το εκτιµώµενο µέγεθος δείγµατος είναι n=447. Στο παράδειγµα αυτό, ο προκαθορισµός του κλινικά σηµαντικού E.S. θα µπορούσε να είχε στηριχθεί από την αρχή και στο δείκτη V. Το µέγεθος του δείγµατος που θα επιδιωχθεί να συλλεχτεί τελικά εξαρτάται και από τους διαθέσιµους πόρους (οικονοµικούς, χρονικούς, κ.λπ.). Εποµένως, κατά το στάδιο σχεδιασµού της έρευνας θα πρέπει να ληφθούν υπόψη και τυχόν άλλοι, εξωγενείς, περιορισµοί. ΣΥΜΠΕΡΑΣΜΑΤΑ Στην περίπτωση δύο κατηγορικών µεταβλητών, όπου τα δεδοµένα έχουν συγκεντρωθεί µε τη µέθοδο της απλής τυχαίας δειγµατοληψίας, είναι δυνατός ο συνδυασµός της AFC µε το στατιστικό έλεγχο ανεξαρτησίας χ. Στην παρούσα εργασία, εισαγάγαµε την έννοια της δυναµικής αδράνειας και προτείναµε µεθοδολογία µε την οποία µπορεί να εκτιµηθεί τόσο η παρατηρούµενη ισχύς του στατιστικού ελέγχου χ (post hoc) όσο και το ελάχιστο απαιτούµενο µέγεθος δείγµατος (a priori) σε δειγµατοληπτική ή πειραµατική έρευνα, όπου στα δεδοµένα θα εφαρµοστεί η AFC. Για την ανάπτυξη της προτεινόµενης µεθοδολογίας θεωρήσαµε την αδράνεια I F και τη δυναµική αδράνεια I D του πίνακα συµπτώσεων δύο µεταβλητών ως εναλλακτικούς δείκτες µεγέθους του αποτελέσµατος και στηριχθήκαµε στο πλαίσιο Ανάλυσης Ισχύος των χ στατιστικών ελέγχων που προτάθηκε από τον Cohen. ABSTRACT The Correspondence Analysis (AFC) is considered mainly as a descriptive technique designed to analyze simple two-way and multi-way tables containing some kind of correspondence or association between the rows and the columns. In the case of two variables where the data have been collected using the simple random sampling scheme, the statistical significance of the total inertia of the contingency table can be tested by means of the χ distribution. If the inertia is considered as an index of a global effect size then the observed power of the χ test of independence can be estimated. In the context of the Statistical Power Analysis proposed by Cohen, the minimum required sample size can be estimated, a priori, in such way that a predetermined effect size can be detected as statistically significant by the χ test, at significance level α with power γ. In this study we introduce the concept of dynamic inertia and we propose a methodology for an a priori and post hoc Power Analysis of the χ test using the square root of the inertia and the dynamic inertia as measures of effect size. ΑΝΑΦΟΡΕΣ Benzécri, J.-P. (199): Correspondence Analysis Handbook. Marcel Dekker, Inc., New York. Blasius, J. & Greenacre, M. (1994): Computation of Correspondence Analysis. In: M. Greenacre and J. Blasius (eds), Correspondence Analysis in the Social Sciences. Recent Developments and Applications. Academic Press, London. Chapman, D. & Nam, J. (1968): Asymptotic Power of Chi-Square Tests for Linear Trends in Proportions. Biometrics, Vol. 4, No., 315-37. Clausen, S.-E. (1998): Applied Correspondence Analysis: An Introduction. Sage, Thousand Oakes. Cochran, W. (195): The chi Test of Goodness of Fit. The Annals of Mathematical Statistics, Vol. 3, No. 3, 315-345. 314
Cohen, J. (196): The Statistical Power of Abnormal-Social Psychological Research: A Review. Journal of Abnormal and Social Psychology, 65, 145-153. Cohen, J. (1965): Some Statistical Issues in Psychological Research. In: B. Wolman (ed.), Handbook of Clinical Psychology. McGraw-Hill, New York. Cohen, J. (1988): Statistical Power Analysis for the Behavioral Sciences. Lawrence Erlbaum Associates, Inc., New Jersey. Cohen, J. & Cohen, P. (1983): Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences. Lawrence Erlbaum Associates Inc., New Jersey. Gifi, A. (1996): NonLinearMultivariate Analysis. John Willey & Sons Ltd., Chichester. Greenacre, M. (1993): Correspondence Analysis in Practice. Academic Press, London. Guenther, W. (1977): Power and Sample Size for Approximate Chi-Square Tests. The American Statistician, Vol. 31, No., 83-85. Haynam, G.E., Govindarajulu, Z. & Leone, F.C. (1970): Tables of the Cumulative Non-central Chi- Square Distribution. In: H. L. Harter and D. B. Owen (eds), Selected Tables in Mathematical Statistics, Vol. I. Markham Publishing Co., Chicago. Kramer, S. & Rosental, R. (1999): Effect Sizes and Significance Levels in Small-Sample Research. Ιn R. Hoyle (ed.), Statistical Strategies for Small Sample Research. Sage Publications Inc., Thousand Oakes. Lachin, J. (1977): Sample Size Determinations for rxc Comparative Trials. Biometrics, Vol. 33, No., 315-34. Lebart, L., Morineau, A. & Piron, M. (000): Statistique Exploratoire Multidimensionnelle. Dunod, Paris. Meng, R. & Chapman, D. (1966): The Power of Chi Square Tests for Contingency Tables. Journal of the American Statistical Association, Vol. 61, No. 316, 965-975. Murphy, K. & Myors, B. (1998): Statistical Power Analysis: A Simple and General Model for Traditional and Modern Hypothesis Tests. Lawrence Erlbaum Associates, Inc., New Jersey. Nathan, G. (197): On the Asymptotic Power of Tests for Independence in Contingency Tables from Stratified Samples. Journal of the American Statistical Association, Vol. 67, No. 340, 917-90. Pearson, E.S. & Hartley, H.O. (eds) (197): Biometrika Tables for Statisticians. Cambridge University Press, London. Τσάντας, Ν., Μωϋσιάδης, Χ., Μπαγιάτης, Ν. και Χατζηπαντελής, Θ. (1999): Ανάλυση εδοµένων µε τη βοήθεια Στατιστικών Πακέτων. Εκδόσεις ΖΗΤΗ, Θεσσαλονίκη. Van de Geer, J. (1993): Multivariate Analysis of Categorical Data: Applications. Sage Publications, Inc., Thousand Oaks. Weller, S. & Romney A.K. (1990): Metric Scaling: Correspondence Analysis. Sage, Newbury Park. 315