Ελληνικό Στατιτικό Ιντιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιτικής (005) ελ.57-65 ΕΛΛΕΙΨΕΙΣ ΕΜΠΙΣΤΟΣΥΝΗΣ ΣΤΑ ΠΑΡΑΓΟΝΤΙΚΑ ΕΠΙΠΕΔΑ ΤΗΣ AFC Γεώργιος Μενεξές, Άγγελος Μάρκος, Γιάννης Παπαδημητρίου Τμήμα Εφαρμομένης Πληροφορικής, Πανεπιτήμιο Μακεδονίας ΠΕΡΙΛΗΨΗ Στην περίπτωη δύο κατηγορικών μεταβλητών, όπου η υλλογή των δεδομένων έχει γίνει με τυχαία δειγματοληψία, οι υντεταγμένες των προβολών των ημείων γραμμών και τηλών, επί των παραγοντικών επιπέδων που παράγονται από την εφαρμογή της Παραγοντικής Ανάλυης των Αντιτοιχιών (AFC), αποτελούν εκτιμήεις των πραγματικών υντεταγμένων, αυτών, δηλαδή, που θα προέκυπταν από την εφαρμογή της AFC τα δεδομένα ολόκληρου του υπό εξέταη πληθυμού. Έτι, το πρόβλημα που τίθεται είναι ο προδιοριμός περιοχών εμπιτούνης (1-α)% για τις πραγματικές θέεις των ημείων (γραμμών, τηλών) επί των παραγοντικών επιπέδων. Στην παρούα εργαία προτείνουμε μέθοδο κατακευής ελλείψεων εμπιτούνης (1-α)% με κέντρα τις προβολές των ημείων γραμμών (τηλών) επί των παραγοντικών επιπέδων της AFC η οποία εφαρμόζεται ε πίνακα υμπτώεων δύο κατηγορικών μεταβλητών. 1. ΕΙΣΑΓΩΓΗ Στην περίπτωη δύο κατηγορικών μεταβλητών, όπου η υλλογή των δεδομένων έχει γίνει με τυχαία δειγματοληψία, οι υντεταγμένες των προβολών των ημείων γραμμών και τηλών, επί των παραγοντικών επιπέδων, τα οποία παράγονται από την εφαρμογή της AFC (Benzécri, 199) τον αντίτοιχο πίνακα υμπτώεων απολύτων υχνοτήτων, αποτελούν εκτιμήεις των πραγματικών υντεταγμένων, αυτών, δηλαδή, που θα προέκυπταν από την εφαρμογή της AFC τα δεδομένα ολόκληρου του υπό εξέταη πληθυμού. Έτι, το πρόβλημα που τίθεται είναι ο προδιοριμός περιοχών εμπιτούνης (1-α)% για τις πραγματικές θέεις των ημείων (γραμμών, τηλών) επί των παραγοντικών επιπέδων της AFC. Το πρόβλημα αυτό υνδέεται με τον έλεγχο της «εξωτερικής ταθερότητας» των αποτελεμάτων που προκύπτουν από την εφαρμογή μεθόδων βέλτιτης κλιμάκωης όπως είναι η AFC, η Μη Γραμμική Ανάλυη ε Κύριες Συνιτώες, κ.ά. (Greenacre 1984, Greenacre 1993, Gifi 1996). Η εξωτερική ταθερότητα αναφέρεται το πόο υνεπή είναι τα παραγόμενα αποτελέματα τη θεωρητική περίπτωη που η ανάλυη επαναληφθεί ε κάποιο άλλο τυχαίο δείγμα από τον ίδιο πληθυμό. Στο χώρο της Πολυδιάτατης - 57 -
Ανάλυης Δεδομένων το ζήτημα αντιμετωπίζεται χεδόν αποκλειτικά με μεθόδους Bootstrap (Efron & Tibshirani, 1993). Όμως, η εφαρμογή τους, την περίπτωη της AFC, δημιουργεί προβληματιμούς χετικά με την επιλογή της κατάλληλης μεθοδολογίας για την υλοποίηη τους. Σημαντικές αποφάεις θα πρέπει να ληφθούν από τους αναλυτές χετικά: α) με την μορφή του πίνακα δεδομένων από τον οποίο θα γίνει η δειγματοληψία με επανατοποθέτηη, β) το πλήθος των δειγμάτων, γ) τη μέθοδο διόρθωης (ή όχι) μεροληψίας των εκτιμητών, δ) την προβολή ή όχι των δειγμάτων ε ένα χώρο αναφοράς, κ.ά. Για περιότερες πληροφορίες χετικά με την εφαρμογή της Bootstrap το πλαίιο της AFC παραπέμπουμε τους Greenacre (1984), Greenacre (1993), Gifi (1996) και Marks (1994). Στην παρούα εργαία προτείνουμε μέθοδο κατακευής (1-α)% ελλείψεων εμπιτούνης (ε.ε.) με κέντρα τις προβολές των γραμμών (τηλών) επί των παραγοντικών επιπέδων. Τα μήκη των αξόνων και ο προανατολιμός τους καθορίζονται με μέθοδο που υνδυάζει το μεταχηματιμό ε κύριες υνιτώες, οριμένες ιδιότητες της διδιάτατης κανονικής κατανομής, την απόταη Mahalanobis, τη χ κατανομή και το επίπεδο ημαντικότητας α.. ΤΟ ΓΕΝΙΚΟ ΠΡΟΒΛΗΜΑ Το γενικό πρόβλημα που προτείνουμε να επιλυθεί αρχικά μπορεί να διατυπωθεί ως εξής: δοθείης της κατ εκτίμηη θέης ενός ημείου ε ένα ορθογώνιο ύτημα υντεταγμένων του R, να προδιοριτεί περιοχή την οποία αναμένεται, με προκαθοριμένη πιθανότητα 1-α, να βρίκεται η πραγματική του θέη θεωρώντας τις υντεταγμένες του ως τυχαίες μεταβλητές. Η «μεταφορά» και η επίλυη του προβλήματος το πλαίιο της AFC παρουιάζει οριμένες ιδιαιτερότητες όπως: α) ο προανατολιμός του υτήματος υντεταγμένων είναι αυθαίρετος, β) υπάρχει διαφορετικός βαθμός «αβεβαιότητας», με την έννοια της αδράνειας, κατά μήκος των παραγοντικών αξόνων, και γ) οι δειγματικές υντεταγμένες των ημείων μπορούν να θεωρηθούν είτε ως εκτιμήεις των πραγματικών είτε ως μέοι όροι βέλτιτα ποοτικοποιημένων (μεταχηματιμένων) βαθμών (score) των πειραματικών ή δειγματοληπτικών μονάδων. Στην παρούα εργαία θεωρούμε ότι οι δειγματικές υντεταγμένες των ημείων αποτελούν εκτιμήεις των πραγματικών και αντιμετωπίζονται ως τυχαίες μεταβλητές. 3. ΕΠΙΛΥΣΗ ΤΟΥ ΓΕΝΙΚΟΥ ΠΡΟΒΛΗΜΑΤΟΣ Έτω ημείο A(,), όπου και είναι οι διαθέιμες αμερόληπτες εκτιμήεις των υντεταγμένων του ε ένα ορθογώνιο ύτημα υντεταγμένων (U V) του R. Αν θεωρήουμε τα και ως τυχαίες μεταβλητές τότε ο πίνακας διαπορών υνδυαπορών Σ με Σ =, με εν γένει, περιγράφει την αβεβαιότητα της κατ εκτίμηη θέης του ημείου Α κατά μήκων των δύο αξόνων του υτήματος υντεταγμένων. Αν οι εκτιμήεις και - 58 -
ακολουθούν τη Ν (μ, Σ), με μ=[μ, μ ] T το διάνυμα των αντίτοιχων μέων τιμών, τότε μπορούμε να θεωρήουμε ότι οι αναμενόμενες τιμές μ και μ είναι οι άγνωτες πραγματικές υντεταγμένες της θέης του ημείου Α. Αν και είναι δυνατόν να κατακευατούν ξεχωριτά (1-α)% διατήματα εμπιτούνης για τις αναμενόμενες τιμές μ και μ, ωτόο, από πρακτική κοπιά θα ήταν χρήιμο να αναζητήουμε μια «περιοχή εμπιτούνης» το επίπεδο, ανεξάρτητα από το εν γένει αυθαίρετο ύτημα αναφοράς, τέτοια ώτε η πραγματική θέη του Α να βρίκεται μέα ε αυτή με προκαθοριμένη πιθανότητα P=1-α. Η ζητούμενη περιοχή θα μπορούε να είναι μια έλλειψη τέτοια ώτε να λαμβάνεται υπόψη τόο ο διαφορετικός βαθμός αβεβαιότητας της θέης του ημείου κατά μήκων των αξόνων όο και η πιθανή υχέτιη των εκτιμητριών των υντεταγμένων. Έτι, αν x=[,] T και x Ν (μ, Σ) τότε η ποότητα Q, που ορίζεται από την παρακάτω χέη [1], ακολουθεί την κατανομή χ με βαθμούς ελευθερίας (Becker & Gather 001, John 1968). Q=(x-μ) Τ Σ -1 (x-μ) χ [1] Η ποότητα Q δεν είναι παρά η απόταη Mahalanobis του διανύματος x από το διάνυμα μ. Από την [1] υνεπάγεται ότι: P((x-μ) Τ Σ -1 (x-μ) χ ) = 1-α [] Συνεπώς, η ζητούμενη περιοχή εμπιτούνης είναι το εωτερικό της καμπύλης με εξίωη: c: (x-μ) Τ Σ -1 (x-μ) = χ ; α, [3] όπου χ ; α είναι η κρίιμη τιμή της κατανομής χ με βαθμούς ελευθερίας, ε επίπεδο ημαντικότητας α. Στα επόμενα, για λόγους οικονομίας πολλά από τα βήματα των αποδείξεων παραλείπονται. Η καμπύλη c της [3], όπως θα δείξουμε τη υνέχεια, είναι εξίωη έλλειψης με κέντρο το ημείο (μ, μ ). Η βαική ιδέα της προτεινόμενης μεθοδολογίας κατακευής ε.ε. τηρίζεται την εφαρμογή μιας «τοπικής» Ανάλυης ε Κύριες Συνιτώες το ημείο Α. Για το λόγο αυτό, αρχικά, αλλάζουμε το ύτημα αναφοράς μετατοπίζοντας την αρχή του το ημείο (μ, μ ) και, τη υνέχεια το τρέφουμε κατά γωνία φ (θετική φορά) ύμφωνα με τη χέη (Δερμάνης, 1986): x=r(x-μ), [4] όπου x είναι το διάνυμα υντεταγμένων του ημείου Α το νέο ύτημα αναφοράς. Πιο αναλυτικά έχουμε: υνϕ ημϕ μ x= = ημφ υνϕ μ Ο πίνακας Σ το νέο ύτημα αναφοράς δίνεται από τη χέη: Ξ=RΣR T [5] - 59 -
Η γωνία φ μπορεί να επιλεγεί με τρόπο ώτε ο ορθογώνιος πίνακας R να διαγωνιοποιεί τον Σ (Δερμάνης, 1998) με αποτέλεμα ο Ξ να μπορεί να γραφεί: 0 Ξ=, 0 όπου οι διαπορές και είναι ταυτόχρονα και ιδιοτιμές του Σ. Από την [5] υνεπάγεται ότι: Σ=R T ΞR Σ -1 = R T Ξ -1 R [6] Από [6], [4] και [3] έχουμε: (x-μ) T Σ -1 (x-μ)=x T Ξ -1 x= 1 0 = [, ] = + = χ ; α [7] 0 Αν θέουμε p = τότε η [7] γράφεται: α χ ; α + = 1 [8] pα p α Η [8] είναι εξίωη έλλειψης με κέντρο την αρχή του νέου υτήματος αναφοράς, με μήκη ημιαξόνων p α και p α αντίτοιχα των οποίων οι διευθύνεις είναι ίδιες με αυτές των αξόνων των και. Οι, και η γωνία φ μπορούν να υπολογιτούν από τις παρακάτω χέεις: + = + + [9] + = + [10] εφφ = [11] Παρατήρηη 1: Σε πρακτικές εφαρμογές, η ε.ε. προτείνουμε να κατακευάζεται με κέντρο το ημείο που ορίζεται από τις διαθέιμες εκτιμήεις και. Τα μήκη των ημιαξόνων m 1 = p α και m = p α καθώς και η γωνία φ μπορούν να υπολογιτούν μέω των χέεων [9], [10] και [11] με αντικατάταη των δειγματικών εκτιμήεων των παραμέτρων αφού οι πραγματικές τους τιμές είναι υνήθως άγνωτες. Στην περίπτωη αυτή, η ποότητα Q =(x-μ) Τ S -1 (x-μ), όπου S ο δειγματικός πίνακας διαπορών - υνδυαπορών, ακολουθεί αυμπτωτικά την χ κατανομή με βαθμούς ελευθερίας (Becker & Gather 001, Atkinson 1994) και η αντίτοιχη περιοχή αποτελεί αυμπτωτική ε.ε.. Είναι φανερό ότι η εγκυρότητα της μεθόδου βαίζεται τελικά το πόο «καλές» εκτιμήεις θα έχουμε τη διάθεή μας για τα τοιχεία του πίνακα Σ. - 60 -
4. «ΜΕΤΑΦΟΡΑ» ΚΑΙ ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΣΤΗΝ AFC Το πρόβλημα που πρέπει να αντιμετωπιτεί την περίπτωη της AFC είναι η εκτίμηη των τοιχείων του πίνακα Σ, δηλαδή ο καθοριμός των τοιχείων του πίνακα S (βλέπε Παρατήρηη 1) για κάθε ημείο γραμμής (τήλης) του πίνακα υμπτώεων απολύτων υχνοτήτων F των δύο μεταβλητών τον οποίο θα εφαρμοτεί η AFC. Στη χετική βιβλιογραφία αναφέρονται δύο βαικές μέθοδοι εκτίμηης: 1) μέθοδοι που τηρίζονται τις τεχνικές Bootstrap και Jackknife (Van der Brg & De Leew 1988, Heiser & Melman 1983, Marks 1994), και β) η μέθοδος Δέλτα (Rao 00, Israëls 1987, Gifi 1996). Στο πλαίιο της παρούας εργαίας προτείνουμε τη μέθοδο Δέλτα διότι: α) τα τυπικά φάλματα των εκτιμητών της μεθόδου είναι «κοντά» τα τυπικά φάλματα που προκύπτουν από την εφαρμογή των μεθόδων Bootstrap, β) οι εκτιμητές που υπολογίζονται ακολουθούν αυμπτωτικά Κανονική Κατανομή, γ) η μέθοδος είναι διαθέιμη, μέω προγραμματιμού, το υπούτημα Categories του τατιτικού πακέτου SPSS (Melman & Heiser, 001), και δ) αποφεύγονται οι χετικοί προβληματιμοί που αναφέρθηκαν την Ειαγωγή της παρούας εργαίας. Στο ημείο αυτό λαμβάνουμε υπόψη ένα βαικό υμπέραμα που προκύπτει από το υνδυαμό αποτελεμάτων χετικών μελετών (Andersen 1991, Nishisato 1980, Aït-Sidi-Allal et al. 004, Marks 1994), το οποίο υμπυκνώνεται την παρακάτω πρόταη: Οι παραγοντικές υντεταγμένες των ημείων γραμμών και τηλών, όπως αυτές υπολογίζονται από την AFC, το πλαίιο της Γαλλικής Σχολής Ανάλυης Δεδομένων, είναι αμερόληπτοι εκτιμητές ταθμιμένων ελαχίτων τετραγώνων. Τα αντίτοιχα διανύματα των υντεταγμένων ακολουθούν αυμπτωτικά πολυδιάτατη Κανονική Κατανομή. Στη υνέχεια, αφού εκτιμηθούν τα τοιχεία του πίνακα S για κάθε ημείο γραμμής (τήλης) και λαμβάνοντας υπόψη και την προηγούμενη πρόταη εφαρμόζουμε την διαδικαία κατακευής των ε.ε., όπως το γενικό πρόβλημα. Η κατακευή «υντηρητικών» ελλείψεων εμπιτούνης μπορεί να επιτευχθεί με τη χρήη ορίων Bonferroni, όπου το επίπεδο εμπιτούνης α διορθώνεται ε α/r για τα ημεία γραμμών και ε α/c για τα ημεία τηλών, όπου r και c είναι το πλήθος γραμμών και τηλών αντίτοιχα του πίνακα F. Τα αποτελέματα της AFC μπορούν να «ενιχυθούν» με ταυτόχρονες πολλαπλές υγκρίεις (ελέγχους) των προφίλ των γραμμών (ή/και τηλών) με τη μέθοδο που πρότεινε ο Gabriel (1966). 5. ΠΑΡΑΔΕΙΓΜΑ Στον Πίνακα 1 παρουιάζεται ο πίνακας υμπτώεων απολύτων υχνοτήτων, τα ύνολα γραμμών και τηλών (περιθώριες κατανομές) καθώς και τα προφίλ (%) των γραμμών, για δύο κατηγορικές μεταβλητές Χ και Υ, με 4 και 5 κλάεις αντίτοιχα, ε ένα τυχαίο δείγμα 438 δειγματοληπτικών μονάδων. Χωρίς περιοριμό της γενικότητας, θεωρούμε ότι το ενδιαφέρον της μελέτης ετιάζεται τη ύγκριη μόνο των προφίλ των 4 κλάεων της μεταβλητής Χ και την αιτιολόγηη των ομοιοτήτων ή/και διαφορών, που ενδεχομένως θα προκύψουν, ε χέη με τη μεταβλητή Υ. Η - 61 -
εφαρμογή της AFC, μέω του SPSS er. 11.5, τα δεδομένα του Πίνακα 1 ανέδειξε δύο παραγοντικούς άξονες που ερμηνεύουν το 98,5% της ολικής αδράνειας. Για λόγους οικονομίας, παραλείπουμε το χολιαμό και την ερμηνεία των αναλυτικών αποτελεμάτων που παράγονται από την AFC και παρουιάζουμε μόνο την εφαρμογή της προτεινόμενης μεθοδολογίας για την κατακευή 95% ε.ε. γύρω από τα ημεία που αντιτοιχούν τις 4 κλάεις της Χ το παραγοντικό επίπεδο 1. Η υλοποίηη της προτεινόμενης μεθοδολογίας έγινε μέω προγράμματος που αναπτύχθηκε το λογιμικό Matlab er. 7.0. Στο Διάγραμμα 1 απεικονίζονται οι 95% ε.ε. γύρω από τα ημεία που αντιτοιχούν τις 4 κλάεις της Χ (Tr_1, Tr_, Tr_3 και Tr_4). Πίνακας 1: Πίνακας Συμπτώεων των Χ και Υ Υ C1 C C3 C4 C5 Σύνολα Tr_1 Συχνότητες 8 4 19 56 149 % 18,8% 16,1% 1,8% 37,6% 14,8% 100,0% Tr_ Συχνότητες 4 15 9 4 5 57 Χ % 7,0% 6,3% 15,8% 4,1% 8,8% 100,0% Tr_3 Συχνότητες 10 16 18 38 8 110 % 9,1% 14,5% 16,4% 34,5% 5,5% 100,0% Tr_4 Συχνότητες 5 19 17 4 39 1 % 4,1% 15,6% 13,9% 34,4% 3,0% 100,0% Σύνολα Συχνότητες 47 74 63 160 94 438 % 10,7% 16,9% 14,4% 36,5% 1,5% 100,0% Πηγή: Gabriel (1966, ελ. 1085) Η εφαρμογή της μεθόδου Δέλτα έδωε τα αποτελέματα που παρουιάζονται τον Πίνακα. Πίνακας : Αποτελέματα της μεθόδου Δέλτα Παραγοντικοί Άξονες F1 F Var() Var() Coar(, ) Tr_1 0.006463 0.003191 0.003 Tr_ 0.034737 0.0141-0.00806 Tr_3 0.007674 0.007089 0.000737 Tr_4 0.00511 0.006 0.000637 Στη υνέχεια παραθέτουμε μερικούς βαικούς κανόνες ερμηνείας της πληροφορίας που παρουιάζεται το Διάγραμμα 1. Σημεία γραμμών που η αντίτοιχη ε.ε. δεν περιέχει την αρχή των αξόνων είναι ημαντικά και υνειφέρουν τη υχέτιη (εξάρτηη) των δύο μεταβλητών, όπως αυτή ερμηνεύεται από το παραγοντικό επίπεδο 1. Από το διάγραμμα παρατηρούμε ότι τα ημεία Tr_1, Tr_ και Tr_4 είναι ημαντικά ενώ το Tr_3 δεν είναι. Σημεία γραμμών που οι αντίτοιχες ε.ε. δεν τέμνονται έχουν διαφορετικό προφίλ ιδιαίτερα την περίπτωη που οι αντίτοιχοι παραγοντικοί άξονες ερμηνεύουν υψηλό - 6 -
ποοτό της ολικής αδράνειας. Από το διάγραμμα φαίνεται ότι μόνο τα προφίλ των γραμμών Tr_1 και Tr_4 διαφέρουν ημαντικά. Οι υγκρίεις των προφίλ μπορούν να πραγματοποιηθούν με τη μέθοδο του Gabriel, τα αποτελέματα της οποίας προαρμότηκαν, από τους υγγραφείς, ε μορφή υνοπτικής παρουίαης ανάλογης αυτής που χρηιμοποιείται τις πολλαπλές υγκρίεις μέων όρων με μεθόδους όπως του Tkey, του Dncan, κ.ά. (βλέπε Πίνακα 3). Οι πολλαπλοί έλεγχοι είναι μάλλον επιβεβλημένοι την περίπτωη που οι αντίτοιχοι παραγοντικοί άξονες δεν ερμηνεύουν ημαντικό ποοτό της ολικής αδράνειας. Σημεία γραμμών που οι αντίτοιχες ε.ε. έχουν χετικά μικρή επιφάνεια έχουν και πιο ταθερή απεικόνιη με την έννοια της εξωτερικής εγκυρότητας. Από το διάγραμμα φαίνεται ότι η θέη του ημείου Tr_ παρουιάζει τη μεγαλύτερη ατάθεια με αποτέλεμα η ερμηνεία του επί του πρώτου παραγοντικού άξονα να είναι προβληματική αφού η θέη του θα μπορούε να αποδοθεί είτα τα δεξιά είτε τα αριτερά του πρώτου άξονα. Το ίδιο φαίνεται να ιχύει για την ερμηνεία των ημείων Tr_4 και Tr_1 ως προς τη θέη τους το δεύτερο άξονα (πάνω ή κάτω). Διάγραμμα 1: Παραγοντικό επίπεδο 1 με 95% ελλείψεις εμπιτούνης για τα ημεία γραμμών (οι εξωτερικές ελλείψεις αντιτοιχούν ε όρια Bonferroni) Πίνακας 3: Ταυτόχρονες πολλαπλές υγκρίεις των προφίλ των γραμμών (μέθοδος Gabriel) 1. Ζεύγος. Συγκρίεω ν 3. Likelihoo d Ratio- LR 4. Ομοιογενή ς 5. Ομάδα 1 6. Ομοιογενή ς 7. Ομάδα 8. Αποτελέματ α Συγκρίεων Tr_1 s Tr_ 8,140 Tr_1 Tr_1a Tr_1 s Tr_3 8,811 Tr_ Tr_ Tr_ ab Tr_1 s Tr_4,483 Tr_3 Tr_3 Tr_3 ab Tr_ s Tr_3 9,497 Tr_4 Tr_4 b Tr_ s Tr_4 13,746 Tr_3 s Tr_4 3,378 LR=18,040 LR=16,47 () Στατιτικά ημαντική διαφορά ε επίπεδο ημαντικότητας α=0,05. Η κρίιμη τιμή χ της 1 ; 0, 05 =1,06. () Τα προφίλ των γραμμών που ακολουθούνται από κοινό γράμμα δε διαφέρουν τατιτικά ημαντικά, ε α=0,05, ύμφωνα με το τατιτικό έλεγχο του Gabriel - 63 -
6. ΣΥΖΗΤΗΣΗ -ΣΥΜΠΕΡΑΣΜΑΤΑ Η προτεινόμενη μεθοδολογία κατακευής ε.ε. γύρω από τα ημεία γραμμών ή/και τηλών, επί των παραγοντικών επιπέδων που παράγονται από την AFC, παρέχει τόο ένα τατιτικό όο και έναν οπτικό έλεγχο της ταθερότητας και της ημαντικότητας των προβολών των αντίτοιχων ημείων επί των παραγοντικών επιπέδων και αξόνων. Η μέθοδος μπορεί να επεκταθεί και τις τρεις διατάεις με την κατακευή ελλειψοειδών εμπιτούνης. Συνήθως, όμως, τα γραφικά αποτελέματα της AFC παρουιάζονται ε δύο διατάεις. Είναι ημαντικό να τονίουμε ότι η απόφαη των αναλυτών τόο ε χέη με τον αριθμό των διατάεων του χώρου ( ή 3) όο και ε χέη με το ε ποιους υποχώρους θα προβληθούν τα ημεία (π.χ. παραγοντικό επίπεδο 1 ή/και 1 3, κ.λπ.) θα πρέπει να ληφθεί a priori ώτε η ημαντικότητα της θέης των ημείων και οι υγκρίεις των αντίτοιχων προφίλ, μέω των ε.ε., να εντάονται το μεθοδολογικό πλαίιο της επαγωγικής τατιτικής. Αντίθετα, η μέθοδος του Gabriel μπορεί να εφαρμοτεί και εκ των υτέρων, δηλαδή μετά την παρατήρηη των αποτελεμάτων της AFC και των ε.ε.. Τέλος, η μέθοδος μπορεί να εφαρμοτεί και ε πειραματική μελέτη, όπου υπάρχει διάκριη μεταξύ εξαρτημένης και ανεξάρτητης μεταβλητής. Στο παράδειγμα που παραθέαμε, η μεταβλητή Χ θα μπορούε να θεωρηθεί ως ένας ποιοτικός ή ποοτικός παράγοντας με 4 επίπεδα (αγωγές) ενώ η Y ως μεταβλητή απόκριης με 5 διακεκριμένες τιμές. ABSTRACT In the present stdy we propose a method of constrcting (1-α)% confidence ellipses arond the projections of row or/and colmn points onto the factorial planes prodced by the application of Correspondence Analysis AFC pon a contingency table of two categorical ariables. The problem is linked with the isse of external stability of the reslts prodced by AFC. The proposed method is based on the idea to perform a local Principal Component Analysis arond the row/colmn points. ΑΝΑΦΟΡΕΣ Aït-Sidi-Allal, M., Baccini, A. and A. Mondot (004). A new algorithm for estimating the parameters and their asymptotic coariance in correlation and association models. Comptations Statistics & Data Analysis, 45, 389-41. Andersen, E. (1991). The Statistical Analysis of Categorical Data. Springer-Verlag, Berlin-Heidelberg. Atkinson, A.C. (1994). Fast ery robst methods for the detection of mltiple otliers. Jornal of the American Statistical Association, 89(48), 139-1339. Becker, C. and U. Gather (001). The largest nonidentifiable otlier: a comparison of mltiariate simltaneos otlier identification rles. Comptational Statistics and Data Analysis, 36, 119-17. Benzécri, J.-P. (199). Correspondence Analysis Handbook. Marcel Dekker, Inc., New York. - 64 -
Efron, B. and R. Tibshirani (1993). An Introdction to the Bootstrap. Chapman and Hall, New York. Gabriel, K.R. (1966). Simltaneos test procedres for mltiple comparisons on categorical data. Jornal of the American Statistical Association, 61(316), 1081-1096. Gifi, A. (1996). NonLinear Mltiariate Analysis. John Willey & Sons Ltd, Chichester. Greenacre, M. (1984). Theory and Applications of Correspondence Analysis. Academic Press, London. Greenacre, M. (1993). Correspondence Analysis in Practice. Academic Press, London. Heiser, W. & J. Melman (1983). Constrained mltidimentional scaling. Applied Psychological Measrement, 7, 381-404. Israëls, A. (1987). Eigenale techniqes for Qalitatie Data. DSWO Press, Leiden. John, S. (1968). A central tolerance region for the mltiariate normal distribtion. Jornal of the Royal Statistical Society. Series B (Methodological), 30(3), 599-601. Lebart, L., Morinea, A. and K. Warwick (1984). Mltiariate Descriptie Statistical Analysis. Correspondence Analysis and Related Techniqes for Large Matrices. John Willey & Sons, New York. Marks, M. (1994). Bootstrap Confidence Regions in Nonlinear Mltiariate Analysis. DSWO Press, Leiden Uniersity, Leiden. Melman, J. and W. Heiser (001). SPSS Categories 11.0. SPSS, Inc., Chicago. Nishisato, S. (1980). Analysis of Categorical Data: Dal Scaling and its Applications. Uniersity of Toronto Press, Toronto. Rao, C.R. (00). Linear Statistical Inference and its Applications. John Willey & Sons, New York. Van der Brg, E. and J. De Leew (1988). Use of the mltinomial jack-knife and bootstrap in generalized non-linear canonical correlation analysis. Applied Stochastic Models and Data Analysis, 4, 159-17. Δερμάνης, Α. (1986). Συνορθώεις Παρατηρήεων και Θεωρία Εκτίμηης, Τόμος 1. Εκδόεις ΖΗΤΗ, Θεαλονίκη. Δερμάνης, Α. (1998). Γραμμική Άλγεβρα και Θεωρία Πινάκων. Εκδόεις ΖΗΤΗ, Θεαλονίκη. - 65 -