ΕΛΛΕΙΨΕΙΣ ΕΜΠΙΣΤΟΣΥΝΗΣ ΣΤΑ ΠΑΡΑΓΟΝΤΙΚΑ ΕΠΙΠΕΔΑ ΤΗΣ AFC



Σχετικά έγγραφα
ΔΕΙΓΜΑΤΙΚΕΣ ΚΑΤΑΝΟΜΕΣ (Sampling Distributions)

Παρουσίαση 4 η : Στοιχεία στατιστικής αξιολόγησης εκτιμήσεων

ηµοκρίτειο Πανεπιστήµιο, Τµήµα ΜηχανικώνΠαραγωγής& ιοίκησης 1

5. ΘΕΩΡΙΑ ΕΙΓΜΑΤΟΛΗΨΙΑΣ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

Παρουσίαση 3 η : Αρχές εκτίμησης παραμέτρων Μέρος 2 ο

, της Χ που έχουμε διαθέσιμες μετά από μια πραγματοποίηση του τυχαίου δείγματος X, X, 2

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΔΙΑΚΥΜΑΝΣΕΙΣ

οι ενήλικες στην περιοχή Β, ο φοιτητής γνωρίζει ότι X ~ N(

05_01_Εκτίμηση παραμέτρων και διαστημάτων. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΔΙΑΚΥΜΑΝΣΕΙΣ

και ονομάζεται μηδενική υπόθεση (null hypothesis), και η άλλη με H

Πανεπιστήμιο Πελοποννήσου

και ονομάζεται μηδενική υπόθεση (null hypothesis), και η άλλη με H

Επεξεργασία. Μέθοδοι Monte Carlo Εφαρμογές στην Επίλυση Προβλημάτων

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΤΗΝ ΔΙΑΦΟΡΑ ΜΕΣΩΝ ΤΙΜΩΝ ΚΑΝΟΝΙΚΩΝ ΠΛΗΘΥΣΜΩΝ

5. ιαστήµατα Εµπιστοσύνης

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2012

3. Κατανομές πιθανότητας

Εκτιµητική. Boutsikas M.V. (2003), Σηµειώσεις Στατιστικής ΙΙΙ, Τµήµα Οικονοµικής Επιστήµης, Πανεπιστήµιο Πειραιώς.

ΜΗΧΑΝΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ ΥΛΙΚΩΝ

σ.π.π. της 0.05 c 0.1

Σχ. 1 Eναλλασσόμενες καταπονήσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ ΣΗΜΕΙΩΣΕΙΣ ΕΙΓΜΑΤΟΛΗΨΙΑΣ Β. Α. ΑΓΓΕΛΗΣ

ΠΡΟΒΛΗΜΑ ΡΟΗΣ ΥΠΕΡΑΝΩ ΤΟΠΙΚΗΣ ΑΝΥΨΩΣΕΩΣ

ΜΗΧΑΝΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ ΥΛΙΚΩΝ

ιάστηµα εµπιστοσύνης της µ 1

S AB = m. S A = m. Υ = m

Έλεγχος Υποθέσεων II. Στατιστική IΙ, Τμήμα Ο.Ε. ΑΠΘ. Χ. Εμμανουηλίδης, 1

ΤΕΧΝΙΚΗ ΜΗΧΑΝΙΚΗ IΙ ΕΦΕΛΚΥΣΜΟΣ ΘΛΙΨΗ ΡΑΒ ΩΤΩΝ ΦΟΡΕΩΝ

5η ΣΕΙΡΑ ΑΣΚΗΣΕΩΝ - ΑΠΑΝΤΗΣΕΙΣ ΚΑΙ ΣΧΟΛΙΑ

1. Η κανονική κατανοµή

ΕΙΣΑΓΩΓΙΚΕΣ ΔΙΑΛΕΞΕΙΣ ΒΑΣΙΚΟΥ ΕΡΓΑΣΤΗΡΙΟΥ ΦΥΣΙΚΗΣ I

Ψηφιακός Έλεγχος. 8 η διάλεξη Σφάλματα. Ψηφιακός Έλεγχος 1

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΑΓΡΟΤΙΚΗΣ ΑΝΑΠΤΥΞΗΣ ΚΟΥΤΡΟΥΜΑΝΙ ΗΣ Θ. ΖΑΦΕΙΡΙΟΥ Ε.

Χάραξη γραφηµάτων/lab Graphing

Είδη σφαλµάτων. Σφάλµατα στις παρατηρήσεις. Θεωρία Σφαλµάτων ΑΚΡΙΒΕΙΕΣ ΙΕΙΚΟΝΙΚΩΝ ΑΠΟ ΟΣΕΩΝ

Άσκηση 19 Εξαναγκασμένες ηλεκτρικές ταλαντώσεις και συντονισμός

Στατιστικοί Ελεγχοι. t-έλεγχος για την σύγκριση των µέσων δύο πληθυσµών. Έλεγχος 5: Έλεγχος της οµοιογένειας δύο πληθυσµών µε διακυµάνσεις σ 1

ΒΑΣΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ (ΣΥΝΕΧΕΙΑ)

Κεφάλαιο 1: Εισαγωγή... 11

ρ. Ευστρατία Μούρτου

ΘΕΡΜΙΟΝΙΚΗ ΕΚΠΟΜΠΗ ΗΛΕΚΤΡΟΝΙΩΝ

ΑΡΙΣΤΗ ΣΥΝΘΕΣΗ ΧΑΡΤΟΦΥΛΑΚΙΩΝ. 4.1 Εισαγωγή

( ) ( ) ( ( )) (( ) ) ( t) ( t) ( ) ( ) Επικαµπύλια ολοκληρώµατα. σ = και την σ, δηλαδή την. συνεχής πραγµατική συνάρτηση. Έστω U R ανοικτό σύνολο και

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ 13 Ιουνίου 2010

( ) ( ) ( ( )) (( ) ) ( t) ( t) ( ) ( ) Επικαµπύλια ολοκληρώµατα. σ = και την σ, δηλαδή την. συνεχής πραγµατική συνάρτηση. Έστω U R ανοικτό σύνολο και

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

1 Το Μεθοδολογικό Πλαίσιο Μέσου- ιακύμανσης... 11

1. Έλεγχος Υποθέσεων. 1.1 Έλεγχοι για την µέση τιµή πληθυσµού

και ονομάζεται μηδενική υπόθεση (null hypothesis), και η άλλη με H

ΘΕΩΡΗΤΙΚΗ ΜΗΧΑΝΙΚΗ Ι Σεπτέµβριος β) Υλικό σηµείο µάζας m κινείται στον άξονα Οx υπό την επίδραση του δυναµικού

ΕΟ31 ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΙΟΙΚΗΣΗ. Τόμος : Θεωρία Χαρτοφυλακίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΚΕΦΑΛΑΙΟ 8 ΜΕΤΑ ΟΣΗ ΤΩΝ ΤΑΣΕΩΝ ΛΟΓΩ ΕΠΙΒΟΛΗΣ ΕΞΩΤΕΡΙΚΩΝ ΦΟΡΤΙΩΝ

ο εκτιμητής LS είναι n 1 x y 2 t Οι βασικές ιδιότητες του εκτιμητή είναι: ( ) = β, αμεροληψία, . Αν έχουμε n x C, τότε Var Τότε, θα έχουμε Var (

10. Στατιστικές συναρτήσεις και δειγματοληπτικές κατανομές

ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ ERSA

Νόμος των Wiedemann-Franz

( α ). Να δηλωθεί η συνάρτηση με την genter. ( β ). Να εφαρμοστεί τον αντίστροφο μετασχηματισμό Laplace και να αποδειχθεί Θεωρητικά.

Κεφάλαιο 5 ΜΕΤΡΗΣΗ ΤΗΣ ΣΥΝΘΕΤΗΣ ΑΝΤΙΣΤΑΣΗΣ ΤΩΝ ΙΣΤΩΝ

Διαφορές μεταξύ Ασφαλίσεων Ζωής και Γενικών

ΚΕΦΑΛΑΙΟ 2 Ο ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ ΚΑΙ ΚΑΤΑΝΟΜΕΣ ΤΟΥΣ

Γ D µε αρχικό σηµείο το ( a, ( ) ( ) είναι µια άλλη και καταλήγει στο ( x, τότε (1) Γ ξεκινούν από το σηµείο (, ) και ( x,

ΙΑΡΘΡΩΣΗ ΜΑΘΗΜΑΤΟΣ. Εξίσωση Schrıdinger. Χρησιµότητα Εξαγωγή της εξίσωσης Schrıdinger. Περιοχές κυµατοδήγησης οπτικού παλµού

Σχεδιασµός, Μεθοδολογία και Λογισµικό Παρακολούθησης Συγκλίσεων Σηράγγων µε Μεθόδους Τεχνικής Γεωδαισίας

Σεισμολογία. Ελαστική Τάση, Παραμόρφωση (Κεφ.2, Σύγχρονη Σεισμολογία)

Ολοκληρωτικός Λογισμός πολλών μεταβλητών

ΔΙΑΧΕΙΡΙΣΗ ΕΠΕΝΔΥΣΕΩΝ

ΑΝΑΛΥΣΗ ΚΑΙ ΙΑΧΕΙΡΙΣΗ ΧΑΡΤΟΦΥΛΑΚΙΟΥ ΚΑΙ ΧΡΗΜΑΤΙΣΤΗΡΙΑΚΕΣ ΕΠΕΝ ΥΣΕΙΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ

12.1 Σχεδιασμός αξόνων

ΕΙΣΗΓΗΤΗΣ Κωνταντινος Πετροπουλος Επικουρος Καηγητης Τμημα Μαηματικων Πανεπιτημιου Πατρων ΕΠΙΤΡΟΠΗ Φιλιππος Αλεβιζος Αναπληρωτης Καηγητης Τμημα Μαηματ

Εφαρµογή κριτηρίου παραβολοειδούς εκ περιστροφής στη Βραχοµηχανική

Γραπτή Εργασία 2 Διαχείριση Χαρτοφυλακίου. Γενικές οδηγίες

όπου Z 1,Z 2,,Z n ανεξ. τ.μ. που ακολουθούν N(0,1), δηλαδή μ Δt + σ Δt Zi σ 2 Δt) για κάποιες σταθερές μ, σ 2. Οι τ.μ. Δ t Z1, Δt

Οριζόντια βολή. Επιλέγοντας την ταχύτητα βολής.

Το θεώρηµα του Green

ΚΕΦΑΛΑΙΟ 7. Ροπή και Στροφορµή Μέρος πρώτο

ΕΝΟΤΗΤΑ Γ ΘΕΩΡΙΑ ΕΙΓΜΑΤΟΛΗΨΙΑΣ. Καθηγητή Κων/νου Ευσταθίου, Εργαστήριο Αναλυτικής Χηµείας Πανεπιστηµίου Αθηνών

6. ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΣΤΗ ΓΡΑΜΜΙΚΗ ΣΥΣΧΕΤΙΣΗ

ΣΤΕΑΜΧ ΕΛΕΓΧΟΣ ΕΚΤΙΜΗΣΗ ΒΛΑΒΩΝ ΠΡΟΤΑΣΕΙΣ ΕΠΙΣΚΕΥΗΣ Φ.Ο. ΣΤΟ ΠΡΩΗΝ ΚΤΙΡΙΟ ΚΕΤΕΣ ΣΠΟΥ ΑΣΤΗΣ: ΛΓΟΣ (ΜΧ) ΒΑΡΛΑΜΟΣ ΕΥΑΓΓΕΛΟΣ ΙΟΥΛΙΟΣ 2006

Περιεχόμενα. Πρόλογος... 15

ΕΦΑΡΜΟΓΕΣ ΘΕΩΡΙΑΣ ΕΛΑΣΤΙΚΟΤΗΤΑΣ

ΘΕΩΡΗΤΙΚΗ ΜΗΧΑΝΙΚΗ Ι - ΙΟΥΝΙΟΣ Θέµατα και Λύσεις

Στοχαστική Προσοµοίωση ισδιάστατων Τυχαίων Πεδίων µε ιατήρηση της Εµµονής

Γιατί; Το παραδοσιακό υπόδειγμα: y t = β 1 + β 2 x 2t β k x kt + u t, ή y = Xβ + u. Υποθέτουμε u t. N(0,σ 2 ).

Θεωρία Στοχαστικών Σηµάτων: Εκτίµηση Φάσµατος. Παραµετρικά µοντέλα

Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού CHIC Analysis

ΥΠΟΛΟΓΙΣΜΟΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗ ΜΟΝΟΒΑΘΜΙΟΥ ΜΕΙΩΤΗΡΑ

Σχήµα 5.1 : Η κανονική κατανοµή, όπου τ = (x-μ)/σ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Μια ακόμη πιο δύσκολη συνέχεια.

6η ΣΕΙΡΑ ΑΣΚΗΣΕΩΝ - ΜΕΤΑΔΟΣΗ ΤΑΣΕΩΝ ΣΤΟ ΕΔΑΦΟΣ ΑΠΑΝΤΗΣΕΙΣ ΚΑΙ ΣΧΟΛΙΑ Επιμέλεια: Γιώργος Μπελόκας, Υποψήφιος Διδάκτωρ Ε.Μ.Π.

ειγματοληπτικές κατανομές

Θηκόγραμμα (box-plot) Γραφική παρουσίαση των μέτρων θέσης μιας μεταβλητής

ΥΠΟΓΕΙΑ ΑΝΑΠΤΥΞΗ. Μέθοδος θαλάμων και στύλων Εφαρμογές. A. Μπενάρδος Λέκτορας ΕΜΠ. Δ. Καλιαμπάκος Καθηγητής ΕΜΠ

Σχεδιασµός Φορέων από Σκυρόδεµα µε βάση τον Ευρωκώδικα 2

S συµβολίζονται ως. Είδη φορτίων: (α) επιφανειακά (π.χ. λόγω επαφής του θεωρούµενου σώµατος µε άλλα σώµατα),

Transcript:

Ελληνικό Στατιτικό Ιντιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιτικής (005) ελ.57-65 ΕΛΛΕΙΨΕΙΣ ΕΜΠΙΣΤΟΣΥΝΗΣ ΣΤΑ ΠΑΡΑΓΟΝΤΙΚΑ ΕΠΙΠΕΔΑ ΤΗΣ AFC Γεώργιος Μενεξές, Άγγελος Μάρκος, Γιάννης Παπαδημητρίου Τμήμα Εφαρμομένης Πληροφορικής, Πανεπιτήμιο Μακεδονίας ΠΕΡΙΛΗΨΗ Στην περίπτωη δύο κατηγορικών μεταβλητών, όπου η υλλογή των δεδομένων έχει γίνει με τυχαία δειγματοληψία, οι υντεταγμένες των προβολών των ημείων γραμμών και τηλών, επί των παραγοντικών επιπέδων που παράγονται από την εφαρμογή της Παραγοντικής Ανάλυης των Αντιτοιχιών (AFC), αποτελούν εκτιμήεις των πραγματικών υντεταγμένων, αυτών, δηλαδή, που θα προέκυπταν από την εφαρμογή της AFC τα δεδομένα ολόκληρου του υπό εξέταη πληθυμού. Έτι, το πρόβλημα που τίθεται είναι ο προδιοριμός περιοχών εμπιτούνης (1-α)% για τις πραγματικές θέεις των ημείων (γραμμών, τηλών) επί των παραγοντικών επιπέδων. Στην παρούα εργαία προτείνουμε μέθοδο κατακευής ελλείψεων εμπιτούνης (1-α)% με κέντρα τις προβολές των ημείων γραμμών (τηλών) επί των παραγοντικών επιπέδων της AFC η οποία εφαρμόζεται ε πίνακα υμπτώεων δύο κατηγορικών μεταβλητών. 1. ΕΙΣΑΓΩΓΗ Στην περίπτωη δύο κατηγορικών μεταβλητών, όπου η υλλογή των δεδομένων έχει γίνει με τυχαία δειγματοληψία, οι υντεταγμένες των προβολών των ημείων γραμμών και τηλών, επί των παραγοντικών επιπέδων, τα οποία παράγονται από την εφαρμογή της AFC (Benzécri, 199) τον αντίτοιχο πίνακα υμπτώεων απολύτων υχνοτήτων, αποτελούν εκτιμήεις των πραγματικών υντεταγμένων, αυτών, δηλαδή, που θα προέκυπταν από την εφαρμογή της AFC τα δεδομένα ολόκληρου του υπό εξέταη πληθυμού. Έτι, το πρόβλημα που τίθεται είναι ο προδιοριμός περιοχών εμπιτούνης (1-α)% για τις πραγματικές θέεις των ημείων (γραμμών, τηλών) επί των παραγοντικών επιπέδων της AFC. Το πρόβλημα αυτό υνδέεται με τον έλεγχο της «εξωτερικής ταθερότητας» των αποτελεμάτων που προκύπτουν από την εφαρμογή μεθόδων βέλτιτης κλιμάκωης όπως είναι η AFC, η Μη Γραμμική Ανάλυη ε Κύριες Συνιτώες, κ.ά. (Greenacre 1984, Greenacre 1993, Gifi 1996). Η εξωτερική ταθερότητα αναφέρεται το πόο υνεπή είναι τα παραγόμενα αποτελέματα τη θεωρητική περίπτωη που η ανάλυη επαναληφθεί ε κάποιο άλλο τυχαίο δείγμα από τον ίδιο πληθυμό. Στο χώρο της Πολυδιάτατης - 57 -

Ανάλυης Δεδομένων το ζήτημα αντιμετωπίζεται χεδόν αποκλειτικά με μεθόδους Bootstrap (Efron & Tibshirani, 1993). Όμως, η εφαρμογή τους, την περίπτωη της AFC, δημιουργεί προβληματιμούς χετικά με την επιλογή της κατάλληλης μεθοδολογίας για την υλοποίηη τους. Σημαντικές αποφάεις θα πρέπει να ληφθούν από τους αναλυτές χετικά: α) με την μορφή του πίνακα δεδομένων από τον οποίο θα γίνει η δειγματοληψία με επανατοποθέτηη, β) το πλήθος των δειγμάτων, γ) τη μέθοδο διόρθωης (ή όχι) μεροληψίας των εκτιμητών, δ) την προβολή ή όχι των δειγμάτων ε ένα χώρο αναφοράς, κ.ά. Για περιότερες πληροφορίες χετικά με την εφαρμογή της Bootstrap το πλαίιο της AFC παραπέμπουμε τους Greenacre (1984), Greenacre (1993), Gifi (1996) και Marks (1994). Στην παρούα εργαία προτείνουμε μέθοδο κατακευής (1-α)% ελλείψεων εμπιτούνης (ε.ε.) με κέντρα τις προβολές των γραμμών (τηλών) επί των παραγοντικών επιπέδων. Τα μήκη των αξόνων και ο προανατολιμός τους καθορίζονται με μέθοδο που υνδυάζει το μεταχηματιμό ε κύριες υνιτώες, οριμένες ιδιότητες της διδιάτατης κανονικής κατανομής, την απόταη Mahalanobis, τη χ κατανομή και το επίπεδο ημαντικότητας α.. ΤΟ ΓΕΝΙΚΟ ΠΡΟΒΛΗΜΑ Το γενικό πρόβλημα που προτείνουμε να επιλυθεί αρχικά μπορεί να διατυπωθεί ως εξής: δοθείης της κατ εκτίμηη θέης ενός ημείου ε ένα ορθογώνιο ύτημα υντεταγμένων του R, να προδιοριτεί περιοχή την οποία αναμένεται, με προκαθοριμένη πιθανότητα 1-α, να βρίκεται η πραγματική του θέη θεωρώντας τις υντεταγμένες του ως τυχαίες μεταβλητές. Η «μεταφορά» και η επίλυη του προβλήματος το πλαίιο της AFC παρουιάζει οριμένες ιδιαιτερότητες όπως: α) ο προανατολιμός του υτήματος υντεταγμένων είναι αυθαίρετος, β) υπάρχει διαφορετικός βαθμός «αβεβαιότητας», με την έννοια της αδράνειας, κατά μήκος των παραγοντικών αξόνων, και γ) οι δειγματικές υντεταγμένες των ημείων μπορούν να θεωρηθούν είτε ως εκτιμήεις των πραγματικών είτε ως μέοι όροι βέλτιτα ποοτικοποιημένων (μεταχηματιμένων) βαθμών (score) των πειραματικών ή δειγματοληπτικών μονάδων. Στην παρούα εργαία θεωρούμε ότι οι δειγματικές υντεταγμένες των ημείων αποτελούν εκτιμήεις των πραγματικών και αντιμετωπίζονται ως τυχαίες μεταβλητές. 3. ΕΠΙΛΥΣΗ ΤΟΥ ΓΕΝΙΚΟΥ ΠΡΟΒΛΗΜΑΤΟΣ Έτω ημείο A(,), όπου και είναι οι διαθέιμες αμερόληπτες εκτιμήεις των υντεταγμένων του ε ένα ορθογώνιο ύτημα υντεταγμένων (U V) του R. Αν θεωρήουμε τα και ως τυχαίες μεταβλητές τότε ο πίνακας διαπορών υνδυαπορών Σ με Σ =, με εν γένει, περιγράφει την αβεβαιότητα της κατ εκτίμηη θέης του ημείου Α κατά μήκων των δύο αξόνων του υτήματος υντεταγμένων. Αν οι εκτιμήεις και - 58 -

ακολουθούν τη Ν (μ, Σ), με μ=[μ, μ ] T το διάνυμα των αντίτοιχων μέων τιμών, τότε μπορούμε να θεωρήουμε ότι οι αναμενόμενες τιμές μ και μ είναι οι άγνωτες πραγματικές υντεταγμένες της θέης του ημείου Α. Αν και είναι δυνατόν να κατακευατούν ξεχωριτά (1-α)% διατήματα εμπιτούνης για τις αναμενόμενες τιμές μ και μ, ωτόο, από πρακτική κοπιά θα ήταν χρήιμο να αναζητήουμε μια «περιοχή εμπιτούνης» το επίπεδο, ανεξάρτητα από το εν γένει αυθαίρετο ύτημα αναφοράς, τέτοια ώτε η πραγματική θέη του Α να βρίκεται μέα ε αυτή με προκαθοριμένη πιθανότητα P=1-α. Η ζητούμενη περιοχή θα μπορούε να είναι μια έλλειψη τέτοια ώτε να λαμβάνεται υπόψη τόο ο διαφορετικός βαθμός αβεβαιότητας της θέης του ημείου κατά μήκων των αξόνων όο και η πιθανή υχέτιη των εκτιμητριών των υντεταγμένων. Έτι, αν x=[,] T και x Ν (μ, Σ) τότε η ποότητα Q, που ορίζεται από την παρακάτω χέη [1], ακολουθεί την κατανομή χ με βαθμούς ελευθερίας (Becker & Gather 001, John 1968). Q=(x-μ) Τ Σ -1 (x-μ) χ [1] Η ποότητα Q δεν είναι παρά η απόταη Mahalanobis του διανύματος x από το διάνυμα μ. Από την [1] υνεπάγεται ότι: P((x-μ) Τ Σ -1 (x-μ) χ ) = 1-α [] Συνεπώς, η ζητούμενη περιοχή εμπιτούνης είναι το εωτερικό της καμπύλης με εξίωη: c: (x-μ) Τ Σ -1 (x-μ) = χ ; α, [3] όπου χ ; α είναι η κρίιμη τιμή της κατανομής χ με βαθμούς ελευθερίας, ε επίπεδο ημαντικότητας α. Στα επόμενα, για λόγους οικονομίας πολλά από τα βήματα των αποδείξεων παραλείπονται. Η καμπύλη c της [3], όπως θα δείξουμε τη υνέχεια, είναι εξίωη έλλειψης με κέντρο το ημείο (μ, μ ). Η βαική ιδέα της προτεινόμενης μεθοδολογίας κατακευής ε.ε. τηρίζεται την εφαρμογή μιας «τοπικής» Ανάλυης ε Κύριες Συνιτώες το ημείο Α. Για το λόγο αυτό, αρχικά, αλλάζουμε το ύτημα αναφοράς μετατοπίζοντας την αρχή του το ημείο (μ, μ ) και, τη υνέχεια το τρέφουμε κατά γωνία φ (θετική φορά) ύμφωνα με τη χέη (Δερμάνης, 1986): x=r(x-μ), [4] όπου x είναι το διάνυμα υντεταγμένων του ημείου Α το νέο ύτημα αναφοράς. Πιο αναλυτικά έχουμε: υνϕ ημϕ μ x= = ημφ υνϕ μ Ο πίνακας Σ το νέο ύτημα αναφοράς δίνεται από τη χέη: Ξ=RΣR T [5] - 59 -

Η γωνία φ μπορεί να επιλεγεί με τρόπο ώτε ο ορθογώνιος πίνακας R να διαγωνιοποιεί τον Σ (Δερμάνης, 1998) με αποτέλεμα ο Ξ να μπορεί να γραφεί: 0 Ξ=, 0 όπου οι διαπορές και είναι ταυτόχρονα και ιδιοτιμές του Σ. Από την [5] υνεπάγεται ότι: Σ=R T ΞR Σ -1 = R T Ξ -1 R [6] Από [6], [4] και [3] έχουμε: (x-μ) T Σ -1 (x-μ)=x T Ξ -1 x= 1 0 = [, ] = + = χ ; α [7] 0 Αν θέουμε p = τότε η [7] γράφεται: α χ ; α + = 1 [8] pα p α Η [8] είναι εξίωη έλλειψης με κέντρο την αρχή του νέου υτήματος αναφοράς, με μήκη ημιαξόνων p α και p α αντίτοιχα των οποίων οι διευθύνεις είναι ίδιες με αυτές των αξόνων των και. Οι, και η γωνία φ μπορούν να υπολογιτούν από τις παρακάτω χέεις: + = + + [9] + = + [10] εφφ = [11] Παρατήρηη 1: Σε πρακτικές εφαρμογές, η ε.ε. προτείνουμε να κατακευάζεται με κέντρο το ημείο που ορίζεται από τις διαθέιμες εκτιμήεις και. Τα μήκη των ημιαξόνων m 1 = p α και m = p α καθώς και η γωνία φ μπορούν να υπολογιτούν μέω των χέεων [9], [10] και [11] με αντικατάταη των δειγματικών εκτιμήεων των παραμέτρων αφού οι πραγματικές τους τιμές είναι υνήθως άγνωτες. Στην περίπτωη αυτή, η ποότητα Q =(x-μ) Τ S -1 (x-μ), όπου S ο δειγματικός πίνακας διαπορών - υνδυαπορών, ακολουθεί αυμπτωτικά την χ κατανομή με βαθμούς ελευθερίας (Becker & Gather 001, Atkinson 1994) και η αντίτοιχη περιοχή αποτελεί αυμπτωτική ε.ε.. Είναι φανερό ότι η εγκυρότητα της μεθόδου βαίζεται τελικά το πόο «καλές» εκτιμήεις θα έχουμε τη διάθεή μας για τα τοιχεία του πίνακα Σ. - 60 -

4. «ΜΕΤΑΦΟΡΑ» ΚΑΙ ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΣΤΗΝ AFC Το πρόβλημα που πρέπει να αντιμετωπιτεί την περίπτωη της AFC είναι η εκτίμηη των τοιχείων του πίνακα Σ, δηλαδή ο καθοριμός των τοιχείων του πίνακα S (βλέπε Παρατήρηη 1) για κάθε ημείο γραμμής (τήλης) του πίνακα υμπτώεων απολύτων υχνοτήτων F των δύο μεταβλητών τον οποίο θα εφαρμοτεί η AFC. Στη χετική βιβλιογραφία αναφέρονται δύο βαικές μέθοδοι εκτίμηης: 1) μέθοδοι που τηρίζονται τις τεχνικές Bootstrap και Jackknife (Van der Brg & De Leew 1988, Heiser & Melman 1983, Marks 1994), και β) η μέθοδος Δέλτα (Rao 00, Israëls 1987, Gifi 1996). Στο πλαίιο της παρούας εργαίας προτείνουμε τη μέθοδο Δέλτα διότι: α) τα τυπικά φάλματα των εκτιμητών της μεθόδου είναι «κοντά» τα τυπικά φάλματα που προκύπτουν από την εφαρμογή των μεθόδων Bootstrap, β) οι εκτιμητές που υπολογίζονται ακολουθούν αυμπτωτικά Κανονική Κατανομή, γ) η μέθοδος είναι διαθέιμη, μέω προγραμματιμού, το υπούτημα Categories του τατιτικού πακέτου SPSS (Melman & Heiser, 001), και δ) αποφεύγονται οι χετικοί προβληματιμοί που αναφέρθηκαν την Ειαγωγή της παρούας εργαίας. Στο ημείο αυτό λαμβάνουμε υπόψη ένα βαικό υμπέραμα που προκύπτει από το υνδυαμό αποτελεμάτων χετικών μελετών (Andersen 1991, Nishisato 1980, Aït-Sidi-Allal et al. 004, Marks 1994), το οποίο υμπυκνώνεται την παρακάτω πρόταη: Οι παραγοντικές υντεταγμένες των ημείων γραμμών και τηλών, όπως αυτές υπολογίζονται από την AFC, το πλαίιο της Γαλλικής Σχολής Ανάλυης Δεδομένων, είναι αμερόληπτοι εκτιμητές ταθμιμένων ελαχίτων τετραγώνων. Τα αντίτοιχα διανύματα των υντεταγμένων ακολουθούν αυμπτωτικά πολυδιάτατη Κανονική Κατανομή. Στη υνέχεια, αφού εκτιμηθούν τα τοιχεία του πίνακα S για κάθε ημείο γραμμής (τήλης) και λαμβάνοντας υπόψη και την προηγούμενη πρόταη εφαρμόζουμε την διαδικαία κατακευής των ε.ε., όπως το γενικό πρόβλημα. Η κατακευή «υντηρητικών» ελλείψεων εμπιτούνης μπορεί να επιτευχθεί με τη χρήη ορίων Bonferroni, όπου το επίπεδο εμπιτούνης α διορθώνεται ε α/r για τα ημεία γραμμών και ε α/c για τα ημεία τηλών, όπου r και c είναι το πλήθος γραμμών και τηλών αντίτοιχα του πίνακα F. Τα αποτελέματα της AFC μπορούν να «ενιχυθούν» με ταυτόχρονες πολλαπλές υγκρίεις (ελέγχους) των προφίλ των γραμμών (ή/και τηλών) με τη μέθοδο που πρότεινε ο Gabriel (1966). 5. ΠΑΡΑΔΕΙΓΜΑ Στον Πίνακα 1 παρουιάζεται ο πίνακας υμπτώεων απολύτων υχνοτήτων, τα ύνολα γραμμών και τηλών (περιθώριες κατανομές) καθώς και τα προφίλ (%) των γραμμών, για δύο κατηγορικές μεταβλητές Χ και Υ, με 4 και 5 κλάεις αντίτοιχα, ε ένα τυχαίο δείγμα 438 δειγματοληπτικών μονάδων. Χωρίς περιοριμό της γενικότητας, θεωρούμε ότι το ενδιαφέρον της μελέτης ετιάζεται τη ύγκριη μόνο των προφίλ των 4 κλάεων της μεταβλητής Χ και την αιτιολόγηη των ομοιοτήτων ή/και διαφορών, που ενδεχομένως θα προκύψουν, ε χέη με τη μεταβλητή Υ. Η - 61 -

εφαρμογή της AFC, μέω του SPSS er. 11.5, τα δεδομένα του Πίνακα 1 ανέδειξε δύο παραγοντικούς άξονες που ερμηνεύουν το 98,5% της ολικής αδράνειας. Για λόγους οικονομίας, παραλείπουμε το χολιαμό και την ερμηνεία των αναλυτικών αποτελεμάτων που παράγονται από την AFC και παρουιάζουμε μόνο την εφαρμογή της προτεινόμενης μεθοδολογίας για την κατακευή 95% ε.ε. γύρω από τα ημεία που αντιτοιχούν τις 4 κλάεις της Χ το παραγοντικό επίπεδο 1. Η υλοποίηη της προτεινόμενης μεθοδολογίας έγινε μέω προγράμματος που αναπτύχθηκε το λογιμικό Matlab er. 7.0. Στο Διάγραμμα 1 απεικονίζονται οι 95% ε.ε. γύρω από τα ημεία που αντιτοιχούν τις 4 κλάεις της Χ (Tr_1, Tr_, Tr_3 και Tr_4). Πίνακας 1: Πίνακας Συμπτώεων των Χ και Υ Υ C1 C C3 C4 C5 Σύνολα Tr_1 Συχνότητες 8 4 19 56 149 % 18,8% 16,1% 1,8% 37,6% 14,8% 100,0% Tr_ Συχνότητες 4 15 9 4 5 57 Χ % 7,0% 6,3% 15,8% 4,1% 8,8% 100,0% Tr_3 Συχνότητες 10 16 18 38 8 110 % 9,1% 14,5% 16,4% 34,5% 5,5% 100,0% Tr_4 Συχνότητες 5 19 17 4 39 1 % 4,1% 15,6% 13,9% 34,4% 3,0% 100,0% Σύνολα Συχνότητες 47 74 63 160 94 438 % 10,7% 16,9% 14,4% 36,5% 1,5% 100,0% Πηγή: Gabriel (1966, ελ. 1085) Η εφαρμογή της μεθόδου Δέλτα έδωε τα αποτελέματα που παρουιάζονται τον Πίνακα. Πίνακας : Αποτελέματα της μεθόδου Δέλτα Παραγοντικοί Άξονες F1 F Var() Var() Coar(, ) Tr_1 0.006463 0.003191 0.003 Tr_ 0.034737 0.0141-0.00806 Tr_3 0.007674 0.007089 0.000737 Tr_4 0.00511 0.006 0.000637 Στη υνέχεια παραθέτουμε μερικούς βαικούς κανόνες ερμηνείας της πληροφορίας που παρουιάζεται το Διάγραμμα 1. Σημεία γραμμών που η αντίτοιχη ε.ε. δεν περιέχει την αρχή των αξόνων είναι ημαντικά και υνειφέρουν τη υχέτιη (εξάρτηη) των δύο μεταβλητών, όπως αυτή ερμηνεύεται από το παραγοντικό επίπεδο 1. Από το διάγραμμα παρατηρούμε ότι τα ημεία Tr_1, Tr_ και Tr_4 είναι ημαντικά ενώ το Tr_3 δεν είναι. Σημεία γραμμών που οι αντίτοιχες ε.ε. δεν τέμνονται έχουν διαφορετικό προφίλ ιδιαίτερα την περίπτωη που οι αντίτοιχοι παραγοντικοί άξονες ερμηνεύουν υψηλό - 6 -

ποοτό της ολικής αδράνειας. Από το διάγραμμα φαίνεται ότι μόνο τα προφίλ των γραμμών Tr_1 και Tr_4 διαφέρουν ημαντικά. Οι υγκρίεις των προφίλ μπορούν να πραγματοποιηθούν με τη μέθοδο του Gabriel, τα αποτελέματα της οποίας προαρμότηκαν, από τους υγγραφείς, ε μορφή υνοπτικής παρουίαης ανάλογης αυτής που χρηιμοποιείται τις πολλαπλές υγκρίεις μέων όρων με μεθόδους όπως του Tkey, του Dncan, κ.ά. (βλέπε Πίνακα 3). Οι πολλαπλοί έλεγχοι είναι μάλλον επιβεβλημένοι την περίπτωη που οι αντίτοιχοι παραγοντικοί άξονες δεν ερμηνεύουν ημαντικό ποοτό της ολικής αδράνειας. Σημεία γραμμών που οι αντίτοιχες ε.ε. έχουν χετικά μικρή επιφάνεια έχουν και πιο ταθερή απεικόνιη με την έννοια της εξωτερικής εγκυρότητας. Από το διάγραμμα φαίνεται ότι η θέη του ημείου Tr_ παρουιάζει τη μεγαλύτερη ατάθεια με αποτέλεμα η ερμηνεία του επί του πρώτου παραγοντικού άξονα να είναι προβληματική αφού η θέη του θα μπορούε να αποδοθεί είτα τα δεξιά είτε τα αριτερά του πρώτου άξονα. Το ίδιο φαίνεται να ιχύει για την ερμηνεία των ημείων Tr_4 και Tr_1 ως προς τη θέη τους το δεύτερο άξονα (πάνω ή κάτω). Διάγραμμα 1: Παραγοντικό επίπεδο 1 με 95% ελλείψεις εμπιτούνης για τα ημεία γραμμών (οι εξωτερικές ελλείψεις αντιτοιχούν ε όρια Bonferroni) Πίνακας 3: Ταυτόχρονες πολλαπλές υγκρίεις των προφίλ των γραμμών (μέθοδος Gabriel) 1. Ζεύγος. Συγκρίεω ν 3. Likelihoo d Ratio- LR 4. Ομοιογενή ς 5. Ομάδα 1 6. Ομοιογενή ς 7. Ομάδα 8. Αποτελέματ α Συγκρίεων Tr_1 s Tr_ 8,140 Tr_1 Tr_1a Tr_1 s Tr_3 8,811 Tr_ Tr_ Tr_ ab Tr_1 s Tr_4,483 Tr_3 Tr_3 Tr_3 ab Tr_ s Tr_3 9,497 Tr_4 Tr_4 b Tr_ s Tr_4 13,746 Tr_3 s Tr_4 3,378 LR=18,040 LR=16,47 () Στατιτικά ημαντική διαφορά ε επίπεδο ημαντικότητας α=0,05. Η κρίιμη τιμή χ της 1 ; 0, 05 =1,06. () Τα προφίλ των γραμμών που ακολουθούνται από κοινό γράμμα δε διαφέρουν τατιτικά ημαντικά, ε α=0,05, ύμφωνα με το τατιτικό έλεγχο του Gabriel - 63 -

6. ΣΥΖΗΤΗΣΗ -ΣΥΜΠΕΡΑΣΜΑΤΑ Η προτεινόμενη μεθοδολογία κατακευής ε.ε. γύρω από τα ημεία γραμμών ή/και τηλών, επί των παραγοντικών επιπέδων που παράγονται από την AFC, παρέχει τόο ένα τατιτικό όο και έναν οπτικό έλεγχο της ταθερότητας και της ημαντικότητας των προβολών των αντίτοιχων ημείων επί των παραγοντικών επιπέδων και αξόνων. Η μέθοδος μπορεί να επεκταθεί και τις τρεις διατάεις με την κατακευή ελλειψοειδών εμπιτούνης. Συνήθως, όμως, τα γραφικά αποτελέματα της AFC παρουιάζονται ε δύο διατάεις. Είναι ημαντικό να τονίουμε ότι η απόφαη των αναλυτών τόο ε χέη με τον αριθμό των διατάεων του χώρου ( ή 3) όο και ε χέη με το ε ποιους υποχώρους θα προβληθούν τα ημεία (π.χ. παραγοντικό επίπεδο 1 ή/και 1 3, κ.λπ.) θα πρέπει να ληφθεί a priori ώτε η ημαντικότητα της θέης των ημείων και οι υγκρίεις των αντίτοιχων προφίλ, μέω των ε.ε., να εντάονται το μεθοδολογικό πλαίιο της επαγωγικής τατιτικής. Αντίθετα, η μέθοδος του Gabriel μπορεί να εφαρμοτεί και εκ των υτέρων, δηλαδή μετά την παρατήρηη των αποτελεμάτων της AFC και των ε.ε.. Τέλος, η μέθοδος μπορεί να εφαρμοτεί και ε πειραματική μελέτη, όπου υπάρχει διάκριη μεταξύ εξαρτημένης και ανεξάρτητης μεταβλητής. Στο παράδειγμα που παραθέαμε, η μεταβλητή Χ θα μπορούε να θεωρηθεί ως ένας ποιοτικός ή ποοτικός παράγοντας με 4 επίπεδα (αγωγές) ενώ η Y ως μεταβλητή απόκριης με 5 διακεκριμένες τιμές. ABSTRACT In the present stdy we propose a method of constrcting (1-α)% confidence ellipses arond the projections of row or/and colmn points onto the factorial planes prodced by the application of Correspondence Analysis AFC pon a contingency table of two categorical ariables. The problem is linked with the isse of external stability of the reslts prodced by AFC. The proposed method is based on the idea to perform a local Principal Component Analysis arond the row/colmn points. ΑΝΑΦΟΡΕΣ Aït-Sidi-Allal, M., Baccini, A. and A. Mondot (004). A new algorithm for estimating the parameters and their asymptotic coariance in correlation and association models. Comptations Statistics & Data Analysis, 45, 389-41. Andersen, E. (1991). The Statistical Analysis of Categorical Data. Springer-Verlag, Berlin-Heidelberg. Atkinson, A.C. (1994). Fast ery robst methods for the detection of mltiple otliers. Jornal of the American Statistical Association, 89(48), 139-1339. Becker, C. and U. Gather (001). The largest nonidentifiable otlier: a comparison of mltiariate simltaneos otlier identification rles. Comptational Statistics and Data Analysis, 36, 119-17. Benzécri, J.-P. (199). Correspondence Analysis Handbook. Marcel Dekker, Inc., New York. - 64 -

Efron, B. and R. Tibshirani (1993). An Introdction to the Bootstrap. Chapman and Hall, New York. Gabriel, K.R. (1966). Simltaneos test procedres for mltiple comparisons on categorical data. Jornal of the American Statistical Association, 61(316), 1081-1096. Gifi, A. (1996). NonLinear Mltiariate Analysis. John Willey & Sons Ltd, Chichester. Greenacre, M. (1984). Theory and Applications of Correspondence Analysis. Academic Press, London. Greenacre, M. (1993). Correspondence Analysis in Practice. Academic Press, London. Heiser, W. & J. Melman (1983). Constrained mltidimentional scaling. Applied Psychological Measrement, 7, 381-404. Israëls, A. (1987). Eigenale techniqes for Qalitatie Data. DSWO Press, Leiden. John, S. (1968). A central tolerance region for the mltiariate normal distribtion. Jornal of the Royal Statistical Society. Series B (Methodological), 30(3), 599-601. Lebart, L., Morinea, A. and K. Warwick (1984). Mltiariate Descriptie Statistical Analysis. Correspondence Analysis and Related Techniqes for Large Matrices. John Willey & Sons, New York. Marks, M. (1994). Bootstrap Confidence Regions in Nonlinear Mltiariate Analysis. DSWO Press, Leiden Uniersity, Leiden. Melman, J. and W. Heiser (001). SPSS Categories 11.0. SPSS, Inc., Chicago. Nishisato, S. (1980). Analysis of Categorical Data: Dal Scaling and its Applications. Uniersity of Toronto Press, Toronto. Rao, C.R. (00). Linear Statistical Inference and its Applications. John Willey & Sons, New York. Van der Brg, E. and J. De Leew (1988). Use of the mltinomial jack-knife and bootstrap in generalized non-linear canonical correlation analysis. Applied Stochastic Models and Data Analysis, 4, 159-17. Δερμάνης, Α. (1986). Συνορθώεις Παρατηρήεων και Θεωρία Εκτίμηης, Τόμος 1. Εκδόεις ΖΗΤΗ, Θεαλονίκη. Δερμάνης, Α. (1998). Γραμμική Άλγεβρα και Θεωρία Πινάκων. Εκδόεις ΖΗΤΗ, Θεαλονίκη. - 65 -