ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

Σχετικά έγγραφα
Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού CHIC Analysis

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ Τµήµα Εφαρµοσµένης Πληροφορικής

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

ΔΙΑΧΡΟΝΙΚΗ ΕΞΕΛΙΞΗ ΤΗΣ ΣΧΕΤΙΚΗΣ ΘΕΣΗΣ ΝΟΜΙΣΜΑΤΙΚΟΥΣ ΚΑΙ ΤΟΥΣ ΠΡΑΓΜΑΤΙΚΟΥΣ ΔΕΙΚΤΕΣ

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ)

Λογιστική Θεωρία και Έρευνα

ΜΕΤΑΠΤΥΧΙΑΚΟ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗ ΕΠΙΧΕΙΡΗΜΑΤΙΚΗ ΠΛΗΡΟΦΟΡΙΚΗ. ΘΕΣΣΑΛΟΝΙΚΗ, Σεπτέμβριος 2006

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΚΑΘΟΡΙΣΜΟΣ ΜΕΓΕΘΟΥΣ ΕΙΓΜΑΤΟΣ ΣΤΗΝ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΑΝΤΙΣΤΟΙΧΙΩΝ (AFC)

Βοήθεια στην Ερµηνεία των Αποτελεσµάτων της Παραγοντικής Ανάλυσης των Αντιστοιχιών & Αλγόριθµοι Κατασκευής και Ανάλυσης Ειδικών Πινάκων Εισόδου

Οδηγίες Χρήσης του CHIC Analysis v1.1

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

«ΣΤΑΤΙΣΤΙΚΗ ΕΡΕΥΝΑ ΚΑΙ ΑΝΑΛΥΣΗ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΗΛΕΚΤΡΟΝΙΚΗΣ ΠΡΟΒΟΛΗΣ ΣΤΗΝ ΚΥΠΡΙΑΚΗ ΑΓΟΡΑ»

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΗΣ ΕΠΙ ΟΣΗΣ ΤΩΝ ΦΟΙΤΗΤΩΝ ΥΟ ΑΚΑ ΗΜΑΪΚΩΝ ΤΜΗΜΑΤΩΝ ΕΝΟΣ ΑΕΙ ΩΣ ΠΡΟΣ ΤΟ ΣΥΣΤΗΜΑ ΕΙΣΑΓΩΓΗΣ ΤΟΥΣ ΣΤΗ ΤΡΙΤΟΒΑΘΜΙΑ ΕΚΠΑΙ ΕΥΣΗ

Εισαγωγή στη Στατιστική

ΜΙΑ ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΜΑΘΗΤΩΝ ΕΝΟΣ ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ 2000 ΩΣ ΤΟ 2013.

Ενότητα 1: Πληθυσμός και δείγμα Είδη Μεταβλητών - Περιγραφική στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΧΡΟΝΟΙ ΑΝΑΜΟΝΗΣ ΜΕΧΡΙ ΤΗΝ ΠΡΩΤΗ ΕΜΦΑΝΙΣΗ ΣΧΗΜΑΤΙΣΜΩΝ ΣΕ ΜΙΑ ΔΙΔΙΑΣΤΑΤΗ ΑΚΟΛΟΥΘΙΑ ΤΡΙΤΙΜΩΝ ΔΟΚΙΜΩΝ

Βιοστατιστική ΒΙΟ-309

Πίνακες. Ι.Ε.Κ ΓΛΥΦΑΔΑΣ Τεχνικός Τεχνολογίας Internet Αλγοριθμική Ι (Ε) Σχολ. Ετος A Εξάμηνο

Από τα Δεδομένα στις Πληροφορίες - Μέρος Ι (Ταξινόμηση, Επιλογή, Μερικά Αθροίσματα)

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΤΑΞΙΝΟΜΙΚΗ ΑΝΑΛΥΣΗ ΓΙΑ ΕΞΑ ΙΑΣΤΑΤΗ ΙΩΝΥΜΙΚΗ ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΑΚΤΙΝΟ ΙΑΓΝΩΣΤΙΚΗ ΤΗΣ ΠΝΕΥΜΟΝΟΚΟΝΙΑΣΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 12ο

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μάθηµα 11. Κεφάλαιο: Στατιστική

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

ΕΡΩΤΗΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ 5 ο εξάμηνο

ΤΑ ΣΧΕΔΙΑ ΤΩΝ ΜΑΘΗΤΩΝ Γ ΛΥΚΕΙΟΥ ΤΗΣ ΡΟΔΟΥ ΜΕΤΑ ΤΗΝ ΑΠΟΦΟΙΤΗΣΗ ΤΟΥΣ. ΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΜΙΑΣ ΕΜΠΕΙΡΙΚΗΣ ΕΡΕΥΝΑΣ

Διαγωνισμός Στατιστικής ΕΛΣΤΑΤ 2018 Κατηγορία Α: Γενικά και Επαγγελματικά Λύκεια Όνομα ομάδας: ΣΤΑΤ2 Εκπαιδευτική μονάδα: Εκπαιδευτική Αναγέννηση

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 5 ΣΕΛΙ ΕΣ

ΠΡΟΤΙΜΗΣΕΙΣ ΤΜΗΜΑΤΩΝ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΑΠΟ ΤΟΥ ΥΠΟΨΗΦΙΟΥΣ ΦΟΙΤΗΤΕΣ

ΤΕΤΡΑ ΙΑ ΑΝΑΛΥΣΗΣ Ε ΟΜΕΝΩΝ, ΤΕΥΧΟΣ 15 (σσ ) DATA ANALYSIS BULLETIN, ISSUE 15 (pp ) Ιεραρχική Ανάλυση

ΔΙΕΡΕΥΝΗΣΗ ΣΧΕΤΙΚΗΣ ΕΠΙΚΙΝΔΥΝΟΤΗΤΑΣ ΟΔΟΥ ΑΝΑ ΗΛΙΚΙΑ ΟΔΗΓΟΥ ΣΥΝΑΡΤΗΣΕΙ ΕΠΙΛΕΓΜΕΝΩΝ ΓΕΩΜΕΤΡΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΗΣ ΓΡΑΜΜΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

Η ΚΑΤΑΝΟΜΗ ΤΟΥ EΠIΠEΔOΥ ΕΚΠΑΙΔΕΥΣΗΣ ΣΤΟΥΣ ΝΟΜΟΥΣ ΤΗΣ ΕΛΛΑΔΑΣ ΣΥΜΦΩΝΑ ΜΕ ΤΗΝ ΑΠΟΓΡΑΦΗ ΤΟΥ 2001

Α.Σ.ΠΑΙ.Τ.Ε. Π.Μ.Σ. ΕΠΙΣΤΗΜΕΣ ΤΗΣ ΑΓΩΓΗΣ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

ICAP GROUP S.A. ΑΝΑΘΕΩΡΗΣΗ ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΩΝ ΥΠΟΔΕΙΓΜΑΤΩΝ

Επιλογή χαρακτηριστικών

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Βασικές έννοιες. Παραδείγµατα: Το σύνολο των φοιτητών που είναι εγγεγραµµένοι

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Διάταξη Θεματικής Ενότητας ΕΠΑ51 / Εφαρμοσμένη Εκπαιδευτική Έρευνα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α

ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΕΦΑΡΜΟΓΗΣ ΚΑΙ ΤΗΣ ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑΣ ΤΩΝ ΚΑΤΕΥΘΥΝΟΜΕΝΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εύρεση ν-στού πρώτου αριθμού

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 5 ΕΠΙΛΟΓΗ ΧΩΡΙΚΩΝ ΟΝΤΟΤΗΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΡΟΤΑΣΗ ΣΥΓΚΡΙΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ME ΤΗΝ ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΑΝΤΙΣΤΟΙΧΙΩΝ: ΣΥΓΚΡΙΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΒΑΘΜΟΥ ΙΚΑΝΟΠΟΙΗΣΗΣ ΑΣΘΕΝΩΝ ΚΑΙ ΙΑΤΡΩΝ

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Παραδοτέο Π.1 (Π.1.1) Εκθέσεις για προµήθεια εκπαιδευτικού υλικού

Αναλυτική Στατιστική

4. ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΑΡΧΗ 2ΗΣ ΣΕΛΙΔΑΣ Γ Α... Β

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Δομές Δεδομένων. Τι είναι η δομή δεδομένων; Έστω η ακολουθία αριθμών: 8, 10,17,19,22,5,12 Λογικό Επίπεδο. Φυσικό Επίπεδο RAM. Ταξινομημένος.

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

Στατιστική ανάλυση αποτελεσμάτων

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΕΙΜΕΝΩΝ: ΘΕΜΑΤΟΛΟΓΙΚΕΣ ΚΑΙ ΣΗΜΑΣΙΟΛΟΓΙΚΕΣ ΑΛΛΗΛΕΠΙΔΡΑΣΕΙΣ

Ανασκόπηση Βιβλιογραφίας. Δρ. Ιωάννης Γκιόσος

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

ΠΙΘΑΝΟΤΗΤΕΣ - ΣΤΑΤΙΣΤΙΚΗ

Η εφαρµογή xsortlab. Οπτικός τρόπος ταξινόµησης

ΝΕΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΥΠΑΡΞΗ ΕΚΤΙΜΗΤΩΝ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ 3-ΠΑΡΑΜΕΤΡΙΚΗ ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ

ΕΚΦΩΝΗΣΕΙΣ. β. Να γράψετε αναλυτικά τα μειονεκτήματα της χρήσης των πινάκων. γ. Να γράψετε ονομαστικά τις τυπικές επεξεργασίες των πινάκων.

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΚΕΦΑΛΑΙΟ 5 o ΣΥΜΠΕΡΑΣΜΑΤΑ

Μεταθέσεις και πίνακες μεταθέσεων

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

Σειρά Προβλημάτων 1 Λύσεις

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΕΥΝΑΣ

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στα Πληροφοριακά Συστήματα

Βιοστατιστική ΒΙΟ-309

Στάδιο Εκτέλεσης

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΜΗΜΑ: Γ2-Γ3

9. ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙ ΕΡΓΑΣΙΑΚΕΣ ΣΧΕΣΕΙΣ ΚΑΙ Η ΚΟΙΝΩΝΙΚΗ ΑΣΦΑΛΙΣΗ ΜΕΣΑ ΑΠΟ ΤΗ ΙΑΧΡΟΝΙΚΗ ΤΟΥΣ ΕΞΕΛΙΞΗ ( )

ΑΝΑΛΥΣΗ ΠΡΟΤΙΜΗΣΕΩΝ ΓΙΑ ΤΗ ΧΡΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΕΝΟΙΚΙΑΖΟΜΕΝΩΝ ΠΟΔΗΛΑΤΩΝ ΣΤΟΝ ΔΗΜΟ ΑΘΗΝΑΙΩΝ

Εφαρμοσμένη Στατιστική

Transcript:

Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ Άγγελος Μάρκος, Γεώργιος Μενεξές, Γιάννης Παπαδημητρίου Τμήμα Εφαρμοσμένης Πληροφορικής, Πανεπιστήμιο Μακεδονίας ΠΕΡΙΛΗΨΗ Η Παραγοντική Ανάλυση των Αντιστοιχιών (AFC) αποτελεί μια από τις σημαντικότερες μεθόδους της Πολυμεταβλητής Στατιστικής Ανάλυσης Δεδομένων. Η μέθοδος εφαρμόζεται σε πίνακες συχνοτήτων, σε λογικούς πίνακες (0-1), σε απλούς πίνακες συμπτώσεων δύο μεταβλητών και σε γενικευμένους πίνακες συμπτώσεων (πίνακες Burt). Στην περίπτωση πολλών μεταβλητών ο συνολικός αριθμός των κλάσεών τους μπορεί να αυξηθεί σε τέτοιο βαθμό που να δυσχεραίνει την ερμηνεία του φαινομένου. Το πρόβλημα που τίθεται είναι το κατά πόσο είναι δυνατό να επιλεγεί υποπίνακας του πίνακα Burt, ο οποίος να περιλαμβάνει το σύνολο των μεταβλητών και η εφαρμογή της AFC σε αυτόν να αποδίδει την πλησιέστερη «εικόνα» του φαινομένου σε αυτή που προκύπτει από την εφαρμογή της μεθόδου στον αρχικό πίνακα Burt. Στο πρόβλημα αυτό που τίθεται για πρώτη φορά στο χώρο της Ανάλυσης Δεδομένων, απαντούμε καταφατικά και στην παρούσα εργασία, προτείνουμε έναν αλγόριθμο επιλογής υποπίνακα από τον πίνακα Burt. Αρχικά, υπολογίζεται η «ενδιαφέρουσα αδράνεια» του πίνακα Burt. Στη συνέχεια, δημιουργούνται όλοι οι δυνατοί υποπίνακες που περιλαμβάνουν συνδυασμούς όλων των μεταβλητών και υπολογίζεται η ενδιαφέρουσα αδράνειά τους. Τελικά, επιλέγεται εκείνος ο υποπίνακας που η ενδιαφέρουσα αδράνειά του μεγιστοποιεί το λόγο «ενδιαφέρουσα αδράνεια υποπίνακα» προς «ενδιαφέρουσα αδράνεια πίνακα Burt». Εφαρμόσαμε τον παραπάνω αλγόριθμο σε τέσσερα διαφορετικά σύνολα δεδομένων με γνωστή a priori δομή. Και στις τέσσερις περιπτώσεις οι απεικονίσεις επί των παραγοντικών επιπέδων ήταν «κοντά» σε αυτές που προκύπτουν από την ανάλυση των αντίστοιχων πινάκων Burt. 1. ΕΙΣΑΓΩΓΗ Η Παραγοντική Ανάλυση των Αντιστοιχιών (AFC) αποτελεί μια περιγραφική μέθοδο της Πολυμεταβλητής Στατιστικής Ανάλυσης Δεδομένων κατάλληλη για τη διερεύνηση των σχέσεων μεταξύ κατηγορικών μεταβλητών (Benzècri 1992, Greenacre 1993, Clausen 1998). Όταν ο πίνακας δεδομένων περιέχει m αντικείμενα-παρατηρήσεις και n κατηγορικές μεταβλητές με n>2, η εφαρμογή της AFC μπορεί να πραγματοποιηθεί - 247 -

είτε στον αντίστοιχο m k πίνακα λογικής περιγραφής 0-1 είτε στο γενικευμένο πίνακα συμπτώσεων (πίνακα Burt) k k, όπου k ο συνολικός αριθμός των κλάσεων των n μεταβλητών. Ένα από τα σημαντικότερα αριθμητικά αποτελέσματα της AFC, τα οποία λαμβάνονται υπόψη για την εξαγωγή συμπερασμάτων, είναι το ποσοστό της αδράνειας που ερμηνεύει ο κάθε παραγοντικός άξονας. Στην περίπτωση μεγάλου αριθμού μεταβλητών, ο συνολικός αριθμός των κλάσεών τους μπορεί να αυξηθεί σε τέτοιο βαθμό ώστε τα ποσοστά ερμηνείας της ολικής αδράνειας στους δύο πρώτους άξονες να θεωρηθούν χαμηλά και η απεικόνιση, επί των παραγοντικών αξόνων φτωχή. Παράλληλα, όσο ελαττώνονται οι διαστάσεις του υπό ανάλυση πίνακα τόσο λεπτομερέστερη είναι η απεικόνιση επί του παραγοντικού επιπέδου (Μάρκος & Παπαδημητρίου, 2003). Επομένως, όταν η μέθοδος εφαρμόζεται στον πίνακα Burt, ο μεγάλος αριθμός των μεταβλητών συχνά δυσχεραίνει την ερμηνεία του φαινομένου. Το πρόβλημα που θέτουμε είναι ο προσδιορισμός εκείνου του υποπίνακα του πίνακα Burt, ο οποίος να περιλαμβάνει το σύνολο των μεταβλητών και η εφαρμογή της AFC σε αυτόν να αποδίδει την πλησιέστερη «εικόνα» του φαινομένου με αυτή που προκύπτει από την εφαρμογή της μεθόδου στον αρχικό πίνακα Burt. Αξίζει να σημειωθεί ότι αυτό το πρόβλημα τίθεται για πρώτη φορά στο πλαίσιο της AFC. Για την πληρέστερη κατανόηση του προβλήματος δίνουμε ένα παράδειγμα εντοπισμού των διαφορετικών υποπινάκων ενός πίνακα Burt. Έστω X 15 15 ο πίνακας Burt με τρεις μεταβλητές, Χ 1, Χ 2, Χ 3 με 7, 6 και 2 κλάσεις αντίστοιχα. Οι υποπίνακες του πίνακα Burt που περιλαμβάνουν το σύνολο των μεταβλητών παρουσιάζονται στο Σχήμα 1. Συγκεκριμένα, σχηματίζονται τρεις διαφορετικοί υποπίνακες διαστάσεων 7 8, 6 9 και 2 13 αντίστοιχα. Σχήμα 1: Γενικευμένος πίνακας συμπτώσεων με τρεις μεταβλητές, X 1 7, X 2 6, X 3 2 και τρεις διαφορετικούς υποπίνακες Το προτεινόμενο κριτήριο επιλογής του «καλύτερου» υποπίνακα του πίνακα Burt βασίζεται στην έννοια της «ενδιαφέρουσας αδράνειας», που ορίζεται ως η μέση n n( n-1) αδράνεια των = σε πλήθος διαφορετικών απλών πινάκων συμπτώσεων 2 2 που σχηματίζουν οι n μεταβλητές ανά δύο (Μενεξές & Παπαδημητρίου, 2004). Ως καλύτερος υποπίνακας επιλέγεται εκείνος που η ενδιαφέρουσα αδράνειά του μεγιστοποιεί το λόγο ενδιαφέρουσα αδράνεια υποπίνακα προς ενδιαφέρουσα αδράνεια πίνακα Burt (Μάρκος, Μενεξές & Παπαδημητρίου, 2005). - 248 -

Εφαρμόσαμε τον προτεινόμενο αλγόριθμο σε τέσσερα διαφορετικά σύνολα δεδομένων με γνωστή a priori δομή. Και στις τέσσερις περιπτώσεις οι απεικονίσεις επί των παραγοντικών επιπέδων ήταν «κοντά» σε αυτές που προκύπτουν από την ανάλυση των αντίστοιχων πινάκων Burt. 2. Ο ΑΛΓΟΡΙΘΜΟΣ Ο αλγόριθμος επιλογής υποπίνακα από τον πίνακα Burt υλοποιήθηκε στη συναρτησιακή γλώσσα MATLAB 6.5. (Marchand & Holland, 2002). Ακολουθεί η περιγραφή του σε φυσική γλώσσα. Είσοδος: Ο αλγόριθμος δέχεται ως είσοδο ένα πίνακα (Burt) έστω X k k, όπου k το συνολικό πλήθος των κλάσεων των n κατηγορικών μεταβλητών. Επιπλέον δέχεται ως είσοδο διάνυσμα k με γενικό στοιχείο k i, i=1,,n που αντιστοιχεί στον αριθμό των κλάσεων της μεταβλητής i, με τη σειρά που αυτές εμφανίζονται στον πίνακα Burt. Βήμα 1 ο : Αρχικά υπολογίζονται οι επιμέρους αδράνειες όλων των απλών πινάκων του πίνακα Burt που σχηματίζουν οι n μεταβλητές ανά δύο. Στην περίπτωση της διασταύρωσης μιας μεταβλητής με τον εαυτό της, η αδράνεια του αντίστοιχου πίνακα δίνεται από τη σχέση (Μενεξές & Παπαδημητρίου, 2004): ij=ki -1, i=1,,n j=1,,n και i=j [1] Στην περίπτωση της διασταύρωσης δύο διαφορετικών μεταβλητών με k και l κλάσεις αντίστοιχα, η αδράνεια του αντίστοιχου πίνακα υπολογίζεται από τη σχέση: p=1 q=1 p q όπου r p είναι το άθροισμα της γραμμής p και 2 rc p q x k l pq - n = ij [2] rc c q το άθροισμα της στήλης q του αντίστοιχου απλού πίνακα συμπτώσεων που σχηματίζουν οι μεταβλητές i και j, i=1,,n j=1,,n και i j. Η ολική αδράνεια του πίνακα Χ υπολογίζεται από την σχέση: n n i=1 j=1 ολ= [3] 2 n Η ενδιαφέρουσα αδράνεια του πίνακα Χ υπολογίζεται από την σχέση: 1 ενδ= ij n [4] i,j=1 n i<j 2 ij - 249 -

Βήμα 2 ο : Υπολογίζεται ο συνολικός αριθμός των προς εξέταση υποπινάκων του πίνακα Burt που περιλαμβάνουν το σύνολο των μεταβλητών. Αν το πλήθος n των μεταβλητών είναι άρτιος, τότε το πλήθος των προς εξέταση διαφορετικών υποπινάκων είναι: n n n + + + n 2 1 2 [5] 2 και αν το n είναι περιττός τότε το πλήθος τους είναι: n n n + + + n 1 [6] 1 2 2 Βήμα 3 ο : Δημιουργούνται όλοι οι συνδυασμοί μεταβλητών του πίνακα Burt με τους οποίους σχηματίζονται όλοι οι διαφορετικοί υποπίνακες. Βήμα 4 ο : Για κάθε υποπίνακα υπολογίζεται η ενδιαφέρουσα αδράνεια καθώς και ο λόγος λ: ενδιαφέρουσα αδράνεια υποπίνακα προς ενδιαφέρουσα αδράνεια του πίνακα Burt. Στη συνέχεια οι λόγοι ταξινομούνται σε φθίνουσα διάταξη. Βήμα 5 ο : Τέλος, ως «καλύτερος» υποπίνακας επιλέγεται εκείνος που μεγιστοποιεί το λόγο ενδιαφέρουσα αδράνεια υποπίνακα προς ενδιαφέρουσα αδράνεια πίνακα Burt. Έξοδος: Εμφανίζονται στην οθόνη, ταξινομημένοι σε φθίνουσα διάταξη, οι λόγοι της ενδιαφέρουσας αδράνειας κάθε διαφορετικού υποπίνακα προς την ενδιαφέρουσα αδράνεια του γενικευμένου πίνακα. Επίσης, εμφανίζεται ο καλύτερος υποπίνακας δηλαδή αυτός που μεγιστοποιεί το παραπάνω κριτήριο καθώς και ο συνδυασμός των μεταβλητών από τις οποίες αυτός σχηματίζεται. 3. ΕΦΑΡΜΟΓΗ Εφαρμόσαμε τον προτεινόμενο αλγόριθμο σε τέσσερα σύνολα δεδομένων με γνωστή a priori δομή: Α) Σύνολο δεδομένων που προέκυψε από πραγματική έρευνα. Το σύνολο δεδομένων 138 3 A προέκυψε από την έρευνα που πραγματοποιήθηκε σε 138 φοιτητές με τρεις μεταβλητές, το «είδος διακοπών» με 6 κλάσεις, το «επάγγελμα του πατέρα» με 7 κλάσεις και το «φύλο» με 2 κλάσεις. Η εφαρμογή του προτεινόμενου αλγόριθμου στον πίνακα Βurt 15 15, όπως αυτός προέκυψε από τον αρχικό πίνακα, έδωσε τρεις διαφορετικούς υποπίνακες «φέτες», δηλαδή υποπίνακες όπου μία από τις μεταβλητές εμφανίζεται στις γραμμές του πίνακα και οι υπόλοιπες στις στήλες: - 250 -

Σχήμα 2: Αποτελέσματα της εφαρμογής του αλγορίθμου στον πίνακα Burt για το σύνολο δεδομένων Α Αδράνειες υποπινάκων Ενδιαφέρουσα Αδράνεια Υποπίνακα / «φέτες» Ενδιαφέρουσα Αδράνεια Πίνακα Burt A 0. 0435 = = 0. 105 = 10. 5% ενδ 0. 416 Β 060. = = 1. 44 = 144% ενδ 0. 416 Γ 061. = = 1. 46 = 146% ενδ 0. 416 α) Τον υποπίνακα A 2 13 με το «φύλο» στις γραμμές και τo «επάγγελμα» και τις «διακοπές» στις στήλες, β) τον υποπίνακα B 7 8 με τις «διακοπές» στις γραμμές και τις άλλες δύο μεταβλητές στις στήλες, και γ) τον υποπίνακα Γ 6 9με το «επάγγελμα» στις γραμμές και τις άλλες στις στήλες. Για κάθε υποπίνακα «φέτα» υπολογίστηκε η επιμέρους αδράνειά του καθώς και ο λόγος λ (Σχήμα 2). Έτσι, ο πρώτος υποπίνακας περιέχει το 10.5% της ενδιαφέρουσας αδράνειας του πίνακα Burt, ο δεύτερος το 144% και ο τρίτος το 146%. Επομένως, σύμφωνα με τον προτεινόμενο αλγόριθμο ως «καλύτερος» υποπίνακας επιλέγεται ο Γ 6 9 με λ=146%. Για να ελέγξουμε την αποτελεσματικότητα του αλγόριθμου εφαρμόσαμε την AFC τόσο στον πίνακα Burt όσο και στον επιλεγμένο υποπίνακα-φέτα με τα παρακάτω αποτελέσματα (Σχήμα 3): Σχήμα 3: Αποτελέσματα της εφαρμογής της AFC στον πίνακα Burt και στον «καλύτερο» υποπίνακα για το σύνολο δεδομένων Α Πίνακας συμπτώσεων (15x15) Υποπίνακας K 1 (6x9) 1 0.417 25.925 25.925 2 0.237 14.694 40.619 3 0.194 12.049 52.668 4 0.158 9.783 62.450 5 0.139 8.647 71.097 6.. 1 0.439 72.250 72.250 2 0.104 17.126 89.376 3 0.039 6.488 95.864 4 0.022 3.646 99.510 5 0.003 0.490 100.000-251 -

Στην περίπτωση της εφαρμογής της μεθόδου στον πίνακα Burt οι δύο πρώτοι άξονες ερμηνεύουν το 40.6% ενώ στην περίπτωση του επιλεγμένου υποπίνακα το 89.3% της ολικής αδράνειας. Αν παρατηρήσουμε την απεικόνιση των σημαντικότερων σημείων επί των παραγοντικών επίπεδων που σχηματίζουν ο πρώτος με το δεύτερο άξονα, θα διαπιστώσουμε ότι αυτή είναι σχεδόν η ίδια και για τις δύο αναλύσεις και ότι επιπλέον είναι λεπτομερέστερη στο παραγοντικό επίπεδο που προκύπτει από την εφαρμογή της AFC στον επιλεγμένο υποπίνακα. Β) Σύνολο δεδομένων με γνωστό a priori «καλύτερο» υποπίνακα. Ομοίως, εφαρμόσαμε τον αλγόριθμο στον πίνακα Burt 15 15 που προέκυψε από σύνολο δεδομένων Β 360 4 (4 μεταβλητές με 15 συνολικά κλάσεις) το οποίο κατασκευάσαμε με a priori γνωστή τη μορφή του «καλύτερου» υποπίνακα. Έτσι προέκυψε ως «καλύτερος» υποπίνακας ο 9 6 με τις μεταβλητές Χ 1, Χ 4 στις γραμμές και τις Χ 2, Χ 3 στις στήλες και λόγο λ ίσο με 146%. Παρατηρούμε ότι η εφαρμογή της AFC στον πίνακα Burt δίνει αρκετά χαμηλά ποσοστά ερμηνείας της ολικής αδράνειας σε όλους τους παραγοντικούς άξονες, με τις αντίστοιχες αδράνειες να μη διαφέρουν σημαντικά (Σχήμα 4). Αυτό καθιστά σχεδόν απαγορευτική την εφαρμογή της μεθόδου στον παραπάνω πίνακα. Στην περίπτωση, όμως, της ανάλυσης του επιλεγμένου υποπίνακα, οι δύο πρώτοι άξονες ερμηνεύουν το 83.4% της ολικής αδράνειας με την εικόνα του φαινομένου επί του αντίστοιχου παραγοντικού επιπέδου να είναι λεπτομερέστερη απ αυτή που προκύπτει από την εφαρμογή της μεθόδου στον πίνακα Burt. Γεγονός αναμενόμενο καθώς η πληροφορία συγκεντρώνεται σε μικρότερο αριθμό παραγοντικών αξόνων. - 252 -

Σχήμα 4: Αποτελέσματα της εφαρμογής της AFC στον πίνακα Burt και στον «καλύτερο» υποπίνακα για το σύνολο δεδομένων Β Πίνακας συμπτώσεων (15x15) 1 0.087 12.485 12.485 2 0.081 11.632 24.117 3 0.076 10.932 35.050 4 0.067 9.702 44.751 5 0.065 9.418 54.169 6 0.061 8.827 62.996 7 0.060 8.575 71.571 8 0.058 8.318 79.890 9 0.052 7.448 87.338 10 0.046 6.558 93.896 11... Υποπίνακας Κ 2 (9x6) 1 0.008 50.778 50.778 2 0.005 32.632 83.411 3 0.002 14.776 98.186 4 0.000 1.814 100.000 5 0.000 0.000 100.000 Γ) Σύνολο δεδομένων που προέκυψε με γεννήτρια τυχαίων αριθμών. Το τρίτο σύνολο δεδομένων Γ 500 6 (6 μεταβλητές με 27 συνολικά κλάσεις) προέκυψε από γεννήτρια τυχαίων αριθμών και η εφαρμογή του αλγόριθμου στον αντίστοιχο πίνακα Burt 27 27, έδωσε ως «καλύτερο» τον υποπίνακα «φέτα» 21 6 με τη μεταβλητή Χ 5 στις στήλες και τις υπόλοιπες στις γραμμές (λ=138%). Η εφαρμογή της AFC στον πίνακα Burt δίνει ποσοστό ερμηνεύσιμης αδράνειας στους δύο πρώτους παραγοντικούς άξονες 15.7%, ποσοστό που μπορεί να θεωρηθεί αρκετά χαμηλό (Σχήμα 5). Όταν όμως η μέθοδος εφαρμόζεται στον επιλεγμένο, σύμφωνα με τον αλγόριθμο, υποπίνακα το ποσοστό είναι 61.9% για τους δύο πρώτους άξονες. Η εικόνα του φαινομένου στα παραγοντικά επίπεδα των δύο αναλύσεων είναι σε γενικές γραμμές η ίδια, ενώ παρατηρείται εναλλαγή των σημαντικότερων σημείων μεταξύ 2 ου και 3 ου άξονα. Συμπερασματικά, καλό είναι η ερμηνεία του φαινομένου να μην περιοριστεί στους δύο πρώτους παραγοντικούς άξονες. - 253 -

Σχήμα 5: Αποτελέσματα της εφαρμογής της AFC στον πίνακα Burt και στον «καλύτερο» υποπίνακα για το σύνολο δεδομένων Γ Πίνακας συμπτώσεων (27x27) 1 0.049 8.108 8.108 2 0.046 7.651 15.759 3 0.043 7.231 22.990 4 0.039 6.460 29.450 5 0.037 6.078 35.528 6... Υποπίνακας K 3 (21x6) 1 0.012 38.438 38.438 2 0.007 23.534 61.971 3 0.006 19.739 81.710 4 0.003 9.608 91.318 5 0.003 8.682 100.000 Δ) Σύνολο δεδομένων όπου μόνο μία απ τις μεταβλητές συσχετίζεται με όλες τις υπόλοιπες, οι οποίες είναι μεταξύ τους ασυσχέτιστες Το σύνολο δεδομένων Δ 1600 5 επιλέχθηκε έτσι ώστε οι 4 από τις συνολικά 5 μεταβλητές να είναι μεταξύ τους ασυσχέτιστες. Ο καλύτερος υποπίνακας είναι διαστάσεων 8 3 με τη μεταβλητή Χ 5 στις στήλες και τις υπόλοιπες στις γραμμές. Ο λόγος λ=249%. Το ποσοστό ερμηνείας της ολικής αδράνειας για τους δύο πρώτους άξονες είναι 46.6% κατά την εφαρμογή της μεθόδου στον πίνακα Burt ενώ 100% στην περίπτωση του επιλεγμένου υποπίνακα. Σχήμα 6: Αποτελέσματα της εφαρμογής της AFC στον πίνακα Burt και στον «καλύτερο» υποπίνακα για το σύνολο δεδομένων Δ Πίνακας συμπτώσεων (11x11) Υποπίνακας K 4 (8x3) 1 0.062 25.121 25.121 2 0.053 21.501 46.622 3 0.040 16.220 62.842 4 0.040 16.220 79.061 5 0.029 11.681 90.743 6... 1 0.015 72.297 72.297 2 0.006 27.703 100.000-254 -

Η εικόνα του φαινομένου και για τις δύο αναλύσεις είναι σχεδόν η ίδια, με λεπτομερέστερη απεικόνιση επί του παραγοντικού επιπέδου της ανάλυσης του επιλεγμένου υποπίνακα (Σχήμα 6). Το σημαντικότερο πλεονέκτημα που προκύπτει είναι ότι στο παραγοντικό επίπεδο της εφαρμογής της μεθόδου στον «καλύτερο» υποπίνακα, αποφεύγεται η ερμηνεία σχέσεων μεταξύ μεταβλητών με ελάχιστη ή καθόλου συσχέτιση. 4. ΣΥΖΗΤΗΣΗ - ΣΥΜΠΕΡΑΣΜΑΤΑ Ο προτεινόμενος αλγόριθμος επιλογής υποπίνακα από τον πίνακα Burt παρέχει σημαντική βοήθεια κατά την ερμηνεία των αποτελεσμάτων της AFC. Συγκεκριμένα, αποφεύγεται η ερμηνεία σχέσεων μεταξύ μεταβλητών με ελάχιστη ή καθόλου συσχέτιση και επιτυγχάνεται λεπτομερέστερη απεικόνιση του φαινομένου επί των παραγοντικών αξόνων, λόγω της συγκέντρωσης της ουσιαστικότερης πληροφορίας σε μικρότερο αριθμό αξόνων. Άλλωστε, ο Greenacre (1984) έδειξε ότι αν Q κατηγορικές μεταβλητές μπορούν να διαμεριστούν σε δύο υποσύνολα με Q 1 και Q 2 μεταβλητές αντίστοιχα, τέτοια ώστε οι μεταβλητές μέσα σε κάθε υποσύνολο να είναι ανά δύο ανεξάρτητες ή ασυσχέτιστες, τότε η εφαρμογή της AFC στις Q μεταβλητές είναι ισοδύναμη με την εφαρμογή της στον πίνακα συμπτώσεων που δημιουργείται όταν οι κλάσεις των Q 1 μεταβλητών τοποθετηθούν στις γραμμές και οι κλάσεις των Q 2 μεταβλητών τοποθετηθούν στις στήλες του πίνακα (ή αντίστροφα). Επειδή σε κάθε περίπτωση υπάρχει ένας υποπίνακας με τη μέγιστη ενδιαφέρουσα αδράνεια, από τα εμπειρικά ευρήματα των πειραματισμών μας φαίνεται ότι αν υπάρχει υποπίνακας με την πλησιέστερη απεικόνιση, μέσω της AFC, στον αντίστοιχο πίνακα Burt, αυτός θα μπορούσε να αναζητηθεί στον υποπίνακα με την μέγιστη ενδιαφέρουσα αδράνεια. Βέβαια, περαιτέρω πειραματισμοί θα μπορούσαν να ισχυροποιήσουν την προτεινόμενη μεθοδολογία. Η εφαρμογή του αλγόριθμου σε άλλα σύνολα δεδομένων μας οδήγησε επιπλέον σε ορισμένα εμπειρικά ευρήματα. Όταν οι αδράνειες μεταξύ 2 ου και 3 ου άξονα δε διαφέρουν σημαντικά, παρατηρήθηκε εναλλαγή των σημαντικότερων σημείων των δύο αξόνων. Καλό είναι, επομένως, η ερμηνεία της AFC στον «καλύτερο» υποπίνακα να μην περιορίζεται στους δύο πρώτους άξονες, ιδιαίτερα όταν το αθροιστικό ποσοστό ερμηνείας της ολικής αδράνειας είναι χαμηλό. Τέλος, σε περίπτωση που ο επιλεγμένος «καλύτερος» υποπίνακας είναι πίνακας «φέτα», οι αναλύσεις μπορούν - 255 -

να εμπλουτιστούν με την εφαρμογή της μεθόδου της αυτόματης ιεραρχικής ταξινόμησης. ABSTRACT n this paper we propose an algorithm for subtable selection from a generalized contingency table (Burt table). The selected subtable contains all the variables and the application of Correspondence Analysis (AFC) on this subtable produces the most similar representation of the phenomenon under investigation to this that is produced by the application of the AFC on the original Burt table. This is a newly introduced problem within the context of the AFC. The subtable selection criterion is based on the concept of interesting inertia. ΑΝΑΦΟΡΕΣ Benzécri, J. P. (1992). Correspondence Analysis Handbook. Marcel Dekker, New Υork. Clausen, S.-E. (1998). Applied Correspondence Analysis: An ntroduction. Sage Publications, 07-121, Thousand Oaks. Greenacre, M. J. (1984): Theory and applications of Correspondence Analysis. Academic Press, London. Greenacre, M. J. (1993). Correspondence Analysis in Practice. Academic Press, London. Marchand, P. and Τ. Holland (2002). Graphics and GUs with MATLAB. Chapman & Hall/CRC. Μάρκος, Α. και Γ. Παπαδημητρίου (2003). Το παρεξηγημένο ποσοστό ερμηνείας των παραγοντικών αξόνων στην παραγοντική ανάλυση των αντιστοιχιών. Πρακτικά 16 ου Πανελλήνιου Συνεδρίου Στατιστικής, 417 425. Μάρκος, Α., Μενεξές, Γ. και Γ. Παπαδημητρίου (2005). Προσέγγιση μεθόδου επιλογής υποπίνακα συμπτώσεων από το γενικευμένο πίνακα Burt. Τετράδια Ανάλυσης εδοµένων, (έγινε δεκτή προς δημοσίευση). Μενεξές, Γ. και Γ. Παπαδημητρίου (2004). Σχέσεις αδράνειας σε πίνακες συμπτώσεων, γενικευμένους και λογικούς δύο ή περισσότερων μεταβλητών. Τετράδια Ανάλυσης Δεδομένων, 4, 42-66. - 256 -