ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ»

Σχετικά έγγραφα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ»

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Εισόδημα Κατανάλωση


Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στη Στατιστική

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού CHIC Analysis

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ Τµήµα Εφαρµοσµένης Πληροφορικής

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Στατιστική ανάλυση αποτελεσμάτων

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Βιοστατιστική ΒΙΟ-309

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Βιοστατιστική ΒΙΟ-309

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Αναλυτική Στατιστική

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Περιεχόμενα. Πρόλογος... 15

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Διάλεξη 1 Βασικές έννοιες

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έρευνα Μάρκετινγκ Ενότητα 5

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ. ν 1 + ν ν κ = v (1) Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

Γ. Πειραματισμός - Βιομετρία

Κεφάλαιο 1 o Εξισώσεις - Ανισώσεις

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΔΙΟΙΚΗΤΙΚΑ ΣΤΕΛΕΧΗ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Περιγραφική Στατιστική

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

Απλή Παλινδρόμηση και Συσχέτιση

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΑΝΑΛΥΣΗ ΕΥΑΙΣΘΗΣΙΑΣ Εισαγωγή

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Α. α) ίνεται η συνάρτηση F(x)=f(x)+g(x). Αν οι συναρτήσεις f, g είναι παραγωγίσιµες, να αποδείξετε ότι: F (x)=f (x)+g (x).

Μαθηματική Εισαγωγή Συναρτήσεις

Απλή Γραμμική Παλινδρόμηση II

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ» 2012-2013 ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάλυση Αντιστοιχιών (Correspondence Analysis) και πρακτική εφαρμογή της σε Έρευνα Αγοράς (Market Research) με τη βοήθεια των στατιστικών πακέτων SPSS & MINITAB» Επιβλέπων Καθηγητής: ΑΛΕΒΙΖΟΣ ΦΙΛΙΠΠΟΣ Εξεταστική Επιτροπή: ΤΣΑΝΤΑΣ ΝΙΚΟΛΑΟΣ, ΠΕΤΡΟΠΟΥΛΟΣ ΚΩΝΣΤΑΝΤΙΝΟΣ Γεωργιτσόπουλος Άγγελος Α.Μ.: 271 angel_geo105@yahoo.gr Πάτρα, 20 Δεκεμβρίου 2013

Δομή Παρουσίασης 1. Σκοπός της Εργασίας 2. Απλή Ανάλυση Αντιστοιχιών (Simple Correspondence Analysis) 3. Πολλαπλή Ανάλυση Αντιστοιχιών (Multiple Correspondence Analysis) 4. Έρευνα Αγοράς (Market Research) 5. Πρακτική εφαρμογή σε SPSS & MINITAB, Πολλαπλής Ανάλυσης Αντιστοιχιών πάνω σε δεδομένα που προέρχονται από Έρευνα Αγοράς (Ποσοτική Έρευνα με χρήση Ερωτηματολογίου).

Σκοπός της Εργασίας Η παρούσα εργασία αποσκοπεί : Α) Θεωρητική, πρακτική και υπολογιστική επισκόπηση της Ανάλυσης Αντιστοιχιών (Απλής & Πολλαπλής) όπως και της Έρευνας Αγοράς. Β) Ανάδειξη της συγκεκριμένης στατιστικής μεθόδου ως ένα από τα καταλληλότερα «εργαλεία» για την διερεύνηση των εξαρτήσεων που υφίστανται μεταξύ των υπό εξέταση μεταβλητών. Γ) Υλοποίηση της στα στατιστικά πακέτα SPSS & MINITAB, με τη χρήση κατάλληλων δεδομένων από τον τομέα της Έρευνας Αγοράς. Θα δοθεί έμφαση, περισσότερο στην ερμηνεία των αποτελεσμάτων, παρά στις μαθηματικές και τεχνικές λεπτομέρειες των διαδικασιών της μεθόδου.

Ανάλυση Αντιστοιχιών (C.A.) Ορισμός Η Ανάλυση Αντιστοιχιών (Correspondence Analysis) είναι μια δημοφιλής περιγραφική/ «διερευνητική» (exploratory) στατιστική τεχνική ανάλυσης δεδομένων, κατάλληλη για πολυμεταβλητά κατηγορικά δεδομένα και τη γραφική Ά76 απεικόνιση των πινάκων συνάφειας (contingency tables). Η μέθοδος αυτή δε χρησιμοποιείται για να γενικεύσουμε τα εξαγόμενα αποτελέσματα στον υπό μελέτη πληθυσμό. Με άλλα λόγια δεν έχει επαγωγικό χαρακτήρα η Ανάλυση Αντιστοιχιών Ά1 και έτσι δεν κάνουμε στατιστική συμπερασματολογία όπως συμβαίνει με άλλες μεθόδους στατιστικής ανάλυσης.

Διαφάνεια 4 Ά1 Ά76 Η μέθοδος της Ανάλυσης Αντιστοιχιών χαρακτηρίζεται από ελάχιστο αριθμό υποθέσεων, διότι ο ερευνητής που υλοποιεί τη μέθοδο δεν υποθέτει κάποιο συγκεκριμένο μοντέλο, απλά προσπαθεί να προσδιορίσει τις δομές που «κρύβονται» πίσω από τα δεδομένα με τη βοήθεια της γραφικής απεικόνισης αυτών των δεδομένων. Άγγελος; 20/12/2013 Η Ανάλυση Αντιστοιχιών είναι μια χρήσιμη τεχνική για τη διερεύνηση εξαρτήσεων μεταξύ κατηγορικών μεταβλητών, στην οποία πραγματοποιείται μια ανάλυση ιδιοτιμών των δεδομένων και η διασπορά αναλύεται στις διάφορες υποκείμενες διαστάσεις και συνδέεται με τις γραμμές και/ ή τις στήλες. Απεικονίζοντας τις εξαρτήσεις γραφικά, οι λύσεις της Ανάλυσης Αντιστοιχιών δίνουν στους ερευνητές περισσότερα ερεθίσματα για περαιτέρω ανάλυση από ότι θα έδιναν τα αποτελέσματα ενός ελέγχου ανεξαρτησίας X2 (Chi-squared). Η Ανάλυση Αντιστοιχιών, κατά πάσα πιθανότητα, υλοποιείται καλύτερα σε συνδυασμό με πιο δόκιμες μεθόδους όπως τα log-linear μοντέλα.

Ανάλυση Αντιστοιχιών (C.A.) Σκοπός H Ανάλυση Αντιστοιχιών (Correspondence Analysis) έχει ως βασικότερο σκοπό τη μετατροπή ενός πίνακα δεδομένων σε μια γραφική απεικόνιση με απώτερο στόχο να «αποκαλυφθούν» οι συσχετίσεις μεταξύ των κελιών του αρχικού πίνακα και ιδιαίτερα ανάμεσα στα βασικά χαρακτηριστικά του πίνακα. Επιπλέον, δίνει τη δυνατότητα στον ερευνητή να κατασκευάσει ένα διάγραμμα (δημιουργώντας τις συντεταγμένες που θα αναπαριστούν τα επίπεδα- κατηγορίες των υπαρχουσών μεταβλητών), το οποίο θα παρουσιάζει την αλληλεπίδραση μεταξύ των κατηγορικών μεταβλητών και τη σχέση συνάμα που θα συνδέει τις γραμμές του πίνακα μεταξύ τους όπως και τις στήλες μεταξύ τους, θα επιτρέπει όμως παράλληλα και την οπτική εξέταση κάθε μορφής ή δομής στα δεδομένα.

Ανάλυση Αντιστοιχιών (C.A.) Σκοπός Χρήσης κατά τον Greenacre (1992) An important aspect of Correspondence Analysis which distinguishes it from more conventional statistical methods is that it is not a confirmatory technique, trying to prove a hypothesis, but rather an exploratory technique, trying to reveal the data content. One can say that it serves as a window onto the data, allowing researchers easier access to their numerical results and facilitating discussion of the data and possibly generating hypotheses which can be formally tested at a later stage.

Ανάλυση Αντιστοιχιών (C.A.) Από μαθηματικής απόψεως, η Ανάλυση Αντιστοιχιών μπορεί να θεωρηθεί ως: Μια μέθοδος που αναλύει το X 2 chi-square στατιστικό για ένα πίνακα συνάφειας σε συνιστώσες που αντιστοιχούν σε διαφορετικές διαστάσεις της ετερογένειας μεταξύ των γραμμών και των στηλών του πίνακα (παρόμοια διαδικασία υλοποιεί η Ανάλυση σε Κύριες Συνιστώσες- Principal Components Analysis σε συνεχή πολυμεταβλητά δεδομένα). Μια μέθοδος που ταυτόχρονα αντιστοιχεί μια κλίμακα στις γραμμές και μια διαφορετική κλίμακα στις στήλες, έτσι ώστε να μεγιστοποιήσει την εξάρτηση ανάμεσα στο ζευγάρι των μεταβλητών που προκύπτουν.

Ανάλυση Αντιστοιχιών (C.A.) Τα βασικά σημεία της Ανάλυσης Αντιστοιχιών Κάθε γραμμή και στήλη ενός πίνακα δεδομένων (ή ενός πίνακα συνάφειας) αναπαριστάται με ένα σημείο σε ένα πολυδιάστατο χώρο. Ά2 Μείωση του προβλήματος με την μετατροπή του πολυδιάστατου χώρου σε ένα χώρο μικρότερων διαστάσεων. Η αναπαράσταση των γραμμών και των στηλών με βέλτιστο τρόπο σε χώρο μικρότερων διαστάσεων, με απώτερο σκοπό να γίνει ουσιαστικότερη η πληροφορία που θα λαμβάνουμε. Ά3

Διαφάνεια 8 Ά2 Ά3 Αυτά τα σημεία είναι στην πραγματικότητα οι προβολές των γραμμών και των στηλών του πίνακα πάνω σε ένα δισδιάστατο Ευκλείδιο χώρο. Άγγελος; 17/12/2013 Επιθυμία μας είναι να διατηρήσουμε, όσο είναι δυνατόν, τη σχέση ανάμεσα στις γραμμές (ή στις στήλες) στο χώρο των δύο διαστάσεων. Άγγελος; 17/12/2013

Ανάλυση Αντιστοιχιών (C.A.) Προσδοκώμενα αποτελέσματα o Εμφάνιση συσχετισμών μεταξύ γραμμών και στηλών. o Φυσική διάταξη ή κάποια επικάλυψη μεταξύ των κατηγοριών των δεδομένων. o Έλεγχος ανεξαρτησίας Chi-Square X 2 μεταξύ γραμμών και στηλών (Εναλλακτικά Log-linear model). o Δημιουργία καινούριων Ά4 μεταβλητών, στις οποίες συνοψίζεται ένα σημαντικό μέρος της αρχικής πληροφόρησης.

Διαφάνεια 9 Ά4 Ενώ αρχικά έχουμε στη διάθεσή μας κατηγορικές (ποιοτικές) μεταβλητές, ολοκληρώνουμε την υλοποίηση της μεθόδου με μερικές συνεχείς ποσοτικές μεταβλητές. Άγγελος; 17/12/2013

Ανάλυση Αντιστοιχιών (C.A.) Ιστορική Αναδρομή Η αρχική αλγεβρική προέλευση της Ανάλυσης Αντιστοιχιών συχνά αποδίδεται στον Hirschfeld (1935) που ανέπτυξε μια διατύπωση της συσχέτισης μεταξύ των γραμμών και των στηλών ενός πίνακα συνάφειας διπλής εισόδου. Πρωτοπόρος πάνω στον τομέα της Ανάλυσης Αντιστοιχιών θεωρείται ο Γάλλος στατιστικός Jean- Ά5 Paul Benzecri (τη δεκαετία του 1960 στη Γαλλία). Ο ψυχομετρητής Louis Guttman έθεσε επί τάπητος τη μέθοδό του, που ονομάστηκε Διπλή ή Βέλτιστη Κλιμακοποίηση (Dual or Optimal Scaling) και η οποία αναφέρεται τώρα ως το θεμέλιο της Πολλαπλής Ανάλυσης Αντιστοιχιών. «Theory and applications of Correspondence Analysis» του Greenacre το 1984. Ά6

Διαφάνεια 10 Ά5 Ά6 Στο σημείο αυτό πρέπει να σημειώσουμε ότι στο παρελθόν είχαν αναπτυχθεί από άλλους επιστήμονες παραπλήσιες μέθοδοι με αρκετή ενδεχομένως επικάλυψη.όλες οι προηγούμενες προσπάθειες είχαν ως κύριο στόχο την κλιμακοποίηση (scaling) των κατηγοριών ενός πίνακα συνάφειας. Άγγελος; 17/12/2013 Με την πάροδο του χρόνου και την εισαγωγή της Ανάλυσης Αντιστοιχιών σε δημοφιλή στατιστικά πακέτα σε όλο τον κόσμο πραγματοποιήθηκε μια ευρεία αποδοχή της μεθόδου ως ένα πολύ χρήσιμο εργαλείο για την περιγραφή κατηγορικών δεδομένων. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 1. Πίνακας Συνάφειας (Contingency Table) Ά7 Ένας a b πίνακας συνάφειας αποτελεί μια παράθεση φυσικών αριθμών ή αλλιώς είναι ένας πίνακας διπλής εισόδου που έχει ως στοιχεία του τη συχνότητα εμφάνισης ενός αντικειμένου ή χαρακτηριστικού που αντιστοιχεί στη γραμμή και τη στήλη του κελιού. Έτσι ένας πίνακας συνάφειας, στη γενική θεωρητική του μορφή, απεικονίζεται με ένα πίνακα που έχει a γραμμές και b στήλες, με στοιχεία x ij Η Ανάλυση Αντιστοιχιών διαθέτει τη δυνατότητα να επεξεργάζεται πίνακες συνάφειας σχετικών συχνοτήτων, όμως στην περίπτωση αυτή δε θα λαμβάνεται υπόψη το μέγεθος του δείγματος καθότι δε θα είναι γνωστό. Ά8

Διαφάνεια 11 Ά7 Ά8 Ο όρος «συνάφεια- contingency» φαίνεται να έχει χρησιμοποιηθεί από τον Karl Pearson (1904), ο οποίος τον εισήγαγε για να περιγράψει το μέτρο της απόκλισης από την απόλυτη ανεξαρτησία μεταξύ των γραμμών και των στηλών μιας τέτοιας δομής δεδομένων. Άγγελος; 17/12/2013 Πάντως η χρήση σχετικών συχνοτήτων είναι γενικά καλύτερη από την άποψη ότι επιτρέπει την απευθείας σύγκριση πινάκων χωρίς να εξαρτόμαστε από το μέγεθος του δείγματος. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Πίνακας 1. Πίνακας Συνάφειας με a γραμμές και b στήλες

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 2. Προφίλ (Profiles) Από ένα δεδομένο πίνακα συνάφειας απόλυτων συχνοτήτων, μπορούμε να κατασκευάσουμε δύο νέους πίνακες σχετικών συχνοτήτων, έναν για τις γραμμές και έναν για τις στήλες του πίνακα. Ο πίνακας P των σχετικών συχνοτήτων ονομάζεται Πίνακας Αντιστοιχιών (Correspondence Matrix). Τα Προφίλ Γραμμών (Row Profiles) ορίζονται ως οι σχετικές συχνότητες (Relative Frequencies) ανά γραμμή f ij και υπολογίζονται από το πηλίκο των απόλυτων συχνοτήτων των κελιών x ij προς το σύνολο της γραμμής n. Τα Προφίλ Γραμμών δίνουν τη δυνατότητα στον ερευνητή να συγκρίνει άμεσα τις γραμμές μεταξύ τους. Ά11 Η τελευταία γραμμή του πίνακα των Προφίλ Γραμμών περιέχει το προφίλ γραμμής για ολόκληρο τον Ά9 πίνακα. Το συγκεκριμένο προφίλ ονομάζεται Κεντροειδές (Centroid) ή Μέσο Προφίλ Γραμμής. Ά10

Διαφάνεια 13 Ά9 Ά10 Ά11 Το άθροισμα των προφίλ γραμμής για κάθε μια γραμμή είναι συνολικά ίσο με τη μονάδα. Άγγελος; 17/12/2013 Από στατιστική άποψης το Κεντροειδές ισούται με το σταθμισμένο μέσο των προφίλ γραμμής που έχουν ως σταθμίσεις το σύνολο των παρατηρήσεων κάθε γραμμής. Άγγελος; 17/12/2013 Αν χρησιμοποιήσουμε κάποιο μέτρο απόστασης μεταξύ των προφίλ γραμμής θα έχουμε την ευχέρεια να ποσοτικοποιήσουμε το βαθμό διαφοροποίησης μεταξύ δύο γραμμών ή μιας γραμμής και του μέσου προφίλ, μετρώντας έτσι τη διαφορά κάθε γραμμής από το μέσο προφίλ. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Πίνακας 2. Πίνακας Αντιστοιχιών (Correspondence Matrix) των Σχετικών Συχνοτήτων

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 2. Προφίλ (Profiles) Ειδικότερα τα Προφίλ Γραμμών και Στηλών μπορούν να θεωρηθούν ως πολυμεταβλητές παρατηρήσεις σε ένα πολυδιάστατο χώρο. Μπορούμε να υπολογίσουμε την απόσταση (π.χ. Ευκλείδεια απόσταση) μεταξύ δύο γραμμών για παράδειγμα, χρησιμοποιώντας τα διανύσματα των Προφίλ Γραμμών αυτών. Αν ο έλεγχος ανεξαρτησίας, μεταξύ των μεταβλητών που είναι υπό εξέταση, οδηγήσει στο συμπέρασμα ότι υπάρχει ανεξαρτησία περιμένουμε τότε οι γραμμές του πίνακα συνάφειας να έχουν παρόμοια προφίλ ή ισοδύναμα οι στήλες να έχουν παρόμοια προφίλ.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 3. Μάζα (Mass) Ορίζονται ως τα αντίστοιχα Περιθώρια Προφίλ, δηλαδή τα προφίλ Ά12 του συνόλου κάθε γραμμής και στήλης αντίστοιχα. Υπολογίζονται διαιρώντας το συνολικό αριθμό συχνοτήτων για τη γραμμή (ή τη στήλη) προς το συνολικό μέγεθος του δείγματος. xi. ri, i 1, 2,..., a n x. j c j, j 1, 2,..., b n

Διαφάνεια 16 Ά12 Η σημασία των Μαζών θα φανεί στη συνέχεια όπου θα τις χρησιμοποιήσουμε ως συντελεστές στάθμισης για να υπολογίσουμε αποστάσεις. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 4. Μέτρα Απόστασης Υπολογίζουμε την απόσταση d i μεταξύ δύο οποιονδήποτε γραμμών χρησιμοποιώντας τις Μάζες των στηλών σα βάρη. Το μέτρο Ά13 απόστασης που προκύπτει κατά αυτόν τον τρόπο λέγεται X 2 Ά14 απόσταση. X 2 ( i, i ) b 1 fij f f f f i j j 1. j i. i. 2 X 2 ( j, j ) a 1 fij f f f f ij i 1 i.. j. j 2 d ( r r ) D ( r r ) 2 1 ij i j c i j

Διαφάνεια 17 Ά13 Ά14 Έχει μεγάλη ομοιότητα με τη γνωστή X2 ελεγχοσυνάρτηση που χρησιμοποιείται στον έλεγχο ανεξαρτησίας μεταξύ δύο μεταβλητών Άγγελος; 17/12/2013 Η X2 απόσταση διαφέρει από την Ευκλείδια απόσταση μόνο στο ότι κάθε τετράγωνο της σταθμίζεται από τον αντίστροφο κάθε συχνότητας που αντιστοιχεί σε κάθε όρο. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 4. Μέτρα Απόστασης Η απόσταση μεταξύ ενός σημείου γραμμής και ενός σημείου στήλης στερείται νοήματος, η εγγύτητα όμως μεταξύ αυτών των δύο σημείων έχει νόημα. Με τη βοήθεια της X 2 απόστασης κατασκευάζουμε έναν πλήρη πίνακα αποστάσεων ανάμεσα σε όλα τα ζεύγη γραμμών. [«Ιδιότητα Ισοδυναμίας Ά17 κατά Κατανομή» (Property of Distributional Equivalence), Lebart, Morineau & Warwick (1984)]. Γραμμές που έχουν μικρή μεταξύ τους απόσταση, μικρή δηλαδή τιμή του μέτρου απόστασης που υπολογίζουμε, θα πρέπει να βρίσκονται σε κοντινά σημεία στο γράφημα και αντίθετα γραμμές που έχουν μεγαλύτερες αποστάσεις θα πρέπει να απέχουν αρκετά. Τα σημεία που αντιπροσωπεύουν τα επίπεδα- κατηγορίες των στηλών δίνουν μια δισδιάστατη απεικόνιση της απόστασης, με την Ευκλείδια απόσταση μεταξύ δύο σημείων να αναπαριστάνει Ά15 την X 2 απόσταση ανάμεσα στα αντίστοιχα επίπεδα των στηλών. Ά16

Διαφάνεια 18 Ά15 Ά16 Για ένα πίνακα συνάφειας με a γραμμές και b στήλες μπορεί να αποδειχθεί ότι οι X2 αποστάσεις μπορούν να απεικονιστούν ακριβώς σε min(a-1,b-1) διαστάσεις. Όμως, αν ταυτόχρονα ισχύει ότι a>3 & b>3 τότε μια ακριβής δισδιάστατη απεικόνιση των X2 αποστάσεων δεν είναι δυνατή. Άγγελος; 17/12/2013 Αναλόγως μπορούμε να βρούμε την απόσταση μεταξύ οποιαδήποτε γραμμής και του Μέσου προφίλ γραμμής ή Κεντροειδούς.Οι αποστάσεις αυτές που υπολογίζονται μας πληροφορούν σχετικά με το πόσο διαφέρει μια γραμμή από το μέσο προφίλ γραμμής. Όμως πρέπει να γνωρίζουμε ότι δε μπορούμε να συγκρίνουμε απευθείας τις γραμμές μεταξύ τους, αφού πρόκειται για αποστάσεις από ένα συγκεκριμένο σημείο και άρα η πληροφορία που εξάγεται από την εύρεση της συγκεκριμένης απόστασης είναι το πόσο κοντά στο σημείο του μέσου προφίλ γραμμής είναι τα σημεία των γραμμών. Άγγελος; 17/12/2013 Ά17 Σύμφωνα με αυτήν την ιδιότητα, αν δύο γραμμές (ή στήλες) διαθέτουν το ίδιο προφίλ τότε μπορούμε να τις ενοποιήσουμε σε μία γραμμή (ή αντίστοιχα στήλη), που θα έχει σχετική συχνότητα το άθροισμα των δύο αρχικών γραμμών (ή στηλών), χωρίς να παρουσιάσει μεταβολή η X2 απόσταση μεταξύ των στηλών (αντίστοιχα γραμμών).η ιδιότητα αυτή μας διευκολύνει πολύ στην ανάλυση μας, αφού ένα από τα επιθυμητά αποτελέσματα είναι η μείωση των διαστάσεων του προβλήματος και είναι σημαντική διότι εξασφαλίζει τη μη αλλοίωση των εξαγόμενων ανεξάρτητα από τον τρόπο κωδικοποίησης των μεταβλητών. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 5. Αδράνεια (Inertia) Όσο αυξάνεται το μέγεθος του δείγματος n, τόσο αυξάνεται και ο συντελεστής συσχέτισης X 2 Chi-square. Η Απλή Ανάλυση Αντιστοιχιών εισάγει την έννοια του λόγου X 2 /n που αναφέρεται στη βιβλιογραφία ως Συνολική Αδράνεια του πίνακα συνάφειας και περιγράφει το επίπεδο συσχέτισης ή εξάρτησης ανάμεσα σε δύο κατηγορικές μεταβλητές. Η Αδράνεια (Inertia), που συμβολίζεται με Ι, είναι ένα συνολικό μέτρο ετερογένειας ή ανομοιογένειας των Προφίλ, δείχνει δηλαδή πόσο διαφέρουν μεταξύ τους τα προφίλ, μετρώντας τις διαφορές ανάμεσα σε κάθε ζευγάρι σημείων. Ά18 I a i 1 r d i 2 i I ( f rc ) ij i j rc i j i j 2

Διαφάνεια 19 Ά18 Εναλλακτικά μπορεί να οριστεί ως ο σταθμισμένος μέσος (με βάρη τις σχετικές συχνότητες fi) των X2 αποστάσεων ανάμεσα στα Προφίλ Γραμμών ri και το μέσο τους c. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 5. Αδράνεια (Inertia) Η Αδράνεια ως έννοια έχει μεγάλη ομοιότητα με την έννοια της Διακύμανσης. Καθώς αυξάνεται η τιμή της αδράνειας τόσο πιο έντονη είναι και η διαφοροποίηση που σημειώνεται μεταξύ των γραμμών. Αν υποθέσουμε ότι Ά19 όλα τα Προφίλ των Γραμμών είναι ίδια, τότε η αδράνεια θα είναι ίση με το μηδέν. Η Αδράνεια και ο γνωστός έλεγχος ανεξαρτησίας X 2 συνδέονται μέσω της παρακάτω σχέσης: 2 X I f ( r c) D ( r c) f ( c r) D ( c r) n a b 1 1 i. i c i. j j r j i 1 j 1

Διαφάνεια 20 Ά19 Με βάση τον παραπάνω ορισμό της Αδράνειας εξάγεται το ακόλουθο συμπέρασμα: Οι γραμμές, οι οποίες έχουν μικρή μάζα επηρεάζουν την αδράνεια μόνο όταν βρίσκονται μακριά από το κέντρο (έχουν δηλαδή μεγάλη απόσταση di). Άρα τα σημεία που βρίσκονται αρκετά κοντά στο κέντρο θα έχουν απόσταση κοντά στο μηδέν και κατά συνέπεια η αδράνεια αυτών των σημείων θα είναι πολύ μικρή. Αξιοσημείωτο είναι το γεγονός ότι η αδράνεια δεν εξαρτάται από το μέγεθος του δείγματος σε αντίθεση με τον έλεγχο X2 που λαμβάνει υπόψη του τη συγκεκριμένη παράμετρο. Άγγελος; 17/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 5. Αδράνεια (Inertia) Η Αδράνεια διακρίνεται σε Συνολική (Total Inertia) και σε Σχετική (Relative Inertia). Η Σχετική Αδράνεια απεικονίζει την αναλογία της Συνολικής Αδράνειας που αντιπροσωπεύεται από το αντίστοιχο σημείο και είναι ανεξάρτητη από το πλήθος των διαστάσεων που επιλέγονται από τον ερευνητή. Αδράνεια του i-οστού σημείου γραμμής: r 1/ c ( f / r c ) r h 2 2 i j ij i j i it j t Συνεισφορά (Contribution) της i-οστής γραμμής στη Συνολική Αδράνεια. Απόλυτη Συνεισφορά (Absolute Contribution) της i-οστής γραμμής στον t-οστό βασικό άξονα: Ά22 Ά20 rh 2 i it / It Ά21

Διαφάνεια 21 Ά20 Ά21 Ά22 ri είναι η μάζα αυτής της γραμμής και η ποσότητα εντός της αγκύλης είναι η X2 απόσταση του Προφίλ Γραμμής από το κέντρο βαρύτητας (center of gravity) c στο χώρο γραμμών, την οποία συμβολίζουμε με hit2. Άγγελος; 18/12/2013 Αυτές οι Συνεισφορές αθροιζόμενες για όλες τις γραμμές ισοδυναμούν με τη Συνολική Αδράνεια. Άγγελος; 18/12/2013 Οι Απόλυτες Συνεισφορές ποσοτικοποιούν τη σημασία κάθε σημείου στον καθορισμό της κατεύθυνσης των βασικών αξόνων και εξυπηρετούν ως οδηγοί στην ερμηνεία κάθε άξονα. Ερμηνεύονται ως το ποσοστό της (σταθμισμένης) διακύμανσης που εξηγείται από κάθε σημείο σε σχέση με τον κάθε άξονα. Είναι εμφανές από την ανάλυση ότι ένα σημείο μπορεί να συνεισφέρει σε ένα βασικό άξονα (δηλαδή να έχει υψηλή συνεισφορά στην Αδράνεια αυτού του άξονα) με δύο τρόπους: όταν έχει μεγάλη μάζα και/ ή όταν έχει μεγάλη απόσταση από το κεντροειδές, ακόμα κι όταν έχει σχετικά μικρή μάζα. Άγγελος; 18/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Βασικές Έννοιες 6. Πίνακας Καταλοίπων Ά23 a ij f rc ij i j rc i j, i =1,, a, j=1,, b. o o o Ο Πίνακας Καταλοίπων θα έχει τις ίδιες διαστάσεις με τον αρχικό πίνακα συνάφειας. Η Αδράνεια είναι το άθροισμα των στοιχείων του Πίνακα Καταλοίπων. Από την οπτική εξέταση του Πίνακα Καταλοίπων μπορούμε να έχουμε ενδείξεις για την ύπαρξη ανεξαρτησίας ή όχι μεταξύ γραμμών και στηλών. Ά24

Διαφάνεια 22 Ά23 Ά24 όπου fij είναι η σχετική συχνότητα του κελιού ij, ενώ η ποσότητα ricj που στηρίζεται στις μάζες των γραμμών και των στηλών, αποτελεί την εκτίμηση της πιθανότητας του κελιού κάτω από την υπόθεση της ανεξαρτησίας γραμμών και στηλών. Άγγελος; 18/12/2013 Αν τα στοιχεία του πίνακα Α έχουν μικρές απόλυτες τιμές, τότε υπάρχει η ένδειξη για την ύπαρξη ισχυρής ανεξαρτησίας και κατά συνέπεια η Αδράνεια του πίνακα θα έχει μικρή τιμή. Αντίθετα, αν δούμε ότι έχουν μεγάλες απόλυτες τιμές τα στοιχεία του πίνακα καταλοίπων, θα γνωρίζουμε εκ των προτέρων ότι είναι πολύ πιθανό να υπάρχει εξάρτηση μεταξύ γραμμών και στηλών του πίνακα συνάφειας και επομένως η Αδράνεια θα έχει μεγάλη τιμή. Άγγελος; 18/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Μείωση των Διαστάσεων Εναλλακτικά μέτρα απόστασης μεταξύ γραμμών και στηλών. Μέγιστος επιτρεπόμενος αριθμός διαστάσεων= min(a,b)-1. Απώλεια πληροφορίας. «Γεωμετρική» διατήρηση της πληροφορίας. Τα σημεία που βρίσκονταν κοντά στον πολυδιάστατο χώρο να εξακολουθούν να βρίσκονται κοντά και στις λιγότερες διαστάσεις. «Κατάρα της Διαστατικότητας- Curse of Dimensionality». Ά25

Διαφάνεια 23 Ά25 Δεν υπάρχει μέθοδος που να καθορίζει κατά τρόπο οριστικό το κατάλληλο πλήθος και τί συνδυασμούς διαστάσεων να απεικονίσει και να μελετήσει. Όπως και με άλλες πολυμεταβλητές μεθόδους, ο ερευνητής πρέπει να ισορροπήσει την οικονομία ενάντια στην ερμηνευσιμότητα όσον αφορά τον καθορισμό του αριθμού των διαστάσεων που θα χρησιμοποιήσουμε. Άγγελος; 18/12/2013

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Διάσπαση Ιδιόμορφων Τιμών (Singular Value Decomposition- SVD) Είναι το πιο συνηθισμένο εργαλείο για την ανάλυση του συντελεστή Pearson. Ά26 Προσέγγιση της «Ανάλυσης Κυρίων Συνιστωσών». Δίνει έμφαση στις γεωμετρικές ιδιότητες της Ανάλυσης Αντιστοιχιών και αποσαφηνίζει τις πρακτικές συνέπειες της ανάλυσης δεδομένων. H SVD ενσωματώνει την ιδέα της βασικής δομής ενός πίνακα που αποτελείται από βασικές τιμές και βασικά διανύσματα. Ιδιόμορφες τιμές (singular values), ιδιόμορφα διανύσματα (singular vectors).

Διαφάνεια 24 Ά26 Διάσπαση Eckart- Young

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Διάσπαση Ιδιόμορφων Τιμών (Singular Value Decomposition- SVD) Ά30 Οι ιδιοτιμές και τα ιδιοδιανύσματα συσχετίζονται με συμμετρικούς πίνακες. Οι ιδιόμορφες τιμές έχουν ως στόχο την επέκταση της ιδέας των ιδιοτιμών και σε μη συμμετρικούς πίνακες. Φασματική Ανάλυση: Ά27 Διάσπαση Ιδιόμορφων Τιμών- SVD: Η Ανάλυση Αντιστοιχιών συνίσταται στην εύρεση της Διάσπασης Ιδιόμορφων Τιμών (Singular Value Decomposition- SVD) του Πίνακα Καταλοίπων Α που περιλαμβάνει τα ξεχωριστά στοιχεία του στατιστικού X 2. Ά29 2 A A V V Generated by Foxit PDF Creator Foxit Software R Ά28 B B A 2 AA U U U V

Διαφάνεια 25 Ά27 Όπου Λ είναι ο διαγώνιος πίνακας που περιέχει τις ιδιοτιμές του R στα διαγώνια στοιχεία του και Β είναι ο πίνακας με στήλες τα αντίστοιχα ιδιοδιανύσματα. Ά28 Όπου Γ είναι ένας διαγώνιος πίνακας με θετικές τιμές ως διαγώνια στοιχεία σε φθίνουσα σειρά (δηλαδή γ1> γ2> > γκ> 0) Ά29 Ά30 Αφού επιδιώκουμε τη μείωση των διαστάσεων του προβλήματος, θα κρατήσουμε λιγότερες ιδιόμορφες τιμές και λιγότερα ιδιόμορφα διανύσματα και επομένως δε θα αναπαράγουμε πλήρως τον αρχικό πίνακα Καταλοίπων, αλλά ένα μέρος του και άρα ένα μέρος της Αδράνειας. Βλέπουμε δηλαδή ότι η λογική είναι ίδια με αυτήν της Ανάλυσης σε Κύριες Συνιστώσες. Οι ιδιοτιμές εξ ορισμού είναι το τετράγωνο των ιδιόμορφων τιμών.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Διάσπαση Ιδιόμορφων Τιμών (Singular Value Decomposition- SVD) Οι τιμές γ 1, γ 2,, γ κ Ιδιόμορφες τιμές Οι k στήλες του πίνακα U Αριστερά ιδιόμορφα διανύσματα Πίνακας U Αριστερά ιδιόμορφος πίνακας Τα δεξιά ιδιόμορφα διανύσματα του Α ταυτίζονται με τα ιδιοδιανύσματα του A A και οι τετραγωνικές τιμές των ιδιόμορφων τιμών του Α (δηλαδή οι ποσότητες) είναι ίσες αντίστοιχα με τις ιδιοτιμές του πίνακα A A. Αν ο πίνακας Α είναι συμμετρικός, τότε η SVD ταυτίζεται με τη Φασματική Ανάλυση. Η τεχνική SVD λειτουργεί ως γενίκευση της Φασματικής Ανάλυσης στην περίπτωση μη συμμετρικών πινάκων.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Διάσπαση Ιδιόμορφων Τιμών (Singular Value Decomposition- SVD) o o o o o Κάθε ιδιοτιμή αντιστοιχεί σε έναν άξονα. Το άθροισμα όλων των ιδιοτιμών είναι ίσο με την Αδράνεια του αρχικού πίνακα. Ο λόγος κάθε ιδιοτιμής με το άθροισμα αυτών, δηλαδή την Αδράνεια, εκφράζει το ποσοστό της αδράνειας που αντιπροσωπεύει ο αντίστοιχος άξονας. Ά31 Είναι απαραίτητο να επιλέξουμε λιγότερους άξονες με συνέπεια ως γνωστόν την απώλεια ενός μέρους της Αδράνειας, δηλαδή της πληροφορίας του αρχικού πίνακα. Ά32 Τα ιδιόμορφα διανύσματα είναι σημαντικά γιατί χρησιμοποιούνται για τον υπολογισμό των Κυρίων Συντεταγμένων, με τις οποίες κατασκευάζουμε τη γραφική απεικόνιση των δεδομένων. Ά33

Διαφάνεια 27 Ά31 Ά32 Ά33 Τί ποσοστό της Αδράνειας ερμηνεύει ο κάθε άξονας. Οπρώτος άξονας θα ερμηνεύει το μεγαλύτερο ποσοστό Τα δεδομένα αντιπροσωπεύονται πλήρως από το σύνολο των αξόνων Οι κύριες συντεταγμένες για τον j άξονα της i κατηγορίας, προκύπτουν ως το γινόμενο του i στοιχείου του ιδιόμορφου διανύσματος που αντιστοιχεί στη j ιδιόμορφη τιμή με την αντίστοιχη ιδιόμορφη τιμή, διαιρεμένο με την τετραγωνική ρίζα της Μάζας της αντίστοιχης γραμμής (ή ανάλογα στήλης) του αρχικού πίνακα.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Biplot Tο γράφημα πάνω στο οποίο μπορούμε να απεικονίσουμε ταυτόχρονα τις Ά34 γραμμές και τις στήλες ενός πίνακα συνάφειας. Μπορεί να οριστεί ως μια δισδιάστατη απεικόνιση ενός πίνακα δεδομένων που δείχνει ένα σημείο για κάθε ένα από τα n διανύσματα παρατηρήσεων (οι γραμμές του πίνακα δεδομένων) μαζί με ένα σημείο για κάθε μία από τις p μεταβλητές (οι στήλες του πίνακα δεδομένων). Αν δύο σημεία- γραμμών βρίσκονται κοντά, τα προφίλ των δύο γραμμών Ά35 κατά μήκος των στηλών είναι παρόμοια. Εάν ένα σημείο- γραμμής είναι εγγύς με ένα σημείο- στήλης τότε αυτός ο συνδυασμός των επιπέδων- κατηγοριών αυτών των δύο μεταβλητών τυχαίνει πιο τακτικά από ότι θα συνέβαινε αν οι δύο μεταβλητές ήταν ανεξάρτητες. Ά36

Διαφάνεια 28 Ά34 Ά35 Ά36 Το Biplot προκύπτει όταν «τοποθετήσουμε» τα δύο γραφήματα, που εξάγονται από την Ανάλυση Αντιστοιχιών μετά την εύρεση των Κυρίων Συντεταγμένων των σημείων-γραμμών και σημείων-στηλών, το ένα πάνω στο άλλο, ένα για κάθε κατηγορική μεταβλητή. Οι αποστάσεις ανάμεσα σε σημεία στο ίδιο σύνολο είναι ίσες με τις σχετικές X2 αποστάσεις, Στα Biplots το στοιχείο που προσελκύει το ενδιαφέρον μας είναι η εγγύτητα μας γραμμής και στήλης, δηλαδή το πόσο κοντά βρίσκονται μεταξύ τους ενώ δεν επικεντρωνόμαστε στη σύγκριση μόνο μεταξύ γραμμών ή στηλών. Συμπερασματικά το Biplot συμβάλλει στον εντοπισμό συσχετίσεων μεταξύ γραμμών και στηλών.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Συμμετρικά Biplots Οι συντεταγμένες των σημείων είναι «κλιμακοποιημένες» κατά τέτοιο τρόπο ώστε τα σημεία γραμμών ή στηλών με μεγάλη Μάζα να μην επηρεάζουν σημαντικά το διάγραμμα. Τα πρόσημα των συντεταγμένων δεν επηρεάζουν κατά κάποιο τρόπο, διότι οι άξονες που προκύπτουν κατά την κατασκευή ενός Biplot είναι τεχνητοί. Μη-Συμμετρικά Biplots Όταν τα Προφίλ Γραμμών απεικονίζονται ταυτόχρονα με κορυφές που αντιπροσωπεύουν τις στήλες, το διάγραμμα θα λέγεται Ασύμμετρο ή Μη Συμμετρικό. Οι συντεταγμένες σε ένα Μη Συμμετρικό (Asymmetric) Biplot προκύπτουν κατά τέτοιο τρόπο ώστε τα σημεία γραμμών και στηλών να απέχουν όσο το δυνατόν περισσότερο. Ά39 Ά40 Η χρήση των Συμμετρικών Biplots είναι πιο συχνή και αυτό οφείλεται στο γεγονός ότι χρησιμοποιούν την ίδια Κανονικοποίηση για γραμμές και στήλες. Ά38

Διαφάνεια 29 Ά38 Ά39 Ά40 Η αλλαγή προσήμου δε μεταβάλλει την ουσία της παρουσίασης, εκτός από την ερμηνεία που μπορεί να αποδώσει κάποιος στο θετικό και αρνητικό πρόσημο των αξόνων. Ειδικότερα, γίνεται χρήση δύο διαφορετικών κλιμάκων για την απεικόνιση των σημείων των γραμμών και των στηλών. Από γεωμετρικής απόψεως, αυτό συνεπάγεται ότι τα σημεία γραμμών και στηλών θα απεικονίζονται μακριά μεταξύ τους, ενώ τα υπόλοιπα σημεία θα απεικονίζονται με βάση αυτήν την τοποθέτηση. Ενεργώντας έτσι, επιτυγχάνουμε μια πιο βελτιωμένη απεικόνιση των συσχετίσεων και αυτό διότι καθώς «επιβάλλουμε» αυτές τις μεγάλες αποστάσεις μεταξύ σημείων γραμμών και στηλών, εξασφαλίζουμε ένα ευκολότερο εντοπισμό των ομαδοποιήσεων στο χώρο που ουσιαστικά αποτελούν συσχετίσεις. Σε ένα Συμμετρικό Biplot έχουν νόημα οι αποστάσεις μεταξύ σημείων της ίδιας μεταβλητής, όχι όμως και οι αποστάσεις μεταξύ σημείων διαφορετικών μεταβλητών. Άρα μπορούμε να οδηγηθούμε σε σωστή συμπερασματολογία σχετικά με τις αποστάσεις μόνο μέσω των Μη Συμμετρικών Biplots.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Συμπερασματολογία Ερμηνεία των αξόνων Νέες μεταβλητές που προκύπτουν από τις αρχικές μεταβλητές. Ά41 Ά42 Σημεία που συνεισφέρουν σε μεγαλύτερο βαθμό στην Αδράνεια του συγκεκριμένου άξονα. Ποσό της Αδράνειας του j άξονα για το σημείο- γραμμή: j Τα σημεία που αντιστοιχούν σε γραμμές με μεγάλη Μάζα και μεγάλη κατ απόλυτη τιμή συντεταγμένη στον j άξονα, θα έχουν και μεγαλύτερη συνεισφορά στην Αδράνεια. Η ερμηνεία των αξόνων βασίζεται στον εντοπισμό των σημείων με μεγάλη Συνεισφορά ή με άλλα λόγια των σημείων που χαρακτηρίζονται από υψηλές συντεταγμένες και Μάζες. Ά43 Πρόσημο των συντεταγμένων για να εξακριβώσουμε αν κάποιες κατηγορίες έχουν αντίθετη συνεισφορά. ru i 2 ij 2

Διαφάνεια 30 Ά41 Ά42 Ά43 Γενικά, η Ανάλυση Αντιστοιχιών ερμηνεύεται από τον έλεγχο των σημείων των επιπέδων- κατηγοριών των γραμμών και στηλών, όπως εκφράζονται από τις αντίστοιχες τιμές των συντεταγμένων τους. Οι τιμές αυτές «καθρεπτίζουν» τις συσχετίσεις ανάμεσα στις κατηγορίεςεπίπεδα των γραμμών- μεταβλητών και των στηλών- μεταβλητών. Τα σημεία των γραμμών που έχουν μικρές αποστάσεις από τα σημεία των στηλών αναπαριστάνουν συνδυασμούς που εμφανίζονται πιο συχνά, από ότι θα αναμενόταν κάτω από ένα μοντέλο ανεξαρτησίας, το οποίο είναι εκείνο που τα επίπεδα των γραμμών- μεταβλητών είναι ασυσχέτιστα με τα επίπεδα των στηλών- μεταβλητών. Οι μάζες στην Ανάλυση Αντιστοιχιών δεν είναι ίσες ενώ στην Ανάλυση Κυρίων Συνιστωσών σε κάθε σημείο αντιστοιχεί 1/n.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Συμπερασματολογία Επιλογή του πλήθους των αξόνων για να περιγράψουμε σε ικανοποιητικό βαθμό τα δεδομένα Ά44και για να πετύχουμε μείωση των διαστάσεων. Ά45 Τεχνικές: Scree Plot, Αθροιστικό ποσοστό Αδράνειας, Ά46 Ποσοστό κάθε κατηγορίας που ερμηνεύεται αν επιλέξουμε έστω k άξονες κ.α. Συμπληρωματικά σημεία Σημεία τα οποία δε χρησιμοποιήθηκαν προηγουμένως Ά47 στην ανάλυση και μπορούμε να τα προσθέσουμε στη γραφική απεικόνιση. Είναι κατάλληλα για τη διαχρονική παρακολούθηση και σύγκριση αποτελεσμάτων. Ά48 Έλεγχος εγκυρότητας.

Διαφάνεια 31 Ά44 Ά45 Ά46 Ά47 Ά48 Έχει στον οριζόντιο άξονα x τη σειρά και στον κάθετο άξονα y την τιμή της κάθε ιδιοτιμής. Το κριτήριο αυτό συνιστά να κρατήσουμε τόσους άξονες μέχρι το γράφημα να αρχίσει να γίνεται σχεδόν επίπεδο ή μέχρι να παρατηρήσουμε ότι αρχίζει να αλλάζει η κλίση της γραμμής. Φυσικά η τεχνική αυτή χαρακτηρίζεται από το μειονέκτημα της υποκειμενικότητας, καθώς πολλές φορές είναι δυσδιάκριτη η αλλαγή της κλίσης που μας ενδιαφέρει και για αυτό το λόγο η χρήση του Scree Plot πρέπει να γίνεται με προσοχή. που ερμηνεύεται από τους άξονες. Με βάση αυτό το κριτήριο θέτουμε κάποιο όριο, όπως για παράδειγμα 80% και επιλέγουμε τόσους άξονες που αθροιστικά θα ξεπερνούν το παραπάνω όριο- στόχο. Το συγκεκριμένο κριτήριο είναι ιδιαίτερα απλό και εύκολο στη χρήση, όμως πρακτικά δεν αποφέρει πάντα το καλύτερο αποτέλεσμα, κυρίως όταν το όριο- στόχος είναι αρκετά υψηλό. Ακόμα δεν είναι εύκολη και η επιλογή του ποσοστού της Αδράνειας που πρέπει να ορίσουμε ως όριο- στόχο. Αν κρατήσουμε k άξονες λογικά χάνουμε κάποιο κομμάτι πληροφορίας κάθε μεταβλητής και επιπλέον μπορούμε να υπολογίσουμε το ποσοστό της Αδράνειας που ερμηνεύεται τελικά. Αυτό το κριτήριο επιλέγει τόσους άξονες έτσι ώστε να ερμηνεύεται για κάθε κατηγορία τουλάχιστον ένα μεγάλο ποσοστό. Όμως και σε αυτήν την περίπτωση το κριτήριο εμπεριέχει υποκειμενικότητα και συν τοις άλλοις υπάρχει το ενδεχόμενο κάποια κατηγορία να μην ερμηνεύεται με σωστό τρόπο και έτσι να οδηγηθούμε σε μεγάλο αριθμό αξόνων. Αφορούν κυρίως τις βασικές μεταβλητές, αυτές δηλαδή που παρουσιάζουν το μεγαλύτερο ενδιαφέρον από πλευράς ανάλυσης.αν έχουμε στη διάθεσή μας τα Προφίλ των Συμπληρωματικών σημείων, τότε είναι εύκολο να υπολογίσουμε την απόσταση του νέου σημείου από το κέντρο και περαιτέρω μπορούμε με τη βοήθεια αυτής της απόστασης να βρούμε τις συντεταγμένες του νέου σημείου στον υπάρχοντα χώρο των βασικών αξόνων. Λόγω του ότι ένα συμπληρωματικό σημείο δεν έχει συνεισφορά στον άξονα, η τετραγωνική του συσχέτιση (Σχετική Συνεισφορά- Relative Contribution) με κάθε βασικό άξονα μπορεί να εξεταστεί. Μεγάλες τιμές υποδεικνύουν καλή προσαρμογή στην απεικόνιση και υπονοούν εγκυρότητα των μεταβλητών που μελετώνται.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) Συμπερασματολογία Ποιότητα Παρουσίασης Το μέτρο «Ποιότητα (Quality)» περιέχει πληροφορίες σχετικά με την ποιότητα της παρουσίασης των αντίστοιχων σημείων γραμμών στο σύστημα συντεταγμένων που προσδιορίζεται από το αντίστοιχο πλήθος των διαστάσεων, όπως επιλέγονται από τον ερευνητή. Ά49 Ά50 Η Ποιότητα ενός σημείου αναπαριστάνει την αναλογία της Συνεισφοράς αυτού του σημείου στη Συνολική Αδράνεια (X 2 Chi-square) που αντιπροσωπεύεται από τον επιλεγμένο αριθμό διαστάσεων. Ορίζεται επίσης ως το άθροισμα των τετραγώνων των συνημιτόνων και για τις n διαστάσεις που χρησιμοποιούνται για την αναπαράσταση των σημείων. Ά51 Μια μικρή Ποιότητα συνεπάγεται ότι ο υπάρχον αριθμός διαστάσεων δεν απεικονίζει ικανοποιητικά την αντίστοιχη γραμμή (ή στήλη).

Διαφάνεια 32 Ά49 Ά50 Ά51 Η «Ποιότητα (Quality)» ενός σημείου ορίζεται ως ο λόγος της τετραγωνικής απόστασης ενός σημείου από την αρχή των αξόνων στον επιλεγμένο αριθμό διαστάσεων, προς την τετραγωνική απόσταση από την αρχή των αξόνων στο χώρο που ορίζεται από το μέγιστο αριθμό διαστάσεων (η μετρική απόστασης είναι η X2). Υπάρχει αναλογία με την Παραγοντική Ανάλυση, όπου η ποιότητα ενός σημείου είναι παρόμοια με την ερμηνεία της Εταιρικότητας (Communality) μιας μεταβλητής. Η τιμή του τετραγώνου του συνημιτόνου αποτελεί ένδειξη της συσχέτισης μεταξύ των σημείων και των αξόνων.

Απλή Ανάλυση Αντιστοιχιών (S.C.A.) o Παρατηρήσεις Ευστάθεια (robustness) της Ανάλυσης Αντιστοιχιών. o Η προσθήκη μιας νέας κατηγορίας ή παρατήρησης δεν επιφέρει συνήθως μεταβολή των αποτελεσμάτων, τα οποία παρουσιάζουν μεγάλη σθεναρότητα. Όταν η Αδράνεια των δεδομένων δεν είναι μεγάλη, υπάρχει το Ά52ενδεχόμενο η Ανάλυση Αντιστοιχιών να μην εξάγει αποτελέσματα με ενδιαφέρον και ουσία και τότε όλα τα σημεία θα βρίσκονται πολύ κοντά μεταξύ τους στη γραφική απεικόνιση. Ά53 Ανάλυση Αντιστοιχιών «Model-free» μέθοδος Γαλλική σχολή σκέψης Ά54 Ελάχιστες υποθέσεις (επιλογή της απόστασης X 2 για την προβολή) Διερευνητικό όχι επαγωγικό χαρακτήρα Log-Linear Μοντέλα «Model-based» προσέγγιση Αγγλο-σαξωνική σχολή σκέψης Θέτουμε ένα μοντέλο και εκτιμούμε τις παραμέτρους του Επαγωγικό χαρακτήρα- Στατιστική Συμπερασματολογία

Διαφάνεια 33 Ά52 Ά53 Ά54 Ο έλεγχος ανεξαρτησίας X2 του Pearson δεν απορρίπτει τη μηδενική υπόθεση Η Ανάλυση Αντιστοιχιών δεν αποτελεί μια απλή μέθοδο ελέγχου της υπόθεσης της ανεξαρτησίας και παράλληλα, μεταξύ των άλλων, είναι κατάλληλη για την εξέταση της δομής των δεδομένων. Η δεύτερη αρχή του Benzecri, που θεωρείται ο πατέρας της Ανάλυσης Αντιστοιχιών, διατυπώνεται ως εξής: «Το μοντέλο πρέπει να ακολουθεί τα δεδομένα και όχι τα δεδομένα το μοντέλο».

Πολλαπλή Ανάλυση Αντιστοιχιών (M.C.A.) Ορισμός Mέθοδος αναπαράστασης των από κοινού ιδιοτήτων κατηγορικών Ά75 μεταβλητών τον οποίων το πλήθος είναι μεγαλύτερο του δύο. Σκοπός της Πολλαπλής Ανάλυσης Αντιστοιχιών είναι η μελέτη δεδομένων ενός πίνακα παρατηρήσεων που περιλαμβάνει Ά55 Ά56 κατηγορικές μεταβλητές. Ά73 Aποτελεί τη γενίκευση της Απλής Ανάλυσης Αντιστοιχιών, δεν είναι όμως το ανάλογο της με δύο μεταβλητές. Βέβαια η ερμηνεία των τιμών των συντεταγμένων, η τιμή της «Ποιότητας», τα τετραγωνικά συνημίτονα (cos 2 ) και άλλα στατιστικά μέτρα που εξάγονται ως αποτελέσματα της Πολλαπλής Ανάλυσης Αντιστοιχιών μπορούν να ερμηνευθούν με τον ίδιο τρόπο όπως και Ά74 στην Απλή Ανάλυση Αντιστοιχιών.

Διαφάνεια 34 Ά55 Ά56 Ά73 Ά74 Ά75 Η μέθοδος αναζητά βασικά να βρει την καλύτερη απεικόνιση όλων των κατηγοριών- επιπέδων των κατηγορικών μεταβλητών συνήθως σε ένα δισδιάστατο ή τρισδιάστατο διάγραμμα, με απώτερο σκοπό οι αποστάσεις μεταξύ των σημείων να αντιπροσωπεύουν τις αποκλίσεις ανάμεσα στις κατηγορίες. Βασική επιδίωξη είναι η μείωση των διαστάσεων, βρίσκοντας τη βέλτιστη προβολή των σημείων σε ένα χώρο μικρότερων διαστάσεων. Σκοπός της Πολλαπλής Ανάλυσης Αντιστοιχιών είναι η εύρεση βέλτιστων ποσοτικοποιήσεων, υπό την έννοια ότι τα επίπεδα- κατηγορίες πρέπει να χωρίζονται όσο το δυνατόν περισσότερο το ένα από το άλλο. Ο μέγιστος αριθμός διαστάσεων είναι ίσος με το πλήθος των επιπέδων- κατηγοριών μείον το πλήθος των μεταβλητών που δεν έχουν απούσες τιμές (missing data) ή εναλλακτικά τον αριθμό των παρατηρήσεων μείον ένα, οποιαδήποτε από τις δύο εναλλακτικές επιλογές είναι μικρότερη. Ωστόσο, σπάνια θα πρέπει να χρησιμοποιήσουμε το μέγιστο πλήθος διαστάσεων. Ένας μικρός αριθμός διαστάσεων είναι ευκολότερο να ερμηνευθεί και μετά από ένα συγκεκριμένο πλήθος διαστάσεων το ποσό της επιπρόσθετης συσχέτισης που υπολογίζεται είναι αμελητέο. Στην Πολλαπλή Ανάλυση Αντιστοιχιών μια μονοδιάστατη ή δισδιάστατη ή τρισδιάστατη λύση είναι η πιο συνηθισμένη. Oι πρώτοι άξονες που θα προκύψουν μετά την υλοποίηση της μεθόδου δε θα μπορούν να ερμηνεύσουν ένα μεγάλο και ικανό ποσοστό της μεταβλητότητας των δεδομένων και κατ επέκταση το διάγραμμα των δύο πρώτων αξόνων που επίσης προκύπτει δεν είναι σε θέση να μας αποδώσει μια ικανοποιητική εικόνα των δεδομένων.

Πολλαπλή Ανάλυση Αντιστοιχιών (M.C.A.) Προτερήματα 1) Παρέχει τη δυνατότητα απεικόνισης ενός μεγάλου πλήθους κατηγορικών μεταβλητών και παράλληλα καθιστά δυνατή τη μελέτη των συσχετίσεων μεταξύ των μεταβλητών αυτών. 2) Συμπυκνώνει την πληροφορία, που περικλείεται μέσα σε ένα μεγάλο αριθμό κατηγορικών μεταβλητών, σε ένα μικρότερο πλήθος συνεχών μεταβλητών (τους άξονες). 3) Έχει την ικανότητα να τρέπει τις κατηγορικές μεταβλητές σε συνεχείς κατά τον καλύτερο δυνατό τρόπο. 4) Μπορεί να αποκαλύψει τη διάταξη των επιπέδων- κατηγοριών του πλήθους των κατηγορικών μεταβλητών σε σχέση με τα υπόλοιπα δεδομένα.

Πολλαπλή Ανάλυση Αντιστοιχιών (M.C.A.) Βασικές Έννοιες 1. Πίνακας Δείκτης (Disjunctive Matrix) o o o o X n c H παράθεση των Q υποπινάκων: X [ X, X,..., X,..., X ] 1 2 Αποτελείται από μονάδες και μηδενικά, τις οποίες τιμές λαμβάνουν Ά60 οι κατηγορίες- επίπεδα κάθε κατηγορικής μεταβλητής. Aπαραίτητη η χρήση ψευδομεταβλητών και μάλιστα το πλήθος τους θα είναι τόσο, όσος είναι και ο αριθμός των επιπέδων των Ά61 μεταβλητών συνολικά. H Πολλαπλή Ανάλυση Αντιστοιχιών είναι ουσιαστικά η Ανάλυση Ά64 Αντιστοιχιών του πίνακα Δείκτη. Ά59 Ά62 q Ά63 Q

Διαφάνεια 36 Ά59 Ά60 Ά61 Ά62 Ά63 Ά64 n είναι το μέγεθος του δείγματος (το πλήθος των παρατηρήσεων) και c είναι ο συνολικός αριθμός των διαφορετικών επιπέδων- κατηγοριών των κατηγορικών μεταβλητών. Την τιμή 1 τη λαμβάνουν οι παρατηρήσεις (που περιέχονται στις γραμμές του πίνακα), όταν διαθέτουν το αντίστοιχο χαρακτηριστικό της εκάστοτε κατηγορικής μεταβλητής ενώ στην αντίθετη περίπτωση το κελί παίρνει την τιμή 0. Oι δυνατές τιμές της ψευδομεταβλητής είναι δύο: 0 ή 1, ανάλογα με το αν το επίπεδο της κατηγορικής μεταβλητής βρίσκεται σε αντιστοιχία με την κατηγορία με την οποία συσχετίζεται η συγκεκριμένη μεταβλητή. Ο πίνακας Δείκτης είναι κατά τεκμήριο ο νέος πίνακας δεδομένων, με τη βοήθεια του οποίου υλοποιείται η Πολλαπλή Ανάλυση Αντιστοιχιών. Eίναι ένας αραιός (sparse) πίνακας που θα απαρτίζεται από ένα μεγάλο πλήθος μηδενικών. Aν αναλύσουμε τον Πίνακα Δείκτη σα να ήταν ένας πίνακας συχνοτήτων διπλής εισόδου, τα αποτελέσματα της Ανάλυσης Αντιστοιχιών θα μας εφοδίαζαν με τις συντεταγμένες των στηλών που θα μας επιτρέψουν να συσχετίσουμε τα ποικίλα επίπεδα- κατηγορίες μεταξύ τους.

Πολλαπλή Ανάλυση Αντιστοιχιών (M.C.A.) Βασικές Έννοιες 2. Πίνακας Burt B11 B12... B1 X X p B21...... B...... Bp 1 Bp1... Bpp Έχει τη δυνατότητα να διασπάται σε p 2 Ά66 υποπίνακες. Όσοι υποπίνακες βρίσκονται πάνω στην κύρια διαγώνιο ουσιαστικά αποτελούν τους πίνακες συνάφειας κάθε μεταβλητής με τον εαυτό της και εξαιτίας αυτού τα μη διαγώνια στοιχεία των υποπινάκων αυτών είναι ίσα με το μηδέν. Ά67 Ά69 Ά68 Οι υποπίνακες χαρακτηρίζονται από μια συμμετρική δομή. Η SVD του πίνακα Burt ταυτογνωμεί με τη Φασματική Ανάλυση. Ά65 Ά70 Ά71 Ά72

Διαφάνεια 37 Ά65 Ά66 Ά67 Ά68 Ά69 Ά70 Ά71 Ά72 Όπου X είναι ο πίνακας Δείκτης. Ο πίνακας Burt επομένως προκύπτει από το εσωτερικό γινόμενο ενός πίνακα Δείκτη και ακόμα χαρακτηρίζεται από μια συγκεκριμένη δομή. Όπου p είναι το πλήθος των υπό ανάλυση κατηγορικών μεταβλητών. Το άθροισμα των διαγωνίων στοιχείων σε κάθε διαγώνιο υποπίνακα είναι αμετάβλητο και είναι ίσο με το σύνολο των παρατηρήσεων που εξετάζουμε. Για να εφαρμόσουμε Πολλαπλή Ανάλυση Αντιστοιχιών, είναι απαραίτητο να παράγουμε από τα δεδομένα τον πίνακα Δείκτη ή τον πίνακα Burt και εν συνεχεία μπορούμε να προχωρήσουμε σε Απλή Ανάλυση Αντιστοιχιών σε όποιον από τους δύο πίνακες επιλέξουμε για την ανάλυση. Οι διαγώνιοι υποπίνακες διαθέτουν τη μέγιστη Αδράνεια συγκριτικά με τους υποπίνακες που δε βρίσκονται στην κύρια διαγώνιο και αυτό οφείλεται στο γεγονός ότι όλες οι παρατηρήσεις είναι στη διαγώνιο ενώ στο αντίστοιχο διάγραμμα θα είναι στις άκρες του. Επομένως, η Αδράνεια των μη διαγώνιων υποπινάκων είναι αρκετά μικρότερη σε σχέση με την Αδράνεια των διαγώνιων υποπινάκων. καθώς ο πίνακας Burt είναι συμμετρικός. Η Πολλαπλή Ανάλυση Αντιστοιχιών με τη χρήση του πίνακα Burt μεταβάλλεται σε Απλή Ανάλυση Αντιστοιχιών, δεδομένου ότι οι γραμμές και οι στήλες του πίνακα Burt συμπίπτουν και λόγω της συμμετρίας του πίνακα αυτού. Συνάμα με τη χρήση στατιστικών ελέγχων που συγκρίνουν τις συντεταγμένες των επιπέδων- κατηγοριών, δίνεται η ευχέρεια σε κάποιον να συγκεκριμενοποιήσει αυτές τις κατηγορίες. Ένας τέτοιος έλεγχος σημαντικότητας των κατηγοριών στον πρώτο άξονα, είναι η εύρεση των λεγόμενων «Test-values» για κάθε κατηγορία στον πρώτο άξονα. Eλέγχουμε αν η συγκεκριμένη κατηγορία συσχετίζεται με τον άξονα ή όχι.

Έρευνα Αγοράς (Market Research) Ορισμός Η Έρευνα Αγοράς (Market Research) ορίζεται ως η μελέτη των αγορών (Market Places) και εστιάζει στα άτομα που αγοράζουν προϊόντα και υπηρεσίες, στις ιδιότητες που χαρακτηρίζουν αυτά τα άτομα και στον τρόπο με τον οποίο μπορεί να επιτευχθεί προσέγγιση Ά77 αυτών των ανθρώπων μέσω της διαφήμισης ή τρίτων μέσων προβολής. Εξετάζει τις ομάδες καταναλωτών καθώς και τις ανταγωνιστικές επιχειρήσεις που οριοθετούν μια συγκεκριμένη αγορά. Αποτελεί το σύνδεσμο ανάμεσα στους καταναλωτές, τους πελάτες και γενικότερα το κοινό.

Διαφάνεια 38 Ά77 Η Έρευνα Αγοράς κάνει χρήση στοιχείων που έχουν συλλεχθεί με σκοπό τη βελτίωση των γνώσεων της ως προς τις ανάγκες και τις επιθυμίες των καταναλωτών αλλά επίσης και για τη δομή και τις προοπτικές που διαφαίνονται στον ορίζοντα για μια αγορά. Κάθε Έρευνα Αγοράς πρέπει να χαρακτηρίζεται αφενός από συστηματικότητα, διότι είναι επιτακτικός ο εκ των προτέρων πολύ προσεκτικός της σχεδιασμός και αφετέρου από αντικειμενικότητα, καθώς θα πρέπει να διεκπεραιώνεται άνευ συναισθηματικών, πολιτικών ή άλλων παραγόντων. Άγγελος; 20/12/2013

Έρευνα Αγοράς (Market Research) Στόχοι της Έρευνας Αγοράς o Εξασφαλίσει τις απαραίτητες για τη λειτουργία τους πληροφορίες. o Ελαχιστοποιήσει, όσο το δυνατόν, τα σφάλματα στη διαδικασία λήψης αποφάσεων. o Διευκολύνει τη διαδικασία αγοράς (πώλησης προϊόντων ή υπηρεσιών) προσφέροντας στους πωλητές και τους αγοραστές πιο αξιόπιστη πληροφόρηση. o Επισημάνει επιχειρηματικές ευκαιρίες. o Ανιχνεύσει για πιθανές επιχειρηματικές απειλές και κινδύνους.

Έρευνα Αγοράς (Market Research) Στάδια Έρευνας Αγοράς Ά78 Εικόνα 1: Στάδια Διεξαγωγής της Έρευνας Αγοράς

Διαφάνεια 40 Ά78 Στη βιβλιογραφία απαντώνται τρία είδη έρευνας: Εξερευνητική (Exploratory) Περιγραφική (Descriptive) Αιτιολογική (Causal) Άγγελος; 20/12/2013

Έρευνα Αγοράς (Market Research) Ερωτηματολόγιο (Questionnaire) Το ερωτηματολόγιο είναι ένα τυποποιημένο σύνολο ερωτήσεων που αποσκοπεί στη συλλογή συγκεκριμένων πληροφοριών σχετικά με τους ερωτηθέντες. Η χρήση του εστιάζεται σε τρεις κύριους στόχους: 1. Τη μετατροπή των αναγκαίων πληροφοριών σε συγκεκριμένες ερωτήσεις που θα μπορούν να απαντηθούν από τους ερωτηθέντες. 2. Την προτροπή και την ενθάρρυνση των ερωτηθέντων για να απαντήσουν στις ερωτήσεις. 3. Την ελαχιστοποίηση του Σφάλματος Απόκρισης (Response Error), το οποίο συγκαταλέγεται στην ευρύτερη κατηγορία των Σφαλμάτων Παρατήρησης (Observational Errors) μαζί με τα Σφάλματα Μέτρησης (Measurement Errors).

Έρευνα Αγοράς (Market Research) Χαρακτηριστικά του Ερωτηματολογίου Ά79 Εικόνα 2: Το ερωτηματολόγιο ως αμφίδρομη επικοινωνία

Διαφάνεια 42 Ά79 Κατά γενικό κανόνα, το ερωτηματολόγιο θεωρείται καλή επιλογή όταν οι οικονομικοί πόροι είναι περιορισμένοι όπως και τα χρονικά περιθώρια, αλλά και όταν είναι επιτακτική η ανάγκη προστασίας των προσωπικών στοιχείων των ερωτηθέντων. Άγγελος; 20/12/2013

Έρευνα Αγοράς (Market Research) Σχεδιασμός Ερωτηματολογίου Εικόνα 3: Η διαδικασία σχεδιασμού του ερωτηματολογίου

Έρευνα Αγοράς (Market Research) Διαδικασία της Δειγματοληψίας Ά80 Εικόνα 4: Διαδικασία Δειγματοληψίας

Διαφάνεια 44 Ά80 -Χαμηλότερο κόστος: Οι πληροφορίες στα δεδομένα προέρχονται από ένα τμήμα του πληθυσμού. -Μεγαλύτερη ταχύτητα: Η συλλογή και η επεξεργασία των δεδομένων είναι ταχύτερη. -Μεγαλύτερη ακρίβεια: Πιο προσεκτική εποπτεία της διεξαγωγής της έρευνας και πιο προσεκτική επεξεργασία των αποτελεσμάτων είναι εφικτή. Ο κύριος στόχος είναι η λήψη ενός δείγματος το οποίο να είναι αντιπροσωπευτικό του πληθυσμού και το οποίο να οδηγεί σε εκτιμήσεις των χαρακτηριστικών του πληθυσμού με όσο το δυνατόν μεγαλύτερη ακρίβεια μπορούμε να επιτύχουμε για το κόστος ή για την προσπάθεια που είμαστε έτοιμοι να καταβάλλουμε. Άγγελος; 20/12/2013

Έρευνα Αγοράς (Market Research) Αναφορά (Report) Ά81 Εικόνα 5: Η Διαδικασία Προετοιμασίας της Αναφοράς (Report) και της Παρουσίασης των Ευρημάτων της Έρευνας

Διαφάνεια 45 Ά81 Η Αναφορά (Report) είναι «μια προφορική παρουσίαση που μπορεί να συνοδεύεται και από ένα γραπτό κείμενο και η οποία αποσκοπεί στο να παρουσιάσει τα αποτελέσματα της έρευνας, τις στρατηγικές προτάσεις καθώς και άλλα συμπεράσματα στη διοίκηση αλλά και σε κάθε ενδιαφερόμενο». Η Αναφορά όπως και η Παρουσίαση των αποτελεσμάτων αποτελούν το τελευταίο βήμα της διαδικασίας της Έρευνας Αγοράς και άρα το Report συμπυκνώνει ολόκληρη την αξία της έρευνας. Άγγελος; 20/12/2013

Έρευνα Αγοράς & Ανάλυση Αντιστοιχιών Οι Hoffman & Franke, (1986) συμπεραίνουν ότι: Correspondence Analysis is very flexible. Not only is it flexible in terms of data requirements, but also allows for incorporation of marketing knowledge. Categorical data are common products of market research. However, the analysis of such data often is hindered by the requirements and limitations of many familiar research tools. Correspondence Analysis is a versatile and easily implemented analytical method that can do much to assist researchers in detecting and explaining relationships among complex marketing phenomena.

Έρευνα Αγοράς & Ανάλυση Αντιστοιχιών Η Ανάλυση Αντιστοιχιών έχει κάποια χαρακτηριστικά που συμβάλλουν στην ωφελιμότητα της στους ερευνητές αγοράς: Πολυμεταβλητή επεξεργασία των δεδομένων μέσω της ταυτόχρονης εξέτασης των κατηγορικών μεταβλητών. Ά82 Φανερώνει το πώς εξαρτώνται οι μεταβλητές και όχι μόνο αν υπάρχει εξάρτηση. Η συνδυαστική γραφική απεικόνιση που προκύπτει από την Ανάλυση Αντιστοιχιών βοηθά στον εντοπισμό δομικών εξαρτήσεων μεταξύ των επιπέδων- κατηγοριών των μεταβλητών. Έχει πολύ ευέλικτες απαιτήσεις αναφορικά με τα δεδομένα. Η μόνη αυστηρή συνθήκη είναι να έχουμε στη διάθεσή μας έναν ορθογώνιο πίνακα δεδομένων με μη αρνητικές καταχωρίσεις. Δημιουργεί δύο διπλές οπτικές παρουσιάσεις των οποίων η γεωμετρική διάταξη των αντικειμένων των γραμμών και των στηλών έχουν παρόμοιες ερμηνείες, διευκολύνοντας έτσι την ανάλυση και τον έλεγχο εξαρτήσεων.

Διαφάνεια 47 Ά82 Η πολυμεταβλητή φύση της Ανάλυσης Αντιστοιχιών μπορεί να αποκαλύψει συσχετίσεις που δε θα ήταν ανιχνεύσιμες σε μια σειρά συγκρίσεων κατά ζεύγη των μεταβλητών. Άγγελος; 20/12/2013

Έρευνα Αγοράς & Ανάλυση Αντιστοιχιών Οι Lebart, Morineau & Warwick (1984) προτείνουν τρεις προϋποθέσεις για να είναι πιο αποτελεσματική η μέθοδος: 1. Ο πίνακας δεδομένων πρέπει να είναι αρκετά μεγάλος έτσι ώστε η οπτική εξέτασή του ή η απλή στατιστική ανάλυση να μη μπορεί να αποκαλύψει τη δομή του. 2. Οι μεταβλητές πρέπει να είναι ομοιογενείς έτσι ώστε να έχει νόημα ο υπολογισμός της στατιστικής απόστασης μεταξύ γραμμών και στηλών και επίσης οι αποστάσεις αυτές να ερμηνεύονται κατά ουσιαστικό τρόπο. 3. Ο πίνακας δεδομένων πρέπει να είναι εκ των προτέρων «άμορφος», να στερείται δηλαδή μορφής, να είναι ακαθόριστος. Με άλλα λόγια, η μέθοδος είναι πιο γόνιμα υλοποιήσιμη σε δεδομένα των οποίων η δομή είναι είτε άγνωστη είτε μόνο απλά κατανοητή.

Έρευνα Αγοράς & Ανάλυση Αντιστοιχιών Συμπεράσματα Η Ανάλυση Αντιστοιχιών είναι μια μέθοδος διερευνητικής ανάλυσης δεδομένων που (1) ποσοτικοποιεί πολυμεταβλητά κατηγορικά δεδομένα, (2) παρέχει γραφική απεικόνιση της δομής στα δεδομένα και (3) δεν θέτει αυστηρούς περιορισμούς μετρήσεων. Η Ανάλυση Αντιστοιχιών είναι ιδιαίτερα ευέλικτη. Όχι μόνο είναι ευέλικτη από την άποψη περιορισμών δεδομένων αλλά επίσης επιτρέπει την ενσωμάτωση της γνώσης της αγοράς. Η τεχνική Τα κατηγορικά της προσαρμογής δεδομένα είναιτων συνηθισμένα συμπληρωματικών προϊόντα τηςσημείων Έρευνας στην απεικόνιση Αγοράς. είναι Εντούτοις, ένας ενδιαφέρων η ανάλυση και στην τέτοιων πραγματικότητα δεδομένων απεριόριστος πολλάκις τρόπος εμποδίζεται για να ενσωματώσει από τους περιορισμούς κανείς εξωτερική πολλώνπληροφορία γνωστών ερευνητικών στην ανάλυση. Είναι εργαλείων. ακόμα χρήσιμη Η Ανάλυση η τεχνική Αντιστοιχιών αυτή, ως είναι ένας μιαέλεγχος ευπροσάρμοστη εγκυρότητας και στα δεδομένα εύκολα υλοποιήσιμη και ως ένααναλυτική εργαλείομέθοδος για τοπου χειρισμό μπορεί ενοχλητικών να κάνει πολλάακραίων για τιμών. να βοηθήσει τους ερευνητές στο να ελέγξουν και να εξηγήσουν συσχετίσεις ανάμεσα σε πολύπλοκα φαινόμενα αγοράς.

Πρακτική εφαρμογή Πολλαπλής Ανάλυσης Αντιστοιχιών σε δεδομένα Έρευνας Αγοράς Μέθοδος Δειγματοληπτικής Έρευνας Περιγραφική Ποσοτική Έρευνα Συλλογή δεδομένων σε ένα χρονικό σημείο με στόχο να περιγράψει τη φύση κοινωνικών γεγονότων ή να προσδιορίσει τις σχέσεις που υπάρχουν ανάμεσα σε συγκεκριμένα γεγονότα. Έχει πολύ συγκεκριμένο σκοπό και χρησιμοποιείται όταν οι ακριβείς πληροφορίες που συσχετίζονται με την έρευνα έχουν καθοριστεί εκ των προτέρων με σαφήνεια και αναζητούνται ποσοτικά αποτελέσματα, με τη βοήθεια των οποίων θα ελεγχθούν οι ερευνητικές υποθέσεις και θα κατασκευαστούν στατιστικά μοντέλα.

Πρακτική εφαρμογή Πολλαπλής Ανάλυσης Αντιστοιχιών σε δεδομένα Έρευνας Αγοράς Πληθυσμός Αναφοράς- Δείγμα Τα δεδομένα που χρησιμοποιήθηκαν στην πρακτική εφαρμογή προέρχονται από μια Έρευνα Αγοράς που διεξήγαγε η Data Research & Consulting SA (Data RC), εταιρεία που παρέχει Ά83 υπηρεσίες ερευνών αγοράς και μάρκετινγκ. Ως πληθυσμός αναφοράς της έρευνας ορίστηκε το σύνολο των ανθρώπων- πελατών που ήταν διαθέσιμοι εκείνη τη χρονική στιγμή έξω από τα εμπορικά καταστήματα μεγάλων πόλεων της Ελλάδος (Αθήνα, Θεσσαλονίκη, Πάτρα) στα οποία διεξαγόταν η έρευνα. Το μέγεθος του δείγματος που χρησιμοποιήθηκε στην έρευνα ήταν 588 συμμετέχοντες.

Διαφάνεια 51 Ά83 Η συγκεκριμένη έρευνα δε θα μπορούσε να ολοκληρωθεί χωρίς τη βοήθεια της Κας Κανελλοπούλου Θάλειας, υπεύθυνης του τμήματος ερευνών Άγγελος; 20/12/2013