Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης"

Transcript

1 Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται τρεις βασικές μέθοδοι πολυμεταβλητής ανάλυσης. Συγκεκριμένα θα παρουσιαστούν η παραγοντική ανάλυση, η ανάλυση συστάδων και η διαχωριστική ανάλυση. Οι μέθοδοι αυτές αναπτύσσονται στην κλασική Στατιστική, έχουν εφαρμογές σε πολλές επιστήμες και χρησιμοποιούνται ευρέως στη Γεωγραφική Ανάλυση. Η παρουσίαση είναι συνοπτική εστιάζοντας περισσότερο στον τρόπο εφαρμογής παρά στο μαθηματικό υπόβαθρο, για το οποίο γίνεται παραπομπή σε σχετικά συγγράμματα. Προαπαιτούμενη γνώση Απαραίτητη είναι η κατανόηση των βασικών μέτρων περιγραφικής στατιστικής, των στατιστικών ελέγχων, της ανάλυσης συσχέτισης και της ανάλυσης παλινδρόμησης. Επίσης πολύ χρήσιμο είναι το υπόβαθρο στη Γραμμική Άλγεβρα. 6.1 Εισαγωγή Οι πολυμεταβλητές (multivariate) μέθοδοι ανάλυσης αφορούν δεδομένα τα οποία περιλαμβάνουν μεγάλο αριθμό μεταβλητών οι οποίες αναλύονται ταυτοχρόνως. Η ανάγκη ανάπτυξης ειδικών μεθόδων ανάλυσης των πολυμεταβλητών δεδομένων μπορεί να υπακούει σε κάποιες θεωρητικές υποθέσεις, αλλά μπορεί να αφορά απλά την ταξινόμηση και την προσπάθεια κατανόησης μεγάλου αριθμού δεδομένων. Όταν δηλαδή έχουμε στη διάθεσή μας μεγάλο όγκο πληροφορίας συχνά υπάρχει πλεονασμός πληροφορίας, δηλαδή το ίδιο χαρακτηριστικό των παρατηρήσεων μετράται και περιγράφεται από πολλές μεταβλητές. Το πρώτο βήμα στις πολυμεταβλητές μεθόδους είναι να προσπαθήσουμε να βρούμε μια δομή στα δεδομένα με την ταξινόμησή τους. Επιπλέον οι πολυμεταβλητές μέθοδοι επιτυγχάνουν τη συνοπτική παρουσίαση των δεδομένων, αποκαλύπτοντας όμως βασικές διαστάσεις και συσχετίσεις. Στη βιβλιογραφία ονομάζονται και τεχνικές μείωσης των δεδομένων (data reduction techniques), αλλά και μέθοδοι ταξινόμησης (classification methods). Η Bιολογία αποτελεί χαρακτηριστικό παράδειγμα επιστήμης η οποία στηρίζεται στην ταξινόμηση για τη μελέτη των φυτών και των ζώων. Στη Γεωγραφία, ίσως η ταξινόμηση δεν είναι τόσο αυστηρά δομημένη, αλλά εξυπηρετεί τον ίδιο σκοπό. Συχνά τα γεωγραφικά φαινόμενα δεν είναι εύκολα μετρήσιμα και μπορούν να περιγραφούν με διαφορετικούς τρόπους. Η ταξινόμηση βοηθά στην κατανόηση της πολυπλοκότητας και της διαφοροποίησης και είναι πολύ σημαντική, τόσο για την περιγραφή, όσο και για την ανάλυση των φαινομένων. Πρέπει όμως να τονιστεί, ότι η ταξινόμηση δεν αποτελεί απλώς τη διαίρεση ενός ομοιογενούς συνόλου δεδομένων σε υποομάδες, αλλά τον ορισμό ομάδων οι οποίες ανταποκρίνονται στην πραγματικότητα. Επομένως στις πολυμεταβλητές μεθόδους πρέπει να υπάρχει μια υπόθεση για τη δομή των δεδομένων, ενώ όπως θα εξηγηθεί παρακάτω, τα αποτελέσματα χρειάζονται κατάλληλη ερμηνεία. Με την έννοια αυτή τα αποτελέσματα έχουν έναν βαθμό υποκειμενικότητας. Στη σύγχρονη εποχή, τα ψηφιακά δεδομένα είναι όλο και περισσότερο διαθέσιμα και συχνά έχουν μεγάλη γεωγραφική ανάλυση, αφορούν δηλαδή πολύ μικρές γεωγραφικές ενότητες, όπως για παράδειγμα τα εικονοστοιχεία (pixels). Επομένως υπάρχει μεγαλύτερη ανάγκη για κατάλληλες μεθόδους περιγραφής και ανάλυσής τους. Η δυνατότητα χρήσης κατάλληλων προγραμμάτων ηλεκτρονικών υπολογιστών έκανε εφικτή την εμπειρική εφαρμογή των πολυμεταβλητών μεθόδων στην ανάλυση γεωγραφικών δεδομένων, δεδομένου ότι οι υπολογισμοί είναι σύνθετοι. Οι πολυμεταβλητές μέθοδοι ταξινόμησης καθώς και ορισμένες από τις τεχνικές που παρουσιάστηκαν στα προηγούμενα κεφάλαια παρά το γεγονός ότι έχουν αναπτυχθεί πριν από αρκετές δεκαετίες, εντάσσονται σε ένα νέο πεδίο ανάλυσης δεδομένων, την εξόρυξη δεδομένων (data mining). Οι πολυμεταβλητές μέθοδοι περιλαμβάνουν πολλές τεχνικές ανάλογα με το πρόβλημα που αντιμετωπίζουν. Πρέπει να σημειωθεί ότι η πολλαπλή παλινδρόμηση που παρουσιάστηκε στο προηγούμενο κεφάλαιο συγκαταλέγεται στις πολυμεταβλητές μεθόδους, αλλά ο αριθμός των μεταβλητών που χρησιμοποιεί συνήθως δεν υπερβαίνει τις δέκα. Υπάρχουν όμως πολυμεταβλητές τεχνικές που χρησιμοποιούν πολύ περισσότερες από δέκα και σε ορισμένες περιπτώσεις περισσότερες από 100 μεταβλητές. 179

2 Στo κεφάλαιο αυτό θα περιγραφούν οι βασικές αρχές για τρεις μόνο από τις πολυμεταβλητές μεθόδους που έχουν ευρύτερη εφαρμογή στην ανάλυση γεωγραφικών δεδομένων: η παραγοντική ανάλυση (factor analysis), η ανάλυση κατά συστάδες (cluster analysis) και η διαχωριστική ανάλυση (discriminant analysis). Είναι σκόπιμο να κάνουμε μία τεχνική παρατήρηση εξαρχής η οποία είναι πολύ σημαντική για την κατανόηση των μεθόδων που θα παρουσιαστούν. Όπως ήδη έχουμε δει στα διαγράμματα διασποράς (Κεφάλαια 3 και 5) οι παρατηρήσεις απεικονίζονται ως σημεία στον δισδιάστατο χώρο των μεταβλητών, οι οποίες παριστάνονται με τους άξονες Χ και Υ. Η απεικόνιση αυτή μπορεί να γίνει μέχρι τρεις διαστάσεις, αλλά στις πολυμεταβλητές μεθόδους οι παρατηρήσεις βρίσκονται σε έναν πολυδιάστατο χώρο μεταβλητών, για παράδειγμα, αν p είναι ο αριθμός των μεταβλητών, σε p-διάστατο χώρο. Υπάρχουν δύο ειδών απεικονίσεις: Τα διαγράμματα διασποράς παρουσιάζουν τις παρατηρήσεις ως σημεία στον p-διάστατο χώρο των μεταβλητών και αυτή είναι η συνηθέστερη απεικόνιση η οποία λαμβάνει υπόψη τις γραμμές σε μία γεωγραφική μήτρα δεδομένων. Η απεικόνιση των μεταβλητών στο χώρο των παρατηρήσεων, όπου οι μεταβλητές ορίζονται ως διανύσματα (vectors) στο n-διάστατο χώρο των παρατηρήσεων, αν n είναι ο αριθμός των παρατηρήσεων. Στην περίπτωση αυτή, η απεικόνιση γίνεται λαμβάνοντας υπόψη τις στήλες στη γεωγραφική μήτρα δεδομένων, μία μεταβλητή δηλαδή ορίζεται στον διανυσματικό χώρο από τις τιμές όλων των παρατηρήσεων για αυτή. Αυτού του είδους η απεικόνιση είναι πολύ χρήσιμη στην παραγοντική ανάλυση (O'Sullivan & Unwin, 2003). Τέλος, η απόσταση η οποία αποτελεί πολύ σημαντική έννοια στην ανάλυση των συστάδων, αλλά και στη διαχωριστική ανάλυση, είναι η στατιστική απόσταση μεταξύ των παρατηρήσεων και όχι η απόλυτη ή σχετική απόσταση που αναφέραμε στο Κεφάλαιο 1. Οι συντεταγμένες δηλαδή των παρατηρήσεων για να υπολογιστεί η απόστασή τους στον πολυδιάστατο χώρο είναι οι τιμές που έχουν για τις μεταβλητές. 6.2 Παραγοντική ανάλυση Ο κύριος σκοπός της παραγοντικής ανάλυσης (factor analysis) είναι να αντικαταστήσει έναν μεγάλο αριθμό μεταβλητών από έναν μικρότερο αριθμό ανεξάρτητων μεταβλητών, οι οποίες δεν περιλαμβάνονται στις αρχικές μεταβλητές και ονομάζονται παράγοντες (factors). Αν τα αρχικά δεδομένα είναι ένας πίνακας διαστάσεων n x p, όπου n είναι ο αριθμός των παρατηρήσεων και p ο αριθμός των μεταβλητών, η μέθοδος καταλήγει σε έναν πίνακα n x f, όπου f ο αριθμός των παραγόντων και f p. Αντικαθίστανται επομένως οι αρχικές μεταβλητές με έναν μικρότερο αριθμό νέων μεταβλητών οι οποίες δεν έχουν συσχέτιση μεταξύ τους. Η παραγοντική ανάλυση είναι κατ αρχήν τεχνική μείωσης των δεδομένων και κατά δεύτερο λόγο μέθοδος ταξινόμησης. Οι λόγοι για τους οποίους θα ήταν επιθυμητή μια τέτοια μετατροπή των αρχικών δεδομένων αφορούν πρωτίστως τον έλεγχο υποθέσεων, σχετικά με τη δομή των δεδομένων, τις οποίες ο ερευνητής επιχειρεί να επαληθεύσει, με την εξαγωγή αντίστοιχων παραγόντων. Αλλά, ακόμα και χωρίς αρχικές υποθέσεις, η παραγοντική ανάλυση μπορεί να αποκαλύψει μια δομή των δεδομένων που είναι πιθανά χρησιμότερη σε σχέση με τον μεγάλο αριθμό των αρχικών μεταβλητών, επειδή αυτές μπορεί να συγκαλύπτουν τα γενικά χαρακτηριστικά της ομάδας των παρατηρήσεων που αναλύεται. Εξάλλου, το γεγονός ότι οι παράγοντες που προκύπτουν είναι ανεξάρτητοι μεταξύ τους, είναι χρήσιμη ιδιότητα για να προετοιμαστούν τα δεδομένα για άλλες αναλύσεις, όπως η ανάλυση παλινδρόμησης ή οι μέθοδοι ταξινόμησης, για τις οποίες η ιδιότητα της ανεξαρτησίας των μεταβλητών είναι στατιστικά αναγκαία. Τέλος, στη Γεωγραφία, η παραγοντική ανάλυση έχει χρησιμοποιηθεί εκτός των άλλων για οριοθετήσεις περιφερειών, παρόλο που δεν είναι αυτός ο κατεξοχήν στόχος της μεθόδου. Στην περίπτωση αυτή για κάθε παρατήρηση (γεωγραφική ενότητα) οι τιμές των αρχικών μεταβλητών αντικαθίστανται από τιμές για καθένα από τους παράγοντες που αποτελούν πλέον τις νέες μεταβλητές για την περιγραφή των γεωγραφικών ενοτήτων. Η οριοθέτηση περιφερειών γίνεται χρησιμοποιώντας τις τιμές για έναν ή περισσότερους παράγοντες. Η παραγοντική ανάλυση έχει τις αφετηρίες της στην επιστήμη της Ψυχολογίας στις αρχές του προηγούμενου αιώνα, όταν οι ερευνητές προσπαθούσαν να μετρήσουν την έννοια της «γενικής ευφυΐας» χρησιμοποιώντας τις βαθμολογίες σε πολλά διαφορετικά αντικείμενα μαθητικών εξετάσεων. Οι ψυχολόγοι την εποχή εκείνοι είχαν αποδεχθεί την έννοια της γενικής ευφυΐας αλλά δεν είχαν καταλήξει στον τρόπο μέτρησής της (Taylor, 1977). Το αποτέλεσμα ήταν να αναπτυχθεί η μέθοδος της παραγοντικής ανάλυσης. Αν για έναν αριθμό μαθητών γνωρίζουμε τη βαθμολογία τους σε τέσσερα μαθήματα, είναι λογικό να υποθέσουμε ότι 180

3 μαθητές με υψηλό βαθμό σε ένα μάθημα θα τείνουν να έχουν υψηλό βαθμό και στα υπόλοιπα μαθήματα, αλλά μπορεί να υπάρχουν εξαιρέσεις. Η θεωρητική υπόθεση είναι ότι υπάρχει ένας γενικός παράγοντας ευφυΐας και ένας παράγοντας που αντιπροσωπεύει την κλίση σε ένα μάθημα. Ο σκοπός της παραγοντικής ανάλυσης είναι να διαχωρίσει αυτούς τους δύο παράγοντες ανάλογα με τη βαθμολογία των μαθητών. Κάθε μεταβλητή που παριστάνει τη βαθμολογία σε ένα μάθημα x i αποτελεί συνάρτηση αυτών των δύο παραγόντων, τον γενικό παράγοντα g και τον ειδικό παράγοντα u ο οποίος εκφράζει την κλίση του μαθητή στο συγκεκριμένο μάθημα. Αν υποθέσουμε ότι υπάρχει γραμμική σχέση μεταξύ των μεταβλητών καταλήγουμε σε εξισώσεις της μορφής: x i = w i(g) g + w i(u) u όπου w i(g) είναι το βάρος του μαθήματος i για τον γενικό παράγοντα g και w i(u) το βάρος του μαθήματος i για τον ειδικό παράγοντα u. Το αντικείμενο της παραγοντικής ανάλυσης είναι να υπολογίσει τα βάρη w i(g) και w i(u), δηλαδή να εκφράσει τη βαθμολογία σε ένα μάθημα i ως συνάρτηση των δύο παραγόντων. Τα βάρη w i(g) αντιπροσωπεύουν τη συσχέτιση κάθε μαθήματος i με τον παράγοντα της γενικής ευφυΐας g. Κάποια μαθήματα έχουν μεγαλύτερη σχέση με τον παράγοντα της γενικής ευφυΐας και κάποια μικρότερη. Αφού γίνει ο υπολογισμός των βαρών, μπορεί να υπολογιστεί ένας γενικός δείκτης ευφυΐας για κάθε έναν μαθητή j, ο οποίος θα είναι ένας γραμμικός συνδυασμός των βαρών w ig με τη βαθμολογία του σε κάθε μάθημα. Για παράδειγμα αν έχουμε τους βαθμούς τεσσάρων μαθημάτων για έναν μαθητή j τότε: g j = w 1(g) x 1(j) + w 2(g) x 2(j) + w 3(g) x 3(j) + w 4(g) x 4(j) = w i(g) x i(j) ι=1 όπου x i(j) είναι η βαθμολογία του μαθητή j στο μάθημα i και w i(g) τα βάρη του γενικού παράγοντα ευφυΐας g για κάθε μάθημα. Με τον τρόπο αυτό μπορούμε να έχουμε τιμές για όλους τους μαθητές και δημιουργείται μία νέα μεταβλητή ο παράγοντας γενικής ευφυΐας g. Στην πραγματικότητα έχουμε πολύ μεγαλύτερο αριθμό παρατηρήσεων και μεταβλητών και μπορεί να εξαχθούν περισσότεροι παράγοντες. Όμως πάντα ο αριθμός των παραγόντων πρέπει να είναι μικρότερος από τον αριθμό των μεταβλητών. Η παραγοντική ανάλυση περιλαμβάνει ποικιλία μεθόδων και παρουσιάζεται αναλυτικά σε συγγράμματα στατιστικών μεθόδων (Johnson & Wichern, 2007 Kim & Mueller, 1978). Αλλά και σε πολλά εγχειρίδια στην περιοχή της Γεωγραφικής Ανάλυσης παρουσιάζεται η μέθοδος της παραγοντικής ανάλυσης (Johnston, 1980 Κουτσόπουλος, 2009 Robinson, 1998 Rogerson, 2006 Shaw & Wheeler, 2000). Εδώ παρουσιάζονται ορισμένα μόνο βασικά χαρακτηριστικά της μεθόδου, χωρίς να αναλύεται το μαθηματικό υπόβαθρο. Η παραγοντική ανάλυση γίνεται καλύτερα κατανοητή με τη γεωμετρική απεικόνιση των μεταβλητών και των παρατηρήσεων. Στον δισδιάστατο χώρο έχουμε παρουσιάσει τα διαγράμματα διασποράς (βλ. Κεφάλαιο 3). Μέχρι τον τρισδιάστατο χώρο μπορεί να γίνει απεικόνιση αυτού του είδους, αλλά για περισσότερες διαστάσεις δεν είναι δυνατό. Στο Διάγραμμα 6.1 φαίνεται το διάγραμμα διασποράς για δύο μεταβλητές, κάθε μία από τις οποίες είναι ένας άξονας X και Y. Δημιουργείται ένα σύννεφο σημείων και επιθυμούμε να προσδιορίσουμε δύο άξονες οι οποίοι συγκεντρώνουν τη συνολική μεταβλητότητα των δεδομένων. Τα περισσότερα σημεία περιλαμβάνονται σε μία έλλειψη και οι δύο άξονες της έλλειψης αποτελούν τους δύο παράγοντες. Οι άξονες είναι κάθετοι και αυτό υποδεικνύει ότι είναι ανεξάρτητοι. Οι άξονες δεν έχουν το ίδιο μήκος, ο μεγαλύτερος άξονας είναι αυτός ο οποίος είναι ο πιο σημαντικός ως προς τη μεταβλητότητα που συγκεντρώνει. Κάθε άξονας αποτελεί γραμμική συνάρτηση των αρχικών μεταβλητών. Στο συγκεκριμένο παράδειγμα οι δύο άξονες αποτελούν τις δύο νέες μεταβλητές οι οποίες αντικαθιστούν τις αρχικές μεταβλητές και εκφράζουν διαφορετικές και ανεξάρτητες διαστάσεις τους. Υπάρχει αναλογία με το μοντέλο της παλινδρόμησης, που μπορεί να θεωρηθεί ως η αντικατάσταση των μεταβλητών από έναν παράγοντα (τον μεγαλύτερο άξονα), που είναι η γραμμή της παλινδρόμησης και συγκεντρώνει το μεγαλύτερο τμήμα της μεταβλητότητας. Ο μικρότερος άξονας αντιστοιχεί στη μη ερμηνευόμενη μεταβλητότητα (Johnson & Wichern, 2007 Shaw & Wheeler, 2000 Taylor, 1977). Όταν ο αριθμός των μεταβλητών είναι μεγαλύτερος, κάτι που είναι η συνήθης περίπτωση, μπορεί να δημιουργηθούν περισσότεροι παράγοντες, οι οποίοι στον n-διάστατο χώρο των παρατηρήσεων είναι κάθετοι μεταξύ τους αλλά έχουν διαφορετικά μήκη. Για την εξαγωγή των παραγόντων, είναι χρησιμότερη η απεικόνιση των μεταβλητών στο χώρο των παρατηρήσεων. Στο Διάγραμμα 6.2 παρουσιάζονται δύο ομάδες μεταβλητών 4 181

4 (επτά συνολικά) οι οποίες είναι συσχετισμένες και ο σκοπός της παραγοντικής ανάλυσης σε αυτό το υποθετικό παράδειγμα είναι να βρει δύο παράγοντες που θα αντικαταστήσουν τις δύο αυτές ομάδες μεταβλητών. Στη γεωμετρική παρουσίαση η γωνία μεταξύ των μεταβλητών εκφράζει τη συσχέτισή τους (Johnson & Wichern, 2007 Taylor, 1977), όταν είναι κάθετες μεταξύ τους είναι ανεξάρτητες και όσο μικρότερη η γωνία η συσχέτιση είναι μεγαλύτερη. Οι μεταβλητές έχουν όλες το ίδιο μήκος επειδή είναι τυποποιημένες και το μήκος τους ισούται με τη μονάδα. Στο Διάγραμμα 6.3 παρουσιάζονται οι επτά μεταβλητές και δύο παράγοντες που τις αντικαθιστούν. Όσο μεγαλύτερες οι συσχετίσεις των παραγόντων με τις μεταβλητές τόσο μεγαλύτερο το μήκος τους και η μεταβλητότητα των δεδομένων που εκφράζουν. Το μήκος μετράται με την ιδιοτιμή (eigenvalue) κάθε παράγοντα. Οι συσχετίσεις των παραγόντων με τις μεταβλητές εκφράζονται γεωμετρικά με την ορθογώνια προβολή κάθε μεταβλητής στον παράγοντα και αποτελούν τις παραγοντικές φορτίσεις (loadings). Οι παραγοντικές φορτίσεις είναι εξαιρετικά σημαντικές επειδή αποτελούν τα βάρη των τιμών των μεταβλητών στις γραμμικές εξισώσεις των παραγόντων. Επίσης η μελέτη τους είναι απαραίτητη για την ερμηνεία των παραγόντων. Διάγραμμα 6.1 Διάγραμμα διασποράς και παράγοντες Μία βασική παραδοχή η οποία οδηγεί σε δύο παραλλαγές της μεθόδου αφορά τη συνολική διασπορά. Αν δηλαδή θεωρούμε ότι η συνολική διασπορά περιλαμβάνεται εξ ολοκλήρου στο μοντέλο, η μέθοδος ονομάζεται ανάλυση των κυρίων συνιστωσών (principal component analysis ή PCA). Αν θεωρούμε ότι κάποιο τμήμα της διασποράς δεν ερμηνεύεται από τους παράγοντες που θα εξαχθούν, η μέθοδος ονομάζεται ανάλυση κοινών παραγόντων (common factor analysis). Η διαδικασία της παραγοντικής ανάλυσης ξεκινάει με τον υπολογισμό των συντελεστών συσχέτισης για όλα τα ζεύγη των μεταβλητών. Τα δεδομένα αποτελούν έναν πίνακα διαστάσεων n x p όπου n ο αριθμός των παρατηρήσεων και p ο αριθμός των μεταβλητών. Στη συνέχεια υπολογίζεται ο πίνακας των συντελεστών συσχέτισης διαστάσεων p x p. Η παραδοχή για το μοντέλο της παραγοντικής ανάλυσης, δηλαδή αν πρόκειται για ανάλυση των κυρίων συνιστωσών ή ανάλυση κοινών παραγόντων επηρεάζει του πίνακα των συντελεστών συσχέτισης. Όπως γνωρίζουμε η διαγώνιος στον πίνακα των συντελεστών συσχέτισης αποτελείται από μονάδες. Αν υποθέσουμε ότι η συνολική διασπορά δεν περιλαμβάνεται εξ ολοκλήρου στο μοντέλο, η διαγώνιος του πίνακα των συσχετίσεων δεν θα αποτελείται από μονάδες, αλλά από μικρότερα μεγέθη τα οποία εκφράζουν τη σχέση της μεταβλητής με όλους τους παράγοντες. Τα μεγέθη αυτά εκφράζουν το ποσοστό της διακύμανσης που εξηγείται από τους κοινούς παράγοντες και μπορούν να αποδοθούν από τον όρο κοινή διασπορά (communalities). 182

5 Διάγραμμα 6.2 Παραγοντική ανάλυση: οι μεταβλητές Διάγραμμα 6.3 Παραγοντική ανάλυση: οι δύο αρχικοί παράγοντες και οι παραγοντικές φορτίσεις Ο πίνακας των συντελεστών συσχέτισης αναλύεται στη συνέχεια σε παράγοντες οι οποίοι αρχικά έχουν τον ίδιο αριθμό με τις μεταβλητές. Ο πρώτος παράγοντας ερμηνεύει το μεγαλύτερο μέρος της συνολικής διασποράς και οι υπόλοιποι κατά σειρά, όπως εξάγονται από το μοντέλο, αντιστοιχούν σε συνεχώς μειωμένο τμήμα της διασποράς αυτής. Η σπουδαιότητα των παραγόντων εκφράζεται με την ιδιοτιμή τους. Ο μέγιστος αριθμός παραγόντων είναι ίσος με των αριθμό των μεταβλητών, αλλά οι παράγοντες που διατηρούνται στη ανάλυση είναι λιγότεροι. Ο αριθμός των παραγόντων είτε εξαρτάται από τις υποθέσεις της έρευνας, οπότε προσδιορίζεται από τον ερευνητή, είτε προκύπτει με κάποιο εμπειρικό κριτήριο. Τα εμπειρικά κριτήρια είναι δύο: Το πρώτο είναι να έχει ο παράγοντας ιδιοτιμή μεγαλύτερη της μονάδας, επειδή θεωρείται ότι μία μεμονωμένη μεταβλητή έχει ερμηνευτική ικανότητα ίση με τη διακύμανσή της που ισούται με τη μονάδα, όταν η μεταβλητή είναι τυποποιημένη (standardized). Κατά συνέπεια, ένας παράγοντας για να εξυπηρετήσει τους 183

6 σκοπούς της παραγοντικής ανάλυσης πρέπει να έχει μεγαλύτερη ερμηνευτική ικανότητα από μία μεμονωμένη μεταβλητή, δηλαδή ιδιοτιμή μεγαλύτερη της μονάδας. Ένα δεύτερο εμπειρικό κριτήριο είναι η γραφική παρουσίαση των ιδιοτιμών κατά φθίνουσα σειρά στον άξονα Υ, έναντι των παραγόντων στον άξονα Χ (βλ. Διάγραμμα 6.5 παρακάτω). Ο αριθμός των παραγόντων προκύπτει από το σημείο το οποίο αντιστοιχεί σε απότομη πτώση της ερμηνευτικής ικανότητας. Η σχέση κάθε μεταβλητής με κάθε έναν από τους παράγοντες δίνεται από την παραγοντική φόρτιση που όσο πλησιάζει τη μονάδα δείχνει ισχυρή σχέση και όσο πλησιάζει το μηδέν δείχνει ασθενή σχέση. Επίσης το πρόσημο της παραγοντικής φόρτισης δείχνει την κατεύθυνση της σχέσης. Κάθε παράγοντας θεωρείται ότι αντιπροσωπεύει τις μεταβλητές που έχουν ισχυρή σχέση μαζί του. Συνήθως οι σημαντικότεροι παράγοντες υφίστανται μια πρόσθετη μαθηματική επεξεργασία, την περιστροφή (rotation), που αποσκοπεί στον καλύτερο διαχωρισμό των μεταβλητών από τους παράγοντες και κατά συνέπεια την ευχερέστερη ερμηνεία των αποτελεσμάτων (Διάγραμμα 6.4). Υπάρχουν διάφοροι μαθηματικοί τρόποι για την περιστροφή, αλλά συχνότερα χρησιμοποιείται η λύση varimax, η οποία μεγιστοποιεί τη διακύμανση των τετραγώνων των παραγοντικών φορτίσεων για κάθε παράγοντα (Johnson & Wichern, 2007 Kim & Mueller, 1978 Shaw & Wheeler, 2000). Με τη μέθοδο αυτή, οι παραγοντικές φορτίσεις πλησιάζουν ή το 0 ή το ±1, οπότε επιτυγχάνεται η λεγόμενη απλή δομή (simple structure). Με τον τρόπο αυτό, όσες μεταβλητές έχουν υψηλές συσχετίσεις με έναν παράγοντα θα έχουν χαμηλές συσχετίσεις με τους υπόλοιπους και θα είναι σαφής η αντιστοιχία μεταβλητών και παραγόντων. Μια τέτοια αντιστοιχία είναι χρήσιμη για την ερμηνεία των αποτελεσμάτων. Τόσο για τους αρχικούς όσο και για τους περιστραμμένους παράγοντες υπολογίζεται ο πίνακας των παραγοντικών φορτίσεων (factor loadings) που εκφράζουν τη σχέση μεταβλητών και παραγόντων και αντιστοιχούν πρακτικά σε συντελεστές συσχέτισης. Τέλος, για κάθε παρατήρηση (γεωγραφική ενότητα) υπολογίζονται οι παραγοντικές τιμές (factor scores) οι οποίες είναι οι νέες τιμές των παρατηρήσεων για καθένα από τους παράγοντες που έχουν εξαχθεί, υπολογίζεται δηλαδή ένας πίνακας n x f, όπου f είναι ο αριθμός των παραγόντων. Οι παραγοντικές τιμές αποτελούν γραμμικό συνδυασμό των αρχικών μεταβλητών και μπορούν να χρησιμοποιηθούν για την ταξινόμηση των παρατηρήσεων, παρόλο που δεν είναι αυτός ο αρχικός σκοπός της μεθόδου. Μετά την ολοκλήρωση των μαθηματικών επεξεργασιών της παραγοντικής ανάλυσης ακολουθεί η ερμηνεία των αποτελεσμάτων. Κάθε παράγοντας παίρνει ένα όνομα και ένα ουσιαστικό περιεχόμενο ανάλογα με το περιεχόμενο των μεταβλητών που έχουν υψηλές παραγοντικές φορτίσεις με αυτόν. Διάγραμμα 6.4 Παραγοντική ανάλυση: Περιστροφή παραγόντων 184

7 ΠΑΡΑΔΕΙΓΜΑ 6.1 Παραγοντική Ανάλυση Στο παράδειγμα αυτό χρησιμοποιούμε δεδομένα για τους 51 νομούς της Ελλάδας τα οποία έχουν προέλθει από απογραφές και έρευνες της ΕΛΣΤΑΤ της περιόδου Τα δεδομένα περιλαμβάνουν έξι μεταβλητές και οι διαστάσεις του αρχικού πίνακα των δεδομένων είναι 51x6 (Πίνακας 6.6): 1. Απασχόληση στα ξενοδοχεία εστιατόρια 2. Αριθμός διανυκτερεύσεων 3. Αριθμός ξενοδοχειακών κλινών 4. Απασχόληση στον πρωτογενή τομέα (%) 5. Προστιθέμενη αξία του πρωτογενή τομέα (%) 6. Αρδευόμενη γεωργική γη (%) Παρακάτω παρουσιάζονται τα αποτελέσματα της παραγοντικής ανάλυσης από το SPSS. Καταρχήν οι μεταβλητές έχουν μετατραπεί σε τυπικές τιμές, ώστε να αφαιρεθούν οι μονάδες μέτρησης. Στη συνέχεια έχουν γίνει επιλογές που αφορούν: το μοντέλο (κυρίων συνιστωσών-principal components), τον αριθμό των παραγόντων (έχουν επιλεγεί δύο παράγοντες), τη μέθοδο περιστροφής (varimax), την εμφάνιση του πίνακα των συντελεστών συσχέτισης. Ο πρώτος πίνακας (Πίνακας 6.1) των αποτελεσμάτων περιλαμβάνει τους συντελεστές συσχέτισης. Παρατηρούμε ότι η απασχόληση στον πρωτογενή τομέα έχει υψηλή θετική συσχέτιση με την προστιθέμενη αξία του πρωτογενή τομέα (r=0,749) και μέτρια συσχέτιση με το ποσοστό της αρδευόμενης γης (r=0,512). Οι δύο τελευταίες μεταβλητές έχουν αρκετά καλή συσχέτιση μεταξύ τους (r=0,577). Η απασχόληση στον τουρισμό έχει μάλλον ισχυρές συσχετίσεις με τις διανυκτερεύσεις και τις ξενοδοχειακές κλίνες (r=0,640 και r=0,669), ενώ οι δύο τελευταίες μεταβλητές έχουν πολύ ισχυρή συσχέτιση μεταξύ τους (r=0,991). Εξάλλου, παρατηρούνται αρνητικές συσχετίσεις μεταξύ των μεταβλητών που αφορούν τον τουρισμό και των μεταβλητών που αφορούν τον πρωτογενή τομέα. Γίνεται μάλλον σαφές εξαρχής ότι υπάρχουν δύο ομάδες μεταβλητών, αυτές που αφορούν τον τουρισμό και αυτές που περιγράφουν τον πρωτογενή τομέα. Σε παραδείγματα με μεγάλο αριθμό μεταβλητών όμως η δομή αυτή των δεδομένων δεν είναι εξαρχής προφανής. CorrelationMatrix Correlation ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ ΑΠΑΣΧΟΛΗΣΗ ΤΟΥΡΙΣΜΟΣ ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ ΑΠΑΣΧΟΛΗΣΗ ΤΟΥΡΙΣΜΟΣ ΔΙΑΝΥΚΤΕΡΕΥΣΕΙΣ ΞΕΝΟΔΟΧΕΙΑΚΕΣ ΚΛΙΝΕΣ ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΠΡΩΤΟΓΕΝΗΣ ΑΡΔΕΥΟΜΕΝΗ ΓΗ 1,000 -,402 -,442 -,456,749,512 -,402 1,000,640,669 -,419 -,509 ΔΙΑΝΥΚΤΕΡΕΥΣΕΙΣ -,442,640 1,000,991 -,384 -,266 ΞΕΝΟΔΟΧΕΙΑΚΕΣ ΚΛΙΝΕΣ ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΠΡΩΤΟΓΕΝΗΣ -,456,669,991 1,000 -,391 -,286,749 -,419 -,384 -,391 1,000,577 ΑΡΔΕΥΟΜΕΝΗ ΓΗ,512 -,509 -,266 -,286,577 1,000 Πίνακας 6.1 Παραγοντική ανάλυση SPSS: Συντελεστές συσχέτισης Ο δεύτερος πίνακας των αποτελεσμάτων (Πίνακας 6.2) περιλαμβάνει τα μεγέθη της κοινής διασποράς (communalities) που υπολογίζονται με διαδοχικές προσεγγίσεις με αφετηρία τη μονάδα. Η μεταβλητή με την υψηλότερη κοινή διασπορά είναι οι ξενοδοχειακές κλίνες (0,968) και ακολουθούν οι διανυκτερεύσεις (0,955) και η προστιθέμενη αξία στον πρωτογενή τομέα (0,806). Τα μεγέθη της κοινής διασποράς εκφράζουν τη συσχέτιση των μεταβλητών με τους παράγοντες που εξάγονται, και εφόσον είναι μικρότερα της μονάδας, κάποιο τμήμα της διασποράς είναι εκτός του μοντέλου μετά την τελική εξαγωγή των παραγόντων. 185

8 Communalities Initial Extraction ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ 1,000,742 ΑΠΑΣΧΟΛΗΣΗ ΤΟΥΡΙΣΜΟΣ 1,000,663 ΔΙΑΝΥΚΤΕΡΕΥΣΕΙΣ 1,000,955 ΞΕΝΟΔΟΧΕΙΑΚΕΣ ΚΛΙΝΕΣ 1,000,968 ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΠΡΩΤΟΓΕΝΗΣ 1,000,806 ΑΡΔΕΥΟΜΕΝΗ ΓΗ 1,000,677 Extraction Method: Principal Component Analysis. Πίνακας 6.2 Παραγοντική ανάλυση SPSS: Communalities Στον Πίνακα 6.3 παρουσιάζεται η αρχική εξαγωγή παραγόντων, αλλά και οι περιστραμμένοι παράγοντες (με πράσινη επισήμανση), οι οποίοι θα εξηγηθούν στη συνέχεια. Εξάγονται αρχικά τόσοι παράγοντες (στα αποτελέσματα αναφέρονται ως components) όσοι και οι μεταβλητές. Επίσης παρουσιάζονται οι ιδιοτιμές (eigenvalues) και το ποσοστό της διασποράς που ερμηνεύει ο κάθε παράγοντας. Αν προσθέσουμε τις ιδιοτιμές (τη στήλη Total) το άθροισμα είναι έξι. Το αποτέλεσμα αυτό προκύπτει επειδή κάθε μία από τις έξι μεταβλητές έχει διακύμανση ίση με τη μονάδα, αφού έχει γίνει μετατροπή σε τυπικές τιμές. Παρόμοια, αν αθροίσουμε τα ποσοστά της διασποράς που αντιστοιχούν σε κάθε παράγοντα (στήλη % of Variance) το αποτέλεσμα είναι 100%. Το αρχικό μοντέλο επομένως θεωρείται ότι εξηγεί τη συνολική μεταβλητότητα των δεδομένων κατά 100%. Total Variance Explained Component Total Initial Eigenvalues % of Variance Cumulative % Total Extraction Sums of Squared Loadings % of Variance Rotation Sums of Squared Loadings Cumulative % Total % of Variance Cumulative % 1 3,581 59,683 59,683 3,581 59,683 59,683 2,519 41,977 41, ,232 20,529 80,212 1,232 20,529 80,212 2,294 38,236 80,212 3,637 10,618 90,830 4,301 5,017 95,848 5,241 4,013 99,861 6,008, ,000 Extraction Method: Principal Component Analysis. Πίνακας 6.3 Παραγοντική ανάλυση SPSS: Εξαγωγή παραγόντων και ιδιοτιμές Παρατηρούμε ότι ο πρώτος παράγοντας (βλ. κίτρινη επισήμανση στον Πίνακα 6.3) έχει τη μεγαλύτερη ιδιοτιμή (3,581) και το μεγαλύτερο ποσοστό της συνολικής διασποράς των δεδομένων που ερμηνεύει (59,683%). Στην πρώτη εξαγωγή των παραγόντων, πριν την περιστροφή, ο πρώτος παράγοντας συγκεντρώνει το μεγαλύτερο τμήμα της διασποράς. Ο δεύτερος παράγοντας έχει ιδιοτιμή μεγαλύτερη της μονάδας και οι υπόλοιποι παράγοντες ιδιοτιμή μικρότερη της μονάδας. Στο Διάγραμμα 6.5 παρουσιάζεται η γραφική παρουσίαση των ιδιοτιμών (scree plot). Το διάγραμμα αυτό μπορεί να χρησιμεύσει για να εντοπιστεί ένα σημείο πέρα από το οποίο δεν υπάρχει σημαντική συνεισφορά των παραγόντων στην ερμηνεία της διασποράς. 186

9 Διάγραμμα 6.5 Παραγοντική ανάλυση: Scree plot Μετά από μελέτη των τιμών των παραγόντων κρατήσαμε τους δύο πρώτους παράγοντες. Μια γενική παρατήρηση είναι ότι η παραγοντική ανάλυση, όπως και οι υπόλοιπες πολυμεταβλητές μέθοδοι, χρειάζεται δοκιμές μέχρι να καταλήξουμε στην τελική λύση. Στο συγκεκριμένο παράδειγμα, αν επιλέξουμε το κριτήριο η ιδιοτιμή να είναι μεγαλύτερη της μονάδας είναι προφανές από τον Πίνακα 6.3 ότι προκύπτουν δύο παράγοντες. Αλλά μπορεί για κάποιο λόγο να θέλαμε να διατηρήσουμε τρεις παράγοντες. Σε άλλη περίπτωση, όταν οι μεταβλητές είναι περισσότερες, μπορεί να προκύπτουν αρκετοί παράγοντες με ιδιοτιμή μεγαλύτερη της μονάδας. Τότε μπορεί να γίνει μία επιλογή λιγότερων παραγόντων ανάλογα με το πρόβλημα που εξετάζουμε. Στον Πίνακα 6.4 παρουσιάζεται η πρώτη εξαγωγή των δύο παραγόντων και οι παραγοντικές φορτίσεις (loadings), που είναι οι συντελεστές συσχέτισης των μεταβλητών με τους παράγοντες. Παρατηρούμε ότι ο πρώτος παράγοντας συγκεντρώνει τις υψηλότερες θετικές ή αρνητικές συσχετίσεις, ενώ ο δεύτερος παράγοντας έχει μέτριες έως χαμηλές συσχετίσεις με όλες τις μεταβλητές. Με το μοντέλο αυτό δεν μπορούμε να αντιστοιχήσουμε τις μεταβλητές στους παράγοντες, που είναι ο σκοπός της μεθόδου, δηλαδή να αντικαταστήσουμε τις αρχικές μεταβλητές με κάποιες νέες. Για τον λόγο αυτό γίνεται η περιστροφή των παραγόντων. Component Matrix a Component 1 2 ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ -,760,406 ΑΠΑΣΧΟΛΗΣΗ ΤΟΥΡΙΣΜΟΣ,792,190 ΔΙΑΝΥΚΤΕΡΕΥΣΕΙΣ,828,520 ΞΕΝΟΔΟΧΕΙΑΚΕΣ ΚΛΙΝΕΣ,842,508 ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΠΡΩΤΟΓΕΝΗΣ -,746,500 ΑΡΔΕΥΟΜΕΝΗ ΓΗ -,652,502 Extraction Method: Principal Component Analysis. a. 2 components extracted. Πίνακας 6.4 Παραγοντική ανάλυση SPSS: Αρχικοί παράγοντες και παραγοντικές φορτίσεις 187

10 Στον Πίνακα 6.5 παρουσιάζονται τα αποτελέσματα της περιστροφής και οι τελικοί παράγοντες. Παρατηρούμε ότι έχει δημιουργηθεί η λεγόμενη απλή δομή, δηλαδή τρεις μεταβλητές έχουν υψηλές συσχετίσεις με τον πρώτο παράγοντα και οι υπόλοιπες τρεις με τον δεύτερο. Στον Πίνακα 6.3 στην προτελευταία στήλη (με πράσινη επισήμανση) μπορούμε να δούμε τους δύο παράγοντες μετά την περιστροφή. Αν αθροίσουμε τις ιδιοτιμές η συνολική τιμή είναι 4,81 που διαφέρει από το 6 της αρχικής λύσης και η διασπορά που ερμηνεύεται από τους δύο παράγοντες είναι πλέον 80,21%. Επομένως ένα τμήμα της διασποράς έχει μείνει εκτός μοντέλου. Αν τώρα για κάθε μεταβλητή αθροίσουμε τα τετράγωνα των παραγοντικών φορτίσεων για τους δύο παράγοντες προκύπτει η κοινή διασπορά (communalities). Για τη μεταβλητή ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ ισχύει (βλ. και Πίνακα 6.2) : -0, ,811 2 =0,742 Αν για κάθε παράγοντα αθροίσουμε τα τετράγωνα των παραγοντικών φορτίσεων, προκύπτει η ιδιοτιμή του παράγοντα. Μετά την εξαγωγή των παραγόντων είναι απαραίτητο να δώσουμε ονομασίες στους παράγοντες ανάλογα με τις μεταβλητές με τις οποίες έχουν ισχυρές συσχετίσεις. Οι τρεις μεταβλητές που έχουν υψηλές και θετικές παραγοντικές φορτίσεις με τον πρώτο παράγοντα είναι η απασχόληση στον τουρισμό, οι διανυκτερεύσεις και οι ξενοδοχειακές κλίνες. Επομένως ο πρώτος παράγοντας εκφράζει την τουριστική δραστηριότητα των νομών και μπορεί να ονομαστεί «τουρισμός». Αντίστοιχα οι τρεις μεταβλητές που έχουν υψηλές και θετικές παραγοντικές φορτίσεις με τον δεύτερο παράγοντα είναι η απασχόληση στον πρωτογενή τομέα, το ποσοστό της προστιθέμενης αξίας από τον πρωτογενή τομέα και το ποσοστό της αρδευόμενης γεωργικής γης. Επομένως ο δεύτερος παράγοντας εκφράζει τη δραστηριότητα των νομών στον πρωτογενή τομέα και μπορεί να ονομαστεί «γεωργία». Στη συνέχεια, για όλες τις παρατηρήσεις μπορούν να υπολογιστούν οι τιμές για κάθε παράγοντα και εφόσον στο παράδειγμα αυτό οι παρατηρήσεις είναι οι νομοί να κατασκευαστούν χάρτες με τις παραγοντικές τιμές. Rotated Component Matrix a Component 1 2 ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ -,290,811 ΑΠΑΣΧΟΛΗΣΗ ΤΟΥΡΙΣΜΟΣ,714 -,392 ΔΙΑΝΥΚΤΕΡΕΥΣΕΙΣ,962 -,172 ΞΕΝΟΔΟΧΕΙΑΚΕΣ ΚΛΙΝΕΣ,965 -,190 ΠΡΟΣΤΙΘΕΜΕΝΗ ΑΞΙΑ ΠΡΩΤΟΓΕΝΗΣ -,215,872 ΑΡΔΕΥΟΜΕΝΗ ΓΗ -,145,810 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. Πίνακας 6.5 Παραγοντική ανάλυση SPSS: Varimax Rotation (περιστραμμένοι παράγοντες και παραγοντικές φορτίσεις) Στον Πίνακα 6.6 παρουσιάζεται τμήμα των δεδομένων για τους νομούς όπως εμφανίζονται στο SPSS μετά τον υπολογισμό των παραγοντικών τιμών. Οι στήλες έχουν τις ονομασίες των μεταβλητών χωρίς ετικέτες, ενώ η ένδειξη Z σημαίνει ότι είναι τυπικές τιμές. Για παράδειγμα η μεταβλητή Zper_primary εμφανίζεται στα αποτελέσματα ως ΑΠΑΣΧΟΛΗΣΗ ΠΡΩΤΟΓΕΝΗΣ. Οι παραγοντικές τιμές είναι οι στήλες FAC1 και FAC2. Παρατηρούμε για παράδειγμα στο συγκεκριμένο τμήμα των αποτελεσμάτων ότι υψηλές θετικές τιμές για τον παράγοντα 1 «τουρισμός» έχουν οι νομοί Κερκύρας και Αττικής, ενώ υψηλές θετικές τιμές για τον παράγοντα 2 «γεωργία» έχουν οι νομοί Καρδίτσας, Ηλείας και Λακωνίας. Θα μπορούσαμε να κατασκευάσουμε έναν χάρτη 188

11 για τον τουρισμό και έναν χάρτη για τη γεωργία, όπου οι νομοί θα παρουσιάζονταν με διαβαθμίσεις ανάλογα με την ένταση της κάθε δραστηριότητας σε αυτούς. Η παραγοντική ανάλυση έχει εφαρμοστεί σε πολλών ειδών γεωγραφικά προβλήματα, οι κλασικές όμως εφαρμογές της είναι στην περιοχή της αστικής γεωγραφίας και συγκεκριμένα στην ανάλυση της κοινωνικής δομής των πόλεων (factorial ecology). Για παράδειγμα, η δομή των αμερικανικών πόλεων αποδόθηκε με τρεις ομάδες μεταβλητών που αντιστοιχούσαν στην κοινωνική και οικονομική κατάσταση (π.χ. επάγγελμα, μόρφωση κ.ά.), στην οικογενειακή κατάσταση (π.χ. αριθμός γυναικών στο εργατικό δυναμικό, ποσοστό μονομελών νοικοκυριών κ.ά.) και στην εθνική καταγωγή (Johnston, 1980 Taylor, 1977). Η εφαρμογή της παραγοντικής ανάλυσης στη γεωγραφική έρευνα έχει αποτελέσει αντικείμενο κριτικής από πολλές απόψεις (Shaw & Wheeler, 2000 Taylor, 1977). Προβλήματα αντιμετωπίζονται στις μαθηματικές επεξεργασίες που περιλαμβάνει η μέθοδος και στην ερμηνεία των αποτελεσμάτων. Βασικό χαρακτηριστικό της μεθόδου και ταυτόχρονα αντικείμενο κριτικής είναι η ευελιξία της, η οποία παρέχει πολλές διαφορετικές εναλλακτικές λύσεις για το ίδιο πρόβλημα, με αποτέλεσμα σχεδόν κάθε πρόβλημα να βρίσκει τη λύση του. Η ευελιξία της μεθόδου αποτελεί πλεονέκτημα και μειονέκτημα ταυτόχρονα και επιβάλει προσοχή στην επιλογή των αρχικών μεταβλητών και την ερμηνεία των αποτελεσμάτων. Εξάλλου, οι μαθηματικές παραδοχές του μοντέλου και, κυρίως, η υπόθεση της γραμμικής αλληλεξάρτησης των μεταβλητών δεν ανταποκρίνονται πάντα στην πραγματική μορφή της σχέσης μεταξύ των μεταβλητών και επηρεάζουν τα αποτελέσματα (Gould & Ηλιοπούλου, 1984). Παρά τις δυσκολίες, η παραγοντική ανάλυση, όπως και οι άλλες πολυμεταβλητές μέθοδοι, δεν χάνει τη χρησιμότητά της στην περίπτωση ερευνητικών προβλημάτων που εμπλέκουν μεγάλους αριθμούς μεταβλητών. Είναι όμως απαραίτητη η καλή γνώση των μεθόδων για την αξιόπιστη εφαρμογή τους. Τα τελευταία χρόνια έχουν γίνει μαθηματικές προσαρμογές στο μοντέλο της παραγοντικής ανάλυσης για χωρικά δεδομένα που έχουν οδηγήσει στη γεωγραφικά σταθμισμένη παραγοντική ανάλυση. Σκοπός της μεθόδου είναι να λάβει υπόψη τη χωρική αυτοσυσχέτιση με ανάλογο τρόπο όπως και στη γεωγραφικά σταθμισμένη παλινδρόμηση που εξετάσαμε στο προηγούμενο κεφάλαιο (Fotheringham, Brunsdon, & Charlton, 2002 Harris, Brunsdon, & Charlton, 2011). Πίνακας 6.6 Αρχικά δεδομένα και παραγοντικές τιμές 189

12 6.3 Ανάλυση Συστάδων Η ανάλυση συστάδων ή ανάλυση κατά συστάδες (cluster analysis) είναι μία οικογένεια μεθόδων ταξινόμησης η οποία έχει εφαρμογή σε πολλές επιστήμες. Οι πρώτες εφαρμογές προέρχονται από τις επιστήμες της Βιολογίας και της Ζωολογίας, όπου η μέθοδος ονομάζεται συνήθως αριθμητική ταξινομία (numerical taxonomy). Άλλες σημαντικές εφαρμογές είναι στην έρευνα αγοράς, την Αστρονομία, την Κλιματολογία, την Ψυχιατρική, την Αρχαιολογία, τη Βιοπληροφορική και στην τεχνητή νοημοσύνη για την αναγνώριση προτύπων (pattern recognition) (Everitt, Landau, Leese, & Stahl, 2011). Ένα σύνολο παρατηρήσεων (ή αντικειμένων) για τις οποίες υπάρχει ένας αριθμός μεταβλητών ταξινομείται έτσι ώστε οι παρατηρήσεις με παρόμοια χαρακτηριστικά να ανήκουν στην ίδια ομάδα. Ενώ δηλαδή η παραγοντική ανάλυση επιδιώκει να ομαδοποιήσει παρόμοιες μεταβλητές, η ανάλυση συστάδων προσπαθεί να ομαδοποιήσει παρόμοιες παρατηρήσεις. Εφόσον οι παρατηρήσεις στα δεδομένα είναι οι γραμμές και οι μεταβλητές οι στήλες, η παραγοντική ανάλυση ομαδοποιεί παρόμοιες στήλες, ενώ η ανάλυση συστάδων παρόμοιες γραμμές. Η ανάλυση συστάδων έχει ιδιαίτερο ενδιαφέρον για τους γεωγράφους, επειδή εφαρμόζεται σε προβλήματα οριοθέτησης περιφερειών (Johnston, 1980). Οι παρατηρήσεις είναι γεωγραφικές ενότητες για τις οποίες υπάρχει ένας αριθμός χαρακτηριστικών και η ταξινόμηση καταλήγει στον ορισμό ομοιογενών περιφερειών, έτσι ώστε οι παρατηρήσεις με παρόμοια χαρακτηριστικά να ανήκουν στην ίδια περιφέρεια. Επίσης χρησιμοποιείται γενικότερα στην ταξινόμηση χωρικών δεδομένων, όπως τα δεδομένα τηλεπισκόπησης (βλ. για παράδειγμα Miliaresis & Iliopoulou, 2004). Τα δεδομένα στην ανάλυση συστάδων μπορεί να είναι ποιοτικά και ποσοτικά, αλλά για τα ποιοτικά δεδομένα χρειάζονται εξειδικευμένες τεχνικές (Norušis, 2011). Η ανάλυση συστάδων είναι η διαδικασία κατά την οποία ένα σύνολο δεδομένων ομαδοποιείται με βάση κάποιο μέτρο ομοιότητας. Η ομαδοποίηση αυτή εξαρτάται από το είδος των δεδομένων και την εφαρμογή. Δεδομένα διαφορετικών εφαρμογών μπορεί να χρειάζεται να ομαδοποιηθούν διαφορετικά. Αυτό έχει ως αποτέλεσμα η ανάλυση κατά συστάδες να γίνεται αρκετά περίπλοκη, επειδή θα πρέπει να αποφασιστεί ο καταλληλότερος αλγόριθμος για την κάθε εφαρμογή. Για την επιλογή του αλγορίθμου είναι απαραίτητη η γνώση των δεδομένων. Η γνώση αυτή χρησιμοποιείται σε διάφορες φάσεις τις διαδικασίας. Το πρώτο και σημαντικότερο βήμα κατά τη διαδικασία της ανάλυσης συστάδων είναι η περιγραφή των δεδομένων και η επιλογή των κατάλληλων χαρακτηριστικών. Στη συνέχεια, πρέπει να οριστεί το μέτρο ομοιότητας με το οποίο θα γίνονται οι συγκρίσεις μεταξύ των παρατηρήσεων. Τέλος, πρέπει να επιλεγεί η μέθοδος ομαδοποίησης που ακολουθείται για την τελική παραγωγή των ομάδων. Οι ιεραρχικοί και k-means αλγόριθμοι είναι οι συνηθέστερες επιλογές. Ανάλογα με την επιλογή του μέτρου ομοιότητας και της μεθόδου ομαδοποίησης, οι ομάδες που προκύπτουν είναι διαφορετικές. Ο ερευνητής πρέπει να κάνει τις επιλογές αυτές ανάλογα με τη φύση των δεδομένων και το πρόβλημα που εξετάζει. Συχνά απαιτούνται πολλές δοκιμές της ανάλυσης συστάδων, περιλαμβάνοντας διαφορετικές μεταβλητές ή αφαιρώντας κάποιες παρατηρήσεις και χρησιμοποιώντας διαφορετικά μέτρα σύγκρισης, ώστε να εξακριβωθεί η σταθερότητα της ομαδοποίησης. Το τελικό αποτέλεσμα πρέπει να μπορεί να ερμηνευτεί. Όπως στην παραγοντική ανάλυση δίνονται ονομασίες στους παράγοντες, έτσι και στην ανάλυση συστάδων δίνονται ονομασίες στις ομάδες που προκύπτουν. Για τον σκοπό αυτό μελετώνται οι τιμές των μεταβλητών σε κάθε ομάδα και με βάση την εμπειρία του ερευνητή εξετάζεται αν οι ομάδες υπάρχουν στην πραγματικότητα ή αποτελούν απλά το αποτέλεσμα ενός αλγορίθμου. Συνοψίζοντας, η ανάλυση κατά συστάδες ακολουθεί μια συγκεκριμένη σειρά από βήματα για την κατασκευή των ομάδων (Everitt et al., 2011): 1. επιλογή των αντικειμένων που θα ομαδοποιηθούν με αντιπροσωπευτικό τρόπο, 2. επιλογή των μεταβλητών ανάλογα με τον σκοπό της ομαδοποίησης, 3. αντιμετώπιση του προβλήματος των ελλειπουσών τιμών, 4. τυποποίηση των μεταβλητών, 5. επιλογή του μέτρου της εγγύτητας, 6. επιλογή της μεθόδου ομαδοποίησης, 7. προσδιορισμός του αριθμού των ομάδων, 8. έλεγχος της σταθερότητας των ομάδων, 9. ερμηνεία των ομάδων. Τα βήματα της ανάλυσης συστάδων θα γίνουν σαφέστερα με τη συζήτηση που ακολουθεί. 190

13 6.3.1 Η μέτρηση της απόστασης Η απόσταση στην ανάλυση συστάδων αποτελεί το μέτρο εγγύτητας που ποσοτικοποιεί την ομοιότητα ή την ανομοιότητα μεταξύ δύο, κάθε φορά, παρατηρήσεων στα δεδομένα. Κάθε παρατήρηση στον πολυδιάστατο χώρο των μεταβλητών έχει ένα σύνολο συντεταγμένων οι οποίες αποτελούνται από τις τιμές για όλες τις μεταβλητές. Με βάση τις συντεταγμένες αυτές υπολογίζονται αποστάσεις μεταξύ των παρατηρήσεων ή των ομάδων παρατηρήσεων. Ο απλούστερος τρόπος μέτρησης της απόστασης είναι η επέκταση του πυθαγορείου θεωρήματος σε πολλές διαστάσεις, ώστε για δύο παρατηρήσεις x και y η απόστασή τους d(x,y) είναι: d(x, y) = (x 1 y 1 ) 2 + (x 2 y 2 ) (x p y p ) 2 = (x i y i ) 2 όπου p είναι ο αριθμός των μεταβλητών (p-διάστατος χώρος) και x i, y i οι τιμές των παρατηρήσεων. Στον δισδιάστατο χώρο των μεταβλητών ΑΞΙΑ ΚΑΤΟΙΚΙΑΣ και ΕΜΒΑΔΟΝ η απόσταση μεταξύ δύο παρατηρήσεων φαίνεται στο Διάγραμμα 6.6. p i=1 Διάγραμμα 6.6 Ευκλείδεια απόσταση στον δισδιάστατο χώρο των μεταβλητών Υπάρχουν όμως και άλλοι τρόποι μέτρησης της απόστασης όπως οι αποστάσεις Minkowski, Manhattan κλπ. (Johnson & Wichern, 2007). H απόσταση Minkowski μπορεί να θεωρηθεί ως μια γενίκευση της Ευκλείδειας απόστασης και δίνεται από τον τύπο: d(x, y) = [ x i y i m ] p i=1 Για m=2 η απόσταση d(x,y) είναι η ευκλείδεια απόσταση. Για m=1, προκύπτει η απόσταση Manhattan, η οποία, ως απόλυτη απόσταση, θεωρείται ότι μετράται κατά μήκος των οικοδομικών τετραγώνων μιας πόλης: d( x, y) p i 1 x i y i 1 m 191

14 Γενικά καθώς το m μεταβάλλεται δίνει μεγαλύτερη βαρύτητα σε μεγαλύτερες ή μικρότερες διαφοροποιήσεις των παρατηρήσεων. Όποιο μέτρο απόστασης και αν χρησιμοποιηθεί, οι μικρές αποστάσεις αντιστοιχούν σε παρόμοιες παρατηρήσεις και οι μεγαλύτερες αποστάσεις σε παρατηρήσεις με μεγάλες διαφορές στις τιμές των μεταβλητών. Η ανάλυση συστάδων, με κατάλληλο λογισμικό, υπολογίζει όλες τις αποστάσεις μεταξύ των παρατηρήσεων και εφόσον n είναι ο αριθμός των παρατηρήσεων δημιουργείται, για τις περισσότερες μεθόδους, ένας πίνακας αποστάσεων n x n. Επειδή η ομοιότητα μεταξύ των παρατηρήσεων μπορεί να μετρηθεί με πολλούς τρόπους, χρησιμοποιείται ο γενικός όρος πίνακας εγγύτητας (proximity matrix). Επειδή ο υπολογισμός των ευκλείδειων αποστάσεων προϋποθέτει ανεξάρτητες μεταβλητές, συχνά οι μεταβλητές για την ανάλυση συστάδων μετατρέπονται με παραγοντική ανάλυση σε έναν περιορισμένο αριθμό παραγόντων Μέθοδοι ομαδοποίησης Οι μέθοδοι δημιουργίας συστάδων ή συσταδοποίησης ή ομαδοποίησης (clustering) εμπίπτουν σε δύο κατηγορίες, την ιεραρχική και τη μη ιεραρχική μέθοδο. Η ιεραρχική (hierarchical) μέθοδος ξεκινά με n ομάδες (clusters) όσες δηλαδή ο αριθμός των παρατηρήσεων. Κάθε παρατήρηση αποτελεί επομένως μία ομάδα. Στη συνέχεια δύο ομάδες, δηλαδή δύο παρατηρήσεις στο στάδιο αυτό, ενώνονται σε μία νέα ομάδα, οπότε ο αριθμός των ομάδων γίνεται n-1. Το κριτήριο για την ένωση των παρατηρήσεων είναι ότι έχουν τη μικρότερη απόσταση στον πίνακα των αποστάσεων. Στο επόμενο στάδιο αντικαθιστάται η ομάδα των δύο παρατηρήσεων με το κέντρο τους και υπολογίζεται εκ νέου ο πίνακας των αποστάσεων. Οι δύο ομάδες με τη μικρότερη απόσταση ενώνονται και η διαδικασία συνεχίζεται μέχρι να ενωθούν όλες οι παρατηρήσεις σε μία ομάδα. Δημιουργούνται επομένως από μία έως n ομάδες παρατηρήσεων. Κάθε φορά που ενώνονται παρατηρήσεις παραμένουν μέχρι το τέλος της διαδικασίας στην ίδια ομάδα. Δεν υπάρχει εκ των προτέρων κάποια παραδοχή για τον αριθμό των ομάδων. Η διαδικασία μπορεί να ξεκινήσει και αντίστροφα, δηλαδή από μία ομάδα, και να καταλήξει σε n ομάδες. Η μη ιεραρχική μέθοδος προϋποθέτει ότι θέλουμε να δημιουργήσουμε έναν συγκεκριμένο αριθμό k ομάδων. Η μέθοδος ξεκινά με έναν αριθμό σημείων k ή με έναν αριθμό ομάδων παρατηρήσεων k. Αν η μέθοδος ξεκινήσει με k σημεία κάθε παρατήρηση τοποθετείται σε μία ομάδα με το πλησιέστερο προς αυτή σημείο. Αν ξεκινήσουμε με k αριθμό ομάδων τότε αρχικά υπολογίζονται τα κεντροειδή των ομάδων. Στη συνέχεια ακολουθεί μια διαδικασία διαδοχικών προσεγγίσεων με κάποια κριτήρια βέλτιστου διαχωρισμού των ομάδων, υπολογίζοντας είτε νέα σημεία είτε νέες ομάδες, μέχρις ότου δεν υπάρχει θέμα μετακίνησης των παρατηρήσεων από μία ομάδα σε άλλη (Rogerson, 2006). Παρακάτω παρουσιάζονται κάποιοι από τους πιο διαδεδομένους αλγόριθμους για την ομαδοποίηση που αναφέρονται ως ιεραρχικοί αλγόριθμοι και μη ιεραρχικοί αλγόριθμοι (k-means) Ιεραρχικές μέθοδοι Οι ιεραρχικές μέθοδοι δημιουργίας συστάδων έχουν χρησιμοποιηθεί συχνότερα στη Γεωγραφική Ανάλυση και για το λόγο αυτό θα γίνει πιο αναλυτική παρουσίαση. Οι ιεραρχικές μέθοδοι προχωρούν είτε με διαδοχικές ενώσεις παρατηρήσεων είτε με διαδοχικές διαιρέσεις για να πετύχουν την επιθυμητή ομαδοποίηση και με τον τρόπο αυτό διακρίνονται σε δυο ομάδες: τις συσσωρευτικές ιεραρχικές μεθόδους και τις διαιρετικές ιεραρχικές μεθόδους. Οι συσσωρευτικές ιεραρχικές μέθοδοι (agglomerative hierarchical methods) ξεκινούν τη διαδικασία με μεμονωμένες παρατηρήσεις, οπότε αρχικά υπάρχουν τόσες ομάδες όσες και οι παρατηρήσεις. Οι πιο παρόμοιες παρατηρήσεις ομαδοποιούνται πρώτες και στη συνέχεια ομαδοποιούνται οι ομάδες ανάλογα με τις ομοιότητές τους. Τελικά καθώς οι ομοιότητες μειώνονται όλες οι υποομάδες ενώνονται σε μία ομάδα. Οι διαιρετικές ή επιμεριστικές ιεραρχικές μέθοδοι (divisive hierarchical methods) ακολουθούν αντίστροφη διαδικασία. Αρχικά οι παρατηρήσεις διαιρούνται σε δύο ομάδες έτσι ώστε οι παρατηρήσεις στη μία ομάδα να είναι μακριά από τις παρατηρήσεις της άλλης ομάδας. Στη συνέχεια αυτές οι ομάδες υποδιαιρούνται σε υποομάδες με όσο το δυνατόν μικρότερες ομοιότητες. Η διαδικασία συνεχίζεται μέχρις ότου δημιουργηθούν τόσες ομάδες όσες και οι αρχικές παρατηρήσεις. 192

15 Δεδομένου ότι και στις δύο μεθόδους δημιουργούνται 1 έως n ομάδες, όπου n ο αριθμός των παρατηρήσεων, σκοπός της μεθόδου είναι να βρεθεί ο κατάλληλος αριθμός ομάδων στο διάστημα αυτό. Ένα από τα χαρακτηριστικά των ιεραρχικών μεθόδων ομαδοποίησης είναι ότι η ανάθεση ενός αντικείμενου σε μια ομάδα είναι αμετάκλητη. Όταν δηλαδή ένα αντικείμενο αποδοθεί σε μια ομάδα, ποτέ δεν απομακρύνεται από αυτήν και ποτέ δεν θα ενωθεί με αντικείμενα που ανήκουν σε άλλη ομάδα. Το πρώτο βήμα στις ιεραρχικές μεθόδους είναι να σχηματιστεί ένας πίνακας αποστάσεων για όλα τα ζεύγη παρατηρήσεων είτε με την ευκλείδεια απόσταση είτε με κάποιο από τα άλλα κριτήρια ομοιότητας που παρουσιάστηκαν προηγουμένως. Ανάλογα με τη μέθοδο ομαδοποίησης σχηματίζονται κάποιες ομάδες παρατηρήσεων. Στη συνέχεια δημιουργείται ένας νέος πίνακας αποστάσεων και η διαδικασία επαναλαμβάνεται θεωρητικά μέχρι το επίπεδο όπου όλες οι παρατηρήσεις αποτελούν μια ομάδα (ή n ομάδες για τις διαιρετικές ιεραρχικές μεθόδους). Τα αποτελέσματα των ιεραρχικών αυτών μεθόδων αναπαριστώνται σε ένα δισδιάστατο διάγραμμα που είναι γνωστό ως δενδρόγραμμα (dendrogram), επειδή μοιάζει με δένδρο. Όταν ένα ζεύγος περιπτώσεων συγχωνευτεί παρουσιάζεται ως ένας κλάδος στο δένδρο. Η επιλογή του αριθμού των ομάδων γίνεται συνήθως με εμπειρικά κριτήρια, αν και έχουν αναπτυχθεί και ορισμένα στατιστικά κριτήρια (Everitt et al., 2011). Η μελέτη του δενδρογράμματος αποτελεί το βασικό εργαλείο για να προσδιοριστεί ο αριθμός των ομάδων που θα προκύψουν από την ανάλυση. Οι συσσωρευτικές ιεραρχικές μέθοδοι είναι συνηθέστερες και έχουν μεγαλύτερη τεχνική τεκμηρίωση, οπότε παρακάτω θα επικεντρωθούμε σε αυτές προκειμένου να γίνει κατανοητή η λογική της μεθόδου ανάλυσης συστάδων. Οι κυριότερες μέθοδοι σύνδεσης (linkage methods) στις συσσωρευτικές ιεραρχικές μεθόδουςείναι οι εξής (Everitt et al., 2011 Johnson & Wichern, 2007): Η μονή σύνδεση (single linkage) η οποία χρησιμοποιεί την ελάχιστη απόσταση ή τον πλησιέστερο γείτονα (nearest neighbor). Η πλήρης σύνδεση (complete linkage) η οποία χρησιμοποιεί τη μέγιστη απόσταση ή τον πιο απομακρυσμένο γείτονα ανάμεσα σε ζεύγη συστάδων. Η μέση σύνδεση (average linkage) η οποία χρησιμοποιεί τη μέση απόσταση ανάμεσα σε ζεύγη συστάδων. Η μέθοδος των κεντροειδών (centroids) η οποία υπολογίζει αποστάσεις μεταξύ των κέντρων των ομάδων. Μία άλλη ιεραρχική μέθοδος η οποία χρησιμοποιείται συχνά σε γεωγραφικές εφαρμογές είναι η μέθοδος Ward. Η μέθοδος αυτή επιδιώκει την ελαχιστοποίηση των αποστάσεων των μελών της ομάδας από το κέντρο της ομάδας και επιτυγχάνει μεγαλύτερη ομοιογένεια στο εσωτερικό των ομάδων και μεγαλύτερο διαχωρισμό μεταξύ των ομάδων. Πρέπει να σημειωθεί ότι ανάλογα με τη μέθοδο της ένωσης των ομάδων δημιουργούνται διαφορετικά clusters. Στο SPSS διατίθενται επτά μέθοδοι ένωσης των ομάδων καθώς και οκτώ τρόποι μέτρησης των ομοιοτήτων (Norušis, 2011). Ανάλογα με την επιλογή, τα αποτελέσματα διαφέρουν. Τέλος, στην περίπτωση που επιδιώκεται οριοθέτηση περιφερειών οι οποίες θα έχουν γεωγραφική συνέχεια, μπορεί να τεθεί ένας μαθηματικός περιορισμός στο μοντέλο (contiguity constraint), ώστε οι παρατηρήσεις να ομαδοποιούνται μόνο όταν είναι γεωγραφικά εφαπτόμενες. Συνήθως βέβαια η λύση αυτή καταλήγει σε λιγότερο ομοιογενείς ομάδες σε σχέση με τη λύση που δεν θέτει περιορισμό γεωγραφικής συνέχειας. Έχουν αναφερθεί ορισμένα μειονεκτήματα της ιεραρχικής ομαδοποίησης. Ένα βασικό μειονέκτημα είναι ότι για μεγάλα σύνολα δεδομένων απαιτείται μεγάλος υπολογιστικός χρόνος. Εξ άλλου, όπως ήδη αναφέραμε, οι ομάδες που δημιουργούνται στα αρχικά βήματα δεν μπορούν να μεταβληθούν στη συνέχεια. Συχνά όμως, στη διαδικασία της ανάλυσης προκύπτει ανάγκη τροποποίησης των ομάδων, προκειμένου να δημιουργηθούν ομάδες οι οποίες να ανταποκρίνονται στα δεδομένα του ερευνητικού προβλήματος. Επίσης η ιεραρχική ταξινόμηση γενικά δημιουργεί μερικές ομάδες με πολλές παρατηρήσεις και αφήνει κάποιες παρατηρήσεις να αποτελούν μόνες τους μία ομάδα. Τέλος πρέπει να τονιστεί ότι η μέθοδος παράγει λύση για κάθε διαφορετικό αριθμό ομάδων, δηλαδή ο αριθμός των ομάδων δεν είναι γνωστός από πριν. Επομένως ο ερευνητής πρέπει να επιλέξει ποια ομαδοποίηση θα κρατήσει. ΠΑΡΑΔΕΙΓΜΑ 6.2 Ανάλυση κατά συστάδες: Ιεραρχική μέθοδος-μονή σύνδεση Παρακάτω παρουσιάζεται ένα παράδειγμα με συνολικά πέντε παρατηρήσεις προκειμένου να γίνει κατανοητή η βασική μέθοδος δημιουργίας των ομάδων. Τα δεδομένα του Πίνακα 6.7 αφορούν πέντε κατοικίες για τις 193

16 οποίες γνωρίζουμε την αξία, το εμβαδόν, τον όροφο, τον αριθμό των υπνοδωματίων, την ηλικία, την αξία ανά τ.μ. και τον δήμο στον οποίο βρίσκονται. Ο δήμος έχει χρησιμοποιηθεί για την ονομασία των περιπτώσεων και δεν περιλαμβάνεται στους υπολογισμούς. Στον Πίνακα 6.8 παρουσιάζονται τα ίδια δεδομένα αφού έχουν υπολογιστεί οι τυπικές τιμές (αφαιρώντας τον αριθμητικό μέσο και διαιρώντας με την τυπική απόκλιση). Πίνακας 6.7 Ανάλυση συστάδων: Δεδομένα Πίνακας 6.8 Ανάλυση συστάδων: Δεδομένα (τυπικές τιμές) Για τα δεδομένα του Πίνακα 6.8 υπολογίζονται οι ευκλείδειες αποστάσεις στον πολυδιάστατο χώρο των έξι μεταβλητών. Ο πίνακας των αποστάσεων (Πίνακας 6.9) περιλαμβάνει τα τετράγωνα των αποστάσεων και είναι συμμετρικός ως προς τη διαγώνιο. Για παράδειγμα η απόσταση μεταξύ των κατοικιών 1:Αθήνα και 2:Γαλάτσι υπολογίζεται ως εξής: d12 = [(-0,832)-( -0,690)] 2 +[(-0,951)-(-0,655)] 2 +[1,043-(-0,447)] 2 +[(-0,920)-(-0,920)] 2 +[0,885-0,213] 2 +[(-0,934)-(-0,505)] 2 = 2,966 Proximity Matrix Squared Euclidean Distance Case 1:ΑΘΗΝΑ 2:ΓΑΛΑΤΣΙ 3:ΑΙΓΑΛΕΩ 4:ΒΟΥΛΙΑΓΜΕΝΗ 5:ΑΛΙΜΟΣ 1:ΑΘΗΝΑ,000 2:ΓΑΛΑΤΣΙ 2,966,000 3:ΑΙΓΑΛΕΩ 5,987 1,613,000 4:ΒΟΥΛΙΑΓΜΕΝΗ 14,485 12,374 14,517,000 5:ΑΛΙΜΟΣ 26,504 18,306 17,719 5,529,000 This is a dissimilarity matrix Πίνακας 6.9 Ανάλυση συστάδων: Πίνακας αποστάσεων (SPSS) Στον Πίνακα 6.9 παρατηρούμε ότι η μικρότερη απόσταση αφορά το ζεύγος των παρατηρήσεων Γαλάτσι και Αιγάλεω (1,613). Αν ακολουθήσουμε τη μέθοδο της μονής σύνδεσης (single linkage), τότε δημιουργείται μία νέα παρατήρηση η ένωση των κατοικιών 2 και 3 η οποία συμβολίζεται με (2,3). Ο πίνακας των αποστάσεων υπολογίζεται εκ νέου αντικαθιστώντας τις αποστάσεις των παρατηρήσεων 2 και 3 από τις υπόλοιπες 194

17 παρατηρήσεις με την αντίστοιχη μικρότερη απόσταση των αρχικών παρατηρήσεων της ομάδας. Για παράδειγμα η απόσταση (2,3) δηλαδή Γαλάτσι-Αιγάλεω από την Αθήνα συμβολίζεται με d (2,3)1 και είναι: d (2,3)1 = min(d 2,1, d 3,1 ) = min[(2,966), ( 5,987)] = 2,966 Με τον ίδιο τρόπο υπολογίζονται οι αποστάσεις της ομάδας Γαλάτσι-Αιγάλεω από τη Βουλιαγμένη και τον Άλιμο και δημιουργείται ο νέος πίνακας των αποστάσεων ο οποίος περιλαμβάνει τέσσερεις παρατηρήσεις (Πίνακας 6.10). Πίνακας 6.10 Ανάλυση συστάδων: Αποστάσεις μετά την πρώτη ομαδοποίηση Στη συνέχεια εντοπίζεται η μικρότερη απόσταση η οποία είναι μεταξύ Αθήνας και της ομάδας Γαλάτσι- Αιγάλεω (2,966) και υπολογίζεται εκ νέου ο πίνακας των αποστάσεων (Πίνακας 6.11). Αν d (2,3,1)4 η απόσταση της νέας ομάδας Γαλάτσι- Αιγάλεω-Αθήνα με τη Βουλιαγμένη τότε: d (2,3,1)4 = min( d 4,2, d 4,3, d 4,1 ) = min[(12,374), (14,517), (14,485)] = 12,374 Με τον ίδιο τρόπο υπολογίζεται και η απόσταση Γαλάτσι-Αιγάλεω-Αθήνα με τον Άλιμο, οπότε προκύπτει ο νέος πίνακας των αποστάσεων με διαστάσεις 3x3. Η μικρότερη απόσταση είναι μεταξύ της Βουλιαγμένης και του Αλίμου (5,529). Επομένως έχουν δημιουργηθεί δύο ομάδες: Γαλάτσι-Αιγάλεω-Αθήνα και Άλιμος Βουλιαγμένη, οι οποίες ενώνονται στο τελευταίο στάδιο όταν όλες οι κατοικίες αποτελούν μία ομάδα. Πίνακας 6.11 Ανάλυση συστάδων: Αποστάσεις μετά τη δεύτερη ομαδοποίηση Τα αποτελέσματα παρουσιάζονται στα Διαγράμματα 6.7 και 6.8 όπου φαίνονται οι διαδοχικές ενώσεις των παρατηρήσεων. Τα διαγράμματα έχουν δημιουργηθεί στο SPSS και είναι το διάγραμμα των συνδέσεων (icicle 1 plot) και το δενδρόγραμμα (dendrogram). Το icicle plot εμφανίζει τις ενώσεις από n-1 clusters έως ένα, όπου n ο αριθμός των παρατηρήσεων. Στο Διάγραμμα 6.7 φαίνεται ότι συνδέονται στο επίπεδο 4 το Αιγάλεω με το Γαλάτσι και στο επίπεδο 3 σχηματίζεται η ομάδα Γαλάτσι - Αιγάλεω - Αθήνα. Στη συνέχεια ενώνεται η Βουλιαγμένη με τον Άλιμο και τέλος όλες οι κατοικίες μαζί. 1 Icicle είναι ο παγοκρύσταλλος και επειδή το διάγραμμα μοιάζει με παγοκρυστάλλους που κρέμονται από τη στέγη ενός κτιρίου έχει το όνομα Icicle Plot 195

18 Στο δενδρόγραμμα (Διάγραμμα 6.8) παρουσιάζεται η σειρά των συνδέσεων καθώς και οι αποστάσεις στις οποίες ενώνονται τα clusters υπό κλίμακα. Παρατηρούμε ότι στα τρία πρώτα στάδια της ομαδοποίησης οι αποστάσεις είναι μικρές ενώ στη συνέχεια μεγαλώνουν. Όμως στο διάγραμμα δεν εμφανίζονται οι πραγματικές αποστάσεις, αλλά αποστάσεις σε νέα κλίμακα που έχει ανώτατο όριο το 25 (Norušis, 2011). Το δενδρόγραμμα μπορεί να χρησιμοποιηθεί για να προσδιοριστεί ο αριθμός των ομάδων ανάλογα με την απόσταση στην οποία συνδέονται. Στο συγκεκριμένο παράδειγμα η πρώτη ομάδα (Γαλάτσι- Αιγάλεω-Αθήνα) δημιουργείται σε αποστάσεις κάτω του πέντε και η δεύτερη (Άλιμος Βουλιαγμένη) σε απόσταση μικρότερη του δέκα. Η τελευταία ένωση όμως γίνεται σε πολύ μεγαλύτερη απόσταση και δείχνει ότι οι δύο ομάδες διαφέρουν μεταξύ τους. Είναι προφανές ότι οι υπολογισμοί ιδιαίτερα για μεγάλα σύνολα δεδομένων δεν είναι δυνατό να πραγματοποιηθούν χωρίς κατάλληλο λογισμικό. Vertical Icicle Number Case of clusters 5:ΑΛΙΜΟΣ 4:ΒΟΥΛΙΑΓ ΜΕΝΗ 3:ΑΙΓΑΛΕΩ 2:ΓΑΛΑΤΣΙ 1:ΑΘΗΝΑ 1 X X X X X X X X X 2 X X X X X X X X 3 X X X X X X X 4 X X X X X X Διάγραμμα 6.7 Διάγραμμα συνδέσεων (Icicle Plot, SPSS) * * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * * Dendrogram using Single Linkage Rescaled Distance Cluster Combine C A S E Label Num ΓΑΛΑΤΣΙ 2 ΑΙΓΑΛΕΩ 3 ΑΘΗΝΑ 1 ΒΟΥΛΙΑΓΜΕΝΗ 4 ΑΛΙΜΟΣ 5 Διάγραμμα 6.8 Δενδρόγραμμα (Dendrogram, SPSS) Μη ιεραρχικές μέθοδοι Όπως ήδη αναφέρθηκε, οι μη ιεραρχικές μέθοδοι ξεκινούν από ένα προκαθορισμένο αριθμό ομάδων και συνήθως ξεκινούν με μία τυχαία κατανομή των παρατηρήσεων στις ομάδες. Η τελική κατανομή των παρατηρήσεων στις ομάδες προκύπτει με διαδοχικές προσεγγίσεις. Ο πιο διαδεδομένος αλγόριθμος είναι ο k-means, όπου k είναι ο αριθμός των ομάδων, ο οποίος ελαχιστοποιεί την Ευκλείδεια απόσταση ανάμεσα στις παρατηρήσεις και στα κέντρα των ομάδων. Η μέθοδος δεν απαιτεί τη δημιουργία ενός πίνακα αποστάσεων όπως στην ιεραρχική μέθοδο, δηλαδή δεν χρειάζεται ο υπολογισμός όλων των πιθανών αποστάσεων μεταξύ των παρατηρήσεων. Για μεγάλα σύνολα δεδομένων η 196

19 υπολογιστική δύναμη που απαιτείται για τον υπολογισμό του πίνακα των αποστάσεων είναι πολύ μεγάλη και για το λόγο αυτό η μέθοδος k-means είναι κατάλληλη για ομαδοποίηση μεγάλου αριθμού παρατηρήσεων. Μετά την αρχική τυχαία κατανομή, υπολογίζονται τα κέντρα των ομάδων (k-means) και κάθε παρατήρηση τοποθετείται στην ομάδα της οποίας το κέντρο είναι πλησιέστερο. Με τον τρόπο αυτό κάποιες από τις αρχικές ομάδες χάνουν παρατηρήσεις και κάποιες άλλες κερδίζουν. Στη συνέχεια γίνεται νέος υπολογισμός των κέντρων των ομάδων και νέα τοποθέτηση των παρατηρήσεων. Η διαδικασία συνεχίζεται μέχρις ότου τα κέντρα των ομάδων δεν μεταβάλλονται σημαντικά και δεν χρειάζονται μετακινήσεις παρατηρήσεων από ομάδα σε ομάδα Η ασαφής ομαδοποίηση (fuzzy clustering) Στις τεχνικές της ανάλυσης συστάδων που παρουσιάστηκαν προηγουμένως κάθε παρατήρηση αντιστοιχούσε σε μία μόνο ομάδα. Η ασαφής ομαδοποίηση επιτρέπει μία παρατήρηση να ανήκει σε περισσότερες ομάδες και ανταποκρίνεται σε πραγματικές καταστάσεις, όπου συχνά υπάρχει αβεβαιότητα στην κατάταξη. Εντάσσεται σε μία σειρά νέων μεθόδων με τη γενική ονομασία «ασαφής λογική» (Höppner, Klawonn, Kruse, & Runkler, 2000 Ross, 2010) Με την ασαφή ταξινόμηση τα αντικείμενα δεν κατατάσσονται σε μία συγκεκριμένη ομάδα, αλλά αντιστοιχούνται σε μία συνάρτηση η οποία δείχνει πόσο ισχυρή είναι η ένταξή τους σε μία ομάδα σε μία κλίμακα 0 έως 1. Ο αλγόριθμος fuzzy c-means 2 (FCM) αποτελεί μια προέκταση του k-means, ο οποίος παρουσιάστηκε προηγουμένως (Bezdek, 1981 Dunn, 1974). Η βασική διαφορά με τον αλγόριθμο k-means είναι ότι επιτρέπει στις παρατηρήσεις να ανήκουν σε περισσότερες από μία ομάδες, δίνοντας ένα βαθμό συμμετοχής από το 0 έως το 1, ανάλογα με την εγγύτητα που έχουν σε κάθε συγκεκριμένη ομάδα. Αν μ ij είναι ο βαθμός συμμετοχής της παρατήρησης j στην ομάδα i τότε: k i 1 1 όπου j=1,2,,n και k ο αριθμός των ομάδων ij Σε όλες τις προηγούμενες τεχνικές της ανάλυσης συστάδων κάθε αντικείμενο κατατάσσεται σε μία μόνο ομάδα για την οποία ο βαθμός συμμετοχής είναι ένα, ενώ για όλες τις υπόλοιπες ομάδες είναι μηδέν (αυτή η ομαδοποίηση αναφέρεται στη διεθνή βιβλιογραφία ως hard ή crispy). Σε πολλές εφαρμογές δεν είναι απαραίτητο ένα αντικείμενο να ανήκει σε μόνο μία ομάδα, όπως είναι για παράδειγμα οι έρευνες αγοράς για καταναλωτικά πρότυπα, όπου ένας καταναλωτής μπορεί να ανήκει σε περισσότερα από ένα πρότυπα. Αλλά και στα προβλήματα της οριοθέτησης περιφερειών, συχνά δεν είναι δυνατό για ορισμένες περιφέρειες να ομαδοποιηθούν με σαφήνεια σε ένα τύπο περιφερειών. Η ασαφής ομαδοποίηση δίνει τη δυνατότητα να δημιουργηθούν ομάδες με κάποιο βαθμό επικάλυψης. Η διαδικασία που ακολουθείται στον αλγόριθμο fuzzy c-means είναι αυτή των διαδοχικών προσεγγίσεων Οριοθέτηση περιφερειών Η ανάλυση συστάδων, όπως αναφέρθηκε προηγουμένως, εφαρμόζεται σε πολλές επιστήμες με δεδομένα που δεν έχουν σχέση με τον γεωγραφικό χώρο. Η διαφορά κατά την εφαρμογή της μεθόδου στη Γεωγραφική Ανάλυση είναι ότι, ανεξάρτητα από την τεχνική ανάλυσης συστάδων, είναι απαραίτητο να χαρτογραφήσουμε τα αποτελέσματα. Οι ομάδες οι οποίες προκύπτουν με βάση την ομοιότητα στις τιμές των δεδομένων μπορεί να μην εμφανίζουν κάποια γεωγραφική δομή. Αυτό που ενδιαφέρει στη Γεωγραφική Ανάλυση είναι αν οι ομάδες έχουν κάποια χωρική συσχέτιση, αν δηλαδή μπορούμε να θεωρήσουμε τις ομάδες ως περιφέρειες. Στην ιεραρχική ταξινόμηση υπάρχουν αρκετές επιλογές ως προς τον αριθμό των ομάδων που θα δημιουργηθούν. Αντίθετα στην k-means ανάλυση πρέπει να γνωρίζουμε εκ των προτέρων τον αριθμό των ομάδων, ίσως από προγενέστερες έρευνες ή σύμφωνα με μία υπόθεση εργασίας. Στην k-means μπορούμε να κάνουμε δοκιμές με διαφορετικό αριθμό ομάδων, αλλά ο υπολογισμός πρέπει να επαναλαμβάνεται. Στις ιεραρχικές μεθόδους με τη μελέτη του δενδρογράμματος, αλλά και επειδή το λογισμικό μπορεί να παρουσιάσει 2 Αναφέρεται και ως fuzzy k-means 197

20 ένα επιθυμητό εύρος λύσεων, μπορούμε να επιλέξουμε τον βέλτιστο αριθμό των ομάδων χωρίς νέους υπολογισμούς. ΠΑΡΑΔΕΙΓΜΑ 6.3 Τυπολογία αγροτικών περιοχών Στο παράδειγμα αυτό παρουσιάζεται μία ομαδοποίηση των αγροτικών περιοχών της Κρήτης με βάση μία σειρά από χαρακτηριστικά (Iliopoulou, Stratakis, & Tsatsaris, 2006). Η έμφαση δίνεται σε χαρακτηριστικά τα οποία περιγράφουν τον αγροτικό χώρο και το γεωργικό τομέα. Η επιλογή των χαρακτηριστικών έγινε με βάση τον προβληματισμό ο οποίος έχει αναπτυχθεί τις τελευταίες δεκαετίες σε διεθνές επίπεδο, για τις προοπτικές ανάπτυξης των αγροτικών περιοχών. Σύμφωνα με σειρά αναλυτικών μελετών του ΟΟΣΑ και της ΕΕ (βλ. για παράδειγμα (Commission of the European Communities, 1988, OECD, 1993) έχουν προταθεί κατηγοριοποιήσεις των αγροτικών περιοχών με βάση τα χαρακτηριστικά τους, ώστε να διατυπωθούν πολιτικές αγροτικής ανάπτυξης. Οι κατηγοριοποιήσεις του είδους αυτού ονομάζονται και τυπολογίες. Σύμφωνα με τις τυπολογίες αυτές, προτείνονται οι εξής βασικοί τύποι αγροτικών περιοχών: αγροτικές περιοχές που βρίσκονται κοντά στα αστικά κέντρα με ευνοϊκούς αναπτυξιακούς δείκτες, ενδιάμεσες αγροτικές περιοχές που χαρακτηρίζονται από την παρουσία τομέων απασχόλησης εκτός της γεωργίας, φθίνουσες αγροτικές περιοχές με δυσμενείς αναπτυξιακούς δείκτες. Οι κατηγορίες αυτές αναφέρονται εδώ επιγραμματικά, αλλά το περιεχόμενό τους μπορεί να διαφοροποιείται ανάλογα με τη χρονική στιγμή και τις περιφέρειες που εξετάζονται. Η ανάλυση συστάδων είναι μια μέθοδος με την οποία μπορούν να σχηματιστούν τυπολογίες. Η επιλογή των δεδομένων στο παράδειγμα αυτό έγινε με τέτοιο τρόπο ώστε να μπορεί να ελεγχθεί η παραπάνω τυπολογία αγροτικών περιοχών στον ελληνικό χώρο. Σε αυτή την εφαρμογή χρησιμοποιήθηκαν 13 δείκτες οι οποίοι είναι δημογραφικά χαρακτηριστικά, δεδομένα υποδομών και συμπληρωματικής απασχόλησης και δεδομένα γεωργικής παραγωγής. Η επιλογή των δεικτών αιτιολογείται με βάση αντίστοιχες μελέτες στη διεθνή και ελληνική βιβλιογραφία. Οι δείκτες που χρησιμοποιήθηκαν στην ανάλυση φαίνονται στον Πίνακα Η ταξινόμηση των αγροτικών περιοχών της Κρήτης έγινε στο επίπεδο του δημοτικού διαμερίσματος και περιελήφθησαν μόνο τα αγροτικά δημοτικά διαμερίσματα. Συνολικά 551 αγροτικά δημοτικά διαμερίσματα χρησιμοποιήθηκαν στην ανάλυση. 1. Δημογραφική πυκνότητα Ποσοστιαία μεταβολή πληθυσμού Δείκτης γήρανσης πληθυσμού Υψόμετρο 5. Απασχόληση στον τουρισμό ως ποσοστό του ενεργού πληθυσμού Απασχόληση στη μεταποίηση ως ποσοστό του ενεργού πληθυσμού Όγκος οικοδομικής δραστηριότητας ανά κάτοικο Ποσοστό απασχολούμενων στη γεωργία Ποσοστιαία μεταβολή απασχολούμενων στη γεωργία Ποσοστό χρησιμοποιούμενης γεωργικής γης Έκταση γεωργικής γης ανά εκμετάλλευση Ποσοστό προϊόντων προς πώληση Ποσοστό αρδευόμενης γης 2000 Πίνακας 6.12 Τυπολογία αγροτικών περιοχών (Κρήτη): Επιλογή μεταβλητών (δείκτες) Λόγω του μεγάλου αριθμού των παρατηρήσεων, χρησιμοποιήθηκε η μέθοδος k-means η οποία ελαχιστοποιεί την ευκλείδεια απόσταση μεταξύ των παρατηρήσεων και των κέντρων των ομάδων (clusters). Με βάση τις προηγούμενες τυπολογίες αγροτικών περιοχών ο ελάχιστος αριθμός ομάδων είναι τρία. Μετά από αρκετές δοκιμές της ανάλυσης, επιλέχθηκε η λύση των πέντε ομάδων. Τα αποτελέσματα φαίνονται στον Χάρτη 6.1. Η ερμηνεία των ομάδων γίνεται σύμφωνα με τα περιγραφικά στατιστικά των δεικτών που χρησιμοποιήθηκαν στην ανάλυση. Η σύγκριση μεταξύ των ομάδων γίνεται με τη σύγκριση των αριθμητικών μέσων για τους δείκτες της ανάλυσης, όπως έχουν υπολογιστεί για τα δημοτικά διαμερίσματα κάθε ομάδας (Πίνακας 6.13). Συνολικά ορίστηκαν πέντε ομάδες αγροτικών περιοχών: 198

21 περιαστικές περιοχές, τουριστικές περιοχές, δυναμικές αγροτικές περιοχές, περιφέρεια, φθίνουσες περιοχές. Ακολουθεί μια σύντομη περιγραφή των ομάδων. Οι ονομασίες των ομάδων έχουν προκύψει από την περιγραφή τους με βάση τους δείκτες. Σημειώνεται ότι η σειρά στα αποτελέσματα του Πίνακα 6.13 είναι διαφορετική απ ότι στον Χάρτη 6.1 επειδή στον χάρτη οι αγροτικές περιοχές παρουσιάζονται σε διαβάθμιση ανάλογα με το επίπεδο ανάπτυξης. Στον Πίνακα 6.13 η σειρά και η αρίθμηση των ομάδων (clusters) είναι αποτέλεσμα του αλγορίθμου k-means. Ομάδα 1 (Cluster 1): Περιαστικές αγροτικές περιοχές Αυτή η ομάδα αποτελείται από 18 δημοτικά διαμερίσματα τα οποία βρίσκονται κυρίως κατά μήκος της βόρειας ακτής της Κρήτης και είναι κοντά στα αστικά κέντρα του νησιού. Από τον Πίνακα 6.13 προκύπτει ότι η ομάδα αυτή χαρακτηρίζεται από δημογραφική ανάπτυξη, οικονομική διαφοροποίηση με αναπτυγμένους όλους τους τομείς της οικονομίας και αρκετά σημαντικό γεωργικό δυναμικό. Αυτός ο δυναμισμός μπορεί να αποδοθεί στη γεωγραφική θέση αυτών των δημοτικών διαμερισμάτων που χαρακτηρίζεται από την εγγύτητα στα αστικά κέντρα και την ακτή, καθώς και από το χαμηλό υψόμετρο. Ομάδα 2 (Cluster 2): Δυναμικές γεωργικές περιοχές Αυτή η ομάδα αποτελείται από 175 δημοτικά διαμερίσματα, τα οποία βρίσκονται σε τρεις γεωργικές περιφέρειες της κεντρικής, δυτικής και ανατολικής Κρήτης και είναι προσανατολισμένα στη γεωργική παραγωγή. Ορισμένες από τις πιο παραγωγικές γεωργικές περιφέρειες της Κρήτης, όπως η κοιλάδα της Μεσσαράς, ανήκουν σε αυτή την ομάδα. Πιθανά το πιο ενδιαφέρον χαρακτηριστικό είναι η αύξηση της απασχόλησης στον πρωτογενή τομέα. Όμως η γεωργική ανάπτυξη δεν συνδέεται με τη δημογραφική ανάπτυξη, αφού η πληθυσμιακή μεταβολή στα δημοτικά διαμερίσματα της ομάδας είναι αρνητική και η γήρανση του πληθυσμού είναι υψηλή. Ομάδα 3 (Cluster 3): Φθίνουσες περιοχές Αυτή η ομάδα αποτελείται από 179 ορεινά δημοτικά διαμερίσματα τα οποία βρίσκονται, ως επί το πλείστον, στην ενδοχώρα της Κρήτης. Χαρακτηρίζονται από δημογραφική παρακμή, περιορισμένη γεωργική γη, φθίνοντα γεωργικό τομέα και μικρή απασχόληση στους άλλους τομείς της οικονομίας. Τα δημοτικά διαμερίσματα της ομάδας δεν φαίνεται να έχουν πλεονεκτήματα και ο εξαιρετικά υψηλός δείκτης γήρανσης αποτελεί την ένδειξη της φθίνουσας προοπτικής των περιοχών αυτών. Ομάδα 4 (Cluster 4). Η περιφέρεια Αυτή η ομάδα αποτελείται από 37 δημοτικά διαμερίσματα, τα οποία βρίσκονται, κυρίως, στο δυτικό τμήμα της Κρήτης και τα περισσότερα ανήκουν στην ορεινή περιοχή των Λευκών Ορέων. Το κύριο χαρακτηριστικό αυτής της περιφέρειας είναι η επικράτηση του πρωτογενή τομέα και η διαθεσιμότητα γεωργικής γης, η οποία όμως φαίνεται ότι δεν είναι ιδιαίτερα παραγωγική. Η οικονομική διαφοροποίηση είναι μικρή και ο πρωτογενής τομέας δεν μπορεί να υποστηρίξει τη δημογραφική ανάπτυξη. Ομάδα 5 (Cluster 5): Τουριστικές περιοχές Αυτή η ομάδα αποτελείται από 142 δημοτικά διαμερίσματα τα οποία βρίσκονται, κυρίως, κατά μήκος της βόρειας ακτής του νησιού και στο εσωτερικό του, ενώ ορισμένα βρίσκονται στη νότια ακτή της Κρήτης. Τα δημοτικά διαμερίσματα της ομάδας αυτής είναι προσανατολισμένα στον τουρισμό και ορισμένα, όπως η Ελούντα, αποτελούν διάσημους τουριστικούς προορισμούς. Ο γεωργικός τομέας δεν είναι πολύ ισχυρός, ενώ ο δευτερογενής τομέας είναι αρκετά αναπτυγμένος, πιθανά σε σχέση με τον τουρισμό. Κατά συνέπεια η οικονομική διαφοροποίηση είναι σημαντική και έχει ως συνέπεια αρκετά σταθερές δημογραφικές συνθήκες. Από τη συζήτηση του παραδείγματος αυτού γίνεται σαφές ότι ο αλγόριθμος δεν οδηγεί αυτόματα σε αποτελέσματα, αλλά χρειάζεται προσεκτική εξέταση των δεδομένων για να καταλήξουμε σε μια ομαδοποίηση ανάλογα με το πρόβλημα που εξετάζουμε. 199

22 Χάρτης 6.1 Τυπολογία αγροτικών περιοχών (Κρήτη): Χαρτογράφηση ομάδων (clusters) (Επεξεργασία από Iliopoulou et al.,2006) 200

23 Πίνακας 6.13 Τυπολογία αγροτικών περιοχών (Κρήτη): Περιγραφικά στατιστικά των ομάδων (cluster analysis-spss) 6.4 Διαχωριστική ή Διακριτική Ανάλυση Στις προηγούμενες ενότητες παρουσιάστηκαν η παραγοντική ανάλυση, με την οποία ομαδοποιούνται οι μεταβλητές, αλλά ταξινομούνται και οι παρατηρήσεις ενός πίνακα δεδομένων με τη βοήθεια των παραγοντικών τιμών, καθώς και η ανάλυση συστάδων, με την οποία ταξινομούνται οι παρατηρήσεις και γίνονται οριοθετήσεις περιφερειών. Η διακριτική (ή διαχωριστική) ανάλυση (discriminant analysis) είναι μια στατιστική τεχνική ταξινόμησης των παρατηρήσεων η οποία όμως προϋποθέτει τον εκ των προτέρων διαχωρισμό των δεδομένων σε δύο ή περισσότερες ομάδες. Από την άποψη αυτή η διακριτική ανάλυση έχει ομοιότητες με την ανάλυση διασποράς την οποία εξετάσαμε στο Κεφάλαιο 4. Η διακριτική ανάλυση μας επιτρέπει να μελετήσουμε τις διαφορές μεταξύ των ομάδων αυτών λαμβάνοντας υπόψη ένα σύνολο μεταβλητών που περιγράφουν τα χαρακτηριστικά των ομάδων. Δημιουργούνται γραμμικοί συνδυασμοί των μεταβλητών και μπορούμε να αξιολογήσουμε τη σπουδαιότητα κάθε μεταβλητής στον διαχωρισμό των ομάδων. Από την άποψη αυτή η διακριτική ανάλυση έχει ομοιότητες με τη μέθοδο της πολλαπλής παλινδρόμησης που εξετάσαμε στο Κεφάλαιο 5. Τέλος, η διακριτική ανάλυση αποτελεί μια μέθοδο ταξινόμησης νέων παρατηρήσεων στις αρχικές ομάδες ανάλογα με τα χαρακτηριστικά τους. 201

24 Η διακριτική ανάλυση έχει εφαρμογές σε πολλές μελέτες των φυσικών και των κοινωνικών επιστημών. Αναπτύχθηκε από τον R.Fisher (Johnson & Wichern, 2007) ο οποίος εισήγαγε την έννοια της γραμμικής διακριτικής συνάρτησης σε μία από τις κλασικές εφαρμογές της διακριτικής ανάλυσης, για την ταξινόμηση λουλουδιών. Στη μελέτη αυτή χρησιμοποιήθηκαν τέσσερεις μεταβλητές που αφορούσαν το μήκος και το πλάτος των πετάλων και του κάλυκα δύο ειδών λουλουδιών (πρόκειται για το Iris data set H διακριτική ανάλυση εφαρμόστηκε αρχικά στην ανθρωπολογία και τη βιολογία, ενώ αργότερα διαδόθηκε στον χώρο των κοινωνικών επιστημών σε εφαρμογές ψυχολογικών και εκπαιδευτικών ερευνών. Έχει εφαρμογές για παράδειγμα στην Ιατρική για τη διάγνωση ασθενειών με βάση τα συμπτώματα, στις πολιτικές επιστήμες για τη μελέτη της εκλογικής συμπεριφοράς, στον τραπεζικό τομέα για την ανάλυση του προφίλ των δανειοληπτών κλπ. Στην Πληροφορική η μέθοδος χρησιμοποιείται για την αναγνώριση προτύπων (pattern recognition) και την εξόρυξη δεδομένων (data mining) (Dunne, 2007 McLachlan, 2004). Σημαντικές είναι και οι εφαρμογές σε χωρικά δεδομένα, όπως στην τηλεπισκόπηση για τη διάκριση των χρήσεων γης με βάση τις εικόνες που παίρνουμε από έναν δορυφόρο. Στις εφαρμογές αυτές χρησιμοποιούνται ομάδες χωρικών μονάδων με γνωστές χρήσεις γης και με βάση τις τηλεπισκοπικές μετρήσεις που αντιστοιχούν σε αυτές μπορούν να ταξινομηθούν νέες χωρικές μονάδες [βλ. για παράδειγμα Lobo (1997) και Gilichinsky & Peled (2013)]. Πρόσφατα έχουν παρουσιαστεί και εφαρμογές χωρικής διακριτικής ανάλυσης σε αντικείμενα όπως η τηλεπισκόπηση και η μελέτη της εκλογικής συμπεριφοράς, οι οποίες λαμβάνουν υπόψη τη χωρική αυτοσυσχέτιση (Brunsdon, Fotheringham, & Charlton, 2007 Wentz et al., 2010) Βασικές παραδοχές- Ορολογία Η πρώτη βασική προϋπόθεση για την εφαρμογή της διακριτικής ανάλυσης είναι ότι οι παρατηρήσεις πρέπει να είναι μέλη δύο ή περισσότερων αμοιβαία αποκλειόμενων ομάδων, δηλαδή οι ομάδες πρέπει να ορίζονται με τέτοιο τρόπο, ώστε κάθε παρατήρηση να ανήκει σε μία και μόνη ομάδα. Οι μεταβλητές στη διακριτική ανάλυση είναι ποσοτικά δεδομένα, αλλά θα μπορούσαν να χρησιμοποιηθούν και ψευδομεταβλητές (dummy variables), όπως και στην πολλαπλή παλινδρόμηση (Norušis, 2011). Οι μεταβλητές αυτές ονομάζονται και διακριτικές μεταβλητές (discriminating variables). Πρέπει να υπάρχει όμως στα δεδομένα μία ποιοτική μεταβλητή, με βάση την οποία να ορίζονται οι ομάδες των παρατηρήσεων, όπως στην ανάλυση διασποράς (ANOVA). Η διακριτική ανάλυση μπορεί να θεωρηθεί ως μια τεχνική παλινδρόμησης, όπου εξαρτημένη μεταβλητή είναι η ποιοτική μεταβλητή, η οποία ορίζει τις ομάδες των παρατηρήσεων και ανεξάρτητες μεταβλητές οι ποσοτικές μεταβλητές, οι οποίες διαχωρίζουν τις ομάδες (Klecka, 1980 Φράγκος, 2011). Υπάρχουν όμως κάποιοι περιορισμοί στις στατιστικές ιδιότητες που πρέπει να έχουν οι διακριτικές μεταβλητές: 1. Κάθε ομάδα έχει προκύψει από πληθυσμό ο οποίος ακολουθεί την πολυδιάστατη (πολυμεταβλητή) κανονική κατανομή. Δηλαδή κάθε μεταβλητή έχει κανονική κατανομή για συγκεκριμένες τιμές των άλλων μεταβλητών. Η προϋπόθεση αυτή είναι απαραίτητη για τους ελέγχους στατιστικής αξιοπιστίας, καθώς και για τον υπολογισμό των πιθανοτήτων κατάταξης των παρατηρήσεων σε κάθε μία από τις ομάδες. 2. Οι πίνακες διακύμανσης και συνδιακύμανσης (variance-covariance matrices) των ομάδων να είναι ίσοι. Αυτή η προϋπόθεση διευκολύνει τον υπολογισμό των διακριτικών συναρτήσεων, επειδή οι συναρτήσεις αυτές υπολογίζονται συνήθως ως γραμμικοί συνδυασμοί των διακριτικών μεταβλητών. 3. Να αποφεύγεται η συγγραμικότητα (multicollinearity). Δηλαδή δεν πρέπει να χρησιμοποιούνται διακριτικές μεταβλητές με μεγάλους συντελεστές συσχέτισης μεταξύ τους, επειδή έτσι υπάρχει πλεονασμός πληροφορίας. Για τον λόγο αυτό στη διακριτική ανάλυση μπορούν να χρησιμοποιηθούν οι ανεξάρτητοι παράγοντες που έχουν προκύψει από την παραγοντική ανάλυση. 4. Καμία μεταβλητή δεν πρέπει να είναι γραμμικός συνδυασμός των υπόλοιπων διακριτικών μεταβλητών. Οι παραπάνω υποθέσεις είναι απαραίτητες για το μαθηματικό μοντέλο πού χρησιμοποιείται συνήθως στη διακριτική ανάλυση. Στην περίπτωση που τα δεδομένα δεν ικανοποιούν αυτές τις βασικές υποθέσεις τα αποτελέσματα δεν απεικονίζουν επακριβώς την πραγματικότητα και πρέπει να γίνονται αποδεκτά με επιφύλαξη. 202

25 Το δείγμα πρέπει να είναι μεγάλο ώστε να είναι ανθεκτική ή εύρωστη (robust) η διαδικασία σε περίπτωση μη κανονικών κατανομών. Δεν υπάρχει όριο για τον αριθμό των μεταβλητών, αλλά ο αριθμός των παρατηρήσεων πρέπει να είναι τουλάχιστον δύο ανά ομάδα και γενικά να υπερβαίνει τον αριθμό των μεταβλητών. Συνήθως χρησιμοποιείται ο κανόνας ο αριθμός των παρατηρήσεων να είναι εικοσαπλάσιος του αριθμού των διακριτικών μεταβλητών (Φράγκος, 2011). Η διακριτική ανάλυση είναι μια στατιστική μέθοδος πού περιλαμβάνει πολλές επί μέρους στατιστικές επεξεργασίες. Μπορούμε να κατατάξουμε αυτές τις στατιστικές επεξεργασίες σε δύο βασικές ομάδες που επιτελούν δύο διαφορετικές λειτουργίες στα πλαίσια της διακριτικής ανάλυσης. Η πρώτη αφορά την ερμηνεία των δεδομένων, δηλαδή τη μελέτη των διαφορών μεταξύ των ομάδων των παρατηρήσεων με βάση τα επιλεγμένα χαρακτηριστικά τους. Έτσι απαντάμε σε ερωτήματα της μορφής: πόσο καλά μπορούμε να διακρίνουμε τις ομάδες με βάση το δεδομένο σύνολο χαρακτηριστικών ή ποιο χαρακτηριστικό είναι καλύτερο για να διακρίνει τις ομάδες. Για τον σκοπό αυτό υπολογίζονται οι διακριτικές συναρτήσεις (discriminant functions) οι οποίες αποτελούν γραμμικό συνδυασμό των μεταβλητών. Η δεύτερη ομάδα στατιστικών επεξεργασιών, στα πλαίσια της διακριτικής ανάλυσης, περιλαμβάνει την εξαγωγή μίας ή περισσότερων μαθηματικών εξισώσεων που επιτρέπουν την ταξινόμηση των μη ταξινομημένων παρατηρήσεων σε μία από τις ομάδες. Αυτές οι εξισώσεις συνδυάζουν τα χαρακτηριστικά των ομάδων με τέτοιο τρόπο ώστε να μπορούμε να εντοπίσουμε την ομάδα με την οποία έχει τις περισσότερες ομοιότητες κάθε μία από τις μη ταξινομημένες παρατηρήσεις. Εφόσον διεξαχθεί η διακριτική ανάλυση, μπορούμε να ταξινομήσουμε παρατηρήσεις οι οποίες δεν περιλαμβάνονται στα αρχικά δεδομένα ή δεν ήταν δυνατό να ταξινομηθούν εξαρχής σε μία από τις ομάδες, χρησιμοποιώντας τις ίδιες διακριτικές μεταβλητές και τις διακριτικές συναρτήσεις. Τέλος πρέπει να σημειώσουμε ότι παρόλο πού η διακριτική ανάλυση συνδέει δύο ή περισσότερες ομάδες παρατηρήσεων με ένα σύνολο διακριτικών μεταβλητών, δεν περιέχει την έννοια της αιτιότητας. Δεν υπάρχει δηλαδή η έννοια του αιτίου και του αποτελέσματος, όπως στην ανάλυση παλινδρόμησης Υπολογισμός των διακριτικών συναρτήσεων Η κανονική διακριτική συνάρτηση (canonical discriminant function) είναι ένας γραμμικός συνδυασμός των διακριτικών μεταβλητών και σχηματίζεται έτσι ώστε να επιτευχθεί ο μέγιστος διαχωρισμός μεταξύ των ομάδων και, ειδικότερα, μεταξύ των μέσων όρων των ομάδων. Όταν οι ομάδες είναι δύο, δημιουργείται μία διακριτική συνάρτηση, ενώ για περισσότερες ομάδες μπορεί να δημιουργηθούν περισσότερες διακριτικές συναρτήσεις. Όταν πρόκειται για δύο ομάδες παρατηρήσεων, είναι ευκολότερη η απεικόνιση του προβλήματος στο δισδιάστατο χώρο. Στο Διάγραμμα 6.9 φαίνεται το διάγραμμα διασποράς για ένα δείγμα κατοικιών ανάλογα με την αξία της κατοικίας και την ηλικία. Οι παρατηρήσεις έχουν ονομαστεί ανάλογα με το αν διαθέτουν θέση στάθμευσης. Παρατηρούμε ότι οι πιο πολλές κατοικίες με θέση στάθμευσης βρίσκονται στην πάνω περιοχή του διαγράμματος, ενώ αυτές που δεν έχουν θέση στάθμευσης συγκεντρώνονται στην πλειοψηφία τους στην κάτω περιοχή. Καμία από τις δύο μεταβλητές ΑΞΙΑ ΚΑΤΟΙΚΙΑΣ και ΗΛΙΚΙΑ δεν διαχωρίζουν εντελώς τις κατοικίες ως προς την ύπαρξη θέσης στάθμευσης. Δηλαδή δεν μπορούμε να βρούμε μία τιμή της μεταβλητής ΑΞΙΑ ΚΑΤΟΙΚΙΑΣ που να διαχωρίζει τις κατοικίες σε αυτές που έχουν θέση στάθμευσης ή όχι, π.χ. πάνω από ευρώ όλες οι κατοικίες έχουν θέση στάθμευσης και κάτω από αυτή δεν έχουν. Το ίδιο ισχύει και για τη μεταβλητή ΗΛΙΚΙΑ. Θα μπορούσαμε με μία ευθεία γραμμή να προσπαθήσουμε να διαχωρίσουμε τις δύο περιοχές του διαγράμματος με τα ΝΑΙ και τα ΟΧΙ (Διάγραμμα 6.9). Όμως αν η περιοχή πάνω από τη γραμμή έχει κυρίως κατοικίες με θέση στάθμευσης, υπάρχουν και κατοικίες χωρίς θέση στάθμευσης. Αντίστοιχα στην περιοχή κάτω από τη γραμμή υπάρχουν και κατοικίες που διαθέτουν θέση στάθμευσης. Σκοπός της διακριτικής ανάλυσης είναι να βρει ένα κριτήριο που να διαχωρίζει τις ομάδες των παρατηρήσεων με τον καλύτερο τρόπο, δηλαδή να βρεθούν κανόνες οι οποίοι θα ελαχιστοποιούν την πιθανότητα λανθασμένης κατάταξης. Στο απλό παράδειγμα των δύο μεταβλητών και δύο ομάδων, η διακριτική ανάλυση υπολογίζει μία μόνο συνάρτηση η οποία είναι μία ευθεία γραμμή που ορίζει την κατεύθυνση του διαχωρισμού και είναι κάθετη προς τη γραμμή που έχει σχεδιαστεί στο Διάγραμμα 6.9. Στο τέλος της διαδικασίας υπολογίζεται ο αριθμός των παρατηρήσεων που δεν έχουν ταξινομηθεί σωστά, οπότε μπορούμε να εκτιμήσουμε την επιτυχία της διαδικασίας. Η μαθηματική μορφή της διακριτικής συνάρτησης είναι η ακόλουθη 3 : 3 Οι συμβολισμοί δεν είναι σταθεροί στη βιβλιογραφία 203

26 d k = u 0k + u 1k Χ 1 + u 2k Χ u pk Χ p όπου: k ο αριθμός των διακριτικών συναρτήσεων ή ο αριθμός των ομάδων μείον ένα p ο αριθμός των μεταβλητών d k η τιμή της συνάρτησης k X i οι διακριτικές μεταβλητές u ik σταθεροί (διακριτικοί) συντελεστές για κάθε μεταβλητή και τη συνάρτηση k Η μορφή των εξισώσεων αυτών είναι ανάλογη της πολλαπλής γραμμικής παλινδρόμησης. Κάθε παρατήρηση λαμβάνει μία νέα τιμή η οποία αποτελεί έναν γραμμικό συνδυασμό των τιμών της για τις διακριτικές μεταβλητές. Το κριτήριο για τον υπολογισμό των συντελεστών u της πρώτης συνάρτησης είναι να επιτευχθεί ο μέγιστος διαχωρισμός μεταξύ των ομάδων και ειδικότερα η διαφορά των μέσων των ομάδων να είναι η μέγιστη δυνατή. Με το ίδιο κριτήριο υπολογίζονται οι συντελεστές για τη δεύτερη, τρίτη κλπ. διακριτικές συναρτήσεις με την πρόσθετη προϋπόθεση ότι οι τιμές για κάθε διακριτική συνάρτηση δεν συσχετίζονται με τις τιμές που έχουν υπολογιστεί για τις προηγούμενες συναρτήσεις. Ο μέγιστος αριθμός διακριτικών συναρτήσεων που μπορούν να προκύψουν είναι ίσος με τον αριθμό των ομάδων μείον ένα ή με τον αριθμό των μεταβλητών στην περίπτωση που αυτός είναι μικρότερος από τον αριθμό των ομάδων. Διάγραμμα 6.9 Διάγραμμα διασποράς και διαχωρισμός παρατηρήσεων Ο τρόπος εξαγωγής των διακριτικών συναρτήσεων μπορεί να παρασταθεί και γεωμετρικά, όπως και στις άλλες μεθόδους πολυμεταβλητής ανάλυσης που παρουσιάστηκαν στο κεφάλαιο αυτό. Αν θεωρήσουμε τις διακριτικές μεταβλητές σαν άξονες πού ορίζουν έναν p-διάστατo χώρο, όπου p είναι ο αριθμός των μεταβλητών, τότε κάθε παρατήρηση αντιπροσωπεύεται από ένα σημείο πού έχει συντεταγμένες τις τιμές της παρατήρησης για κάθε μεταβλητή. Αν έχουμε δύο ή περισσότερες ομάδες παρατηρήσεων που διαφέρουν μεταξύ τους ως προς τις παραπάνω μεταβλητές, μπορούμε να φανταστούμε κάθε ομάδα σαν μια συγκέντρωση σημείων στον p- διάστατo χώρο. Η θέση κάθε ομάδας μπορεί να αντιπροσωπευθεί από ένα κεντρικό σημείο (centroid) τού 204

Ιωάννης Τσαούσης, Πανεπιστήμιο Κρήτης Τμήμα Ψυχολογίας

Ιωάννης Τσαούσης, Πανεπιστήμιο Κρήτης Τμήμα Ψυχολογίας Η Ανάλυση Παραγόντων (Factor Analysis) Τι είναι η ανάλυση παραγόντων Σκοπός της ανάλυσης παραγόντων (ΑΠ) είναι να συνοψίσει τις σχέσεις ανάμεσα σε ένα μεγάλο αριθμό μεταβλητών με έναν περιεκτικό και ακριβή

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. Μ-Ν ΝΤΥΚΕΝ Ορισμός Σκοπός της Α.Κ.Σ. Η Α.Κ.Σ. εντάσσεται στις μεθόδους διερευνητικής ανάλυσης (exploratory) συνθετικών φαινόμενων (Παραγοντικές μεθόδοι).

Διαβάστε περισσότερα

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) ΜΕ ΤΟ SPSS Ρ ΚΟΡΡΕΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) Η ανάλυση παραγόντων (Fact) είναι ουσιαστικά µία τεχνική µείωσης

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS Άγγελος Μάρκος Λέκτορας ΠΤΔΕ, ΔΠΘ Αλεξανδρούπολη 2012 1. Εισαγωγή Η μέτρηση στις επιστήμες της συμπεριφοράς συχνά στοχεύει στην

Διαβάστε περισσότερα

Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS

Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS 1. Εισαγωγή Άγγελος Μάρκος Αλεξανδρούπολη, 04.04.2013 Η μέτρηση στις επιστήμες της συμπεριφοράς συχνά στοχεύει

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Ενότητα 5: Ανάλυση στοιχείων. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΘΗΜΑ: Ανάλυση Πολυδιάστατων (Πολυμεταβλητών) Δεδομένων και Συστήματα Εξόρυξης Δεδομένων (Multivariate Data

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΑΓΡΟΝΟΜΩΝ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΤΟΠΟΓΡΑΦΙΑΣ ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΒΥΡΩΝΑΣ ΝΑΚΟΣ ΑΘΗΝΑ 2006 ΠΕΡΙΕΧΟΜΕΝΑ Περιεχόμενα 1. Εισαγωγή 1 2. Μέθοδοι σταθερών

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ FACTOR ANALYSIS

ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ FACTOR ANALYSIS ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΣΤΟΧΟΣ FACTOR ANALYSIS ΜΕΙΟΝΕΚΤΗΜΑΤΑ-ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΙΑΦΟΡΕΣ ΜΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ. ΚΑΤΑΛΛΗΛΟΤΗΤΑ Ε ΟΜΕΝΩΝ. ΠΩΣ ΕΠΙΤΥΓΧΑΝΕΤΑΙ. ΠΑΡΑ ΕΙΓΜΑ ΥΛΟΠΟΙΗΣΗ ΣΤΟ SPSS ΕΡΜΗΝΕΙΑ 1 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων Γένεση Μετακινήσεων Παναγιώτης Παπαντωνίου Δρ. Πολιτικός Μηχανικός, Συγκοινωνιολόγος ppapant@upatras.gr Πάτρα, 2017 Εισαγωγή Αθροιστικά μοντέλα (Aggregate models) Ανάλυση κατά ζώνη πόσες μετακινήσεις ξεκινούν

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. .. ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3. Ποιες μεταβλητές λέγονται ποσοτικές; 4. Πότε μια ποσοτική μεταβλητή

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Στατιστική ανάλυση αποτελεσμάτων

Στατιστική ανάλυση αποτελεσμάτων HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Στατιστική ανάλυση αποτελεσμάτων Βασίλης Αγγελής Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Πανεπιστήμιο Αιγαίου Κατερίνα Δημάκη Αν. Καθηγήτρια

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX Θεμελιώδης αλγόριθμος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού που κάνει χρήση της θεωρίας της Γραμμικής Άλγεβρας Προτάθηκε από το Dantzig (1947) και πλέον

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Χειμερινό εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Μέτρα

Διαβάστε περισσότερα

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ. χρησιμοποιήσουμε καθημερινά φαινόμενα όπως το θερμόμετρο, Θετικοί-Αρνητικοί αριθμοί.

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ. χρησιμοποιήσουμε καθημερινά φαινόμενα όπως το θερμόμετρο, Θετικοί-Αρνητικοί αριθμοί. ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ ΑΛΓΕΒΡΑ (50 Δ. ώρες) Περιεχόμενα Στόχοι Οδηγίες - ενδεικτικές δραστηριότητες Οι μαθητές να είναι ικανοί: Μπορούμε να ΟΙ ΑΚΕΡΑΙΟΙ ΑΡΙΘΜΟΙ χρησιμοποιήσουμε καθημερινά φαινόμενα

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Πεπερασμένες και Διαιρεμένες Διαφορές Εισαγωγή Θα εισάγουμε την έννοια των διαφορών με ένα

Διαβάστε περισσότερα

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η

Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η Ποιοτική & Ποσοτική Ανάλυση εδομένων Εβδομάδα 5 η 6 η Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη, 2013-2014 Εμπειρικές Στατιστικές Κατανομές Τα προβλήματα που

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 9/10/009 ΤΕΙ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ Η/Υ ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ 3o ΜΑΘΗΜΑ Ι ΑΣΚΩΝ ΒΑΣΙΛΕΙΑ ΗΣ ΓΕΩΡΓΙΟΣ Emal: gasl@math.auth.gr Ιστοσελίδα Μαθήματος: users.auth.gr/gasl

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ»

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Της σπουδάστριας ΚΑΤΣΑΡΟΥ ΧΑΡΙΚΛΕΙΑΣ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 8 : Παραγοντική Ανάλυση Αντιστοιχιών. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης

Διαβάστε περισσότερα

Κεφάλαιο Τοπολογικές απεικονίσεις Αζιμουθιακή ισόχρονη απεικόνιση

Κεφάλαιο Τοπολογικές απεικονίσεις Αζιμουθιακή ισόχρονη απεικόνιση Κεφάλαιο 9 Σύνοψη Στο κεφάλαιο αυτό, περιγράφονται αναλυτικές χαρτογραφικές μέθοδοι μετασχηματισμού του χώρου, μετατρέποντας τη γεωμετρία του χάρτη με τρόπο που να απεικονίζεται το ίδιο το χωρικό φαινόμενο

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Μάθημα Αστικής Γεωγραφίας

Μάθημα Αστικής Γεωγραφίας Μάθημα Αστικής Γεωγραφίας Διδακτικό Έτος 2015-2016 Παραδόσεις Διδακτικής Ενότητας: Πληθυσμιακή πρόβλεψη Δούκισσας Λεωνίδας, Στατιστικός, Υποψ. Διδάκτορας, Τμήμα Γεωγραφίας, Χαροκόπειο Πανεπιστήμιο Σελίδα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ 1 ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ 1. Ποιες μεταβλητές λέγονται ποσοτικές; (ΓΕΛ 2005) 2. Πότε μια ποσοτική μεταβλητή ονομάζεται διακριτή και πότε συνεχής; (ΓΕΛ 2005,2014) 3. Τι ονοµάζεται απόλυτη

Διαβάστε περισσότερα

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών 7. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης) 7. Μέθοδος Euler 7.3

Διαβάστε περισσότερα

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Δείκτες Κεντρικής Τάσης και Διασποράς. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Δείκτες Κεντρικής Τάσης και Διασποράς Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης Δημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη Εμπειρικές Στατιστικές Κατανομές Τα προβλήματα που γεννιούνται κατά την σύγκριση

Διαβάστε περισσότερα

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α) Τμήμα Διοίκησης Επιχειρήσεων (Αγ. Νικόλαος), Τ.Ε.Ι. Κρήτης Σελίδα 1 από 13 5η Εργαστηριακή Άσκηση Σκοπός: Η παρούσα εργαστηριακή άσκηση στοχεύει στην εκμάθηση κατασκευής γραφημάτων που θα παρουσιάζουν

Διαβάστε περισσότερα

Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων

Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Εφαρμοσμένη Πολυμεταβλητή Ανάλυση : Ανάλυση κατά συστάδες 1. Εισαγωγή Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων Η ομαδοποίηση δεδομένων

Διαβάστε περισσότερα

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα

f , Σύνολο 40 4) Να συμπληρώστε τον παρακάτω πίνακα f , , Σύνολο 5) Να συμπληρώστε τον παρακάτω πίνακα 1 ΣΤΑΤΙΣΤΙΚΗ 1) Οι παρακάτω αριθμοί παρουσιάζουν τα ύψη σε cm, των φυτών ενός θερμοκηπίου 4 3 6 5 3 1 4 5 4 6 6 3 3 1 4 3 α) Να κάνετε τον πίνακα όλων των συχνοτήτων β) Από τον προηγούμενο πίνακα να βρείτε,

Διαβάστε περισσότερα

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο Πολλαπλή παλινδρόµηση Μάθηµα 3 ο Πολλαπλή παλινδρόµηση (Multivariate regression ) Η συµπεριφορά των περισσότερων οικονοµικών µεταβλητών είναι συνάρτηση όχι µιας αλλά πολλών µεταβλητών Y = f ( X, X 2, X

Διαβάστε περισσότερα

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8 ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ Άλγεβρα 1 ο Κεφάλαιο 1. Τι ονομάζουμε αριθμητική και τι αλγεβρική παράσταση; Να δώσετε από ένα παράδειγμα. Μια παράσταση που περιέχει πράξεις με αριθμούς, καλείται αριθμητική παράσταση,

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΟΙ ΜΕΘΟΔΟΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΛΥΣΗΣ Χ. ΑΠ. ΛΑΔΙΑΣ

ΟΙ ΜΕΘΟΔΟΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΛΥΣΗΣ Χ. ΑΠ. ΛΑΔΙΑΣ ΟΙ ΜΕΘΟΔΟΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΛΥΣΗΣ Χ. ΑΠ. ΛΑΔΙΑΣ ΔΙΑΣΠΟΡΑ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΕΣ ΑΝΙΣΟΤΗΤΕΣ Τα μέτρα διασποράς χρησιμεύουν για τη μέτρηση των περιφερειακών ανισοτήτων. Τα περιφερειακά χαρακτηριστικά που χρησιμοποιούνται

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΠΛΗΘΥΣΜΟΙ ΔΕΙΓΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΕΔΟΜΕΝΩΝ Περιγραφική Στατιστική Με τις στατιστικές μεθόδους επιδιώκεται: - η συνοπτική αλλά πλήρης και κατατοπιστική παρουσίαση των ευρημάτων μιας

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Mέτρα (παράμετροι) θέσεως

Mέτρα (παράμετροι) θέσεως Mέτρα (παράμετροι) θέσεως Είδη παραμέτρων Σκοπός μέτρων θέσεως Μέτρα θέσεως Αριθμητικός μέσος Επικρατούσα τιμή Διάμεσος Τεταρτημόρια Σύντομη περιγραφή Το πρώτο βήμα της ανάλυσης των δεδομένων, είναι η

Διαβάστε περισσότερα

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ Κ. Ποϊραζίδης Η ταξινόμηση εικόνας αναφέρεται στην ερμηνεία με χρήση υπολογιστή των τηλεπισκοπικών εικόνων. Παρόλο που ορισμένες διαδικασίες έχουν τη δυνατότητα να συμπεριλάβουν πληροφορίες

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 Πίνακας Περιεχομένων Πρόλογος... 17 ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21 (Basic Sampling Techniques and Questionnaire Analysis using

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ ΥΠΕΥΘΥΝΟΣ ΚΑΘΗΓΗΤΗΣ Α. Ντούνης ΔΙΔΑΣΚΩΝ ΑΚΑΔ. ΥΠΟΤΡΟΦΟΣ Χ. Τσιρώνης ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ ΜΑΘΗΜΑ ΔΕΥΤΕΡΟ - Διανύσματα - Πράξεις με πίνακες - Διαφορικός λογισμός (1D) ΜΑΘΗΜΑΤΙΚΟ ΥΠΟΒΑΘΡΟ

Διαβάστε περισσότερα

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Προϋποθέσεις Εφαρμογής

Διαβάστε περισσότερα

Μεθοδολογία της Τράπεζας της Ελλάδος για την κατασκευή των δεικτών τιμών ακινήτων

Μεθοδολογία της Τράπεζας της Ελλάδος για την κατασκευή των δεικτών τιμών ακινήτων Μεθοδολογία της Τράπεζας της Ελλάδος για την κατασκευή των δεικτών τιμών ακινήτων Τράπεζα της Ελλάδος Διεύθυνση Οικονομικής Ανάλυσης και Μελετών Τμήμα Ανάλυσης Αγοράς Ακινήτων (email: sec.realestate@bankofgreece.gr)

Διαβάστε περισσότερα

7.2.1 Εκτίμηση της Καμπύλης Παλινδρόμησης της Μεταβλητής Υ πάνω στην Μεταβλητή Χ

7.2.1 Εκτίμηση της Καμπύλης Παλινδρόμησης της Μεταβλητής Υ πάνω στην Μεταβλητή Χ 7.2.1 Εκτίμηση της Καμπύλης Παλινδρόμησης της Μεταβλητής Υ πάνω στην Μεταβλητή Χ Για να προσδιορισθεί η καμπύλη παλινδρόμησης, η οποία αποτελείται από όλα τα ζεύγη σημείων τα οποία μπορούν προσδιορισθούν

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού CHIC Analysis

Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού CHIC Analysis Η Παραγοντική Ανάλυση των Αντιστοιχιών µέσω του λογισµικού Άγγελος Μάρκος, Γεώργιος Μενεξές, Γιάννης Παπαδηµητρίου Τµήµα Εφαρµοσµένης Πληροφορικής, Πανεπιστήµιο Μακεδονίας Εισαγωγή Το C.HI.C. (Correspondence

Διαβάστε περισσότερα

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης). Μέθοδος Euler 3. Μέθοδοι

Διαβάστε περισσότερα

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $)

Παράδειγμα. Χρονολογικά δεδομένα. Οι πωλήσεις μιας εταιρείας ανά έτος για το διάστημα (σε χιλιάδες $) Χρονολογικά δεδομένα Ένα διάγραμμα που παριστάνει την εξέλιξη των τιμών μιας μεταβλητής στο χρόνο χρονόγραμμα (ή χρονοδιάγραμμα). Κύρια μέθοδος παρουσίασης χρονολογικών δεδομένων είναι η πολυγωνική γραμμή

Διαβάστε περισσότερα

Γιατί μετράμε την διασπορά;

Γιατί μετράμε την διασπορά; Γιατί μετράμε την διασπορά; Παράδειγμα Δίνεται το ετήσιο ποσοστό κέρδους δύο επιχειρήσεων για 6 χρόνια. Αν έπρεπε να επιλέξετε την μετοχή μιας εκ των 2 με κριτήριο το ποσοστό κέρδους αυτά τα 6 χρόνια.

Διαβάστε περισσότερα

Philip McCann Αστική και περιφερειακή οικονομική. 2 η έκδοση. Chapter 1

Philip McCann Αστική και περιφερειακή οικονομική. 2 η έκδοση. Chapter 1 Philip McCann Αστική και περιφερειακή οικονομική 2 η έκδοση Chapter 1 Κεφάλαιο 1 Χωροθέτηση δραστηριοτήτων Περιεχόμενα διάλεξης Υπόδειγμα για τη χωροθέτηση της παραγωγής Weber και Moses Ανάλυση της περιοχής

Διαβάστε περισσότερα

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι: Χωρική Ανάλυση Ο σκοπός χρήσης των ΣΓΠ δεν είναι μόνο η δημιουργία μίας Β.Δ. για ψηφιακές αναπαραστάσεις των φαινομένων του χώρου, αλλά κυρίως, η βοήθειά του προς την κατεύθυνση της υπόδειξης τρόπων διαχείρισής

Διαβάστε περισσότερα

Αναλυτική Στατιστική

Αναλυτική Στατιστική Αναλυτική Στατιστική Συμπερασματολογία Στόχος: εξαγωγή συμπερασμάτων για το σύνολο ενός πληθυσμού, αντλώντας πληροφορίες από ένα μικρό υποσύνολο αυτού Ορισμοί Πληθυσμός: σύνολο όλων των υπό εξέταση μονάδων

Διαβάστε περισσότερα

Άσκηση Η15. Μέτρηση της έντασης του μαγνητικού πεδίου της γής. Γήινο μαγνητικό πεδίο (Γεωμαγνητικό πεδίο)

Άσκηση Η15. Μέτρηση της έντασης του μαγνητικού πεδίου της γής. Γήινο μαγνητικό πεδίο (Γεωμαγνητικό πεδίο) Άσκηση Η15 Μέτρηση της έντασης του μαγνητικού πεδίου της γής Γήινο μαγνητικό πεδίο (Γεωμαγνητικό πεδίο) Το γήινο μαγνητικό πεδίο αποτελείται, ως προς την προέλευσή του, από δύο συνιστώσες, το μόνιμο μαγνητικό

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα)

Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 3: Περιγραφική Στατιστική (Πίνακες & Αριθμητικά μέτρα) Δρ. Χρήστος Γενιτσαρόπουλος

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

Μαθηματικά. Ενότητα 3: Ολοκληρωτικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Μαθηματικά. Ενότητα 3: Ολοκληρωτικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Μαθηματικά Ενότητα 3: Ολοκληρωτικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Για την κατανόηση της ύλης αυτής θα συμβουλευθείτε επίσης το: βοηθητικό υλικό που υπάρχει στη

Για την κατανόηση της ύλης αυτής θα συμβουλευθείτε επίσης το: βοηθητικό υλικό που υπάρχει στη ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) ΕΡΓΑΣΙΑ 4 η Ημερομηνία Αποστολής στον Φοιτητή: Φεβρουαρίου Ημερομηνία παράδοσης της Εργασίας: 6 Μαρτίου Πριν από την λύση κάθε άσκησης καλό είναι να

Διαβάστε περισσότερα

ΓΥΜΝΑΣΙΟ ΚΑΣΤΕΛΛΑΝΩΝ ΜΕΣΗΣ ΑΛΓΕΒΡΑ

ΓΥΜΝΑΣΙΟ ΚΑΣΤΕΛΛΑΝΩΝ ΜΕΣΗΣ ΑΛΓΕΒΡΑ ΑΛΓΕΒΡΑ ΠΡΟΑΠΑΙΤΟΥΜΕΝΑ ΑΠΟ Α ΓΥΜΝΑΣΙΟΥ Ομόσημοι Ετερόσημοι αριθμοί Αντίθετοι Αντίστροφοι αριθμοί Πρόσθεση ομόσημων και ετερόσημων ρητών αριθμών Απαλοιφή παρενθέσεων Πολλαπλασιασμός και Διαίρεση ρητών αριθμών

Διαβάστε περισσότερα

4 Το άτομο ως παραγωγός (η προσφορά των αγαθών)

4 Το άτομο ως παραγωγός (η προσφορά των αγαθών) 4 Το άτομο ως παραγωγός (η προσφορά των αγαθών) Σκοπός Στο προηγούμενο κεφάλαιο εξετάσαμε τη ζήτηση των αγαθών, η οποία προέρχεται από τα νοικοκυριά (τους καταναλωτές). Τα αγαθά αυτά παράγονται και προσφέρονται

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΔΕΔΟΜΕΝΑ Δεδομένα μπορούν να αποκτηθούν στα πλαίσια διαφόρων εφαρμογών, χρησιμοποιώντας, όπου είναι απαραίτητο, κατάλληλο εξοπλισμό. Μερικά παραδείγματα

Διαβάστε περισσότερα

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση Οι επιδόσεις δέκα μαθητών σε τέσσερα μαθήματα Μαθητής Άλγεβρα Φυσική Νέα Ελληνικά Μουσική Α 65 63 35 61 Β 60 58 38 35 Γ 60 60 40 46

Διαβάστε περισσότερα

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 7 ο, Τμήμα Α

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 7 ο, Τμήμα Α Μαθηματικά: Αριθμητική και Άλγεβρα Μάθημα 7 ο, Τμήμα Α Δεδομένα Συχνότητα Μέτρα θέσης Μέτρα διασποράς Στοχαστικά μαθηματικά διαφέρουν από τα κλασσικά μαθηματικά διότι τα φαινόμενα δεν είναι αιτιοκρατικά,

Διαβάστε περισσότερα