Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων"

Transcript

1 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Εφαρμοσμένη Πολυμεταβλητή Ανάλυση : Ανάλυση κατά συστάδες 1. Εισαγωγή Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων Η ομαδοποίηση δεδομένων που έχουν συγκεντρωθεί από πραγματικές εφαρμογές δεν θα μπορούσε να διεκπεραιωθεί χωρίς τη βοήθεια των ηλεκτρονικών υπολογιστών τόσο λόγω της πολυπλοκότητας των διαθέσιμων αλγορίθμων όσο και το όγκου των πράξεων που πρέπει να γίνουν ιδιαίτερα στην περίπτωση ύπαρξης μεγάλου πλήθους δεδομένων. Σήμερα, πέρα από τα διάφορα μεμονωμένα προγράμματα που τρέχουν αλγόριθμους ομαδοποίησης, όλα σχεδόν τα στατιστικά πακέτα περιέχουν εντολές cluster analysis ενώ παράλληλα υπάρχουν και στατιστικά πακέτα ειδικά μόνο για cluster analysis όπως το CLUSTAN. Σε αυτή την ενότητα θα παρουσιάσουμε τον τρόπο με τον οποίο μπορούν να χρησιμοποιηθούν τα στατιστικά πακέτα SPSS και S-Plus για την ομαδοποίηση δεδομένων. 2. Η ανάλυση κατά συστάδες με χρήση του SPSS To SPSS έχει τη δυνατότητα να εκτελέσει δυο βασικές λειτουργίες ομαδοποίησης: μηιεραρχικές μεθόδους(k-means cluster) και ιεραρχικές μεθόδους (Hierarchical cluster). Για να οδηγηθούμε σε αυτές επιλέγουμε αρχικά το menu Analyze και στη συνέχεια την εντολή Classify.

2 2 Πρώτα θα εξετάσουμε την επιλογή K-Means Cluster Analysis. Ο αλγόριθμος που χρησιμοποιείται εδώ έχει τη δυνατότητα να επεξεργαστεί μεγάλο αριθμό δεδομένων σε σχέση με τις Ιεραρχικές μεθόδους. Οι αποστάσεις υπολογίζονται μόνο με την Ευκλείδεια απόσταση, οπότε αν ε- πιθυμούμε να χρησιμοποιήσουμε κάποιο άλλο μέτρο ομοιότητας ή αποστάσεως θα πρέπει να οδηγηθούμε σε Ιεραρχική μέθοδο ή να κάνουμε κατάλληλους μετασχηματισμούς ώστε ο υπολογισμός της Ευκλείδειας απόστασης στα μετασχηματισμένα δεδομένα να δίνει την απόσταση που μας ενδιαφέρει. Στο παρακάτω εικονίδιο θα πρέπει καταρχήν να εισάγουμε τις μεταβλητές που μας ενδιαφέρουν για την ομαδοποίηση. Όλες οι μεταβλητές θα πρέπει να είναι ποσοτικές ενώ ακριβώς από κάτω υπάρχει η επιλογή Label Cases by όπου μπορούμε να εισάγουμε (προαιρετικά) μια αλφαριθμητική μεταβλητή με σκοπό την ταυτοποίηση των στοιχείων (labeling cases). Τα σύμβολα που θα δοθούν ως στοιχεία στη μεταβλητή αυτή θα χρησιμοποιηθούν από το πρόγραμμα ως ετικέτες (labels) άτομα που χρησιμοποιούμε. Σε αυτό το σημείο θα πρέπει να επισημάνουμε ότι η τυποποίηση των μεταβλητών μας θα βοηθούσε αρκετά την στατιστική μας ανάλυση. Για παράδειγμα αν μια μεταβλητή έχει σαν μονάδα μέτρησης νομισματική μονάδα και κάποια άλλη έχει χρόνο τότε τα αποτελέσματα που θα εξαχθούν από το πρόγραμμα δεν θα είναι κατατοπιστικά. Για αυτό συνιστάται η τυποποίηση των μεταβλητών πριν ξεκινήσουμε να εκτελέσουμε την k-means μέθοδο. Αυτό είναι εφικτό με την παρακάτω σειρά εντολών Analyze Descriptive Statistics Descriptives. Ένα πολύ σημαντικό συστατικό του αλγόριθμου είναι ο προσδιορισμός από το χρηστή του αριθμού των ομάδων που θα γίνει η ομαδοποίηση και συμπληρώνεται στο Number of Clusters. Ο αριθμός των ομάδων θα πρέπει να είναι τουλάχιστον δυο και να μην υπεβαίνει το πλήθος των ατόμων που περιέχουν τα δεδομένα μας. Εάν επιλέξουμε την ένδειξη Centers>> θα εμφανιστεί το διπλανό εικονίδιο με το οποίο μας δίνεται η δυνατότητα να εισαγάγουμε στον αλγόριθμο τα αρχικά κέντρα των ομάδων απ όπου θα ξεκινήσει η διαδικασία της ομαδοποίησης., Επιλέγοντας την ένδειξη Read initial from και στη συνέχεια την ένδειξη File,μπορούμε να δώσουμε το όνομα του αρχείου από το ο-

3 3 ποίο θα πάρει το πρόγραμμα τα αρχικά κέντρα των ομάδων (μητρικά σημεία). Αυτό γίνεται εφικτό αν προηγουμένως έχουμε δημιουργήσει ένα καινούργιο αρχείο δεδομένων (σε μορφή πίνακα) που θα έχει στήλες όλες τις μεταβλητές των στοιχείων και μια ακόμη στήλη με το όνομα cluster_ ό- που εκεί θα είναι αριθμημένα τα κέντρα βάρους των ομάδων. Η επιλογή από τον χρήστη των αρχικών κέντρων των ομάδων προϋποθέτει κάποια ιδιαίτερη γνώση της υφής δεδομένων ώστε να έχει νόημα να προβεί ο ίδιος στον ορισμό των αρχικών κέντρων. Σε διαφορετική περίπτωση καλό θα είναι να αποφευχθεί η επιλογή αυτής της δυνατότητας, οπότε το πρόγραμμα θα προχωρήσει σε αυτόματο των αρχικών κέντρων. Ακόμη υπάρχει η δυνατότητα αν επιλέξουμε την ένδειξη Write final as να καταχωρήσουμε σε κάποιο αρχείο τα τελικά κέντρα των ομάδων έπειτα από την διαδικασία ομαδοποίησης. Ένα άλλο στοιχείο που καλούμαστε να συμπληρώσουμε στο αρχικό εικονίδιο K-Means Cluster Analysis είναι μια μεταξύ των επιλογών Iterate and Classify και Classify only. Αν επιλέξουμε την ένδειξη Iterate and Classify ο αλγόριθμος θα εκτελέσει επαναλαμβανόμενες ανανεώσεις των κέντρων των ομάδων μέχρις ότου σταθεροποιηθεί η σύσταση των ομάδων (τελική ομαδοποίηση). Αν χρησιμοποιήσουμε την επιλογή Classify only θα γίνει μόνο ένα βήμα, δηλαδή θα ταξινομηθούν απλώς τα στοιχεία με βάση την απόσταση από τα διαθέσιμα κέντρα Με την πρώτη επιλογή Iterate and Classify, δίνεται το διπλανό ειδικό πλαίσιο «K-means Cluster Analysis: Iterate» όπου καλούμαστε να επιλέξουμε το μέγιστο πλήθος των επαναλήψεων του αλγόριθμου και το κριτήριο σύγκλισης. Το πλήθος των επαναλήψεων μπορεί να είναι από 1 έως 999. Αυτό σημαίνει ότι ο αλγόριθμος θα σταματήσει τις επαναλήψεις όταν φτάσει το νούμερο που του έχουμε ορίσει ακόμη και αν δεν ικανοποιείται το κριτήριο σύγκλισης (ισορροπίας) που έχει οριστεί. Το κριτήριο ισορροπίας (Convergence Criterion) καθορίζει το πότε θα σταματήσει η επαναληπτική διαδικασία. Εκφράζεται ως λόγος της ελάχιστης απόστασης μεταξύ δυο αρχικών κέντρων των ομάδων σε σχέση με την απόστασή τους μετά μια επανάληψη. Επομένως οι τιμές που θα δώσουμε πρέπει να είναι μεταξύ 0 και 1. Έτσι για παράδειγμα αν θέσουμε στο κριτήριο την τιμή 0.02 τότε η επαναληπτική διαδικασία θα τερματιστεί όταν μια πλήρης επανάληψη του αλγόριθμου δεν μετακινεί κανένα κέντρο από τις ο- μάδες που έχουν διαμορφωθεί σε μια απόσταση μεγαλύτερη από 2% από τη μικρότερη απόσταση μεταξύ δυο οποιοδήποτε αρχικών κέντρών. Η επιλογή της ένδειξης Use running means έχει ως επακόλουθο τα κέντρα των ομάδων να ανανεώνονται έπειτα από την κατάταξη ενός στοιχείου σε μία ομάδα. Διαφορετικά τα νέα κέντρα βάρους υπολογίζονται όταν όλα τα στοιχεία έχουν τοποθετηθεί στις ομάδας.

4 4 Μια άλλη επιλογή που υπάρχει στο αρχικό εικονίδιο K-Means Cluster Analysis είναι αυτή με την ένδειξη Save. Αυτή η επιλογή μας προσφέρει τη δυνατότητα να αποθηκεύσουμε πληροφορίες από μια λύση σαν νέες μεταβλητές για να τις χρησιμοποιήσουμε σε κάποια άλλη ανάλυση. Στο διπλανό εικονίδιο η ένδειξη Cluster membership δημιουργεί μια νέα μεταβλητή που υποδεικνύει την ομάδα που ανήκει κάθε στοιχείο μετά την στατιστική επεξεργασία. Η νέα αυτή μεταβλητή παίρνει τιμές από 1 έως το πλήθος των ομάδων. Μια άλλη ένδειξη που υπάρχει στο ίδιο εικονίδιο είναι Distance from cluster center η οποία δημιουργεί μια νέα μεταβλητή η οποία αντιπροσωπεύει την Ευκλείδεια απόσταση μεταξύ κάθε στοιχείου και το κέντρου της ομάδας στην οποία ανήκει. Η τελευταία επιλογή που έχουμε να εξετάσουμε είναι αυτή με την ένδειξη options. Εκεί βρίσκονται ορισμένες πρόσθετες πληροφορίες που θα μπορούσαμε να έχουμε στην διάθεσή μας μετά την ολοκλήρωση της διαδικασίας ομαδοποίησης. Για παράδειγμα, θα μπορούσαμε να ζητήσουμε την εμφάνιση των αρχικών κέντρων βάρους, τη δημιουργία ενός πίνακα ANOVA, πληροφορίες σχετικά με το σε ποια ομάδα είναι μέλος το κάθε στοιχείο ξεχωριστά. Τέλος μπορούμε να καθορίσουμε με ποιο τρόπο θα χειριστεί το πρόγραμμα τις ελλιπείς τιμές (με ποιο κριτήριο θα αποφασίζεται αν θα εξαιρεθούν από την ανάλυση). Στη συνεχεία θα περιγράψουμε τον τρόπο με τον οποίο μπορεί να υλοποιηθούν στο SPSS Ιεραρχικοί μέθοδοι ομαδοποίησης (Hierarchical Clustering Methods) και πιο συγκεκριμένα οι συσσωρευτικές μέθοδοι. Αυτή η διαδικασία εντοπίζει σχετικά ομοιογενείς ομάδες από στοιχεία ή μεταβλητές βάσει των επιλεγμένων χαρακτηριστικών και χρησιμοποιώντας ένα αλγόριθμο ο οποίος ξεκινάει με ένα άτομο σε κάθε ομάδα, και με διαδοχικές συνενώσεις καταλήγει σε μια και μόνο ομάδα που περιέχει όλα τα άτομα. Επιλέγουμε αρχικά Analyze Classify Hierarchical Cluster, για να φτάσουμε στο διπλανό εικονίδιο και στην

5 5 συνέχεια καλούμαστε να εισαγάγουμε τις μεταβλητές οι οποίες μπορεί να είναι ποσοτικές, δίτιμες ή κατηγορικές. Όλες οι μεταβλητές που θα εισαχθούν θα πρέπει να είναι του ιδίου τύπου. Ακόμη, όλες οι μεταβλητές θα πρέπει να είναι σε αριθμητική μορφή, για παράδειγμα οι δίτιμες θα πρέπει να περιγράφονται με την μορφή 0 και 1 και όχι με Yes και No. Αν οι μεταβλητές έχουν μεγάλες διαφορές καλό θα ήταν να τις τυποποιήσουμε. Η ομαδοποίηση μπορεί να γίνει είτε θεωρώντας ως άτομα τις γραμμές (cases) των δεδομένων (πρωτεύουσα θεώρηση), είτε θεωρώντας ως άτομα τις στήλες δηλαδή με τις μεταβλητές (variables) που χρησιμοποιήσαμε για τη συλλογή των δεδομένων (δυϊκή θεώρηση). Αν επιλέξουμε ομαδοποίηση για τις γραμμές τότε θα πρέπει να συμπεριλάβουμε τουλάχιστον μια αριθμητική μεταβλητή. Αν κάνουμε ομαδοποίηση για τις στήλες, θα πρέπει να συμπεριλάβουμε τουλάχιστον τρεις αριθμητικές μεταβλητές στην ανάλυση μας. Ακόμη μπορούμε να επιλέξουμε και μια μεταβλητή-ετικέτα που να χαρακτηρίζει τα στοιχεία ( Label Cases by: ). Ξεκινώντας την παρουσίαση όλων των επιλογών του αρχικού εικονιδίου από αριστερά, η πρώτη ένδειξη που συναντάμε είναι η Statistics. Όπως βλέπουμε στο εικονίδιο παρακάτω υπάρχει μια επιλογή Agglomeration schedule όπου αν την διαλέξουμε τότε στα αποτελέσματα θα έ- χουμε μια αναλυτική πληροφόρηση για τα στοιχεία που συνδυάζονται μεταξύ τους σε κάθε στάδιο της διαδικασίας. Η ένδειξη Proximity matrix εάν επιλεχθεί θα μας δώσει όλες τις αποστάσεις ή τα μέτρα ομοιότητας μεταξύ των στοιχείων ή των μεταβλητών. Η επιλογή Cluster Membership μας δίνει την δυνατότητα απεικόνισης της ομάδας στην οποία κάθε στοιχείο τοποθετείται σε ένα ή περισσότερα σταδία στην διαδικασία της ομαδοποίησης. Η άλλη επιλογή είναι Plots και αναφέρεται στα γραφήματα που μπορεί να παράγει το πρόγραμμα ώστε να απεικονίσει τα στάδια της Ιεραρχικής μεθόδου. Όπως παρατηρούμε και στο εικονίδιο παρακάτω έχουμε τη δυνατότητα να ζητήσουμε τη δημιουργία δενδροδιαγράμματος η οποία αποτελεί και τη συνηθέστερη μορφή γραφικής απεικόνισης της διαδικασίας ομαδοποίησης, δίνοντάς μας παράλληλα και τη δυνατότητα να εξάγουμε πληροφορίες σχετικά και με το βέλτιστο αριθμό ομάδων που υπάρχει στα δεδομένα μας. Μια άλλη

6 6 μορφή γραφήματος είναι το icicle plot. Για το τελευταίο, υπάρχει η δυνατότητα παρουσίασης του για όλες τις ομάδες ή για καθορισμένο εύρος αυτών. Το icicle plot δίνει επίσης πληροφορίες για το πως τα στοιχεία ενώνονται σε ομάδες σε κάθε επανάληψη του αλγόριθμου. Δίνεται η δυνατότητα απεικόνισης αυτού του γραφήματος σε κάθετη ή σε οριζόντια μορφή. Στο κάτω μέρος του icicle plot (ή ισοδύναμα, δεξιά όταν έχουμε επιλέξει την οριζόντια απεικόνιση του γραφήματος) κανένα στοιχείο δεν έχει ακόμη ενωθεί με κάποιο άλλο, ενώ όσο προχωράμε προς τα πάνω (από δεξιά προς τα αριστερά για την οριζόντια μορφή), τα στοιχεία που ενώνονται σημειώνονται με ένα Χ ή με μια παύλα στην στήλη που βρίσκεται ανάμεσα τους. Οι διαφορετικές ομάδες διακρίνονται από την κενή στήλη που αφήνεται μεταξύ τους. Στην επιλογή Method βρίσκεται η καρδιά μιας Ιεραρχικής διαδικασίας αφού εδώ μπορούμε να διαλέξουμε με ποια μέθοδο επιθυμούμε να γίνει η ομαδοποίηση. Διαθέσιμες μέθοδοι τις ο- ποίες έχουμε εξετάσει αναλυτικά στην θεωρητική ενότητα είναι οι ακόλουθες : Between-groups linkage Within-groups linkage Nearest neighbor Furthest neighbor Centroid clustering Median Clustering Ward s method Ένα άλλο στοιχείο που μας ζητείται να συμπληρωθεί είναι το είδος του μέτρου ομοιότητας ή αποστάσεως που θα χρησιμοποιήσει η μέθοδος. Τα διαθέσιμα μέτρα και αποστάσεις χωρίζονται ανάλογα με το τύπο των μεταβλητών που έχουν εισαχθεί στην ανάλυση. Έτσι για Ποσοτικά δεδομένα (interval data) έχουμε στην διάθεση μας τα ακόλουθα: Euclidean distance, squared Euclidean distance, cosine, Pearson correlation, Chebychev, block, Minkowski και

7 7 customized. Για απαριθμητά δεδομένα (Count data) έχουμε chi-square measure και phi-square measure. Τέλος για Δίτιμα δεδομένα υπάρχει μια πληθώρα μέτρων όπως : Euclidean distance, squared Euclidean distance, size difference, pattern difference, variance, dispersion, shape, simple matching, phi 4-point correlation, lambda, Anderberg s D, dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2, Lance and Williams, Ochiai, Rogers and Tanimoto, Russel and Rao, Sokal and Sneath 1, Sokal and Sneath 2, Sokal and Sneath 3, Sokal and Sneath 4, Sokal and Sneath 5, Yule s Y, and Yule s Q. Στις δίτιμες μεταβλητές υπάρχει η επιλογή του συμβολισμού με 1 ή 0 για την παρουσία ή όχι ενός χαρακτηριστικού. Η επιλογή Transform Values μας επιτρέπει να τυποποιήσουμε τις τιμές των μεταβλητών μας ( δεν πρέπει να είναι δίτιμες) με διάφορες μεθόδους που διαθέτει. Ενώ η επιλογή Transform Measures μας επιτρέπει να μετασχηματίσουμε τις τιμές που προκύπτουν από τις μετρήσεις των αποστάσεων. Ακόμη μια επιλογή που υπάρχει στο αρχικό εικονίδιο της Ιεραρχικής μεθόδου είναι αυτό με την ένδειξη Save όπου μας δίνεται η δυνατότητα όπως φαίνεται παρακάτω- να αποθηκεύσουμε τη σύσταση των ομάδων σε ένα συγκεκριμένο επίπεδο (αριθμό ομάδων) της ιεραρχικής δοκιμασίας ή σε ένα συγκεκριμένο εύρος μεταξύ δυο επιπέδων της ιεραρχικής δοκιμασίας (το τελευταίο οριοθετείται με τον αριθμό των ομάδων ανάμεσα στις οποίες θέλουμε να κινηθούμε). Οι αποθηκευμένες μεταβλητές μπορούν να χρησιμοποιηθούν σε οποιαδήποτε άλλη στατιστική ανάλυση των δεδομένων. 2. Η ανάλυση κατά συστάδες με χρήση του S-Plus Το επόμενο στατιστικό πακέτο που θα εξετάσουμε είναι το S-Plus. Αυτό το πακέτο έχει τη δυνατότητα να εκτελεί τις διάφορες εντολές ομαδοποίησης δεδομένων με δυο τρόπους. Ο πρώτος είναι απευθείας από το γραφικό περιβάλλον του προγράμματος όπου υπάρχει ειδική ενότητα για ομαδοποίηση δεδομένων και ο δεύτερος είναι με χρήση ενός πλήθους εντολών που αφορούν αυτήν την διαδικασία σε ένα ειδικό παράθυρο εντολών (Commands Window). Ουσιαστικά ο πρώτος τρόπος εκμεταλλεύεται κάποιο τμήμα των εντολών του πακέτου (που είναι παράλληλα και οι πιο βασικές) οι οποίες τοποθετούνται σε γραφικό περιβάλλον που είναι φιλικό στον χρήστη. Από την άλλη πλευρά η χρήση του παραθύρου εντολών εκμεταλλεύεται πλήρως τις διαθέσιμες εντολές και

8 8 ο χρήστης έχει τη δυνατότητα να δουλέψε, σε διάφορες παραλλαγές και ρυθμίσεις που του παρέχουν οι εντολές, προσαρμόζοντάς τες ανάγκες του. Στην παρουσίαση που θα ακολουθήσει θα εξετάσουμε τις λειτουργίες και δυνατότητες του πρώτου τρόπου χειρισμού του πακέτου και παράλληλα θα γίνεται μια αναφορά στις διάφορες ε- ντολές που αφορούν την Ομαδοποίηση Δεδομένων. Εφόσον έχουμε εισάγει στο πακέτο τα δεδομένα μας είτε με την εντολή File Import File από κάποιο αρχείο είτε απευθείας σε ένα φύλλο εργασίας (Data Set), είμαστε έτοιμοι να προχωρήσουμε στην επεξεργασία τους με την επιλογή από το μενού Statistics Cluster Analysis όπου εκεί έχουμε μια σειρά μεθόδων ο- μαδοποίησης. Διακρίνουμε δυο κατηγορίες μεθόδων, τις μη Ιεραρχικές μεθόδους όπως είναι οι k-means, Partinioning Around Medoids και Fuzzy Partitioning και από την άλλη πλευρά τις Ιεραρχικές μεθόδους όπου σε αυτό το σημείο το πακέτο έχει την δυνατότητα εκτέλεσης και των δυο τύπων αλγόριθμων που είναι ο συσσωρευτικός (Agglomerative) και ο Διαιρετικός (Divisive). Τέλος με την επιλογή Compute Dissimilarities το πακέτο υπολογίζει τις αποστάσεις μεταξύ των στοιχείων ενός συνόλου δεδομένων τις οποίες κάνουν χρήση κάποιοι αλγόριθμοι όπως οι Ιεραρχικοί, Partinioning Around Medoids και Fuzzy Partitioning. Η επιλογή της μεθόδου k-means μας οδηγεί στο παράθυρο που φαίνεται παρακάτω όπου εκεί καλούμαστε να δηλώσουμε το όνομα του συνόλου των δεδομένων, τις μεταβλητές που θα ληφθούν υπόψη στην διαδικασία, τον αριθμό των ομάδων( Num of Clusters ) ή ένα πίνακα αρχικών τιμών για τα κέντρα βάρους, το μέγιστο αριθμό των επαναλήψεων του αλγόριθμου ( Max Iterations ), την παράλειψη γραμμών όπου υπάρχουν ελλιπείς τιμές (Missing Values), την επιλογή ενός υποσυνόλου γραμμών ( Subset Rows with ) που να πληρούν κάποια συνθήκη για κάποια μεταβλητή ή τη συμμετοχή όλων των γραμμών

9 9 στην ανάλυση αν αφήσουμε κενό αυτό το πεδίο και τέλος μπορούμε να αποθηκεύσουμε αυτό το μοντέλο ανάλυσης με κάποιο όνομα ώστε να μπορούμε να το καλέσουμε οποιαδήποτε στιγμή το χρειαστούμε. Ο αλγόριθμος ανακατανέμει τα στοιχεία των ομάδων με βάση τις αποστάσεις τους από τα κέντρα βάρη των εκάστοτε διαμορφωμένων ομάδων. Το κέντρο βάρους μιας ομάδας u είναι ένα σημείο στο p-διάστατο χώρο (p- μεταβλητές) βρίσκοντας τους μέσους όρους των μετρήσεων σε κάθε μεταβλητή. Για παράδειγμα η r- συντεταγμένη του είναι x r 1 n ( u) = όπου με C u συμβολίζουμε το σύνολο των δεικτών της ομάδας u ( η οποία περιέχει n u στοιχεία). Έτσι το κέντρο βάρους μιας ομάδας u δίνεται από την παρακάτω σχέση x( u) = ( x1( u), x2( u),..., x p( u)) Όσον αφορά τον τρόπο παρουσίασης των αποτελεσμάτων υπάρχει η επιλογή Results όπου εκεί μπορούμε να δηλώσουμε αν θέλουμε και σε τι βαθμό ή όχι την λίστα των αποτελεσμάτων, ακόμη μπορούμε να αποθηκεύσουμε με κάποιο όνομα την διανομή των στοιχείων των δεδομένων μας στις διάφορες ομάδες. Στο παράθυρο των αποτελεσμάτων (Report Window) εμφανίζονται τα κέντρα των δυο ο- μάδων με την μορφή διανυσμάτων με τις τιμές των μεταβλητών όπως φαίνονται παρακάτω, στην συνέχεια περιγράφεται η ταξινόμηση των στοιχείων με την σειρά που έχουν στα δεδομένα, επίσης αναφέρεται και το άθροισμα των τετραγώνων της κάθε ομάδας και τέλος δίνεται το πλήθος των στοιχείων που αποτελούν την κάθε ομάδα. Στην συνέχεια θα δούμε μια άλλη μη Ιεραρχική μέθοδο την Partitioning Around Medoids η οποία έχει κοινά στοιχεία με την k-means αλλά αντί για κέντρα βάρους (centroids) χρησιμοποιεί medoids. Ο αλγόριθμος επεξεργάζεται τον πίνακα των αποστάσεων των δεδομένων και σε πρωτη φάση υπολογίζει k αντιπροσωπευτικά αντικείμενα τα οποία ονομάζονται medoids όπου ο αριθμός k ορίζεται από τον χρήστη. Ο αλ- u i C u x ir

10 10 γόριθμος με τον οποίο γίνεται η επιλογή των k αντιπροσωπευτικών αντικειμένων (Medoids) αποτελείται από τα παρακάτω βήματα. 1. Θεωρούμε ένα στοιχείο i το οποίο δεν έχει ακόμη επιλεχθεί. 2. Θεωρούμε ένα μη επιλεγμένο στοιχείο j και υπολογίζουμε την διαφορά μεταξύ της απόστασης του D j με τα πιο όμοια προς αυτό επιλεγμένα στοιχεία και της απόστασής του με το αντικείμενο i. 3. Εάν αυτή η διαφορά είναι θετική, το αντικείμενο j θα συνεισφέρει στην απόφαση της επιλογής του στοιχείου i. Έτσι υπολογίζουμε την ποσότητα 4. Υπολογίζουμε το άθροισμα j C ji ji = max( D j d ij,0) C για την επιλογή του στοιχείου i. 5. Επιλέγουμε το μη επιλεγμένο ακόμη στοιχείο i το οποίο μεγιστοποιεί το άθροισμα j Η παραπάνω διαδικασία συνεχίζεται έως ότου βρεθούν τα k αντιπροσωπευτικά αντικείμενα. Στη συνέχεια κάθε στοιχείο αντιστοιχίζεται στο πλησιέστερο medoid και στόχος είναι η ελαχιστοποίηση του αθροίσματος των αποστάσεων όλων των στοιχείων στο πλησιέστερο medoid. C. ji d ij Ο αλγόριθμος αυτός σε σύγκριση με την k-means υπερέχει στα εξής σημεία: (α) Έχει την δυνατότητα να δεχτεί ένα πίνακα αποστάσεων (Dissimilarity Matrix). (β) Είναι πιο αποτελεσματικός διότι προσπαθεί να ελαχιστοποιήσει ένα άθροισμα από αποστάσεις (sum of dissimilarities) έναντι ενός αθροίσματος από τετράγωνα Ευκλείδειων αποστάσεων. (γ) Ακόμη έχει την δυνατότητα παραγωγής διαφόρων γραφημάτων. Στο παράθυρο που αντιστοιχεί σε αυτήν τη μέθοδο όπως φαίνεται παρακάτω καλούμαστε να δηλώσουμε το όνομα του συνόλου των δεδομένων, τις μεταβλητές που θα λάβουν μέρος στην διαδικασία, την όποια εξαίρεση γραμμών, την παράλειψη γραμμών με ελλιπείς τιμές, τη χρήση πίνακα αποστάσεων στην περίπτωση όπου δεν έχουμε αριθμητικά δεδομένα αλλά μπορούμε να εξάγουμε ένα τέτοιο πίνακα από την επιλογή Statistics Cluster Analysis Compute Dissimilarities. Ακόμη υπάρχει η δυνατότητα επιλογής της μετρικής που θα χρησιμοποιηθεί για να υπολογιστεί ο πίνακας

11 11 των αποστάσεων, η μια είναι η Ευκλείδεια που ορίζεται ως η τετραγωνική ρίζα του αθροίσματος των διαφορών και η άλλη είναι η manhattan που είναι το άθροισμα των απόλυτων διαφορών. Μια πολύ χρήσιμη επιλογή είναι αυτή της τυποποίησης των μεταβλητών και συνιστάται η χρήση της σε περίπτωση που οι μεταβλητές μας περιγράφουν διαφορετικά μεγέθη και υπάρχει μεγάλη διαφορά στις μονάδες μέτρησης. Οι δυο τελευταίες επιλογές που αναφέραμε έχουν νόημα μόνο όταν έχουμε ένα σύνολο δεδομένων και όχι ένα πίνακα αποστάσεων. Κάποια άλλα στοιχεία που πρέπει να εισάγουμε στον αλγόριθμο είναι το πλήθος των ομάδων και ακόμη μπορούμε να επιλέξουμε την ένδειξη Use Large Data Algorithm στην περίπτωση που έχουμε μεγάλο αριθμό δεδομένων με τη διαφορά ότι θα πρέπει να εισάγουμε το σύνολο δεδομένων και όχι τον πίνακα αποστάσεων. Τέλος υπάρχουν οι επιλογές της αποθήκευσης του μοντέλου που δημιουργήσαμε καθώς και των δεδομένων και των αποστάσεων, όπου η αποθήκευση αυτών των πληροφοριών είναι αναγκαία προϋπόθεση για την δημιουργία γραφήματος Clusplot που θα εξετάσουμε στην συνέχεια. Υπάρχει η δυνατότητα διαχείρισης της παρουσίασης των αποτελεσμάτων με τις κατάλληλες ρυθμίσεις στο παράθυρο Results όπου έχουμε περιγράψει προηγούμενα. Στο παράθυρο των αποτελεσμάτων (Report Window) φαίνεται το συντακτικό της εντολής που χρησιμοποιήθηκε και εμφανίζονται κατά σειρά τα medoids που επιλέχθηκαν από τον αλγόριθμο, το διάνυσμα (Clustering Vector) που μας δίνει την ταξινόμηση των παρατηρήσεων στις ομάδες και στο τέλος δίνεται η Objective function κατά τα δυο στάδια του αλγόριθμου που είναι το Build-step και το Swap-step όπου ορίζεται ως εξης: n Obj.Function= d ( i, mν ), i είναι το στοιχείο εκείνο ι i= 1 που τοποθετείται στην ομάδα ν i και το medoid mν ι είναι το πλησιέστερο από οποιοδήποτε άλλο. Ένα πολύ σημαντικό εργαλείο αυτής της μεθόδου είναι η δημιουργία γραφημάτων. Δυο είναι τα διαθέσιμα γραφήματα, το Clusplot και το Silhouette Plot που μπορούμε να επιλέξουμε στο

12 12 παράθυρο Plot. Το clusplot απεικονίζει όλα τα στοιχεία των δεδομένων σε ένα διδιάστατο σύστημα αξόνων και με το σχήμα της έλλειψης περιγράφει την κάθε ομάδα που έχει προκύψει από την ανάλυση. Το δεύτερο γράφημα είναι το Silhouette Plot, το οποίο μας δείχνει την ισχύ της σχέσης κάθε στοιχείου με την ομάδα που ανήκει σύμφωνα με την ανάλυση που έχει γίνει. Για κάθε παρατήρηση i, μια οριζόντια γραμμή σχεδιάζεται της οποίας το μήκος είναι το Silhouette width s(i) της παρατήρησης. Έστω ότι το στοιχείο i ανήκει στην ομάδα Α τότε συμβολίζουμε με α(i) το μέσο όρο των αποστάσεων του στοιχείου i από όλα τα υπόλοιπα στοιχεία της ομάδας Α. Στην συνέχεια θεωρούμε μια άλλη ομάδα C και συμβολίζουμε με d(i,c) το μέσο όρο των αποστάσεων του στοιχείου i από όλα τα στοιχεία της ομάδας C. Αφου υπολογίσουμε τα d(i,c) για όλα τα C A, επιλέγουμε το μικρότερο από αυτά και το συμβολίζουμε με b(i) b( i) = min d ( i, C) C A Έτσι είμαστε σε θέση να ορίσουμε την ποσότητα s(i) a( i) 1 b( i) s( i) = 0 b( i) 1 a( i) αν α(i)<b(i) αν α(i)=b(i) αν α(i)>b(i) Οι παρατηρήσεις που εμφανίζονται στο Silhouette Plot είναι κατανεμημένες ανά ομάδα και ξεκινάνε από την 1 η ομάδα να βρίσκεται στην κορυφή. Όσες παρατηρήσεις έχουν μεγάλο s(i) (δηλ. κοντά στο 1) είναι μια ένδειξη για το ότι πολύ σωστά έχουν κατανεμηθεί στην ομάδα που ανήκουν. Αν πάλι κάποιες παρατηρήσεις έχουν μικρό s(i) (δηλ. γύρω από το μηδέν) αυτό σημαίνει ότι αυτές οι παρατηρήσεις θα μπορούσαν να βρίσκονται κάλλιστα και στις δυο ομάδες. Τέλος υ- πάρχει η περίπτωση όπου κάποιες παρατηρήσεις έχουν αρνητική τιμή s(i) αυτό μας υποδεικνύει ότι αυτές οι παρατηρήσεις έχουν τοποθετηθεί λανθασμένα σε αυτήν την ομάδα.

13 13 Εφόσον έχουμε περιγράψει τις καλούμενες μη-ιεραρχικές μεθόδους θα προχωρήσουμε στην εξέταση των δυνατοτήτων του πακέτου στις Ιεραρχικές μεθόδους οι οποίες, όπως γνωρίζουμε, διακρίνονται σε Συσσωρευτικές (Agglomerative) και Διαιρετικές (Divisive). Πρώτα θα εξετάσουμε την Συσσωρευτική μέθοδο. Όπως παρατηρούμε στο διπλανό παράθυρο που αντιστοιχεί στη συγκεκριμένη μέθοδο, ζητείται από τον χρήστη να δηλώσει το σύνολο δεδομένων που θα χρησιμοποιηθεί στην ανάλυση καθώς και ποιες μεταβλητές θα λάβουν μέρος σε αυτήν. Επίσης μπορούμε να επιλέξουμε ποιες ακριβώς γραμμές θέλουμε να συμπεριληφθούν στην ανάλυση τις οποίες δηλώνουμε στο πεδίο Subset Rows with, όπως μπορούμε να δηλώσουμε να παραλειφθούν από την διαδικασία οι γραμμές στις οποίες υπάρχουν ελλιπείς τιμές missing values. Εάν οι τιμές που έχουμε δεν είναι αριθμητικές (numeric) αλλά κατηγορικές (factor) υπάρχει η δυνατότητα να κάνουμε χρήση του Dissimilarity Object αφού πρώτα το υπολογίσουμε από την επιλογή Statistics Cluster Analysis Compute Dissimilarities. Ακόμη υπάρχει η δυνατότητα της επιλογής της μετρικής που θα χρησιμοποιηθεί για τον υπολογισμό του πίνακα των αποστάσεων του συνόλου των δεδομένων. Στη διάθεση μας υπάρχουν δυο μετρικές, Euclidean και Manhattan. Μια πολύ σημαντική επιλογή είναι αυτής της τυποποίησης (standardize) των μεταβλητών μας κατά την οποία αφαιρείται από κάθε τιμή η μέση τιμή της μεταβλητής όπου ανήκει και εν συνεχεία διαιρείται αυτή η διαφορά με την απόλυτη μέση απόκλιση. Η διαδικασία της ομαδοποίησης μπορεί να γίνει με μια από της παρακάτω γνωστές μεθόδους Ιεραρχικής ομαδοποίησης την οποία και συμπληρώνουμε στην επιλογή Linkage Type : Average Complete Single Ward Weighted Στην ενότητα Save Model Object, δίνεται η δυνατότητα στον χρηστή να αποθηκεύσει τα στοιχεία αυτής της ανάλυσης το οποίο είναι και προϋπόθεση για την δημιουργία γραφημάτων. Οι τελευταίες ρυθμίσεις σχετικά με την παρουσίαση των αποτελεσμάτων της ανάλυ-

14 14 σης μπορούν να γίνουν από το παράθυρο Results όπου εκεί δηλώνουμε αν επιθυμούμε την εμφάνιση των αποτελεσμάτων και το όνομα που ενδεχομένως θέλουμε να αποθηκεύσουμε τα αποτελέσματα. Ακόμη υπάρχει η δυνατότητα επιλέγοντας το Cluster Membership να μας παρουσιάσει ένα διάνυσμα-στήλη όπου οι συντεταγμένες του μας δείχνουν την ταξινόμηση κάθε στοιχείου σε κάποια ομάδα (όπως τις δημιούργησε η ανάλυση) και σε συνδυασμό με το παρακάτω από αυτό πεδίο Num of Clusters όπου εκεί μπορούμε να δηλώσουμε το πλήθος των ομάδων που επιθυμούμε να γίνει αυτή η ταξινόμηση. Όπως παρατηρούμε στο παράθυρο εμφάνισης (Report Window) των αποτελεσμάτων, η ε- ντολή που είναι υπεύθυνη για όλη τη διαδικασία είναι η agnes η οποία με όλες τις παραμέτρους που έχουμε δηλώσει κατά την διάρκεια των ρυθμίσεων παίρνει την μορφή που έχουμε παρακάτω. Υπάρχουν ακόμη οι εντολές hclust και mclust οι οποίες έχουν διαφορετικές δυνατότητες σε σχέση με την agnes, όπως για παράδειγμα η mclust έχει κάποιες ιδιαίτερες υπολογιστικές μεθόδους αλλά η χρήση της agnes κρίνεται η καλύτερη δυνατή για τις περισσότερες των περιπτώσεων. Tα αποτελέσματα που παίρνουμε μετά την εκτέλεση της εντολής agnes συνοψίζονται στα ακόλουθα: {merge} εμφανίζει ένα (n-1) x 2 πίνακα, όπου n ο αριθμός των α- ντικειμένων των δεδομένων. Η γραμμή i του πίνακα περιγράφει την συγχώνευση των ομάδων στο βήμα i της ομαδοποίησης. Έστω j ένα στοιχείο σε μια γραμμή του πίνακα merge το οποίο έχει αρνητική τιμή τότε το αντικείμενο j συγχωνεύτηκε σε αυτό το στάδιο. Αν το j έχει θετική τιμή τότε πραγματοποιείται συγχώνευση με αυτήν που συνέβη στο προηγούμενο στάδιο. {order} είναι ένα διάνυσμα με τιμές τη σειρά των αντικειμένων όπως αυτά έχουν σχεδιαστεί στο δενδρόγραμμα. {height} είναι ένα διάνυσμα με τιμές τις αποστάσεις μεταξύ των ομάδων στα διαδοχικά στάδια του αλγόριθμου.

15 15 {Agglomerative coefficient} είναι ένας συντελεστής όπου μετράει την ισχύ της ομαδοποίησης. Για κάθε στοιχείο i, ορίζουμε το μέγεθος l(i) το οποίο ισούται με την αντίστοιχη τιμή στην ποσότητα Height. Ακόμη όπως θα δούμε παρακάτω στο διάγραμμα banner το μήκος κάθε ευθυγράμμου τμήματος που αντιπροσωπεύει κάθε μια παρατήρηση είναι ίσο με l(i). Ο συσσωρευτικός συντελεστής (AC) ορίζεται ως AC = 1 n n i= 1 Ο συντελεστής (AC) παίρνει τιμές από το 0 έως το 1 και εκφράζει την ισχύ της ομαδοποίησης. Όταν ο συντελεστής παίρνει τιμές κοντά στο μηδέν είναι μια ένδειξη για ασθενή συνοχή των δεδομένων μας στην συγκεκριμένη ομαδοποίηση ενώ όταν προσεγγίζει τη μονάδα τότε είναι μια ένδειξη ισχυρής ομαδοποίησης. Επειδή ο συντελεστής (AC) μεγαλώνει όσο αυξάνει το πλήθος των δεδομένων δεν μπορεί να χρησιμοποιηθεί για τη σύγκριση l( i) μεταξύ ομάδων δεδομένων με διαφορετικό μέγεθος. Μια πολύ σημαντική λειτουργία της συσσωρευτικής ιεραρχικής μεθόδου είναι αυτή της δημιουργίας γραφημάτων και συγκεκριμένα δενδρογράμματος (Clustering Tree) και Banner Plot. Το δενδρόγραμμα είναι μια γραφική αναπαράσταση της διαδικασίας της ο- μαδοποίησης όπου δείχνει τις παρατηρήσεις που ε- νώνονται για να σχηματίσουν τις ομάδες και τις τιμές των αποστάσεων σε κάθε βήμα του αλγόριθμου. Τα φύλλα (leaves) του δενδρογράμματος που βρίσκονται στο κάτω μέρος του γραφήματος παριστάνουν τις παρατηρήσεις και σε κάθε βήμα έχουμε τις συγχωνεύσεις των στοιχείων έως ότου όλα τα στοιχεία - παρατηρήσεις ενοποιηθούν σε μια ομάδα. Η κάθετη συντεταγμένη του σημείου όπου δυο κλαδιά ενώνονται ισούται με την απόσταση μεταξύ των ομάδων που αντιστοιχούν σε αυτά. Το banner plot απεικονίζει τις διαδοχικές συγχωνεύσεις από τα αριστερά προς τα δεξιά. Τα στοιχεία είναι διαταγμένα από την κορυφή προς το τέλος. Οι συγχωνεύσεις απεικονίζονται από οριζοντιες γραμμές του κατάλληλου μεγέθους το οποίο ταυτίζεται με το ύψος (height).

16 16 Οι πληροφορίες που μας δίνει το banner plot είναι ακριβώς οι ίδιες με αυτές που μας παρέχει το δενδρόγραμμα. Ενώ ο συσσωρευτικός αλγόριθμος ξεκινάει με πολλές ομάδες, οι οποίες συγχωνεύονται και καταλήγουν σε μια, αντίθετα μια διαιρετική διαδικασία ξεκινάει με μια ομάδα που περιέχει όλα τα στοιχεία και σταδιακά διαιρεί τις υπάρχουσες ο- μάδες, διαμορφώνοντας άλλες ομάδες. Το παράθυρο ρυθμίσεων είναι σχεδόν όμοιο με αυτό που έχουμε περιγράψει στο συσσωρευτικό αλγόριθμο ομαδοποίησης με τη μόνη διαφορά ότι εδώ δεν έχουμε τη δυνατότητα επιλογής μεθόδου όπως προηγούμενα. Η μέθοδος (εντολή) diana είναι και η μοναδική που υπολογίζει διαιρετικούς αλγόριθμους, διότι σχεδόν όλο το λογισμικό που υπάρχει σε ιεραρχικές μεθόδους αναλίσκεται σε συσσωρευτικούς αλγόριθμους. Η αρχική ομαδοποίηση (στο βήμα 0) περιέχει μια μεγάλη ομάδα αποτελούμενη από n στοιχεία, σε κάθε βήμα η μεγαλύτερη διαθέσιμη ομάδα διασπάται σε δυο μικρότερες ομάδες έως ότου όλες οι ομάδες να περιέχουν ένα μόνο στοιχείο. Η μέθοδος diana προσφέρει τη δυνατότητα να μας παρέχει το διαιρετικό συντελεστή (divisive coefficient), ο ο- ποίος μετράει τη δομή της ομαδοποίησης του συνόλου των δεδομένων. Για κάθε στοιχείο i, συμβολίζουμε με d(i) την διάμετρο της τελευταίας ομάδας όπου ανήκει (πριν διαμεριστεί στην μονομελή ομάδα), διαιρούμενη με την διάμετρο ολόκληρου του συνόλου των δεδομένων. Έτσι ο διαιρετικός συντελεστής (DC) ορίζεται ως ο μέσος όρος όλων των d(i). Όπως με τον AC στην προηγούμενη ενότητα με την μέθοδο agnes έτσι και ο DC αυξάνει όσο μεγαλώνει και το πλήθος των στοιχείων. Έτσι ο DC δεν μπορεί

17 17 να χρησιμοποιηθεί για την σύγκριση συνόλων δεδομένων με διαφορετικά μεγέθη. Τέλος υπάρχει η δυνατότητα παραγωγής γραφημάτων όμοια με αυτά της συσσωρευτικής διαδικασίας. Στην περίπτωση όπου όλες οι μεταβλητές σε ένα σύνολο δεδομένων είναι δίτιμες, ένας φυσικός τρόπος να ομαδοποιήσουμε τα στοιχεία, είναι να διαμερίσουμε τα δεδομένα σε δυο ομάδες βάσει των δυο τιμών μιας συγκεκριμένης δίτιμης μεταβλητής. Η μέθοδος Monothetic Analysis παράγει μια ιεράρχηση των ομάδων όπου σε κάθε βήμα μια ομάδα διαμερίζεται σε δυο υποομάδες βάσει των τιμών μιας από τις δίτιμες μεταβλητές. Στο παράθυρο των ρυθμίσεων μπορούμε να δηλώσουμε το όνομα του συνόλου των δεδομένων, στο οποίο σύνολο θα πρέπει να περιέχονται μόνο δίτιμες μεταβλητές. Επίσης ο αλγόριθμος μπορεί να δεχτεί ένα περιορισμένο αριθμό ελλιπών τιμών (NA-missing values), όπου κάθε γραμμή θα πρέπει να έχει το λιγότερο μια τιμή διαφορετική από NA. Ενας άλλος περιορισμός είναι ότι καμία μεταβλητή δεν μπορεί να έχει περισσότερες από τις μισές τιμές ΝΑ. Επίσης θα πρέπει να υπάρχει τουλάχιστον μια μεταβλητή η οποία δεν πρέπει να έχει ΝΑ τιμές. Τέλος η ανάλυση δεν επιτρέπει μια μεταβλητή να έχει όλες τις μη-ελλιπείς τιμές ίσες μεταξύ τους. Στην συνέχεια θα εξετάσουμε την παρουσίαση των αποτελεσμάτων μιας Monothetic Analysis, όπου υπεύθυνη είναι η εντολή mona. Σε αντίθεση με τις προηγούμενες μεθόδους οι οποίες μπορούν να δεχτούν εκτός από το πίνακα των στοιχείων και τον πίνακα των αποστάσεων τους, η μέθοδος mona επεξεργάζεται πίνακες δεδομένων με δίτιμες μεταβλητές. Για κάθε διαμέριση, η μέθοδος χρησιμοποιεί μια μόνο μεταβλητή σε κάθε βήμα και από εκεί προέρχεται και το όνομα της (Monothetic). Ο αλγόριθμος mona ξεκινάει από μια μεγάλη ομάδα και σε κάθε βήμα, μια διαθέσιμη ομάδα διαιρείται σύμφωνα με μια μόνο μεταβλητή.

18 18 Η ομάδα αυτή διασπάται σε δυο υποομάδες, μια όπου όλα τα στοιχεία της έχουν την τιμή 1 για την συγκεκριμένη μεταβλητή και μια άλλη όπου τα στοιχεία της έχουν την τιμή 0. Στα αποτελέσματα πρώτα εμφανίζεται ένας διορθωμένος πίνακας Revised data με τα δεδομένα μας όπου όλα είναι κωδικοποιημένα στις τιμές 0, 1 και έχουν αντικατασταθεί όλες οι ελλιπείς τιμές. Στη συνέχεια υπάρχει ένα διάνυσμα order, όπου είναι μια παραλλαγή της σειράς των αρχικών στοιχείων, με σκοπό να επιτρέπεται η σωστή σχεδίαση της ομαδοποίησης. Ένα άλλο διάνυσμα που υπάρχει στα αποτελέσματα είναι το variable όπου έχει n-1 στοιχεία, με n συμβολίζεται ο αριθμός των παρατηρήσεων του συνόλου δεδομένων και καθορίζει τις μεταβλητές που χρησιμοποιούνται στον διαχωρισμό των παρατηρήσεων. Τέλος μας δίνεται η πληροφορία από το διάνυσμα separation step (το οποιο έχει μήκος n-1) των βημάτων όπου συμβαίνει ο διαχωρισμός των παρατηρήσεων. Μια ακόμη σημαντική λειτουργία της Monothetic Analysis είναι η δημιουργία γραφήματος banner plot. Κλείνοντας αξίζει να αναφέρουμε ότι μέσω του S-plus υπάρχει η δυνατότητα πίνακα αποστάσεων(dissimilarity matrix) για ένα σύνολο δεδομένων. Επίσης υπάρχει η δυνατότητα, να υλοποιήσουμε κα ποιους αλγόριθμους ιεραρχικής ομαδοποίησης ακόμα και αν δεν διαθέτουμε τα αρχικά δεδομένα αλλά κάποιος μας έχει εφοδιάσει απλώς μα τον πίνακα αποστάσεων των ατόμων που θέλουμε να ομαδοποιήσουμε.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Ενότητα 5: Ανάλυση στοιχείων. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 6 : Μέτρα και διαδικασίες στην cluster. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ

ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ Είναι δυνατόν δύο βιοκοινότητες να έχουν τον ίδιο (ή σχεδόν τον ίδιο) δείκτη ποικιλότητας ειδών αν και τα είδη που συνθέτουν τη μία βιοκοινότητα να είναι -σε μεγάλο βαθμό ή και

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΜΕΘΟΔΟΙ ΕΥΡΕΣΗΣ ΒΕΛΤΙΣΤΟΥ ΠΛΗΘΟΥΣ ΟΜΑΔΩΝ ΓΙΑ ΠΟΛΥΔΙΑΣΤΑΤΑ ΔΕΔΟΜΕΝΑ

ΜΕΘΟΔΟΙ ΕΥΡΕΣΗΣ ΒΕΛΤΙΣΤΟΥ ΠΛΗΘΟΥΣ ΟΜΑΔΩΝ ΓΙΑ ΠΟΛΥΔΙΑΣΤΑΤΑ ΔΕΔΟΜΕΝΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕΘΟΔΟΙ ΕΥΡΕΣΗΣ ΒΕΛΤΙΣΤΟΥ ΠΛΗΘΟΥΣ ΟΜΑΔΩΝ ΓΙΑ ΠΟΛΥΔΙΑΣΤΑΤΑ ΔΕΔΟΜΕΝΑ Φανή Ζαφειροπούλου

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1) ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1) Εισαγωγή στο SPSS Παρουσίαση ποσοτικών και ποιοτικών δεδομένων Φίλιππος Ορφανός Εργαστήριο Υγιεινής, Επιδημιολογίας και Ιατρικής Στατιστικής, Πανεπιστήμιο Αθηνών orfanos@nut.uoa.gr

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές Στάθης Κλωνάρης 1. Εισαγωγή 2. Εισαγωγή Δεδομένων Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές 2. Διαχείριση μεταβλητών (Τύπος Ετικέτα, κωδικοποίηση

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 7 : Πολυδιάστατη Κλιμάκωση. Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

SPSS Statistical Package for the Social Sciences

SPSS Statistical Package for the Social Sciences SPSS Statistical Package for the Social Sciences Ξεκινώντας την εφαρμογή Εισαγωγή εδομένων Ορισμός Μεταβλητών Εισαγωγή περίπτωσης και μεταβλητής ιαγραφή περιπτώσεων ή και μεταβλητών ΣΤΑΤΙΣΤΙΚΗ Αθανάσιος

Διαβάστε περισσότερα

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη;

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης. Στην Κινηματική

Διαβάστε περισσότερα

Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ

Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης.

Διαβάστε περισσότερα

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ)

ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) «ΣΠ0ΥΔΑI», Τόμος 47, Τεύχος 3o-4o, Πανεπιστήμιο Πειραιώς / «SPOUDAI», Vol. 47, No 3-4, University of Piraeus ΑΠΟΣΤΑΣΕΙΣ ΓΙΑ ΤΗΝ ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΈΣ (ΤΑΞΙΝΟΜΗΣΗ ΣΕ ΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ) Υπό Γιάννης

Διαβάστε περισσότερα

Εισαγωγή στην Αριθμητική Ανάλυση

Εισαγωγή στην Αριθμητική Ανάλυση Εισαγωγή στην Αριθμητική Ανάλυση Εισαγωγή στη MATLAB ΔΙΔΑΣΚΩΝ: ΓΕΩΡΓΙΟΣ ΑΚΡΙΒΗΣ ΒΟΗΘΟΙ: ΔΗΜΗΤΡΙΑΔΗΣ ΣΩΚΡΑΤΗΣ, ΣΚΟΡΔΑ ΕΛΕΝΗ E-MAIL: SDIMITRIADIS@CS.UOI.GR, ESKORDA@CS.UOI.GR Τι είναι Matlab Είναι ένα περιβάλλον

Διαβάστε περισσότερα

Καθορισμός μεταβλητών και εισαγωγή δεδομένων

Καθορισμός μεταβλητών και εισαγωγή δεδομένων Καθορισμός μεταβλητών και εισαγωγή δεδομένων Καθορισμός μεταβλητών (variables) Το πρώτο βήμα κατά την εισαγωγή των δεδομένων είναι η δημιουργία των μεταβλητών. Ανοίγοντας το στατιστικό πρόγραμμα SPSS 12

Διαβάστε περισσότερα

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ 8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ Στόχος του εργαστηρίου αυτού είναι να δείξει πώς τα εργαστήρια με τα δεδομένα της ICAP μπορούν να υλοποιηθούν χωρίς τη χρήση SQL Server, χρησιμοποιώντας μόνον Excel και Rapid

Διαβάστε περισσότερα

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών Περιγραφική Ανάλυση ποσοτικών μεταβλητών Στο data file Worldsales.sav (αρχείο υποθετικών πωλήσεων ανά ήπειρο και προϊόν) Analyze Descriptive Statistics Frequencies Επιλογή μεταβλητής Revenue Πατάμε στο

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη;

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης. Στην Κινηματική

Διαβάστε περισσότερα

5.1.1 Περιγραφή των συστατικών τμημάτων ενός γραφήματος

5.1.1 Περιγραφή των συστατικών τμημάτων ενός γραφήματος 5. Γραφήματα 5.1 Εισαγωγή 5.1.1 Περιγραφή των συστατικών τμημάτων ενός γραφήματος Το Discoverer παρέχει μεγάλες δυνατότητες στη δημιουργία γραφημάτων, καθιστώντας δυνατή τη διαμόρφωση κάθε συστατικού μέρους

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Βάση δεδομένων είναι συσχετισμένα μεταξύ τους δεδομένα, οργανωμένα σε μορφή πίνακα. Οι γραμμές του πίνακα αποτελούν τις εγγραφές και περιλαμβάνουν τις πληροφορίες για μια οντότητα. Οι

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά;

1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά; Μονόμετρα ονομάζονται τα μεγέθη τα οποία, για να τα προσδιορίσουμε πλήρως, αρκεί να γνωρίζουμε

Διαβάστε περισσότερα

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Κεφάλαιο 4: Επιλογή σημείου παραγωγής Κ4.1 Μέθοδος ανάλυσης νεκρού σημείου για την επιλογή διαδικασίας παραγωγής ή σημείου παραγωγής Επιλογή διαδικασίας παραγωγής Η μέθοδος ανάλυσης νεκρού για την επιλογή διαδικασίας παραγωγής αναγνωρίζει

Διαβάστε περισσότερα

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία «Μετάδοση πληροφορίας σε ασύρµατο δίκτυο αισθητήρων µε οµαδοποιηµένους κόµβους και µε χρήση διευθύνσεων

Διαβάστε περισσότερα

Ταξινόμηση Δεδομένων. 9 η Εργαστηριακή Άσκηση (Excel)

Ταξινόμηση Δεδομένων. 9 η Εργαστηριακή Άσκηση (Excel) 9 η Εργαστηριακή Άσκηση (Excel) Ταξινόμηση Δεδομένων Μπορούμε να ταξινομήσουμε τα στοιχεία του πίνακα ανά πεδίο και με οποιαδήποτε σειρά. Η διαδικασία είναι η εξής: Κάνουμε κλικ μέσα σε κάποιο κελί στην

Διαβάστε περισσότερα

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΘΗΜΑ: Ανάλυση Πολυδιάστατων (Πολυμεταβλητών) Δεδομένων και Συστήματα Εξόρυξης Δεδομένων (Multivariate Data

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι

Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εξόρυξη Δεδομένων Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι 1 2 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση

Διαβάστε περισσότερα

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0 ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0 20130510 ΠΕΡΙΕΧΟΜΕΝΑ 1. Εγκατάσταση προγράμματος DCAD 2 2. Ενεργοποίηση Registration 2 3. DCAD 3 3.1 Εισαγωγή σημείων 3 3.2 Εξαγωγή σημείων 5 3.3 Στοιχεία ιδιοκτησίας

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 1ο Τι είναι το SPSS; Statistical Package for the Social Sciences Λογισμικό για διαχείριση και στατιστική ανάλυση δεδομένων σε γραφικό περιβάλλον http://en.wikipedia.org/wiki/spss

Διαβάστε περισσότερα

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Κεφάλαιο 4: Επιλογή σημείου παραγωγής Κεφάλαιο 4: Επιλογή σημείου παραγωγής Κ4.1 Μέθοδος ανάλυσης νεκρού σημείου για την επιλογή διαδικασίας παραγωγής ή σημείου παραγωγής Επιλογή διαδικασίας παραγωγής Η μέθοδος ανάλυσης νεκρού για την επιλογή

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Γ. Β Α Λ Α Τ Σ Ο Σ. 4ο ΓΥΜΝΑΣΙΟ ΛΑΜΙΑΣ 1. Γιώργος Βαλατσός Φυσικός Msc

Γ. Β Α Λ Α Τ Σ Ο Σ. 4ο ΓΥΜΝΑΣΙΟ ΛΑΜΙΑΣ 1. Γιώργος Βαλατσός Φυσικός Msc 4ο ΓΥΜΝΑΣΙΟ ΛΑΜΙΑΣ 1 1. Πότε τα σώματα θεωρούνται υλικά σημεία; Αναφέρεται παραδείγματα. Στη φυσική πολλές φορές είναι απαραίτητο να μελετήσουμε τα σώματα χωρίς να λάβουμε υπόψη τις διαστάσεις τους. Αυτό

Διαβάστε περισσότερα

Μαθηματικά Γ Γυμνασίου

Μαθηματικά Γ Γυμνασίου Α λ γ ε β ρ ι κ έ ς π α ρ α σ τ ά σ ε ι ς 1.1 Πράξεις με πραγματικούς αριθμούς (επαναλήψεις συμπληρώσεις) A. Οι πραγματικοί αριθμοί και οι πράξεις τους Διδακτικοί στόχοι Θυμάμαι ποιοι αριθμοί λέγονται

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία. Πέτρος Ποτίκας CoReLab 4/5/2006

Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία. Πέτρος Ποτίκας CoReLab 4/5/2006 Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία Πέτρος Ποτίκας CoReLab 4/5/2006 Επισκόπηση Ετικέτες σε συνιστώσες (Component labelling) Hough μετασχηματισμοί (transforms) Πλησιέστερος

Διαβάστε περισσότερα

Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης

Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται τρεις βασικές μέθοδοι πολυμεταβλητής ανάλυσης. Συγκεκριμένα θα παρουσιαστούν η παραγοντική ανάλυση, η ανάλυση συστάδων

Διαβάστε περισσότερα

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 1ο Τι είναι το SPSS; Statistical Package for the Social Sciences Λογισμικό για διαχείριση και στατιστική ανάλυση δεδομένων σε γραφικό περιβάλλον http://en.wikipedia.org/wiki/spss

Διαβάστε περισσότερα

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης Σύνολα Δεδομένων - Είδη Ποσοτικής Έρευνας: Παράλογες Ιδέες Γονέων (Δειγματοληπτική)

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Το πρόγραμμα συγχρηματοδοτείται 75% από το Ευρωπαϊκό κοινωνικό ταμείο και 25% από εθνικούς πόρους.

Το πρόγραμμα συγχρηματοδοτείται 75% από το Ευρωπαϊκό κοινωνικό ταμείο και 25% από εθνικούς πόρους. Το πρόγραμμα συγχρηματοδοτείται 75% από το Ευρωπαϊκό κοινωνικό ταμείο και 25% από εθνικούς πόρους. ΓΕΝΙΚΟ ΤΜΗΜΑ ΦΥΣΙΚΗΣ, ΧΗΜΕΙΑΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΛΙΚΩΝ ΕΡΓΑΣΤΗΡΙΑ ΦΥΣΙΚΗΣ ORIGIN ΕΙΣΑΓΩΓΙΚΟ ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Διαβάστε περισσότερα

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής

Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη. χρήση συναρτήσεων ομαδοποίησης κατά την εκτέλεση ενός ερωτήματος προβολής Εργαστήριο 8 ο Συγκεντρωτικά ερωτήματα Ερωτήματα διασταύρωσης Ερωτήματα Ενεργειών Συγκεντρωτικά ερωτήματα Τα συγκεντρωτικά ερωτήματα αφορούν στην ομαδοποίηση των δεδομένων και στη χρήση συναρτήσεων ομαδοποίησης

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Περιγραφική Στατιστική

Περιγραφική Στατιστική Περιγραφική Στατιστική Παναγιώτα Λάλου. Βασικές έννοιες Ορισμός: Στατιστικός πληθυσμός ονομάζεται το σύνολο των πειραματικών μονάδων π.χ άνθρωποι, ζώα, επιχειρήσεις κ.λπ, οι οποίες συμμετέχουν στην έρευνα

Διαβάστε περισσότερα

Σκοπός του μαθήματος

Σκοπός του μαθήματος Σκοπός του μαθήματος Στο μάθημα αυτό γίνεται εφαρμογή, με τη βοήθεια του υπολογιστή και τη χρήση του στατιστικού προγράμματος S.P.S.S., της στατιστικής θεωρίας που αναπτύχθηκε στα μαθήματα «Εισαγωγή στη

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ 1 Συναρτήσεις Όταν αναφερόμαστε σε μια συνάρτηση, ουσιαστικά αναφερόμαστε σε μια σχέση ή εξάρτηση. Στα μαθηματικά που θα μας απασχολήσουν, με απλά λόγια, η σχέση

Διαβάστε περισσότερα

8. Σύνθεση και ανάλυση δυνάμεων

8. Σύνθεση και ανάλυση δυνάμεων 8. Σύνθεση και ανάλυση δυνάμεων Βασική θεωρία Σύνθεση δυνάμεων Συνισταμένη Σύνθεση δυνάμεων είναι η διαδικασία με την οποία προσπαθούμε να προσδιορίσουμε τη δύναμη εκείνη που προκαλεί τα ίδια αποτελέσματα

Διαβάστε περισσότερα

Εφαρμοσμένη Ανάλυση Συστάδων

Εφαρμοσμένη Ανάλυση Συστάδων Σχολή Μηχανικών Παραγωγής και Διοίκησης Πρόγραμμα Μεταπτυχιακών Σπουδών ''Εφαρμοσμένα μαθηματικά για μηχανικούς'' ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Εφαρμοσμένη Ανάλυση Συστάδων (Applied Cluster Analysis) Στρατινάκης

Διαβάστε περισσότερα

Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο. Microsoft Excel Μέρος 1

Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο. Microsoft Excel Μέρος 1 Πανεπιστήμιο Κύπρου Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο ΕΠΛ001 Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο Microsoft Excel Μέρος 1 Παναγιώτης Χατζηχριστοδούλου

Διαβάστε περισσότερα

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ»

«ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΑΝΑΛΥΣΗ ΣΥΣΤΑΔΩΝ ΤΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΑΠΟ ΤΟΥΣ ΦΟΙΤΗΤΕΣ» Της σπουδάστριας ΚΑΤΣΑΡΟΥ ΧΑΡΙΚΛΕΙΑΣ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ

Διαβάστε περισσότερα

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX ΚΕΦΑΛΑΙΟ 3 ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX 3.1 Εισαγωγή Ο αλγόριθμος Simplex θεωρείται πλέον ως ένας κλασικός αλγόριθμος για την επίλυση γραμμικών προβλημάτων. Η πρακτική αποτελεσματικότητά του έχει

Διαβάστε περισσότερα

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. Πληθυσμός: Το συνόλου του οποίου τα στοιχεία εξετάζουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους. 1 Κεφάλαιο. ΣΤΑΤΙΣΤΙΚΗ Α. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στατιστική: ένα σύνολο αρχών και μεθοδολογιών για: το σχεδιασμό της διαδικασίας συλλογής δεδομένων τη συνοπτική και αποτελεσματική παρουσίασή τους την ανάλυση

Διαβάστε περισσότερα

Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο. Microsoft Excel Μέρος 1

Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο. Microsoft Excel Μέρος 1 Πανεπιστήμιο Κύπρου Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη της Πληροφορικής και Πληροφοριακά Συστήματα Εργαστήριο - ΕΠΛ003 Εισαγωγή στην Επιστήμη της Πληροφορικής Εργαστήριο Microsoft Excel Μέρος 1

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων... Μέρος 2 Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων... 211 Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων... 241 Kεφάλαιο 13 Ανάλυση δεδομένων... 257 Kεφάλαιο 14 Συναρτήσεις Μέρος Β... 285 Kεφάλαιο 15 Ευρετήριο

Διαβάστε περισσότερα

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL 1. Εισαγωγή δεδομένων σε φύλλο εργασίας του Microsoft Excel Για να τοποθετήσουμε τις μετρήσεις μας σε ένα φύλλο Excel, κάνουμε κλικ στο κελί στο οποίο θέλουμε να τοποθετήσουμε

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Αυτόματο Κλείσιμο Ισολογισμού

Αυτόματο Κλείσιμο Ισολογισμού Αυτόματο Κλείσιμο Ισολογισμού Το συγκεκριμένο εγχειρίδιο δημιουργήθηκε για να βοηθήσει την κατανόηση της διαδικασίας διαχείρισης Οδηγιών Αυτόματου Κλεισίματος Ισολογισμού στην εφαρμογή extra Λογιστική

Διαβάστε περισσότερα

10. Μη-κατευθυνόμενη ταξινόμηση ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ

10. Μη-κατευθυνόμενη ταξινόμηση ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ 1 2 3 1 ΚΑΤΗΓΟΡΊΕΣ ΤΑΞΙΝΌΜΗΣΗΣ Κατευθυνόμενη ταξινόμηση (supervised classification) Μη-κατευθυνόμενη ταξινόμηση (unsupervised classification) Γραμμική: Μη-Γραμμική: Ιεραρχική: Επιμεριστική:

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM ΚΕΦΑΛΑΙΟ 5 Matlab GUI για FWSVM και Global SVM Προκειμένου να γίνουν οι πειραματικές προσομοιώσεις του κεφαλαίου 4, αναπτύξαμε ένα γραφικό περιβάλλον (Graphical User Interface) που εξασφαλίζει την εύκολη

Διαβάστε περισσότερα

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11

Πίνακας περιεχομένων. Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων Κεφάλαιο 2 Συγκεντρωτικοί πίνακες Πρόλογος... 11 Πίνακας περιεχομένων Πρόλογος... 11 Κεφάλαιο 1 Λειτουργίες βάσης δεδομένων...13 1.1 Εισαγωγή... 13 1.2 Δημιουργία βάσης δεδομένων... 14 1.3 Ταξινόμηση βάσης δεδομένων... 16 1.4 Μερικά αθροίσματα... 20

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα,

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Ηλίας Κ. Σάββας Εξόρυξη Δεδομένων Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, Μετατροπή δεδομένων σε ΠΛΗΡΟΦΟΡΙΑ, Πολλά δεδομένα αποθηκευμένα

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ Θέμα Α ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ 2014-2015 Πάτρα 5/5/2015 Ονοματεπώνυμο:.. Α1. α. Να γράψετε στο τετράδιό σας τον

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

Ψευδοκώδικας. November 7, 2011

Ψευδοκώδικας. November 7, 2011 Ψευδοκώδικας November 7, 2011 Οι γλώσσες τύπου ψευδοκώδικα είναι ένας τρόπος περιγραφής αλγορίθμων. Δεν υπάρχει κανένας τυπικός ορισμός της έννοιας του ψευδοκώδικα όμως είναι κοινός τόπος ότι οποιαδήποτε

Διαβάστε περισσότερα

Σενάριο 18: Ραβδογράμματα Πληθυσμού

Σενάριο 18: Ραβδογράμματα Πληθυσμού Σενάριο 18: Ραβδογράμματα Πληθυσμού Φύλλο Εργασίας Τίτλος: Ραβδογράμματα Πληθυσμού Γνωστικό Αντικείμενο: Εφαρμογές Πληροφορικής-Υπολογιστών Διδακτική Ενότητα: Διερευνώ - Δημιουργώ Ανακαλύπτω, Συνθετικές

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Εργασία 2η Clustering

Αναγνώριση Προτύπων Εργασία 2η Clustering ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Αναγνώριση Προτύπων Εργασία 2η Clustering Κιντσάκης Αθανάσιος 6667 Μόσχογλου Στυλιανός 6978 18 Ιανουαρίου, 2013

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή Τεχνικές διαχωριστικής ομαδοποίησης: Ν πρότυπα k ομάδες Ν>>k Συνήθως k καθορίζεται από χρήστη Διαχωριστικές τεχνικές: επιτρέπουν πρότυπα να μετακινούνται από ομάδα σε

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C Επιμέλεια: Κ Μυλωνάκης ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΕΡΩΤΗΣΗ Τι ονομάζεται πραγματική συνάρτηση με πεδίο ορισμού το Α; Έστω Α ένα υποσύνολο του R Ονομάζουμε πραγματική συνάρτηση με πεδίο ορισμού το Α μια διαδικασία

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑΤΙΚΑ Β ΓΥΜΝΑΣΙΟΥ. ΜΕΡΟΣ 1ο ΑΛΓΕΒΡΑ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑΤΙΚΑ Β ΓΥΜΝΑΣΙΟΥ. ΜΕΡΟΣ 1ο ΑΛΓΕΒΡΑ 1. Τι καλείται μεταβλητή; ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑΤΙΑ Β ΓΥΜΝΑΣΙΟΥ ΜΕΡΟΣ 1ο ΑΛΓΕΒΡΑ Μεταβλητή είναι ένα γράμμα (π.χ., y, t, ) που το χρησιμοποιούμε για να παραστήσουμε ένα οποιοδήποτε στοιχείο ενός συνόλου..

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. Μ-Ν ΝΤΥΚΕΝ Ορισμός Σκοπός της Α.Κ.Σ. Η Α.Κ.Σ. εντάσσεται στις μεθόδους διερευνητικής ανάλυσης (exploratory) συνθετικών φαινόμενων (Παραγοντικές μεθόδοι).

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 03 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 2016-2017 1 1. Περιγραφική Ανάλυση Παρουσίαση

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση (clustering) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων

Διαβάστε περισσότερα

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

Προβλήματα, αλγόριθμοι, ψευδοκώδικας Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι

Διαβάστε περισσότερα

Στατιστικό κριτήριο χ 2

Στατιστικό κριτήριο χ 2 18 Μεθοδολογία Επιστηµονικής Έρευνας & Στατιστική Στατιστικό κριτήριο χ 2 Ο υπολογισµός του κριτηρίου χ 2 γίνεται µέσω του µενού [Statistics => Summarize => Crosstabs...]. Κατά τη συγκεκριµένη διαδικασία

Διαβάστε περισσότερα

Αθήνα, Απρίλιος 2018 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΚΩΝ

Αθήνα, Απρίλιος 2018 ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΚΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΟΙΚΟΝΟΜΙΚΩΝ Αθήνα, Απρίλιος 2018 ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΑΣ ΠΕΡΙΟΥΣΙΑΣ ΓΕΝΙΚΗ ΔΙΕΥΘΥΝΣΗ ΔΗΜΟΣΙΑΣ ΠΕΡΙΟΥΣΙΑΣ ΚΑΙ ΚΟΙΝΩΦΕΛΩΝ ΠΕΡΙΟΥΣΙΩΝ Διεύθυνση Τεχνικών Υπηρεσιών Τμήμα Α

Διαβάστε περισσότερα

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX Θεμελιώδης αλγόριθμος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού που κάνει χρήση της θεωρίας της Γραμμικής Άλγεβρας Προτάθηκε από το Dantzig (1947) και πλέον

Διαβάστε περισσότερα

E [ -x ^2 z] = E[x z]

E [ -x ^2 z] = E[x z] 1 1.ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτήν την διάλεξη θα πάμε στο φίλτρο με περισσότερες λεπτομέρειες, και θα παράσχουμε μια νέα παραγωγή για το φίλτρο Kalman, αυτή τη φορά βασισμένο στην ιδέα της γραμμικής

Διαβάστε περισσότερα