Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Εξόρυξη Δεδομένων. Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι"

Transcript

1 Εξόρυξη Δεδομένων Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι 1

2 2 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Σύνοψη

3 4 Βήματα Διαδικασίας Συσταδοποίησης

4 Τι είναι η Συσταδοποίηση; 5 Τι είναι η Συστάδα; Συστάδα είναι μια συλλογή από αντικείμενα δεδομένων τα οποία είναι: Όμοια (ή συσχετιζόμενα) μεταξύ τους μέσα στην ίδια ομάδα (συστάδα) Ανόμοια (ή μη-συσχετιζόμενα) με τα αντικείμενα σε άλλες ομάδες (συστάδες) Ανάλυση Συστάδων (ή συσταδοποίηση, ομαδοποίηση) Δεδομένου ενός συνόλου δεδομένων, να χωριστούν σε ένα σύνολο ομάδων (συστάδων) που είναι όσο το δυνατόν πιο όμοιες Η Ανάλυση Συστάδων είναι μέθοδος μη εποπτευόμενης μάθησης (δεν υπάρχουν προκαθορισμένες κλάσεις) Σε αντιδιαστολή με την κατηγοριοποίηση (εποπτευόμενη μάθηση) Τυπικοί τρόποι χρήσης / εφαρμογής της ανάλυσης συστάδων Ως αυτόνομο εργαλείο για μια προσέγγιση της κατανομής των δεδομένων, ή Ως προκαταρκτικό (ή ενδιάμεσο) βήμα για άλλους αλγόριθμους

5 6 Τι είναι συσταδοποίηση Εύρεση συστάδων (ομάδων) αντικειμένων έτσι ώστε τα αντικείμενα σε κάθε συστάδα να είναι όμοια (ή να σχετίζονται) και διαφορετικά (ή μη σχετιζόμενα) από τα αντικείμενα των άλλων συστάδων Οι αποστάσεις μέσα στη συστάδα ελαχιστοποιούνται Οι αποστάσεις ανάμεσα στις συστάδες μεγιστοποιούνται 3-διάστατα σημεία, ευκλείδεια απόσταση

6 7 Τι είναι Καλή Συσταδοποίηση; Μια καλή μέθοδος συσταδοποίησης παράγει υψηλής ποιότητας συστάδες που πρέπει να έχουν Υψηλή ομοιότητα εντός των κλάσεων: Συνοχή μέσα στις συστάδες Χαμηλή ομοιότητα μεταξύ των κλάσεων: Διαφοροποίηση μεταξύ συστάδων Συνάρτηση ποιότητας Υπάρχει ξεχωριστή συνάρτηση "ποιότητας" που μετρά το «πόσο καλή» είναι μια συστάδα Είναι δύσκολο να οριστεί η έννοια του "αρκετά παρόμοια" ή "αρκετά καλή" Η απάντηση είναι συνήθως πολύ υποκειμενική Υπάρχουν πολλά μέτρα ομοιότητας και / ή συναρτήσεις για διαφορετικές εφαρμογές Τα μέτρα ομοιότητας είναι κρίσιμα για την ανάλυση συστάδων

7 Ανάλυση Συστάδων: Εφαρμογές 8 Ένα κομβικό ενδιάμεσο βήμα για άλλες εργασίες εξόρυξης δεδομένων Δημιουργία μιας συμπαγούς σύνοψης δεδομένων για κατηγοριοποίηση, ανακάλυψη προτύπων, δημιουργία και δοκιμή υποθέσεων κ.λπ. Ανίχνευση ακραίων τιμών: Ακραίες τιμές-αυτές που είναι πολύ μακριά από οποιαδήποτε συστάδα Σύνοψη δεδομένων, συμπίεση και μείωση Π.χ. Επεξεργασία εικόνας: Κβαντοποίηση διανύσματος (vector quantization) Συνεργατικό φιλτράρισμα, συστήματα συστάσεων ή διαχωρισμός πελατών Εύρεση παρόμοιων χρηστών ή προϊόντων Δυναμική ανίχνευση τάσεων Ομαδοποίηση δεδομένων ροής και ανίχνευση τάσεων και μοτίβων Ανάλυση δεδομένων πολυμέσων, ανάλυση βιολογικών δεδομένων και δεδομένων κοινωνικών δικτύων Π.χ. ομαδοποίηση εικόνων ή κλιπ βίντεο / ήχου, ακολουθίες γονιδίων / πρωτεϊνών κ.λπ.

8 Παράγοντες της Ανάλυσης Συστάδων Κριτήρια Διαχωρισμού Διαχωρισμός ενός επιπέδου ή ιεραρχικός: (συχνά, είναι προτιμητέος ο ιεραρχικός διαχωρισμός πολλαπλών επιπέδων, π.χ., ομαδοποίηση θεματικών όρων) Διαχωρισμός συστάδων Αποκλειστική (π.χ. ένας πελάτης ανήκει σε μία μόνο περιοχή) Μη- Αποκλειστική (π.χ. ένα έγγραφο μπορεί να ανήκει σε περισσότερες από μία κατηγορίες) Μέτρο ομοιότητας Με βάση την απόσταση (π.χ. Ευκλείδεια απόσταση) Με βάση την συνδεσιμότητα (π.χ., πυκνότητα ή γειτνίαση) Χώρος συσταδοποίησης Ο πλήρης χώρος (συχνά όταν είναι χαμηλής διάστασης) Υπο-χώροι (συχνά σε συσταδοποίηση υψηλής διάστασης) 9

9 Απαιτήσεις και Προκλήσεις Ποιότητα Ικανότητα αντιμετώπισης διαφορετικών τύπων χαρακτηριστικών: Αριθμητικά, κατηγορηματικά, κειμένου, πολυμέσα, δίκτυα και μείγμα πολλαπλών τύπων Ανακάλυψη συστάδων με αυθαίρετο σχήμα Ικανότητα αντιμετώπισης θορυβωδών δεδομένων Ευελιξία Ομαδοποίηση όλων των δεδομένων αντί μόνο δειγμάτων Υψηλή διάσταση (dimensionality) Σταδιακή συσταδοποίηση ή συσταδοποίηση ρευμάτων και μη ευαισθησία στην σειρά εισαγωγής Συσταδοποίηση βασισμένη σε περιορισμούς Προτιμήσεις ή περιορισμοί που δίδονται από τον χρήστη: γνωστικό πεδίο; ερωτήματα χρηστών Ερμηνεία και χρηστικότητα Οι συστάδες που δημιουργούνται πρέπει να έχουν σημασία και να είναι χρήσιμες 10

10 11 Είδη συσταδοποίησης Βασική διάκριση Διαχωριστική (partitional) Ιεραρχική (hierarchical) Διαχωριστική Συσταδοποίηση (Partitional Clustering) Ένας διαμερισμός των αντικειμένων σε μη επικαλυπτόμενα υποσύνολα (συστάδες) τέτοιος ώστε κάθε αντικείμενο να ανήκει σε ακριβώς ένα υποσύνολο Ιεραρχική Συσταδοποίηση (Hierarchical clustering Ένα σύνολο από εμφωλευμένες (nested) ομάδες Επιτρέπεται σε μια συστάδα να έχει υπο-συστάδες οργανωμένες σε ένα ιεραρχικό δέντρο

11 12 Διαχωριστική και Ιεραρχική Συσταδοποίηση Αρχικά Σημεία

12 13 Διαχωριστική και Ιεραρχική Συσταδοποίηση Διαχωριστική Συσταδοποίηση p1 p2 p3 p4 p1 p3 p4 p2 Ιεραρχική Συσταδοποίηση p1 p2 p3 p4 Παραδοσιακό Δένδρο-γράμμα (Dendrogram) Φύλλα: απλά σημεία ή απλές συστάδες Ως ακολουθία διαχωριστικών Να «κόψουμε» το δέντρο

13 Τύποι συστάδων: Καλώς Διαχωρισμένες Συστάδες Συστάδα: ένα σύνολο από σημεία τέτοια ώστε κάθε σημείο μιας συστάδας είναι κοντινότερο σε (ή πιο όμοιο με) όλα τα άλλα σημεία της συστάδας από ότι σε οποιοδήποτε άλλο σημείο που δεν ανήκει στη συστάδα. Συχνά υπάρχει η έννοια του κατωφλιού (threshold) Όχι απαραίτητα κυκλικές (οποιοδήποτε σχήμα) 3 καλώς-διαχωρισμένες συστάδες 14

14 Τύποι συστάδων: Συστάδες βασισμένες σε κέντρο ή πρότυπο Μια συστάδα είναι ένα σύνολο από αντικείμενα τέτοιο ώστε ένα αντικείμενο στην συστάδα είναι κοντινότερο σε (ή πιο όμοιο με) το «κέντρο» ή πρότυπο της συστάδας από ότι από το κέντρο οποιασδήποτε άλλης συστάδας. Το κέντρο της ομάδας είναι συχνά centroid, ο μέσος όρος των σημείων της συστάδας, ή medoid, το πιο «αντιπροσωπευτικό» σημείο της συστάδας (για κατηγορικά γνωρίσματα) 4 συστάδες βασισμένες σε κέντρο -Τείνουν να είναι κυκλικές 15

15 Τύποι συστάδων: Συνεχής Συστάδες Συνεχείς Συστάδες Κοντινότερος γείτονας ή βάσει γειτνίασης Συχνά σε περιπτώσεις συστάδων με μη κανονικό σχήμα ή με αλληλοπλεκόμενα σχήματα ή για γραφήματα με συνεκτικά υπογραφήματα Πρόβλημα με θόρυβο 8 συνεχείς συστάδες 16

16 Τύποι συστάδων: Συστάδες βασισμένες στην πυκνότητα Μια συστάδα είναι μια πυκνή περιοχή από σημεία την οποία χωρίζουν από άλλες περιοχές μεγάλης πυκνότητας περιοχές χαμηλής πυκνότητας Συχνά σε περιπτώσεις συστάδων με ακανόνιστο σχήμα ή με αλληλοπλεκόμενα σχήματα ή όταν υπάρχει θόρυβος ή ακραίες τιμές 6 συστάδες βασισμένες στην πυκνότητα 17

17 20 Γενικές Απαιτήσεις Αντιμετώπιση θορύβου και ακραίων τιμών συστάδα Ακραίες τιμές Ακραίες τιμές: τιμές που είναι εξαιρέσεις ως προς τις συνηθισμένες ή αναμενόμενες τιμές

18 Άλλες Διακρίσεις Μεταξύ Συστάδων Αποκλειστική Επικαλυπτόμενη Ένα σημείο ανήκει σε περισσότερες από μια συστάδες (πχ οριακά σημεία) Ασαφής συσταδοποίηση Ένα σημείο ανήκει σε κάθε συστάδα με κάποιο βάρος μεταξύ του 0 και του 1 Συχνά τα βάρη για κάθε σημείο έχουν άθροισμα 1 Πλήρης ή Μερική Ομαδοποίηση μόνο για κάποια από τα δεδομένα (αποκλεισμός θορύβου, ακραίων τιμών ή μη ενδιαφέρουσας πληροφορίας) Ομογενής ή Ετερογενής Συστάδες με πολύ διαφορετικά μεγέθη, σχήματα και πυκνότητα 21

19 22 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Σύνοψη

20 23 Μέθοδοι Διαχωρισμού Βασικές έννοιες αλγορίθμων διαχωρισμού Η μέθοδος συσταδοποίησης Κ-Μέσων (K-Means) Αρχικοποίηση της συσταδοποίησης Κ-Μέσων Η μέθοδος συσταδοποίησης K-Medoids Οι μέθοδοι συσταδοποίησης K-Medians και K-Modes

21 24 Αλγόριθμοι Διαχωρισμού Μέθοδος Διαχωρισμού: Εύρεση των συστάδων στα δεδομένα με τη βελτίωση μιας συγκεκριμένης αντικειμενικής συνάρτησης και βελτιώνοντας επαναληπτικά την ποιότητα του διαχωρισμού Μέθοδος K-διαχωρισμού: Διαχωρισμός ενός συνόλου δεδομένων D από n αντικείμενα σε ένα σύνολο K συστάδων ώστε να βελτιστοποιείται μια αντικειμενική συνάρτηση (π.χ., ελαχιστοποίηση του αθροίσματος των τετραγώνων των αποστάσεων, όπου c k το κέντρο (centroid ή medoid) της συστάδας C k ) Μια τυπική αντικειμενική συνάρτηση: Sum of Squared Errors (SSE) K SSE( C) = x c k= 1 x i C k Διατύπωση προβλήματος: Δεδομένου του K, να βρεθεί μια διαμέριση σε K συστάδες που βελτιστοποιούν το επιλεγμένο κριτήριο κατάτμησης Καθολικό βέλτιστο: Χρειάζεται να απαριθμηθούν εξαντλητικά όλες οι κατατμήσεις Ευρετικές Μέθοδοι (άπληστοι αλγόριθμοι): K-Means, K-Medians, K-Medoids, etc. i k 2

22 Η Μέθοδος Συσταδοποίησης K-Μέσων Κ-Μέσων (K-Means) (MacQueen 67, Lloyd 57/ 82) Κάθε συστάδα αντιπροσωπεύεται από το κέντρο της συστάδας Δεδομένου του K (αριθμός συστάδων) ο αλγόριθμος K-Μέσων περιγράφεται ως εξής: Επιλογή K σημείων ως αρχικών κέντρων (centroids) Επανάληψη Δημιουργία K συστάδων με αντιστοίχιση του κάθε σημείου στο πιο κοντινό κέντρο Επανυπολογισμός του κέντρου για κάθε συστάδα Μέχρι να ικανοποιηθεί κάποιο κριτήριο σύγκλισης (π.χ. να μην αλλάζουν τα κέντρα) Μπορούν να χρησιμοποιηθούν διάφορα είδη μέτρων Απόσταση Manhattan (L 1 norm), Euclidean απόσταση (L 2 norm), Ομοιότητα συνημιτόνου 25

23 Παράδειγμα: Συσταδοποίηση K-Μέσων Αντιστοίχιση σημείων στις συστάδες Επανυπολογισμός των κέντρων των συστάδων Τυχαία επιλογή K = 2 σημείων (centroids) Νέα αντιστοίχιση σημείων Αλγόριθμος Συσταδοποίησης Κ-Μέσων 26 Επιλογή K σημείων ως αρχικών κέντρων των συστάδων Επανάληψη Δημιουργία K συστάδων με αντιστοίχιση του κάθε σημείου στο πιο κοντινό κέντρο Επανυπολογισμός του κέντρου για κάθε συστάδα Μέχρι να ικανοποιηθεί κάποιο κριτήριο σύγκλισης

24 27 Παρατηρήσεις για την K-Μέσων Αποδοτικότητα: O(tKn) όπου n: # αντικειμένων, K: # συστάδων, και t: # επαναλήψεων Η K-Μέσων συχνά τερματίζει σε τοπικό μέγιστο Οι αρχικές τιμές μπορεί να είναι σημαντικές για την εύρεση συστάδων υψηλής ποιότητας Χρειάζεται να οριστεί το K, ο αριθμός των κλάσεων, εκ των προτέρων Υπάρχουν τρόποι για τον αυτόματο προσδιορισμό του «καλύτερου» K Στην πράξη, δοκιμάζονται διάφορες τιμές και επιλέγετε η «καλύτερη» Ευαίσθητη σε θορυβώδη δεδομένα και ακραίες τιμές Παραλλαγές: Χρήση K-medians, K-medoids, κλπ. Η K-Μέσων εφαρμόζεται μόνο σε αντικείμενα σε συνεχή n-διάστατο χώρο Χρήση της K-modes για κατηγορικά δεδομένα Δεν είναι κατάλληλη για την ανακάλυψη συστάδων με μη κυρτά σχήματα Χρήση συσταδοποίησης με βάση την πυκνότητα, πυρήνας K-Μέσων, κλπ.

25 Παραλλαγές της Μεθόδου K-Μέσων Υπάρχουν διάφορες παραλλαγές της μεθόδου K-Μέσων, που διαφέρουν από διαφορετικές απόψεις Επιλογή καλύτερων αρχικών κεντρικών σημείων K-means++, Intelligent K-Means, Genetic K-Means Επιλογή διαφορετικών αντιπροσωπευτικών πρωτότυπων για τις συστάδες K-Medoids, K-Medians, K-Modes Εφαρμογή τεχνικών μετασχηματισμού χαρακτηριστικών Weighted K-Means, Kernel K-Means 28

26 29 Κακή Αρχική Επιλογή των Κ Σημείων Μπορεί να Οδηγήσει σε Κακή Συσταδοποίηση Άλλη τυχαία επιλογή Κ μέσων για τα ίδια σημεία δεδομένων Επανάληψη της K-Μέσων χρησιμοποιώντας άλλα τυχαία Κ αρχικά σημεία Δημιουργεί μια συσταδοποίηση κακής ποιότητας

27 Αρχικές Τιμές των K-Μέσων: Πρόβλημα και Λύση Διαφορετικές αρχικές τιμές μπορεί να δημιουργήσουν διαφορετικές συσταδοποιήσεις (μερικές πολύ μακριά από τις βέλτιστες) Η αρχική πρόταση (MacQueen 67): Επιλογή K τυχαίων μέσων Απαιτούνται πολλές επαναλήψεις με διαφορετικές αρχικές τιμές Υπάρχουν πολλές μέθοδοι που προτείνουν καλύτερες αρχικές τιμές των k μέσων K-Means++ (Arthur & Vassilvitskii 07): Ο πρώτος μέσος επιλέγεται τυχαία Ο επόμενος που επιλέγεται είναι αυτός που βρίσκεται πιο μακριά από αυτόν που έχει επιλεγεί (η επιλογή βασίζεται σε σταθμισμένη τιμή πιθανότητας) Η επιλογή συνεχίζεται μέχρι να επιλεγούν K μέσοι 30

28 31 Ακραίες Τιμές: Από τον K-Means στον K-Medoids Ο αλγόριθμος K-Μέσων είναι ευαίσθητος στις ακραίες τιμές! οπότε ένα αντικείμενο με εξαιρετικά μεγάλη τιμή μπορεί να παραμορφώσει ουσιαστικά την κατανομή των δεδομένων K-Medoids: Αντί για τη μέση τιμή (mean) του αντικειμένου στη συστάδα μπορεί να χρησιμοποιηθεί το medoids, το οποίο είναι το αντικείμενο που βρίσκεται πιο κεντρικά στην συστάδα Ο αλγόριθμος συσταδοποίησης K-Medoids: Επιλογή K σημείων ως αρχικών αντικείμενων (δηλ., ως αρχικών K medoids) Επανάληψη Αντιστοίχιση κάθε σημείου στη συστάδα με το πλησιέστερο medoid Τυχαία επιλογή ενός μη αντιπροσωπευτικού αντικειμένου o i Υπολογισμός συνολικού κόστους S για την εναλλαγή του medoid m με το o i Εάν S < 0, τότε εναλλαγή m με o i για σχηματισμό νέου συνόλου medoids Μέχρι να ικανοποιηθεί το κριτήριο σύγκλισης

29 PAM: Ένας Τυπικός K-Medoids Αλγόριθμος K = 2 Τυχαία αρχική επιλογή K medoids Επανάληψη Αντικατάσταση αντικειμένου Ανταλλαγή medoid m με o i αν βελτιώνει την ποιότητα της συστάδας Μέχρι να ικανοποιηθεί κάποιο κριτήριο σύγκλισης Τυχαία επιλογή K αντικειμένων ως αρχικών medoids Ανταλλαγή O και O ramdom Αν βελτιώνεται η ποιότητα Αντιστοίχιση όλων των υπολοίπων σημείων στο πιο κοντινό medoids Υπολογισμός συνολικού κόστους ανταλλαγής Τυχαία επιλογή ενός μηmedoid αντικειμένου, O ramdom

30 33 Συσταδοποίηση K-Medoids Συσταδοποίηση K-Medoids: Βρίσκει αντιπροσωπευτικά αντικείμενα (medoids) στις συστάδες PAM (Partitioning Around Medoids) Αρχίζει από ένα αρχικό σύνολο medoids, και Επαναληπτικά αντικαθιστά ένα από τα medoids από ένα από τα μη- medoids αν βελτιώνεται το συνολικό άθροισμα των τετραγωνικών σφαλμάτων (SSE) της συσταδοποίησης που προκύπτει Η PAM λειτουργεί αποτελεσματικά για μικρά σύνολα δεδομένων, αλλά δεν είναι κατάλληλη για μεγάλα σύνολα δεδομένων (λόγω της υπολογιστικής της πολυπλοκότητας) Υπολογιστική πολυπλοκότητα: PAM: O(K(n K) 2 ) (αρκετά ακριβή!)

31 K-Medians: Χειρισμός Ακραίων Τιμών 34 Οι διάμεσοι (medians) είναι λιγότερο ευαίσθητοι στις ακραίες τιμές από τους μέσους Σκεφτείτε το διάμεσο μισθό έναντι του μέσου μισθού μιας μεγάλης επιχείρησης, όταν προσθέσετε μερικά κορυφαία στελέχη! K-Medians: Αντί για τη μέση τιμή του αντικειμένου στην κλάση ως σημείου αναφοράς, χρησιμοποιούνται οι διάμεσοι (L 1 -norm ως μέτρο απόστασης) Η συνάρτηση κριτήριο για τον αλγόριθμο K-Medians: Ο αλγόριθμος συσταδοποίησης K-Medians: Επιλογή K σημείων ως αρχικών αντικειμένων (ως αρχικών K διαμέσων) Επανάληψη Αντιστοίχιση του κάθε σημείου στον πιο κοντινό διάμεσο Επαναπροσδιορισμός του διάμεσου με τη χρήση της διάμεσης τιμής κάθε επιμέρους χαρακτηριστικού Μέχρι να ικανοποιηθεί κάποιο κριτήριο σύγκλισης K S = x med k= 1 x i C k ij kj

32 35 K-Modes: Συσταδοποίηση Κατηγορικών Δεδομένων Ο K-Μέσων δεν μπορεί να χειριστεί μη-αριθμητικά (κατηγορικά) δεδομένα Η αντιστοίχιση της κατηγορικής τιμής σε 1/0 δεν μπορεί να δημιουργήσει ποιοτικές συστάδες K-Modes: Μια επέκταση του K-Means με την αντικατάσταση των μέσων των κλάσεων με την Επικρατούσα Τιμή Επικρατούσα Τιμή (Mode): Η τιμή που εμφανίζεται πιο συχνά σε ένα σύνολο τιμών Μέτρο ανομοιότητας μεταξύ αντικειμένου X και του κέντρου της συστάδας Z Φ(x j, z j ) = 1 n jr /n l όπου x j = z j ; 1 όταν x j ǂ z j όπου z j η κατηγορική τιμή του χαρακτηριστικού j στο Z l, n l ο αριθμός των αντικειμένων στη συστάδα l, και n jr ο αριθμός των αντικειμένων με τιμή χαρακτηριστικού r Αυτό το μέτρο ανομοιότητας (συνάρτηση απόστασης) βασίζεται σε συχνότητα Ο αλγόριθμος εξακολουθεί να βασίζεται στην επαναληπτική αντιστοίχιση αντικειμένων της συστάδας και την επικαιροποίηση των centroid

33 36 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Σύνοψη

34 37 Ιεραρχική Συσταδοποίηση: Βασικές Έννοιες Ιεραρχική Συσταδοποίηση Δημιουργεί ιεραρχία συστάδων (σχεδιασμένη ως δενδρόγραμμα) Δεν χρειάζεται να οριστεί ο αριθμός των συστάδων K Πιο ντετερμινιστική Δίνει το ίδιο αποτέλεσμα Όχι επαναληπτική βελτίωση Δύο κατηγορίες αλγορίθμων: Step 0 Step 1 Step 2 Step 3 Step 4 a b c d e a b d e c d e a b c d e Step 4 Step 3 Step 2 Step 1 Step 0 Συσσωρευτική (Agglomerative): Ξεκινά με τα σημεία ως ξεχωριστές συστάδες και επαναληπτικά συγχωνεύει τα πιο κοντινά ζεύγη συστάδων δημιουργώντας μια ιεραρχία από κάτω προς τα πάνω Συσσωρευτική (AGNES) Διαιρετική (Divisive): Ξεκινά με μια συστάδα με όλα τα σημεία και τη διασπά συνεχόμενα μέχρι να απομείνουν μεμονωμένες συστάδες ξεχωριστών σημείων δημιουργώντας μια ιεραρχία από πάνω προς τα κάτω Διαιρετική (DIANA)

35 38 Δενδρόγραμμα: Πως συντίθενται οι Συστάδες Δενδρόγραμμα (Dendrogram): Αποσυνθέτει ένα σύνολο δεδομένων σε ένα δέντρο από συστάδες με εμφωλευμένη διαίρεση σε πολλά επίπεδα Μια συστάδα δεδομένων δημιουργείται με το κόψιμο του δενδρογράμματος στο επιθυμητό επίπεδο, κατόπιν κάθε συνδεδεμένο στοιχείο σχηματίζει μια συστάδα Η Ιεραρχική συσταδοποίηση δημιουργεί ένα δενδρόγραμμα (μια ιεραρχία συστάδων)

36 39 Συσσωρευτικός Αλγόριθμος Συσταδοποίησης AGNES (AGglomerative NESting) (Kaufmann and Rousseeuw, 1990) Χρησιμοποιεί τη μέθοδο μονής ζεύξης και τον πίνακα ανομοιότητας Συνεχώς συγχωνεύει κόμβους που έχουν τη μικρότερη ανομοιογένεια Τελικά όλοι οι κόμβοι ανήκουν στην ίδια συστάδα Η Συσσωρευτική Συσταδοποίηση ποικίλει ανάλογα με τα μέτρα ομοιότητας μεταξύ των συστάδων Μονή ζεύξη (πλησιέστερος γείτονας) Μέση ζεύξη (μέσος όρος ομάδας) Πλήρης ζεύξη (διάμετρος) Centroid ζεύξη (ομοιότητα centroid)

37 Μονή και Πλήρης Ζεύξη Μονή ζεύξη (πλησιέστερος γείτονας) Η ομοιότητα μεταξύ δύο συστάδων είναι η ομοιότητα μεταξύ των πιο παρόμοιων μελών (πλησιέστερων γειτόνων) X X Βασισμένο στην τοπική ομοιότητα: Δίνει έμφαση στις κοντινές περιοχές αγνοώντας τη συνολική δομή της συστάδας Δυνατότητα συσταδοποίησης ομάδων αντικειμένων μη ελλειπτικού σχήματος Ευαίσθητη στο θόρυβο και τις ακραίες τιμές Πλήρης ζεύξη (διάμετρος) Η ομοιότητα μεταξύ δύο συστάδων είναι η ομοιότητα μεταξύ των πιο ανόμοιων μελών X X Συγχώνευση δύο συστάδων για το σχηματισμό μίας με τη μικρότερη διάμετρο Μη τοπική συμπεριφορά, δημιουργεί συστάδες συμπαγούς σχήματος 40

38 41 Μέση Ζεύξη και Ζεύξη Κέντρων Μέση Ζεύξη Η μέση απόσταση μεταξύ ενός στοιχείου σε μια συστάδα και ενός στοιχείου στην άλλη (δηλ., όλα τα ζεύγη σε δύο συστάδες) Ακριβή υπολογιστικά Ζεύξη Κέντρων (Centroid) Η απόσταση μεταξύ των κέντρων (centroids) δύο συστάδων Group Averaged Agglomerative Clustering (GAAC) Έστω δύο συστάδες C a και C b συγχωνεύονται στην C aub. Το νέο κέντρο είναι: c Το N a είναι η πληθικότητα της συστάδας C a, και c a το κέντρο της C a Το μέτρο ομοιότητας για την GAAC είναι ο μέσος όρος των αποστάσεων a b X X = C a : N a C b : N b X X N c N a a b b a + N c + N b

39 Διαιρετική Συσταδοποίηση DIANA (Divisive Analysis) (Kaufmann and Rousseeuw,1990) Υλοποιείται σε μερικά πακέτα στατιστικής ανάλυσης, π.χ. Splus Αντίστροφη σειρά από την AGNES: Τελικά κάθε κόμβος σχηματίζει μια συστάδα από μόνος του Η Διαιρετική Συσταδοποίηση είναι μια προσέγγιση από πάνω προς τα κάτω Η διαδικασία ξεκινά από τη ρίζα με όλα τα σημεία ως μια συστάδα Αναδρομικά διαιρεί τις υψηλότερου επιπέδου συστάδες για να δημιουργήσει το δενδρόγραμμα Μπορεί να θεωρηθεί ως μια καθολική (global) προσέγγιση Πιο αποτελεσματική σε σύγκριση με τη συσσωρευτική συσταδοποίηση

40 43 Διαιρετική Συσταδοποίηση Επιλογή της συστάδας που θα διαχωριστεί Έλεγχος των αθροισμάτων των τετραγωνικών σφαλμάτων των συστάδων και επιλογή αυτής με τη μεγαλύτερη τιμή Κριτήριο διαίρεσης: Καθορισμός του τρόπου διαίρεσης Χρήση του κριτηρίου Ward για προσπάθεια μεγαλύτερης μείωσης της διαφοράς στο κριτήριο SSE ως αποτέλεσμα της διάσπασης Για τα κατηγορικά δεδομένα, μπορεί να χρησιμοποιηθεί ο δείκτης Gini Διαχείριση θορύβου Χρήση ενός κατωφλίου για τον καθορισμό του κριτήριου τερματισμού, ώστε να μη δημιουργηθούν πολύ μικρές συστάδες επειδή περιέχουν θόρυβο.

41 44 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Σύνοψη

42 45 Μέθοδοι Βασισμένοι στην Πυκνότητα Συσταδοποίηση με βάση την πυκνότητα (ένα τοπικό κριτήριο συστάδων), όπως τα σημεία πυκνότητας Κύρια χαρακτηριστικά: Ανακάλυψη συστάδων αυθαίρετου σχήματος Χειρισμός θορύβου Μια σάρωση: εξετάζεται μόνο η τοπική περιοχή για την εύρεση της πυκνότητας Χρειάζονται παράμετροι πυκνότητας ως συνθήκη τερματισμού Διάφοροι ενδιαφέροντες αλγόριθμοι: DBSCAN: Ester, et al. (KDD 96) OPTICS: Ankerst, et al (SIGMOD 99) DENCLUE: Hinneburg & D. Keim (KDD 98) CLIQUE: Agrawal, et al. (SIGMOD 98)

43 46 DBSCAN DBSCAN: Density-Based Spatial Clustering of Applications with Noise Ανακαλύπτει συστάδες αυθαίρετου σχήματος Έννοια της συστάδας που βασίζεται στην πυκνότητα Μια συστάδα ορίζεται ως ένα μέγιστο σύνολο σημείων που συνδέονται με πυκνότητα Δύο παράμετροι: Eps(ε): Μέγιστη ακτίνα της γειτονιάς MinPts: Ελάχιστος αριθμός σημείων στην Eps-γειτονιά ενός σημείου Η Eps(ε)-γειτονιά ενός σημείου q: N Eps (q): {p ανήκει στο D dist(p, q) Eps} Όριο Πυρήνας q p MinPts = 5 Eps = 1 cm Ακραίο σημείο Outlier/θόρυβος: εκτός συστάδας Σημείο πυρήνας: πυκνή γειτνίαση Οριακό σημείο: στην συστάδα αλλά όχι με πυκνή γειτνίαση

44 DBSCAN: Density-Reachable and Density-Connected Άμεσα Προσβάσιμο μέσω Πυκνότητας: Ένα σημείο p είναι άμεσα προσβάσιμο μέσω πυκνότητας από ένα σημείο q, όσον αφορά τα Eps(ε), MinPts, αν p ανήκει στο N Eps (q) συνθήκη σημείου πυρήνα (core point) : N Eps (q) MinPts Προσβάσιμο μέσω Πυκνότητας: q p MinPts = 5 Eps = 1 cm p Ένα σημείο p είναι προσβάσιμο μέσω πυκνότητας από ένα σημείο q, όσον αφορά τα Eps(ε), MinPts, αν υπάρχει μια αλυσίδα σημείων p 1,, p n, p 1 = q, p n = p έτσι ώστε p i+1 είναι άμεσα προσβάσιμο μέσω πυκνότητας από το p i Συνδεδεμένο μέσω Πυκνότητας: p q p 2 q Ένα σημείο p είναι συνδεδεμένο μέσω πυκνότητας με ένα σημείο q, όσον αφορά τα Eps, MinPts, αν υπάρχει ένα σημείο o τέτοιο ώστε τόσο το p όσο και το q είναι προσβάσιμα μέσω πυκνότητας από το o, όσον αφορά τα Eps, MinPts o 47

45 48 Αλγόριθμος DBSCAN Αλγόριθμος Τυχαία επιλογή ενός σημείου p Ανάκτηση όλων των σημείων που είναι προσβάσιμα μέσω πυκνότητας από το p, όσον αφορά τα Eps και MinPts Αν το p είναι ένα σημείο πυρήνα, έχει σχηματιστεί συστάδα Εάν το p είναι ένα οριακό σημείο, κανένα σημείο δεν είναι προσβάσιμο μέσω πυκνότητας από το p, και η DBSCAN επισκέπτεται το επόμενο σημείο Η διαδικασία συνεχίζεται μέχρι να επεξεργαστούν όλα τα σημεία Όριο Πυρήνας Ακραίο σημείο Outlier/θόρυβος: εκτός συστάδας Σημείο πυρήνας: πυκνή γειτνίαση Οριακό σημείο: στην συστάδα αλλά όχι με πυκνή γειτνίαση

46 49 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση και Επικύρωση Σύνοψη

47 50 Αξιολόγηση και Επικύρωση Συσταδοποίησης Αξιολόγηση και Επικύρωση: Μετρώντας την Ποιότητα της Συσταδοποίησης Εξωτερικά Μέτρα για Επικύρωση της Συσταδοποίησης I: Μέτρα που βασίζονται σε αντιστοίχιση ΙΙ: Μέτρα που βασίζονται στην εντροπία ΙΙΙ: Μέτρα σύγκρισης κατά ζεύγη Εσωτερικά Μέτρα για Επικύρωση της Συσταδοποίησης Σταθερότητα της Συσταδοποίησης Τάση τη Συσταδοποίησης

48 Αξιολόγηση και Επικύρωση Συσταδοποίησης Αξιολόγηση της Συσταδοποίησης Αξιολόγηση του «πόσο καλή» είναι η συσταδοποίηση Σταθερότητα της Συσταδοποίησης Κατανόηση της ευαισθησίας της Συσταδοποίησης σε διάφορες παραμέτρους του αλγορίθμου, π.χ., # συστάδων Τάση της Συσταδοποίησης Αξιολόγηση της καταλληλότητας της Συσταδοποίησης, δηλαδή εάν τα δεδομένα έχουν οποιαδήποτε εγγενή δομή ομαδοποίησης 51

49 Μέτρηση της Ποιότητας της Συσταδοποίησης Αξιολόγηση Συσταδοποίησης: Αξιολόγηση του «πόσο καλή» είναι η συσταδοποίηση Στην πράξη, δεν υπάρχει κοινώς αναγνωρισμένο πλέον κατάλληλο μέτρο Εξωτερική: Εποπτευόμενη, χρησιμοποιεί κριτήρια που δεν είναι εγγενή στο σύνολο δεδομένων Συγκρίνει μια συσταδοποίηση με βάση προηγούμενη γνώση ή τη γνώση των ειδικών (συσταδοποίηση αναφοράς) με τη χρήση κάποιου μέτρου ποιότητας Εσωτερική: Μη επιτηρούμενη, κριτήρια που προέρχονται από τα ίδια τα δεδομένα Πόσο καλά διαχωρίζονται οι συστάδες και πόσο συμπαγείς είναι Σχετική: Άμεση σύγκριση διαφορετικών συστάδων, συνήθως εκείνων που λαμβάνονται μέσω διαφορετικών παραμέτρων για τον ίδιο αλγόριθμο 52

50 Ποιότητα Συστάδων: Εξωτερικές Μέθοδοι 53 T η συσταδοποίηση αναφοράς και Q(C, T) το μέτρο ποιότητας της συσταδοποίησης C Το Q(C, T) είναι καλό αν ικανοποιεί τα επόμενα τέσσερα βασικά κριτήρια Ομοιογένεια Το καθαρότερο, το καλύτερο Πληρότητα Τοποθέτηση αντικείμενων που ανήκουν στην ίδια κατηγορία της συσταδοποίησης αναφοράς στην ίσια συστάδα Δημιουργία συστάδας με υπόλοιπα καλύτερη από την τοποθέτηση ξένων Η τοποθέτηση ενός ετερογενούς αντικειμένου σε μια καθαρή συστάδα τιμωρείται περισσότερο από την τοποθέτησή του σε μια συστάδα με «υπόλοιπα» αντικείμενα Διατήρηση μικρών συστάδων Η διάσπαση μιας μικρής κατηγορίας σε κομμάτια είναι πιο επιβλαβής από τη διάσπαση μιας μεγάλης κατηγορίας σε κομμάτια

51 54 Συνηθισμένες Εξωτερικές Μέθοδοι Μέτρα που βασίζονται σε αντιστοίχιση Καθαρότητα, μέγιστη ταύτιση, μέτρηση F Μέτρα που βασίζονται στην εντροπία Υποθετική εντροπία Normalized mutual information (NMI) Διακύμανση πληροφορίας Μέτρα σύγκρισης ζευγών Τέσσερις δυνατότητες: True positive (TP), FN, FP, TN Συντελεστής Jaccard, στατιστική Rand, μέτρο Fowlkes-Mallow Μέτρα συσχέτισης Διακριτή στατική Huber, κανονικοποιημένη Διακριτή στατική Huber Συσταδοποίηση αναφοράς T 1 T 2 Cluster C 1 Cluster C 2

52 Σταθερότητα Συστάδων Η συσταδοποίηση που προκύπτει από διάφορα σύνολα δεδομένων δείγματα από την ίδια κατανομή δεδομένων με το D, πρέπει να είναι ίδια ή «σταθερή» Τυπική προσέγγιση: Εντοπισμός καλών τιμών για τις παραμέτρους του αλγορίθμου Παράδειγμα: Εντοπισμός καλής τιμής k, ο αριθμός των συστάδων Μια προσέγγιση bootstrapping για την εύρεση της καλύτερης τιμής του k (κρίνεται από τη σταθερότητα) Δημιουργία t δειγμάτων μεγέθους n με δειγματοληψία από D με αντικατάσταση Για κάθε δείγμα Di, εκτελείται ο ίδιος αλγόριθμος συσταδοποίησης με τιμές k από 2 έως k max Σύγκριση της απόστασης μεταξύ όλων των ζευγών συστάδων C k (D i ) και C k (D j ) μέσω κάποιας συνάρτησης απόστασης Υπολογισμός της αναμενόμενης απόσταση ζευγών για κάθε τιμή του k Η τιμή k* που παρουσιάζει τη μικρότερη απόκλιση μεταξύ των συσταδοποιήσεων είναι η καλύτερη επιλογή για k, (παρουσιάζει την μεγαλύτερη σταθερότητα) 55

53 56 Άλλες Μέθοδοι για τον Προσδιορισμό του K Εμπειρική Μέθοδος k n/2 Μέθοδος αγκώνα: Χρήση του σημείου καμπής στην καμπύλη του αθροίσματος της διακύμανσης εντός των συστάδων σε σχέση με τον # των συστάδων Διασταυρωμένη μέθοδος επικύρωσης # συστάδων: για ένα σύνολο από n σημεία (π.χ., n = 200, k = 10) Διαχωρισμός ενός συνόλου δεδομένων σε m μέρη Χρήση m-1 μερών για τη δημιουργία ενός μοντέλου ομαδοποίησης Χρήση του υπόλοιπου τμήματος για τον έλεγχο της ποιότητας της συσταδοποίησης Π.χ., για κάθε σημείο του συνόλου ελέγχου, εντοπισμός του πλησιέστερου κέντρου και χρήση του αθροίσματος της τετραγωνικής απόστασης μεταξύ όλων των σημείων στο σύνολο ελέγχου και των πλησιέστερων κέντρων για τη μέτρηση του πόσο καλά το μοντέλο ταιριάζει με το σύνολο ελέγχου Για κάθε k > 0, επανάληψη m φορές, σύγκριση του συνολικού μέτρου ποιότητας σε όσο αφορά τα διαφορετικά k, και εύρεση του # των συστάδων που ταιριάζουν καλύτερα στα δεδομένα

54 57 Τάση Συστάδων (Ενδογενής Δομή) Αξιολόγηση της καταλληλότητας της συσταδοποίησης Αν τα δεδομένα έχουν οποιαδήποτε εγγενή δομή συστάδων Προσδιορισμός της τάσης συσταδοποίησης Ένα δύσκολο έργο επειδή υπάρχουν πολλοί διαφορετικοί ορισμοί των συστάδων Π.χ., διαχωρισμού, ιεραρχική, με βάση την πυκνότητα, βασισμένη σε γραφήματα κλπ. Παρ όλα αυτά, υπάρχουν μερικές μέθοδοι αξιολόγησης της συσταδοποίησης Χωρικό ιστόγραμμα: Συγκρίνει το ιστόγραμμα των δεδομένων με αυτό που παράγεται από τυχαία δείγματα Κατανομή απόστασης: Συγκρίνει την απόσταση των σημείων των δεδομένων ανά ζεύγη με αυτά από τα τυχαία παραγόμενα δείγματα

55 58 Συσταδοποίηση: Βασικές Έννοιες και Μέθοδοι Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Σύνοψη

56 59 Σύνοψη Εισαγωγή στη Συσταδοποίηση Μέθοδοι Διαχωρισμού Ιεραρχικές Μέθοδοι Μέθοδοι Πυκνότητας Αξιολόγηση Συσταδοποίησης

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΙΙ

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΙΙ Τι είναι συσταδοποίηση Εύρεση συστάδων αντικειμένων έτσι ώστε τα αντικείμενα σε κάθε ομάδα να είναι όμοια (ή να σχετίζονται) και διαφορετικά (ή μη σχετιζόμενα) από τα αντικείμενα των άλλων ομάδων Συσταδοποίηση

Διαβάστε περισσότερα

Ομαδοποίηση Ι (Clustering)

Ομαδοποίηση Ι (Clustering) Ομαδοποίηση Ι (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 9: Ομαδοποίηση Μέρος Γ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση (clustering) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

P.-N. Tan, M.Steinbach, V. Kumar, Introduction to Data Mining»,

P.-N. Tan, M.Steinbach, V. Kumar, Introduction to Data Mining», Συσταδοποίηση Ι Οι διαφάνειες στηρίζονται στο P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006 Τι είναι συσταδοποίηση Εύρεση συστάδων αντικειμένων έτσι ώστε τα αντικείμενα

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Γ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 10: Ομαδοποίηση Μέρος Δ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

Συσταδοποίηση II DBScan Εγκυρότητα Συσταδοποίησης BIRCH

Συσταδοποίηση II DBScan Εγκυρότητα Συσταδοποίησης BIRCH Συσταδοποίηση II DBScan Εγκυρότητα Συσταδοποίησης BIRCH Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 2006 Εξόρυξη Δεδομένων: Ακ. Έτος

Διαβάστε περισσότερα

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Γνώσης από Χωρικά εδοµένα (spatial data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Διαβάστε περισσότερα

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση Συσταδοποίηση II Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 006 Εξόρυξη Δεδομένων: Ακ. Έτος 008-009 ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΙΙ Τι είναι συσταδοποίηση

Διαβάστε περισσότερα

Υλοποίηση του αλγορίθμου DBSCAN και η εφαρμογή του σε δεδομένα της αγοράς

Υλοποίηση του αλγορίθμου DBSCAN και η εφαρμογή του σε δεδομένα της αγοράς Υλοποίηση του αλγορίθμου DBSCAN και η εφαρμογή του σε δεδομένα της αγοράς Φωτεινή Καλαφάτη Πολυτεχνείο Κρήτης Σχολή Μηχανικών Παραγωγής και Διοίκησης Πολυτεχνειούπολη, 73100 Χανιά email: fot.kalafati@yahoo.com

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Εισαγωγή Τεχνικές διαχωριστικής ομαδοποίησης: Ν πρότυπα k ομάδες Ν>>k Συνήθως k καθορίζεται από χρήστη Διαχωριστικές τεχνικές: επιτρέπουν πρότυπα να μετακινούνται από ομάδα σε

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Άσκηση 5.1 Για ένα σήμα που έχει τη σ.π.π. του σχήματος να υπολογίσετε: μήκος του δυαδικού κώδικα για Ν επίπεδα κβάντισης για σταθερό μήκος λέξης;

Διαβάστε περισσότερα

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση Συσταδοποίηση I Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 6 Τι είναι συσταδοποίηση Εύρεση συστάδων αντικειμένων έτσι ώστε τα αντικείμενα

Διαβάστε περισσότερα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρμοσμένες Επιστήμες Στατιστικός Πληθυσμός και Δείγμα Το στατιστικό

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα,

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Ηλίας Κ. Σάββας Εξόρυξη Δεδομένων Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, Μετατροπή δεδομένων σε ΠΛΗΡΟΦΟΡΙΑ, Πολλά δεδομένα αποθηκευμένα

Διαβάστε περισσότερα

Συσταδοποίηση/ Ομαδοποίηση

Συσταδοποίηση/ Ομαδοποίηση Συσταδοποίηση/ Ομαδοποίηση Lecture Notes for Chapter 8 Introduction to Data Mining by Tan, Steinbach, Kumar 1 Τι είναι η ανάλυση ομάδων/ομαδοποίηση (Συσταδοποίηση)? Εύρεση συνόλων από αντικείμενα έτσι

Διαβάστε περισσότερα

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ

ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ Σ ε λ ί δ α 0 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΚΑΤΑΝΑΛΩΤΩΝ ΜΕ ΣΚΟΠΟ ΤΗΝ ΤΙΜΟΛΟΓΗΣΗ Διπλωματική

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ Τμήμα Πληροφορικής και Επικοινωνιών

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ Τμήμα Πληροφορικής και Επικοινωνιών ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ Τμήμα Πληροφορικής και Επικοινωνιών ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Ο αλγόριθμος Simulated Annealing στην κατευθυνόμενη στοχαστική αναζήτηση της βέλτιστης

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΑΝΑΠΤΥΞΗ ΓΡΑΦΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΣΕ MATLAB ΓΙΑ ΣΥΣΤΑΔΟΠΟΙΗΣΗ ΜΕΣΩ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ ISODATA Μαρκαντωνάτου Μαρία Α.Μ.: 379 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Δρ. Τσιμπίρης

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό ΗΜΥ 429 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό 1 (i) Βασική στατιστική 2 Στατιστική Vs Πιθανότητες Στατιστική: επιτρέπει μέτρηση και αναγνώριση θορύβου και

Διαβάστε περισσότερα

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση

Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, Τι είναι συσταδοποίηση Συσταδοποίηση I Εισαγωγή Ο αλγόριθμος k-means Αποστάσεις Ιεραρχική Συσταδοποίηση Μέρος των διαφανειών είναι από το P.-N. Tan, M.Steinbach, V. Kumar, «Introduction to Data Mining», Addison Wesley, 006 Τι

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Ανασκόπηση βασικών εννοιών Στατιστικής και Πιθανοτήτων Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

10. Μη-κατευθυνόμενη ταξινόμηση ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ

10. Μη-κατευθυνόμενη ταξινόμηση ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ ΚΥΡΊΩΣ ΜΈΡΗ ΔΕΥ 1 2 3 1 ΚΑΤΗΓΟΡΊΕΣ ΤΑΞΙΝΌΜΗΣΗΣ Κατευθυνόμενη ταξινόμηση (supervised classification) Μη-κατευθυνόμενη ταξινόμηση (unsupervised classification) Γραμμική: Μη-Γραμμική: Ιεραρχική: Επιμεριστική:

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Σχολή Θετικών Επιστημών Πανεπιστήμιο Θεσσαλίας ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Κατηγοριοποίηση Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Κατηγοριοποιητής K πλησιέστερων

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ ΚΕΦΑΛΑΙΟ 3 Περιγραφή της Μεθόδου Το αντικείμενο αυτής της εργασίας είναι η χρήση μιας μεθόδου προσέγγισης συναρτήσεων που έχει προταθεί από τον hen-ha huang και ονομάζεται Ασαφώς Σταθμισμένη Παλινδρόμηση

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

ιαµέριση - Partitioning

ιαµέριση - Partitioning ιαµέριση - Partitioning ιαµέριση ιαµέριση είναι η διαµοίραση αντικειµένων σε οµάδες µε στόχο την βελτιστοποίηση κάποιας συνάρτησης. Στην σύνθεση η διαµέριση χρησιµοποιείται ως εξής: Οµαδοποίηση µεταβλητών

Διαβάστε περισσότερα

Ανάκτηση πολυμεσικού περιεχομένου

Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση

Διαβάστε περισσότερα

Είδη Μεταβλητών. κλίµακα µέτρησης

Είδη Μεταβλητών. κλίµακα µέτρησης ΠΕΡΙΕΧΟΜΕΝΑ Κεφάλαιο 1 Εισαγωγικές Έννοιες 19 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Η Μεταβλητότητα Η Στατιστική Ανάλυση Η Στατιστική και οι Εφαρµοσµένες Επιστήµες Στατιστικός Πληθυσµός και Δείγµα Το στατιστικό

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

Γ. Πειραματισμός - Βιομετρία

Γ. Πειραματισμός - Βιομετρία Γ. Πειραματισμός - Βιομετρία Πληθυσμοί και δείγματα Πληθυσμός Περιλαμβάνει όλες τις πιθανές τιμές μιας μεταβλητής, δηλαδή αναφέρεται σε μια παρατήρηση σε όλα τα άτομα του πληθυσμού Ο πληθυσμός προσδιορίζεται

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 8 ο Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι ακμές είναι βασικά χαρακτηριστικά της εικόνας. Ένας αποδεκτός ορισμός της ακμής είναι ο ακόλουθος: «Το σύνορο μεταξύ δύο ομοιογενών περιοχών με

Διαβάστε περισσότερα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 8 ο Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι ακμές είναι βασικά χαρακτηριστικά της εικόνας Προς το παρόν δεν υπάρχει ακόμα ένας ευρέως αποδεκτός ορισμός της ακμής. Εδώ θα θεωρούμε ως ακμή:

Διαβάστε περισσότερα

Περιεχόμενα. Περιεχόμενα

Περιεχόμενα. Περιεχόμενα Περιεχόμενα xv Περιεχόμενα 1 Αρχές της Java... 1 1.1 Προκαταρκτικά: Κλάσεις, Τύποι και Αντικείμενα... 2 1.1.1 Βασικοί Τύποι... 5 1.1.2 Αντικείμενα... 7 1.1.3 Τύποι Enum... 14 1.2 Μέθοδοι... 15 1.3 Εκφράσεις...

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς ) Πληθυσμός (populaton) ονομάζεται ένα σύνολο, τα στοιχεία του οποίου εξετάζουμε ως προς τα χαρακτηριστικά τους. Μεταβλητές (varables ) ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Διαβάστε περισσότερα

Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων

Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Εφαρμοσμένη Πολυμεταβλητή Ανάλυση : Ανάλυση κατά συστάδες 1. Εισαγωγή Ανάλυση κατά συστάδες με χρήση στατιστικών πακέτων Η ομαδοποίηση δεδομένων

Διαβάστε περισσότερα

ΕΞΕΛΙΚΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΠΟΛΥΚΡΙΤΗΡΙΑΣ ΟΜΑΔΟΠΟΙΗΣΗΣ

ΕΞΕΛΙΚΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΠΟΛΥΚΡΙΤΗΡΙΑΣ ΟΜΑΔΟΠΟΙΗΣΗΣ ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΑΡΑΓΩΓΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΞΕΛΙΚΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΠΟΛΥΚΡΙΤΗΡΙΑΣ ΟΜΑΔΟΠΟΙΗΣΗΣ ΝΙΚΟΛΑΚΑΚΗ ΚΩΝΣΤΑΝΤΙΝΑ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΔΟΥΜΠΟΣ ΜΙΧΑΛΗΣ Χανιά, 2009 ΕΥΧΑΡΙΣΤΙΕΣ

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2017-2018 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 16: Πολυεκπομπή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 16: Πολυεκπομπή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 16: Πολυεκπομπή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης Μάθημα 4 ο Δρ. Ανέστης Γ. Χατζημιχαηλίδης Τμήμα Μηχανικών Πληροφορικής Τ.Ε. ΤΕΙ Ανατολικής Μακεδονίας και Θράκης 2016-2017 Διευρυμένη Υπολογιστική Νοημοσύνη (ΥΝ) Επεκτάσεις της Κλασικής ΥΝ. Μεθοδολογίες

Διαβάστε περισσότερα

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Στατιστική Ι Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος e-mail: dgs@eap.gr Παρασκευή, 30 Νοεμβρίου 2012 Στατιστική Ι Έννοιες - Κλειδιά Μεταβλητότητα Εύρος (range) Εκατοστημόρια

Διαβάστε περισσότερα

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ.

03 _ Παράμετροι θέσης και διασποράς. Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ. 6_Στατιστική στη Φυσική Αγωγή 03 _ Παράμετροι θέσης και διασποράς Γούργουλης Βασίλειος Καθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ. Παράμετροι θέσης όταν θέλουμε να εκφράσουμε μια μεταβλητή με έναν αριθμό π.χ.

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στην κατάτμηση εικόνας Τεχνικές

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ... ΠΕΡΙΕΧΟΜΕΝΑ ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...................................... 11 ΠΡΟΛΟΓΟΣ..........................................................15 1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΝΑΛΥΤΙΚΗ, ΣΤΑ ΠΟΣΟΤΙΚΑ

Διαβάστε περισσότερα

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης

DIP_05 Τμηματοποίηση εικόνας. ΤΕΙ Κρήτης DIP_05 Τμηματοποίηση εικόνας ΤΕΙ Κρήτης ΤΜΗΜΑΤΟΠΟΙΗΣΗ ΕΙΚΟΝΑΣ Τμηματοποίηση εικόνας είναι η διαδικασία με την οποία διαχωρίζεται μία εικόνα σε κατάλληλες περιοχές ή αντικείμενα. Για την τμηματοποίηση

Διαβάστε περισσότερα

11 Ανάλυση Συστάδων

11 Ανάλυση Συστάδων 11 Ανάλυση Συστάδων Σύνοψη Η Ανάλυση Συστάδων (ΑΣ) (Clustering) είναι μια από τις βασικότερες εργασίες Εξόρυξης Δεδομένων. Στόχος της ΑΣ είναι ο επιμερισμός ενός συνόλου παραδειγμάτων σε συστάδες. Οι συστάδες

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις

Διαβάστε περισσότερα

Κεφάλαιο 6: Συσταδοποίηση

Κεφάλαιο 6: Συσταδοποίηση Κεφάλαιο 6: Συσταδοποίηση Σύνοψη Ο βασικός στόχος αυτού του κεφαλαίου είναι η εξοικείωση με θέματα που αφορούν την τρίτη σημαντική εργασία της εξόρυξης δεδομένων, δηλαδή την ανάλυση των συστάδων. Πιο συγκεκριμένα,

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

κυρτών και σύνθετων σωμάτων

κυρτών και σύνθετων σωμάτων Τ.Ε.Ι. Αθηνών τμήμα Πληροφορικής Διπλωματική εργασία Ανίχνευση συγκρούσεων σε σκηνές 3Δ κυρτών και σύνθετων σωμάτων Κόνιαρης Χαράλαμπος Επιβλέπων καθηγητής : Δρ. Ιωάννης Πρατικάκης Περιληπτικά (1) Γενικά

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2013-2014 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητή: ένα χαρακτηριστικό ή ιδιότητα που μπορεί να πάρει διαφορετικές τιμές

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ)

ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ) ΣΤΑΤΙΣΤΙΚΗ ( ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ) ΠΕΡΙΕΧΟΜΕΝΑ Μέτρα θέσης και διασποράς (Εισαγωγή) Μέση τιμή Διάμεσος Σταθμικός μέσος Επικρατούσα τιμή Εύρος Διακύμανση Τυπική απόκλιση Συντελεστής μεταβολής Κοζαλάκης

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Οδηγίες: Σχετικά με την παράδοση της εργασίας θα πρέπει: Το κείμενο

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436 Χειμερινό εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Μέτρα

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19 2.1 Αβεβαιότητα, Τυχαία Διαδικασία, και Συναφείς Έννοιες 21 2.1.1 Αβεβαιότητα και Τυχαίο Πείραμα

Διαβάστε περισσότερα

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. ιπλωµατική Εργασία ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ιπλωµατική Εργασία «Μετάδοση πληροφορίας σε ασύρµατο δίκτυο αισθητήρων µε οµαδοποιηµένους κόµβους και µε χρήση διευθύνσεων

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 5: Κατηγοριοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα

Στατιστική: Δειγματοληψία X συλλογή δεδομένων. Περιγραφική στατιστική V πίνακες, γραφήματα, συνοπτικά μέτρα ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕΡΟΣ Α Δημήτρης Κουγιουμτζής e-mail: dkugiu@auth.gr Ιστοσελίδα αυτού του τμήματος του μαθήματος: http://users.auth.gr/~dkugiu/teach/civiltrasport/ide.html Στατιστική: Δειγματοληψία

Διαβάστε περισσότερα

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson ΘΕΜΑ : Αλγόριθμος Ford-Fulkerson Α Να εξετάσετε αν ισχύει η συνθήκη συντήρησης της αρχικής ροής στο δίκτυο. Β Με χρήση του αλγορίθμου Ford-Fulkerson να βρεθεί η μέγιστη ροή που μπορεί να σταλεί από τον

Διαβάστε περισσότερα

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι: Άσκηση 1: Δύο τυχαίες μεταβλητές Χ και Υ έχουν στατιστικές μέσες τιμές 0 και διασπορές 25 και 36 αντίστοιχα. Ο συντελεστής συσχέτισης των 2 τυχαίων μεταβλητών είναι 0.4. Να υπολογισθούν η διασπορά του

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ Ενότητα 3: Ασυμπτωτικός συμβολισμός Μαρία Σατρατζέμη Τμήμα Εφαρμοσμένης Πληροφορικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ

ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ ΟΜΟΙΟΤΗΤΑ ΒΙΟΚΟΙΝΟΤΗΤΩΝ Είναι δυνατόν δύο βιοκοινότητες να έχουν τον ίδιο (ή σχεδόν τον ίδιο) δείκτη ποικιλότητας ειδών αν και τα είδη που συνθέτουν τη μία βιοκοινότητα να είναι -σε μεγάλο βαθμό ή και

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13 ΠΕΡΙΕΧΟΜΕΝΑ / 7 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1: Περιγραφική Στατιστική... 15 1.1 Περιγραφική και Συμπερασματική Στατιστική... 15 1.2 Μεταβλητές - Τιμές - Παρατηρήσεις... 19 1.3 Είδη μεταβλητών...

Διαβάστε περισσότερα