Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Σχετικά έγγραφα
Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Εισαγωγή στους Αλγορίθμους

Εισαγωγή στους Αλγορίθμους

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Διοικητική Λογιστική

Εισαγωγή στους Αλγορίθμους

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Ψηφιακή Επεξεργασία Εικόνων

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Δομές Δεδομένων Ενότητα 1

Διοίκηση Επιχειρήσεων

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Βέλτιστος Έλεγχος Συστημάτων

Ιστορία της μετάφρασης

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Μηχανολογικό Σχέδιο Ι

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Διοικητική Λογιστική

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού Υπέρθερμου Ατμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Κβαντική Επεξεργασία Πληροφορίας

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

ΗΛΕΚΤΡΟΝΙΚΗ IΙ Ενότητα 6

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 1: Εκτιμητές και Ιδιότητες. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Μυελού των Οστών Ενότητα #1: Ερωτήσεις κατανόησης και αυτόαξιολόγησης

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Εκκλησιαστικό Δίκαιο

Οικονομετρία Ι. Ενότητα 6: Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Βάσεις Περιβαλλοντικών Δεδομένων

Εφαρμογές πληροφορικής σε θέματα πολιτικού μηχανικού

Κβαντική Επεξεργασία Πληροφορίας

ΟΙΚΟΝΟΜΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Οικονομετρία. Πολλαπλή Παλινδρόμηση. Στατιστικός έλεγχος γραμμικού συνδυασμού συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Εκκλησιαστικό Δίκαιο

Έλεγχος και Διασφάλιση Ποιότητας Ενότητα 4: Μελέτη ISO Κουππάρης Μιχαήλ Τμήμα Χημείας Εργαστήριο Αναλυτικής Χημείας

1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

ΑΛΓΟΡΙΘΜΟΙ. Ενότητα 12: Αντιμετώπιση Περιορισμών Αλγοριθμικής Ισχύος

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

Εισαγωγή στους Αλγορίθμους Ενότητα 11η Άσκηση - Σταθμισμένος Χρονοπρογραμματισμός Διαστημάτων

Μάρκετινγκ Αγροτικών Προϊόντων

Οικονομετρία Ι. Ενότητα 5: Ανάλυση της Διακύμανσης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Θέματα Εφαρμοσμένης. Ενότητα 14.2: Η ψήφος στα πρόσωπα. Θεόδωρος Χατζηπαντελής Τμήμα Πολιτικών Επιστημών ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εξελικτική Ψυχολογία: Κοινωνικο-γνωστική ανάπτυξη

Τεχνικό Σχέδιο - CAD

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στους Υπολογιστές

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Επεξεργασία Στοχαστικών Σημάτων

Στατιστική Ι. Ενότητα 3: Στατιστική Ι (3/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Β. Διαφορικός Λογισμός

ΗΛΕΚΤΡΟΝΙΚΗ IΙ Ενότητα 3

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Ενδεικτικές λύσεις ασκήσεων διαχείρισης έργου υπό συνθήκες αβεβαιότητας

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

ΑΡΙΣΤΟΤΕΛΕΙΟ ΑΝΟΙΚΤΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΑ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΑΘΗΜΑΤΑ Γενικά Μαθηματικά Ι Ενότητα 11 : Ακολουθίες και Σειρές Λουκάς Βλάχος Τμήμα Φυσικής

ΣΥΜΠΕΡΙΦΟΡΑ ΚΑΤΑΝΑΛΩΤΗ

Τεχνικό Σχέδιο - CAD

Ποιοτική μεθοδολογία έρευνας στη Διδακτική των Μαθηματικών Ενότητα 7: Συγγραφή μιας εργασίας

Γενικά Μαθηματικά Ι. Ενότητα 14: Ολοκλήρωση Κατά Παράγοντες, Ολοκλήρωση Ρητών Συναρτήσεων Λουκάς Βλάχος Τμήμα Φυσικής

Παράκτια Τεχνικά Έργα

Προγραμματισμός Η/Υ. Βασικές Προγραμματιστικές Δομές. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους

Διδακτική της Πληροφορικής

ΟΙΚΟΝΟΜΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

Κβαντική Επεξεργασία Πληροφορίας

Βέλτιστος Έλεγχος Συστημάτων

Η ΓΝΩΣΗ ΚΑΙ ΤΟ ΠΡΑΓΜΑΤΙΚΟ ΣΤΟΝ ΠΛΑΤΩΝΑ ΚΑΙ ΤΟΝ ΑΡΙΣΤΟΤΕΛΗ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Στατιστική. 5 ο Μάθημα: Βασικές Έννοιες Εκτιμητικής. Γεώργιος Μενεξές Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Λειτουργία και εφαρμογές της πολιτιστικής διαχείρισης

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 10: Ομαδοποίηση Μέρος Δ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creatve Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ομαδοποίηση Μέρος Δ Έλεγχος εγκυρότητας, τάση ομαδοποίησης

Περιεχόμενα ενότητας 1. Έλεγχος εγκυρότητας και τάση ομαδοποίησης.. Γενικά θέματα κλιμάκωσης. 3. Ποιός αλγόριθμος πρέπει να επιλέγεται. 5

Σκοποί ενότητας Εξέταση θεμάτων που αφορούν τον έλεγχο εγκυρότητας και της τάσης ομαδοποίησης. Παρουσιάζονται κριτήρια και παράγοντες που καθορίζουν την επιλογή του αλγορίθμου ομαδοποίησης. 6

Εγκυρότητα ομαδοποίησης Πώς αξιολογείται η ποιότητα των συστάδων; Πολλές φορές το πόσο καλό είναι το αποτέλεσμα είναι υποκειμενικό. o Clusters are n the eye of the beholder! Γιατί χρειάζεται η αξιολόγηση: o Για την αποφυγή εύρεσης προτύπων σε θόρυβο. o Για τη σύγκριση διαφορετικών αλγορίθμων. o Για τη σύγκριση δύο συνόλων από συστάδες. o Για τη σύγκριση δύο συστάδων. Αποτίμηση αποτελέσματος ομαδοποίησης: o Εσωτερικά κριτήρια (καμία γνώση κλάσεων). o Εξωτερικά κριτήρια (γνώση κλάσεων). o Σχετικά κριτήρια. 7

Εγκυρότητα αλγορίθμων Συμπάγεια (Συνοχή) τμηματοποίησης o Πόσο κοντά ή στενά συσχετισμένα είναι τα αντικείμενα μίας συστάδας. m είναι το κέντρο της συστάδας Απομόνωση SSE o Πόσο μακριά ή καλά διαχωρισμένες είναι οι συστάδες μεταξύ τους. SSB C είναι το μέγεθος της συστάδας m το κέντρο όλων των συστάδων x C C ( x ( m m ) m ) 8

Αλληλεξάρτηση SSE και SSB (1/) 1 m 1 3 4 m 5 K=1 cluster: SSE SSB Total (1 4 10 3) (3 0 3) ( 10 m 3) 0 (4 3) (5 3) 10 K= clusters: SSE (1 1.5) ( 1.5) (4 4.5) (5 4.5) 1 SSB (3 1.5) (4.5 3) 9 Total 1 9 10 Αποδεικνύεται ότι πάντα το άθροισμα παραμένει σταθερό. Άρα η ελαχιστοποίηση του SSE σημαίνει μεγιστοποίηση του SSB. 9

Αλληλεξάρτηση SSE και SSB (/) Απόδειξη: 0 10

Περισσότερα για συνοχή-απομόνωση Η συνοχή μπορεί να υπολογιστεί αν πάρουμε την απόσταση των σημείων της συστάδας μεταξύ τους. cluster SSE x C ( x m ) 1 c x C y C ( x ) y Η απομόνωση μπορεί να υπολογιστεί αν πάρουμε την απόσταση μεταξύ των κέντρων των συστάδων. Για ισομεγέθεις συστάδες: ό SSB x C c 1 K K K ( m m) ( m mj) 1 j 1 K n 11

Έλεγχος σημαντικότητας SSE και SSB Οι τιμές SSE και SSB ερμηνεύονται μόνο συγκριτικά. Παράγουμε έναν αριθμό συνόλων με αντικείμενα που ακολουθούν ομοιόμορφη κατανομή και έχουν τον ίδιο αριθμό αντικειμένων Ομαδοποιούμε κάθε τέτοιο σύνολο και υπολογίζουμε τις τιμές SSE και SSB. Εξετάζουμε την κατανομή των τιμών SSE και SSB. Ελέγχουμε κατά πόσο μη αναμενόμενες είναι οι τιμές SSE και SSB που προέκυψαν από την υπό εξέταση ομαδοποίηση. 1

Συντελεστής σιλουέτας (αλγόριθμοι τμηματοποίησης) Συνδυασμός συμπάγειας και απομόνωσης o Απόσταση ενός αντικειμένου από τα αντικείμενα της ομάδας του συγκριτικά με την απόσταση από τα αντικείμενα άλλων ομάδων α = μέση απόσταση -οστού αντικειμένου από τα αντικείμενα της ομάδας του b = η ελάχιστη μέση απόσταση -οστού αντικειμένου από αντικείμενα άλλης ομάδας b a max{ a, b Τιμή στο [-1,1], επιθυμητές τιμές > 0 S } 13

Εγκυρότητα για ιεραρχικούς αλγορίθμους Συντελεστής CPCC (cophenetc correlaton coeffcent) μετράει κατά πόσο τα αντικείμενα ταιριάζουν στο (πλήρες) δενδρόγραμμα. d(x,y): απόσταση x, y. dc(x,y): απόσταση των ομάδων που περιείχαν τα x και y, όταν αυτά τοποθετήθηκαν για πρώτη φορά στην ίδια ομάδα, έπειτα από συγχώνευση των ομάδων τους. Οι τιμές είναι στο διάστημα [-1,1]. o Οι τιμές πλησιέστερα στο 1 υποδηλώνουν καλύτερη συσταδοποίηση. 14

Γενική μέθοδος εγκυρότητας μέσω Δύο πίνακες: συσχέτισης (1/) o Πίνακας Γειτνίασης (Ομοιότητας ή απόστασης). o Πίνακας Εμφάνισης (Incdence). Μία γραμμή και μία στήλη για κάθε σημείο. Τιμή 1 σημαίνει ότι τα αντίστοιχα σημεία βρίσκονται στην ίδια συστάδα. Τιμή 0 σημαίνει ότι τα αντίστοιχα σημεία βρίσκονται σε διαφορετική συστάδα. 15

Γενική μέθοδος εγκυρότητας μέσω συσχέτισης (/) Υπολογισμός συσχέτισης μεταξύ των δύο πινάκων. o Καθώς οι πίνακες είναι συμμετρικοί, χρειάζεται ο υπολογισμός μόνο n(n-1) / συνδυασμών. Υψηλή συσχέτιση σημαίνει ότι τα σημεία μιας συστάδας είναι κοντά το ένα στο άλλο. Δεν ενδείκνυται για συσταδοποίηση βάσει πυκνότητας ή συνέχειας. 16

Αποτίμηση μέσω οπτικοποίησης Ταξινομούμε τα αντικείμενα ως προς την ομάδα που ανήκουν και αναπαριστούμε τις αποστάσεις τους σε έναν πίνακα Οι συστάδες σε τυχαία δεδομένα δεν είναι ξεκάθαρες 17

Εγκυρότητα με εξωτερικά κριτήρια Γνωρίζουμε εκ των προτέρων την κλάση στην οποία ανήκουν. a: Το πλήθος των αντικειμένων που ανήκουν και στην ίδια ομάδα και στην ίδια κλάση. b: Το πλήθος των αντικειμένων που ανήκουν και στην ίδια ομάδα αλλά όχι στην ίδια κλάση. c: Το πλήθος των αντικειμένων που δεν ανήκουν στην ίδια ομάδα αλλά ανήκουν στην ίδια κλάση. Συντελεστής Jaccard: a Ο συντελεστής Jaccard παίρνει τιμές στο διάστημα [0,1]. Τιμές πλησιέστερα στο 1 δηλώνουν καλύτερη ομαδοποίηση. a b c 18

Τελευταίο σχόλιο πάνω στην εγκυρότητα The valdaton of clusterng structures s the most dffcult and frustratng part of cluster analyss. Wthout a strong effort n ths drecton, cluster analyss wll reman a black art accessble only to those true belevers who have experence and great courage. Algorthms for Clusterng Data, Jan and Dubes 19

Έλεγχος βάσει MST Παράγουμε σημεία με τυχαία κατανομή Έστω η υπόθεση Η 0 ότι τα σύνολα δεδομένων προέρχονται από τον ίδιο πληθυσμό. 0

Βήματα ελέγχου (1/) Βρες την κυρτή (convex) περιοχή που περικλείει όλα τα σημεία του συνόλου δεδομένων X. Δημιούργησε σύνολο δεδομένων Y με Y = X σημεία, που βρίσκονται εντός της κυρτής περιοχής του βήματος 1. Βρες το MST του συνόλου X Y. T είναι ο αριθμός των ακμών του MST, των οποίων η μία τους κορυφή ανήκει στο X και η άλλη στο Y. Απόρριψε την υπόθεση H 0, αν ο αριθμός T είναι μικρός. 1

Βήματα ελέγχου (/) Εναλλακτικά: Απορρίπτουμε την Η0 σε επίπεδο εμπιστοσύνης a αν Τ < z(a)

Έλεγχος βάσει κοντινότερων γειτόνων Βρες την κυρτή (convex) περιοχή που περικλείει όλα τα σημεία του συνόλου δεδομένων X. Δημιούργησε το σύνολο δεδομένων Y με Y << X σημεία που βρίσκονται εντός της κυρτής περιοχής του βήματος 1. Πάρε ένα τυχαίο δείγμα S από σημεία του X, όπου S = Y. Θέτουμε ως X'=X-S το σύνολο των σημείων που δεν επιλέχθηκαν στο δείγμα. Για κάθε σημείο y στο Y βρίσκουμε την απόσταση u από τον κοντινότερο γείτονα που ανήκει στο X. Ομοίως, για κάθε σημείο s στο S βρίσκουμε την απόσταση w από τον κοντινότερο γείτονα που ανήκει στο X. Υπολόγισε το στατιστικό του Hopkns: o Υπάρχουν συστάδες όταν H > 0.5 Aπόρριψε την υπόθεση H 0, αν το H είναι περίπου 0.5. H S 1 S w 1 u S 1 u 3

Θέματα που πρέπει να προσεχθούν εκτός της πολυπλοκότητας Απαιτήσεις σε μνήμη. Αποδοτικός υπολογισμός πλησιέστερου κέντρου, γειτόνων ή σημείων μέσα σε δεδομένη απόσταση. Όρια στην γειτονικότητα: o μείωση του αριθμού συγκρίσεων ενός σημείου με κεντρικά σημεία Δειγματοληψία. Τεχνικές διαίρει και βασίλευε. Περίληψη των δεδομένων. Παραλληλισμός. 4

Κριτήρια-παράγοντες επιλογής αλγορίθμου (1/) Τύπος συσταδοποίσης: o ιεραρχίες, πληρότητα, μοναδικότητα Τύπος συστάδων: o Βάσει πρωτοτύπου-κεντρικού σημείου. o Βάσει γράφου. o Βάσει πυκνότητας. o Άλλα κριτήρια, όπως αποδοτικότητα σε συστάδες διαφορετικού μεγέθους, σχήματος, πυκνότητας, δυνατότητα υπολογισμού κεντρικού σημείου, συσταδοποίηση σε υποσύνολο χαρακτηριστικών. 5

Κριτήρια-παράγοντες επιλογής αλγορίθμου (/) Θόρυβος και ανώμαλες-ακραίες τιμές. Περιγραφή συστάδας. Ντετερμινιστική συμπεριφορά. Ευαισθησία στη σειρά των δεδομένων. Αυτόματος υπολογισμός αριθμού συστάδων. Ύπαρξη αντικειμενικής συνάρτησης. 6

Σημείωμα Αναφοράς Copyrght, Αναστάσιος Γούναρης. «. Ενότητα 10. Ομαδοποίηση Μέρος Δ». Έκδοση: 1.0. Θεσσαλονίκη 014. Διαθέσιμο από τη δικτυακή διεύθυνση:http://eclass.auth.gr/courses/ocrs18/

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creatve Commons Αναφορά - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο [1] http://creatvecommons.org/lcenses/by-nc-sa/4.0/

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Τέλος ενότητας Επεξεργασία: Ανδρέας Κοσματόπουλος Θεσσαλονίκη, Χειμερινό Εξάμηνο 013-014

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Σημειώματα

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους.