Efficient and Effective Clustering Methods for Spatial Data Mining (Αποδοτικές και αποτελεσματικές μέθοδοι ομαδοποίησης για εξόρυξη χωρικών δεδομένων)

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Efficient and Effective Clustering Methods for Spatial Data Mining (Αποδοτικές και αποτελεσματικές μέθοδοι ομαδοποίησης για εξόρυξη χωρικών δεδομένων)"

Transcript

1 Efficient and Effective Clustering Methods for Spatial Data Mining (Αποδοτικές και αποτελεσματικές μέθοδοι ομαδοποίησης για εξόρυξη χωρικών δεδομένων) Των Raymond T. Ng και Jiawei Han (1994) Παρουσίαση : Κατερίνα Ελ Ράχεμπ 1

2 Εισαγωγή Εξετάζουμε τη σημασία των μεθόδων ομαδοποίησηςστηνεξόρυξηχωρικώνδεδομένων. Παρουσιάζουμε τη μέθοδο ομαδοποίησης CLARANS η οποία βασίζεται σε τυχαία αναζήτηση. Περιγράφουμε δύο προϋπάρχοντες αλγόριθμους, PAM και CLARA στους οποίους βασίζεται ο CLARANS. Παρουσιάζουμε δύο διαφορετικούς αλγορίθμους που χρησιμοποιούν τη μέθοδο CLARANS (SD και NSD). Γίνεται σύγκριση του CLARANS με τις μέχρι τότε υπάρχουσες μεθόδους ομαδοποίησης και μέσα από πειραματικά δεδομένα αποδεικνύεται ότι η CLARANS αποτελεί μια αποτελεσματική και αποδοτική μέθοδο εξόρυξης χωρικών δεδομένων. 2

3 Εξόρυξη χωρικών δεδομένων Εξόρυξη χωρικών δεδομένων καλείται η ανακάλυψη σημαντικών σχέσεων και χαρακτηριστικών που υπάρχουν σε μια βάση χωρικών δεδομένων. Τα χωρικά δεδομένα στα οποία αναφερόμαστε μπορεί να προέρχονται από μια δορυφορική λήψη, από ιατρικά όργανα ή από βιντεοκάμερες. Οι χωρικές βάσεις δεδομένων συνήθως περιέχουν χωρικά και μη-χωρικά δεδομένα. Χαρακτηριστικό τους είναι ο πολύ μεγάλος όγκος δεδομένων (συνήθως μερικά terabytes) που καθιστά υψηλού κόστους ως πρακτικά αδύνατη τη λεπτομερή ανάλυση των δεδομένων. Η εξόρυξη χωρικών δεδομένων προσπαθεί να εξάγει ενδιαφέροντα χωρικά σχήματα και χαρακτηριστικά και να απεικονίσει σχέσεις μεταξύ χωρικών και μη-χωρικών δεδομένων. 3

4 Ιδιαιτερότητα των χωρικών δεδομένων Οι ιεραρχικοί αλγόριθμοι εξόρυξης αποτυγχάνουν κυρίως για δύο λόγους: 1. Πρέπει ο χρήστης/ειδικός να εισάγει εκ των προτέρων ιεραρχική γνώση σε σχέση με τα χωρικά δεδομένα, γεγονόςπουδενείναιπάνταεφικτό 2. Στα σημεία όπου πρέπει να γίνει η συνένωση των μικρότερων ομάδων πρέπει επίσης να είναι γνωστή η ιεραρχία. Στην πραγματικότητα ο λόγος που θέλουμε συνήθως να κάνουμε εξόρυξη χωρικών δεδομένων είναι να βρούμε τη ιεραρχία που συνδέει τα δεδομένα Δε μπορούμε να χρησιμοποιήσουμε αλγορίθμους που απαιτούν εκ των προτέρων γνώση της ιεραρχίας. Έτσι καταφεύγουμε στην ανάλυση ομαδοποίησης (cluster analysis), κλάδο της στατιστικής που δίνει τη δυνατότητα να εξάγουμε απευθείας από τα δεδομένα τις δομές και της ομάδες (clusters), χωρίς να βασιζόμαστε σε ιεραρχίες. Παραμένει τα προβλήματα της αποτελεσματικότητας και αποδοτικότητας! (Οι κλασικές μέθοδοι cluster analysis δίνουν ικανοποιητικά αποτελέσματα για μέχρι 2000 αντικείμενα). 4

5 PAM-Partitioning Around Medoids (1) Προτάθηκε από τους Kauffman και Rousseauw (1990). Ανήκει στις διαμεριστικές μεθόδους συσταδοποίησης (partitioning methods) όπως και οι ευριστικοί k-means και k-medoids, CLARA, CLARANS) Πιο συγκεκριμένα ο PAM ανήκει στην υποκατηγορία των k-medoids μεθόδων, δηλαδή καθορίζει τις ομάδες (clusters) ορίζοντας ένα αντιπροσωπευτικό αντικείμενο για κάθε ομάδα, το οποίο λέγεται medoid. Οι k-medoids πλεονεκτούν έναντι άλλων διαμεριστικών μεθόδων γιατί: 1. παρουσιάζουν ευρωστία όσον αφορά το χειρισμό των μεμονωμένων σημείων (outliers) και του θορύβου 2. τα clusters δεν επηρεάζονται από τη σειρά με την οποία εξετάζονται τα αντικείμενα 3. σύμφωνα με πειραματικά δεδομένα δίνουν αποδοτικούς αλγορίθμους για μεγάλα σύνολα δεδομένων. 5

6 PAM-Partiotioning Around Medoids (2) Αρχικά επιλέγονται k αντιπροσωπευτικά αντικείμενα (k-medoids). Στη συνέχεια κάθε μη επιλεγμένο αντικείμενο ομαδοποιείται στην ομάδα του πλησιέστερου medoid. Αν Oj είναι μη-επιλεγμένο αντικείμενο και Oi είναι το medoid λέμε ότι το Oj ανήκει στο cluster που αντιπροσωπεύει το Oi αν d(oj,oi)=min Οe d(oj,oe) Όπου min Οe : το ελάχιστο μεταξύ όλων των medoids Ο e και d(oj,oe): ανομοιότητα (dissimilarity) ή απόσταση(distance) μεταξύ των αντικειμένων Oj και Oe. Η ποιότητα της ομαδοποίησης (quality of clustering) υπολογίζεται ως η μέση ανομοιότητα μεταξύ ενός αντικείμένου και του medoid του cluster. 6

7 PAM-Partitioning Around Medoids (3) Έτσι σε κάθε βήμα γίνεται αντικατάσταση (swap) ενός επιλεγμένου από ένα μη επιλεγμένο αντικείμενο με σκοπό τη βελτίωση της ποιότητας ομαδοποίησης. Η επίδραση που έχει μια αντικατάσταση υπολογίζεται από το κόστος αντιμετάθεσης C jih και υπολογίζεται με τέσσερις διαφορετικές εξισώσεις ανάλογα με την περίπτωση. Το συνολικό κόστος της αντιμετάθεσης του i από το h δίνεται τελικά από το άθροισμα του κόστους όλων των περιπτώσεων TCih = ΣCjih 7

8 PAM αλγόριθμος (1) Βήμα 1: Όρισε αυθαίρετα k αντιπροσωπευτικά αντικείμενα. Βήμα 2: Υπολόγισε τα TC ih για όλα τα ζεύγη αντικειμένων O i, O h όπου Ο i είναι ήδη επιλεγμένο αντικείμενο και το O h δεν έχει επιλεχθεί ακόμα. Βήμα 3: Επέλεξε ένα ζεύγος O i, O h στο οποίο αντιστοιχεί min OiOh T cih. Αν το ελάχιστο TC ih είναι αρνητικό αντικατέστησε το Ο i με το Ο h και επέστρεψε στο βήμα 2. Βήμα 4: Διαφορετικά για κάθε μη-επιλεγμένο αντικείμενο βρες το πιο κοντινό αντιπροσωπευτικό αντικείμενο και τοποθέτησέ το στην αντίστοιχη ομάδα. 8

9 PAM αλγόριθμος (2) Πειραματικά δεδομένα δείχνουν ότι ο PAM δουλεύει ικανοποιητικά για μικρά σύνολα δεδομένων (π.χ. 100 αντικείμενα σε 5 ομάδες). Δε συμβαίνει το ίδιο για μεσαίου και μεγάλου μεγέθους σύνολα δεδομένων μια και πρόκειται για αλγόριθμο με κακή απόδοση. Η πολυπλοκότητα του PAM είναι O(k(n-k) 2 ). 9

10 CLARA-Clustering LARge Applications Προτάθηκε από τους Kauffman και Rousseauw (1990). Αναπτύχθηκε για να αντιμετωπίζει μεγάλα σύνολα δεδομένων, βασίζεται σε δείγματα (samples) καιχρησιμοποιείτονpam. Έτσι αντί να βρίσκει αντιπροσωπευτικά αντικείμενα (medoids) για ολόκληρο το σύνολο δεδομένων, όπως ο PAM, φτιάχνει ένα δείγμα του συνόλου και εφαρμόζει τον PAM πάνω σε αυτό το δείγμα. Αν τα δείγματα επιλεχθούν με «καλό» τυχαίο τρόπο τότε τα medoids προσεγγίζουν ικανοποιητικά τα medoids του συνόλου. Ο CLARA για να πετύχει ένα «καλό δείγμα» επιλέγει μια σειρά από από δείγματα και κρατάει αυτό με που δίνει την καλύτερη ομαδοποίηση. Βάσει πειραμάτων τα 5 δείγματα μεγέθους 40+2k δίνουν ικανοποιητικά αποτελέσματα. 10

11 CLARA αλγόριθμος (1) Βήμα 1: Για κάθε δείγμα (π.χ. 5) επανέλαβε τα ακόλουθα βήματα: Βήμα 2: Σχημάτισε ένα δείγμα από 40+2k τυχαία αντικείμενα από ολόκληρο το σύνολο δεδομένων και εφάρμοσε τον PAM αλγόριθμο για να βρεις τα k-medoids των δειγμάτων. Βήμα 3: Για κάθε αντικείμενο Oj σε ολόκληρο το σύνολο δεδομένων προσδιόρισε ποια από τα kmedoidsείναι πλησιέστερο στο Oj. Βήμα 4: Υπολόγισε τη μέση ανομοιότητα της ομαδοποίησης που πέτυχε το προηγούμενο βήμα. Αν η τιμή είναι μικρότερη από το τρέχον ελάχιστο, χρησιμοποίησε αυτή την τιμή ως τρέχον ελάχιστο και σημείωσε τα k του βήματος (2) ως την καλύτερη τιμή medoid μέχρι τώρα. Βήμα 5: Επέστρεψε στο βήμα 1 για την επόμενη επανάληψη 11

12 CLARANS-Clustering LARge Applications based on RANdomized Search (1) Ηεύρεσητωνk-medoids περιγράφεται ως αναζήτηση μέσα σε ένα γράφο G n, k. Ένας κόμβος αναπαρίσταται από ένα είναι ένα σύνολο από k αντικείμενα {Ο m1, O m2, O mk } όπου τα Ο m1, O m2, O mk είναι τα επιλεγμένα medoids. Δύο κόμβοι S 1 = {Ο m1, O m2, O mk } και S 2 = {Ο w1, O w2, O wk } είναι γείτονες (συνδέονται με πλευρά) αν τα σύνολά τους διαφέρουν μόνο κατά ένα αντικείμενο, αν δηλαδή S 1 S 2 = k- 1.Κάθε κόμβος έχει k(n-k) γείτονες. Ο PAM μπορεί με τη σειρά του να περιγραφεί ως αναζήτηση ελαχίστου στο γράφο όπου σε κάθε βήμα όλοι οι γείτονες ενός κόμβου εξετάζονται και το τρέχον κόμβος αντικαθίσταται απότογείτοναμετημεγαλύτερηκάθοδο κόστους. Η αναζήτηση συνεχίζεται μέχρι ένα ελάχιστο. Για μεγάλες τιμές του n (π.χ. n=1000 και k=10) το να εξετάσουμε τους k(n-k) γείτονες είναι προφανώς χρονοβόρο. Από την άλλη ο CLARA προσπαθεί εξετάσει λιγότερους γείτονες περιορίζοντας την αναζήτηση σε μικρότερους υπογράφους του G n, k. Το πρόβλημα είναι ότι οι υπογράφοι που εξετάζονται καθορίζονται εξ ολοκλήρου από τα δείγματα. Ο υπογράφοςgs a, k αποτελείται από όλα τα υποσύνολα του S a. 12

13 CLARANS-Clustering LARge Applications based on RANdomized Search (2) Έτσι ενώ ο CLARA χρησιμοποιεί τον PAM γιαναεξετάσειεξαντλητικάτοgs a, k η αναζήτηση περιορίζεται. Αν το ελάχιστο M βρίσκεται στον αρχικό γράφο αλλά όχι στον Gs a, k τότε o CLARA προφανώς δε μπορέσει ποτέ να το βρει. Ο CLARANS εν αντιθέσει με τον PAM εξετάζει μόνο ένα δείγμα αντικειμένων, όπως και ο CLARA δεν ψάχνει όλους τους γείτονες κάθε κόμβου. Όμως εν αντιθέσει με τον CLARA δεν περιορίζει την αναζήτηση σε ένα συγκεκριμένο υποσύνολο του γράφου αφού κάθε δείγμα που εξετάζεται σχηματίζεται δυναμικά έτσι ώστε να μη μένουν απ έξω κόμβοι που μπορεί να είναι χρήσιμοι για την ομαδοποίηση. Ενώ ο CLARA επιλέγεί ένα δείγμα από κόμβους στην αρχή της αναζήτησης, ο CLARANS επιλέγει ένα δείγμα από γείτονες σε κάθε βήμα διευρύνοντας έτσι το πεδίο αναζήτησης γεγονός που οδηγεί σε ομαδοποίηση καλύτερης ποιότητας με λιγότερες επαναλήψεις. 13

14 CLARANS αλγόριθμος (1) Βήμα 1: Θέσε τιμή στις παραμέτρους εισόδου numlocal και maxneighbor. Θέσε i=1 και το mincost ίσο με μια μεγάλη τιμή. Βήμα 2: Όρισε ως τρέχον ένα τυχαίο κόμβο του γράφου Gn,k. Βήμα 3: Θέσε j=1 Βήμα 4: Θεώρησε ένα τυχαίο γείτονα S του τρέχοντος κόμβου και υπολόγισε το κόστος διαφοράς μεταξύ των δύο κόμβων. Βήμα 5: Αν ο S έχει μικρότερο κόστος, κάνε τον S τρέχον κόμβο και πήγαινε στο βήμα (3). Βήμα 6: Διαφορετικά αύξησε το j κατά 1. Αν j<=maxneighbor, πήγαινε στο βήμα (4). Βήμα 7: Διαφορετικά, αν j>maxneighbor, σύγκρινε το κόστος του τρέχοντος κόμβου με το mincost. Αν το τρέχον είναι μικρότερο από το mincost θέσε ως mincost το κόστος του τρέχοντος και θέσε το τρέχον ως βέλτιστο κόμβο (bestnode). Βήμα 8:Αύξησε το i κατά 1. Αν i >numlocal, δώσε ως έξοδο το bestnode και σταμάτα. Διαφορετικά πήγαινε στο βήμα (2). 14

15 CLARANS παράμετροι maxneighbor: μέγιστος αριθμός γειτόνων που εξετάζονται. numlocal: η τιμή του τοπικού ελαχίστου που επιτυγχάνεται. Όσο μεγαλύτερη είναι η τιμή του maxneighbor τόσο ο CLARANS πλησιάζει τον PAM και τόσο περισσότερο διαρκεί η αναζήτηση του τοπικού ελαχίστου, ταυτόχρονα η ποιότητα του τοπικού ελαχίστου είναι καλύτερη και θα εξετάσουμε λιγότερα τοπικά ελάχιστα. Η τιμές των παραμέτρων προσδιορίζονται πειραματικά έτσι το numlocal τίθεται ίσο με 2, ενώ το maxneighbor ίσο με τη μέγιστη τιμή μεταξύ των 1,25% του k(n-k) και του

16 CLARANS vs PAM Η σύγκριση έγινε για μικρά σύνολα δεδομένων (40, 60, 80 και 100 αντικείμενα σε 5clusters)ως προς το χρόνο εκτέλεσης του αλγορίθμου. H ποιότητα των αλγορίθμων (μέση απόσταση) είναι παρόμοια. Ο CLARANS πλεονεκτεί σημαντικά όσον αφορά την αποδοτικότητα (Σχ.1) Σχήμα 1 16

17 CLARANS vs CLARA Η σύγκριση έγινε για μικρά σύνολα δεδομένων με περισσότερα από 100 αντικείμενα μια και ο CLARA δεν είναι σχεδιασμένος για μικρά σύνολα. Τα αντικείμενα ανήκαν σε διαφορετικές ομάδες και σε διαφορετικού τύπου ομάδες. Παρατηρώντας ότι παρότι ο CLARA μειονεκτούσε ως προς την ποιότητα σε σχέση με τον CLARANS, πολλές φορές τερμάτιζε γρηγορότερα. Δίνοντας τον ίδιο χρόνο στους δύο αλγορίθμους ο CLARANS και πάλι πλεονεκτεί (Σχ.3) Γιαδεδομένοαριθμόομάδωνόσο μεγαλύτερος είναι ο αριθμός των αντικειμένων τόσο μικραίνει το χάσμα μεταξύ CLARA και CLARANS (Σχ.3), γεγονός που εξηγείται από την πολυπλοκότητα των αλγορίθμων. Σχήμα 2 17

18 Αλγόριθμοι Εξόρυξης που βασίζονται σε ανάλυση ομαδοποίησης Θεωρούμε ότι οι χωρικές βάσεις δεδομένων αποτελούνται από χωρικά και μη χωρικά δεδομένα και ότι τα μη χωρικά συνδέονται μεταξύ τους με σχέσεις, Η γενική προσέγγιση είναι να εφαρμόσουμε ανάλυση ομαδοποίησης στα χωρικά δεδομένα και κάποιο άλλο εργαλείο όπως το DBLEARN γιαταμηχωρικάδεδομένα. To DBLEARN παίρνει ως είσοδο σχεσιακά δεδομένα, γενικευμένες ιεραρχίες για τα γνωρίσματα και μια ερώτηση/αίτηση. Στη συνέχεια με SQL επερωτήσεις εξάγει ένα σύνολο από σχετικές πλειάδες. Με βάση τις ιεραρχίες γνωρισμάτων, γενικεύει τις πλειάδες. Π.χ. Έστω ότι υποβάλλουμε μια αίτηση για τα γνωρίσματα <πλειοψηφία, εθνικότητα> και η ιεραρχία για την «εθνικότητα» έχει το Ασιάτες ως γενίκευση του Κινέζοι και Ινδοί. Τότε οι πλειάδες της μορφής <m, Κινέζοι>, <m, Ινδοί> να συγχωνεύονται στην πλειάδα <m, Ασιάτες>. Άλλο χαρακτηριστικό του DBLEARN είναι το γνώρισμα count που κρατάει τον αριθμό των αρχικώνπλειάδωνπρογενίκευσηςστηβδ. Έτσι μπορεί να εξάγει προτάσεις «Το 8% των φοιτητών κοινωνιολογίας είναι Ασιάτες» ή αποτελέσματα περαιτέρω γενικεύσεων π.x. «Το 90% των φοιτητών Τεχνών είναι Καναδοί» (εδώ το μη-καναδοί αποτελεί γενίκευση του Ασιάτης). 18

19 SD(CLARANS) και NSD(CLARANS) Υπάρχουν δύο τρόποι να συνδυάσουμε τον CLARANS με το DBLEARN Προσέγγιση όπου κυριαρχούν τα χωρικά δεδομένα (Spatial Dominant) Προσέγγιση όπου κυριαρχούν τα μη χωρικά δεδομένα (Νon Spatial Dominant) Στην SD(CLARANS) αλγόριθμο πρώτα γίνεται η ομαδοποίηση των χωρικών δεδομένων και στη συνέχεια γίνεται η γενίκευση των πλειάδων των μη χωρικών δεδομένων. Στον ΝSD(CLARANS) αλγόριθμο η ανακάλυψη των ομάδων στα χωρικά δεδομένα γίνεται μέσα από τις πλειάδες των μη χωρικών δεδομένων, μια και συσταδοποίηση με βάση τα μη χωρικά γνωρίσματα προηγείται. Αντίστοιχα θα μπορούσαμε να εφαρμόσουμε SD(PAM) ή SD(CLARA), αλλά όπως είδαμε ο CLARANS πετυχαίνει πιο αποδοτικά καλύτερη ομαδοποίηση. Ο SD(CLARANS) πλεονεκτεί έναντι άλλων μεθόδων που προτάθηκαν στο παρελθόν (Lu et al. 1993) και ακολουθούσαν παρόμοια λογική συνδυασμού DBLEARN και αλγορίθμου εξόρυξης χωρικών δεδομένων στο ότι ο CLARANS μέσω της ομαδοποίησης εξάγει την ιεραρχία απευθείας μέσα από τα χωρικά δεδομένα και δεν απαιτεί a priori γνώση της ιεραρχίας. 19

20 SD(CLARANS) αλγόριθμος Βήμα 1: Βρες το αρχικό σύνολο σχετικών πλειάδων με τις αντίστοιχες SQL επερωτήσεις. Βήμα 2: Εφάρμοσε τον CLARANS στα χωρικά γνωρίσματα και βρες το πιο φυσικό αριθμό knat ομάδων. Βήμα 3:Για κάθε ένα από τις knat ομάδες που σχηματίστηκαν a. Συγκέντρωσε τα μη-χωρικάμέρητωνπλειάδωνπουπεριλαμβάνονται στην ομάδα b. Εφάρμοσε DBLEARN σε αυτή τη συλλογή από τα μη-χωρικά δεδομένα. 20

21 Προσδιορισμός του k nat (1) k nat : ο πιο φυσικός αριθμός ομάδων για ένα συγκεκριμένο σύνολο δεδομένων. Δεν είναι εκ των προτέρων γνωστό. Ο προσδιορισμός του αποτελεί σημαντικό πρόβλημακαιδενυπάρχειέναςκαιμοναδικός τρόπος να εκτιμηθεί. Η ευρεστική μέθοδος που εφαρμόζεται εδώ είναι βασίζεται στον υπολογισμού του εύρους περιγράμματος (silhouette width). To περίγραμμα (silhouette) ενός αντικειμένου Oj, είναι ένας αριθμός από το 1 ως 1 που δηλώνει κατά πόσο το αντικείμενο Oj ανήκει στην ομάδα του. Εύρος περιγράμματος: ενός cluster είναι ο μέσος όρος των silhouette όλων των αντικειμένων στο cluster. Εύρος περιγράμματος Ερμηνεία 0,71-1 Πολύ καλή 0,51-0,7 Ικανοποιητική 0,25-0,5 Κακή <=0,25 Δε βρέθηκε 21

22 Προσδιορισμός του k nat (2) Βήμα 1: Βρες το k με το μεγαλύτερο συντελεστή περιγράμματος (silhouette coefficient). Βήμα 2: Αν όλες οι k ομάδες έχουν εύρος περιγράμματος k nat >=0,51, θέσε k nat = k και τερμάτισε. Βήμα 3: Διαφορετικά, αφαίρεσε από τη συγκεκριμένη ομάδα τα αντικείμενα με εύρος περιγράμματος μικρότερο του 0,5 εφόσον ο αριθμός των αντικειμένων που αφαιρούνται δεν ξεπερνά ένα συγκεκριμένο κατώφλι (π.χ. 25% του συνολικού πληθυσμού). Τα αντικείμενα που αφαιρούνται θεωρούνται μεμονωμένα σημεία(outliers) ή θόρυβος. Επέστρεψε στο βήμα(1) εξετάζοντας το νέο σύνολο δεδομένων χωρίς τα μεμονωμένα σημεία. Βήμα 4: Αν στο βήμα (3) ο αριθμός των μεμονωμένων σημείων που πρέπει να αφαιρεθούν ξεπερνά το κατώφλι, απλά θέσε k nat = 1 δηλώνοντας έτσι ότι καμία ομαδοποίηση δεν είναι εύλογη. 22

23 ΝSD(CLARANS) αλγόριθμος Βήμα 1: Βρες το αρχικό σύνολο σχετικών πλειάδων με τις αντίστοιχες SQL επερωτήσεις. Βήμα 2: Εφάρμοσε DBLEARN στα μη χωρικά δεδομένα μέχρι ο τελικός αριθμός των πλειάδων να πέσει κάτω από ένα συγκεκριμένο κατώφλι. Βήμα 3: Για κάθε μια πλειάδα από τις παραπάνω a. Συγκέντρωσε τα χωρικά μέρη των πλειάδων που αναπαρίστανται από την τρέχουσα πλειάδα. b. Εφάρμοσε CLARANS και βρες ευρεστικά το k nat (όπως και πιο πάνω) για την εύρεση του πιο φυσικού αριθμού ομάδων. Βήμα 4: Γιακάθεμιαομάδααπόαυτέςπουσχηματίστηκανπιοπάνω, έλεγξε αν υπάρχουν ομάδες που τέμνονται ή επικαλύπτονται. Αν υπάρχουν τέτοιες ομάδες πρέπει να συγχωνευτούν. 23

24 Η αξιολόγηση-παράδειγμα (1) Ένας τρόπος να αξιολογήσουμε την απόδοση ενός αλγορίθμου εξόρυξη δεδομένων είναι να τον εφαρμόσουμε σε ένα πραγματικό σύνολο δεδομένων και να δούμε τι θα βγάλει! Επειδή είναι δύσκολο τις περισσότερες φορές να ξέρουμε εκ των προτέρων τι περιμένουμε να βγάλει, συνήθως αναπαράγουμε δεδομένα με συγκεκριμένους κανόνες που είναι κοντά στην πραγματικότητα. Παράδειγμα -Ομαδοποίηση 2500 οικιακών μονάδων στο Vancouver A) Πληροφορίες για το μέγεθος, την τιμή και τον τύπο Αν ο τύπος της οικίας είναι μέγαρο τη τιμή βρίσκεται στο διάστημα [1500,3500] κα το μέγεθος στο [6000, 10000] τετραγωνικά πόδια. Αν ο τύπος της οικίας είναι μονοκατοικία η τιμή είναι στο [800,1500] και το μέγεθος [3000, 7000] τετραγωνικά πόδια. Αν ο τύπος της οικίας είναι διαμέρισμα πολυκατοικίας η τιμή είναι στο [300,800] και το μέγεθος [1000,2500] τετραγωνικά πόδια. 24

25 Η αξιολόγηση-παράδειγμα (2) Β) Κατανομή Υπάρχουν 1200 διαμερίσματα στην περιοχή του κέντρου (Β1) Υπάρχουν περίπου 320 μέγαρα και 80 μονοκατοικίες στην περιοχή κατά μήκος του Marine Drive (Β2). Υπάρχουν περίπου 800 μονοκατοικίες γύρω από το Queen Elizabeth Park(B3). Τέλος υπάρχουν 100 μονοκατοικίες διασκορπισμένες σε διάφορα σημεία στο Vancouver. Β4 Β1 Β3 Β2 Σχήμα 3 25

26 Αποτελέσματα SD(CLARANS) (1) Ο SD(CLARANS) έθεσε k nat =3, με συντελεστή περιγράμματος 0,7 προσδιόρισε δηλ. 3 ομάδες με πολύ καλή ομαδοποίηση. Έτσι τα βήματα (3) και (4) του αλγορίθμου παραλήφθηκαν. Μετά τον προσδιορισμό του k nat ο CLARANS έκανε 25sec γιαναξεχωρίσειτις3 ομάδες. Η 1η ομάδα περιλάμβανε 832 αντικείμενα τα οποία ήταν όλα μονοκατοικίες και εκ των οποίων τα 800 είναι αυτά της περιοχής B3 του σχήματος. Γιατηνομάδααυτή σωστά ο DBLEARN βρίσκει ότι η τιμή και το μέγεθος είναι στο [800,1500] και [3000, 7000] αντίστοιχα. Η 2η ομάδα περιλάμβανε 1235 αντικείμενα, 1200 εκτωνοποίωνήτανδιαμερίσματα σε πολυκατοικίες είναι αυτά της περιοχής B1 του σχήματος και τα υπόλοιπα μονοκατοικίες 35. Και για τους δύο τύπους ο DBLEARN ανακάλυψε σωστά τα διαστήματα όπου κυμαίνονται οι τιμές κόστους και μεγέθους. 26

27 Αποτελέσματα SD(CLARANS) (2) Η 3η ομάδα περιλάμβανε 431 αντικείμενα, 320 εκτωνοποίωνήτανμέγαρα(όλα τα αντικείμενα της περιοχής B2) καιταυπόλοιπαμονοκατοικίες. ΚαιπάλιοDBLEARN ανακάλυψε σωστά τα διαστήματα όπου κυμαίνονται οι τιμές κόστους και μεγέθους τόσογιαταμέγαραόσοκαιγιατιςμονοκατοικίες. O SD(CLARANS) είναι αποδοτικός και αποτελεσματικός αφού και ο CLARANS έκανε τη σωστή ομαδοποίηση, παρά την ύπαρξη των μεμονωμένων σημείων (περιοχή Β4) και ο DBLEARN εξήγαγε τη σωστή πληροφορία από τα μη χωρικά δεδομένα. 27

28 Αποτελέσματα NSD(CLARANS) (1) Στο βήμα (2) του NSD(CLARANS) ο DBLEARN βρίσκει 12 πλειάδες, 4 για κάθε ένα τύπο οικιών. Αν δούμε τις 4 πλειάδες για τον τύπο μέγαρο έχουμε: 1. Τιμή στο [1500, 2600], μέγεθος στο [6000, 8500] 2. Τιμή στο [1500, 2600], μέγεθος στο [8500,10000] 3. Τιμή στο [2600,3500], μέγεθος στο [6000, 8500] 4. Τιμή στο [2600, 3500], μέγεθος στο [8500,10000] Όπωςφαίνεταιστοσχήμααπότηνχωρική κατανομή των οικιών τύπου μέγαρο, όταν ο CLARANSεφαρμόζεται στα σημεία του γράφου, βρίσκει 2 ομάδες. + ομάδα 1 ομάδα 2 Σχήμα 4 Στο βήμα (4) του NSD(CLARANS) συγχωνεύονται οι ομάδες που παρουσιάζουν επικάλυψη και ο αλγόριθμος βρίσκει ότι όλα τα μέγαρα βρίσκονται στην περιοχή Β2. 28

29 Αποτελέσματα NSD(CLARANS) (2) Αντίστοιχα οι 4 πλειάδες για τον τύπο διαμέρισμα πολυκατοικίας είναι: 1. Τιμή στο [300, 600], μέγεθος στο [1000, 1800] 2. Τιμή στο [300, 600], μέγεθος στο [1800, 2500] 3. Τιμή στο [600, 800], μέγεθος στο [1000, 1800] 4. Τιμή στο [600, 800], μέγεθος στο [1800, 2500] Η διαφορά εδώ είναι ότι για τις 4 πλειάδες δε βρέθηκε καμία ομάδα (είχαμε knat=1) και έτσι ο αλγόριθμος συγχώνεψε όλα τις περιοχές σε μια που αντιστοιχεί ακριβώς μετην περιοχή B1 του σχ.2 Για τις 4 πλειάδες που αντιστοιχούν τύπο στις μονοκατοικίες : 1. Τιμή στο [1200, 1500], μέγεθος στο [3000, 5000] 2. Τιμή στο [1200, 1500], μέγεθος στο [5500, 7000] 3. Τιμή στο [800, 1200], μέγεθος στο [3000, 5000] 4. Τιμή στο [800, 1200], μέγεθος στο [5500, 7000] Εδώ τα πράγματα είναι λίγο πιο πολύπλοκα αφού για κάποιες κατηγορίες ο συντελεστής περιγράμματος ήταν μικρότερος του 0,5 και έπρεπε να αφαιρεθούν κάποια σημεία ως outliers. Μετά την αφαίρεση αυτή εντοπίστηκαν 2 ομάδες μια που αντιστοιχούσε στην περιοχή Β2 και μια στην Β3. Τέλος ο αλγόριθμος προσδιόρισε σωστά τα διαστήματα για τις τιμές κόστους και μεγέθους για τις μονοκατοικίες. 29

30 Σύγκριση των SD και NSD Τόσο ο SD(CLARANS) όσο και ο NSD(CLARANS) φαίνεται ότι κατέληξαν στα αναμενόμενα αποτελέσματα σύμφωνα με τα δεδομένα και τους κανόνες με τους οποίους παράχθηκαν. Ο SD(CLARANS) πλεονεκτεί όσον αφορά την απόδοση, αφούηπρόωρηεφαρμογήτου CLARANS οδηγεί σε άμεσο καθορισμό των ομάδων. Αντίθετα ο NSD(CLARANS) αρχικά υποδιαιρεί το σύνολο σε μικρότερες συστάδες/πλειάδες γεγονός που έχει ως αποτέλεσμα να σπάει τη συνοχή κάποιων ομάδων και να χρειάζεται η απομάκρυνση των μεμονωμένων σημείων. Αυτή η διαδικασία, όπως και η συγχώνευση των ομάδων που τέμνονται ή επικαλύπτονται κοστίζουν σε χρόνο. Ωστόσο για να είμαστε δίκαιοι πρέπει να ομολογήσουμε ότι το συγκεκριμένο παράδειγμα και η κατανομή των δεδομένων ευνοεί τον SD(CLARANS) μια και δίνεται έμφαση στην εξαγωγή μη χωρικών δεδομένων από ομάδες χωρικών δεδομένων, γεγονός που είναι χαρακτηριστικό τωναλγορίθμωνπουκυριαρχούνταχωρικάδεδομένα. Αντίθετα ένας αλγόριθμος όπου κυριαρχούνταμηχωρικάδεδομέναεστιάζειστο να βρει ομάδες χωρικών δεδομένων μέσα από συστάδες μη χωρικών δεδομένων. Έτσι αν στο παράδειγμά μας η χωρική κατανομή για τις μονοκατοικίες καθορίζονταν από την τιμή και το μέγεθος πιθανώς ο NSD(CLARANS) θα μπορούσε να ήταν αποδοτικότερος του SD(CLARANS) 30

31 Συμπεράσματα Πέρα από το γεγονός ότι η μέθοδος ομαδοποίησης CLARANS είναι αποδοτική και αποτελεσματική, η ομαδοποίηση δίνει την ευκαιρία να ανακαλύψουμε σχέσεις μεταξύ των ομάδων και άλλων ενδιαφέρον αντικειμένων. Π.χ. στο παράδειγμά μας μπορούμε να συσχετίσουμε τις οικιακές μονάδες με διάφορους χάρτες και αντικείμενα όπως λεωφόρους, λίμνες, πάρκα κτλ και να εξάγουμε πληροφορία όπως «Το 96% τωνοικιώντηςομάδας1 απέχουν 0,6 km από το Queen Elizabeth Park. Μελλοντικές προτάσεις Εξέλιξη της υλοποίησης που παρουσιάσαμε θα μπορούσε να είναι ένας αλγόριθμος που συνδυάζει τον SD και NSD CLARANS και θα λειτουργεί έτσι ώστε να εφαρμόζεται προσέγγιση όπου κυριαρχούν τα χωρικά ή μη χωρικά δεδομένα ανάλογα με το αν προσδιορίζονται καλής ποιότητας συστάδες ή ομάδες αντίστοιχα, σε κάθε βήμα. Οι χωρικές βάσεις δεδομένων μπορούν να σχετίζονται με πολλαπλούς θεματικούς χάρτες. Η εξόρυξη χωρικών δεδομένων σε μια ενιαία εφαρμογή που συνδυάζει και άλλες χωρικές λειτουργίεςόπωςπολλαπλούςθεματικούςχάρτεςαποτελείπρόκληση. Τα χωρικά δεδομένα που εξετάσαμε μέχρι εδώ είναι σημειακά, ενώ θα μπορούσαν να είναι περιοχές ή γραμμές. Το πώς θα μπορούσε ο αλγόριθμος να προσαρμοστεί ώστε να χειρίζεται χωρικά δεδομένα τύπου γραμμών, ώστε να εξετάζουμε π.χ. το πώς τοποθετούνται οι λεωφόροι σε μια πόλη παραμένει ως ερώτημα. 31

32 Ευχαριστώ! 32

33 Βιβλιογραφία R. Agrawal, S. Ghosh, T. Imielinski, B. Iyer,and A. Swami. (1992) An Interval Classifier for Database Mining Applications, Proc. 18thVLDB, pp R. AgrawaI, T. Imielinski, and A. Swami. (1993)Mining Association Rules between Sets of Items in Large Databases, Proc SIGMOD, pp W. G. Aref and H. Samet. (1991) Optimization Strategies for Spatial Query Processing, Proc. 17th VLDB, pp A. Borgida and R. J. Brachman (1993) Loading Data into Description Reasoners, Proc SIGMOD, pp T. Brinkhoff and H.-P. Kriegel and B. Seeger (1993) Eficient Processing of Spatial Joins Using R-trees, Proc SIGMOD, pp Ο.Giinther. (1993) Efficient Computation ofspatial Joins, Proc. 9th Data Engineering, pp J. Han, Y. Cai and N. Cercone. (1992) Knowledge Discovery in Databases: an Attribute-Oriented Approach, Proc. 18th VLDB, pp Y. Ioannidis and Y. Kang. (1990) Randomized Algorithms for Optimizing Large Join Queries, Proc SIGMOD, pp Y. Ioannidis and E. Wong. (1987) Query Optimization by Simulated Annealing, Proc SIGMOD, pp

34 Βιβλιογραφία L. Kaufman and P.J. Rousueeuw. (1990) Finding Groups in Data: an Introduction to Cluster Analysis, John Wiley & Sons. D. Keim and H. Kriegel and T. Seidl. (1994) Supporting Data Mining of Large Databases by Visual Feedbach Queries, Proc. 10th Data Engineering,pp R. Laurini and D. Thompson. (1992) Fundamentals of Spatial Information Systems, Academic Press. W. Lu, J. Han and B. C. Ooi. (1993) Discovery of General Knowledge in Large Spatial Databases,Proc. Far East Workshop on Geographic Information Systems, Singapore, pp G. Milligan and M. Cooper. (1985) An Ezamination of Procedures for Determining the Number of Clusters in a Data Set, Psychometrika, 50, pp R. Ng and J. Han. (1994) Effective and EflectiveClustering Methods for Spatial Data Mining,Technical Report 9413, University of British Columbia. G. Piatetsky-Shapiro and W. J. Frawley. (1991) Knowledge Discove y in Databases, AAAI/MIT Press. H. Samet. (1990) The Design and Analysis of Spatial Data Structures, Addison- Wesley. H. Spath. (1985) Cluster Dissection and Analysis: Theory, FORTRAN programs, Examples, Ellis Horwood Ltd. 34

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Δ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων

Clustering. Αλγόριθµοι Οµαδοποίησης Αντικειµένων Clustering Αλγόριθµοι Οµαδοποίησης Αντικειµένων Εισαγωγή Οµαδοποίηση (clustering): οργάνωση µιας συλλογής από αντικείµενα-στοιχεία (objects) σε οµάδες (clusters) µε βάση κάποιο µέτρο οµοιότητας. Στοιχεία

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Γνώσης από Χωρικά εδοµένα (spatial data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Γ http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

substructure similarity search using features in graph databases

substructure similarity search using features in graph databases substructure similarity search using features in graph databases Aleksandros Gkogkas Distributed Management of Data Laboratory intro Θα ενασχοληθούμε με το πρόβλημα των ερωτήσεων σε βάσεις γραφημάτων.

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση

Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση (clustering) Γιάννης Θεοδωρίδης, Νίκος Πελέκης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 9: Ομαδοποίηση Μέρος Γ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

Ανάλυση κατά Συστάδες. Cluster analysis

Ανάλυση κατά Συστάδες. Cluster analysis Ανάλυση κατά Συστάδες Cluster analysis 1 H ανάλυση κατά συστάδες είναι µια µέθοδος που σκοπό έχει να κατατάξει σε οµάδες τις υπάρχουσες παρατηρήσεις χρησιµοποιώντας την πληροφορία που υπάρχει σε κάποιες

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση Γιάννης Θεοδωρίδης Οµάδα ιαχείρισης εδοµένων Εργαστήριο Πληροφοριακών Συστηµάτων http://isl.cs.unipi.gr/db

Διαβάστε περισσότερα

Επερωτήσεις σύζευξης με κατάταξη

Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις σύζευξης με κατάταξη Επερωτήσεις κατάταξης Top-K queries Οι επερωτήσεις κατάταξης επιστρέφουν τις k απαντήσεις που ταιριάζουν καλύτερα με τις προτιμήσεις του χρήστη. Επερωτήσεις κατάταξης Top-K

Διαβάστε περισσότερα

Επίλυση Προβλημάτων 1

Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων 1 Επίλυση Προβλημάτων Περιγραφή Προβλημάτων Αλγόριθμοι αναζήτησης Αλγόριθμοι τυφλής αναζήτησης Αναζήτηση πρώτα σε βάθος Αναζήτηση πρώτα σε πλάτος (ΒFS) Αλγόριθμοι ευρετικής αναζήτησης

Διαβάστε περισσότερα

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Μέθοδοι μονοδιάστατης ελαχιστοποίησης Βασικές αρχές μεθόδων ελαχιστοποίησης Μέθοδοι μονοδιάστατης ελαχιστοποίησης Οι μέθοδοι ελαχιστοποίησης είναι επαναληπτικές. Ξεκινώντας από μια αρχική προσέγγιση του ελαχίστου (την συμβολίζουμε ) παράγουν

Διαβάστε περισσότερα

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ Δομή παρουσίασης Εισαγωγή Βασικές Έννοιες Σχετικές μελέτες Εφαρμογή Δεδομένων Συμπεράσματα Εισαγωγή Μελέτη και προσαρμογή των διάφορων

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 12ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 12ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 12ο ΑΙΤΙΟΤΗΤΑ Ένα από τα βασικά προβλήματα που υπάρχουν στην εξειδίκευση ενός υποδείγματος είναι να προσδιοριστεί η κατεύθυνση που μία μεταβλητή

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα Αλγόριθμοι και Πολυπλοκότητα Εισαγωγή Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Βιβλιογραφία Jon Kleinberg και Éva Tardos, Σχεδιασμός αλγορίθμων, Εκδόσεις Κλειδάριθμος,

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

6. Στατιστικές μέθοδοι εκπαίδευσης

6. Στατιστικές μέθοδοι εκπαίδευσης 6. Στατιστικές μέθοδοι εκπαίδευσης Μία διαφορετική μέθοδος εκπαίδευσης των νευρωνικών δικτύων χρησιμοποιεί ιδέες από την Στατιστική Φυσική για να φέρει τελικά το ίδιο αποτέλεσμα όπως οι άλλες μέθοδοι,

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων

Διαβάστε περισσότερα

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ ΑΕΙ ΠΕΙΡΑΙΑ ΤΤ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ Τ.Ε. ΕΡΓΑΣΤΗΡΙΟ ΜΗΧΑΝΙΚΗΣ ΤΩΝ ΡΕΥΣΤΩΝ Σκοπός της άσκησης 1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ Σκοπός αυτής της άσκησης είναι η εξοικείωση των σπουδαστών με τα σφάλματα που

Διαβάστε περισσότερα

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης Μάθημα 4 ο Δρ. Ανέστης Γ. Χατζημιχαηλίδης Τμήμα Μηχανικών Πληροφορικής Τ.Ε. ΤΕΙ Ανατολικής Μακεδονίας και Θράκης 2016-2017 Διευρυμένη Υπολογιστική Νοημοσύνη (ΥΝ) Επεκτάσεις της Κλασικής ΥΝ. Μεθοδολογίες

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Λογική Δημήτρης Πλεξουσάκης Φροντιστήριο 6: Προτασιακός Λογισμός: Μέθοδος Επίλυσης Τμήμα Επιστήμης Υπολογιστών

Λογική Δημήτρης Πλεξουσάκης Φροντιστήριο 6: Προτασιακός Λογισμός: Μέθοδος Επίλυσης Τμήμα Επιστήμης Υπολογιστών Λογική Δημήτρης Πλεξουσάκης Φροντιστήριο 6: Προτασιακός Λογισμός: Μέθοδος Επίλυσης Τμήμα Επιστήμης Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται στην άδεια χρήσης Creative Commons και

Διαβάστε περισσότερα

Η αβεβαιότητα στη μέτρηση.

Η αβεβαιότητα στη μέτρηση. Η αβεβαιότητα στη μέτρηση. 1. Εισαγωγή. Κάθε μέτρηση, όσο προσεκτικά και αν έχει γίνει, περικλείει κάποια αβεβαιότητα. Η ανάλυση των σφαλμάτων είναι η μελέτη και ο υπολογισμός αυτής της αβεβαιότητας στη

Διαβάστε περισσότερα

Λυσεις προβλημάτων τελικής φάσης Παγκύπριου Μαθητικού Διαγωνισμού Πληροφορικής 2007

Λυσεις προβλημάτων τελικής φάσης Παγκύπριου Μαθητικού Διαγωνισμού Πληροφορικής 2007 Λυσεις προβλημάτων τελικής φάσης Παγκύπριου Μαθητικού Διαγωνισμού Πληροφορικής 2007 Πρόβλημα 1 Το πρώτο πρόβλημα λύνεται με τη μέθοδο του Δυναμικού Προγραμματισμού. Για να το λύσουμε με Δυναμικό Προγραμματισμό

Διαβάστε περισσότερα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 4 Χάραξη Καμπύλης, Ελάχιστα Τετράγωνα

ΑΣΚΗΣΗ 4 Χάραξη Καμπύλης, Ελάχιστα Τετράγωνα Σκοπός ΑΣΚΗΣΗ 4 Χάραξη Καμπύλης, Ελάχιστα Τετράγωνα Σκοπός της άσκησης αυτής είναι ο σπουδαστής να μπορέσει να παρουσιάζει τα αποτελέσματα πειραματικών μετρήσεων σε μορφή καμπυλών και να μπορέσει εν τέλει

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ Επικ. Καθ. Στέλιος Ζήμερας Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά 015 Ανάλυση Διακύμανσης Η Ανάλυση Διακύμανσης είναι μία τεχνική που

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η Μονοδιάστατοι Πίνακες Τι είναι ο πίνακας γενικά : Πίνακας είναι μια Στατική Δομή Δεδομένων. Δηλαδή συνεχόμενες θέσεις μνήμης, όπου το πλήθος των θέσεων είναι συγκεκριμένο. Στις θέσεις αυτές καταχωρούμε

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Επεξεργασία Ερωτήσεων Αρχεία ευρετηρίου Κατάλογος συστήματος Αρχεία δεδομένων ΒΑΣΗ Ε ΟΜΕΝΩΝ Σύστημα Βάσεων εδομένων (ΣΒ ) Βάσεις Δεδομένων 2007-2008

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Κλείσιμο Συνόλου Γνωρισμάτων

Κλείσιμο Συνόλου Γνωρισμάτων Κλείσιμο Συνόλου Γνωρισμάτων Ο υπολογισμός του κλεισίματος ενός συνόλου από ΣΕ μας δίνει τα σύνολα όλων των γνωρισμάτων τα οποία προσδιορίζονται συναρτησιακά από άλλα σύνολα γνωρισμάτων Ο υπολογισμός αυτός

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα,

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Ηλίας Κ. Σάββας Εξόρυξη Δεδομένων Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα, Μετατροπή δεδομένων σε ΠΛΗΡΟΦΟΡΙΑ, Πολλά δεδομένα αποθηκευμένα

Διαβάστε περισσότερα

Συναρτησιακές Εξαρτήσεις

Συναρτησιακές Εξαρτήσεις Συναρτησιακές Εξαρτήσεις Βάσεις Δεδομένων 2009-2010 Ευαγγελία Πιτουρά 1 Εισαγωγή Θεωρία για το πότε ένας σχεδιασμός είναι «καλός» Η θεωρία βασίζεται στις Συναρτησιακές Εξαρτήσεις (Functional Dependencies)

Διαβάστε περισσότερα

Δομές Δεδομένων (Data Structures)

Δομές Δεδομένων (Data Structures) Δομές Δεδομένων (Data Structures) Ανάλυση - Απόδοση Αλγορίθμων Έλεγχος Αλγορίθμων. Απόδοση Προγραμμάτων. Χωρική/Χρονική Πολυπλοκότητα. Ασυμπτωτικός Συμβολισμός. Παραδείγματα. Αλγόριθμοι: Βασικές Έννοιες

Διαβάστε περισσότερα

Κεφάλαιο 6. Ικανοποίηση Περιορισµών. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 6. Ικανοποίηση Περιορισµών. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 6 Ικανοποίηση Περιορισµών Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Ικανοποίηση Περιορισµών Ένα πρόβληµα ικανοποίησης περιορισµών (constraint

Διαβάστε περισσότερα

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Συμπληρωματικές σημειώσεις για τον μηχανισμό VCG 1 Εισαγωγή στις Συνδυαστικές

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ: ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ (Πάτρας) Διεύθυνση: Μεγάλου Αλεξάνδρου 1, 263 34 ΠΑΤΡΑ Τηλ.: 2610 369051, Φαξ: 2610 396184, email: mitro@teipat.gr Καθηγητής

Διαβάστε περισσότερα

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι: Χωρική Ανάλυση Ο σκοπός χρήσης των ΣΓΠ δεν είναι μόνο η δημιουργία μίας Β.Δ. για ψηφιακές αναπαραστάσεις των φαινομένων του χώρου, αλλά κυρίως, η βοήθειά του προς την κατεύθυνση της υπόδειξης τρόπων διαχείρισής

Διαβάστε περισσότερα

BIRCH: : An Efficient Data Clustering Method for Very Large Databases

BIRCH: : An Efficient Data Clustering Method for Very Large Databases BIRCH: : An Efficient Data Clustering Method for Very Large Databases Tian Zhang Raghu Ramakrishnan Miron Livny Παρουσίαση: Μαρία Καθηγητής: Μιχάλης Μάθημα: Θέματα Μαρία Δήμα Μιχάλης Χατζόπουλος Θέματα

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία

Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων. Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία Οργάνωση Βάσεων Βιοϊατρικών Δεδομένων Εξόρυξη Γνώσης Βιοϊατρικών Δεδομένων Σεμινάριο 6, μέρος 2 ο : Δομές ευρετηρίων για αρχεία Ευάγγελος Καρκαλέτσης, Αναστασία Κριθαρά, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας

Διαβάστε περισσότερα

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) 2.882 E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) 4.063 E04 R SQUARE (i) PARAMETER

SOURCE DF SUM OF SQUARES MEAN SQUARE F VALUE PR F MODEL (a) 2.882 E04 (e) (g) (h) ERROR (b) (d) (f) TOTAL (c) 4.063 E04 R SQUARE (i) PARAMETER ΑΣΚΗΣΕΙΣ. Θεωρήστε το παράδειγμα που αναφέρεται στη συσχέτιση του βαθμού ικανοποίησης των εργαζομένων σε ένα εργαστήριο σε σχέση με τις οκτώ μεταβλητές που ορίστηκαν εκεί. (Χ =ηλικία, Χ =φύλο, Χ =εβδομαδιαίος

Διαβάστε περισσότερα

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Τρόποι και μέθοδοι δειγματοληψίας

ΙΕΚ ΞΑΝΘΗΣ. Μάθημα : Στατιστική Ι. Υποενότητα : Τρόποι και μέθοδοι δειγματοληψίας ΙΕΚ ΞΑΝΘΗΣ Μάθημα : Στατιστική Ι Υποενότητα : Τρόποι και μέθοδοι δειγματοληψίας Επαμεινώνδας Διαμαντόπουλος Ιστοσελίδα : http://users.sch.gr/epdiaman/ Email : epdiamantopoulos@yahoo.gr 1 Στόχοι της υποενότητας

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Παπαδάκης Χαράλαμπος 1, Παναγιωτάκης Κώστας 2, Παρασκευή Φραγκοπούλου 1 1 Τμήμα Μηχ/κών Πληροφορικής, ΤΕΙ Κρήτης 2 Τμήμα

Διαβάστε περισσότερα

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία

Διαβάστε περισσότερα

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εισαγωγή στην Επεξεργασία Ερωτήσεων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Εισαγωγή στην Επεξεργασία Ερωτήσεων Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Επεξεργασία Ερωτήσεων Θα δούμε την «πορεία» μιας SQL ερώτησης (πως εκτελείται) Ερώτηση SQL Ερώτηση ΣΒΔ Αποτέλεσμα Βάσεις

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές αναζήτησης και ρ δείκτες ως εξής P 1 K 1 P

Διαβάστε περισσότερα

Απαλλακτική Εργασία Γραφικά & Εικονική Πραγματικότητα. Παπαπαύλου Χρήστος ΑΜ: 6609

Απαλλακτική Εργασία Γραφικά & Εικονική Πραγματικότητα. Παπαπαύλου Χρήστος ΑΜ: 6609 Απαλλακτική Εργασία Γραφικά & Εικονική Πραγματικότητα Παπαπαύλου Χρήστος ΑΜ: 6609 Αναπαράσταση μοντέλου Το 3D μοντέλο το αποθηκεύουμε στην μνήμη με τις εξής δομές δεδομένων: Λίστα κορυφών Λίστα τριγώνων

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων

Εισαγωγή στην. Εισαγωγή Σ Β. Αρχεία ευρετηρίου Κατάλογος. συστήματος. Αρχεία δεδομένων Εισαγωγή στην Επεξεργασία Ερωτήσεων 1 Εισαγωγή Σ Β Σύνολο από προγράμματα για τη διαχείριση της Β Αρχεία ευρετηρίου Κατάλογος ΒΑΣΗ Ε ΟΜΕΝΩΝ Αρχεία δεδομένων συστήματος Σύστημα Βάσεων εδομένων (ΣΒ ) 2 :

Διαβάστε περισσότερα

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εργασία στο µάθηµα Ανάλυση εδοµένων Μεταπτυχιακό Υπολογιστικής Φυσικής Εργασία στο µάθηµα Ανάλυση εδοµένων ηµήτρης Κουγιουµτζής E-mail: dkugiu@gen.auth.gr 31 Ιανουαρίου 2017 Οδηγίες : Σχετικά µε την παράδοση της εργασίας ϑα πρέπει : Το κείµενο

Διαβάστε περισσότερα

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing)

Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) ΕΠΛ231 Δομές Δεδομένων και Αλγόριθμοι 1 Διάλεξη 23: Τεχνικές Κατακερματισμού II (Hashing) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: - Διαχείριση Συγκρούσεων με Ανοικτή Διεύθυνση a) Linear

Διαβάστε περισσότερα

Συναρτησιακές Εξαρτήσεις Σχεδιασμός Βάσεων Δεδομένων

Συναρτησιακές Εξαρτήσεις Σχεδιασμός Βάσεων Δεδομένων Συναρτησιακές Εξαρτήσεις Σχεδιασμός Βάσεων Δεδομένων Μαρία Χαλκίδη 1 Εισαγωγή Θεωρία για το πότε ένας σχεδιασμός είναι «καλός» Η θεωρία βασίζεται στις Λειτουργικές (Συναρτησιακές) Εξαρτήσεις (Functional

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Κβάντιση Δρ. Ν. Π. Σγούρος 2 Άσκηση 5.1 Για ένα σήμα που έχει τη σ.π.π. του σχήματος να υπολογίσετε: μήκος του δυαδικού κώδικα για Ν επίπεδα κβάντισης για σταθερό μήκος λέξης;

Διαβάστε περισσότερα

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION)

ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) 4. ΜΕΘΟΔΟΣ ΤΗΣ ΒΗΜΑΤΙΚΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ (STEPWISE REGRESSION) Η μέθοδος της βηματικής παλινδρόμησης (stepwise regression) είναι μιά άλλη μέθοδος επιλογής ενός "καλού" υποσυνόλου ανεξαρτήτων μεταβλητών.

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

Συναρτησιακές Εξαρτήσεις

Συναρτησιακές Εξαρτήσεις Συναρτησιακές Εξαρτήσεις Βάσεις Δεδομένων 2010-2011 Ευαγγελία Πιτουρά 1 Εισαγωγή Θεωρία για το πότε ένας σχεδιασμός είναι «καλός» Η θεωρία βασίζεται στις Συναρτησιακές Εξαρτήσεις (Functional Dependencies)

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς Detecting Duplicates over Distributed Data Sources Δημήτρης Σουραβλιάς Δομή παρουσίασης Εισαγωγή Ορισμός του προβλήματος Παράδειγμα Αρχιτεκτονικές ανίχνευσης διπλότυπων Γενικές παρατηρήσεις Αναφορές DMOD

Διαβάστε περισσότερα

Επιβλέπων καθηγητής: Βασίλειος Μεγαλοοικονόμου

Επιβλέπων καθηγητής: Βασίλειος Μεγαλοοικονόμου ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ» ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΦΑΡΜΟΓΗ ΑΛΓΟΡΙΘΜΩΝ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ενότητα 7: Βάσεις Δεδομένων (Θεωρία) Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών Σπουδών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη 19ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών, 3-5 Νοεμβρίου 2010, Αθήνα Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη Άννα Μάστορα (1) Μαρία Μονόπωλη (2) Σαράντος Καπιδάκης

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Δεντρικά Ευρετήρια. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1 Δεντρικά Ευρετήρια Βάσεις Δεδομένων 2013-2014 Ευαγγελία Πιτουρά 1 Δέντρα Αναζήτησης Ένα δέντρο αναζήτησης (search tree) τάξεως p είναι ένα δέντρο τέτοιο ώστε κάθε κόμβος του περιέχει το πολύ p - 1 τιμές

Διαβάστε περισσότερα

Συναρτησιακές Εξαρτήσεις

Συναρτησιακές Εξαρτήσεις Εισαγωγή Θεωρία για το πότε ένας σχεδιασμός είναι «καλός» Η θεωρία βασίζεται στις Τι είναι; Εξαρτήσεις ανάμεσα σε σύνολα από γνωρίσματα Συμβολισμός S1 S2 (όπου S1, S2 σύνολα γνωρισμάτων) Τι σημαίνει: Αν

Διαβάστε περισσότερα

Υπολογιστικά & Διακριτά Μαθηματικά

Υπολογιστικά & Διακριτά Μαθηματικά Υπολογιστικά & Διακριτά Μαθηματικά Ενότητα 1: Εισαγωγή- Χαρακτηριστικά Παραδείγματα Αλγορίθμων Στεφανίδης Γεώργιος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ Εισαγωγή Συστάσεις Ι Ποιός είμαι εγώ: Email: tsap@cs.uoi.gr Γραφείο: Β.3 Προτιμώμενες ώρες γραφείου: 11:00-18:00 Ενδιαφέροντα Web mining, Social networks, User Generated Content Mobile

Διαβάστε περισσότερα

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8 ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ Άλγεβρα 1 ο Κεφάλαιο 1. Τι ονομάζουμε αριθμητική και τι αλγεβρική παράσταση; Να δώσετε από ένα παράδειγμα. Μια παράσταση που περιέχει πράξεις με αριθμούς, καλείται αριθμητική παράσταση,

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ

ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ Ενότητα 13: Πολυωνυμική αναγωγή Ρεφανίδης Ιωάννης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες,

Διαβάστε περισσότερα

ΚΥΚΛΟΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΚΥΚΛΟΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΕΥΝΑΣ ΚΥΚΛΟΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΕΥΝΑΣ Βασίλης Καραγιάννης Η παρέμβαση πραγματοποιήθηκε στα τμήματα Β2 και Γ2 του 41 ου Γυμνασίου Αθήνας και διήρκησε τρεις διδακτικές ώρες για κάθε τμήμα. Αρχικά οι μαθητές συνέλλεξαν

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

Αλγόριθμοι Εξόρυξης Χωρικών εδομένων

Αλγόριθμοι Εξόρυξης Χωρικών εδομένων Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Αγρονόμων και Τοπογράφων Μηχανικών ιατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών «ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ» Αλγόριθμοι Εξόρυξης Χωρικών εδομένων Εφαρμογή σε Αλγόριθμους Συσταδοποίησης

Διαβάστε περισσότερα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα Αλγόριθμοι και Πολυπλοκότητα Ανάλυση Αλγορίθμων Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ανάλυση Αλγορίθμων Η ανάλυση αλγορίθμων περιλαμβάνει τη διερεύνηση του τρόπου

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #03 Βασικές έννοιες Ανάκτησης Πληροφορίας Δομή ενός συστήματος IR Αναζήτηση με keywords ευφυής

Διαβάστε περισσότερα

Στοιχεία Θεωρίας Γράφων (Graph Theory)

Στοιχεία Θεωρίας Γράφων (Graph Theory) Στοιχεία Θεωρίας Γράφων (Graph Theory) Ε Εξάμηνο, Τμήμα Πληροφορικής & Τεχνολογίας Υπολογιστών ΤΕΙ Λαμίας plam@inf.teilam.gr, Οι διαφάνειες βασίζονται στα βιβλία:. Αλγόριθμοι, Σχεδιασμός & Ανάλυση, η έκδοση,

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΕΘΝΙΚΟ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Καθηγητής : Κουμπαράκης Μανόλης Ημ/νία παράδοσης: 11/01/2011 Ονομ/μο φοιτητή : Μπεγέτης Νικόλαος Α.Μ.:

Διαβάστε περισσότερα

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΣΕΠΤΕΜΒΡΙΟΣ 2011 ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ, ΠΙΘΑΝΟΤΗΤΩΝ & ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α ΘΕΜΑ 1 ο Σε ένα διαγωνισμό για την κατασκευή μίας καινούργιας γραμμής του

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας

Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Αξιοποίηση της συσχέτισης μεταξύ λέξεων για τη βελτίωση του προσεγγιστικού φιλτραρίσματος πληροφορίας Σε ένα σύστημα φιλτραρίσματος πληροφορίας, ή αλλιώς σύστημα έκδοσης/συνδρομής, οι χρήστες εγγράφονται

Διαβάστε περισσότερα

Quick algorithm f or computing core attribute

Quick algorithm f or computing core attribute 24 5 Vol. 24 No. 5 Cont rol an d Decision 2009 5 May 2009 : 100120920 (2009) 0520738205 1a, 2, 1b (1. a., b., 239012 ; 2., 230039) :,,.,.,. : ; ; ; : TP181 : A Quick algorithm f or computing core attribute

Διαβάστε περισσότερα

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών

Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Κεφάλαιο 5 Κριτήρια απόρριψης απόμακρων τιμών Σύνοψη Στο κεφάλαιο αυτό παρουσιάζονται δύο κριτήρια απόρριψης απομακρυσμένων από τη μέση τιμή πειραματικών μετρήσεων ενός φυσικού μεγέθους και συγκεκριμένα

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα