Εξόρυξη Γνώσης από Βάσεις Χωρικών και Χρονικών Δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Εξόρυξη Γνώσης από Βάσεις Χωρικών και Χρονικών Δεδομένων"

Transcript

1 Εξόρυξη Γνώσης από Βάσεις Χωρικών και Χρονικών Δεδομένων Βασίλειος Μεγαλοοικονόμου, Ph.D.

2 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

3 Εισαγωγή Η σύγχρονη τεχνολογία καθιστά εφικτή την συλλογή πληθώρας χωρικών και χρονικών δεδομένων μεγάλες βάσεις δεδομένων Πλούτος δεδομένων αλλά πενιχρή πληροφορία Ανάγκη για meta-ανάλυση δεδομένων από πολλαπλές μελέτες Ανάγκη για robust εργαλεία πληροφορικής για τη στήριξη λήψης αποφάσεων (π.χ., διάγνωση στον τομέα της ιατρικής) Στόχος: κατανόηση προτύπων, προσδιορισμός συσχετίσεων, ομαλοτήτων, ανωμαλιών,...

4 Εξόρυξη γνώσης? Αποτελεσματική εξόρυξη ενδιαφέρουσας (μη-τετριμένης, υπονοούμενης, προηγουμένως άγνωστης και πιθανώς χρήσιμης) πληροφορίας ή προτύπων (patterns) από μεγάλες βάσεις δεδομένων Πρότυπα (Patterns)? Συσχετίσεις - Associations (π.χ., butter + bread --> milk) Ακολουθίες (π.χ., χρονικά δεδομένα χρηματιστήριο) Κανόνες για χωρισμό δεδομένων (π.χ., πρόβλημα εντοπισμού θέσης μαγαζιού) Τι είδους πρότυπα είναι ενδιαφέροντα ( interesting )? Σύμφωνα με: Περιεχόμενο πληροφορίας, confidence and support, p-value, απροσδοκότητα, ικανότητα για εφαρμογή/δράση actionability (utility in decision making)

5 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Εκτίμηση/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

6 Tο πρόβλημα Εξόρυξη γνώσης - χωρικά δεδομένα: Δεδομένης μιας μεγάλης συλλογής από χωρικά δεδομένα, π.χ., 2D ή 3D εικόνες, και άλλα δεδομένα, βρείτε ενδιαφέροντα πράγματα, δηλ.: Συσχετίσεις μεταξύ χωρικών δεδομένων ή μεταξύ χωρικών και μη-χωρικών δεδομένων Περιοχές ικανές να διακρίνουν (discriminative areas) ομάδες εικόνων Κανόνες/πρότυπα Εικόνες παρόμοιες με μια εικόνα query (queries by content)

7 Χωρικά Δεδομένα - Δυσκολίες Πως να εφαρμόσουμε τεχνικές εξόρυξης γνώσης σε εικόνες? Ετερογένεια και διακύμανση (variability) δεδομένων Προεπεξεργασία δεδομένων (π.χ., κατάτμιση, χωρική κανονικοποίηση, αναπαράσταση) Eξερεύνηση της υψηλής συσχέτισης μεταξύ γειτονικών αντικειμένων Yψηλή διαστατικότητα δεδομένων (large dimensionality of data) Πολυπλοκότητα συσχετίσεων Αποδοτική (efficient) διαχείρηση της τοπολογικής πληροφορίας/απόστασης Αναπαράσταση χωρικής γνώσης / Spatial Access Methods (SAMs) ώστε να διευκολύνει την αναζήτηση

8 Υπόβαθρο: Βάσεις Χωρικών Δεδομένων Εικόνες-δεδομένα: συλλογή από απεικονίσεις σάρωσης σε πολλαπλά επίπεδα Εστίαση στην διαχείρηση χωρικών περιοχών ειδικού ενδιαφέροντος (ROIs) Προεπεξεργασία: Προσδιορισμός ορίων χωρικών περιοχών ειδικού ενδιαφέροντος Χωρική κανονικοποίηση (Registration, Spatial Normalization) Original MRI Atlas παραμόρφωση MRI ROIs ROIs ROIs Before Spatial Normalization After Spatial Normalization

9 Παράδειγμα: Εξόρυξη Συσχετίσεων Ανακάλυψη συσχετίσεων μεταξύ χωρικών και μη-χωρικών δεδομένων (σε μεγάλες Βάσεις Δεδομένων) Εικόνες {i 1, i 2,, i L } Χωρικές περιοχές {s 1, s 2,,s K } Μη-χωρικές μεταβλητές {c 1, c 2,, c M } i 1 i 2 i 3 i 4 i 5 i 6 i 7 c 1 c 2 c 7 c 2 c 1 c 3 c 9 c 6

10 Παράδειγμα: fmri χάρτες αντίθεσης (contrast maps) Υγιές δείγμα Δείγμα με νόσημα

11 Εφαρμογές Ανάλυση ιατρικών εικόνων, βιοπληροφορική, γεωγραφία, μετεωρολογία,...

12 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

13 Ανάλυση Χωρικών Δεδομένων voxel-by-voxel Μη ύπαρξη μοντέλου για εικόνες Η μεταβολή κάθε voxel αναλύεται ανεξάρτητα παράγεται χάρτης στατιστικής σημαντικότητας Η διακριτική ικανότητα υπολογίζεται με στατιστικά τεστς (t-test, ranksum test, F-test, ) Statistical Parametric Mapping (SPM) Η ισχύς των συσχετίσεων μετριέται με το chi-squared test, Fisher s exact test (πίνακες πιθανών ενδεχομένων για κάθε ζεύγος μεταβλητών) Ομαδοποίηση των voxels σύμφωνα με τα αποτελέσματα (λειτουργική σχέση) [ V. Megalooikonomou, C. Davatzikos, E. Herskovits, Mining Lesion- Deficit Associations in a Brain Image Database, ACM SIGKDD 1999 ]

14 Ανάλυση Χωρικών Δεδομένων με Ομαδοποίηση των Voxels Ομαδοποίηση των voxels βασισμένη σε άτλαντα Προγενέστερη γνώση αυξάνει την ευαισθησία Ελάττωση δεδομένων: 10 7 voxels R περιοχές (δομές) Απεικόνηση κάθε ROI σε τουλάχιστον μια περιοχή Τόσο καλή όσο και ο χάρτης (άτλας) που χρησιμοποιείται Μ μη-χωρικές μεταβλητές, R περιοχές Ανάλυση Διακριτές (Categorical) μεταβλητές δομής Μ x R πίνακες πιθανών ενδεχομένων, Chi-square/Fisher exact test πρόβλημα πολλαπλών συγκρίσεων log-linear analysis, multivariate Bayesian Συνεχείς (Continuous) μεταβλητές δομής Logistic regression, Mann-Whitney [ V. Megalooikonomou, C. Davatzikos, E. Herskovits, Mining Lesion- Deficit Associations in a Brain Image Database, ACM SIGKDD 1999 ]

15 Μέθοδοι: Στατιστικές: Chi-square 2 x 2 πίνακες πιθανών ενδεχομένων για categorical μεταβλητές Pearson chi-square

16 Δυναμικός Αναδρομικός Διαμερισμός (Dynamic Recursive Partitioning) Δυναμικός αναδρομικός διαμερισμός ενός τρισδιάστατου χώρου σε υποπεριοχές

17 Δυναμικός Αναδρομικός Διαμερισμός (Dynamic Recursive Partitioning) Δυναμικός αναδρομικός διαμερισμός ενός τρισδιάστατου χώρου σε υποπεριοχές Κριτήρια για τον διαμερισμό: διακριτική ισχύ (discriminative power) των χαρακτηριστικών της υποπεριοχής (hyper-rectangle) και μέγεθος της υποπεριοχής

18 Δυναμικός Αναδρομικός Διαμερισμός (Dynamic Recursive Partitioning) Δυναμικός αναδρομικός διαμερισμός ενός τρισδιάστατου χώρου σε υποπεριοχές Κριτήρια για τον διαμερισμό: διακριτική ισχύ (discriminative power) των χαρακτηριστικών της υποπεριοχής (hyper-rectangle) και μέγεθος της υποπεριοχής

19 Δυναμικός Αναδρομικός Διαμερισμός (Dynamic Recursive Partitioning) Δυναμικός αναδρομικός διαμερισμός ενός τρισδιάστατου χώρου σε υποπεριοχές Κριτήρια για τον διαμερισμό: διακριτική ισχύ (discriminative power) των χαρακτηριστικών της υποπεριοχής (hyper-rectangle) και μέγεθος της υποπεριοχής

20 Δυναμικός Αναδρομικός Διαμερισμός (Dynamic Recursive Partitioning) Δυναμικός αναδρομικός διαμερισμός ενός τρισδιάστατου χώρου σε υποπεριοχές Κριτήρια για τον διαμερισμό: διακριτική ισχύ (discriminative power) των χαρακτηριστικών της υποπεριοχής (hyper-rectangle) και μέγεθος της υποπεριοχής Εξαγωγή χαρακτηριστικών από περιοχές με διακριτική ισχύ για ταξινόμηση σε κλάσεις Ελάττωση του προβλήματος πολλαπλών συγκρίσεων (multiple comparison problem) (# τέστς = # υποδιαιρέσεων < # voxels) τεστς downward closed [ V. Megalooikonomou, D. Pokrajac, A. Lazarevic, and Z. Obradovic, Effective classification of 3-D image data using partitioning methods, SPIE Conference on Visualization and Data Analysis, 2002 ] [ V. Megalooikonomou, D. Kontos, D. Pokrajac, A. Lazarevic, Z. Obradovic, " An adaptive partitioning approach for mining discriminant regions in 3D image data", Journal of Intelligent Information Systems, (in review) ]

21 Άλλες μέθοδοι για Ταξινόμηση Χωρικών Δεδομένων Διάκριση μεταξύ κατανομών: Με χρήση αποστάσεων κατανομών πιθανότητας: - Mahalanobis distance - Kullback-Leibler divergence (parametric, non-parametric) Με χρήση Maximum Likelihood (ότι η πιθανοτική κατανομή του νέου αντικειμένου είναι η ίδια με κάποια από τις υπάρχουσες): - Εκτίμηση πυκνότητας πιθανότητας (probability densities) και υπολογισμός likelihood Μέθοδος EM (Expectation-Maximization) για μοντελοποίηση χρησιμοποιώντας κάποια βασική συνάρτηση - base function (Gaussian) Στατικός διαμερισμός: * Ελάττωση των μεταβλητών σε σχέση με την ανάλυση voxel-by-voxel Ο χώρος υποδιαιρείται σε 3D υπερ-πολύγωνα (discretization step) * * Μεταβλητές: χαρακτηριστικά των voxels μέσα στα υπερ-πολύγωνα Σταδιακή αύξηση ανάλυσης (discretization) D. Pokrajac, V. Megalooikonomou, A. Lazarevic, D. Kontos, Z. Obradovic, Artificial Intelligence in Medicine, Vol. 33, No. 3, pp , Mar * * * * * *

22 Πειραματικά Αποτελέσματα DRP Method Classification Accuracy (%) Criterion Threshold Tree depth Controls Patients Total correlation t-test ranksum Maximum Likelihood / EM Maximum Likelihood / k-means Kullback-Leibler / EM Kullback-Leibler / k-means Συγκριτικά αποτελέσματα ταξινόμησης χρησιμοποιώντας Maximum Likelihood και EM ή k-means για εκτίμηση της κατανομής Areas discovered by DRP with t-test: significance threshold=0.05, maximum tree depth=3. Colorbar shows significance Σύγκριση του αριθμού των τεστς που έχουν πραγματοποιηθεί Number of tests Thresh Depth DRP Voxel Wise [D. Kontos, V. Megalooikonomou, D. Pokrajac, A. Lazarevic, Z. Obradovic, O. B. Boyko, J. Ford, F. Makedon, A. J. Saykin, MICCAI 2004]

23 Πειραματικά Αποτελέσματα (a) (b) Discriminative υπο-περιοχές που εντοπίστηκαν εφαρμόζοντας (a) DRP και (b) ανάλυση voxel-wise με ranksum test και κατώφλι σπουδαιότητας (significance) 0.05 σε κλινικά fmri δεδομένα Επίδραση αυτής της εργασίας: Βοηθά στην ερμηνεία των εικόνων (π.χ., διευκολύνει την κλινική διάγνωση) Καθιστά δυνατή την ενοποίηση, διαχειρισμό και ανάλυση μεγάλων όγκων εικόνων και άλλων τύπων δεδομένων Παρέχει νέα γνώση ως προς την συσχέτηση δομής και λειτουργίας

24 Διαχείρηση Χωρικών Περιοχών Λεπτομερής ποσοτικός χαρακτηρισμός και ταξινόμηση (classification) των περιοχών ειδικού ενδιαφέροντος (ROIs) π.χ., επέκταση ανάλυσης Sholl με ομόκεντρα κέλυφη Εξαγωγή και αναπαράσταση του πληροφοριακού περιεχομένου (information content) των εικόνων Ανάπτυξη ενός γενικού και ενοποιημένου πλαισίου εργασίας για διαχείρηση περιοχών (ROIs) Πιθανοτικά μοντέλα για παραγωγή προσομοιωμένων περιοχών Αναζήτηση ομοιότητας similarity searches

25 Ποσοτικός Χαρακτηρισμός Δενδροειδών δομών και Ταξινόμηση Ένα δίκτυο αγωγών στο μαστό: (a) γαλακτόγραμμα με a contrast-enhanced δίκτυο αγωγών, (b) μέρος του γαλακτογράμματος που δείχνει μεγαλύτερο το δίκτυο αγωγών, (c) το δίκτυο 1 (a) (b) (c) { } Prufer Προεπεξεργασία (προσδιορισμός ορίων χωρικών περιοχών, σκελετοποίηση, κανονικοποίηση (ισόμορφα δένδρα) Labeling και αναπαράσταση δέντρων με σειρές χαρακτήρων κωδικοποίηση Prüfer [ V. Megalooikonomou, D. Kontos, J. Danglemaier, A. Javadi, P. A. Bakic, A.D.A. Maidment, Proceedings of the SPIE Conference on Medical Imaging, 2006.]

26 Ποσοτικός Χαρακτηρισμός Δενδροειδών δομών και Ταξινόμηση αναπαράσταση δέντρων με σειρές χαρακτήρων Χρήση τεχνικών tf-idf εξόρυξης γνώσης από κείμενα για ανάθεση βάρους σπουδαιότητας σε κάθε όρο- label To βάρoς w ij του όρου i στη σειρά j προσδιορίζεται ως εξής: w ij = tf ij idf i = tf ij log 2 (N/ df i ) όπου f ij είναι η συχνότητα εμφάνισης του όρου i στη σειρά j, tf ij = f ij / max{f ij } df i = αριθμός των σειρών που περιλαμβάνουν τον όρο i, idf i = αντίστροφο της df i, = log 2 (N/ df i ) και N: ο συνολικός αριθμός σειρών H κάθε σειρά αναπαρίστανται ως ένα t-dimensional διάνυσμα: d j = (w 1j, w 2j,,w tj ), όπου t = vocabulary =διάσταση Δύο σειρές είναι παρεμφερείς με βάση το cosine similarity measure των διανυσμάτων που υπολογίζεται ως εξής: t ( d q wij wiq ) CosSim(d j, q) = j i 1 t 2 t 2 dj q w w ij i 1 i 1 iq

27 Ποσοτικός Χαρακτηρισμός Δενδροειδών δομών και Ταξινόμηση Similarity searches: Υπολογίζουμε το pairwise cosine distance matrix για όλα τα tf-idf διανύσματα. Χρησιμοποιούμε κάθε δένδρο (δηλ. tf-idf διάνυσμα) σαν query και βρίσκουμε τα k πιο όμοια δέντρα με βάση το cosine distance matrix. Precision: το ποσοστό των σχετικών δένδρων (relevant trees) μεταξύ αυτών που βρέθηκαν μέσος όρος για όλα τα similarity queries που κάναμε (σχετικά: τα δένδρα που ανήκουν στην ίδια ομάδα με το query tree (NF vs. RF)). Prufer Encoding k Precision NF RF Total 1 100% 100 % 100% % % % % % % % % % % % %

28 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

29 Έλεγχος/Αξιολόγηση Τεχνικών Εξόρυξης Γνώσης Γιατί να ελέγξουμε την διαδικασία εξόρυξης γνώσης? μη γνώση της πραγματικότητας αντικειμενική αξιολόγηση των προσόντων και περιορισμών των μεθόδων υπολογισμός μεγέθους δείγματος επίδραση μεθόδων προεπεξεργασίας δεδομένων Κατασκευή χωρικού προσομοιωτή και εκτέλεση Monte Carlo ανάλυσης (simulations) Παραγωγή μεγάλου αριθμού δειγμάτων Χρήση πιθανοτικών κατανομών για μοντελοποίηση: χωρικών περιοχών ειδικού ενδιαφέροντος (αριθμός, μέγεθος, σχήμα, και θέση) μη-χωρικών μεταβλητών συσχετίσεων (ισχύς, αριθμός, δομή) σφάλματος χωρικής κανονικοποίησης και κατάτμησης (segmentation) (των χωρικών περιοχών) σύμφωνα με αληθινά δεδομένα/μελέτες Ανακάλυψη συσχετίσεων με εφαρμογή τεχνικών εξόριξης γνώσης Σύγκριση των αποκαλυφθέντων συσχετίσεων με τις πραγματικές

30 Ο Χωρικός Προσομοιωτής Χρήση μοντέλου συσχετίσεων μεταξύ χωρικών περιοχών και άλλων μηχωρικών μεταβλητών (που παρέχονται σαν input ή παράγονται τυχαία χρησιμοποιώντας διάφορες παραμέτρους) Χρήση ενός σετ δεδομένων D (real study) για εξαγωγή παραμέτρων για: χωρικές και μη-χωρικές μεταβλητές περιοχές, priors, σφάλμα χωρικής κανονικοποίησης (spatial normalization error) Παραγωγή προσομοιωμένων δειγμάτων (samples) Για κάθε δείγμα p: παραγωγή προσομοιωμένων χωρικών περιοχών αλλαγή θέσης και παραμόρφωση των περιοχών (modeling spatial normalization error) αναγνώριση περιοχών που είναι ασυνήθιστες (ανώμαλες) παραγωγή προσομοιωμένων μη-χωρικών μεταβλητών με βάση τις τεχνητές συσχετίσεις και τις ανώμαλες περιοχές

31 Ο χωρικός προσομοιωτής: Μοντελοποίηση συσχετίσεων με χρήση Bayesian Networks Μοντέλο Bayesian Network (BN): directed acyclic graph (DAG) απεικονίζει την joint pdf του πεδίου, πληροφορία αιτίων/ανεξαρτησίας κάθε κόμβος είναι μια μεταβλητή (χωρική περιοχή ή μη-χωρική μεταβλητή (δυσ)λειτουργία/κατάσταση) πίνακες δείχνουν conditional πιθανότητες Αρχή conditional independence Πλεονεκτήματα: μαθηματικά έγκυρη (θεωρία πιθανοτήτων) εκφράζεται παραστατικά έχει δομική σημασία (μπορούν να απεικονίσουν παραγωγικές διαδικασίες (generative processes)) πλήρης (οποιαδήποτε παραγωγική διαδικασία) V. Megalooikonomou, C. Davatzikos, E. Herskovits, A Simulator for Evaluation of Methods for the Detection of Lesion-Deficit Associations, Human Brain Mapping, Vol. 10, No. 2, pp.61-73, 2000.

32 Ο χωρικός προσομοιωτής: Μοντελοποίηση συσχετίσεων με χρήση Bayesian Networks Δημιουργία τυχαίων μοντέλων Bayesian Networks χρησιμοποιώντας τις παρακάτω παραμέτρους: αριθμό κόμβων χωρικών περιοχών και μη χωρικών μεταβλητών αριθμό συσχετίσεων (associations) prior πιθανότητα κάθε περιοχής να είναι ενδιαφέρουσα conditional πιθανότητες (δυσ)λειτουργιών (π.χ., ισχύς των συσχετίσεων) βαθμός (degree) συσχέτισης κόμβων, ανώτατο όριο βαθμού του δικτύου Χρήση noisy-or model για probabilistic disjunctive αλληλεπιδράσεις μεταξύ αιτίων ενός αποτελέσματος (leak prob.) Υπολογισμός prior πιθανότητες για τις χωρικές περιοχές υπολογισμός ποσοστού επί τοις εκατό των δειγμάτων με ανωμαλία σε κάθε χωρική περιοχή (χρήση sigmoid ή step function)

33 Ο χωρικός προσομοιωτής: Παραγωγή προσομοιωμένων περιοχών (ROIs) Δημιουργία προσομοιωμένων περιοχών χρησιμοποιώντας στατιστικά δεδομένα συλλεγμένα από ένα σετ δεδομένων D για: αριθμό των περιοχών ειδικού ενδιαφέροντος / δείγμα μέγεθος κάθε περιοχής σχήμα κάθε περιοχής χωρική πιθανοτική κατανομή του κέντρου μάζας κάθε περιοχής εξομάλυνση (κάνοντας χρήση ενός σφαιρικού παραθύρου), padding, κανονικοποίηση (normalization) Δημιουργία των σχημάτων των περιοχών χρησιμοποιώντας ένα μοντέλο ανάπτυξης (growth model) βασισμένο σε αυτό του Eden, 1961 V. Megalooikonomou, "Evaluating the performance of association mining methods in 3- D medical image databases", SIAM International Conference on Data Mining, 2002.

34 Αποτελέσματα: Χωρικός Προσομοιωτής N είναι αντιστρόφως ανάλογο της μικρότερης prior/conditional πιθανότητας

35 Αποτελέσματα: Χωρικός Προσομοιωτής Ο βαθμός (degree) συσχέτισης επηρεάζει περισσότερο την απόδοση του συστήματος από τον αριθμό των υπάρχοντων συσχετίσεων Κατά μέσον όρο 87% των συσχετίσεων βρέθηκαν σε ευθυγραμμισμένες εικόνες σε σύγκριση με τέλεια ευθυγράμμιση (perfect registration)

36 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Εκτίμηση/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

37 Ανάλυση Χρονικών Σειρών Χρονική σειρά: Μία ακολουθία (διατεταγμένη συλλογή) πραγματικών τιμών : X = x 1, x 2,, x n Πολλές εφαρμογές... Δυσκολίες: Υψηλή διαστατικότητα δεδομένων (high dimensionality) Μεγάλος αριθμός σειρών Ορισμός συνάρτησης ομοιότητας (similarity) Ανάλυση ομοιότητας (π.χ., ανεύρεση μετοχών που μοιάζουν με αυτήν της IBM Στόχοι: υψηλή ακρίβεια, γρήγορες τεχνικές για αναζήτηση ομοιότητας μεταξύ χρονικών σειρών και για ανακάλυψη ενδιαφέροντων προτύπων Εφαρμογές: ομαδοποίηση (clustering), ταξινόμηση (classification), αναζήτηση ομοιότητας (similarity searches), δημιουργία περίληψης (summarization)

38 Τεχνικές Μείωσης Διαστατικότητας (Dimensionality) DFT: Discrete Fourier Transform DWT: Discrete Wavelet Transform SVD: Singular Value Decomposition APCA: Adaptive Piecewise Constant Approximation PAA: Piecewise Aggregate Approximation SAX: Symbolic Aggregate approximation

39 Αποστάσεις ομοιότητας χρονικών σειρών (similarity distances) Ευκλείδειος Απόσταση: η πιο διαδεδομένη αλλά ευπαθής σε μεταβολές (shifts) Δυναμική παραμόρφωση χρόνου (Dynamic Time Warping): βελτιώνει την ακρίβεια αλλά είναι αργή: O(n Envelope-based DTW: 2 ) πιο γρήγορη: O(n) Μια πιο διαισθητική ιδέα: δύο σειρές πρέπει να θεωρούνται όμοιες αν έχουν αρκετά μη-επικαλυπτόμενα χρονικά διατεταγμένα ζεύγη υποσειρών που είναι όμοια (Agrawal et al. VLDB, 1995)

40 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

41 Διαμελισμός Προσέγγιση Τμημάτων με Σταθερές (Piecewise Constant Approximations) Αρχική σειρά (n σημεία) Piecewise constant approximation (PCA) ή Piecewise Aggregate Approximation (PAA), [Yi and Faloutsos 00, Keogh et al, 00] (n' τμήματα) Προσαρμόσιμη PCA - Adaptive Piecewise Constant Approximation (APCA), [Keogh et al., 01] (n" τμήματα)

42 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

43 Multiresolution Vector Quantized (MVQ) προσέγγιση Διαμελίζει μια σειρά σε τμήματα ίσου μήκους και χρησιμοποιεί VQ για αναπαράσταση κάθε τμήματος η σειρά αναπαριστάνεται με τη συχνότητα ενφάνισης υποσειρών κλειδίων 1) Χρησιμοποιεί ένα λεξικό υποσειρών (βιβλίο κώδικα - codebook) χρησιμοποιείται κάποιο training 2) Χρησιμοποιεί πολλαπλή ανάλυση (multiple resolutions) διατηρεί τοπική και γενική πληροφορία 3) Αντίθετα από τα wavelets αγνοεί μερικώς την σειρά (διάταξη) των κωδικών ( codewords ) 3) Εκμεταλλεύεται προηγούμενη γνώση (prior knowledge) σχετικά με τα δεδομένα 4) Χρησιμοποιεί μια νέα συνάρτηση απόστασης (distance function) [V. Megalooikonomou, Q. Wang, G. Li, C. Faloutsos, ICDE 2005]

44 Μεθοδολογία l Δημιουργία s=16 βιβλίου κώδικα s Μετασχηματισμός σειρών c m d b c a m i n j j a h l d f k o o g c b l p l h n k k k k k g j h h i f a j b b ma I n j m p h c a k o o c c b l h p l c a c g g k g j l p Κωδικοποίηση Σειρών

45 -Δημιουργία λεξικού Q: Πως? Output: Μεθοδολογία A: Χρήση Vector Quantization, πιο συγκεκριμένα, χρήση του Generalized Lloyd Algorithm (GLA) Βιβλίο κώδικα με s κωδικούς (codewords) -Αναπαράσταση χρονικών σειρών X = x 1, x 2,, x n Κωδικοποιείται με την νέα αναπαράσταση f = (f 1,f 2,, f s ) (f i : η συχνότητα εμφάνισης του i th κωδικού στο X) Πρότυπα που εμφανίζονται συχνά σε υποσειρές

46 Μεθοδολογία Νέα συνάρτηση απόστασης: Το μοντέλο ιστογράμματος (ΗΜ) χρησιμοποιείται για να υπολογιστεί η ομοιότητα μεταξύ των αναπαραστάσεων δυο χρονικών σειρών σε κάθε επίπεδο ανάλυσης (resolution level): S HM ( q, t) 1 1 dis( q, t) f i,t όπου dis( q, t) s f 1 i, t f i, q i 1 i, t i, q f f s f i,q

47 Μεθοδολογία Δημιουργία περίληψης χρονικών σειρών (Time series summarization): Πληροφορία υψηλού επιπέδου (πρότυπα που εμφανίζονται συχνά) είναι πιο χρήσιμη Η καινούργια αναπαράσταση παρέχει αυτό το είδος της πληροφορίας Οι κωδικοί (patterns) 3 & 5 εμφανίζονται 2 φορές

48 Μεθοδολογία Προβλήματα με την κωδικοποίηση που χρησιμοποιεί συχνότητα εμφάνισης : Δύσκολο να καθοριστεί το σωστό επίπεδο ανάλυσης (resolution - codeword length) Μπορεί να χάσει γενική πληροφορία

49 Μεθοδολογία Λύση: Χρήση πολλαπλών επιπέδων ανάλυσης (multiple resolutions): Δύσκολο να καθοριστεί το σωστό επίπεδο ανάλυσης (resolution - codeword length) Μπορεί να χάσει γενική πληροφορία

50 Μεθοδολογία Η προτεινόμενη συνάρτηση απόστασης: Άθροισμα ομοιοτήτων με βάρη, σε όλα τα επίπεδα ανάλυσης (resolution levels) μοντέλο ιεραρχικού ιστογράμματος S c HHM (q,d j) w i *SHMi (q,d j) i 1 όπου c είναι ο αριθμός των επιπέδων ανάλυσης Μην έχοντας προηγούμενη γνώση ίσο βάρος σε όλα τα επίπεδα ανάλυσης αποδίδει καλά στις περισσότερες περιπτώσεις επίπεδο i

51 MVQ: Παράδειγμα Βιβλίου Κώδικα (Codebook) Πρώτο επίπεδο κωδικοποίησης Δεύτερο επίπεδο κωδικοποίησης (περισσότεροι κωδικοί μιας και κωδικοποιείται περισσότερη λεπτομέρεια)

52 Datasets: Πειράματα SYNDATA (control chart data): συνθετικό σετ : 600 παραδείγματα διαγραμμάτων μήκους 60 σημείων που ανήκουν σε 6 διαφορετικές κατηγορίες (Normal, Cyclic, Increasing trend, Decreasing trend, Upward shift, and Downward shift) CAMMOUSE: ένα χωροχρονικό σετ δεδομένων Αποτελείται από 5 λέξεις και έχει δημιουργηθεί χρησιμοποιώντας το Camera Mouse Program, 3 εγγραφές κάθε λέξης, μέσος όρος μήκους: 1100 σημεία RTT: RTT μετρήσεις από UCR στο CMU με ρυθμό αποστολής 50 msec για μια μέρα Ο συνολικός αριθμός των τιμών RTT είναι 1,728,000. Το σετ δεδομένων διαμερίστηκε σε 24 χρονοσειρές μήκους 72,000.

53 Πειράματα Αναζήτηση Best Match: Matching accuracy: ποσοστό των knn s (που βρέθηκαν με διαφορετικές μεθόδους) που είναι στην ίδια κλάση Accuracy knn(q) std_set(q) k 100%

54 Πειράματα Αναζήτηση Best Match Method Single level VQ SYNDATA Weight Vector Accuracy [ ] 0.55 [ ] 0.70 [ ] 0.65 [ ] 0.48 [ ] 0.46 MVQ [ ] 0.83 Euclidean 0.51 CAMMOUSE Method Weight Vector Accuracy Single level VQ [ ] 0.56 [ ] 0.60 [ ] 0.44 [ ] 0.56 [ ] 0.60 MVQ [ ] 0.83 Euclidean 0.58

55 Πειράματα Αναζήτηση Best Match MVQ MVQ (a) (b) Precision-recall για διαφορετικές μεθόδους (a) SYNDATA dataset (b) CAMMOUSE dataset

56 Πειράματα Πειράματα ομαδοποίησης (clustering) Δεδομένων δύο ομαδοποιήσεων (clusterings), G=G 1, G 2,, G K (οι αληθινοί clusters), και A = A 1, A 2,, A k (αποτέλεσμα ομαδοποίησης μιας μεθόδου), η ακρίβεια ομαδοποίησης (clustering accuracy) υπολογίζεται με την cluster similarity που ορίζεται ως εξής: Sim(G, A) i max j Sim( G k i, A j ) όπου Sim(Gi, Aj) 2 G G i i A A j j [Gavrilov, M., Anguelov, D., Indyk, P. and Motwani, R., KDD 2000]

57 Πειράματα Πειράματα ομαδοποίησης (clustering) Method Single level VQ SYNDATA Weight Vector Accuracy [ ] 0.69 [ ] 0.71 [ ] 0.63 [ ] 0.51 [ ] 0.49 MVQ [ ] 0.82 DFT 0.67 SAX 0.65 DTW 0.80 Euclidean 0.55 Method Single level VQ RTT Weight Vector Accuracy [ ] 0.55 [ ] 0.52 [ ] 0.57 [ ] 0.80 [ ] 0.79 MVQ [ ] 0.81 DFT 0.54 SAX 0.54 DTW 0.62 Euclidean 0.50

58 Πειράματα Δημιουργία περίληψης - Summarization (SYNDATA) Τυπικές σειρές:

59 Πειράματα Πρώτο επίπεδο Δεύτερο επίπεδο

60 MVQ: Παράδειγμα: Δυο Χρονικές Σειρές Δεδομένων δυο χρονικών σειρών t1 και t2 ως εξής: Στο πρώτο επίπεδο, κωδικοποιούνται με τον ίδιο κωδικό (codeword) (3), και δεν υπάρχει διαφορά ανάμεσα στις δυο σειρές Στο δεύτερο επίπεδο, καταγράφονται περισσότερες λεπτομέρειες. Οι δυο σειρές έχουν διαφορετική κωδικοποίηση: η πρώτη κωδικοποιείται με τους κωδικούς 1 και 4, η δεύτερη με τους κωδικούς 9 and 12.

61 Πολυπλοκότητα προεπεξεργασίας Time complexity: T(training) = c * i * s * N * w = O(N * w ) N: αριθμός χρονικών σειρών στο training set w: αριθμός τμημάτων στη μεγαλύτερη ανάλυση N*w: αριθμός training vectors c: αριθμός των επιπέδων ανάλυσης (~5) i: αριθμός επαναλήψεων Lloyd (~15) s: μέγεθος του βιβλίου κώδικα (~ 6-32) H μάθηση του βιβλίου κώδικα γίνεται μια φορά κατά τη διάρκεια της προεπεξεργασίας

62 Συμπεράσματα Μια νέα αναπαράσταση χρονικών σειρών που χρησιμοποιεί σύμβολα/κώδικες και ανάλυση πολλαπλών επιπέδων Νέα συνάρτηση απόστασης Βελτιωμένη αποδοτικότητα βασισμένη σε μείωση της διαστατικότητας Εργαλεία για δημιουργία περίληψης Εκμετάλλευση υπάρχουσας γνώσης (prior knowledge) σχετικά με τα δεδομένα

63 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Έλεγχος/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

64 Ανάλυση Ομοιότητας Χρονικών Σειρών Διαφορετικού Μήκους Πρόβλημα - Κίνητρα MVM (Minimal Variance Matching) περιγραφή, παράδειγμα Πειραματικά αποτελέσματα Ταίριασμα ολόκληρων σειρών (whole sequence matching) Ταίριασμα υπο-σειρών (subsequence matching) Συμπεράσματα

65 Πρόβλημα Κίνητρα Πρόβλημα: Δεδομένων 2 χρονικών σειρών: A = { a 1, a m } (query) και B = { b 1,,b n } (target), προσδιορίστε υπο-σειρά B' της B που ταιριάζει καλύτερα με την A (όπου m < n) Για κάποια δεδομένα μπορούμε εύκολα και με ακρίβεια να εξάγουμε την αρχή και το τέλος κάποιου προτύπου (pattern) εντός μίας σειράς (π.χ., καρδιακοί παλμοί). Σε μερικές εφαρμογές όμως αυτό είναι δύσκολο.

66 Παράδειγμα: Κίνητρα (συνέχεια) Δεδομένου ενός τμήματος κάποιου σχήματος, θέλουμε να βρούμε παρεμφερή σχήματα που το περιέχουν Query Shape Target Shape Target Shape

67 Ένα άλλο παράδειγμα: Κίνητρα (συνέχεια) Αναπήδηση αθλητή άλματος εις ύψος

68 Άλλες μέθοδοι Dynamic Time Warping (DTW): Ευθυγραμμίζει τον άξονα χρόνου πριν από τον υπολογισμό της απόστασης των δύο χρονικών σειρών Η απόσταση είναι το άθροισμα των αποστάσεων των αντίστοιχων στοιχείων Χρησιμοποιεί dynamic programming για να βρεί την αντιστοιχία έτσι ωστε να ελαχιστοποιηθεί η απόσταση Ευαίσθητη στα outliers μιας και δεν μπορεί να παραλείψει κανένα στοιχείο της target σειράς Longest Common Subsequence (LCSS): Προσδιορίζει την μεγαλύτερη κοινή υπο-σειρά Η απόσταση είναι το ratio (μήκος της μεγαλύτερης κοινής υπο-σειράς) / (μήκος της σειράς) Όχι απαραίτητα συνεχόμενα σημεία, η σειρά των στοιχείων δεν αλλάζει και κάποια στοιχεία μπορούν να παραλειφθούν (no outlier problem) Χρειάζεται ένα κατώφλι, θ, που καθορίζει πότε οι αριθμητικές τιμές είναι ίσες

69 A, B: ένα ψηλός αθλητής (η αναπήδηση στο Β περικόπτεται) C: σχετικά κοντή αθλήτρια με αρκετά διαφορετικό style Κίνητρα (συνέχεια) Το DTW αντιστοιχεί την αναπήδηση του A στο τέλος της σειράς B Θέλουμε να μπορούμε να αγνοούμε τμήματα που δεν έχουν φυσική αντιστοιχία Η προτεινόμενη μέθοδος, MVM, παράγει πιο φυσικές ομάδες (clustering) αφού επιτρέπει την εξάλειψη των outliers

70 Minimal Variance Matching (MVM) Περιγραφή της μεθόδου MVM: αλγόριθμος για εύρεση ελαστικού ταιριάσματος (elastic matching) δύο χρονικών σειρών A,B διαφορετικών μηκών m, n Στόχος είναι να βρούμε την καλύτερη αντιστοιχία (correspondence) της σειράς A σε μια υπο-σειρά B' της B Η αντιστοιχία ορίζεται ως εξής: a monotonic injection f : {1,,m} {1,,n} (όπου f (i) < f (i+1)) έτσι ώστε a i αντιστοιχίζεται στο b f (i) για κάθε i στο {1,,m} δεν είναι απαραίτητο να συμμετέχουν όλα τα στοιχεία του B Το σύνολο των δεικτών { f (1),, f (m) } ορίζει την υπο-σειρά B' της B Στο DTW η αντιστοιχία είναι μια σχέση one-to-many και many-to-one στο σύνολο των δεικτών {1,,m} x {1,,n}. Από όλες τις πιθανές αντιστοιχίες ψάχνουμε την καλύτερη [ L. J. Latecki, V. Megalooikonomou, Q. Wang, R. Lakaemper, C. A. Ratanamahatana, and E. Keogh, "Elastic Partial Matching of Time Series", PKDD'05 ]

71 Η καλύτερη αντιστοιχία ορίζεται ως εξής (για A,B με μήκος m,n όπου m<n): Είναι η αντιστοιχία f* που δίνει το global minimum της Ευκλείδειος απόστασης D μεταξύ (a i, b f*(i) ) για όλα τα i στο {1,,m} Minimal Variance Matching (MVM) Περιγραφή της μεθόδου d( a, b, f ) Το σύνολο των δεικτών { f*(1),, f*(m) } ορίζει το καλύτερο ταίριασμα της υπο-σειράς B' της B Από την πλευρά της στατιστικής: η σειρά A είναι μια έκδοση της B με κάποιο θόρυβο: A ~ B + N(0,σ 2 ) ( N(0, σ 2 ) είναι μια zero-mean Gaussian noise μεταβλητή) 2 ( a, b, i 1 f m ) ( b f a 2 ( i) i ) 1 m m i 1 ( b f a ( i) i ) 2

72 Minimal Variance Matching (MVM) Περιγραφή της μεθόδου Από τον πίνακα αποστάσεων (R) μεταξύ A (a 1, a 2,,a m ) και B (b 1, b 2,, b n ) R = {r ij r ij = a i b j ; 1 i m & 1 j n } Κατασκευάζουμε έναν Directed Acyclic Graph (DAG)

73 Minimal Variance Matching (MVM) Οι κορυφές (vertices) είναι στοιχεία του R (πίνακα αποστάσεων) Οι γραμμές (edges) υπάρχουν μεταξύ r ij (1 i m; i j ) και r kp (k p) αν και μόνο αν k-i = 1 (γραμμή προς γραμμή) και j+1 p j+1 + (n - m) - (j - i) (μπορούμε να παραλείψουμε στήλες) Συνάρτηση κόστους (cost function): edge weight μεταξύ r ij και r kp : weight(r ij,r kp ) = (r kp ) 2 Ψάχνουμε για το shortest path από r 1x (1 x n-m+1) στο r mv (m v n)

74 Minimal Variance Matching (MVM) Ένα απλό παράδειγμα A = (1, 2, 8, 6, 8) B = (1, 2, 9, 3, 3, 5, 9) Για να υπολογίσουμε την optimal αντιστοιχία f*, αναπτύσσουμε τον παρακάτω πίνακα διαφορών:

75 Minimal Variance Matching (MVM) Ένα απλό παράδειγμα A = (1, 2, 8, 6, 8) B = (1, 2, 9, 3, 3, 5, 9) To συντομότερο μονοπάτι (shortest path): f*(1) = 1, f*(2) = 2, f*(3) = 3, f*(4) = 6, f*(5) = H μικρότερη απόσταση μεταξύ Α και Β είναι sqrt(3) 1.732

76 Πειραματικά Αποτελέσματα Πειράματα: Ταίριασμα ολόκληρων σειρών (whole sequence matching) - διάφορα benchmark datasets Ταίριασμα υπο-σειρών (subsequence matching) (ομοιότητα σχημάτων) Μέτρηση ακρίβειας ταξινόμησης (classification accuracy) Σύγκριση με άλλες μεθόδους (LCSS & DTW) [L. J. Latecki, V. Megalooikonomou, Q. Wang, R. Lakaemper, C. A. Ratanamahatana and E. Keogh, "Partial Elastic Matching of Time Series", ICDM'05 ]

77 Πειραματικά Αποτελέσματα (συνέχεια) Ταίριασμα ολόκληρων σειρών (Whole sequence matching) 3 σετ δεδομένων: Face: 112 σειρές που απεικονίζουν το προφίλ 4 διαφορετικών ανθρώπων σημεία Leaf: 442 σειρές που απεικονίζουν το περίγραμμα 6 διαφορετικών ειδών φύλλων σημεία Gun: 200 κινήσεις τραβήγματος πιστολιού από 2 διαφορετικούς ηθοποιούς 150 σημεία Animation της μετατροπής σχήματος σε χρονική σειρά

78 Πειραματικά Αποτελέσματα (συνέχεια) Ταίριασμα ολόκληρων σειρών Αποτελέσματα 1-NN Face Gun Leaf MVM DTW LCSS Η καλύτερη απόδοση του MVM βασίζεται στην ικανότητα του να αποκλείει αυτόματα στοιχεία της target σειράς που δεν ταιριάζουν (π.χ., πίσω μέρος του κεφαλιού στο προφίλ)

79 Πειραματικά Αποτελέσματα (συνέχεια) Ταίριασμα υπο-σειρών (ομοιότητα σχημάτων) Σχήματα Μέρη σχημάτων που χρησιμοποιούνται σαν queries 1-NN in best 6 MVM LCSS DTW Το MVM προσδιορίζει την καλύτερη αντιστοιχία υποσειράς στο σχήμα

80 Πολυπλοκότητα Time complexity: MVM O(m * (n-m) * (n-m)) = O(m*n 2 ) [το (n-m) είναι λόγω του περιορισμού στην ολική ελαστικότητα] O(m * (n-m) * c) = O(m*n) [Όταν περιορίσουμε τον δείκτη διαφοράς σε σταθερά c] O(m) [οταν περιορίσουμε τη διαφορά μήκους των δύο σειρών σε μια σταθερά K: n-m K DTW O(m * n) O(n) [με περιορισμό στο warping window] LCSS O(m * n) Space complexity: MVM, DTW: Two matrices: one for cost, one for path, both are m * n. LCSS: One matrix: record the length of LCS, m *n

81 Συμπεράσματα To MVM (Minimal Variance Matching) κάνει τα παρακάτω ταυτόχρονα : Αυτόματα προσδιορίζει αν η query σειρά ταιριάζει καλύτερα με όλη την target σειρά, ή μόνο με μέρος της Εντοπίζει την υπο-σειρά που ταιριάζει καλύτερα με την query σειρά Αυτόματα παραλείπει τα outliers της target σειράς Ελαχιστοποιεί την στατιστική διακύμανση της ανομοιότητας των αντίστοιχων στοιχείων Το MVM υπερτερεί των DTW και LCSS σε απόδοση Μετασχηματίζοντας το πρόβλημα του ελαστικού ταιριάσματος χρονικών σειρών στο πρόβλημα εύρεσης του πιο σύντομου μονοπατιού σε έναν γράφο DAG, είναι δυνατή η χρήση πιο αποδοτικών αλγορίθμων.

82 Κύρια σημεία Εισαγωγή Χωρικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) και ομαδοποίηση (clustering) Ανακάλυψη συσχετίσεων Ανακάλυψη διακριτικών περιοχών Εκτίμηση/αξιολόγηση της διαδικασίας εξόρυξης γνώσης Χρονικά δεδομένα Κίνητρα Προβλήματα Υπόβαθρο Διαμερισμός (partitioning) Προσέγγιση σειρών με Multi-resolution Vector Quantization Ανάλυση ομοιότητας χρονικών σειρών διαφορετικού μήκους Εφαρμογή τεχνικών ανάλυσης σειρών σε χωρικά δεδομένα Συμπεράσματα Συζήτηση

83 Ανάλυση εικόνων με μετασχηματισμό σε 1D (a) (b) (c) (a) linear mapping of a 3D fmri scan, (b) effect of binning by representing each bin with its V mean measurement, (c) the discriminative voxels after applying the t-test with θ=0.05 Hilbert Space Filling Curve Τοποθέτηση σε κουτιά (Binning) Statistical tests of significance σε ομάδες από σημεία Προσδιορισμός περιοχών ικανών να διακρίνουν ομάδες (με backprojection) [D. Kontos, V. Megalooikonomou, N. Ghubade, and C. Faloutsos, Detecting discriminative functional MRI activation patterns using space filling curves, IEEE Engineering in Medicine and Biology Society (EMBS), 2003]

84 Χρήση τεχνικών για χρονικές σειρές (a) (b) Areas discovered: (a) θ=0.05, (b) θ=0.01. The colorbar shows significance. Αποτελέσματα: 87%-98% ακρίβεια ταξινόμησης (t-test, CATX) Παραλλαγή: Αλυσιδωτή σύνδεση των τιμών των σημαντικών περιοχών χωρικές σειρές Ανάλυση προτύπων με βάση την ομοιότητα μεταξύ χωρικών σειρών και χρονικών σειρών SVD, DFT, DWT, PCA (ακρίβεια ομαδοποιήσης - clustering accuracy: %) [ Q. Wang, D. Kontos, G. Li and V. Megalooikonomou, " Application of Time Series Techniques to Data Mining and Analysis of of Spatial Patterns in 3D images", ICASSP 2004]

85 Περίληψη και Γενικά Συμπεράσματα Στόχος: Ανεύρεση προτύπων (patterns) / ενδιαφέροντων πραγμάτων αποτελεσματικά και με robustness σε Βάσεις χωρικών και χρονικών δεδομένων Χρήση διαμερισμού και ομαδοποίησης Χρήση πολλαπλής ανάλυσης (multiple resolutions) Ελαχιστοποίηση του αριθμού των tests που εκτελούνται Επιλεκτική επεξεργασία του χώρου με έξυπνες μεθόδους για ανεύρεση διακριτικών περιοχών (discriminative areas) Μείωση της διαστατικότητας Αναπαράσταση με συμβολοσειρές Εργαλεία για δημιουργία περίληψης Εκμετάλλευση υπάρχουσας γνώσης (prior knowledge) σχετικά με τα δεδομένα Μελέτη πιο πολύπλοκων χωρικών/χρονικών/χωροχρονικών μοντέλων και μεγαλύτερων σετ δεδομένων

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589) Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589) Μεγαλοοικονόμου Βασίλειος Τμήμα Μηχ. Η/ΥκαιΠληροφορικής Επιστημονικός Υπεύθυνος Στόχος Προτεινόμενου Έργου Ανάπτυξη μεθόδων

Διαβάστε περισσότερα

Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών Gemini,, Applications Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών Εαρινό Εξάμηνο 2011-2012 Table of contents 1 Table of contents 1 2 Table of contents 1 2 3 Table of contents

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας

Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας Μακεδόνας Ανδρέας Μεταδιδακτορικός Ερευνητής Τμ. Φυσικής, Εργαστήριο Ηλεκτρονικής Ένα απλό ερώτημα Στον κόσμο την πληροφορίας υπάρχει

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές

Διαβάστε περισσότερα

ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ

ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ BIOMIG Medical Image Processing, Algorithms and Applications http://biomig.ntua.gr ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ Εισαγωγή στην MRI και στην fmri ΔΡ. Γ. ΜΑΤΣΟΠΟΥΛΟΣ ΑΝ. ΚΑΘΗΓΗΤΗΣ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ

Διαβάστε περισσότερα

substructure similarity search using features in graph databases

substructure similarity search using features in graph databases substructure similarity search using features in graph databases Aleksandros Gkogkas Distributed Management of Data Laboratory intro Θα ενασχοληθούμε με το πρόβλημα των ερωτήσεων σε βάσεις γραφημάτων.

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά.

Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά. Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά Xerox Research Centre Europe LIP6 - Université Pierre et Marie Curie

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #05 Ακρίβεια vs. Ανάκληση Extended Boolean Μοντέλο Fuzzy Μοντέλο 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 7 ο : Ανάκτηση πληροφορίας Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος βασίζονται

Διαβάστε περισσότερα

Αξιολόγηση µεθόδων σύνθεσης εικόνων. Β. Τσαγκάρης και Β. Αναστασόπουλος

Αξιολόγηση µεθόδων σύνθεσης εικόνων. Β. Τσαγκάρης και Β. Αναστασόπουλος Αξιολόγηση µεθόδων σύνθεσης εικόνων Β. Τσαγκάρης και Β. Αναστασόπουλος Περιεχόµενα Σύνθεση πληροφορίας - εικόνων Εφαρµογές Τύποι εικόνων Μέθοδοι σύνθεσης εικόνων Αξιολόγηση µεθόδων σύνθεσης εικόνων Θεωρία

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος B http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse

Διαβάστε περισσότερα

Buried Markov Model Pairwise

Buried Markov Model Pairwise Buried Markov Model 1 2 2 HMM Buried Markov Model J. Bilmes Buried Markov Model Pairwise 0.6 0.6 1.3 Structuring Model for Speech Recognition using Buried Markov Model Takayuki Yamamoto, 1 Tetsuya Takiguchi

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι

Διαβάστε περισσότερα

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques)

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques) Αναγνώριση Προτύπων Μη παραμετρικές τεχνικές Αριθμητικά Παραδείγματα (Non Parametric Techniques) Καθηγητής Χριστόδουλος Χαμζάς Τα περιεχόμενο της παρουσίασης βασίζεται στο βιβλίο: Introduction to Pattern

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

Εφαρμογές σε Χωρικά Δίκτυα

Εφαρμογές σε Χωρικά Δίκτυα Εφαρμογές σε Χωρικά Δίκτυα Ελευθέριος Τιάκας Δεκέμβριος 2013 Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εργαστήριο Τεχνολογίας και Επεξεργασίας Δεδομένων Τμήμα Πληροφορικής Α.Π.Θ. Σύνοψη Παρουσίασης Σημαντικά

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης

Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης ΠΜΣ Βιοπληροφορικής Μαρίνα-Αγάπη Αθανασούλη Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών ΕΚΕΦΕ Δημόκριτος Σκοπός Σύντομη παρουσίαση

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 9 ο Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ Εισαγωγή () Η κατάτμηση έχει ως στόχο να υποδιαιρέσει την εικόνα σε συνιστώσες περιοχές και αντικείμενα. Μία περιοχή αναμένεται να έχει ομοιογενή χαρακτηριστικά

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 9 ο Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ Εισαγωγή () Η κατάτμηση έχει ως στόχο να υποδιαιρέσει την εικόνα σε συνιστώσες περιοχές και αντικείμενα. Μία περιοχή αναμένεται να έχει ομοιογενή χαρακτηριστικά

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

Ειδικές Επιστηµονικές Εργασίες

Ειδικές Επιστηµονικές Εργασίες Ειδικές Επιστηµονικές Εργασίες 2005-2006 1. Ανίχνευση προσώπων από ακολουθίες video και παρακολούθηση (face detection & tracking) Η ανίχνευση προσώπου (face detection) αποτελεί το 1 ο βήµα σε ένα αυτόµατο

Διαβάστε περισσότερα

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) Θεοχαράτος Χρήστος Εργαστήριο Ηλεκτρονικής (ELLAB), Τµήµα Φυσικής, Πανεπιστήµιο Πατρών email: htheohar@upatras.gr http://www.ellab.physics.upatras.gr/users/theoharatos/default.htm

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Το μοντέλο Boolean Το μοντέλο Vector Ταξινόμηση Μοντέλων IR Ανάκτηση Περιήγηση Κλασικά Μοντέλα Boolean Vector Probabilistic Δομικά Μοντέλα Non-Overlapping Lists Proximal Nodes Browsing

Διαβάστε περισσότερα

Biostatistics for Health Sciences Review Sheet

Biostatistics for Health Sciences Review Sheet Biostatistics for Health Sciences Review Sheet http://mathvault.ca June 1, 2017 Contents 1 Descriptive Statistics 2 1.1 Variables.............................................. 2 1.1.1 Qualitative........................................

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων Αναστάσιος Σκαρλατίδης 1,2 anskarl@iit.demokritos.gr επιβλέπων: Καθ. Βούρος Γ. 1 1 Τµήµα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστηµάτων Πανεπιστήµιο

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Λανθάνουσα Σημασιολογική Ανάλυση (Latent Semantic Analysis) Απόστολος Παπαδόπουλος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό

Διαβάστε περισσότερα

Προσομοίωση Μοντέλων Επιχειρησιακών Διαδικασιών

Προσομοίωση Μοντέλων Επιχειρησιακών Διαδικασιών Προσομοίωση Μοντέλων Επιχειρησιακών Διαδικασιών Α. Τσαλγατίδου - Γ.-Δ. Κάπος Πρόγραμμα Μεταπτυχιακών Σπουδών Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών 2017-2018 Σκοπός Διαλέξεων Κίνητρα για προσομοίωση

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διαλέξεις 11-12 Γραμμική παλινδρόμηση συνέχεια Γραμμική παλινδρόμηση συνέχεια Γραμμικές διαχωριστικές συναρτήσεις Γραμμική παλινδρόμηση (Linear regression) y = w + wx + + w

Διαβάστε περισσότερα

Τμηματοποίηση με χρήση τυχαίων πεδίων Markov. Κοινή ιδιότητα σημείων τμήματος Εισαγωγή χωρικής πληροφορίας Εξομάλυνση πεδίου κατατάξεων

Τμηματοποίηση με χρήση τυχαίων πεδίων Markov. Κοινή ιδιότητα σημείων τμήματος Εισαγωγή χωρικής πληροφορίας Εξομάλυνση πεδίου κατατάξεων Τμηματοποίηση με χρήση τυχαίων πεδίων Markov Κοινή ιδιότητα σημείων τμήματος Εισαγωγή χωρικής πληροφορίας Εξομάλυνση πεδίου κατατάξεων Κόστος τμηματοποίησης Δυαδικοποίηση Κόστος σφαλμάτων σημειακής κατάταξης

Διαβάστε περισσότερα

Μηχανουργική Τεχνολογία ΙΙ

Μηχανουργική Τεχνολογία ΙΙ Μηχανουργική Τεχνολογία ΙΙ Χαρακτηριστικά διεργασιών - Παραμετροποίηση-Μοντελοποίηση Associate Prof. John Kechagias Mechanical Engineer, Ph.D. Παραμετροποίηση - Μοντελοποίηση Στο κεφάλαιο αυτό γίνεται

Διαβάστε περισσότερα

Ομαδοποίηση ΙΙ (Clustering)

Ομαδοποίηση ΙΙ (Clustering) Ομαδοποίηση ΙΙ (Clustering) Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr Αλγόριθμοι ομαδοποίησης Επίπεδοι αλγόριθμοι Αρχίζουμε με μια τυχαία ομαδοποίηση Βελτιώνουμε επαναληπτικά KMeans Ομαδοποίηση

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA)

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Component Analysis, PCA) ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα 005 - Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π. Ανάλυση Κυρίων Συνιστωσών (Principal-Coponent Analysis, PCA) καθ. Βασίλης Μάγκλαρης aglaris@netode.ntua.gr www.netode.ntua.gr

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στην κατάτμηση εικόνας Τεχνικές

Διαβάστε περισσότερα

Anomaly Detection with Neighborhood Preservation Principle

Anomaly Detection with Neighborhood Preservation Principle 27 27 Workshop on Information-Based Induction Sciences (IBIS27) Tokyo, Japan, November 5-7, 27. Anomaly Detection with Neighborhood Preservation Principle Tsuyoshi Idé Abstract: We consider a task of anomaly

Διαβάστε περισσότερα

Βιοπληροφορική II. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Βιοπληροφορική II. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 Βιοπληροφορική II Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 Μικροσυστοιχίες Γυάλινο πλακίδιο που αποτελείται από συγκεκριμένες αλληλουχίες οι οποίες είναι ειδικές για συγκεκριμένα

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 9: Ομαδοποίηση Μέρος Γ Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 8: Ομαδοποίηση Μέρος B Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Παπαδάκης Χαράλαμπος 1, Παναγιωτάκης Κώστας 2, Παρασκευή Φραγκοπούλου 1 1 Τμήμα Μηχ/κών Πληροφορικής, ΤΕΙ Κρήτης 2 Τμήμα

Διαβάστε περισσότερα

Digital Image Processing

Digital Image Processing Digital Image Processing Intensity Transformations Πέτρος Καρβέλης pkarvelis@gmail.com Images taken from: R. Gonzalez and R. Woods. Digital Image Processing, Prentice Hall, 2008. Image Enhancement: είναι

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Εργασία 1η Classification

Αναγνώριση Προτύπων Εργασία 1η Classification ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Αναγνώριση Προτύπων Εργασία 1η Classification Κιντσάκης Αθανάσιος 6667 Μόσχογλου Στυλιανός 6978 30 Νοεμβρίου,

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ... ΠΕΡΙΕΧΟΜΕΝΑ ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...................................... 11 ΠΡΟΛΟΓΟΣ..........................................................15 1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΝΑΛΥΤΙΚΗ, ΣΤΑ ΠΟΣΟΤΙΚΑ

Διαβάστε περισσότερα

Προχωρημένες Εργασίες

Προχωρημένες Εργασίες Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Τεχνολογία και Ανάλυση Εικόνων και Βίντεο Προχωρημένες Εργασίες Χειμερινό Εξάμηνο 2007-2008 1. Εισαγωγή Σε σχέση με τις

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

LALING/PLALING :

LALING/PLALING : 1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ Άνοιξη I. ΜΗΛΗΣ

ΑΛΓΟΡΙΘΜΟΙ  Άνοιξη I. ΜΗΛΗΣ ΑΛΓΟΡΙΘΜΟΙ http://eclass.aueb.gr/courses/inf161/ Άνοιξη 216 - I. ΜΗΛΗΣ ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΑΛΓΟΡΙΘΜΟΙ - ΑΝΟΙΞΗ 216 - Ι. ΜΗΛΗΣ 9 DP II 1 Dynamic Programming ΓΕΝΙΚΗ ΙΔΕΑ 1. Ορισμός υπο-προβλήματος/ων

Διαβάστε περισσότερα

χ 2 test ανεξαρτησίας

χ 2 test ανεξαρτησίας χ 2 test ανεξαρτησίας Καθηγητής Ι. Κ. ΔΗΜΗΤΡΙΟΥ demetri@econ.uoa.gr 7.2 Το χ 2 Τεστ Ανεξαρτησίας Tο χ 2 τεστ ανεξαρτησίας (όπως και η παλινδρόμηση) είναι στατιστικά εργαλεία για τον εντοπισμό σχέσεων μεταξύ

Διαβάστε περισσότερα

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ Ενότητα 4: Time and Frequency Analysis Διδάσκων: Γεώργιος Στεφανίδης Πολυτεχνική Σχολή Τμήμα Πολιτικών Μηχανικών Σκοποί ενότητας Για την περιγραφή ενός συστήματος κρίσιμο

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

ΒΕΛΤΙΣΤΕΣ ΙΑ ΡΟΜΕΣ ΣΕ ΙΚΤΥΑ ΜΕΤΑΒΛΗΤΟΥ ΚΟΣΤΟΥΣ

ΒΕΛΤΙΣΤΕΣ ΙΑ ΡΟΜΕΣ ΣΕ ΙΚΤΥΑ ΜΕΤΑΒΛΗΤΟΥ ΚΟΣΤΟΥΣ ΒΕΛΤΙΣΤΕΣ ΙΑ ΡΟΜΕΣ ΣΕ ΙΚΤΥΑ ΜΕΤΑΒΛΗΤΟΥ ΚΟΣΤΟΥΣ Μωυσιάδης Πολυχρόνης, Ανδρεάδης Ιωάννης Τμήμα Μαθηματικών Α.Π.Θ. ΠΕΡΙΛΗΨΗ Στην εργασία αυτή παρουσιάζεται μία μελέτη για την ελάχιστη διαδρομή σε δίκτυα μεταβλητού

Διαβάστε περισσότερα

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 15η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων Κωνσταντίνος Τζιόμαλος Επίκουρος Καθηγητής Παθολογίας ΑΠΘ Α Προπαιδευτική Παθολογική Κλινική, Νοσοκομείο ΑΧΕΠΑ 1 ο βήμα : καταγραφή δεδομένων Το πιο πρακτικό

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Χωρικά φίλτρα Χωρικά φίλτρα Γενικά Σε αντίθεση με τις σημειακές πράξεις και μετασχηματισμούς, στα

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker Ειδική Ερευνητική Εργασία Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker ΚΑΡΑΔΗΜΑΣ ΗΛΙΑΣ Α.Μ. 323 Επιβλέπων: Σ. Φωτόπουλος Καθηγητής, Μεταπτυχιακό Πρόγραμμα «Ηλεκτρονική και Υπολογιστές», Τμήμα Φυσικής,

Διαβάστε περισσότερα

Ανάκτηση πολυμεσικού περιεχομένου

Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Εξόρυξη γνώσης από δεδομένα δικτύου υπολογιστών: Συστήματα ανίχνευσης εισβολής.

Εξόρυξη γνώσης από δεδομένα δικτύου υπολογιστών: Συστήματα ανίχνευσης εισβολής. Πανεπιστήμιο Μακεδονίας, Δια τμηματικό πρόγραμμα μεταπτυχιακών σπουδών στα πληροφοριακά συστήματα. Εξόρυξη γνώσης από δεδομένα δικτύου υπολογιστών: Συστήματα ανίχνευσης εισβολής. Κατσαβέλης Κ. Ζήσης Οκτώβριος

Διαβάστε περισσότερα

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS Ο παρακάτω πίνακας παρουσιάζει θανάτους από καρδιακή ανεπάρκεια ανάμεσα σε άνδρες γιατρούς οι οποίοι έχουν κατηγοριοποιηθεί κατά ηλικία

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Οι διαφάνειες αυτού του μαθήματος

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 7: Σύγκριση αλληλουχιών Part II Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΑΓΡΟΝΟΜΩΝ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΤΟΠΟΓΡΑΦΙΑΣ ΟΜΑΔΟΠΟΙΗΣΗ ΑΡΙΘΜΗΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΒΥΡΩΝΑΣ ΝΑΚΟΣ ΑΘΗΝΑ 2006 ΠΕΡΙΕΧΟΜΕΝΑ Περιεχόμενα 1. Εισαγωγή 1 2. Μέθοδοι σταθερών

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο Εαρινό εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο 2009-2010 Στατιστική και Θεωρία Πιθανοτήτων users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr

Διαβάστε περισσότερα

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό ΗΜΥ 429 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό 1 (i) Βασική στατιστική 2 Στατιστική Vs Πιθανότητες Στατιστική: επιτρέπει μέτρηση και αναγνώριση θορύβου και

Διαβάστε περισσότερα

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ ΚΩΔΙΚΟΣ MIS: 346961 Φορέας Υποβολής: Πανεπιστήμιο Ιωαννίνων - Τμήμα Πληροφορικής Φορέας Χρήστης:

Διαβάστε περισσότερα