ΜΕΛΕΤΗ ΤΕΧΝΙΚΩΝ, ΜΕΘΟΔΟΛΟΓΙΩΝ ΚΑΙ ΕΦΑΡΜΟΓΩΝ ΣΤΟΝ ΤΟΜΕΑ ΤΗΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΕΛΕΤΗ ΤΕΧΝΙΚΩΝ, ΜΕΘΟΔΟΛΟΓΙΩΝ ΚΑΙ ΕΦΑΡΜΟΓΩΝ ΣΤΟΝ ΤΟΜΕΑ ΤΗΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ"

Transcript

1 ^,ΛίΓ πγΐν ΤΕΙ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ Πτυχιακή Εργασία: ΜΕΛΕΤΗ ΤΕΧΝΙΚΩΝ, ΜΕΘΟΔΟΛΟΓΙΩΝ ΚΑΙ ΕΦΑΡΜΟΓΩΝ ΣΤΟΝ ΤΟΜΕΑ ΤΗΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ Κωσιωρή Αφροδίτη ΜΑΙΟΣ 2013 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ Κος Ζαφειρίδης Παναγιώτης Εκπονηθείσα πτυχιακή εργασία απαραίτητη για την κτήση του βασικού πτυχίου

2

3

4

5 ΠΡΟΛΟΓΟΣ Η σύγκλιση της προόδου των υπολογιστικών συστημάτων και της εξέλιξης στην επικοινωνία έχει οδηγήσει στην δημιουργία μιας κοινωνίας ικανής να παρέχει διαρκώς νέες πληροφορίες. Το υλικό που συγκεντρώνεται καταγράφεται διαρκώς, με αποτέλεσμα τη δημιουργία τεράστιων βάσεων δεδομένων. Το ζήτημα λοιπόν που προκύπτει είναι εάν μπορούμε να διαχειριστούμε αυτές τις βάσεις δεδομένων. Είναι βέβαιο ότι ζούμε στην κοινωνία της πληροφορίας, όπου η μετατροπή των δεδομένων σε πληροφορία απαιτείται να οδηγεί στην μετατροπή της πληροφορίας σε γνώση. Μια από τις πιο μεγάλες προκλήσεις της εποχής μας είναι η ανακάλυψη προτύπων, τάσεων και ανωμαλιών σε τεράστια σύνολα δεδομένων, καθώς και η σύνοψη τους μέσω απλών και εύχρηστων μοντέλων. Η συνύπαρξη ετερόκλητων επιστημονικών πεδίων όπως της στατιστικής, της μηχανικής μάθησης, της θεωρίας της πληροφορίας και των υπολογιστικών διαδικασιών, έχει δημιουργήσει μια νέα επιστήμη με δυναμικά εργαλεία, η οποία καλείται «Εξόρυξη Δεδομένων» Σελ.5 από 157

6 Περιεχόμενα ΠΡΟΛΟΓΟΣ... 5 Πίνακας Σχημάτων ΚΕΦΑΛΑΙΟ 1Ο ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΚΑΛΥΨΗ ΓΝΩΣΗΣ...12 ΕΙΣΑΓΩΓΗ Εξόρυξη και Ανακάλυψη Γνώσης Τα Στάδια της KDD Διαδικασίας Οι ρίζες της Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων Στατιστική Τεχνητή Νοημοσύνη-Μηχανική Μάθηση Βάσεις Δεδομένων Ανάκτηση Πληροφοριών Δεδομένα Προς Ανακάλυψη Γνώσης Τι Είδους Δεδομένα Συλλέγουμε Τύποι Δεδομένων Για Την Ανακάλυψη Γνώσης Επίπεδα αρχεία (Flat files) Σχεσιακές βάσεις δεδομένων (Relational Databases) Αποθήκες δεδομένων (Data Warehouse) Βάσεις Δεδομένων Συναλλαγών (Transactional Databases) Βάσεις δεδομένων Πολυμέσων (Multimedia Databases) Χρονικές βάσεις δεδομένων (Temporal Databases) Χωρικές βάσεις δεδομένων (Spatial Databases) Βάσεις δεδομένων κειμένου (Text databases) Παγκόσμιος Ιστός Η Εξόρυξη Γνώσης Από Δεδομένα Ως Στάδιο Της KDD Εργασίες Εξόρυξης Γνώσης Από Δεδομένα Κατηγοριοποίηση Παλινδρόμηση Ανάλυση Χρονοσειρών...34 Σελ.6 από 157

7 1.6.4 Πρόβλεψη Συσταδοποίηση Παρουσίαση Συνόψεων Κανόνες Συσχέτισης Ανακάλυψη Ακολουθιών...37 ΚΕΦΑΛΑΙΟ 2Ο ΜΟΝΤΕΛΟΠΟΙΩΝΤΑΣ ΤΗΝ KDD ΔΙΑΔΙΚΑΣΙΑ...38 Εισαγωγή στη Μοντελοποίηση Επισκόπηση Μοντέλων Το μοντέλο Crisp-DM (CRoss Industry Standard Process for Data Mining) Το CRISP DM σε δράση...47 ΚΕΦΑΛΑΙΟ 3Ο ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ Εισαγωγή στην Κατηγοριοποίηση Η διαδικασία της κατηγοριοποίησης Εκτίμηση ακρίβειας Κατηγοριοποιητή Αλγόριθμοι Κατηγοριοποίησης Αλγόριθμοι Βασισμένοι στην απόσταση Κ Πλησιέστεροι Γείτονες Αλγόριθμοι Δένδρων Αποφάσεων Ο Αλγόριθμος ID Ο Αλγόριθμος ID3 σε Java Ο Αλγόριθμος C Ο Αλγόριθμός CART Κλιμακούμενες Τεχνικές για Δένδρα Απόφασης Bayesian Κατηγοριοποίηση Naïve Bayes Υπόλοιπες τεχνικές Κατηγοριοποίησης Νευρωνικά Δίκτυα Κατηγοριοποίηση βάσει Κανόνων...91 Σελ.7 από 157

8 Κατηγοριοποίηση με SVM's...92 ΚΕΦΑΛΑΙΟ 4Ο ΣΥΣΤΑΔΟΠΟΙΗΣΗ...94 Εισαγωγή στη Συσταδοποίηση Η διαδικασία της Συσταδοποίησης Κατηγοριοποίηση των αλγορίθμων Συσταδοποίησης Ιεραρχικοί Αλγόριθμοι Συσταδοποίησης Ο Αλγόριθμος CURE Ο Αλγόριθμος Β^ΟΗ Ο Αλγόριθμος ROCK Διαμεριστικοί Αλγόριθμοι Συσταδοποίησης Ο Αλγόριθμος K-Means Ο αλγόριθμος PAM ΚΕΦΑΛΑΙΟ 5Ο ΚΑΝΟΝΕΣ ΣΥΣΧΕΤΙΣΗΣ Εισαγωγή στους Κανόνες Συσχέτισης Κανόνες Συσχέτισης και Στοιχειοσύνολα Αλγόριθμοι Κανόνων Συσχέτισης Ο Αλγόριθμος Apriori O Αλγόριθμος Akamas ΚΕΦΑΛΑΙΟ 6Ο Εξόρυξη Γνώσης από τον Παγκόσμιο στον Σημασιολογικό Ιστό Εισαγωγή Εξόρυξη Γνώσης από τον Παγκόσμιο Ιστό (ΠΙ) Εξόρυξη Γνώσης από το Περιεχόμενο του Παγκόσμιου Ιστού Εξόρυξη Γνώσης από τη Χρήση του Παγκόσμιου Ιστού Εφαρμογές Εξόρυξης Γνώσης ΠΙ Προσωποποίηση περιεχομένου Προανάκληση και επαναποθήκευση δεδομένων Υποστήριξη στο σχεδιασμό σελίδων Σελ.8 από 157

9 Ηλεκτρονικό εμπόριο Ο Σημασιολογικός Ιστός (ΣΙ) Εξόρυξη Γνώσης από τον Σημασιολογικό Ιστό Εφαρμογές Εξόρυξης Γνώσης ΣΙ ΚΕΦΑΛΑΙΟ 7Ο Η Προσφορά της Εξόρυξης Γνώσης σε διάφορους επιστημονικούς τομείς Εισαγωγή Εξόρυξη Γνώσης στη Βιοϊατρική και στην ανάλυση DNA δεδομένων Εξόρυξη Γνώσης στο Τομέα των Τηλεπικοινωνιών Εξόρυξη Γνώσης για την Βιομηχανία του Λιανικού εμπορίου(^3ΐί industry) Εξόρυξη Γνώσης στην ανάλυση Χρηματοοικονομικών δεδομένων Συμπεράσματα-Μελλοντικές Τάσεις Βιβλιογραφία Σελ.9 από 157

10 Πίνακας Σχημάτων [ 1] Σχήμα 1.1: Διαδικασία KDD 16 [2] Σχήμα 1.2: Επιστημονικά Πεδία Ανακάλυψης Γνώσης σε βάσεις δεδομένων 20 [3] Σχήμα 1.3: Αποθήκη δεδομένων 28 [4] Σχήμα 1.4: Μοντέλα και εργασίες στην εξόρυξη γνώσης από δεδομένα 34 [5] Σχήμα 1.5: Ένα τυπικό διάγραμμα χρονοσειρών 36 [6] Σχήμα 2.1: The Reinartz s model 42 [7] Σχήμα 2.2: Το μοντέλο CRISP-DM 44 [8] Σχήμα 2.3: Crisp-dm Step-by-step data mining guide 46 [9] Σχήμα 3.1: Η διαδικασία της κατηγοριοποίησης 55 [ 10] Σχήμα 3.2: Εκτίμηση ακρίβειας με την μέθοδο holdout 57 [ 11] Σχήμα 3.3: Εκτίμηση ακρίβειας με τη μέθοδο k-fold cross-validation 58 [12] Σχήμα 3.6: Κατηγοριοποίηση με χρήση απλού αλγόριθμου απόστασης 62 [ 13] Σχήμα 3.7: Κατηγοριοποίηση με χρήση KNN 63 [ 14] Σχήμα 3.8(i): Αναπαράσταση Δένδρου από δεδομένα πίνακα [15] Σχήμα 3.9: Το πρόβλημα της κατηγοριοποίησης με ID3 74 [ 16] Σχήμα 3.10: Νευρωνικό Δίκτυο 91 [ 17] Σχήμα 3.11: SVM διαχωρισμός 94 [ 18] Σχήμα 4.1: Η διαδικασία της Συσταδοποίησης 96 [ 19] Σχήμα 4.2 : Δενδρόγραμμα 98 [20] Σχήμα 4.3 Ακολουθία Συσσωρευτικών αλγορίθμων 99 [21] Σχήμα 4.4 : Προσέγγιση του Αλγόριθμου CURE 102 [22] Σχήμα 4.5: Αρχικοποίηση K-Means 107 [23] Σχήμα 4.6: Παράδειγμα αποτελεσμάτων με την μέθοδο K-Means 108 [24] Σχήμα 4.7: Fuzzy k-means 111 [25] Σχήμα 4.8 Σύγκριση Κ-means & Pam 112 [26] Σχήμα 5.1: Παράδειγμα της βασικής αρχής του Apriori αλγόριθμου 119 [27] Σχήμα 5.2: Κλάδεμα των μη συχνών itemsets 120 Σελ.10 από 157

11 [28] Σχήμα 6.1: Κατηγοριοποίηση εργασιών Web Mining 133 [29] Σχήμα 6.2: Συσχετίσεις κατηγοριών Web Mining 134 [30] Σχήμα 6.3: Ιεραρχία εξόρυξης κειμένου 135 [31] Σχήμα 6.4: Η δημιουργία του Semantic WM 139 [32] Σχήμα 6.5:Η Δομή του Σημασιολογικού Ιστού 141 [33] Σχήμα 6.6: RDF γράφημα οντολογίας 142 Σελ.11 από 157

12 ΚΕΦΑΛΑΙΟ 1 Ο ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΚΑΛΥΨΗ ΓΝΩΣΗΣ «Knowledge Discovery is the most desirable end-product of computing. It's not surprising that is also one of the most difficult computing challenges to do well... (Gio Wiederhold '96)» ΕΙΣΑΓΩΓΗ Ιστορικά, στην έννοια της εύρεσης χρήσιμων συσχετίσεων μεταξύ των δεδομένων έχουν δοθεί ποικίλα ονόματα από διάφορες επιστημονικές κοινότητες, μερικά από τα οποία είναι η εξόρυξη γνώσης από δεδομένα, η εξαγωγή γνώσης, η ανακάλυψη γνώσης, η συγκομιδή πληροφοριών, data archaeology και η διαδικασία συσχετίσεων των δεδομένων. Ο όρος "εξόρυξη γνώσης από δεδομένα" (data mining) έχει χρησιμοποιηθεί κυρίως από τους στατιστικούς, τους αναλυτές δεδομένων, τις κοινότητες συστημάτων διαχείρισης πληροφοριών καθώς και στις επιχειρηματικές κοινότητες. Η φράση "Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων"(knowledge discovery in databases) δημιουργήθηκε στο πρώτο KDD εργαστήριο, το 1989 για να δώσει έμφαση στο ότι η γνώση είναι το τελικό προϊόν από μια οδηγούμενη από τα δεδομένα ανακάλυψη. Έχει διαδοθεί στους τομείς της Τεχνητής Νοημοσύνης, της Μηχανικής Μάθησης, της Στατιστικής και των Βάσεων Δεδομένων. Παρακάτω αναφέρουμε τη σχέση μεταξύ της Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων και των παραπάνω τομέων.[7] 1.1 Εξόρυξη και Ανακάλυψη Γνώσης Οι όροι «Εξόρυξη Γνώσης από Δεδομένα» (DataMining) και «Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων» (Knowledge Discovery in Databases, KDD) Σελ.12 από 157

13 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή συχνά χρησιμοποιούνται εναλλακτικά για την ίδια έννοια. Στην πραγματικότητα όμως η «Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων» χρησιμοποιείται για να εκφράσει μια διαδικασία που αποτελείται από πολλά βήματα και η «Εξόρυξη Γνώσης από Δεδομένα» είναι ένα κομμάτι της διαδικασίας αυτής. Με λίγα λόγια, η ανακάλυψη γνώσης σε βάσεις δεδομένων (KDD) είναι η διαδικασία εύρεσης χρήσιμων πληροφοριών και προτύπων στα δεδομένα, ενώ η εξόρυξη γνώσης από δεδομένα είναι η χρήση αλγορίθμων για την εξαγωγή πληροφοριών και προτύπων που παράγονται με την διαδικασία ανακάλυψης γνώσης σε βάσεις δεδομένων.[3] Ένας γενικός ορισμός, που παρουσιάζει με περισσότερη σαφήνεια την έννοια του όρου KDD δόθηκε από τους Frawley,Piatesky-Shaphiro και Matheus (1996), σύμφωνα με τον οποίο: «Η ανακάλυψη γνώσης στις βάσεις δεδομένων είναι η ντετερμινιστική και σημαντική διαδικασία αναγνώρισης έγκυρων, καινοτόμων, ενδεχομένως χρήσιμων και εν τέλει κατανοητών μοτίβων στα δεδομένα» Για να γίνει πιο κατανοητή η έννοια των όρων που συμπεριλαμβάνονται στον παραπάνω ορισμό, ακολουθεί μια σύντομη περιγραφής τους: > Τα δεδομένα αποτελούν ένα σύνολο πραγματικών οντοτήτων ή συσχετίσεων. Για παράδειγμα, θα μπορούσε να είναι ένα σύνολο εγγραφών των ασθενών ενός νοσοκομείου στις οποίες υπάρχει περιγραφή κάποιων ιδιοτήτων τους (για παράδειγμα όνομα, επώνυμο, ημερομηνία γέννησης και διάγνωση). > Ο όρος μοτίβο ή πρότυπο (pattern) εγκολπώνει έννοιες όπως συσχετίσεις (correlations), συνάφειες ή σχέσεις (relationships), γραμμές κατεύθυνσης (trends), περιγραφές σπάνιων γεγονότων, κλπ. Βέβαια υπάρχουν και άλλοι τρόποι περιγραφής του στόχου της ανακάλυψης γνώσης και της εξόρυξης δεδομένων, ανάλογα πάντα με τη γενικότητα του προβλήματος και τις προσδοκίες των επιστημόνων. Πρότυπα είναι μια έκφραση, σε μια Σελ. 13 από 157

14 Κεφάλαιο 1ο 1.2 Τα Στάδια της Κϋϋ Διαδικασίας συγκεκριμένη γλώσσα, που περιγράφει ένα υποσύνολο των δεδομένων χρησιμοποιώντας τις κοινές ιδιότητες τους. > Ο όρος διαδικασία υπονοεί ότι η ανακάλυψη γνώσης από βάσεις δεδομένων είναι μια διαδικασία πολλαπλών βημάτων, που περιλαμβάνει την προεπεξεργασία των δεδομένων, την αναζήτηση προτύπων και την αξιολόγηση της εξαγόμενης γνώσης. Τα βήματα αυτά επαναλαμβάνονται κατά την διάρκεια πολλαπλών επαναλήψεων. > Ο όρος ντετερμινιστική αναφέρεται στο ότι η ανακάλυψη γνώσης δεν είναι ένας απλός υπολογισμός προκαθορισμένων μεγεθών, όπως για παράδειγμα υπολογισμός του μέσου όρου ενός συνόλου αριθμών, αλλά περιλαμβάνει κάποια αναζήτηση και συμπεράσματα. > Εγκυρότητα των προτύπων σημαίνει ότι τα πρότυπα που προκύπτουν θα πρέπει να ισχύουν και είναι συνεπή και για νέα δεδομένα, με κάποιο βαθμό βεβαιότητας. > Ενδεχομένως χρήσιμων σημαίνει ότι η ανακάλυψη προτύπων θα πρέπει να οδηγεί σε ορισμένες χρήσιμες διεργασίες. Η χρησιμότητα τους αξιολογείται μέσω συναρτήσεων εκτίμησης χρησιμότητας. > Εν τέλει Κατανοητά σημαίνει ότι τα νέα πρότυπα που θα προκύψουν θα πρέπει να είναι κατανοητά, αν όχι άμεσα, τουλάχιστον έπειτα από μικρή επεξεργασία, ακόμη και από μη ειδικούς έτσι ώστε να μπορούν να αξιοποιηθούν εύκολα στην λήψη αποφάσεων. 1.2 Τα Στάδια της Κϋϋ Διαδικασίας Η KDD, όπως θα δούμε στη συνέχεια, είναι μια διαδικασία που περιλαμβάνει πολλά βήματα. Η είσοδος σε αυτή τη διαδικασία είναι τα δεδομένα, και οι χρήσιμες πληροφορίες που επιθυμούν οι χρήστες είναι η έξοδος. Όμως, ο αντικειμενικός σκοπός δεν είναι εξαρχής ξεκάθαρος. Η διαδικασία από μόνη της είναι διαδραστική και συνήθως απαιτείται πολύς χρόνος για την ολοκλήρωσης της. Για να διασφαλιστεί η χρησιμότητα και η ακρίβεια των αποτελεσμάτων αυτής της διαδικασίας, συνήθως χρειάζεται η συνεργασία Σελ. 14 από 157

15 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή ειδικών του πεδίου εφαρμογής με ειδικούς της διαδικασίας KDD καθ' όλη τη διάρκεια της διαδικασίας αυτής.[2] Ο Fayyad στο "Advances in Knowledge Discovery and Data Mining (1996) επικεντρώθηκε στην ανακάλυψη γνώσης από βάσεις δεδομένων και θεώρησε την προσπάθεια αυτή ως: «Τη διεργασία της χρήσης των βάσεων δεδομένων μαζί με οποιαδήποτε απαίτηση επιλογής, προεπεξεργασίας, υποδειγματοποίησης και μετασχηματισμού, προκειμένου να εφαρμοσθούν οι διάφοροι μέθοδοι εξόρυξης δεδομένων για να απαριθμηθούν τα μοτίβα που ενυπάρχουν στη βάση, και για να αξιολογηθούν τα προϊόντα της εξόρυξης γνώσης για να αναγνωριστούν τα υποσύνολα των απαριθμηθέντων μοτίβων που θεωρούνται γνώση» Το Σχήμα 1.1 επεξηγεί τη συνολική διαδικασία της ανακάλυψης γνώσης σε βάσεις δεδομένων. Σχήμα1.1: Διαδικασία KDD (τροποποιημένο από [7]). Κάτι σημαντικό, το οποίο πρέπει να ληφθεί σοβαρά υπόψη είναι ότι πολλές φορές μπορεί να χρειαστεί κάποια από τα επιμέρους βήματα να επαναληφθούν. Αυτό μπορεί να συμβεί, γιατί στην πορεία πιθανώς να εμφανιστούν προβλήματα που να έχουν σχέση με τις αρχικές επιλογές και τα Σελ.15 από 157

16 Κεφάλαιο 1ο 1.2 Τα Στάδια της KDD Διαδικασίας οποία δεν ήταν δυνατόν να εντοπιστούν από την αρχή της διαδικασίας. Είναι, δηλαδή, μία διαδραστική και επαναληπτική διαδικασία, η οποία περιλαμβάνει πολυάριθμα βήματα με πολλές από τις αποφάσεις να λαμβάνονται από το χρήστη. Η διαδικασία KDD αποτελείται από τα επόμενα έξι βήματα: 1. Κατανόηση της περιοχής εφαρμογής Σχετικά με τη προγενέστερη γνώση του προς εξέταση τομέα και τους στόχους του τελικού χρήστη. 2. Επιλογή Δεδομένων Στο στάδιο αυτό δημιουργείται το σύνολο δεδομένων, πάνω στο οποίο θα εφαρμοστεί η KDD διαδικασία. Οι αλγόριθμοι που εκτελούν την ανακάλυψη γνώσης, συνήθως, δεν μπορούν να χρησιμοποιήσουν τα δεδομένα με την μορφή στην οποία είναι εξ αρχής οργανωμένα. Γι' αυτό ακριβώς το λόγο απαιτείται η εξαγωγή τους από τους πολλαπλούς πίνακες και η οργάνωση τους σε απλούστερες και πιο ευκολόχρηστες δομές. Συνήθως, η ανάγκη αυτή ικανοποιείται με την χρήση των συστημάτων αποθήκευσης δεδομένων (data warehouse), τα οποία παρέχουν στους αλγορίθμους ανακάλυψης γνώσης μία πιο εύκολα προσβάσιμη οπτική των δεδομένων. 3. Προεπεξεργασία Δεδομένων Στο στάδιο αυτό αντιμετωπίζονται περιπτώσεις ελλιπών δεδομένων (όπως άδεια πεδία), πεδίων με τιμές που ουσιαστικά τα καθιστούν κενά, (όπως Οδός="Άγνωστο"), πεδίων με τιμές που υπονοούν κάτι άλλο (όπως καταχώριση μιας συγκεκριμένης ημερομηνίας σε πεδίο που απαιτούσε τιμή, αλλά αυτή δεν ήταν διαθέσιμη). Το στάδιο αυτό μπορεί να ονομαστεί και στάδιο καθαρισμού των δεδομένων (data cleaning), εξαιτίας των διαδικασιών που λαμβάνουν χώρα σε αυτό. Στο στάδιο αυτό περιλαμβάνεται ακόμα, η Σελ. 16 από 157

17 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή αφαίρεση του θορύβου (noise, δηλαδή λανθασμένα δεδομένα) από τα δεδομένα, όταν αυτό χρειάζεται, συλλέγοντας τις απαραίτητες πληροφορίες για τη διαμόρφωση ή την περιεκτικότητα του θορύβου, παίρνοντας έτσι αποφάσεις για τις στρατηγικές όσον αφορά τη διαχείριση ελλιπών πεδίων δεδομένων. 4.Μετασχηματισμός Δεδομένων Τα δεδομένα που προέρχονται από διαφορετικές πηγές χρειάζονται να μετατραπούν σε ένα κοινό σχήμα για την περαιτέρω επεξεργασία τους. Μερικά δεδομένα ίσως απαιτείται να κωδικοποιηθούν ή να μετασχηματιστούν σε πιο λειτουργικές δομές. Μπορεί να μειωθούν τα δεδομένα για να ελαττωθεί ο αριθμός των πιθανών τιμών των δεδομένων που θα ληφθούν υπόψη. [2] Οι μετασχηματισμοί μπορεί να περιλαμβάνουν για παράδειγμα, τη μείωση του αριθμού των υπό εξέταση χαρακτηριστικών (dimensionality reduction) με επιλογή ορισμένων εξ' αυτών (feature selection ή attribute selection), την ομοιόμορφη κωδικοποίηση της ποιοτικά ίδιας πληροφορίας, τη μετατροπή συνεχόμενων αριθμητικών τιμών σε διακριτές τιμές (διακριτοποίηση) και πολλά άλλα. Οι μετασχηματισμοί αυτοί γίνονται ανάλογα με τον στόχο της διεργασίας. Η μείωση του αριθμού των διαστάσεων των δεδομένων, αφαιρώντας ακατάλληλα χαρακτηριστικά, μπορεί να βελτιώσει την απόδοση των αλγορίθμων όσον αφορά την ταχύτητα τους, άλλα και την ποιότητα της εξαγόμενης γνώσης, εστιάζοντας στα πιο σχετικά και άρα σημαντικά χαρακτηριστικά. Η επιλογή χαρακτηριστικών μπορεί να γίνει με αυτόματες μεθόδους, αλλά ο καλύτερος τρόπος είναι να γίνει από κάποιον ειδικό του τομέα στον οποίο αναφέρονται τα δεδομένα. Ο ειδικός θα έχει μία καλύτερη οπτική των δεδομένων και θα κατανοεί καλύτερα τη σημασία κάθε χαρακτηριστικού. Σελ.17 από 157

18 Κεφάλαιο 1ο 1.2 Τα Στάδια της KDD Διαδικασίας Η επιλογή χαρακτηριστικών είναι μία απαραίτητη διαδικασία, γιατί συνήθως τα δεδομένα περιλαμβάνουν χαρακτηριστικά τα οποία είναι είτε περιττά στη διαδικασία ανακάλυψης γνώσης είτε ακατάλληλα. Αν και οι περισσότεροι αλγόριθμοι σχεδιάζονται για να μαθαίνουν ποια είναι τα πιο σημαντικά χαρακτηριστικά για τη λήψη μίας απόφασης, όπως για παράδειγμα στα δέντρα απόφασης, οπού επιλέγεται σε κάθε κόμβο το πιο κατάλληλο χαρακτηριστικό για να γίνει ο διαχωρισμός, εντούτοις η ύπαρξη μεγάλου αριθμού μη-σχετικών ή ακατάλληλων χαρακτηριστικών μειώνει σημαντικά την απόδοση των αλγορίθμων. Με τον όρο διακριτοποίηση αναφερόμαστε στη διαδικασία μετασχηματισμού ενός χαρακτηριστικού που παίρνει συνεχείς αριθμητικές τιμές, σε ένα πεπερασμένο σύνολο διακριτών διαστημάτων. Η διαδικασία αυτή απαιτείται είτε γιατί ο αλγόριθμος δεν μπορεί να χειριστεί αριθμητικά δεδομένα είτε δεν τα χειρίζεται σε βαθμό που να βγάζει τα επιθυμητά αποτελέσματα. 5.Εξόρυξη Γνώσης από Δεδομένα Στο βήμα αυτό καθορίζεται τι είδους γνώση θα αναζητηθεί, κάτι το οποίο έμμεσα προσδιορίζει και την κατηγορία αλγορίθμου που θα χρησιμοποιηθεί. Αν θα είναι αλγόριθμος κατηγοριοποίησης, συσταδοποίησης, οπισθοδρόμησης και ούτω καθεξής. Η εφαρμογή του αλγορίθμου είναι ένα καθαρά υπολογιστικό στάδιο, στο οποίο γίνεται η ουσιαστική αναζήτηση της γνώσης από τα δεδομένα. Μπορούν να προκύψουν δύο είδη γνώσης ως παράγωγα της διαδικασίας Εξόρυξη Γνώσης από δεδομένα: Τα προβλεπτικά μοντέλα (predictive model) και Τα περιγραφικά μοντέλα (descriptive model) Σελ. 18 από 157

19 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή Η διαφορά των δύο μοντέλων έγκειται στο γεγονός ότι τα προβλεπτικά μοντέλα, σε αντίθεση από τα περιγραφικά, χρησιμοποιούν την μάθηση με επίβλεψη. 6.Ερμηνεία (interpretation) Στο τελευταίο στάδιο της διαδικασίας γίνεται η ερμηνεία και η αξιολόγηση των ευρεθέντων προτύπων/μοντέλων. Είναι πολύ σημαντικό το πώς θα παρουσιαστούν στους χρήστες τα αποτελέσματα της εξόρυξης γνώσης, επειδή η χρησιμότητα ή μη των αποτελεσμάτων μπορεί να εξαρτάται ακριβώς από αυτήν την παρουσίαση. Σε αυτό το τελευταίο βήμα χρησιμοποιούνται διάφορες στρατηγικές οπτικοποίησης και γραφικές διεπαφές χρήστη (GUI- Graphical user interface).[2] 1.3 Οι ρίζες της Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων Η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων έχει δανειστεί τις τεχνικές και την ορολογία από τις τρείς βασικές της ρίζες, τον τομέα της Στατιστικής, της Μηχανικής Μάθησης(ML)/Τεχνητής Νοημοσύνης(ΑΙ) και των Βάσεων Δεδομένων. Σημαντική επιρροή άσκησε και ο τομέας Ανάκτησης Πληροφοριών. Σχήμα1.2: Επιστημονικά Πεδία Ανακάλυψης Γνώσης σε βάσεις δεδομένων Σελ.19 από 157

20 Κεφάλαιο 1ο 1.3 Οι ρίζες της Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων Στατιστική Η Στατιστική είναι ο παλαιότερος τομέας που χρησιμοποιεί η Ανακάλυψη Γνώσης σε Βάσεις δεδομένων και χωρίς αυτή δεν θα ήταν εφικτή η ύπαρξη της. Η κλασσική Στατιστική εμπερικλείει τεχνικές οι οποίες συνοψίζονται σε αυτό που μας είναι γνωστό ως Εξερευνητική Ανάλυση Δεδομένων (Exploratory Data Analysis (EDA)) και χρησιμοποιείται για να προσδιορίσει διάφορες συσχετίσεις ανάμεσα σε διαφορετικές μεταβλητές, όταν δεν υπάρχουν αρκετές πληροφορίες για την φύση των δεδομένων. [4] Το κοινό σημείο του τομέα της στατιστικής και της εξόρυξης γνώσης είναι ότι και οι δύο αποσκοπούν στην αναγνώριση χρήσιμων πληροφοριών και προτύπων στα δεδομένα. Μέρος της διεργασίας μοντελοποίησης της εξόρυξης γνώσης αποτελεί η αναζήτηση των πραγματικών δεδομένων και η εξαγωγή συμπερασμάτων από τα αποτελέσματα της αναζήτησης. Για αυτό το λόγω, μια συχνά χρησιμοποιούμενη τεχνική της εξόρυξης γνώσης είναι αυτή της δειγματοληψίας. Στην στατιστική αυτή η προσέγγιση αναφέρεται ως "στατιστική εξαγωγή συμπερασμάτων.[2] Ένα σημαντικό τμήμα των υλοποιημένων αλγορίθμων εξόρυξης γνώσης αποτελούνται από στατιστικές τεχνικές που έχουν προσαρμοστεί στις απαιτήσεις του τομέα. Όπως και με τις κλασικές τεχνικές στατιστικής στην εξόρυξη γνώσης ακολουθούμε τεχνικές και δείκτες, όπως ανάλυση παλινδρόμησης (regression analysis), ανάλυση συστάδων (cluster analysis), μέσος (mean), διάμεσος (median), τυπική απόκλιση (standard deviation), συσχέτιση, θεώρημα Bayes, ανάλυση χρονοσειρών κ.α., που χρησιμοποιούνται για την μελέτη των δεδομένων και των σχέσεων ανάμεσα στα δεδομένα και αποτελούν δομικά στοιχεία για τις τεχνικές εξόρυξης γνώσης. [4] Η διαφορές ανάμεσα στους δύο τομείς έγκειται στο γεγονός ότι στην στατιστική, αντίθετα με την εξόρυξη γνώσης, χρησιμοποιούνται μικρότερα και πιο σχηματοποιημένα σύνολα δεδομένων.[2] Με την στατιστική ανάλυση Σελ. 20 από 157

21 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή προσπαθούμε να βρούμε αυτό που ήδη ψάχνουμε, ενώ με την εξόρυξη γνώσης ψάχνουμε για το τι μπορεί να ανακαλύψουμε από τα δεδομένα. Η σημαντική επιρροή που άσκησε η Στατιστική στον τομέα της Εξόρυξης Γνώσης παρατηρείται από το γεγονός ότι ακόμα και όταν οι αλγόριθμοι εξόρυξης γνώσης δεν χρησιμοποιούν άμεσα τεχνικές στατιστικής, πολλές φορές οι βασικές τους ιδέες απορρέουν από αυτή Τεχνητή Νοημοσύνη-Μηχανική Μάθηση Η Τεχνητή Νοημοσύνη (TN)(Artificial Intelligent), σε αντίθεση με την Στατιστική, έχει βασιστεί σε μεθόδους αυτοδιδαχής. Σκοπός της Τεχνητής Νοημοσύνης, και κοινή συνιστώσα με την ανακάλυψη γνώσης, είναι η εξαγωγή λογικών συμπερασμάτων από ανεπεξέργαστα δεδομένα. Αυτή η διαδικασία στην Τεχνητή Νοημοσύνη πραγματοποιείται μέσω ευφυών υπολογιστικών συστημάτων, δηλαδή συστημάτων που επιδεικνύουν χαρακτηριστικά παρόμοια με την νοημοσύνη στην ανθρώπινη συμπεριφορά. Να μπορούν, δηλαδή, τα ευφυή υπολογιστικά συστήματα να κατέχουν την στοιχειώδη ευφυΐα της μάθησης, της προσαρμοστικότητας, της εξαγωγής συμπερασμάτων, της κατανόησης από συμφραζόμενα, της επίλυσης προβλημάτων κλπ. Ο τομέας της Ανακάλυψης Γνώσης κάνει εκτεταμένη χρήση των εργαλείων της Τεχνητής Νοημοσύνης και της Μηχανικής Μάθησης. Μερικά παραδείγματα είναι τα νευρωνικά δίκτυα, τα δέντρα απόφασης, οι γενετικοί αλγόριθμοι και οι μηχανές διανυσμάτων(support vector machines). Η Μηχανική Μάθηση (Machine Learning) είναι μια περιοχή της Τεχνητής Νοημοσύνης και μπορούμε να πούμε ότι είναι η χρυσή τομή ανάμεσα στον τομέα της Στατιστικής και της Τεχνητής Νοημοσύνης, καθώς συνδυάζει θεμελιώδεις έννοιες της στατιστικής με αλγόριθμους τεχνητής νοημοσύνης. Σκοπός της είναι να παρέχει στα ευφυή υπολογιστικά συστήματα τη δυνατότητα να "μαθαίνουν από τα δεδομένα, δηλαδή να είναι σε θέση να Σελ.21 από 157

22 Κεφάλαιο 1ο 1.3 Οι ρίζες της Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων παίρνουν διαφορετικές αποφάσεις σε σχέση με την εκάστοτε περίπτωση και ανάλογα με τις προγενέστερες ιδιότητες που είχαν βρει στα δεδομένα. Στην Ανακάλυψη γνώσης, η μηχανική μάθηση χρησιμοποιείται για σκοπούς πρόβλεψης και κατηγοριοποίησης. Με την μηχανική μάθηση, ο υπολογιστής κάνει μια πρόβλεψη και κατόπιν, βασιζόμενος στην ανάδραση περί της ορθότητας της πρόβλεψης, "μαθαίνει από αυτή την ανάδραση. Μαθαίνει μέσω παραδειγμάτων, αποθηκευμένης γνώσης και ανάδρασης, με αποτέλεσμα όταν συμβεί μελλοντικά μια ανάλογη περίπτωση θα μπορεί να χρησιμοποιήσει την ανάδραση και να κάνει την ίδια ή μια τελείως διαφορετική πρόβλεψη. Για να εφαρμοστεί η μηχανική μάθηση στις εργασίες της ανακάλυψης γνώσης χρησιμοποιείται ένα μοντέλο για να αναπαραστήσει τα δεδομένα της βάσης(π.χ. ένα δέντρο απόφασης). [2] Η κύρια διαφορά μεταξύ του τομέα της Ανακάλυψης γνώσης και της Μηχανικής μάθησης έγκειται στο γεγονός ότι στην ανακάλυψη γνώσης δεν χρειάζεται να χρησιμοποιηθεί μια ομοιογενής βάση δεδομένων και αντίθετα με την μηχανική μάθηση χρησιμοποιεί μεγαλύτερες και ετερογενείς βάσεις δεδομένων Βάσεις Δεδομένων Μια βάση δεδομένων είναι μια συλλογή από δεδομένα τα οποία έχουν μια ορισμένη δομή ή σχήμα με το οποίο σχετίζονται. Τα δεδομένα σε μια βάση δεδομένων συχνά οπτικοποιούνται με την χρήση ενός μοντέλου δεδομένων. Αυτό το μοντέλο χρησιμοποιείται για να περιγράψει τα δεδομένα, τα γνωρίσματά τους και τις συσχετίσεις μεταξύ τους. Για την πρόσβαση σε βάσεις δεδομένων θα πρέπει να χρησιμοποιηθεί μια γλώσσα ερωταποκρίσεων και η ποιο διαδεδομένη στη χρήση είναι η βοι. Η διαφορά μεταξύ ερωτήσεων ανακάλυψη γνώσης σε βάσεις δεδομένων και αυτών στα Συστήματα Διαχείρισης Βάσεων Δεδομένων είναι το αποτέλεσμα. Μια ερώτηση σε ένα ΣΔΒΔ επιστρέφει ένα υποσύνολο της βάσης, ενώ στην ανακάλυψη γνώσης ένα Κϋϋ αντικείμενο το οποίο δεν προϋπήρχε στην Σελ. 22 από 157

23 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή ερωτηθείσα βάση δεδομένων. Η ανακάλυψη γνώσης σε βάσεις δεδομένων μπορεί να επωφεληθεί από την SQL για την επιλογή των δεδομένων, τον μετασχηματισμό τους και την ενοποίηση τους.[2] Ανάκτηση Πληροφοριών Η Ανάκτηση Πληροφοριών (ΑΠ) ασχολείται με την ανάκτηση επιθυμητών πληροφοριών από δεδομένα κειμένου ή και διαφόρων άλλων μορφών δεδομένων και μεταδεδομένων (metadata). Η ΑΠ επηρέασε την εξέλιξη της Ανακάλυψης Γνώσης καθώς πολλά μέτρα ομοιότητας και μέτρα ακρίβειας που αναπτύχθηκαν για την ανάκτηση πληροφοριών εφαρμόζονται σε αυτή. 1.4 Δεδομένα Προς Ανακάλυψη Γνώσης Τι Είδους Δεδομένα Συλλέγουμε Συλλέγουμε μεγάλους όγκους δεδομένων, από απλές αριθμητικές μετρήσεις, έγγραφα κειμένων και διαδικτύου σε πιο σύνθετες πληροφορίες όπως τα χωρικά δεδομένα. Παρακάτω βλέπουμε από ποια πεδία μπορούμε να συλλέξουμε πληροφορίες Επιχειρησιακές συναλλαγές: Κάθε συναλλαγή του κλάδου των επιχειρήσεων συχνά αποθηκεύεται για μελλοντική χρήση. Οι συναλλαγές είναι συνήθως χρονικά συσχετιζόμενες και μπορεί να αφορούν επαγγελματικές συμφωνίες όπως αγορές, ανταλλαγές, τραπεζικές συμφωνίες, συμφωνίες μετοχών κ.λ.π. ή εσωτερικές λειτουργίες της επιχείρησης όπως η διαχείριση της και τα περιουσιακά στοιχεία της. Μεγάλα πολυκαταστήματα, για παράδειγμα, χάρη στη διαδεδομένη χρήση του γραμμοκώδικα (barcode), αποθηκεύουν καθημερινά εκατομμύρια δεδομένα συναλλαγών που συχνά αντιστοιχούν σε terabytes. Ο χώρος αποθήκευσης δεν είναι μεγάλο πρόβλημα καθώς οι τιμές των σκληρών δίσκων μειώνονται συνεχώς, όμως η αποτελεσματική χρήση των δεδομένων σε ένα λογικό χρονικό πλαίσιο για την ανταγωνιστική λήψη αποφάσεων είναι σαφώς το πιο σημαντικό πρόβλημα Σελ.23 από 157

24 Κεφάλαιο 1ο 1.4 Δεδομένα Προς Ανακάλυψη Γνώσης που εχει να αντιμετωπίσει μια επιχείρηση σε ενα ακρως ανταγωνιστικό περιβάλλον. Επιστημονικά δεδομένα: Είτε πρόκειται για ενα Ελβετικό εργοστάσιο επιτάχυνσης πυρηνικών σωματιδίων, είτε για την συλλογή δεδομένων από ενα παγόβουνο στο Νότιο πόλο σχετικά με τη δραστηριότητα του, τα κολοσσιαία ποσά των επιστημονικών δεδομένων που συλλέγονται πρέπει να αναλυθούν. Δυστυχώς, η καταγραφή και αποθήκευση γίνεται ταχύτερα σε σχέση με ανάλυση τους, με αποτέλεσμα να συσσωρεύονται νέα δεδομένα. Ιατρικά και προσωπικά δεδομένα: Είτε πρόκειται για πελατειακά αρχεία, είτε για κρατικές απογραφές προσωπικού παρατηρούμε ότι αποθηκεύονται μεγάλες ποσότητες πληροφοριών που σχετίζονται με άτομα και ομάδες ατόμων. Ανεξάρτητα από τα ζητήματα απορρήτου, τέτοιου τύπου δεδομένα συχνά αποκαλύπτονται. Οι πληροφορίες που συσχετίζονται με άλλα δεδομένα μπορούν να οδηγήσουν στην ανακάλυψη της συμπεριφοράς των πελατών. Βίντεο και εικόνες/ψηφιακά μέσα: Οι βιντεοκάμερες παρακολούθησης είναι σε πολύ μεγάλη χρήση, τα τελευταία χρόνια. Αν και παλαιότερα ανακυκλώνανε το μαγνητοσκοπημένο περιεχόμενο, στην σημερινή εποχή υπάρχει η τάση αποθήκευσης μεγάλου όγκου δεδομένων για μελλοντική χρήση και ανάλυση. Ένα ενδιαφέρον παράδειγμα για την χρήση των δεδομένων βιντεοσκοπημένου υλικού μας παρουσιάζει η εταιρία Δίη8χ, η οποία δημιούργησε υψηλής τεχνολογίας "κούκλες καταστημάτων με ενσωματωμένο λογισμικό αναγνώρισης προσώπου. Η συγκεκριμένη "κούκλα μπορεί να προσδιορίσει την ηλικία, το φύλο και την αντίδραση των πελατών σε σχέση με το εκάστοτε προϊόν πώλησης. Είναι ένα σύστημα που μπορεί μέσω ανάλυσης των βιντεοσκοπημένων δεδομένων να δώσει δημογραφικά στοιχεία σχετικά με το άτομο που περνάει μπροστά από αυτό. Υπάρχουν φυσικά αντιδράσεις περί της προστασίας των προσωπικών δεδομένων, Σελ. 24 από 157

25 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή παρόλα αυτά οι εταιρίες που τις χρησιμοποιούν (με πρωτοπόρα την Benneton) εφαρμόζουν τις νέες τους στρατηγικές για την αύξηση των πωλήσεων τους. Αυτή η μαζική αποθήκευση είναι μία από αιτίες της ολοένα πιο διαδεδομένης χρήσης και δημιουργίας μεγάλων αποθηκών (warehouses) πολυμεσικών βάσεων δεδομένων. Δεδομένα Δορυφόρων: Οι δορυφόροι της παρέχουν μια συνεχή ροή δεδομένων, με αποτέλεσμα οι ερευνητές να αδυνατούν να επεξεργαστούν τον μεγάλο όγκο δεδομένων. Η χρήση τεχνικών εξόρυξης γνώσης μπορεί να βοηθήσει στην αντιμετώπιση ανάλυσης των δεδομένων. [11] Αθλητισμός: Συλλέγονται τεράστια ποσά δεδομένων και στατιστικών στοιχείων σχετικά με παίκτες και αθλητές. Οι τεχνικές εξόρυξης γνώσης μπορούν να βοηθήσουν σε προβλέψεις, στην δημιουργία μιας ομάδας με καλύτερες επιδόσεις και στον προσδιορισμό της συνεισφοράς και των αδυναμιών των παιχτών. [12] Τύποι Δεδομένων Για Την Ανακάλυψη Γνώσης Η Ανακάλυψη γνώσης σε βάσεις δεδομένων δεν ασχολείται με έναν μόνο τύπο δεδομένων αλλά μπορεί να εφαρμοστεί σε πολλούς τύπους δεδομένων και σε διάφορες δομές αποθήκευσης της. Ωστόσο, οι αλγόριθμοι και οι τεχνικές εξόρυξης που χρησιμοποιούνται της διάφορους τύπους δεδομένων διαφέρουν σημαντικά Επίπεδα αρχεία (Flat files) Τα επίπεδα αρχεία είναι η πιο κοινή πηγή δεδομένων για της αλγόριθμους εξόρυξης γνώσης. Πρόκειται για απλά αρχεία δεδομένων σε δυαδική μορφή ή μορφή κειμένου με γνωστή την δομή της για της αλγόριθμους που θα τα χρησιμοποιήσουν. Τα δεδομένα σε αυτά τα αρχεία μπορεί να προέρχονται Σελ.25 από 157

26 Κεφάλαιο 1ο 1.4 Δεδομένα Προς Ανακάλυψη Γνώσης από οπουδήποτε, της συναλλαγές, χρονολογικές σειρές δεδομένων, επιστημονικές μετρήσεις κλπ Σχεσιακές βάσεις δεδομένων (Relational Databases) Οι σχεσιακές βάσεις δεδομένων παρέχουν πλούσιες πηγές δεδομένων. Μια σχεσιακή βάση δεδομένων αποτελείται από μια συλλογή πινάκων, όπου κάθε της πίνακας περιέχει ένα σύνολο χαρακτηριστικών (στήλες ή πεδία) και αποθηκεύονται σε αυτή μεγάλες συλλογές εγγραφών(γραμμές). Κάθε εγγραφή της σχεσιακού πίνακα αντιπροσωπεύει ένα αντικείμενο ή μια σχέση ανάμεσα στα αντικείμενα που περιγράφεται από ένα σύνολο τιμών των χαρακτηριστικών και ορίζεται με ένα μοναδικό κλειδί. Η γλώσσα υποβολής δομημένων ερωτημάτων SQL είναι αυτή που χρησιμοποιείται της σχεσιακές βάσεις δεδομένων και επιτρέπει την ανάκτηση, διαχείριση και ενημέρωση των δεδομένων, την δημιουργία και τροποποίηση σχημάτων και σχεσιακών πινάκων, αλλά και τον έλεγχο πρόσβασης στα δεδομένα. Ουσιαστικά, κύριος σκοπός της είναι η βέλτιστη επεξεργασία των δεδομένων. Η ανακάλυψη γνώσης σε βάσεις δεδομένων μπορεί να επωφεληθεί από την SQL για την επιλογή των δεδομένων, τον μετασχηματισμό της και την ενοποίηση της, αλλά η εφαρμογή μεθόδων και τεχνικών εξόρυξης γνώσης πάει ένα βήμα πιο πέρα, παρέχει καλύτερα αποτελέσματα καθώς οδηγεί στην αναζήτηση τάσεων, προτύπων, μοντέλων πρόβλεψης και εντοπισμού αποκλίσεων στα δεδομένα Αποθήκες δεδομένων (Data Warehouse) Η έννοια της αποθήκευσης δεδομένων χρονολογείται από τα τέλη της δεκαετίας του 1980, όταν οι ερευνητές της IBM Μπάρι Ντέβλιν και Πολ Μέρφι ανέπτυξαν μια επιχείρηση αποθήκης δεδομένων. Στην ουσία, η ιδέα αποθήκευσης των δεδομένων είχε ως στόχο να παρέχει ένα αρχιτεκτονικό μοντέλο για τη ροή των δεδομένων και των επιχειρησιακών συστημάτων σε περιβάλλον υποστήριξης αποφάσεων. Γενικά, μια αποθήκη δεδομένων δίνει Σελ. 26 από 157

27 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή τη δυνατότητα να αναλυθούν δεδομένα από διαφορετικές πηγές. Οι αποθήκες δεδομένων υποστηρίζουν ποικίλες βιομηχανίες, όπως το εμπόριο, οι τηλεπικοινωνίες, η υγεία. Συνήθως, οι μεγάλες εταιρίες αποτελούνται από μεγάλα τμήματα και παραρτήματα και στηρίζονται στην συλλογή λειτουργικών δεδομένων που σχετίζονται με τις ημερήσιες δραστηριότητες τους. Ωστόσο όμως, για την λήψη στρατηγικών αποφάσεων για την μελλοντική κατεύθυνση της εταιρίας, το μάρκετινγκ και την πρόβλεψη, τα συγκεντρωτικά και ιστορικά δεδομένα είναι απαραίτητα και αυτά τα δεδομένα προσφέρουν οι αποθήκες δεδομένων. [11] Σχήμα 1.3: Αποθήκη δεδομένων Οι παραδοσιακές εφαρμογές βάσεων δεδομένων συσχετίζονται με την άμεση επεξεργασία συναλλαγών (OnLine Transactional Processing - OLTP) όπου οι απαιτήσεις των χρηστών δηλώνονται με τη χρήση της γλώσσας SQL και τα αποτελέσματα είναι υποσύνολα των σχέσεων. Οι εφαρμογές, όμως, σε μία αποθήκη δεδομένων σχετίζονται απευθείας με τις επιχειρησιακές αποφάσεις και αναλύσεις των δεδομένων, με την άμεση αναλυτική επεξεργασία (OnLine Analytical Processing - OLAP). Σε αντίθεση με μια συμβατική βάση Σελ.27 από 157

28 Κεφάλαιο 1ο 1.4 Δεδομένα Προς Ανακάλυψη Γνώσης δεδομένων, μια αποθήκη δεδομένων συσχετίζεται με την επιχείρηση και όχι με την εφαρμογή αυτής. Σε μία αποθήκη δεδομένων μπορεί να δημιουργηθεί ένα υποσύνολο δεδομένων το οποίο καλείται data mart. Τα data marts επικεντρώνονται στην συλλογή δεδομένων που αφορούν ένα συγκεκριμένο μέρος της συνολικής πληροφορίας. Ένα data mart έχει περιορισμένο μέγεθος, μπορεί να αποθηκεύεται και να προσπελαύνεται ξεχωριστά, με αποτέλεσμα να έχει καλύτερη απόδοση στην υποστήριξη εφαρμογών συγκεκριμένου ενδιαφέροντος. [2] Βάσεις Δεδομένων Συναλλαγών (Transactional Databases) Μία βάση δεδομένων συναλλαγών είναι ένα σύνολο εγγραφών που εκπροσωπούν συναλλαγές, καθεμία από τις οποίες περιέχει ένα αναγνωριστικό και ένα σύνολο στοιχείων. Δεδομένου ότι οι σχεσιακές βάσεις δεδομένων δεν επιτρέπουν ένθετους πίνακες, οι συναλλαγές αποθηκεύονται συνήθως σε επίπεδα αρχεία ή σε δύο κανονικοποιημένους πίνακες, ένας για τις συναλλαγές και ένας για τα στοιχεία των συναλλαγών. Βασικές διεργασίες εξόρυξης αποτελούν η ανάλυση του "καλαθιού αγοράς (market basket analysis) και η εύρεση κανόνων συσχετίσεων μεταξύ των στοιχείων. [11] Βάσεις δεδομένων Πολυμέσων (Multimedia Databases) Οι βάσεις πολυμέσων περιέχουν δεδομένα όπως βίντεο, εικόνες, ήχο ή ακόμη και συνδυασμό αυτών. Αυτός ο συνδυασμός των δεδομένων καθιστά την εργασία ανακάλυψης γνώσης ακόμα πιο προκλητική. Η ανακάλυψη γνώσης από δεδομένα τέτοιου τύπου ενδέχεται να περιλαμβάνει μεθοδολογίες ερμηνείας εικόνας, επεξεργασίας φυσικής γλώσσας, μηχανικής όρασης και γραφικών Χρονικές βάσεις δεδομένων (Temporal Databases) Τα χρονικά δεδομένα που διατηρούνται σε μια χρονική βάση δεδομένων αναφέρονται σε πολλαπλά σημεία στο χρόνο και όχι σε ένα μόνο χρονικό Σελ. 28 από 157

29 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή σημείο. Για παράδειγμα, ένα διευθυντικό στέλεχος μπορεί να επιθυμεί να παρατηρήσει τάσεις της επιχείρησης όσων αφορά την πρόσληψη και απόλυση υπαλλήλων. Τέτοιου τύπου ερωτήσεις στην εξόρυξη γνώσης απαιτούν χρονικά δεδομένα.[11] Η ανάλυση τέτοιου τύπου δεδομένων περιλαμβάνει αρκετές προκλήσεις, λόγω της ερμηνείας του χρόνου και του γεγονότος ότι τέτοιου είδους ερωτήσεις είναι πιο σύνθετες σε σχέση με τις συνηθισμένες των σχεσιακών βάσεων δεδομένων Χωρικές βάσεις δεδομένων (Spatial Databases) Τα χωρικά δεδομένα είναι δεδομένα, τα οποία έχουν μια συνιστώσα θέσης. Μπορούν να θεωρηθούν ως δεδομένα αντικειμένων τα οποία βρίσκονται σε έναν φυσικό χώρο. Ωστόσο, οι χωρικές βάσεις μπορεί να περιέχουν και μη χωρικές πληροφορίες. Τα χωρικά δεδομένα σχετίζονται με την απόσταση και οι τεχνικές εξόρυξης γνώσης χρησιμοποιούν την πληροφορία της απόστασης ώστε να παρέχουν τη βάση για τις αναγκαίες μετρήσεις ομοιότητας. Οι βάσεις χωρικών δεδομένων,εκτός από την παροχή γεωγραφικών πληροφοριών, μπορούν να χρησιμοποιηθούν και σε εφαρμογές όπως, βιοϊατρική, καιρός, διαχείριση καταστροφών και επικινδύνων αποβλήτων. Οι τεχνικές εξόρυξης γνώσης με την μέθοδο της πρόβλεψης μπορούν να προβλέψουν μελλοντικές καταστροφές ή να δημιουργήσουν μοντέλα που βασίζονται σε κοινά χαρακτηριστικά χωρικών δεδομένων κλπ. Μια άλλη κατηγορία βάσεων αποτελούν οι χωροχρονικές βάσεις δεδομένων (spatiotemporal databases) οι οποίες περιλαμβάνουν χωρικά δεδομένα που μεταβάλλονται στον χρόνο Βάσεις δεδομένων κειμένου (Text databases) Αυτές οι βάσεις περιέχουν λεκτικές περιγραφές αντικειμένων. Μπορεί να έχουν την μορφή λέξεων-κλειδιών, ολόκληρων προτάσεων, ολόκληρων Σελ.29 από 157

30 Κεφάλαιο 1ο 1.4 Δεδομένα Προς Ανακάλυψη Γνώσης παραγράφων, εκθέσεων αναφορών κλπ. Η ανακάλυψη γνώσης σε βάσεις κειμένου είναι μια διαδικασία εξαγωγής νέας πληροφορίας από μια συλλογή κειμένων. Ο ακαδημαϊκός επιστήμονας Kalev Leetaru αναφέρει πως από μία συλλογή ειδήσεων σε συνδυασμό με τεχνικές εξόρυξης, θα μπορούσε να προβλεφθεί η εξέγερση της αραβικής άνοιξης Παγκόσμιος Ιστός Ο Παγκόσμιος Ιστός αποτελεί την πιο ετερογενή και δυναμική πηγή διαθέσιμων δεδομένων. Τα δεδομένα στο διαδίκτυο οργανώνονται σε διασυνδεόμενα έγγραφα και τα έγγραφα μπορεί να είναι κειμένου, ήχου, βίντεο ακόμη και εφαρμογές. Εννοιολογικά ο Παγκόσμιος Ιστός αποτελείται από τρία βασικά συστατικά: Το περιεχόμενο του παγκόσμιου ιστού που περιλαμβάνει τα διαθέσιμα αρχεία, η δομή του παγκόσμιου ιστού που καλύπτει υπερσυνδέσεις και σχέσεις μεταξύ των αρχείων και η χρήση του παγκόσμιου ιστού που περιγράφει τον τρόπο και την χρονική στιγμή που είναι προσπελάσιμες οι πηγές. Οι τεχνικές web mining εφαρμόζονται στους παραπάνω τομείς και βοηθούν στην κατανόηση του τρόπου κατανομής των πληροφοριών στον παγκόσμιο ιστό, στον χαρακτηρισμό και κατηγοριοποίηση των ιστοσελίδων και στην ανακάλυψη συσχετίσεων ανάμεσα σε χρήστες διαδικτύου και ιστοσελίδες. [2] 1.5 Η Εξόρυξη Γνώσης Από Δεδομένα Ως Στάδιο Της KDD Η εξόρυξη γνώσης από δεδομένα περιλαμβάνει πολλούς διαφορετικούς αλγορίθμους για να εκπληρωθούν διαφορετικές εργασίες. Όλοι αυτοί οι αλγόριθμοι επιχειρούν να ταιριάξουν ένα μοντέλο/πρότυπο στα δεδομένα. Οι αλγόριθμοι εξετάζουν τα δεδομένα και καθορίζουν ένα μοντέλο που να είναι πλησιέστερο στα χαρακτηριστικά των δεδομένων που εξετάζονται. Οι αλγόριθμοι εξόρυξης γνώσης μπορεί να θεωρηθεί ότι αποτελούνται από τρία μέρη: 1. Το Μοντέλο Σελ. 30 από 157

31 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή Ο σκοπός του αλγόριθμου είναι να ταιριάξει το μοντέλο στα δεδομένα. [2] Υπάρχουν δύο παράγοντες που σχετίζονται με το μοντέλο: Η λειτουργία του μοντέλου, η οποία καθορίζει τις βασικές εργασίες που θα διεκπεραιωθούν κατά τη διάρκεια της εξόρυξης γνώσης από δεδομένα, π.χ. κατηγοριοποίηση, συσταδοποίηση κ.α. Ο τύπος αναπαράστασης του μοντέλου, ο οποίος καθορίζει τόσο την προσαρμοστικότητα του μοντέλου στην αναπαράσταση των δεδομένων όσο και τη δυνατότητα ερμηνείας του μοντέλου με όρους κατανοητούς από τον άνθρωπο. Τυπικά, τα πιο πολύπλοκα μοντέλα προσαρμόζονται καλύτερα στα δεδομένα, αλλά ενδέχεται να είναι πιο δύσκολο να γίνουν κατανοητά και να προσαρμοστούν σε πραγματικά δεδομένα. Οι πιο γνωστές αναπαραστάσεις μοντέλων είναι τα δέντρα απόφασης, οι κανόνες, τα γραμμικά μοντέλα, τα γραφικά μοντέλα που βασίζονται σε πιθανότητες, τα νευρωνικά δίκτυα κ.ο.κ. 2. Προτίμηση Μοντέλου: Η προτίμηση, η οποία γίνεται βάσει κάποιων κριτηρίων(π.χ. maximum likelihood(μέγιστη πιθανοφάνεια) ), καθορίζει κατά πόσο ένα συγκεκριμένο μοντέλο και οι παράμετροι του προσαρμόζονται στα κριτήρια της KDD διαδικασίας. Η προτίμηση ενός μοντέλου, έναντι ενός άλλου, περιλαμβάνει τόσο την εκτίμηση της εγκυρότητας των προτύπων που παράγονται από αυτό όσο και την εκτίμηση της ακρίβειας, της χρησιμότητας και της ευκολίας κατανόησης του μοντέλου. 3. Αλγόριθμος Αναζήτησης: Αναφέρεται στον καθορισμό ενός αλγορίθμου για την εύρεση συγκεκριμένων μοντέλων και παραμέτρων, με βάση ένα σύνολο δεδομένων, μια οικογένεια μοντέλων και ένα κριτήριο αξιολόγησης. Οι αλγόριθμοι αναζήτησης χωρίζονται σε δύο τύπους: Σελ.31 από 157

32 Κεφάλαιο 1ο 1.5 Η Εξόρυξη Γνώσης Από Δεδομένα Ως Στάδιο Της KDD Αλγόριθμοι αναζήτησης παραμέτρων, οι οποίοι αναζητούν τις παραμέτρους εκείνες που θα βελτιστοποιήσουν το μοντέλο ως προς το κριτήριο αξιολόγησης. Εκτελούν την αναζήτηση λαμβάνοντας ως είσοδο το σύνολο των δεδομένων και την αναπαράσταση του μοντέλου. Αλγόριθμοι αναζήτησης μοντέλου, οι οποίοι εκτελούν μια επαναληπτική διαδικασία αναζήτησης ενός μοντέλου για την αναπαράσταση των δεδομένων. Για μία συγκεκριμένη αναπαράσταση μοντέλου εκτελείται η μέθοδος αναζήτησης παραμέτρων και εκτιμάται η ποιότητα του συγκεκριμένου μοντέλου. Όπως αναφέρθηκε και προηγουμένως, προκύπτουν δύο είδη γνώσης ως παράγωγα της διαδικασίας Εξόρυξη Γνώσης από δεδομένα, τα περιγραφικά και τα προβλεπτικά μοντέλα. Ένα προβλεπτικό μοντέλο (predictive model) κάνει μία πρόβλεψη για τις τιμές των δεδομένων, χρησιμοποιώντας γνωστά αποτελέσματα που έχει βρει από άλλα δεδομένα. Η μοντελοποίηση πρόβλεψης μπορεί να γίνει με βάση τη χρήση ιστορικών δεδομένων. Οι εργασίες εξόρυξης γνώσης από δεδομένα για τη δημιουργία ενός προβλεπτικού μοντέλου περιλαμβάνουν Κατηγοριοποίηση ή Ταξινόμηση (Classification) Παλινδρόμηση (Regression) Ανάλυση χρονολογικών σειρών (Time series analysis) Πρόβλεψη (Prediction) Ένα περιγραφικό μοντέλο (descriptive model) αναγνωρίζει πρότυπα ή συσχετίσεις στα δεδομένα. Αντίθετα από το προβλεπτικό, το περιγραφικό μοντέλο λειτουργεί σαν ένα μέσο που διερευνά τις ιδιότητες των δεδομένων Σελ. 32 από 157

33 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή που εξετάζονται, και όχι για να προβλέπει νέες ιδιότητες, και οι εργασίες που περιλαμβάνονται είναι Συσταδοποίηση Παρουσίαση Συνόψεων Κανόνες Συσχετίσεων Ανακάλυψη Ακολουθιών Σχήμα1.4 : Μοντέλα και εργασίες στην εξόρυξη γνώσης από δεδομένα 1.6 Εργασίες Εξόρυξης Γνώσης Από Δεδομένα Στις επόμενες παραγράφους αναφέρουμε εν συντομία κάποιες από τις εργασίες της εξόρυξης γνώσης. Αυτές οι μεμονωμένες εργασίες μπορούν να συνδυαστούν προκειμένου να έχουμε πιο εξειδικευμένες εφαρμογές της εξόρυξης γνώσης από δεδομένα Κατηγοριοποίηση Η Κατηγοριοποίηση (dassification) ταξινομεί τα δεδομένα σε προκαθορισμένες ομάδες ή κατηγορίες-κλάσεις(dasses). Αναφέρεται συχνά σαν εποπτευόμενη μάθηση, επειδή οι κατηγορίες-κλάσεις καθορίζονται πριν ακόμη εξεταστούν τα δεδομένα. Οι αλγόριθμοι κατηγοριοποίησης απαιτούν οι Σελ.33 από 157

34 Κεφάλαιο 1ο 1.6 Εργασίες Εξόρυξης Γνώσης Από Δεδομένα κατηγορίες να ορίζονται με βάση τις τιμές των γνωρισμάτων των δεδομένων. Συχνά περιγράφουν αυτές τις κατηγορίες κοιτάζοντας τα χαρακτηριστικά των δεδομένων που είναι ήδη γνωστό ότι ανήκουν στις κατηγορίες. Η αναγνώριση προτύπου (pattern recognition) αποτελεί ένα είδος κατηγοριοποίησης, όπου ένα πρότυπο εισόδου κατηγοριοποιείται σε μία από διάφορες κατηγορίες, με βάση την εγγύτητα του ως προς αυτές τις προκαθορισμένες κατηγορίες Παλινδρόμηση Η Παλινδρόμηση (regression) χρησιμοποιείται για να απεικονιστεί ένα στοιχειώδες δεδομένο σε μία πραγματική μεταβλητή πρόβλεψης. Στην πραγματικότητα, η παλινδρόμηση περιλαμβάνει την εκμάθηση της συνάρτησης που κάνει αυτή την απεικόνιση. Η παλινδρόμηση προϋποθέτει ότι τα σχετικά δεδομένα ταιριάζουν με μερικά γνωστά είδη συνάρτησης (πχ. γραμμική, λογαριθμική κτλ.) και μετά καθορίζει την καλύτερη συνάρτηση αυτού του είδους που μοντελοποιεί τα δεδομένα που έχουν δοθεί. Ένα είδος ανάλυσης σφάλματος χρησιμοποιείται για να καθορίσει ποια συνάρτηση είναι "η καλύτερη". Η παλινδρόμηση μπορεί να χρησιμοποιηθεί για να λύσει προβλήματα κατηγοριοποίησης και μπορεί να χρησιμοποιηθεί και σε άλλες εφαρμογές, όπως αυτή της πρόβλεψης Ανάλυση Χρονοσειρών Με την Ανάλυση Χρονοσειρών ή χρονολογικών σειρών (times series analysis), μελετάται η τιμή ενός γνωρίσματος καθώς μεταβάλλεται στο χρόνο. Οι τιμές συνήθως λαμβάνονται σε ίσα χρονικά διαστήματα ( ημερήσια, εβδομαδιαία, ωριαία κοκ). Για να παρασταθούν οπτικά οι χρονοσειρές χρησιμοποιείται ένα διάγραμμα χρονοσειρών. Στο σχήμα 1.5 μπορεί κανείς εύκολα να δει ότι οι γραφικές παραστάσεις των Υ και Ζ έχουν παρόμοια συμπεριφορά, ενώ το Χ φαίνεται να έχει λιγότερη αστάθεια. Υπάρχουν τρεις βασικές λειτουργίες που πραγματοποιούνται στην ανάλυση χρονοσειρών. Σελ. 34 από 157

35 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή Στην μία περίπτωση, χρησιμοποιούνται μονάδες μέτρησης απόστασης για να καθορίσουν την ομοιότητα ανάμεσα σε διαφορετικές χρονοσειρές. Στην δεύτερη περίπτωση, εξετάζεται η δομή της χρονοσειράς για να καθορίσει (και ίσως να κατηγοριοποιήσει) τη συμπεριφορά της. Μια τρίτη εφαρμογή θα μπορούσε να είναι η χρήση διαγραμμάτων χρονοσειρών για την πρόβλεψη μελλοντικών τιμών. Σχήμα1.5: Ένα τυπικό διάγραμμα χρονοσειρών Πρόβλεψη Πολλές από τις πρακτικές εφαρμογές εξόρυξης γνώσης μπορούν να θεωρηθούν σαν πρόβλεψη μελλοντικών καταστάσεων με γνώση των προηγούμενων και των τωρινών δεδομένων. Η πρόβλεψη (Prediction) μπορεί να θεωρηθεί σαν ένα είδος κατηγοριοποίησης. Να σημειωθεί πως αυτή η εργασία εξόρυξης γνώσης είναι διαφορετική από το μοντέλο πρόβλεψης, παρόλο που η διαδικασία πρόβλεψης αποτελεί έναν τύπο μοντέλου πρόβλεψης. Η διαφορά έγκειται στο γεγονός ότι ως πρόβλεψη θεωρείται περισσότερο το να δίνεται τιμή σε μία μελλοντική κατάσταση παρά σε μία τρέχουσα. Εδώ αναφερόμαστε σε ένα είδος εφαρμογής παρά σε μια προσέγγιση μοντελοποίησης. Οι εφαρμογές πρόβλεψης περιλαμβάνουν Σελ.35 από 157

36 Κεφάλαιο 1ο 1.6 Εργασίες Εξόρυξης Γνώσης Από Δεδομένα πρόγνωση πλημμύρων, αναγνώριση ομιλίας, μηχανική μάθηση και αναγνώριση προτύπων Συσταδοποίηση Η Συσταδοποίηση (clustering) είναι παρόμοια με την κατηγοριοποίηση εκτός από το ότι οι συστάδες-ομάδες δεδομένων δεν είναι προκαθορισμένες αλλά ορίζονται κυρίως από τα ίδια τα δεδομένα. Η συσταδοποίηση αναφέρεται εναλλακτικά και σαν μη εποπτευόμενη μάθηση ή τμηματοποίηση. Μπορεί να θεωρηθεί σαν μια διαμέριση ή τμηματοποίηση των δεδομένων σε ομάδες που μπορεί να είναι ή να μην είναι διακριτές μεταξύ τους. Η συσταδοποίηση συνήθως επιτυγχάνεται με τον καθορισμό της ομοιότητας, ως προς προκαθορισμένα γνωρίσματα, ανάμεσα στα δεδομένα. Τα πιο σχετικά δεδομένα ομαδοποιούνται στις ίδιες ομάδες. Μια ειδική κατηγορία συσταδοποίησης ονομάζεται κατάτμηση(segmentation). Με την κατάτμηση, μια βάση δεδομένων χωρίζεται σε διακριτές ομάδες παρόμοιων εγγραφών που ονομάζονται τμήματα (segments). Η κατάτμηση συχνά θεωρείται πανομοιότυπη με την συσταδοποίηση. Κατά άλλους, η κατάτμηση θεωρείται σαν ένας ειδικός τύπος συσταδοποίησης που εφαρμόζεται στην ίδια βάση δεδομένων Παρουσίαση Συνόψεων Η Παρουσίαση Συνόψεων (summarization) απεικονίζει τα δεδομένα σε υποσύνολα τους με συνοδευτικές απλές περιγραφές. Η σύνοψη των δεδομένων ονομάζεται επίσης και χαρακτηρισμός (characterization) ή γενίκευση (generalization). Εξάγει ή παράγει αντιπροσωπευτικές πληροφορίες σχετικά με τις βάσεις δεδομένων. Αυτό γίνεται ανακτώντας, στη πραγματικότητα, τμήματα από τα δεδομένα. Εναλλακτικά, μπορούν να εξαχθούν από τα δεδομένα συνοπτικές πληροφορίες (όπως είναι ο μέσος όρος κάποιου αριθμητικού γνωρίσματος). Εν ολίγοις, η παρουσίαση συνόψεων χαρακτηρίζει τα περιεχόμενα της βάσης δεδομένων. Σελ. 36 από 157

37 Πτυχιακή Εργασία της Αφροδίτης Κωσιωρή Κανόνες Συσχέτισης Η ανάλυση συνδέσμων (link analysis), που εναλλακτικά αναφέρεται και σαν ανάλυση συγγένειας (affinity analysis) ή συσχέτιση (association), αναφέρεται στη διαδικασία εκείνη της εξόρυξης γνώσης που αποκαλύπτει συσχετίσεις μεταξύ των δεδομένων. Το καλύτερο παράδειγμα αυτού του είδους της εφαρμογής είναι ο προσδιορισμός κανόνων συσχετίσεων. Ένας κανόνας συσχέτισης (association rules) είναι ένα μοντέλο που αναγνωρίζει ειδικούς τύπους συσχέτισης μεταξύ των δεδομένων. Αυτές οι συσχετίσεις συχνά χρησιμοποιούνται στις λιανικές πωλήσεις για να αναγνωριστούν προϊόντα που συχνά αγοράζονται μαζί (market basket analysis Κεφάλαιο 5ο). Η χρήση των κανόνων συσχετίσεων για τις όποιες αποφάσεις πρέπει να γίνεται πολύ προσεκτικά επειδή υπάρχει ο κίνδυνος αυτές οι συσχετίσεις να είναι τυχαίες. Οι συσχετίσεις αυτές μπορεί να μην αντιπροσωπεύουν καμία έμφυτη σχέση ανάμεσα στα δεδομένα ( κάτι που ισχύει για παράδειγμα στις συναρτησιακές εξαρτήσεις) Ανακάλυψη Ακολουθιών Η ακολουθιακή ανάλυση (sequential analysis) ή αλλιώς ανακάλυψη ακολουθιών (sequence discovery) χρησιμοποιείται για να καθοριστούν σειριακά πρότυπα στα δεδομένα. Αυτά τα πρότυπα βασίζονται σε μία χρονική ακολουθία ενεργειών. Αυτά τα πρότυπα είναι παρόμοια με τις συσχετίσεις στο ότι συσχετίζονται τα δεδομένα ( ή τα γεγονότα) που εξάγονται, με την διαφορά ότι η συσχέτισή τους αυτή βασίζεται στο χρόνο. Αντίθετα με την ανάλυση καλαθιού αγορών, που προϋποθέτει να γνωρίζουμε ποια προϊόντα αγοράστηκαν ταυτόχρονα, στη ανακάλυψη ακολουθιών τα προϊόντα αγοράζονται με κάποια σειρά κατά τη διάρκεια μιας περιόδου. [2] Σελ.37 από 157

38 ΚΕΦΑΛΑΙΟ 2 0 ΜΟΝΤΕΛΟΠΟΙΩΝΤΑΣ ΤΗΝ KDD ΔΙΑΔΙΚΑΣΙΑ Εισαγωγή στη Μοντελοποίηση Η εργασία της μοντελοποίησης της KDD διαδικασίας είναι δύσκολη λόγω της ποικιλομορφίας των εργασιών και της μοναδικότητας της σε σχέση με την κάθε εφαρμογή. Στην πράξη ακόμα και μέσα σε έναν μόνο τομέα οι λεπτομέρειες της διαδικασίας μπορεί να διαφέρουν ανάλογα με την εφαρμογή. [5] Πολλοί ακαδημαϊκοί επιστήμονες έχουν επιχειρήσει να μοντελοποιήσουν την διαδικασία Ανακάλυψης γνώσης από δεδομένα. Παρακάτω αναφέρουμε περιληπτικά και με χρονολογική σειρά μερικά από τα πιο γνωστά μοντέλα που δημιουργήθηκαν, δίνοντας έμφαση κυρίως στο βιομηχανικό μοντέλο Crisp-DM(Cross Industry Process for Data Mining). Όλα τα μοντέλα της KDD διαδικασίας αποτελούνται από πολλαπλά βήματα τα οποία εκτελούνται σύμφωνα με μία προκαθορισμένη σειρά και συχνά περιλαμβάνουν βρόγχους και επαναλήψεις. Κάθε επόμενο βήμα ξεκινά με την επιτυχή ολοκλήρωση ενός προηγούμενου βήματος, και απαιτεί ως είσοδο το αποτέλεσμα που παράχθηκε από το προηγούμενο βήμα. Ένα κοινό χαρακτηριστικό των μοντέλων είναι το εύρος των καλυπτόμενων δραστηριοτήτων. Το εύρος κυμαίνεται από την κατανόηση του πεδίου εφαρμογής και των δεδομένων, της προετοιμασίας των δεδομένων και της ανάλυσης, αξιολόγησης, κατανόησης, και εφαρμογής των αποτελεσμάτων που δημιουργούνται. Όλα τα προτεινόμενα μοντέλα δίνουν έμφαση στην επαναληπτική φύση τους, η οποία ενεργοποιείται από την διαδικασία της αναθεώρησης. Δηλαδή, μέσω της επανεξέτασης των αποτελεσμάτων, η έξοδος επιστρέφει ως είσοδος. Ουσιαστικά, όλα τα μοντέλα επιχειρούν την μεγίστη αυτοματοποίηση της διαδικασίας. Η κύρια διαφορά των παρακάτω Σελ. 38 από 157

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα 6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων YouTube Ιδρύθηκε το 2005 Στόχος του ήταν να δημιουργήσει μία παγκόσμια κοινότητα Βάση δεδομένων βίντεο Μέσα σε ένα χρόνο από τη δημιουργία

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ Η Έρευνα Μάρκετινγκ ως εργαλείο ανάπτυξης νέων προϊόντων ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ.

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 7: Ομαδοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ 1 Βάση Δεδομένων: Με το όρο Βάση Δεδομένων εννοούμε ένα σύνολο δεδομένων που είναι οργανωμένο

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής Data Mining: Στοχεύοντας στους σωστούς πελάτες To CRM front-office πελατών Οι Προμηθευτές Οι Πελάτες ΟΟργανισμός Τροφοδότηση ενεργειών Μάρκετινγκ ΒΙ Απόταδεδομέναστηγνώση Επιχειρηματική Γνώση Επιχειρηματικοί

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΣΧΥΕΙ ΚΑΤΑ ΤΟ ΜΕΡΟΣ ΠΟΥ ΑΦΟΡΑ ΤΟ ΛΥΚΕΙΟ ΓΙΑ ΤΗΝ ΥΠΟΧΡΕΩΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ ΙΣΧΥΟΥΝ ΤΟ ΔΕΠΠΣ

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Θέμα: Ανάπτυξη Μοντέλων για την Πρόβλεψη Πιθανής Αποτυχίας Αποπληρωμής Δανείου

Διαβάστε περισσότερα

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΗΜΑΣΜΕΝΩΝ, ΑΚΟΛΟΥΘΙΑΚΩΝ, ΣΥΝΘΕΤΩΝ ΤΥΠΩΝ ΔΕΔΟΜΕΝΩΝ Δομή παρουσίασης Εισαγωγή Βασικές Έννοιες Σχετικές μελέτες Εφαρμογή Δεδομένων Συμπεράσματα Εισαγωγή Μελέτη και προσαρμογή των διάφορων

Διαβάστε περισσότερα

Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων

Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων Β. Μεγαλοοικονόμου Εισαγωγή στην Εξόρυξη Δεδομένων Γενική Επισκόπηση- Σχεσιακό μοντέλο Σχεσιακό Μοντέλο -SQL Συναρτησιακές εξαρτήσεις & Κανονικοποίηση Φυσικός

Διαβάστε περισσότερα

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας

Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας 1 Δρ. Αλέξανδρος Αποστολάκης Email: aapostolakis@staff.teicrete.gr Τηλ.: 2810379603 E-class μαθήματος: https://eclass.teicrete.gr/courses/pgrad_omm107/

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) 1 Προέλευση και ιστορία της Επιχειρησιακής Έρευνας Αλλαγές στις επιχειρήσεις Τέλος του 19ου αιώνα: βιομηχανική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΟΣ Διδάσκων: Γ. Χαραλαμπίδης, Επ. Καθηγητής

Διαβάστε περισσότερα

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING)

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) Των σπουδαστών Σκλαβενίτης Αργύρης (Α.Μ. 535) Στασινός

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

Εισαγωγή στη Σχεδίαση Λογισμικού

Εισαγωγή στη Σχεδίαση Λογισμικού Εισαγωγή στη Σχεδίαση Λογισμικού περιεχόμενα παρουσίασης Τι είναι η σχεδίαση λογισμικού Έννοιες σχεδίασης Δραστηριότητες σχεδίασης Σχεδίαση και υποδείγματα ανάπτυξης λογισμικού σχεδίαση Η σχεδίαση του

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Η συνολική εικόνα Τοπικές Βάσεις Βάσεις Κεντρικών Συστημάτων Βάσεις Τρίτων Ποιοτική Αναβάθμιση δεδομένων Λογισμικό Επικοινωνιών DATA WAREHOUSE Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός Warehouse

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ. Χρηματοδότηση Το παρόν

Διαβάστε περισσότερα

Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420)

Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420) Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420) Διάλεξη 8: Σχεδίαση Συστήματος Σχεδίαση Συστήματος 2 Διεργασία μετατροπής του προβλήματος σε λύση. Από το Τί στο Πώς. Σχέδιο: Λεπτομερής περιγραφή της λύσης. Λύση:

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

Περιεχόμενο του μαθήματος

Περιεχόμενο του μαθήματος ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Απαιτήσεις Λογισμικού Περιπτώσεις χρήσης Δρ Βαγγελιώ Καβακλή Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου Εαρινό Εξάμηνο 2012-2013 1 Περιεχόμενο του μαθήματος

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΕΝΟΤΗΤΑ 1 : ΕΙΣΑΓΩΓΗ Διάλεξη 1: Γενικά για το ΓΣΠ, Ιστορική αναδρομή, Διαχρονική εξέλιξη Διάλεξη 2 : Ανάλυση χώρου (8/4/2013) Διάλεξη 3: Βασικές έννοιες των Γ.Σ.Π.. (8/4/2013)

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Τρόπος Διεξαγωγής #1 Ύλη (4 Ενότητες) 1. Ανάλυση Απαιτήσεων -Σχεδιασμός Βάσης Δεδομένων 2. Δημιουργία βάσης a) Create

Διαβάστε περισσότερα

Η-επιχειρείν και συνεργασία σε παγκόσμιο επίπεδο

Η-επιχειρείν και συνεργασία σε παγκόσμιο επίπεδο Κεφάλαιο 2 Η-επιχειρείν και συνεργασία σε παγκόσμιο επίπεδο 2.1 ΜΑΘΗΣΙΑΚΟΙ ΣΤΟΧΟΙ Ποια είναι τα βασικά χαρακτηριστικά μιας επιχείρησης που είναι σημαντικά για την κατανόηση του ρόλου των πληροφοριακών

Διαβάστε περισσότερα

Βάσεις δεδομένων και Microsoft Access

Βάσεις δεδομένων και Microsoft Access Περιεχόμενα Κεφάλαιο 1 Βάσεις δεδομένων και Microsoft Access... 7 Κεφάλαιο 2 Microsoft Access 2010... 16 Κεφάλαιο 3 Σχεδιασμός βάσης δεδομένων και δημιουργία πίνακα... 27 Κεφάλαιο 4 Προβολές πινάκων και

Διαβάστε περισσότερα

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος 1 Βασίλειος Χρυσικόπουλος Καθηγητής Πληροφορική Δίκτυα Ασφάλεια Πληροφοριών Ερευνητικά Ενδιαφέροντα Ασφάλεια Δίκτυα Η/Υ http://di.ionio.gr/staff-2/faculty-staff/vassilischrissikopoulos/

Διαβάστε περισσότερα

ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ

ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ ΣΥΣΤΗΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ ΣΕ ΣΧΕ ΟΝ ΠΡΑΓΜΑΤΙΚΟ ΧΡΟΝΟ ΠΑΡΑ ΟΤΕΟ 9 ΠΛΑΤΦΟΡΜΑ ΥΠΟΛΟΓΙΣΜΟΥ ΑΕΡΟΣΩΜΑΤΙ ΙΑΚΗΣ ΡΥΠΑΝΣΗΣ Συγγραφείς: ημήτρης Παρώνης, Αδριανός Ρετάλης, Φίλιππος Τύμβιος,

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ ΚΑΙ ΚΑΙΝΟΤΟΜΙΑ

ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ ΚΑΙ ΚΑΙΝΟΤΟΜΙΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ ΚΑΙ Έρευνα αγοράς θεωρείται κάθε οργανωμένη προσπάθεια συλλογής, επεξεργασίας και ανάλυσης πληροφοριών σχετικών με την αγορά που δραστηριοποιείται μια επιχείρηση. Αυτές οι πληροφορίες

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ανάπτυξη μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, με χρήση

Διαβάστε περισσότερα

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. Άδειες Χρήσης Το

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος:

ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ. Παρουσίαση 2 ο μέρος: ΣΤΡΑΤΗΓΙΚΟ MANAGEMENT KAI EΠΙΧΕΙΡHΜΑΤΙΚΗ ΕΥΦΥΙΑ Παρουσίαση 2 ο μέρος: Λήψη αποφάσεων Η λήψη αποφάσεων αποτελεί κεντρική δραστηριότητα σε όλα τα επίπεδα λειτουργίας μιας επιχείρησης, από τον σχεδιασμό δράσεων,

Διαβάστε περισσότερα

Μεθοδολογίες Αξιοποίησης Δεδομένων

Μεθοδολογίες Αξιοποίησης Δεδομένων Μεθοδολογίες Αξιοποίησης Δεδομένων Βλάχος Σ. Ιωάννης Λέκτορας 407/80, Ιατρικής Σχολής Πανεπιστημίου Αθηνών Εργαστήριο Πειραματικής Χειρουργικής και Χειρουργικής Ερεύνης «Ν.Σ. Σ Χρηστέας» Στάδια Αξιοποίησης

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Διαχείριση Πολιτισμικών Δεδομένων Ενότητα 6: Εισαγωγή στις Βάσεις Δεδομένων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και

Διαβάστε περισσότερα

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Διοίκηση Παραγωγής & Συστημάτων Υπηρεσιών ΕΡΓΑΣΤΗΡΙΟ ΣΥΣΤΗΜΑΤΩΝ ΑΠΟΦΑΣΕΩΝ ΚΑΙ ΔΙΟΙΚΗΣΗΣ Περιεχόμενα

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Παλαιγεωργίου Γιώργος Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πανεπιστήμιο Θεσσαλίας Ιανουάριος 2011 Ψυχομετρία Η κατασκευή

Διαβάστε περισσότερα

Εισαγωγή στην Πληροφορική

Εισαγωγή στην Πληροφορική Εισαγωγή στην Πληροφορική Βάσεις Δεδομένων ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι οι Βάσεις Δεδομένων; Σύστημα για αποθήκευση, μετάδοση

Διαβάστε περισσότερα

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΕΝΟΤΗΤΑ 1.1 ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΔΙΔΑΚΤΙΚΟI ΣΤOΧΟΙ Στο τέλος της ενότητας αυτής πρέπει να μπορείτε: να επεξηγείτε τις έννοιες «βάση δεδομένων» και «σύστημα διαχείρισης βάσεων δεδομένων» να αναλύετε

Διαβάστε περισσότερα

ΑΕΠΠ Ερωτήσεις θεωρίας

ΑΕΠΠ Ερωτήσεις θεωρίας ΑΕΠΠ Ερωτήσεις θεωρίας Κεφάλαιο 1 1. Τα δεδομένα μπορούν να παρέχουν πληροφορίες όταν υποβάλλονται σε 2. Το πρόβλημα μεγιστοποίησης των κερδών μιας επιχείρησης είναι πρόβλημα 3. Για την επίλυση ενός προβλήματος

Διαβάστε περισσότερα

Αλγόριθμοι Εξόρυξης Χωρικών εδομένων

Αλγόριθμοι Εξόρυξης Χωρικών εδομένων Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Αγρονόμων και Τοπογράφων Μηχανικών ιατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών «ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ» Αλγόριθμοι Εξόρυξης Χωρικών εδομένων Εφαρμογή σε Αλγόριθμους Συσταδοποίησης

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS Ακαδημαϊκό Έτος 2016-2017, Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS A. Εισαγωγή στις βάσεις δεδομένων - Γνωριμία με την ACCESS B. Δημιουργία Πινάκων 1. Εξήγηση των

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Επιχειρηματική ευφυΐα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2017 Επιχειρηματική ευφυΐα Η πλειονότητα των εργαζομένων μιας επιχείρησης έχουν

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ ΔΕΔΟΜΕΝΑ ΔΕΔΟΜΕΝΑ ΠΛΗΡΟΦΟΡΙΑ ΑΡΙΘΜΟΙ ΣΥΜΒΟΛΑ - ΛΕΞΕΙΣ ΟΠΟΙΑΔΗΠΟΤΕ ΔΡΑΣΤΗΡΙΟΤΗΤΑ ΣΥΜΒΑΙΝΕΙ ΣΕ ΜΙΑ ΟΙΚΟΝΟΜΙΚΗ ΜΟΝΑΔΑ ΠΡΕΠΕΙ ΝΑ ΜΕΤΡΕΙΤΑΙ ΚΑΙ ΝΑ ΚΑΤΑΓΡΑΦΕΤΑΙ ΟΡΓΑΝΩΣΗ ΚΑΤΑΓΡΑΦΗΣ

Διαβάστε περισσότερα

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική

ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση. Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΑΝΑΛΥΣΗ Επιχειρηματική Μοντελοποίηση Ιωάννης Σταμέλος Βάιος Κολοφωτιάς Πληροφορική Θεσσαλονίκη, Σεπτέμβριος 2013 Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business. e-mail: kyritsis@ist.edu.

Managing Information. Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business. e-mail: kyritsis@ist.edu. Managing Information Lecturer: N. Kyritsis, MBA, Ph.D. Candidate Athens University of Economics and Business e-mail: kyritsis@ist.edu.gr Διαχείριση Γνώσης Knowledge Management Learning Objectives Ποιοί

Διαβάστε περισσότερα

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την 1 ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την παλαιότερη γνώση τους, σημειώνουν λεπτομέρειες, παρακολουθούν

Διαβάστε περισσότερα

710 -Μάθηση - Απόδοση. Κινητικής Συμπεριφοράς: Προετοιμασία

710 -Μάθηση - Απόδοση. Κινητικής Συμπεριφοράς: Προετοιμασία 710 -Μάθηση - Απόδοση Διάλεξη 5η Ποιοτική αξιολόγηση της Κινητικής Συμπεριφοράς: Προετοιμασία Περιεχόμενο ενοτήτων Ποιοτική αξιολόγηση Ορισμός και στάδια που περιλαμβάνονται Περιεχόμενο: στοιχεία που τη

Διαβάστε περισσότερα

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων

Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων Κεφάλαιο 11 Βελτίωση της λήψης αποφάσεων και της διαχείρισης γνώσεων 11.1 Λήψη αποφάσεων και πληροφοριακά συστήματα Η επιχειρηματική αξία της βελτιωμένης λήψης αποφάσεων Είναι εφικτό να αποτιμηθεί σε κάποιον

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

Μαθησιακές δραστηριότητες με υπολογιστή

Μαθησιακές δραστηριότητες με υπολογιστή ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Μαθησιακές δραστηριότητες με υπολογιστή Κατευθυντήριες γραμμές σχεδίασης μαθησιακών δραστηριοτήτων Διδάσκων: Καθηγητής Αναστάσιος Α. Μικρόπουλος Άδειες

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 1: Εισαγωγή Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Διδάκτορας Οικονομικού Πανεπιστημίου Αθηνών

Διδάκτορας Οικονομικού Πανεπιστημίου Αθηνών Κ Χατζηπαναγιώτου Κ. Χατζηπαναγιώτου Διδάκτορας Οικονομικού Πανεπιστημίου Αθηνών Έρευνα Μάρκετινγκ είναι...... Η Συστηματική, Αντικειμενική, και Ολοκληρωτική εξέταση και μελέτη στοιχείων που έχουν σχέση

Διαβάστε περισσότερα

Ηλεκτρονικό Εμπόριο. Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ηλεκτρονικό Εμπόριο. Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Ηλεκτρονικό Εμπόριο Ενότητα 6: Διαχείριση Σχέσεων με Πελάτες Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Αρχές Οργάνωσης και Διοίκησης Επιχειρήσεων και Υπηρεσιών ΝΙΚΟΛΑΟΣ Χ. ΤΖΟΥΜΑΚΑΣ ΟΙΚΟΝΟΜΟΛΟΓΟΣ ΠΡΟΣΟΜΟΙΩΣΗ ΔΙΑΓΩΝΙΣΜΑΤΩΝ 2.

Αρχές Οργάνωσης και Διοίκησης Επιχειρήσεων και Υπηρεσιών ΝΙΚΟΛΑΟΣ Χ. ΤΖΟΥΜΑΚΑΣ ΟΙΚΟΝΟΜΟΛΟΓΟΣ ΠΡΟΣΟΜΟΙΩΣΗ ΔΙΑΓΩΝΙΣΜΑΤΩΝ 2. Αρχές Οργάνωσης και Διοίκησης Επιχειρήσεων και Υπηρεσιών ΕΠΙΜΕΕΙΑ: ΝΙΚΟΑΟ Χ. ΤΖΟΥΜΑΚΑ ΟΙΚΟΝΟΜΟΟΓΟ ΠΡΟΟΜΟΙΩΗ ΔΙΑΓΩΝΙΜΑΤΩΝ 2 Κεφάλαιο 2 ο Η Επιστήμη της Διοίκησης των Επιχειρήσεων Ομάδα Α Ερωτήσεις ωστού

Διαβάστε περισσότερα

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη 01 Εισαγωγή Μια απλή και γρήγορη εισαγωγή Το Splunk > είναι ένα πρόγραμμα το οποίο πρωτοεμφανίστηκε στην αγορά το 2003 και αποτελεί ένα πρόγραμμα εξόρυξης

Διαβάστε περισσότερα

6. Διαχείριση Έργου. Έκδοση των φοιτητών

6. Διαχείριση Έργου. Έκδοση των φοιτητών 6. Διαχείριση Έργου Έκδοση των φοιτητών Εισαγωγή 1. Η διαδικασία της Διαχείρισης Έργου 2. Διαχείριση κινδύνων Επανεξέταση Ερωτήσεις Αυτοαξιολόγησης Διαχείριση του έργου είναι να βάζεις σαφείς στόχους,

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων: Oμαδοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ. Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων Δρ. Κωνσταντίνος Χ. Γιωτόπουλος Βασικά θέματα Βάσεων Δεδομένων Ένα Σύστημα Βάσης Δεδομένων

Διαβάστε περισσότερα

Orchid: Integrating Schema Mapping and ETL ICDE 2008

Orchid: Integrating Schema Mapping and ETL ICDE 2008 Orchid: Integrating Schema Mapping and ETL ICDE 2008 Δομουχτσίδης Παναγιώτης Γενικά Data warehouse (DW): Είναι μία αποθήκη πληροφοριών οργανωμένη από ένα ενοποιημένο μοντέλο. Τα δεδομένα συλλέγονται από

Διαβάστε περισσότερα

1. Οι Τεχνολογίες της Πληροφορίας και των Επικοινωνιών στην εκπαιδευτική διαδικασία

1. Οι Τεχνολογίες της Πληροφορίας και των Επικοινωνιών στην εκπαιδευτική διαδικασία 1. Οι Τεχνολογίες της Πληροφορίας και των Επικοινωνιών στην εκπαιδευτική διαδικασία Ο διδακτικός σχεδιασμός (instructional design) εμφανίσθηκε στην εκπαιδευτική διαδικασία και στην κατάρτιση την περίοδο

Διαβάστε περισσότερα

ΜΕΘΟΔΟΛΟΓΙΕΣ ΑΝΑΠΤΥΞΗΣ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΜΕΘΟΔΟΛΟΓΙΕΣ ΑΝΑΠΤΥΞΗΣ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΘΟΔΟΛΟΓΙΕΣ ΑΝΑΠΤΥΞΗΣ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Μεθοδολογίες Ανάπτυξης Συστημάτων Πληροφορικής Απαντούν στα εξής ερωτήματα Ποιά βήματα θα ακολουθηθούν? Με ποιά σειρά? Ποιά τα παραδοτέα και πότε? Επομένως,

Διαβάστε περισσότερα

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining)

Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής Αποθήκες εδοµένων και Εξόρυξη Γνώσης (Data Warehousing & Data Mining) Εξόρυξη Γνώσης από Χωρικά εδοµένα (spatial data mining) Γιάννης Θεοδωρίδης, Νίκος Πελέκης

Διαβάστε περισσότερα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση Ηλεκτρονικό εμπόριο HE 8 Εξατομίκευση Πληροφοριακός υπερφόρτος (information overload) Αδυναμία διαχείρισης μεγάλου όγκου πληροφοριών και εντοπισμού της χρήσιμης πληροφορίας Η εξατομίκευση στοχεύει στην

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής

Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Αριστομένης Μακρής Εξαγωγή Μετασχηματισμός Εισαγωγή Δεδομένων στην Αποθήκη Πληροφοριών (ETL) ETL) Τεχνολογίες Υποστήριξης Λήψης Διοικητικών Αποφάσεων OLTP (On Line Transaction Processing) Επιχειρηματικές Εφαρμογές (Σχεσιακές

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες ΕΙΣΑΓΩΓΗ Βασικές έννοιες Σε ένα ερωτηματολόγιο έχουμε ένα σύνολο ερωτήσεων. Μπορούμε να πούμε ότι σε κάθε ερώτηση αντιστοιχεί μία μεταβλητή. Αν θεωρήσουμε μια ερώτηση, τα άτομα δίνουν κάποιες απαντήσεις

Διαβάστε περισσότερα

Διδάσκοντες: Μαρία Χαλκίδη

Διδάσκοντες: Μαρία Χαλκίδη Αποθήκες και Εξόρυξη Δεδομένων 6 ο εξάμηνο Τμήμα Ψηφιακών Συστημάτων Παν. Πειραιά Διδάσκοντες: Μαρία Χαλκίδη Μαθήματα σχετικά με Διαχείριση Δεδομένων στο Πρόγραμμα Σπουδών Δομές Δεδομένων (3 ο εξάμηνο)

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Επιχειρηματική ευφυΐα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου Επιχειρηματική ευφυΐα Η πλειονότητα των ατόμων μιας επιχείρησης έχουν ανάγκη υποστήριξης

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο Βάσεις Δεδομένων Εισαγωγή Ανάλυση Απαιτήσεων Φροντιστήριο 1 ο 16-10-2008 Εισαγωγή - Ορισμοί Βάση Δεδομένων είναι μία συλλογή από σχετιζόμενα αντικείμενα Ένα σύστημα διαχείρισης βάσεων δεδομένων (ΣΔΒΔ)

Διαβάστε περισσότερα

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος + Περιγραφή Μαθήματος Τίτλος Κωδικός Αριθμός του Πληροφοριακά Συστήματα Μαθήματος : Επίπεδο Τύπος του Μαθήματος : ΠΡΟΠΤΥΧΙΑΚΟ - ΥΠΟΧΡΕΩΤΙΚΟ Έτος Σπουδών Εξάμηνο : 5 Ε Αριθμός Ευρωπαϊκών Πιστωτικών Μονάδων

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΕΥΑΓΓΕΛΙΑΣ Π. ΛΟΥΚΟΓΕΩΡΓΑΚΗ Διπλωματούχου Πολιτικού Μηχανικού ΟΛΟΚΛΗΡΩΜΕΝΟ

Διαβάστε περισσότερα

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη

HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme. Επιλογή δείγματος. Κατερίνα Δημάκη HELLENIC OPEN UNIVERSITY School of Social Sciences ΜΒΑ Programme Επιλογή δείγματος Κατερίνα Δημάκη Αν. Καθηγήτρια Τμήμα Στατιστικής Οικονομικό Πανεπιστήμιο Αθηνών 1 Τρόποι Συλλογής Δεδομένων Απογραφική

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να N161 _ (262) Στατιστική στη Φυσική Αγωγή Βιβλία ή 1 ΕΞΕΤΑΣΕΙΣ στο τέλος του εξαμήνου με ΑΝΟΙΧΤΑ βιβλία ΕΞΕΤΑΣΕΙΣ ο καθένας θα πρέπει να έχει το ΔΙΚΟ του βιβλίο ΔΕΝ θα μπορείτε να ανταλλάσετε βιβλία ή να

Διαβάστε περισσότερα