Μεταπτυχιακή Διπλωματική Εργασία

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Μεταπτυχιακή Διπλωματική Εργασία"

Transcript

1 Πανεπιστήμιο Πατρών Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής Μεταπτυχιακό Πρόγραμμα: «Επιστήμη και Τεχνολογία Υπολογιστών» Μεταπτυχιακή Διπλωματική Εργασία «Υλοποίηση εφαρμογής εξόρυξης δεδομένων σε αποτελέσματα εντοπισμού της θέσης κινητού χρήστη και αξιοποίηση της πληροφορίας σε M-commerce εφαρμογές» Μεττούρης Χρίστος ΑΜ: 492 Επίβλεψη: αναπληρωτής καθ. κ. Γαροφαλάκης Ιωάννης Τριμελής Επιτροπή: κ. Γαροφαλάκης Ιωάννης, κ. Μακρής Χρήστος, κ. Χατζηλυγερούδης Ιωάννης Πάτρα, Ιούνιος 2008

2 Ευχαριστίες Η παράγραφος αυτή αφιερώνεται σε όλους εκείνους που βοήθησαν, ώστε να ολοκληρωθεί η μεταπτυχιακή διπλωματική εργασία αυτή. Ο πρώτος που θα ήθελα να ευχαριστήσω είναι ο επιβλέποντας καθηγητής μου κ. Γαροφαλάκης Ιωάννης, για την εμπιστοσύνη που μου έδειξε, την καλή θέληση για συνεργασία μεταξύ μας και την πολύτιμη βοήθεια και καθοδήγηση που παρείχε. Ευχαριστίες απευθύνω επίσης στους μεταπτυχιακούς συμφοιτητές μου και συναδέλφους που βοήθησαν με οποιονδήποτε τρόπο στην προσπάθεια μου, καθώς και στον φίλο Πάρη Γιαπάνη για τις συμβουλές και υποδείξεις του. Η διπλωματική αφιερώνεται στα πιο πάνω πρόσωπα, καθώς και σε όλους τους φίλους μου. Μεττούρης Χρίστος Πάτρα, Ιούνιος 2008 Ιούνιος

3 Εισαγωγή... 6 Κεφάλαιο 1. Data Mining Ορισμοί Χρήσεις του data mining Κύρια στοιχεία της διαδικασίας data mining Λογισμικό Data mining. Πώς λειτουργεί; Data mining και Knowledge Discovery in Databases (KDD) 17 Κεφάλαιο 2. Market Basket Analysis & Association Rules Market Basket Analysis Κανόνες συσχέτισης - Association Rules 23 Κεφάλαιο 3. Εντοπισμός θέσης χρήστη και M-commerce εφαρμογές Εισαγωγή M-commerce Εντοπισμός της θέσης του χρήστη τεχνολογίες Περιγραφή αρχικού συστήματος εντοπισμού της θέσης κινητού χρήστη. 30 Κεφάλαιο 4. Στόχοι εφαρμογής.. 36 Κεφάλαιο 5. Εξαγωγή κανόνων συσχέτισης Εισαγωγή Apriori αλγόριθμος Δημιουργία Κανόνων Συσχέτισης από Frequent Itemsets 52 Κεφάλαιο 6. Εφαρμογή Μέρος Ι - Σύστημα Εξαγωγής Κανόνων Συσχέτισης Εισαγωγή στο Σύστημα Εξαγωγής Κανόνων Συσχέτισης Πληροφορία κανόνων συσχέτισης Υποσύστημα Υλοποίησης Apriori Αλγορίθμου Υποσύστημα Παραγωγής Κανόνων Κεφάλαιο 7. Εφαρμογή Μέρος ΙΙ- Σύστημα Ανίχνευσης και Επεξεργασίας Εισαγωγή Μέρη συστήματος Σταθμοί βάσης Κεντρικός Server Βάση Δεδομένων Php Module.. 83 Ιούνιος

4 Κεφάλαιο 8. Δοκιμή εφαρμογής Σενάριο λειτουργίας Παρουσίαση αποτελεσμάτων. 97 Κεφάλαιο 9. Συμπεράσματα - Μελλοντική εργασία Συζήτηση-Συμπεράσματα Θέματα χρονικών περιορισμών Μελλοντική εργασία Βιβλιογραφία. 120 Ευρετήριο Σχημάτων Σχήμα 1. Τα σημαντικότερα βήματα της KDD διαδικασίας.. 20 Σχήμα 2. Οι εφτά υποπεριοχές του συστήματος εντοπισμού θέσης.. 31 Σχήμα 3. Τοπολογία εφαρμογής 32 Σχήμα 4. Περιοχές στις οποίες το σύστημα ανίχνευε κάποιον χρήστη κατά τις δοκιμές. 34 Σχήμα 5. Τα δύο υποσυστήματα του Συστήματος Εξαγωγής Κανόνων Συσχέτισης και η πληροφορία που ανταλλάζουν μεταξύ τους και με το Σύστημα Ανίχνευσης και Επεξεργασίας. 67 Σχήμα 6. Συναρτήσεις Υποσυστήματος Παραγωγής Κανόνων 71 Σχήμα 7. Μέρη Συστήματος Ανίχνευσης και Επεξεργασίας 75 Ευρετήριο Εικόνων Εικόνα 1: Ψευδοκώδικας Apriori αλγορίθμου. 51 Εικόνα 2. Εξαγόμενοι κανόνες συσχέτισης (για όλους τους πελάτες) Εικόνα 3. Εξαγόμενοι κανόνες συσχέτισης (για τον πελάτη 0012ee459023) Εικόνα 4. Μη ορισμός νέας τιμής στο temporary minimum confidence από τον διαχειριστή Εικόνα 5. Ορισμός νέας τιμής (80) στο temporary minimum confidence από τον διαχειριστή Εικόνα 6. Πίνακας πορείας πελατών, όπως παρουσιάζεται από το php Module Εικόνα 7. Οπτική αναπαράσταση πορείας πελάτη.. 92 Εικόνα 8. Πίνακας συναλλαγών πελατών. 93 Εικόνα 9. Παραλαβή μηνύματος από τον πελάτη 1112ee μια φορά. 95 Εικόνα 10. Μήνυμα το οποίο εκκρεμεί για τον πελάτη 0012ee Εικόνα 11. Διαθέσιμες επιλογές συστήματος για τον διαχειριστή Εικόνα 12. Πίνακας συναλλαγών όλων των πελατών που έχουν καταχωρηθεί στο σύστημα Εικόνα 13. Τιμές σημαντικών για την λειτουργία της εφαρμογής παραμέτρων 99 Ιούνιος

5 Εικόνα 14. Επιλογές στην διάθεσή του διαχειριστή για την παρουσίαση των κανόνων συσχέτισης Εικόνα 15.α. Κανόνες συσχέτισης παραγόμενοι από το σύστημα (20 πρώτοι) 102 Εικόνα 15.β. Κανόνες συσχέτισης παραγόμενοι από το σύστημα (20 τελευταίοι) Εικόνα 16. Πελάτες καταχωρημένοι από το σύστημα κατά τις δοκιμές Εικόνα 17. Συναλλαγές πελάτη 0012ee Εικόνα 18. Κανόνες παραγόμενοι από τις συναλλαγές τις εικόνας Εικόνα 19. Αναλυτική παρουσίαση συναλλαγής πελάτη 110 Εικόνα 20. Αποδεχόμενα και απορριπτόμενα μηνύματα πελάτη 3312ee Εικόνα 21. Μηνύματα που εκκρεμούν για τον πελάτη 0012ee Εικόνα 22. Κανόνες συσχέτισης Ευρετήριο Πινάκων Πίνακας 1. Πίνακας συναλλαγών D.. 43 Πίνακες 2.α, 2.β, 2.γ, 2.δ, 2.ε, 2.στ, 2.ζ, 2.η. Παράδειγμα εφαρμογής Apriori αλγορίθμου Πίνακας 3. Τυπικός πίνακας συναλλαγών προϊόντων (item transaction table) υπεραγοράς με προϊόντα Πίνακας 4. Πίνακας συναλλαγών πελατών - Client transaction table Πίνακας 5. Πίνακας συναλλαγών πελατών αρχείου transa.txt.. 65 Πίνακας 6. Πίνακας συναλλαγών πελατών.. 84 Πίνακας 7. Συναλλαγή πελάτη σε πίνακα συναλλαγών πελατών με βάρη. 86 Πίνακας 8. Πίνακας πορείας πελάτη για συναλλαγή πίνακα Πίνακας 9. Πίνακας συναλλαγών πελάτη.. 94 Ιούνιος

6 Εισαγωγή Πολλές επιχειρήσεις πώλησης προϊόντων αποθηκεύουν καθημερινά τεράστιο όγκο δεδομένων, τα οποία προκύπτουν από τις συναλλαγές των διαφόρων πελατών τους, κατά την διαδικασία του ψωνίσματος. Με τον όρο συναλλαγή κάποιου πελάτη, εννοούμε το σύνολο των προϊόντων που αυτός αγόρασε, σε μια συγκεκριμένη αγορά του. Ο πιο διαδεδομένος τρόπος καταχώρησης σε υπολογιστικό σύστημα των προϊόντων που οι πελάτες αγοράζουν, είναι η τεχνολογία barcode [4] (ή bar code). Με χρήση των barcodes, καταχωρούνται τα δεδομένα που αφορούν τις συναλλαγές των πελατών εύκολα, γρήγορα και με ασφάλεια. Πλέον, κάθε σύγχρονη επιχείρηση πώλησης προϊόντων, διαθέτει μεγάλου όγκου βάσεις δεδομένων, οι οποίες αποθηκεύουν τέτοιου είδους δεδομένα. Για την ανάλυση των δεδομένων αυτών, χρησιμοποιούνται τεχνικές εξόρυξης δεδομένων (data mining). Σκοπός της ανάλυσης είναι η εξαγωγή χρήσιμης πληροφορίας. Εξόρυξη δεδομένων (data mining) [7] είναι η διαδικασία ψαξίματος σε μεγάλο όγκο δεδομένων, με σκοπό την περισυλλογή πληροφορίας. Το data mining έχει περιγραφεί σαν: «η μη τετριμμένη εξαγωγή υπονοούμενης, ενδεχομένως χρήσιμης και μέχρι στιγμής άγνωστης πληροφορίας από διάφορα δεδομένα». Μια σημαντική μέθοδος εξόρυξης δεδομένων είναι το market basket analysis. Η μέθοδος αυτή βασίζεται στην θεωρία ότι αν κάποιος πελάτης αγοράσει κάποιο συγκεκριμένο προϊόν (ή σύνολο προϊόντων), τότε είναι πολύ πιθανό να αγοράσει και ένα άλλο προϊόν (ή σύνολο προϊόντων). Χρησιμοποιείται στα τμήματα πωλήσεων προϊόντων, για την επιλογή πελατών με κάποιες συγκεκριμένες προτιμήσεις ή/και την επιλογή προϊόντων με κάποια συγκεκριμένα χαρακτηριστικά. Τα τελευταία χρόνια παρατηρείται ραγδαία ανάπτυξη στον τομέα του m-commerce (κινητό εμπόριο). Ιδιαίτερα στο τομέα διαφήμισης μέσω κινητού (mobile advertising), βλέπουμε συνεχώς νέες εφαρμογές να κάνουν την εμφάνισή τους στην αγορά. Τέτοιες εφαρμογές μπορεί να περιλαμβάνουν διαφήμιση μέσω ασύρματων τεχνολογιών, όπως είναι το Bluetooth, όπου σε τέτοιες περιπτώσεις, ο χρήστης παροτρύνεται να ενεργοποιήσει το Bluetooth στο κινητό του τηλέφωνο και στην συνέχεια λαμβάνει διαφημιστικά μηνύματα/σποτάκια, ή λαμβάνει μέρος σε διάφορους διαγωνισμούς. Μεγάλο ρόλο στην ανάπτυξη του m-commerce έπαιξε η εξάπλωση των ασύρματων τεχνολογιών τα τελευταία χρόνια. Τεχνολογίες όπως το Bluetooth, το Wi-Fi (802.11b Ιούνιος

7 και g) και οι υπέρυθρες χρησιμοποιούνται πλέον σε διάφορες εφαρμογές, με ποιό διαδεδομένη τη δημιουργία ασύρματων δικτύων, στα οποία συμμετέχουν υπολογιστές ή/και κινητές συσκευές όπως κινητά τηλέφωνα και PDAs. Τα ασύρματα δίκτυα χρησιμοποιούνται κυρίως για ανταλλαγές δεδομένων μεταξύ των επικοινωνούντων συσκευών και για παροχή πρόσβασης στο διαδίκτυο σε κινητές συσκευές. Μια άλλη χρήση των ασύρματων τεχνολογιών, είναι σε εφαρμογές εντοπισμού της θέσης του χρήστη. Σε τέτοιες εφαρμογές, στόχος είναι η εύρεση της θέσης του χρήστη, η οποία μπορεί να αφορά γεωγραφικές συντεταγμένες (global positioning) ή κάποιον κλειστό χώρο, για παράδειγμα κάποιο δωμάτιο κάποιου κτιρίου (indoor positioning). Στην παρούσα διπλωματική υλοποιείται εφαρμογή, η οποία χρησιμοποιεί τεχνικές εξόρυξης δεδομένων σε αποτελέσματα εντοπισμού της θέσης κινητού χρήστη για παραγωγή πληροφορίας, ενώ παράλληλα γίνεται αξιοποίηση των αποτελεσμάτων εντοπισμού της θέσης σε M-commerce εφαρμογές. Η εφαρμογή υλοποιήθηκε για χρήση της σε μια υπεραγορά, στην οποία οι πελάτες θα ανιχνεύονται στα διάφορα τμήματά της, κατά την πραγματοποίηση των αγορών τους. Από τα αποτελέσματα εντοπισμού της θέσης του χρήστη, παράγονται κανόνες συσχέτισης, οι οποίοι αφορούν τις ανιχνεύσεις των πελατών στα τμήματα αυτά. Πιο συγκεκριμένα, εκμεταλλευόμενοι ήδη υπάρχον σύστημα εντοπισμού της θέσης κινητού χρήστη σε κλειστό χώρο [20], η εφαρμογή λαμβάνει σαν δεδομένα τις θέσεις (τμήματα υπεραγοράς) στις οποίες έχουν εντοπιστεί οι διάφοροι χρήστες. Στην συνέχεια, τα δεδομένα αυτά αποθηκεύονται κατάλληλα, με σκοπό την μελλοντική τους ανάλυση (το πότε γίνεται η ανάλυση αυτή αποφασίζεται από τον διαχειριστή της εφαρμογής). Η ανάλυση βασίζεται σε τεχνικές εξόρυξης δεδομένων, ώστε να προκύψουν κανόνες συσχέτισης. Γενικότερα, οι κανόνες συσχέτισης χρησιμοποιούνται κυρίως για το ψάξιμο προϊόντων τα οποία αγοράστηκαν μαζί. Στα πλαίσια της παρούσας διπλωματικής εργασίας, οι κανόνες συσχέτισης που εξάγονται αφορούν, αντί για προϊόντα, όπως γίνεται σε κοινές εφαρμογές εξαγωγής κανόνων συσχέτισης, τα διαφορετικά τμήματα της υπεραγοράς. Επιπλέον, η εφαρμογή αξιοποιεί την αποθηκευμένη πληροφορία που αφορά τις θέσεις εντοπισμού των χρηστών, με σκοπό την ανακάλυψη των προτιμήσεών τους σχετικά με τα διάφορα τμήματα της υπεραγοράς. Στην συνέχεια, εκμεταλλευόμενοι τα τμήματα προτίμησης του κάθε πελάτη, αποστέλλονται σε αυτούς διάφορα μηνύματα σχετικά με το m-commerce. Τα μηνύματα είναι διαφημιστικού και ενημερωτικού περιεχομένου και αφορούν κυρίως προϊόντα που πωλούνται στα τμήματα προτίμησης του κάθε πελάτη. Ιούνιος

8 Τέλος, είναι δυνατή η παρακολούθηση της πορείας των διαφόρων πελατών στην υπεραγορά. Η εφαρμογή, παρέχει στον διαχειριστή την δυνατότητα να μπορεί να παρακολουθεί, για κάθε χρήστη-πελάτη που έχει εντοπιστεί από το σύστημα, την πορεία που έχει αυτός ακολουθήσει κατά την παραμονή του στην υπεραγορά, δηλαδή πότε επισκέφθηκε το κάθε τμήμα της και με ποια σειρά. Συνοψίζοντας, παραθέτουμε τους τρεις στόχους της διπλωματικής: Εξαγωγή Κανόνων Συσχέτισης Καταγραφή και επίδειξη της πορείας του χρήστη Αποστολή διαφημιστικών και ενημερωτικών μηνυμάτων με βάση τις πραγματικές προτιμήσεις του χρήστη και όχι με μια μεμονωμένη ανίχνευση σε κάποια περιοχή Το κείμενο είναι διαρρυθμισμένο ως εξής: Το πρώτο κεφάλαιο αναφέρεται στο data mining. Τι είναι, πού χρησιμοποιείται, ποια τα κύρια στοιχεία της διαδικασίας, καθώς και το πώς σχετίζεται με το Knowledge Discovery in Databases είναι τα θέματα που συζητούνται στο κεφάλαιο αυτό. Στο δεύτερο κεφάλαιο αναφερόμαστε στο Market Basket Analysis και στους Κανόνες Συσχέτισης. Πέρα από τους ορισμούς, βλέπουμε ποια πληροφορία μπορεί να παραχθεί χρησιμοποιώντας κανόνες συσχέτισης προϊόντων. Η πληροφορία αυτή είναι πολύ σημαντική και χρησιμοποιείται μεταξύ άλλων για να γίνει καλύτερη τιμολόγηση των προϊόντων, να αποφασιστούν ποια προϊόντα θα βγουν σε εκπτώσεις και προσφορές και ποια όχι, να μελετηθούν οι επιπτώσεις σε άλλα προϊόντα από τυχόν κατάργηση κάποιου προϊόντος και να αποφασιστεί η διαρρύθμιση των προϊόντων στα ράφια. Στο τρίτο κεφάλαιο, κάνουμε εισαγωγή στο m-commerce, καθώς και στις τεχνολογίες που χρησιμοποιούνται σε εφαρμογές εντοπισμού της θέσης του χρήστη. Στην συνέχεια, περιγράφουμε το αρχικό σύστημα εντοπισμού της θέσης κινητού χρήστη, το οποίο χρησιμοποιεί τροποποιημένο η παρούσα εφαρμογή. Το σύστημα αυτό, τροποποιήθηκε κατάλληλα για τους σκοπούς της παρούσας διπλωματικής. Τα θέματα που εξετάζονται είναι ο σκοπός υλοποίησης του αρχικού συστήματος, η μέθοδος εντοπισμού της θέσης κινητού χρήστη που χρησιμοποιεί, το πώς λειτουργεί και τα αποτελέσματα από δοκιμές. Το τέταρτο κεφάλαιο αναλύει τους στόχους της εφαρμογής της διπλωματικής. Μεταξύ άλλων, συζητάμε το ποια πληροφορία μπορεί να παρέχει η εφαρμογή στον διαχειριστή του συστήματος, εφόσον αυτή πετύχει την εξαγωγή κανόνων συσχέτισης τμημάτων και την καταγραφή και επίδειξη της πορείας των πελατών. Ιούνιος

9 Το πέμπτο κεφάλαιο αναφέρεται στην διαδικασία παραγωγής κανόνων συσχέτισης. Παρουσιάζεται ο Apriori αλγόριθμος, τον οποίο χρησιμοποιούμε για παραγωγή των frequent itemsets, καθώς και η διαδικασία παραγωγής κανόνων συσχέτισης από τα frequent itemsets αυτά. Η παρουσίαση γίνεται με χρήση και παραδειγμάτων για καλύτερη κατανόηση της διαδικασίας. Τα κεφάλαια 6 και 7 παρουσιάζουν την εφαρμογή. Η εφαρμογή αποτελείται από δύο συστήματα, το Σύστημα Εξαγωγής Κανόνων Συσχέτισης και το Σύστημα Ανίχνευσης και Επεξεργασίας. Τα κεφάλαια αυτά αναλύουν τα μέρη των δύο συστημάτων, τις λειτουργίες τους, τα δεδομένα που ανταλλάζουν και τα αποτελέσματα τα οποία είναι σε θέση να παράξουν. Το όγδοο κεφάλαιο περιγράφει τις δοκιμές της εφαρμογής. Αρχικά περιγράφεται το σενάριο λειτουργίας το οποίο χρησιμοποιήθηκε για τις δοκιμές αυτές. Στην συνέχεια παρουσιάζονται τα αποτελέσματα τα οποία πήραμε, ενώ γίνεται συζήτηση για το κατά πόσο τα αποτελέσματα αυτά ανταποκρίνονται στην πραγματικότητα, καθώς και το κατά πόσο παρέχουν την ποθητή πληροφορία στον διαχειριστή της εφαρμογής. Στο τελευταίο κεφάλαιο, γίνεται συζήτηση για το τι έχει υλοποιηθεί στα πλαίσια της διπλωματικής και το αν η υλοποίηση ανταποκρίνεται στους στόχους τους οποίους θέσαμε και σε ποιο βαθμό. Επιπλέον, μας απασχολούν θέματα χρονικών περιορισμών, αφού η εφαρμογή έχει άμεση σχέση με την εύρεση της θέσης κινούμενων πελατών σε συγκεκριμένο χώρο και χρόνο. Τέλος, παραθέτουμε διάφορες σκέψεις για μελλοντική εργασία που αφορά την εφαρμογή και το πώς αυτή θα μπορούσε μελλοντικά να ανταποκριθεί σε ακόμη μεγαλύτερες προκλήσεις. Ιούνιος

10 Κεφάλαιο 1. Data Mining 1.1. Ορισμοί Data mining (εξόρυξη δεδομένων) είναι η διαδικασία ψαξίματος σε μεγάλο όγκο δεδομένων, με σκοπό την περισυλλογή πληροφορίας [7][16]. Το data mining έχει περιγραφεί σαν: «η μη τετριμμένη εξαγωγή υπονοούμενης, ενδεχομένως χρήσιμης και μέχρι στιγμής άγνωστης πληροφορίας από διάφορα δεδομένα» και «η επιστήμη της εξαγωγής χρήσιμης πληροφορίας από μεγάλα datasets ή βάσεις δεδομένων». Σε σχέση με το ERP (Enterprise Resource Planning), το data mining ορίζεται σαν η στατιστική και λογική ανάλυση μεγάλου συνόλου δεδομένων που προέκυψαν από συναλλαγές, με σκοπό την εύρεση patterns. Το data mining λογισμικό είναι ένα από τα μερικά αναλυτικά εργαλεία (analytical tools) που υπάρχουν για ανάλυση δεδομένων. Επιτρέπει στους χρήστες να αναλύουν δεδομένα από πολλές διαφορετικές διαστάσεις και γωνίες, να τα κατηγοριοποιούν και να συνοψίσουν τις συσχετίσεις που υπάρχουν. Πιο τεχνικά, το data mining ορίζεται σαν η διαδικασία της εύρεσης συσχετίσεων και μοτίβων (patterns) μεταξύ δεκάδων πεδίων μεγάλων βάσεων δεδομένων [14]. Ανέκαθεν διάφοροι αναλυτές ασχολούνται με την διαδικασία της εξαγωγής χρήσιμης πληροφορίας από καταγεγραμμένα δεδομένα. Στις σύγχρονες όμως επιχειρήσεις και επιστήμες, ο αυξημένος όγκος των δεδομένων απαιτεί το ψάξιμο αυτό να γίνεται με χρήση υπολογιστικών προσεγγίσεων. Πράγματι, στην σύγχρονη εποχή, ο όγκος των δεδομένων αυτών, τα οποία δεδομένα ονομάζονται datasets, έχει αυξηθεί τόσο σε μέγεθος, όσο και σε πολυπλοκότητα. Το αποτέλεσμα είναι οι μέθοδοι απ`ευθείας ανάλυσης δεδομένων να δίνουν την θέση τους σε αυτόματες μεθόδους ανάλυσης δεδομένων, οι οποίες χρησιμοποιούν πιο πολύπλοκα και εξεζητημένα εργαλεία. Από την άλλη, οι αναπτυσσόμενες τεχνολογίες των υπολογιστών, δικτύων και αισθητήρων έχουν μετάτρεψε την περισυλλογή και οργάνωση δεδομένων σε μια αρκετά εύκολη διαδικασία. Το ζητούμενο όμως δεν είναι μόνο η περισυλλογή των δεδομένων αυτών. Τουναντίον, τα περισυλλεγμένα δεδομένα πρέπει να μετατραπούν σε κατάλληλη πληροφορία και γνώση, για να μπορούν να καταστούν χρήσιμα. Έτσι, μπορούμε να πούμε ότι το data mining αποτελεί την διαδικασία Ιούνιος

11 εφαρμογής υπολογιστικών μεθοδολογιών, συμπεριλαμβανομένων και καινούργιων τεχνικών, με σκοπό την ανακάλυψη γνώσης. Παρόλο που το data mining είναι ένας σχετικά καινούργιος όρος, εντούτοις η τεχνολογία δεν είναι καινούργια. Διάφορες επιχειρήσεις ανέκαθεν χρησιμοποιούσαν ισχυρούς υπολογιστές για να «κοσκινίσουν» τεράστιους όγκους δεδομένων, όπως για παράδειγμα δεδομένα που προκύπτουν από τον σαρωτή προϊόντων (optical scanner ή barcode reader) κάποιας υπεραγοράς, με σκοπό την παραγωγή διαφόρων αναφορών σχετικών με την αγορά. Εξάλλου, η συνεχιζόμενη και αυξανόμενη εμφάνιση καινοτομιών σχετικών με την απόδοση των μοντέρνων υπολογιστικών συστημάτων, την απόδοση και χωρητικότητα των συστημάτων αποθήκευσης αλλά και την παραγωγή λογισμικού σχετικού με την στατιστική ανάλυση, αυξάνουν δραματικά την ακρίβεια και την χρησιμότητα της ανάλυσης των δεδομένων αυτών, μειώνοντας παράλληλα το κόστος. Ο όρος data mining χρησιμοποιείται συχνά αναφερόμενος σε δύο διαφορετικές διαδικασίες: την ανακάλυψη γνώσης και την πρόβλεψη [14]. Η ανακάλυψη γνώσης παρέχει ρητή πληροφορία η οποία έχει αναγνώσιμη μορφή και μπορεί να γίνει κατανοητή από κάποιον χρήστη. Η πρόβλεψη παρέχει προβλέψεις για μελλοντικά συμβάντα. Σε κάποιες περιπτώσεις μπορεί να είναι διαφανείς και αναγνώσιμη, π.χ. σε συστήματα βασισμένα σε κανόνες (rule based systems), ενώ σε άλλες περιπτώσεις μπορεί να είναι αδιαφανής, όπως σε νευρωνικά δίκτυα (neural networks). Εφόσον το data mining βασίζεται στην χρήση δεδομένων του πραγματικού κόσμου, μπορεί σε κάποιες περιπτώσεις τα δεδομένα αυτά να είναι εξαιρετικά ευαίσθητα και να έχουν άγνωστες αλληλοσυσχετίσεις. Μια αναπόφευκτη αδυναμία του data mining είναι ότι κρίσιμα δεδομένα που μπορεί να έχουν αλληλοσυσχετίσεις δεν παρατηρούνται ποτέ. Πρόσφατα, έγιναν προσπάθειες για τον ορισμό κάποιου standard για το data mining, όπως το CRISP-DM standard και το Java Data-Mining Standard [14]. Ανεξάρτητα από τις προσπάθειες αυτές, υπάρχουν και ελεύθερα «ανοικτού» κώδικα συστήματα όπως το RapidMiner και το Weka, τα οποία αποτελούν το ανεπίσημο standard για τον ορισμό των data mining διαδικασιών. Δεδομένα, πληροφορία και γνώση Δεδομένα Σαν δεδομένα μπορούμε να ορίσουμε οτιδήποτε (αριθμούς, κείμενο κ.τ.λ.) μπορεί να επεξεργαστεί κάποιο υπολογιστικό σύστημα. Σήμερα, διάφοροι οργανισμοί συγκεντρώνουν κολοσσιαίες ποσότητες δεδομένων σε πολλές διαφορετικές Ιούνιος

12 τυποποιήσεις (formats) και βάσεις δεδομένων. Τα δεδομένα αυτά συμπεριλαμβάνουν: Επιχειρησιακά δεδομένα ή δεδομένα συναλλαγών όπως πωλήσεις, απογραφές, μισθολόγια, λογιστικά. Μη επιχειρησιακά δεδομένα, όπως δεδομένα προβλέψεων και μακροοικονομικά δεδομένα. Μεταδεδομένα (δεδομένα που περιγράφουν δεδομένα) όπως η σχεδίαση λογικών βάσεων δεδομένων και προσδιορισμοί δεδομένων λεξικών. Πληροφορία Τα μοτίβα (patterns), οι συσχετίσεις (associations) και οι συνάφειες (relationships) μεταξύ όλων αυτών των δεδομένων, μπορούν να παρέχουν πληροφορία. Για παράδειγμα, η ανάλυση δεδομένων από συναλλαγές που έγιναν σε ένα σημείο πώλησης προϊόντων (όπως μια υπεραγορά), μπορεί να παράγει πληροφορία σχετικά με το ποια προϊόντα πωλούνται, πότε (χρονικά διαστήματα) και πώς (με ποια άλλα προϊόντα πωλούνται μαζί κ.ο.κ.). Γνώση Η πληροφορία με την σειρά της μπορεί να μετατραπεί σε γνώση, η οποία να αφορά μελλοντικές τάσεις της αγοράς. Στο παράδειγμα της υπεραγοράς πιο πάνω, η πληροφορία που κερδίζεται με την ανάλυση των δεδομένων από τις συναλλαγές, μπορεί να βοηθήσει στον προσδιορισμό της αγοραστικής συμπεριφοράς των πελατών, δηλαδή να γίνει γνωστή και να εκμεταλλευτεί η αγοραστική τάση του κοινού. Γνωρίζοντας την τάση αυτή, είναι εφικτός ο προσδιορισμός των προϊόντων εκείνων που είναι καλύτερα και πρέπει να προωθούνται περισσότερο Χρήσεις του data mining Το data mining χρησιμοποιείται ευρέως σε διάφορους τομείς, όπως στης επιχειρήσεις, επιστήμες, μηχανική κ.α. Επιχειρήσεις Σήμερα, το data mining χρησιμοποιείται κυρίως από διάφορες επιχειρήσεις που ασχολούνται άμεσα με τους καταναλωτές, επιχειρήσεις πώλησης προϊόντων, επιχειρήσεις που ασχολούνται με την οικονομία, τις επικοινωνίες αλλά και Ιούνιος

13 επιχειρήσεις που ασχολούνται με το marketing [14]. Το data mining βοηθά τις επιχειρήσεις αυτές στον καθορισμό συναφειών μεταξύ εσωτερικών παραγόντων όπως οι τιμές, η τοποθέτηση των προϊόντων και η ικανότητα του προσωπικού, αλλά και μεταξύ εξωτερικών παραγόντων όπως οι οικονομικοί δείκτες και ο ανταγωνισμός. Βοηθά στην μελέτη του αντίκτυπου στις πωλήσεις από διάφορες καταστάσεις, το ποσοστό ικανοποίησης των πελατών και τον καθορισμό του κέρδους, ενώ επιβάλλει την εις βάθος μελέτη και επεξεργασία των δεδομένων των συναλλαγών. Με την χρήση data mining τεχνικών, ένας πωλητής μπορεί να χρησιμοποιήσει δεδομένα συναλλαγών πελατών του για να μάθει το αγοραστικό ιστορικό τους και στην συνέχεια να το εκμεταλλευτεί, προωθώντας σε αυτούς με κατάλληλο τρόπο διάφορα προϊόντα. Επιπλέον, με την εξόρυξη δημογραφικών δεδομένων από διάφορες φόρμες σχολίων και κάρτες εγγύησης διαφόρων πελατών, ένας πωλητής θα μπορούσε να δημιουργήσει δελεαστικές προσφορές που να έχουν σαν στόχο συγκεκριμένη μερίδα πελατών. Για παράδειγμα, καταστήματα ενοικίασης ταινιών εφαρμόζουν τεχνικές εξόρυξης σε βάσεις δεδομένων που διατηρούν με το ιστορικό των ενοικιάσεων των πελατών τους, με σκοπό την παραγωγή κατάλληλης πληροφορίας, ώστε να μπορούν να προτείνουν στους πελάτες τους διάφορες ταινίες. Ακόμα, εταιρίες πιστωτικών καρτών προτείνουν προϊόντα στους πελάτες τους, ανάλογα με τις προηγούμενες αγορές που οι τελευταίοι έχουν κάνει. Φυσικά, η πληροφορία για το ποια προϊόντα ενδιαφέρουν κάποιο πελάτη, προκύπτει με ανάλυση των προηγούμενών τους αγορών, με τη χρήση data mining τεχνικών. Επιχειρήσεις πώλησης αγαθών τεράστιων διαστάσεων πραγματοποιούν συνεχώς περισυλλογή δεδομένων συναλλαγών πελατών τους ταυτόχρονα από χιλιάδες καταστήματα από διάφορες χώρες και τα προωθούν (τα δεδομένα αυτά) σε κολοσιαία (πολλών Terabyte) data warehouses. Στην συνέχεια, οι επιχειρήσεις αυτές επιτρέπουν σε χιλιάδες προμηθευτές τους να έχουν πρόσβαση στα δεδομένα και να τα αναλύουν με τεχνικές data mining. Οι προμηθευτές χρησιμοποιούν τα δεδομένα αυτά για να αναγνωρίσουν αγοραστικά μοτίβα πελατών και να ανακαλύψουν νέες ευκαιρίες που σχετίζονται με το εμπόριο διαφόρων προϊόντων. Το data mining συνεισφέρει επίσης σε εφαρμογές διαχείρισης των σχέσεων με τους πελάτες. Για παράδειγμα, μια επιχείρηση θα μπορούσε να εφαρμόσει data mining τεχνικές για την εύρεση των πελατών με την μεγαλύτερη πιθανότητα να απαντήσουν σε κάποια δική τους προσφορά, παρά την μαζική αποστολή και ενημερωτικών φυλλαδίων σε αυτούς. Ποιό εξειδικευμένες τεχνικές data mining μπορούν να χρησιμοποιηθούν στο να προβλέπουν και ποιες συγκεκριμένες προσφορές είναι πιθανότερο να ενδιαφέρουν κάποιο πελάτη. Ακόμα, αντί για ένα μοντέλο το οποίο να Ιούνιος

14 προβλέπει ποιοι από τους πελάτες θα αποδεχθούν τις προσφορές, μια επιχείρηση μπορεί να εφαρμόσει πολλά διαφορετικά μοντέλα για πολλούς διαφορετικούς χρήστες. Μια ακόμα εφαρμογή του data mining είναι σε τμήματα ανθρωπίνων πόρων (human-resources departments). Σε τέτοιες περιπτώσεις, το ζητούμενο είναι το να προσδιοριστούν τα χαρακτηριστικά των πιο επιτυχημένων υπαλλήλων μιας επιχείρησης. Τέτοια χαρακτηριστικά μπορεί να είναι για παράδειγμα το πανεπιστήμιο στο οποίο φοίτησαν, ούτως ώστε μελλοντικά να γίνει πρόσληψη περισσότερου ανθρώπινου δυναμικού από το πανεπιστήμιο αυτό. Το market basket analysis είναι μια σημαντική μέθοδος του data mining, η οποία έχει άμεση σχέση με την εφαρμογή της παρούσας διπλωματικής. Η μέθοδος αυτή χρησιμοποιείται στα τμήματα πωλήσεων προϊόντων, είτε για την επιλογή πελατών με κάποιες συγκεκριμένες προτιμήσεις, ή για την επιλογή προϊόντων με κάποια συγκεκριμένα χαρακτηριστικά. Οι διάφορες προτιμήσεις των πελατών αλλά και τα προϊόντα με τις συγκεκριμένες ιδιότητες είναι δυνατόν να προκύψουν με ανάλυση των αγορών των πελατών. Έτσι, αν ένα κατάστημα εμπορίου ρούχων καταγράφει τις αγορές των πελατών του, τότε με κάποιο σύστημα data mining θα μπορούσε να εξαχθεί πληροφορία της μορφής: «ποιοι πελάτες προτιμούν το μετάξι αντί για το βαμβάκι» ή «τι ποσοστό των αγορών που περιλαμβάνουν μετάξι, περιλαμβάνουν και βαμβάκι». Τα ποιό πάνω προκύπτουν με κατάλληλη ανάλυση των συναλλαγών των πελατών, για εξαγωγή των λεγόμενων κανόνων συσχέτισης (association rules). Για την περίπτωση ενός καταστήματος εμπορίου ρούχων, μπορεί να προκύψουν κανόνες όπως: «το 79% των αγορών που περιλαμβάνουν μετάξι, περιλαμβάνουν και βαμβάκι». Στην περίπτωση βιομηχανίας κατασκευής προϊόντων, ένας κανόνας συσχέτισης θα μπορούσε να είναι: «Το 82% των προϊόντων που έχουν ένα συγκεκριμένο κατασκευαστικό λάθος, θα παρουσιάσουν ένα δεύτερο πρόβλημα σε περίοδο 6 μηνών». Η μέθοδος market basket analysis και η διαδικασία εξαγωγής κανόνων συσχέτισης παρουσιάζονται σε επόμενο κεφάλαιο. Επιστήμες - Μηχανική Στην σύγχρονη εποχή,το data mining χρησιμοποιείται ευρέως στους τομείς των επιστημών και της μηχανικής. Πιο συγκεκριμένα, απαντάται στην βιοπληροφορική, την γενετική, τον φαρμακευτικό τομέα, την εκπαίδευση και την ηλεκτρολογία. Στον τομέα της γενετικής, ο στόχος είναι να βρούμε το πώς οι αλλαγές στην αλυσίδα DNA κάποιου ατόμου επηρεάζουν το ρίσκο της ανάπτυξης κοινών ασθενειών, όπως είναι ο καρκίνος. Αυτό είναι πολύ σημαντικό για την βελτίωση της διάγνωσης, αποφυγής και θεραπείας των διαφόρων ασθενειών. Η τεχνική data Ιούνιος

15 mining που χρησιμοποιείται για την διαδικασία αυτή ονομάζεται multifactor dimensionality reduction. Στην περιοχή της ηλεκτρολογίας, data mining τεχνικές έχουν χρησιμοποιηθεί ευρέως για επίβλεψη της κατάστασης ηλεκτρολογικού εξοπλισμού υψηλής τάσης. Ο σκοπός της επίβλεψης είναι η λήψη πολύτιμης πληροφορίας που αφορά την κατάσταση της μόνωσης του εξοπλισμού. Τέλος, το data mining εφαρμόζεται στην εκπαιδευτική έρευνα (educational research), όπου χρησιμοποιείται προς μελέτη των παραγόντων που οδηγούν τους μαθητές/φοιτητές σε δραστηριότητες, οι οποίες μειώνουν την μάθηση. Λοιπές εφαρμογές Μεγάλο ενδιαφέρον παρουσιάζει μια data mining εφαρμογή, την οποία χρησιμοποιεί ο Εθνικός Σύνδεσμος Καλαθόσφαιρας της Αμερικής (National Basketball Association - NBA) και η οποία χρησιμοποιεί στατιστικά δεδομένα και εικόνες καταγραμμένες από καλαθοσφαιρικούς αγώνες για να αναλύσει τις κινήσεις των παιχτών, βοηθώντας τους προπονητές στην επιλογή κατάλληλων παιχτών και στρατηγικών. Για παράδειγμα, η κατάλληλη ανάλυση στατιστικών δεδομένων κάποιου παιχνιδιού το 1995, έδειξε ότι όταν συγκεκριμένος παίχτης έπαιξε σε αμυντική θέση, τότε ένας άλλος παίχτης επιχείρησε τέσσερις βολές με 100% επιτυχία. Αυτό ήταν σημαντικό, επειδή το μοτίβο αυτό διαφοροποιείται κατά πολύ από τον μέσο όρο επιτυχημένων βολών της ομάδας στο συγκεκριμένο παιχνίδι, ο οποίος ήταν μόλις 49.3% Κύρια στοιχεία της διαδικασίας data mining Διασπώντας την data mining διαδικασία, μπορούμε να αναφέρουμε τα εξής κυριότερα της στοιχεία [14]: Εξαγωγή, μετασχηματισμός και φόρτωση δεδομένων συναλλαγών από και προς συστήματα data warehouses. Αποθήκευση και διαχείριση των δεδομένων σε πολυδιάστατη βάση δεδομένων. Παροχή πρόσβασης στα δεδομένα σε αναλυτές και επαγγελματίες IT. Ανάλυση δεδομένων μέσω κατάλληλου λογισμικού εφαρμογών. Ιούνιος

16 Παρουσίαση αποτελεσμάτων με χρήσιμο τρόπο, όπως οι γραφικές παραστάσεις και οι πίνακες. Η ανάλυση των δεδομένων μπορεί να γίνει με: Τεχνητά νευρωνικά δίκτυα - Artificial neural networks: Μη γραμμικά προγνωστικά μοντέλα, τα οποία μαθαίνουν μέσω εκπαίδευσης και που δομικά μοιάζουν με βιολογικά νευρωνικά δίκτυα. Γενετικοί αλγόριθμοι - Genetic algorithms: τεχνικές βελτιστοποίησης, οι οποίες χρησιμοποιούν τεχνικές όπως οι γενετικοί συνδυασμοί, η μετάλλαξη και η φυσική επιλογή. Δέντρα αποφάσεων - Decision trees: Δεντρικές δομές που περιέχουν σύνολα αποφάσεων. Οι αποφάσεις αυτές παράγουν κανόνες, με σκοπό την ταξινόμηση κάποιου dataset. Συγκεκριμένες τεχνικές που χρησιμοποιούν δέντρα αποφάσεων είναι τα Δέντρα Ταξινόμησης και Οπισθοδρόμησης (Classification and Regression Trees - CART) και η Αυτόματη Ανίχνευση Αλληλεπιδράσεων Chi Square (Chi Square Automatic Interaction Detection - CHAID). Οι CART και CHAID τεχνικές παρέχουν ένα σύνολο κανόνων το οποίο μπορεί να εφαρμοστεί σε ένα καινούργιο, αταξινόμητο dataset, με σκοπό την πρόβλεψη για το ποιες εγγραφές θα δώσουν κάποιο συγκεκριμένο αποτέλεσμα. Μέθοδος κοντινότερου γείτονα - Nearest neighbor method: Τεχνική που ταξινομεί κάθε εγγραφή κάποιου dataset, με βάση κάποιο συνδυασμό των κλάσεων των k-πιο-όμοιων του εγγραφών. Κάποτε ονομάζεται και k-nearest neighbor τεχνική. Επαγωγή κανόνων - Rule induction: Η εξαγωγή από δεδομένα χρήσιμων if-then κανόνων, με βάση την στατιστική τους σπουδαιότητα. Οπτικοποίηση δεδομένων - Data visualization: Η οπτική ερμηνεία πολύπλοκων συναφειών, σε πολυδιάστατα δεδομένα. Για τις απεικονίσεις των συναφειών, χρησιμοποιούνται εργαλεία γραφικών Λογισμικό Data mining. Πώς λειτουργεί; Το λογισμικό data mining, βασισμένο σε ερωτήματα (queries) τελικών χρηστών, αναλύει σχέσεις και μοτίβα σε αποθηκευμένα δεδομένα συναλλαγών. Γενικότερα, τέσσερα είδη σχέσεων αναζητούνται: Ιούνιος

17 Κλάσεις: Αποθηκευμένα δεδομένα χρησιμοποιούνται για τον εντοπισμό άλλων δεδομένων. Για παράδειγμα, μια αλυσίδα εστιατορίων θα μπορούσε να χρησιμοποιήσει data mining τεχνικές σε δεδομένα συναλλαγών των πελατών της, για να καθορίσει πότε οι πελάτες επισκέπτονται τα εστιατόρια και τι παραγγέλνουν συνήθως. Η πληροφορία αυτή θα μπορούσε να χρησιμοποιηθεί για την δημιουργία συγκεκριμένων ημερήσιων προσφορών, με σκοπό την αύξηση της πελατείας. Clusters: Δεδομένα ομαδοποιούνται σύμφωνα με λογικές συσχετίσεις ή προτιμήσεις πελατών. Για παράδειγμα, δεδομένα θα μπορούσαν να εξορυχθούν, με σκοπό τον εντοπισμό διαφόρων σχέσεων μεταξύ πελατών. Συσχετίσεις Associations: Δεδομένα εξορύσσονται με σκοπό τον προσδιορισμό συσχετίσεων. Για παράδειγμα, μια αλυσίδα υπεραγορών χρησιμοποιούσε λογισμικό data mining, για την ανάλυση των δεδομένων που προέκυπταν από τις αγορές των πελατών. Ανακάλυψαν ότι, όταν οι άντρες αγόραζαν βρεφικές πάνες τις Πέμπτες και τα Σάββατα, αγόραζαν επίσης και μπίρες. Περαιτέρω ανάλυση έδειξε ότι οι συγκεκριμένοι πελάτες, τυπικά έκαναν τις εβδομαδιαίες αγορές τους το Σάββατο, ενώ τις Πέμπτες απλά αγόραζαν μερικά πράγματα. Οι υπεύθυνοι της υπεραγοράς συμπέραναν ότι οι πελάτες αυτοί αγόραζαν μπίρα, ούτως ώστε να την έχουν διαθέσιμη για το Σαββατοκύριακο που ερχόταν. Έτσι, με αυτή την πληροφορία διαθέσιμη, μπορούσαν να λάβουν κάποια μέτρα ώστε να αυξήσουν τα κέρδη τους, όπως για παράδειγμα το να τοποθετήσουν τις πάνες κοντά στις μπίρες και το να πωλούν τις πάνες και τις μπίρες σε κανονικές τιμές τις Πέμπτες, χωρίς δηλαδή κάποια έκπτωση. Σειριακά μοτίβα - Sequential patterns: Στην περίπτωση αυτή, δεδομένα υπόκεινται εξόρυξη με σκοπό την πρόβλεψη συμπεριφορών και τάσεων. Για παράδειγμα, κάποιος πωλητής κατασκηνωτικών ειδών θα μπορούσε να προβλέψει την πιθανότητα αγοράς σακιδίου πλάτης, δεδομένης της αγοράς από κάποιον πελάτη υπνόσακου και παπουτσιών ορειβασίας Data mining και Knowledge Discovery in Databases (KDD) «KDD is the nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data (Fayyad, Piatetsky-Shapiro, and Smyth 1996).» Ιούνιος

18 Παραδοσιακά, η έννοια της εύρεσης χρήσιμων μοτίβων σε δεδομένα έχει πάρει μια πληθώρα ονομάτων, συμπεριλαμβανομένων των: εξόρυξη δεδομένων - data mining, εξαγωγή γνώσης - knowledge extraction, ανακάλυψη γνώσης - information discovery, συγκέντρωση πληροφορίας - information harvesting, αρχαιολογία δεδομένων - data archaeology και επεξεργασία μοτίβων δεδομένων - data pattern processing [8]. Η φράση Knowledge Discovery in Databases επινοήθηκε στο πρώτο KDD workshop το 1989, με σκοπό να δοθεί έμφαση στο γεγονός ότι η γνώση είναι το τελικό αποτέλεσμα μιας ανακάλυψης που σχετίζεται με επεξεργασία δεδομένων. Το KDD έγινε δημοφιλείς στους τομείς Τεχνητής Νοημοσύνης (AI - Artificial Intelligence) και machine-learning. Σύμφωνα με τους Fayyad, Piatetsky-Shapiro και Smyth στο [8], το KDD αναφέρεται στην γενικότερη διαδικασία ανακάλυψης χρήσιμης γνώσης από δεδομένα, ενώ το data mining αναφέρεται σε ένα συγκεκριμένο βήμα της διαδικασίας αυτής. Σύμφωνα με αυτούς, το data mining είναι η εφαρμογή συγκεκριμένων αλγορίθμων για εξαγωγή μοτίβων από τα δεδομένα. Τα επιπλέον βήματα της KDD διαδικασίας, τα οποία δεν υφίστανται στο data mining, αφορούν την προετοιμασία δεδομένων (data preparation), την επιλογή των δεδομένων (data selection), τον «καθαρισμό» των δεδομένων (data cleaning), την ενσωμάτωση κατάλληλης προηγούμενης γνώσης και την κατάλληλη ερμηνεία των αποτελεσμάτων. Όλα αυτά τα βήματα είναι, σύμφωνα με τους συγγραφείς, απαραίτητα, για να εξασφαλιστεί ότι από τα δεδομένα θα παραχθεί χρήσιμη γνώση. Το KDD έχει εξελιχθεί και συνεχίζει να εξελίσσεται, από την τομή ερευνητικών πεδίων όπως το machine learning, η αναγνώριση μοτίβων (pattern recognition), οι βάσεις δεδομένων, η στατιστική και άλλα. Στόχος, είναι η εξαγωγή υψηλού επιπέδου γνώσης από χαμηλού επιπέδου δεδομένα (datasets). Το data mining τμήμα του KDD βασίζεται σε γνωστές τεχνικές από τα πεδία machine learning, pattern recognition, και στατιστική. Στόχος του data mining βήματος της KDD διαδικασίας, είναι η εύρεση μοτίβων από δεδομένα. Τα βήματα της KDD διαδικασίας πιο αναλυτικά Η KDD διαδικασία είναι αλληλεπιδραστική και επαναληπτική, περιλαμβάνοντας πολλά βήματα, καθώς και πολλές αποφάσεις που πρέπει να παρθούν από τον χρήστη. Οι Fayyad, Piatetsky-Shapiro και Smyth στο [8], αναφέρουν τα βασικά της βήματα: 1. Κατανόηση του πεδίου της εφαρμογής και της σχετικής με αυτό προηγούμενης γνώσης, όπως επίσης και προσδιορισμός του στόχου της διαδικασίας από την οπτική πλευρά του πελάτη. 2. Επιλογή του data set προς επεξεργασία. Ιούνιος

19 3. «Καθαρισμός δεδομένων» και προεπεξεργασία: περιλαμβάνει την απομάκρυνση του «θορύβου», την συλλογή της κατάλληλης πληροφορίας για μοντελοποίηση του «θορύβου», την απόφαση για το πώς θα διαχειριστούν τυχών απόντα πεδία δεδομένων κ.α. 4. Μείωση όγκου δεδομένων και προβολή τους: εύρεση χρήσιμων χαρακτηριστικών για αναπαράσταση των δεδομένων, ανάλογα πάντα με τον σκοπό της διαδικασίας. Με μείωση των διαστάσεων και κατάλληλες μεθόδους μετασχηματισμού, ο αριθμός των μεταβλητών μπορεί να μειωθεί. 5. Ταύτιση των στόχων της KDD διαδικασίας (βήμα 1) με μια συγκεκριμένη data mining μέθοδο (summarization, classification, regression, clustering κ.α.). 6. Επιλογή των data mining αλγορίθμων και των μεθόδων επιλογής, για την αναζήτηση μοτίβων δεδομένων (data patterns). Κατά την διαδικασία αυτή αποφασίζεται το ποια μοντέλα και παράμετροι είναι κατάλληλα (για παράδειγμα τα μοντέλα ρητών δεδομένων είναι διαφορετικά από τα μοντέλα διανυσμάτων) και γίνεται αντιστοίχιση μιας συγκεκριμένης data mining μεθόδου, με τα γενικότερα κριτήρια της KDD διαδικασίας (για παράδειγμα ο τελικός χρήστης μπορεί να ενδιαφέρεται περισσότερο στην κατανόηση του ίδιου του μοντέλου, παρά των προγνωστικών του ικανοτήτων). 7. Data mining: Ψάξιμο για μοτίβα που παρουσιάζουν κάποιο ενδιαφέρον σε μια συγκεκριμένη μορφή αναπαράστασης ή σε ένα σύνολο τέτοιων αναπαραστάσεων, συμπεριλαμβανομένων των κανόνων ή δέντρων ταξινόμησης, της οπισθοχώρησης (regression) και του clustering. Ο χρήστης μπορεί να βοηθήσει σημαντικά την data mining μέθοδο, με το να εκτελέσει σωστά τα προηγούμενα βήματα. 8. Μετάφραση των εξορυγμένων μοτίβων, με πιθανόν επιστροφή σε κάποιο από τα βήματα 1 με 7 για περαιτέρω επεξεργασία. 9. Πράξεις πάνω στην γνώση που έχει ανακαλυφθεί είτε απ ευθείας, είτε με ενσωμάτωση της σε άλλο σύστημα ή και με απλή τεκμηρίωση και παρουσίασή της στους ενδιαφερόμενους. Η KDD διαδικασία μπορεί να περιλαμβάνει πολλές επαναλήψεις και βρόγχους μεταξύ οποιονδήποτε δύο βημάτων. Τα σημαντικότερα βήματα, φαίνονται στο σχήμα 1. Ιούνιος

20 Σχήμα 1. Τα σημαντικότερα βήματα της KDD διαδικασίας Η περισσότερη σχετική εργασία στην βιβλιογραφία έχει επικεντρωθεί στο βήμα 7, το data mining. Για περισσότερα όσον αφορά την KDD διαδικασία καθώς και τις data mining μεθόδους που χρησιμοποιούνται στην διαδικασία αυτή, ο αναγνώστης παραπέμπεται στο [8]. Ιούνιος

21 Κεφάλαιο 2. Market Basket Analysis & Association Rules 2.1. Market Basket Analysis Εισαγωγή Η τεχνική Market Basket Analysis βασίζεται στην θεωρία ότι αν κάποιος πελάτης αγοράσει κάποιο συγκεκριμένο προϊόν (ή σύνολο προϊόντων), τότε είναι πολύ πιθανό (ή αντίστοιχα ελάχιστα πιθανό) να αγοράσει και ένα άλλο προϊόν (ή σύνολο προϊόντων) [2]. Το σύνολο των προϊόντων που αγοράζει ένας πελάτης κατά την διάρκεια μιας συγκεκριμένης αγοράς του ονομάζεται itemset. Άρα, ένα itemset αποτελείται από κάποια προϊόντα. Η τεχνική market basket analysis έχει σαν κύριο στόχο την ανάλυση των δεδομένων που προκύπτουν από τις αγορές των πελατών, με σκοπό την ανακάλυψη συσχετίσεων μεταξύ των διαφόρων προϊόντων. Τυπικά, μια συσχέτιση μεταξύ δύο προϊόντων είναι της μορφής: IF { προϊόν Α } THEN { προϊόν Β } Η πιο πάνω συσχέτιση, δείχνει την σχέση μεταξύ των δύο προϊόντων. Φυσικά, μια συσχέτιση θα μπορούσε να περιλαμβάνει, αντί για μεμονωμένα προϊόντα, σύνολα προϊόντων. Μια τέτοια συσχέτιση θα μπορούσε να είναι η εξής: IF { γάλα, ψωμί } THEN { βούτυρο, δημητριακά } Με τέτοιες συσχετίσεις συνδέονται άμεσα στατιστικές μεταβλητές, οι οποίες ονομάζονται support και confidence. Οι συσχετίσεις μεταξύ των προϊόντων ονομάζονται και κανόνες συσχέτισης, όπου οι μεταβλητές support και confidence δίνουν στατιστική πληροφορία που αφορά τους κανόνες αυτούς. Στην επόμενη παράγραφο δίνουμε έναν πιο τυπικό ορισμό της διαδικασίας market basket analysis. Ορισμός Ο όρος Market Basket Analysis (MBA), ή ανάλυση καλαθιού αγορών, αφορά την ανάλυση διαφόρων υποσυνόλων αντικειμένων (προϊόντων), τα οποία επιλέχθηκαν μέσα από κάποιον μεγαλύτερο πληθυσμό αντικειμένων [9]. Ένα παράδειγμα κανόνα είναι το Α Β, όπου υποδηλώνει ότι: «εάν το αντικείμενο Α υπάρχει στο καλάθι Ιούνιος

22 αγορών (market basket), τότε υπάρχει και το αντικείμενο Β». Το Α ονομάζεται προηγηθέν αντικείμενο (antecedent item), ενώ το Β συνεπακόλουθο (consequent). Σε έναν κανόνα MBA, όπως τον Α Β, μπορεί να έχουμε ότι ενώ ο κανόνας είναι αληθείς (true), να ισχύει Α αληθές και Β μη αληθές, δηλαδή A AND NOT B. Έχοντας δηλαδή έναν κανόνα, μπορεί αυτός ενώ είναι αληθές, δηλαδή ενώ ισχύει, τα επιμέρους στοιχεία του να μην ισχύουν [9]. Αυτό συμβαίνει, επειδή οι κανόνες στο market basket analysis θεωρούνται να έχουν κάποιους βαθμούς συνέπειας άμεσα συσχετισμένους με αυτούς, Τέτοιοι είναι οι confidence και support στατιστικές. Το support κάποιου κανόνα Α Β ορίζεται σαν: Αν τα Α και Β ισχύουν μαζί για τουλάχιστον X% των καλαθιών αγορών, τότε το support του κανόνα είναι το X. Το confidence κάποιου κανόνα Α Β ορίζεται σαν: Από όλα τα καλάθια αγορών που περιέχουν το Α, αν τουλάχιστον X% περιέχουν επίσης το Β, τότε το confidence του κανόνα είναι X. Σαν καλάθι αγορών ονομάζουμε μια συναλλαγή (transaction) κάποιου πελάτη. Αν έχουμε για παράδειγμα μια υπεραγορά, τότε σαν καλάθι αγορών ονομάζουμε το σύνολο των προϊόντων που αγοράστηκαν από κάποιον πελάτη σε μια συγκεκριμένη συναλλαγή αυτού με το κατάστημα. Οι πιο πάνω κανόνες χρησιμοποιώντας τον όρο συναλλαγή αντί για καλάθι αγορών, θα γίνουν: Το support κάποιου κανόνα Α Β ορίζεται σαν: Αν τα Α και Β ισχύουν μαζί για τουλάχιστον X% των συναλλαγών, τότε το support του κανόνα είναι το X. Το confidence κάποιου κανόνα Α Β ορίζεται σαν: Από όλες τις συναλλαγές που περιέχουν το Α, αν τουλάχιστον X% περιέχουν επίσης το Β, τότε το confidence του κανόνα είναι X. Για σκοπούς marketing, το confidence διαβεβαιώνει ότι ο κανόνας ισχύει, δηλαδή είναι αληθείς, μέχρι κάποιο συγκεκριμένο σημείο, ή αλλιώς με κάποια συγκεκριμένη πιθανότητα. Χρησιμοποιώντας το confidence, μπορεί κάποιος να διαβεβαιώσει ότι κάποιος κανόνας ισχύει αρκετά συχνά, ώστε να παίξει σημαντικό ρόλο κατά την λήψη αποφάσεων. Για παράδειγμα, αν σε κάποια υπεραγορά κάποιος κανόνας ισχύει Ιούνιος

23 αρκετά συχνά ή με αρκετά μεγάλη πιθανότητα, τότε λόγω του κανόνα αυτού μπορεί να αποφασιστεί διαρρύθμιση των προϊόντων που εμφανίζονται σε αυτόν. Η χρήση του confidence από την άλλη, περιλαμβάνει και κάποιο ρίσκο. Αυτό συμβαίνει, επειδή όταν το συνεπακόλουθο αντικείμενο κάποιου κανόνα είναι δημοφιλές γενικότερα στις συναλλαγές, τότε το confidence του κανόνα μπορεί να είναι αρκετά μεγάλο, άσχετα με το αν τα δύο αντικείμενα (προηγηθέν και συνεπακόλουθο) δεν συσχετίζονται στην πραγματικότητα σε τόσο μεγάλο βαθμό. Βλέποντας το θέμα και διαισθητικά, από τον ορισμό του confidence, έχουμε ότι εάν ένας κανόνας Α Β έχει confidence για παράδειγμα 95, τότε σημαίνει ότι από όλες τις συναλλαγές που περιέχουν το Α, τουλάχιστον 95% περιέχουν επίσης το Β. Στην περίπτωση όμως που το Β είναι πολύ δημοφιλές προϊόν στις συναλλαγές γενικότερα, τότε μπορεί μεν να εμφανίζεται σε πολύ υψηλό ποσοστό (95%) στις ίδιες συναλλαγές με το Α, όμως στην πραγματικότητα δεν συσχετίζεται τόσο με το συγκεκριμένο προϊόν, όσο θα συσχετιζόταν αν το Β εμφανιζόταν κυρίως μόνο στις συναλλαγές που περιλαμβάνουν το Α (δηλαδή αν το Β δεν ήταν δημοφιλές). Το support παρέχει ένα μέτρο για το πόσο συχνά ένας κανόνας συμβαίνει (σε πόσες συναλλαγές είναι αυτός αληθείς), στο σύνολο όλων γενικότερα των συναλλαγών. Χρησιμοποιώντας το support, ένας αναλυτής μπορεί να συμπεράνει κατά πόσο αξίζει την προσοχή του κάποιος κανόνας Κανόνες συσχέτισης - Association Rules Οι κανόνες συσχέτισης, ή αλλιώς association rules, είναι κανόνες οι οποίοι εκφράζουν συσχετίσεις μεταξύ αντικειμένων. Πιο συχνά χρησιμοποιούνται σε συστήματα σημείων πώλησης προϊόντων, οπότε οι συσχετίσεις που εκφράζουν είναι μεταξύ των διαφόρων προϊόντων που αγοράζουν οι πελάτες. Οι κανόνες προκύπτουν με την διαδικασία εξόρυξης κανόνων συσχέτισης (association rule mining). Η εξόρυξη κανόνων συσχέτισης είναι μια πολύ διαδεδομένη διαδικασία, κατά την οποία γίνεται κατάλληλη ανάλυση των δεδομένων που είναι αποθηκευμένα σε βάσεις δεδομένων, για ανακάλυψη χρήσιμων συσχετίσεων μεταξύ προϊόντων, όπως για παράδειγμα η εύρεση προϊόντων τα οποία αγοράστηκαν μαζί. Οι κανόνες συσχέτισης χρησιμοποιούνται σε εφαρμογές Market Basket Analysis. Όπως είδαμε σε προηγούμενη παράγραφο, με το όρο Market Basket Analysis Ιούνιος

24 εννοούμε την αναγνώριση διαφόρων ευκαιριών για πώληση προϊόντων που σχετίζονται μαζί (cross selling opportunities). Για παράδειγμα: 1. Αναγνώριση ομάδων προϊόντων που αγοράζονται μαζί (product baskets) 2. Η πρόβλεψη άλλων προϊόντων που ενδεχομένως να μπορούν να αγοραστούν μαζί, δεδομένων των προϊόντων που έχουν είδη αγοραστεί μαζί. Δίνοντας πιο τυπικό ορισμό των κανόνων συσχέτισης, έχουμε: Α Β: Δεδομένης της αγοράς του προϊόντος Α, υπάρχει μεγάλη πιθανότητα να έχει αγοραστεί ή να υπάρχει μεγάλο ενδιαφέρον για το προϊόν Β. Το προϊόν Α ονομάζεται προηγηθέν, ενώ το Β συνεπακόλουθο. Οι Agrawal, Imielinski και Swami στο [1], χρησιμοποίησαν κανόνες συσχέτισης για την ανακάλυψη ομοιοτήτων μεταξύ προϊόντων σε μεγάλες βάσεις δεδομένων. Οι βάσεις δεδομένων αυτές περιλάμβαναν τεράστιους όγκους δεδομένων από συναλλαγές πελατών, σε διάφορα σημεία πώλησης προϊόντων όπως υπεραγορές (supermarkets). Για παράδειγμα, εάν ο κανόνας {κρεμμύδια, λαχανικά} {βοδινό} εξαγόταν από τα δεδομένα συναλλαγών πελατών σε μια υπεραγορά, αυτό θα σήμαινε ότι δεδομένης της αγοράς κρεμμυδιών και λαχανικών από κάποιον πελάτη, υπήρχε μεγάλη πιθανότητα να είχε αγοραστεί ή να υπήρχε μεγάλο ενδιαφέρον για βοδινό. Τέτοια πληροφορία μπορεί να χρησιμοποιηθεί σαν βάση για λήψη αποφάσεων που σχετίζονται με το marketing, όπως η τιμολόγηση και η τοποθέτηση των προϊόντων στους χώρους της υπεραγοράς. Στο [1], παρατίθενται κάποια χρήσιμα αποτελέσματα που μπορούν να προσφέρουν οι κανόνες συσχέτισης. Για παράδειγμα, έστω ο κανόνας συσχέτισης: «Το 90% των συναλλαγών που περιλαμβάνουν ψωμί και βούτυρο, περιλαμβάνουν και γάλα» Στον πιο πάνω κανόνα, το ψωμί και το βούτυρο είναι τα προηγηθέντα προϊόντα, ενώ το γάλα το συνεπακόλουθο προϊόν. Επίσης, το confidence του κανόνα είναι 90 και εκφράζει την δύναμη του κανόνα. Στην περίπτωση αυτή, εκφράζει το ποσοστό των συναλλαγών που περιλαμβάνουν γάλα, δεδομένου ότι περιλαμβάνουν ψωμί και βούτυρο. Πολλοί άλλοι κανόνες συσχέτισης μπορούν να προκύψουν που να αφορούν τα ποιό πάνω προϊόντα, οι οποίοι θα προσφέρουν πολύτιμη πληροφορία για τα προϊόντα αυτά: Ιούνιος

25 - Να βρούμε όλους τους κανόνες που έχουν το γάλα σαν συνεπακόλουθο προϊόν. Αποτέλεσμα: Βλέπουμε με ποια προϊόντα συσχετίζεται το γάλα. - Να βρούμε όλους τους κανόνες με το ψωμί σαν προηγηθέν προϊόν. Αποτέλεσμα: Βλέπουμε ποια προϊόντα θα επηρεαστούν αν σταματήσει η πώληση του ψωμιού στην υπεραγορά. (Στο παράδειγμα το γάλα και το βούτυρο) - Να βρούμε όλους τους κανόνες με το γάλα σαν συνεπακόλουθο και το ψωμί σαν προηγηθέν. Αποτέλεσμα: Βλέπουμε ποια προϊόντα πρέπει ή είναι καλό να πωλούνται μαζί με το ψωμί (π.χ. βούτυρο), με σκοπό την μεγαλύτερη πιθανότητα για πώληση γάλακτος. - Να βρούμε όλους τους κανόνες που σχετίζονται με προϊόντα που βρίσκονται στα ράφια Α και Β στην υπεραγορά. Αποτέλεσμα: Shelf Planning Σχεδιάζουμε ποια προϊόντα είναι κατάλληλα για να τοποθετηθούν γειτονικά στα ράφια της υπεραγοράς. Προϊόντα τα οποία σχετίζονται στενά, δηλαδή με κανόνες συσχέτισης με μεγάλο παράγοντα confidence, θα ήταν καλή τακτική να τοποθετηθούν σε γειτονικά ράφια. - Τέλος χρήσιμο είναι να βρούμε τους καλύτερους k κανόνες, που έχουν κάποιο προϊόν (π.χ. το γάλα) σαν συνεπακόλουθο προϊόν. Ο όρος καλύτερος κανόνας αναφέρεται στον κανόνα με το μεγαλύτερο confidence factor ή την μεγαλύτερη συχνότητα εμφάνισης. Αποτέλεσμα: Κάνουμε χρήση μόνο αυτών των κανόνων οι οποίοι είναι και οι πλέον κατάλληλοι για λήψη αποφάσεων, αφού οι κανόνες αυτοί είναι οι πιο «βάσιμοι» και χαρακτηρίζουν το μεγαλύτερο μέρος των συναλλαγών (εφόσον είναι οι πιο συχνά εμφανιζόμενοι). Από τα πιο πάνω, συμπεραίνουμε ότι οι κανόνες συσχέτισης μπορούν να προσφέρουν αξιοποιήσιμη πληροφορία που σχετίζεται με τα προϊόντα. Με χρήση της πληροφορίας αυτής, μπορεί να γίνει καλύτερη τιμολόγηση των προϊόντων, να αποφασιστούν ποια προϊόντα θα βγουν σε εκπτώσεις και προσφορές και ποια όχι, να μελετηθούν οι επιπτώσεις σε άλλα προϊόντα από τυχόν κατάργηση κάποιου προϊόντος, να αποφασιστεί η διαρρύθμιση των προϊόντων στα ράφια κ.α. Ιούνιος

26 Επιπλέον, εκτός από το market basket analysis, οι κανόνες συσχέτισης χρησιμοποιούνται και σε άλλες εφαρμογές, όπως το Web usage mining, intrusion detection και βιοπληροφορική (bioinformatics). Ιούνιος

27 Κεφάλαιο 3. Εντοπισμός θέσης χρήστη και M- commerce εφαρμογές 3.1. Εισαγωγή Στο κεφάλαιο αυτό αναφερόμαστε στο σύστημα εντοπισμού της θέσης του χρήστη, το οποίο υλοποιήθηκε στα πλαίσια πτυχιακής εργασίας [20] και που χρησιμοποιούμε στην παρούσα διπλωματική, με κάποιες τροποποιήσεις. Κρίνουμε αναγκαία την παρουσίαση αυτή, αφού η παρούσα διπλωματική χρησιμοποιεί τα αποτελέσματα του συστήματος για περαιτέρω ανάλυση. Το σύστημα είχε αρχικά σχεδιαστεί να εντοπίζει την θέση των χρηστών που ανίχνευε μέσα στην περιοχή κάλυψης του, χρησιμοποιώντας την Bluetooth τεχνολογία και στην συνέχεια να στέλνει στους χρήστες μηνύματα σχετικά με το κινητό εμπόριο (mobile-commerce ή m-commerce). Στο κεφάλαιο αυτό, μετά από μια σύντομη αναφορά στο m-commerce και τις μεθοδολογίες εντοπισμού της θέσης χρήστη (user positioning methods), περιγράφουμε το αρχικό σύστημα εντοπισμού, πριν αυτό τροποποιηθεί στα πλαίσια της παρούσας διπλωματικής M-commerce To m-commerce είχε αρχικά επινοηθεί για σκοπούς χρέωσης των χρηστών [13]. Οι χρήστες, χρησιμοποιώντας κάποιες εφαρμογές, χρέωναν είτε τον λογαριασμό των κινητών τους τηλεφώνων, είτε προπληρωμένα chips. Πλέον, m-commerce ονομάζουμε κάθε εμπορική συναλλαγή που περιλαμβάνει την χρήση κινητής συσκευής, όπως κινητά τηλέφωνα, PDAs και smartphones και που μπορεί να γίνει εν κινήσει. Ένας πιο τυπικός ορισμός είναι: «Mobile commerce ονομάζουμε κάθε συναλλαγή που περιλαμβάνει την μεταβίβαση ιδιοκτησίας ή δικαιωμάτων για την χρήση αγαθών και υπηρεσιών, η οποία έχει αρχίσει ή/και ολοκληρώθηκε με την χρήση κινητής πρόσβασης σε δίκτυα υπολογιστών από κινητές συσκευές». Η ανάπτυξη των ασύρματων τεχνολογιών και των κινητών δικτύων, έχει παίξει καταλυτικό ρόλο στην εμφάνιση του m-commerce, το οποίο παρέχει τα δικά του Ιούνιος

28 πλεονεκτήματα, σε αντίθεση με το παραδοσιακό e-commerce (ηλεκτρονικό εμπόριο) [18]. Πολλά μοναδικά χαρακτηριστικά του, όπως η ευκολότερη πρόσβαση πληροφορίας οποτεδήποτε και οπουδήποτε σε πραγματικό χρόνο, η ανεξάρτητη από την τοποθεσία του χρήστη επικοινωνία, και η ευκολότερη λήψη δεδομένων, προκάλεσαν την ευρεία αποδοχή των εφαρμογών και υπηρεσιών του. Τέτοιες υπηρεσίες είναι διαθέσιμες στο κοινό μέσω των ασύρματων τεχνολογιών. Σύμφωνα με παλιά έρευνα της εταιρία ερευνών αγοράς Strategy Analytics, η παγκόσμια αγορά για το κινητό εμπόριο αναμενόταν να φτάσει τα 200 δισεκατομμύρια δολάρια το 2004 [18]. Ο Burger στο [6] τονίζει ότι, ενώ οι Αμερικάνικες και Ευρωπαϊκές αγορές είναι πιο συνωστισμένες, κλειστές και με μεγαλύτερο ανταγωνισμό, το μέγεθος τους και η τεχνολογική τους υποδομή δείχνουν ότι θα αποτελέσουν πρόσφορο έδαφος για την ανάπτυξη του m-commerce. Ο David Chamberlain, κύριος αναλυτής ασύρματων τεχνολογιών της In-Stat's, ανέφερε στο E- Commerce Times [6], ότι είναι πιθανό να υπάρχουν 10 με 20 δισεκατομμύρια χρήστες του m-commerce στις ΗΠΑ, μέχρι το Όντως, τα τελευταία χρόνια υπάρχει μεγάλο ενδιαφέρων για διάφορες εφαρμογές που αφορούν το m-commerce. Ο Varshney [17] αναφέρει αρκετές σημαντικές κλάσεις του m-commerce, καθώς και παραδείγματα για κάθε κλάση. Οι πιο σημαντικές είναι μεταξύ άλλων: διαφήμιση μέσω κινητού (mobile advertising), Mobile Financial Applications (εφαρμογές στις οποίες η κινητή συσκευή γίνεται ένα ισχυρό οικονομικό μέσο), Product Locating and Shopping (εφαρμογές οι οποίες βοηθούν στην εύρεση της θέσης προϊόντων και υπηρεσιών) και Proactive Service Management (εφαρμογές που προσπαθούν να παρέχουν στους χρήστες πληροφορία για υπηρεσίες που μπορεί να χρειαστούν). Σχετικά με εφαρμογές διαφήμισης μέσω κινητού, ο Varshney τονίζει δύο σημαντικά χαρακτηριστικά τους: 1) οι διαφημίσεις που στέλνονται στους χρήστες μπορούν να είναι σχετικές με την θέση των χρηστών και να τους πληροφορούν για διάφορες προσφορές και 2) τα μηνύματα μπορούν να στέλνονται σε όσους χρήστες εντοπιστούν σε κάποια περιοχή. Τα χαρακτηριστικά αυτά αφορούν το παρόν σύστημα εντοπισμού θέσης. Σύμφωνα με τα όσα αναφέρθηκαν, η ραγδαία ανάπτυξη των εφαρμογών m- commerce τα τελευταία χρόνια, παράλληλα με την προοπτική για μελλοντική άνοδο των επενδύσεων στον τομέα αυτόν, δείχνουν ότι οι εφαρμογές m-commerce πρόκειται να συνεχίσουν να παρουσιάζουν άνθηση. Στόχος του συστήματος εντοπισμού της θέσης του χρήστη, είναι η χρήση του σε σενάρια m-commerce, με την αποστολή διαφημιστικών και ενημερωτικών μηνυμάτων στους χρήστες. Σε μια υποτιθέμενη χρήση του συστήματος σε μια υπεραγορά, οι χρήστες θα μπορούν να λαμβάνουν διαφημιστικά μηνύματα για διάφορα προϊόντα που τους ενδιαφέρουν, Ιούνιος

«Αφιερωμένο στους γονείς μου Νικογιάννη και Ευγενία, στα αδέρφια μου Διονύση και Μπέσσυ αλλά και σε όσους ήταν μαζί μου αυτά τα χρόνια...

«Αφιερωμένο στους γονείς μου Νικογιάννη και Ευγενία, στα αδέρφια μου Διονύση και Μπέσσυ αλλά και σε όσους ήταν μαζί μου αυτά τα χρόνια... ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ Διδακτορική Διατριβή Εφαρμογή Τεχνικών Data Mining σε Συστήματα Ηλεκτρονικού Εμπορίου Κουρής Ν. Γιάννης ΠΑΤΡΑ

Διαβάστε περισσότερα

Τμήμα Εφαρμοσμένης Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης Συστήματα Υπολογιστών ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Τμήμα Εφαρμοσμένης Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης Συστήματα Υπολογιστών ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Τμήμα Εφαρμοσμένης Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών Ειδίκευσης Συστήματα Υπολογιστών ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Δημιουργία μοντέλου γνώσης από βάση δεδομένων βλαβών ΑDSL με την χρήση εργαλείων DATA

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Εφαρμογή τεχνικών Data Mining σε δεδομένα κυκλοφορίας οδικού δικτύου

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Εφαρμογή τεχνικών Data Mining σε δεδομένα κυκλοφορίας οδικού δικτύου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Εφαρμογή τεχνικών Data Mining σε δεδομένα κυκλοφορίας οδικού δικτύου ΦΟΙΤΗΤΗΣ : ΓΑΚΟΠΟΥΛΟΣ ΕΥΘΥΜΙΟΣ Α.Μ.: 1010 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΕΥΑΓΓΕΛΙΔΗΣ ΓΕΩΡΓΙΟΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΗ ΤΕΧΝΙΚΩΝ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΣΕ ΟΙΚΟΝΟΜΙΚΑ Ε ΟΜΕΝΑ

ΕΦΑΡΜΟΓΗ ΤΕΧΝΙΚΩΝ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΣΕ ΟΙΚΟΝΟΜΙΚΑ Ε ΟΜΕΝΑ ΕΦΑΡΜΟΓΗ ΤΕΧΝΙΚΩΝ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΣΕ ΟΙΚΟΝΟΜΙΚΑ Ε ΟΜΕΝΑ Μεταπτυχιακή Εργασία ΓΕΩΡΓΙΟΣ Ν. ΡΑΥΤΟΠΟΥΛΟΣ Επιβλέπων: ΚΑΘΗΓΗΤΗΣ ΠΑΝΑΓΙΩΤΗΣ ΠΙΝΤΕΛΑΣ Ιανουάριος 2012 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Διαβάστε περισσότερα

Η ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ (Data Mining) ΣΤΗ ΛΟΓΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΚΤΙΚΗ

Η ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ (Data Mining) ΣΤΗ ΛΟΓΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΚΤΙΚΗ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΔΙΟΙΚΗΣΗ» Η ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ (Data Mining) ΣΤΗ ΛΟΓΙΣΤΙΚΗ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ-ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ-ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ-ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Μεταπτυχιακό πρόγραμμα Τμήμα: Τεχνολογίες Διαχείρισης Πληροφορίας και Παγκόσμιου Ιστού Κατηγοριοποίηση

Διαβάστε περισσότερα

«ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER»

«ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER» Τ.Ε.Ι ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ & ΘΡΑΚΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ ΤΟΝ ΠΙΣΤΩΤΙΚΟ ΚΙΝΔΥΝΟ ΜΕ ΤΟ ΛΟΓΙΣΜΙΚΟ ΕΞΟΡΥΞΗΣ STATISTICA DATA MINER»

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ CRM - ΕΦΑΡΜΟΓΗ ΣΕ ΕΠΙΧΕΙΡΗΣΗ ΛΙΑΝΙΚΟΥ ΕΜΠΟΡΙΟΥ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ CRM - ΕΦΑΡΜΟΓΗ ΣΕ ΕΠΙΧΕΙΡΗΣΗ ΛΙΑΝΙΚΟΥ ΕΜΠΟΡΙΟΥ Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ CRM - ΕΦΑΡΜΟΓΗ ΣΕ ΕΠΙΧΕΙΡΗΣΗ ΛΙΑΝΙΚΟΥ ΕΜΠΟΡΙΟΥ Ελένη Ρεμόντη ΜΑΡΤΙΟΣ 2012 ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ Αθανάσιος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ Κατασκευή Ιστοσελίδας Ηλεκτρονικού Καταστήματος με χρήση

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Η ΔΙΑΧΕΙΡΙΣΗ ΣΧΕΣΕΩΝ ΠΕΛΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ. ΣΥΣΤΗΜΑΤΩΝ e-crm» Σχολή Διοίκησης και Οικονομίας

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Η ΔΙΑΧΕΙΡΙΣΗ ΣΧΕΣΕΩΝ ΠΕΛΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ. ΣΥΣΤΗΜΑΤΩΝ e-crm» Σχολή Διοίκησης και Οικονομίας ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Η ΔΙΑΧΕΙΡΙΣΗ ΣΧΕΣΕΩΝ ΠΕΛΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ e-crm» Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων Σταμουλακάτος Ηρακλής Επιβλέπων Καθηγητής : Ρομπογιαννάκης

Διαβάστε περισσότερα

ΜΕΛΕΤΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΙΣ ΑΝΑΓΚΕΣ ΤΩΝ ΛΟΓΙΣΤΗΡΙΩΝ ΤΩΝ ΤΡΑΠΕΖΩΝ

ΜΕΛΕΤΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΙΣ ΑΝΑΓΚΕΣ ΤΩΝ ΛΟΓΙΣΤΗΡΙΩΝ ΤΩΝ ΤΡΑΠΕΖΩΝ Τ.Ε.Ι. ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΤΗΛΕΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΜΕΛΕΤΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΓΙΑ ΤΙΣ ΑΝΑΓΚΕΣ ΤΩΝ ΛΟΓΙΣΤΗΡΙΩΝ ΤΩΝ ΤΡΑΠΕΖΩΝ Του σπουδαστή ΓΡΙΒΑ ΑΡΓΥΡΗ Επιβλέπων

Διαβάστε περισσότερα

ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ

ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΑΤΡΙΒΗ Ανάλυση Οικονομικών Δεδομένων με Χρήση Τεχνικών Εξόρυξης Μεταπτυχιακός φοιτητής: Ζαβουδάκης

Διαβάστε περισσότερα

Τεχνικές Δυναμικής Απόδοσης Τιμής από Πωλητές που δρουν σε Ηλεκτρονικές Αγορές

Τεχνικές Δυναμικής Απόδοσης Τιμής από Πωλητές που δρουν σε Ηλεκτρονικές Αγορές ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΗ ΤΩΝ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΩΝ

Διαβάστε περισσότερα

Κατασκευή μοντέλων Data Mining με Γενικευμένα Νευρωνικά Δίκτυα Παλινδρόμησης GRNN σε βάσεις δεδομένων Oracle

Κατασκευή μοντέλων Data Mining με Γενικευμένα Νευρωνικά Δίκτυα Παλινδρόμησης GRNN σε βάσεις δεδομένων Oracle ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ Τµήµα Πληροφορικής και Επικοινωνιών ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Κατασκευή μοντέλων Data Mining με Γενικευμένα Νευρωνικά Δίκτυα Παλινδρόμησης GRNN

Διαβάστε περισσότερα

Predicting the Choice of Contraceptive Method using Classification

Predicting the Choice of Contraceptive Method using Classification ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΣΣΑΛΟΝΙΚΗ Predicting the Choice of Contraceptive Method using Classification ΠΑΠΑΔΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Νικόλαος Σαμαράς ΕΞΕΤΑΣΤΗΣ:

Διαβάστε περισσότερα

Data Mining & CRM. «Τεχνικές Εξόρυξης δεδομένων στα συστήματα Customer Relationship Management (CRM)»

Data Mining & CRM. «Τεχνικές Εξόρυξης δεδομένων στα συστήματα Customer Relationship Management (CRM)» «Τεχνικές Εξόρυξης δεδομένων στα συστήματα Customer Relationship Management (CRM)» 1 Πίνακας Περιεχομένων: 1. Εισαγωγή... 4 1.1 Πρόλογος... 4 1.2 Στόχοι της εργασίας... 4 1.3 Δομή της εργασίας... 5 2.Το

Διαβάστε περισσότερα

«Τεχνικές Οπτικοποίησης Δεδομένων από Οικονομικές Ειδήσεις και Χρηματιστηριακές Αναλύσεις»

«Τεχνικές Οπτικοποίησης Δεδομένων από Οικονομικές Ειδήσεις και Χρηματιστηριακές Αναλύσεις» -ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ-ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ «Τεχνικές Οπτικοποίησης Δεδομένων από Οικονομικές Ειδήσεις και Χρηματιστηριακές Αναλύσεις» Διπλωματική

Διαβάστε περισσότερα

ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΛΑΤΕΙΑΚΩΝ ΣΧΕΣΕΩΝ

ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΛΑΤΕΙΑΚΩΝ ΣΧΕΣΕΩΝ Α.Τ.Ε.Ι. ΠΕΙΡΑΙΑ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ (Σ.Δ.Ο.) ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΛΑΤΕΙΑΚΩΝ ΣΧΕΣΕΩΝ CUSTOMER RELATIONSHIP MANAGEMENT SYSTEMS (C.R.M.) ΠΡΙΜΙΚΥΡΗ ΦΛΩΡΑ Α.Μ.

Διαβάστε περισσότερα

ΕΠΕΞΕΡΓΑΣΙΑ ΣΕΙΣΜΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ

ΕΠΕΞΕΡΓΑΣΙΑ ΣΕΙΣΜΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ Τμήμα Εφαρμοσμένης Πληροφορικής Πανεπιστήμιο Μακεδονίας Θεσσαλονίκη ΕΠΕΞΕΡΓΑΣΙΑ ΣΕΙΣΜΟΛΟΓΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ ΙΩΑΝΝΗΣ ΑΠΟΣΤΟΛΟΥ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΑΤΡΙΒΗ Επιβλέπων Καθηγητής: Νικόλαος

Διαβάστε περισσότερα

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΤΕΙ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΤΕΙ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΤΕΙ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ Θέμα ΟΝΟΜΑΤΕΠΩΝΥΜΟ: LUBJANA XHEJA 14574 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΡΙΑ: ΑΛΙΝΑ ΧΥΖ ΑΘΗΝΑ 2014 Ευχαριστίες Με την πτυχιακή μου εργασία ο κύκλος

Διαβάστε περισσότερα

ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ ΚΑΙ ΕΠΙΧΕΙΡΗΣΕΙΣ

ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ ΚΑΙ ΕΠΙΧΕΙΡΗΣΕΙΣ Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ ΚΑΙ ΕΠΙΧΕΙΡΗΣΕΙΣ Βαρσάμης Θωμάς 2010 ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ ΠΑΠΠΑΣ ΔΗΜΟΣΘΕΝΗΣ Σελίδα 1 από 113 Εκττονηθείσα πτυχιακή

Διαβάστε περισσότερα

Υποστήριξη Λειτουργιών Διαχείρισης Αποθηκών και Αποθέματος με Χρήση του Συστήματος Διαχείρισης Επιχειρησιακών Πόρων Microsoft Navision

Υποστήριξη Λειτουργιών Διαχείρισης Αποθηκών και Αποθέματος με Χρήση του Συστήματος Διαχείρισης Επιχειρησιακών Πόρων Microsoft Navision Υποστήριξη Λειτουργιών Διαχείρισης Αποθηκών και Αποθέματος με Χρήση του Συστήματος Διαχείρισης Επιχειρησιακών Πόρων Microsoft Navision Η Διπλωματική Εργασία παρουσιάστηκε ενώπιον του Διδακτικού Προσωπικού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ. Η Αντιμετώπιση της Πληροφοριακής Υπερφόρτωσης ενός Οργανισμού με χρήση Ευφυών Πρακτόρων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ. Η Αντιμετώπιση της Πληροφοριακής Υπερφόρτωσης ενός Οργανισμού με χρήση Ευφυών Πρακτόρων ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ Η Αντιμετώπιση της Πληροφοριακής Υπερφόρτωσης ενός Οργανισμού με χρήση Ευφυών Πρακτόρων Συγγραφέας: Ιωάννης Κόρδαρης Επιβλέπων Καθηγητής:

Διαβάστε περισσότερα

Πως μπορούν να χρησιμοποιηθούν ιστορικά δεδομένα για την κατασκευή

Πως μπορούν να χρησιμοποιηθούν ιστορικά δεδομένα για την κατασκευή ΜΕΡΟΣ Α ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 1 Εξόρυξη Δεδομένων 22 Η επανάσταση του ΚΡΙΟΥ 1.1 Εισαγωγή Το Data Mining αποτελεί μια νέα ερευνητική περιοχή, ραγδαία εξελισσόμενη, που είναι η τομή πολλών θεωριών και επιστημών,

Διαβάστε περισσότερα

ΔΗΜΙΟΥΡΓΙΑ ΣΥΓΚΡΙΤΙΚΟΥ ΠΛΕΟΝΕΚΤΗΜΑΤΟΣ ΜΕΣΩ ΤΗΣ ΕΙΣΑΓΩΓΗΣ ΤΕΧΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΟΥ ΕΜΠΟΡΙΟΥ ΣΕ ΜΙΑ ΕΠΙΧΕΙΡΗΣΗ

ΔΗΜΙΟΥΡΓΙΑ ΣΥΓΚΡΙΤΙΚΟΥ ΠΛΕΟΝΕΚΤΗΜΑΤΟΣ ΜΕΣΩ ΤΗΣ ΕΙΣΑΓΩΓΗΣ ΤΕΧΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΟΥ ΕΜΠΟΡΙΟΥ ΣΕ ΜΙΑ ΕΠΙΧΕΙΡΗΣΗ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ φδφσ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΔΗΜΙΟΥΡΓΙΑ ΣΥΓΚΡΙΤΙΚΟΥ ΠΛΕΟΝΕΚΤΗΜΑΤΟΣ ΜΕΣΩ ΤΗΣ ΕΙΣΑΓΩΓΗΣ ΤΕΧΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΟΥ ΕΜΠΟΡΙΟΥ ΣΕ ΜΙΑ ΕΠΙΧΕΙΡΗΣΗ ΤΟΥ ΦΟΙΤΗΤΗ: ΚΟΥΤΣΟΥ ΣΩΤΗΡΙΟΥ

Διαβάστε περισσότερα

«ΜΟΝΑΔΑ ΚΑΙΝΟΤΟΜΙΑΣ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑΣ (ΜΚΕ) ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ»

«ΜΟΝΑΔΑ ΚΑΙΝΟΤΟΜΙΑΣ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑΣ (ΜΚΕ) ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ» «ΜΟΝΑΔΑ ΚΑΙΝΟΤΟΜΙΑΣ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑΣ (ΜΚΕ) ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕΔΟΝΙΑΣ» Επιχειρησιακό Πρόγραμμα «Εκπαίδευση και Δια Βίου Μάθηση» (Ε.Π.Ε.Δ.Β.Μ.) 2007-2013, Υπουργείου Παιδείας Δια Βίου Μάθησης και Θρησκευμάτων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΚΕΦΑΛΑΙΟ 1... 5 1.1 Εισαγωγή στο Marketing... 6. 1.2 E Marketing... 7

ΠΕΡΙΕΧΟΜΕΝΑ. ΚΕΦΑΛΑΙΟ 1... 5 1.1 Εισαγωγή στο Marketing... 6. 1.2 E Marketing... 7 ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1... 5 1.1 Εισαγωγή στο Marketing... 6 1.1.1 Παραδοσιακό Marketing...6 1.1.1.1 Από το μονόλογο στο διάλογο...7 1.1.1.2 Καθετί παλιό γίνεται ξανά καινούργιο...7 1.2 E Marketing... 7

Διαβάστε περισσότερα

Πανεπιστήμιο Πατρών, Πολυτεχνική Σχολή Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής. Διπλωματική Εργασία. Ηλεκτρονικό Εμπόριο &

Πανεπιστήμιο Πατρών, Πολυτεχνική Σχολή Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής. Διπλωματική Εργασία. Ηλεκτρονικό Εμπόριο & Πανεπιστήμιο Πατρών, Πολυτεχνική Σχολή Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής Διπλωματική Εργασία Ηλεκτρονικό Εμπόριο & Σημασιολογικός Ιστός : Υλοποίηση του Ηλεκτρονικού Καταστήματος YourBooks

Διαβάστε περισσότερα

ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΙΣ ΕΠΙΧΕΙΡΗΣΕΙΣ ΕΣΤΙΑΣΗΣ ΡΕΡΑΚΗ ΑΓΓΕΛΙΚΗ

ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΙΣ ΕΠΙΧΕΙΡΗΣΕΙΣ ΕΣΤΙΑΣΗΣ ΡΕΡΑΚΗ ΑΓΓΕΛΙΚΗ Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΙΣ ΕΠΙΧΕΙΡΗΣΕΙΣ ΕΣΤΙΑΣΗΣ ΡΕΡΑΚΗ ΑΓΓΕΛΙΚΗ ΙΟΥΝΙΟΣ 2011 ΕΠΟΠΤΗΣ ΚΑΘΗΓΗΤΗΣ Εκπονηθείσα πτυχιακή

Διαβάστε περισσότερα

Πανεπιστήμιο Αιγαίου Σχολή Θετικών Επιστημών Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων

Πανεπιστήμιο Αιγαίου Σχολή Θετικών Επιστημών Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων Πανεπιστήμιο Αιγαίου Σχολή Θετικών Επιστημών Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων Θέμα: Ανάλυση Χώρο-χρονικών Περιβαλλοντολογικών Δεδομένων Ακαδημαϊκό έτος: 2010-2011 Σπουδαστής

Διαβάστε περισσότερα