Μεταπτυχιακή Εργασία. Αλγόριθμοι Εξαγωγής Κανόνων Συσχέτισης και Εφαρμογές

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Μεταπτυχιακή Εργασία. Αλγόριθμοι Εξαγωγής Κανόνων Συσχέτισης και Εφαρμογές"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ Μεταπτυχιακό Πρόγραμμα: Επιστήμης και Τεχνολογίας Υπολογιστών Μεταπτυχιακή Εργασία Αλγόριθμοι Εξαγωγής Κανόνων Συσχέτισης και Εφαρμογές Ιωάννα Χ. Μουσουρούλη Επιβλέπων Χρήστος Μακρής, Επίκουρος Καθηγητής Ιούνιος 2008

2

3

4

5 Τριμελής Εξεταστική Επιτροπή Χρήστος Μακρής, Επίκουρος Καθηγητής Τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής (Επιβλέπων) Αθανάσιος Τσακαλίδης, Καθηγητής Τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής Ιωάννης Χατζηλυγερούδης, Επίκουρος Καθηγητής Τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών & Πληροφορικής

6

7 Ευχαριστίες Θα ήθελα να ευχαριστήσω τους ανθρώπους που με βοήθησαν και με στήριξαν σε όλη τη διάρκεια εκπόνησης της μεταπτυχιακής μου εργασίας. Πρώτα από όλους ευχαριστώ τον επίκουρο καθηγητή κ. Χρήστο Μακρή, επιβλέποντα της εργασίας μου, για τη βοήθεια του, την καθοδήγηση και την πολύτιμη υποστήριξή του. Τον καθηγητή κ. Αθανάσιο Τσακαλίδη, που μου έδωσε την ευκαιρία να γίνω μέλος του Εργαστηρίου του και το οποίο αποτέλεσε το εφαλτήριο για την επαγγελματική μου εξέλιξη. Τον επίκουρο καθηγητή κ. Ιωάννη Χατζηλυγερούδη, μέλος της τριμελούς εξεταστικής επιτροπής. Την Πηνελόπη Μαρκέλλου, για την εποικοδομητική συνεργασία που είχαμε όλα αυτά τα χρόνια, τη βοήθεια της αλλά και τη φιλία της. Τον αναπληρωτή καθηγητή κ. Σπύρο Συρμακέση, ο οποίος στάθηκε η αφορμή να ασχοληθώ με τα συγκεκριμένα θέματα που αναλύονται σε αυτή την εργασία. Τους δικούς μου ανθρώπους και όλους τους φίλους που μου στάθηκαν και με ενθάρρυναν. I

8 Περίληψη μεταπτυχιακής εργασίας Η παρούσα μεταπτυχιακή εργασία έχει στόχο τη μελέτη προβλημάτων «κρυμμένης γνώσης» από συστήματα και εφαρμογές ηλεκτρονικού εμπορίου (e-commerce) και ηλεκτρονικής μάθησης (e-learning) με κύριο στόχο τη βελτίωση της ποιότητας και της απόδοσης των παρεχόμενων υπηρεσιών προς τους τελικούς χρήστες. Στο πρώτο κεφάλαιο παρουσιάζεται ένα σενάριο για σημασιολογικά εξατομικευμένο e- learning. Ο προτεινόμενος αλγόριθμος βασίζεται σε μια οντολογία (ontology) η οποία βοηθά στη δόμηση και στη διαχείριση του περιεχομένου που σχετίζεται με μια δεδομένη σειρά μαθημάτων, ένα μάθημα ή ένα θεματικό. Η διαδικασία χωρίζεται σε δύο στάδια: στο offline στάδιο το οποίο περιλαμβάνει τις ενέργειες προετοιμασίας των δεδομένων, δημιουργίας της οντολογίας και εξόρυξης από δεδομένα χρήσης (usage mining) και στο online στάδιο το οποίο περιλαμβάνει την εξαγωγή των εξατομικευμένων συστάσεων. Το προτεινόμενο σύστημα σε πρώτη φάση βρίσκει ένα αρχικό σύνολο συστάσεων βασισμένο στην οντολογία του πεδίου και στη συνέχεια χρησιμοποιεί τα frequent itemsets (συχνά εμφανιζόμενα σύνολα στοιχείων) για να το εμπλουτίσει, λαμβάνοντας υπόψη την πλοήγηση άλλων παρόμοιων χρηστών (similar users). Με τον τρόπο αυτό, μειώνεται ο χρόνος που απαιτείται για την ανάλυση όλων των frequent itemsets και των κανόνων συσχέτισης. Η ανάλυση εστιάζεται μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της ενεργούς συνόδου (current session) του χρήστη και των συστάσεων της οντολογίας. Αν και η εξατομίκευση απαιτεί αρκετά βήματα επεξεργασίας και ανάλυσης, στη συγκεκριμένη προσέγγιση το εμπόδιο αυτό αποφεύγεται με την εκτέλεση σημαντικού μέρους της διαδικασίας offline. Στο δεύτερο κεφάλαιο μελετάται το πρόβλημα της παραγωγής προτάσεων σε μια εφαρμογή e-commerce. Η προτεινόμενη υβριδική προσέγγιση στοχεύει στην παραγωγή αποτελεσματικών συστάσεων για τους πελάτες ενός online καταστήματος που ενοικιάζει κινηματογραφικές ταινίες. Η γνώση για τους πελάτες και τα προϊόντα προκύπτει από τα δεδομένα χρήσης και τη δομή της οντολογίας σε συνδυασμό με τις εκτιμήσεις-βαθμολογίες των πελατών για τις ταινίες καθώς και την εφαρμογή τεχνικών ταιριάσματος «όμοιων» πελατών. Όταν ένα ή περισσότερα κριτήρια ταιριάσματος ικανοποιούνται, τότε άλλες ταινίες μπορούν να προσδιοριστούν σύμφωνα με το οντολογικό σχήμα που έχουν παρόμοια χαρακτηριστικά με αυτές που ο πελάτης έχει ήδη νοικιάσει. Στην περίπτωση ενός νέου πελάτη όπου το ιστορικό του είναι κενό, αναλύονται πληροφορίες από την αίτηση εγγραφής του ώστε να ταξινομηθεί σε μια συγκεκριμένη κλάση πελατών και να παραχθούν προτάσεις με βάση το οντολογικό σχήμα. Αυτή η ενοποίηση παρέχει πρόσθετη γνώση για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή επιτυχημένων συστάσεων. Ακόμη και στην περίπτωση του «cold-start problem» όπου δεν είναι διαθέσιμη αρχική πληροφορία για τη συμπεριφορά του πελάτη, η προσέγγιση προβαίνει σε σχετικές συστάσεις. Στο τρίτο κεφάλαιο παρουσιάζεται μία νέα προσέγγιση στο πρόβλημα της δημιουργίας συστάσεων. Οι προηγούμενες προσεγγίσεις δεν λαμβάνουν υπόψη τους τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα, είτε πρόκειται για e-learning είτε πρόκειται για e-commerce δεδομένα. Στο κεφάλαιο αυτό προτείνεται μία τεχνική η οποία λαμβάνει υπόψη τη σειρά με την οποία ο χρήστης προσπελαύνει τα δεδομένα (ordering). Πιο συγκεκριμένα μελετάται η τεχνική αυτή σε e-commerce συστήματα και καλάθια αγορών. Παρουσιάζεται και αναλύεται η υλοποίηση του προτεινόμενου αλγορίθμου. Επιπλέον γίνεται αξιολόγηση των αποτελεσμάτων του αλγορίθμου σε testing input data τα οποία και δείχνουν την ποιότητα των παραγόμενων συστάσεων. II

9 Περιεχόμενα Ευχαριστίες...i Περίληψη μεταπτυχιακής εργασίας...ii Περιεχόμενα...iii Λίστα Εικόνων... v Λίστα Πινάκων... v Εισαγωγή... 1 Δημοσιεύσεις μεταπτυχιακής εργασίας... 7 E-LEARNING DOMAIN Εισαγωγή Semantic Web Mining και E-Learning Προτεινόμενο σενάριο εξατομίκευσης Συμπεράσματα MOVIE DOMAIN Εισαγωγή Background Movies Domain TV Domain Research Papers και Books Domain Other Domains Τα στάδια επεξεργασίας των συστημάτων δημιουργίας συστάσεων (RSs) Επιλογή των δεδομένων Προεπεξεργασία των δεδομένων Ανάλυση των δεδομένων Παραγωγή των συστάσεων, αξιολόγηση και αναπαράστασή τους Μειωνεκτήματα της μεθόδου Ενωποίηση των οντολογικών και των Usage Mining δεδομένων E-shop Ontological Schema Κατηγοριοποίηση των πελατών Association Rule Mining στα Click-streams Παραγωγή των συστάσεων Ανοιχτά θέματα Συμπεράσματα ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΧΡΟΝΙΚΑ ΔΙΑΤΕΤΑΓΜEΝA ΔΕΔΟΜΕΝΑ Εισαγωγή Η προσέγγιση matrix based itemset Το Boolean Weighting Scheme Το Distance Based Weighting Scheme Proposal Phase Πρακτικές αναζήτησης βασισμένες σε τεχνικές ανάκτησης πληροφορίας Τεχνική ανεστραμμένου αρχείου σε επίπεδο αντικειμένου Proposal Phase Θεώρηση των itemsets ως Authorities και Hubs Κατασκευή του γράφου Special Weighting Factor Proposal Phase Υλοποίηση Η Matrix Based τεχνική Η Hits Based τεχνική III

10 3.4.3 Πειράματα Αποτελέσματα Συμπεράσματα - Ανοιχτά Θέματα Αναφορές Γλωσσάρι όρων... 85

11 Λίστα Εικόνων Εικόνα 1: Προτεινόμενο σενάριο για την παραγωγή συστάσεων σε ένα σύστημα διαδικτυακή μάθησης...14 Εικόνα 2: Παράδειγμα οντολογίας για ένα μάθημα «Web Mining». Η web mining ταξονομία έχει υιοθετηθεί από το (Cooley et al., 1997; Chakrabarti et al., 1999) Εικόνα 3: Τα στάδια λειτουργίας των RSs...35 Εικόνα 4: Προτεινόμενη προσέγγιση δημιουργίας συστάσεων...40 Εικόνα 5: Τμήμα της οντολογίας του ηλεκτρονικού καταστήματος (εκτεταμένη έκδοση από Mobasger et al. (2004))...42 Εικόνα 6: Το πιλοτικό ηλεκτρονικό κατάστημα ταινιών...48 Εικόνα 7: Ο πίνακας γειτνίασης με χρήση του Boolean Scheme...56 Εικόνα 8: Ο πίνακας γειτνίασης με χρήση του Boolean Scheme...58 Εικόνα 9: Μετατροπή του transaction [A,B,T,I,F] στον αντίστοιχο γράφο...62 Εικόνα 10: Γραφική απεικόνηση των αποτελεσμάτων του Πίνακα Εικόνα 11: Γραφική απεικόνιση των αποτελεσμάτων του Πίνακα Λίστα Πινάκων Πίνακας 1: Ο προτεινόμενος αλγόριθμος για την παραγωγή συστάσεων στους χρήστης...18 Πίνακας 2: Σύγκριση των διάφορων RSs που αναλύθηκαν...32 Πίνακας 3: Ειδικά χαρακτηριστικά για τη σύγκριση των RSs...33 Πίνακας 4: Τμήμα από προφίλ χρήστη...43 Πίνακας 5: Ένα στιγμιότυπο από τη βάση δεδομένων...43 Πίνακας 6: Ο αλγόριθμος που χρησιμοποιήθηκε για τη δημιουργία συστάσεων...47 Πίνακας 7: Αποτελέσματα πειραμάτων για τις matrix based και HITS based προσεγγίσεις..70 Πίνακας 8: Πειραματικά αποτελέσματα της matrix based τεχνικής για τους δύο τύπους Distance & Boolean Scema V

12

13 ΕΙΣΑΓΩΓΗ Εισαγωγή Η ευρεία χρήση και η ταχύτατη εξάπλωσης του Παγκόσμιου Ιστού Πληροφοριών (World Wide Web ή Web) είχε σαν αποτέλεσμα τη μετατροπή του σε μια τεράστια αποθήκη πληροφοριών με δισεκατομμύρια σελίδες και περισσότερους από 800 εκατομμύρια χρήστες παγκοσμίως (Internet World Stats, 2006). Σήμερα θεωρείται ένα από τα πιο σημαντικά μέσα συλλογής, διαμοίρασης και διάδοσης πληροφοριών και υπηρεσιών. Όμως, ο όγκος των διαθέσιμων πληροφοριών προκαλεί αρκετά προβλήματα που σχετίζονται με τη συνεχώς αυξανόμενη δυσκολία αναζήτησης, εύρεσης, οργάνωσης, πρόσβασης και συντήρησης της αιτούμενης πληροφορίας από τους χρήστες. Το πρόβλημα αυτό έχει σημαντικές επιπτώσεις στον τρόπο που σχεδιάζουμε και υλοποιούμε εφαρμογές στο Web τμήμα του οποίου αποτελούν τα συστήματα ηλεκτρονικής μάθησης (e-learning) και ηλεκτρονικού εμπορίου (ecommerce). Μια λύση στο παραπάνω πρόβλημα έρχεται από την επιστημονική περιοχή του Data Knowledge Mining (Εξόρυξη Γνώσης από Δεδομένα) ή απλώς Data Mining (Εξόρυξη Δεδομένων) (Hand et al., 2001). Πράγματι η εξόρυξη γνώσης από μεγάλες αποθήκες δεδομένων έχει εξελιχθεί σε ένα από τα βασικότερα ερευνητικά ζητήματα. Μέχρι πρόσφατα η εξόρυξη γνώσης αφορούσε αποκλειστικά δομημένα (structured) δεδομένα δηλαδή δεδομένα που είναι αποθηκευμένα σε βάσεις δεδομένων (databases). Τα τελευταία χρόνια το ενδιαφέρον στράφηκε και σε μη δομημένα δεδομένα (semi-structured και unstructured) π.χ. κείμενα, εικόνες, ιστοσελίδες (web pages), κλπ. Αυτό οδήγησε στη δημιουργία νέων κλάδων όπως το Text Mining (Εξόρυξη Γνώσης από Κείμενα) και το Web Mining (Εξόρυξη Γνώσης από Δεδομένα του Web). Η εμφάνιση του Semantic Web (Σημασιολογικός Παγκόσμιος Ιστός Πληροφοριών) στοχεύει στην ενσωμάτωση ενός ακόμα επιπέδου ευφυΐας (intelligence) στο περιβάλλον των διαδικτυακών εφαρμογών. Η ικανότητα του Semantic Web να προσθέτει νόημα στις πληροφορίες, αποθηκευμένο με τέτοιο τρόπο που να μπορεί να αναζητηθεί και να υποβληθεί σε επεξεργασία, παρέχει πολλές ευκαιρίες επέκτασης για τις web-based εφαρμογές (Anderson & Whitelock, 2004). Ο συνδυασμός του με το Web Mining έχει δημιουργήσει μια νέα και γρήγορα-αναδυόμενη ερευνητική περιοχή που είναι γνωστή ως Semantic Web Mining. Η ιδέα πίσω από τη χρήση του στη δημιουργία εξατομικευμένων (personalized) web εμπειριών είναι να βελτιωθεί το Web Mining με την εκμετάλλευση των νέων σημασιολογικών δομών (Markellou et al., 2004). Με το συνδυασμό και την ολοκλήρωση τεχνικών και τεχνολογιών εξόρυξης γνώσης, οι e- εφαρμογές θα βελτιώσουν την ποιότητα των παρεχόμενων υπηρεσιών τους προς τους τελικούς χρήστες. Συγκεκριμένα, για να το επιτύχουν αυτό μελετούν τη συμπεριφορά των χρηστών και προσπαθούν να εξάγουν χρήσιμα συμπεράσματα από αυτή. Η απαίτηση για πρόβλεψη των αναγκών των χρηστών με στόχο την ευκολία χρήσης αλλά και τη διατήρηση των χρηστών ενός δικτυακού τόπου μπορεί να ικανοποιηθεί με την εφαρμογή της εξατομίκευσης ή personalization. Ορίζουμε σαν web personalization οποιαδήποτε ενέργεια που προσαρμόζει τις πληροφορίες ή τις υπηρεσίες που παρέχονται από ένα δικτυακό τόπο στις ανάγκες ενός συγκεκριμένου χρήστη ή ενός συνόλου χρηστών, χρησιμοποιώντας τη γνώση που πηγάζει από την ανάλυση της συμπεριφοράς 1

14 ΕΙΣΑΓΩΓΗ πλοήγησης των χρηστών και από τα ενδιαφέροντά τους, σε συνδυασμό με τη δομή και το περιεχόμενο του δικτυακού τόπου. Στόχος είναι η παροχή στους χρήστες των πληροφοριών που θέλουν ή χρειάζονται χωρίς να απαιτεί από αυτούς να τις ζητήσουν με ρητό τρόπο. Η διαδικασία της εξατομίκευσης περιλαμβάνει την κατηγοριοποίηση και την προεπεξεργασία των δεδομένων, την εξαγωγή συσχετίσεων μεταξύ των δεδομένων και τον καθορισμό των ενεργειών που θα προταθούν. Με στόχο την αντιμετώπιση των παραπάνω προβλημάτων, στα πλαίσια της παρούσας εργασίας παρουσιάζονται τεχνικές και αλγόριθμοι που βελτιώνουν τις παρεχόμενες υπηρεσίες προς τον τελικό χρήστη. Αρχικά μελετάται το πρόβλημα της εξόρυξης γνώσης από μια εφαρμογή e-learning με στόχο την παραγωγή εξατομίκευσης. Ο όρος e-learning αφορά όλες τις μορφές εκπαίδευσης που βασίζονται στο Web και χρησιμοποιεί υπολογιστές και δίκτυα υπολογιστών για τη δημιουργία, την παράδοση, τη διαχείριση και την υποστήριξη online σειρών μαθημάτων. Τελευταία, χάρη στην προαναφερθείσα έκρηξη του Web, η έρευνα στο e-learning έχει κερδίσει όλο και περισσότερη προσοχή από τις επιστημονικές κοινότητες. Σημαντικοί εκπαιδευτικοί και εμπορικοί οργανισμοί καταδεικνύουν ένα συνεχές ενδιαφέρον για την περιοχή, κίνηση που αποτελεί μια πολύ ισχυρή κατευθυντήρια δύναμη εκφρασμένη μέσα από πολυάριθμη έρευνα και εμπορικές προσπάθειες. Η μεγάλη ποικιλία των διαθέσιμων συστημάτων και εφαρμογών e-learning αποτελεί άλλωστε μια ισχυρή ένδειξη της ωριμότητας στην περιοχή (Urdan & Weggen, 2000), (Wentling et al., 2000), (Fry, 2001). Εντούτοις, στην πλειοψηφία των e-learning συστημάτων του παρελθόντος, οι σειρές των μαθημάτων και το εκπαιδευτικό υλικό δεν ήταν αρκετά δυναμικά, παρέχοντας ένα μάλλον περιορισμένο σύνολο χαρακτηριστικών, με πολύπλοκη δομή και δυσκολίες στην πλοήγηση με αποτέλεσμα να μη μπορούν να ανταποκριθούν αποδοτικά στις ανάγκες και στις απαιτήσεις των χρηστών, οδηγώντας σε «φτωχές» εκπαιδευτικές εμπειρίες. Γενικά, το εκπαιδευτικό υλικό με ενσωματωμένους υπερσυνδέσμους (hyperlinks) επιτρέπει στους εκπαιδευόμενους να ακολουθήσουν οποιοδήποτε μονοπάτι πλοήγησης επιθυμούν και να μη χρησιμοποιήσουν απαραιτήτως τη δομή που έχουν καθορίσει οι σχεδιαστές των δικτυακών τόπων ή οι δημιουργοί του περιεχομένου (οι οποίοι έχουν ένα ορισμένο σχέδιο πλοήγησης στο μυαλό τους). Αυτή η ελευθερία μπορεί να αποδειχτεί αρνητικός παράγοντας, δεδομένου ότι σε πολλές περιπτώσεις οι εκπαιδευόμενοι δεν έχουν την απαραίτητη ωριμότητα και ικανότητα να ακολουθήσουν μια αποτελεσματική πορεία και συχνά να οδηγούνται σε θεματικά που είναι είτε πάρα πολύ δύσκολα, είτε πάρα πολύ εύκολα, ή ακόμα και άσχετα με τις προσωπικές τους εκπαιδευτικές ανάγκες (Markellos et al., 2004). Μια λύση στο πρόβλημα αυτό αποτελεί η ενσωμάτωση προσαρμοστικών χαρακτηριστικών (adaptive features) που επιτρέπουν την παροχή εξατομικευμένης μάθησης (personalized learning) (Brusilovsky, 2001). Αυτά τα συστήματα είναι η απάντηση στην παραδοσιακή «one-size-fits-all» προσέγγιση που παρέχει το ίδιο στατικό υλικό εκπαίδευσης σε όλους τους χρήστες, χωρίς να λαμβάνει υπόψη τις ανάγκες και τις προτιμήσεις, τις εμπειρίες και τις γνώσεις τους, οι οποίες μπορεί να ποικίλουν εντυπωσιακά (De Bra et al., 1999). Με τον τρόπο αυτό οι εφαρμογές e- learning παρέχουν υψηλής ποιότητας περιεχόμενο, αποδοτική δομή, εύκολη πλοήγηση καθώς επίσης και πλήρη υποστήριξη για τις διαφορετικές εργασίες όλων των προφίλ χρηστών που συμμετέχουν σε ένα τυπικό σενάριο εκπαίδευσης από απόσταση (Mödritscher et al., 2004). Συγκεκριμένα, ανάλογα με το γνωστικό υπόβαθρο του εκπαιδευομένου, τις γνώσεις και τις αδυναμίες του, το εκπαιδευτικό στυλ που προτιμάει, την πρόοδο που έχει σημειώσει μέχρι τώρα, το σύστημα αποφασίζει τι εκπαιδευτικό υλικό θα του παρουσιάσει και με ποιον τρόπο. Πιθανές παράμετροι αποτελούν τα 2

15 3 ΕΙΣΑΓΩΓΗ διαφορετικά εκπαιδευτικά μονοπάτια, οι διαφορετικοί τρόποι παρουσίασης του ίδιου περιεχομένου (π.χ. με ή χωρίς ήχο) ή η προσφορά ενός διαφορετικού συνόλου λειτουργιών που το περιβάλλον διεπαφής (user interface) του συστήματος εκπαίδευσης μπορεί να παρέχει για να μειώσει την πολυπλοκότητα (Dietinger, 2003). Στην προσέγγιση που παρουσιάζεται στο πρώτο κεφάλαιο της εργασίας για την υποστήριξη του εξατομικευμένου e-learning, η δομή και η σχέση των δεδομένων και των πληροφοριών παίζουν ουσιαστικό ρόλο. Ο προτεινόμενος αλγόριθμος βασίζεται σε μια οντολογία (ontology) η οποία βοηθά στη δόμηση και στη διαχείριση του περιεχομένου που σχετίζεται με μια δεδομένη σειρά μαθημάτων, ένα μάθημα ή ένα θεματικό (Markellou et al., 2005a), (Markellou et al., 2006). Ειδικότερα, το πλαίσιο εξατομίκευσης λαμβάνει υπόψη τα προφίλ των χρηστών και την οντολογία του θεματικού, ενώ η διαδικασία χωρίζεται σε δύο στάδια: στις offline ενέργειες προετοιμασίας των δεδομένων, δημιουργίας της οντολογίας και εξόρυξης από δεδομένα χρήσης (usage mining) και στην online παροχή εξατομίκευσης. Το σύστημα βρίσκει σε πρώτη φάση ένα αρχικό σύνολο συστάσεων βασισμένο στην οντολογία του πεδίου και στη συνέχεια χρησιμοποιεί τα frequent itemsets (συχνά εμφανιζόμενα σύνολα στοιχείων) για να το εμπλουτίσει, λαμβάνοντας υπόψη την πλοήγηση άλλων παρόμοιων χρηστών (similar users). Με τον τρόπο αυτό, μειώνουμε το χρόνο που απαιτείται για την ανάλυση όλων των frequent itemsets και των κανόνων συσχέτισης. Εστιάζουμε μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της ενεργούς συνόδου (current session) του χρήστη και των συστάσεων της οντολογίας. Η χρονική μείωση προκύπτει λόγω του γεγονότος ότι τα frequent itemsets φιλτράρονται με το σύνολο των συστάσεων της οντολογίας οδηγώντας σε ένα μικρότερο χώρο αναζήτησης. Επιπλέον, αυτή η προσέγγιση ανακουφίζει και το πρόβλημα των μεγάλων χρόνων απόκρισης, το οποίο μπορεί στη συνέχεια να οδηγήσει στην εγκατάλειψη του e-learning συστήματος. Αν και η εξατομίκευση απαιτεί αρκετά βήματα επεξεργασίας και ανάλυσης, το εμπόδιο αυτό αποφεύγεται με την εκτέλεση σημαντικού μέρους της διαδικασίας offline. Στο δεύτερο κεφάλαιο μελετάται το πρόβλημα της παραγωγής προτάσεων σε μια εφαρμογή e-εμπορίου. Τα συστήματα συστάσεων (recommendations systems ή RSs) αποτελούν ίσως την πιο δημοφιλή μορφή εξατομίκευσης και τείνουν να μετατραπούν στις μέρες μας σε σημαντικά επιχειρησιακά εργαλεία (Μαρκέλλου, 2003). Αρχικά, εμφανίστηκαν στα μέσα της δεκαετίας του 90 και χρησιμοποιούνταν από λίγα web sites. Σήμερα δεν νοούνται εφαρμογές e-εμπορίου που να μην ενσωματώνουν τεχνολογίες RSs προκειμένου να βοηθήσουν τους πελάτες στις αγορές τους π.χ. Amazon.com, το CDNow.com, Yahoo.com, ebay.com, κλπ. Με αυτό τον τρόπο, τα e- shops (ηλεκτρονικά καταστήματα) μπορούν να βελτιώσουν την απόδοσή τους καλύπτοντας τις ανάγκες και τις προτιμήσεις κάθε πελάτη ξεχωριστά, να αυξήσουν την ικανοποίησή τους, να προωθήσουν το e-loyalty και να καθιερώσουν ένα-προς-ένα σχέσεις (Markellou et al., 2005c). Γενικά, τα RSs μπορούν να ταξινομηθούν σε τρεις βασικές κατηγορίες: content based filtering (φιλτράρισμα με βάση το περιεχόμενο), collaborative filtering (συνεργατικό φιλτράρισμα) και hybrid approaches (υβριδικές προσεγγίσεις). Το content based filtering λαμβάνει υπόψη του τις παραμέτρους χρήστη με τις πληροφορίες των προϊόντων (μεταδεδομένα, λέξεις κλειδιά, κλπ.) ενώ το collaborative filtering (CF) την «ομοιότητα» των χρηστών προκειμένου να παράγουν συστάσεις. Οι δύο αυτές μέθοδοι μπορούν να συνδυαστούν σε υβριδικές προσεγγίσεις. Συγκεκριμένα, ένα RS σύστημα εκμεταλλεύεται τις απόψεις των χρηστών ή/και των κοινοτήτων χρηστών προκειμένου να

16 ΕΙΣΑΓΩΓΗ υποστηρίξει τον πελάτη να προσδιορίσει τις πληροφορίες ή τα προϊόντα για τα οποία ενδιαφέρεται και είναι κοντά στις ανάγκες και τις προτιμήσεις του. Οι συστάσεις μπορούν να παρουσιαστούν με πολλές μορφές π.χ. εξατομικευμένες προσφορές, τιμές, προϊόντα ή υπηρεσίες, προσθήκη ή παράλειψη θεματικών ενοτήτων ή παραγράφων, ταξινόμηση, κρύψιμο, εμφάνιση, προσθήκη, παράληψη ή έμφαση συνδέσμων, προαιρετικές εξηγήσεις ή αναλυτικές πληροφορίες, κλπ. (Μαρκέλλου, 2005). Η προτεινόμενη υβριδική προσέγγιση (Markellou et al., 2005b) στοχεύει στην παραγωγή αποτελεσματικών συστάσεων για τους πελάτες ενός online καταστήματος που νοικιάζει κινηματογραφικές ταινίες. Η γνώση για τους πελάτες και τα προϊόντα προκύπτει από δεδομένα χρήσης (usage data) και τη δομή της οντολογίας (ontology structure) σε συνδυασμό με τις εκτιμήσεις-βαθμολογίες (ratings) των πελατών για τις ταινίες καθώς και με την εφαρμογή τεχνικών ταιριάσματος (matching) «όμοιων» (similar) πελατών. Αρχικά, το σχήμα της οντολογίας αποτυπώνει το πεδίο του e-shop με τον προσδιορισμό όλων των εννοιών του, των σχέσεων μεταξύ τους και άλλων ιδιοτήτων, όρων ή κανονισμών. Το πιλοτικό e-shop αποτελείται από μια συλλογή ιστοσελίδων που περιέχουν πληροφορίες για τις ταινίες (τίτλος, κατηγορία, στούντιο, ηθοποιός, σκηνοθέτης, παραγωγός, βραβεία, έτος, διάρκεια, κοινό, περίληψη, κλπ.). Τα αρχικά στοιχεία ανακτήθηκαν από τη βάση δεδομένων Internet Movie Database ( και στη συνέχεια οργανώθηκαν στο οντολογικό σχήμα προκειμένου να αποτελέσουν ένα πλούσιο σύνολο δεδομένων (superset) το οποίο χρησιμοποιήθηκε στη διαδικασία ανακάλυψης γνώσης (knowledge discovery process). Συγκεκριμένα, αποτέλεσε την είσοδο στη φάση εξόρυξης γνώσης ώστε να συνδυαστούν και να μετασχηματιστούν τα υπονοούμενα/ρητά δεδομένα (κλάση χρηστών, ιστορικό, προφίλ, δομή και περιεχόμενο e-shop) σε νέες μορφές. Το RS λαμβάνει επίσης υπόψη τις εκτιμήσεις-βαθμολογίες των χρηστών για τις ταινίες σε μια κλίμακα από 1 έως 10, όπου 1 σημαίνει μια πολύ κακή ταινία και 10 μια πολύ καλή και παράγει ως έξοδο μια λίστα πιθανών προτάσεων για κάθε χρήστη ξεχωριστά. Παράλληλα η οντολογία δημιουργεί συνδέσεις μεταξύ των ταινιών σύμφωνα με τα χαρακτηριστικά τους (attributes). Χρησιμοποιώντας το ιστορικό των συναλλαγών (transactions history file) του συγκεκριμένου πελάτη, οι προτιμήσεις του μπορούν να προβλεφτούν. Για παράδειγμα, μπορεί να βρεθεί εάν σε ένα πελάτη αρέσει ή όχι μια ταινία μια συγκεκριμένης κατηγορίας, ενός συγκεκριμένου σκηνοθέτη, ενός συγκεκριμένου ηθοποιού ή συνδυασμών άλλων χαρακτηριστικών. Όταν ένα ή περισσότερα κριτήρια ταιριάσματος ικανοποιούνται, τότε άλλες ταινίες μπορούν να προσδιοριστούν σύμφωνα με το οντολογικό σχήμα που έχουν παρόμοια χαρακτηριστικά με αυτές που ο πελάτης έχει ήδη ενοικιάσει. Στην περίπτωση ενός νέου πελάτη όπου το ιστορικό του είναι κενό, αναλύονται οι πληροφορίες από την αίτηση εγγραφής (registration form) του ώστε να ταξινομηθεί σε μια συγκεκριμένη κλάση πελατών (user class), ενώ οι προτάσεις βασίζονται στο οντολογικό σχήμα. Αυτή η ολοκλήρωση παρέχει πρόσθετη γνώση για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή πιο επιτυχημένων συστάσεων. Ακόμη και στην περίπτωση του «cold-start problem» όπου δεν είναι διαθέσιμη αρχική πληροφορία για τη συμπεριφορά του πελάτη, η προσέγγιση μπορεί να προβεί σε λογικές και σχετικές συστάσεις. Τα πειραματικά αποτελέσματα έδειξαν ότι ο συνδυασμός τεχνικών από τις περιοχές του Web Mining και του Semantic Web και η ενσωμάτωσή τους σε ένα υβριδικό RS μπορεί να οδηγήσει σε ποιοτικότερες και πιο επιτυχημένες συστάσεις. Τέλος, στο τρίτο κεφάλαιο της συγκεκριμένης εργασίας αναλύονται δύο νέες τεχνικές παραγωγής συστάσεων που εφαρμόζονται στην περιοχή του e-commerce. Οι παραδοσιακοί αλγόριθμοι και οι διάφορες προσεγγίσεις των κανόνων συσχέτισης 4

17 ΕΙΣΑΓΩΓΗ βασίζονται στην απλοϊκή υπόθεση ότι κάθε σύνολο αντικειμένων (itemset) μέσα σε μία συναλλαγή (transaction) επηρεάζει το ίδιο όλα τα υπόλοιπα itemsets μέσα στο ίδιο transaction. Δηλαδή, τα αντικείμενα μπορεί να εμφανίζονται μαζί σε διάφορα transactions αλλά αυτό δε σημαίνει ότι όλα επηρεάζουν το ένα το άλλο κατά τον ίδιο βαθμό. Δηλαδή, μια ενέργεια που συμβαίνει στο μέλλον (δηλαδή, μετά από μία άλλη) δεν μπορεί να επηρεάσει μία ενέργεια που συνέβη στο παρελθόν. Το σενάριο αυτό παρατηρείται ιδιαίτερα σε on-line καταστήματα όπου οι αγορές γίνονται σε αλυσίδα, δηλαδή ο χρήστης αγοράζει ένα αντικείμενο τη φορά χωρίς να ακολουθεί μία προκαθορισμένη λίστα. Άρα, κάθε αντικείμενο μέσα στο transaction επηρεάζει όλα τα υπόλοιπα αντικείμενα μέσα στο ίδιο transaction. Οι παραδοσιακοί αλγόριθμοι, μέχρι τώρα, δεν διατηρούσαν τη σειρά με την οποία ο χρήστης επέλεξε τα αντικείμενα που αγόρασε, αλλά τα ταξινομούσαν με διάφορους τρόπους έτσι ώστε να εξυπηρετείται ο αποδοτικότερος υπολογισμός των συστάσεων. Μία ακόμη παράλειψη των παραδοσιακών αλγορίθμων είναι ότι όλα τα αντικείμενα έχουν μόνο θετική επίδραση μεταξύ τους, δηλαδή η αγορά ενός αντικειμένου μπορεί μόνο θετικά να επηρεάσει την αγορά ενός άλλου αντικειμένου. Όμως στην πράξη τα αντικείμενα δεν σχετίζονται μόνο θετικά αλλά και αρνητικά μεταξύ τους, δηλαδή η αγορά ενός αντικειμένου μπορεί να οδηγήσει στην έξοδο ενός αντικειμένου από το καλάθι αγορών του χρήστη. Συνεπώς, χωρίς να σκεφτόμαστε την τελική κατάληξη των αντικειμένων μέσα σε ένα transaction, η απομάκρυνση ενός αντικειμένου επηρεάζεται από τα αντικείμενα που ήταν μέσα στο transaction τη στιγμή της απομάκρυνσης. Επιπρόσθετα, ένα αντικείμενο που έχει βγει από το transaction δεν επηρεάζει την επιλογή των υπόλοιπων αντικειμένων που εισέρχονται στο transaction είτε εξέρχονται από αυτό. Όλες οι ενέργειες του χρήστη στα αντικείμενα επηρεάζονται μόνο από τα αντικείμενα που βρίσκονται μέσα στο καλάθι αγορών τη στιγμή που έγινε η συγκεκριμένη ενέργεια (είτε επιλέχθηκε ένα αντικείμενο είτε αφαιρέθηκε). Κάθε αντικείμενο παίζει ένα συγκεκριμένο ρόλο μέσα σε κάθε transaction και αυτός ο ρόλος είναι που πρέπει να λαμβάνεται υπόψη από το σύστημα το συστάσεων. Στο κεφάλαιο αυτό αναλύεται μία νέα προσέγγιση (Matrix Based Itemset) η οποία μιμείται τη λειτουργία ενός on-line συστήματος συνεργατικού φιλτραρίσματος, το οποίο καταφέρνει επιπλέον να λάβει υπόψη του την ακριβή σειρά των αντικειμένων μέσα στο transaction καθώς και τις αφαιρέσεις αυτών. Ο ακρογωνιαίος λίθος αυτής της προσέγγισης είναι το weighting scheme που χρησιμοποιείται και το οποίο αποθηκεύει την πληροφορία της διάταξης των αντικειμένων στο transaction. Περιγράφονται αναλυτικά δύο τρόποι δημιουργίας του weighting scheme. Πρόκειται για δύο διαφορετικές τεχνικές ανάθεσης των βαρών συσχέτισης μεταξύ των αντικειμένων: το Boolean Weighting Scheme, στο οποίο τα βάρη είναι Boolean τιμές, και το Distance Weighting Scheme στο οποίο τα βάρη εξαρτώνται απο την απόσταση των αντικειμένων μέσα στο transaction. Επιπλέον παρουσιάζεται μία άλλη προσέγγιση για τη δημιουργία συστάσεων, η οποία βασίζεται στον αλγόριθμο HITS, οποίος μπορεί να διαιρεθεί σε τρεις διαφορετικές διαδικασίες. Στην προσέγγιση αυτή θεωρείται ότι το πρώτο βήμα, το οποίο αφορά στη δημιουργία ενός υπογράφου από οντότητες σχετικές με το θέμα ενδιαφέροντος, ολοκληρώθηκε σε προηγούμενη φάση χρησιμοποιώντας μία διαδικασία μαύρου κουτιού, π.χ. ένα ερώτημα σε μία μηχανή αναζήτησης στον Παγκόσμιο Ιστό. Συνεπώς, ο υπογράφος που προκύπτει αποτελείται από αντικείμενα και όχι από transactions. Σε αναλογία με τον Παγκόσμιο Ιστό, τα αντικείμενα είναι οι διάφοροι όροι 5

18 ΕΙΣΑΓΩΓΗ μέσα σε μία ιστοσελίδα και τα transactions είναι οι ιστοσελίδες που αποτελούνται από όρους. Άρα, στον κλασσικό HITS κάποιος θα έθετε ένα ερώτημα για ένα συγκεκριμένο θέμα και κάποιες ιστοσελίδες θα επιστρέφονταν. Όμως, στη συγκεκριμένη προσέγγιση τα transactions δεν είναι διασυνδεδεμένα μεταξύ τους με υπερσυνδέσμους όπως συμβαίνει στον Παγκόσμιο Ιστό μεταξύ των ιστοσελίδων. Άρα, θα ήταν αδύνατο αν προσπαθούσαμε να κατασκευάσουμε ένα γράφο με τα transactions. Παρόλο αυτά, περιγράφεται ένας τρόπος κατασκευής του γράφου καθώς και ο ρόλος των αντικειμένων σε αυτόν ο οποίος είναι ριζικά διαφορετικός. Για παράδειγμα στη συγκεκριμένη προσέγγιση είναι πρακτικά αδύνατο να βρεθούν δύο όμοια αντικείμενα από μία κατηγορία στο ίδιο transaction (π.χ. συνδεδεμένα μεταξύ τους). 6

19 ΔΗΜΟΣΙΕΥΣΕΙΣ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ Δημοσιεύσεις μεταπτυχιακής εργασίας Κεφάλαια σε Βιβλία [1] Konstantinos Markellos, Penelope Markellou, Aristotelis Mertis, Ioanna Mousourouli, Angeliki Panayiotaki, Athanasios Tsakalidis, book chapter entitled «Hybrid Recommendation Systems: A Case Study on the Movies Domain», in the book «Social Information Retrieval Systems: Emerging Technologies and Applications for Searching the Web Effectively», Dion H. Goh & Schubert Foo (Eds.), Idea Group Publishing Inc., Hershey, USA, Διεθνή Επιστημονικά Περιοδικά [1] Penelope Markellou, Ioanna Mousourouli, Sirmakessis Spiros, Athanasios Tsakalidis, «Semantic Web Mining for E-Learning Personalization», International Journal of Knowledge and Learning (IJKL), Published by Inderscience Publishers, [2] Andreas Aresti, Penelope Markellou, Ioanna Mousourouli, Spiros Sirmakessis, Athanasios Tsakalidis, «A Movie Shop Recommendation Model Based on Web Usage and Ontological Data», Journal of Electronic Commerce in Organizations (JECO), an Official Publication of the Information Resources Management Association since 2003, Mehdi Khosrow-Pour (Editor-in-chief), Idea Group Publishing Inc., Hershey, USA, Vol. 5, No. 3, pp , July/September 2007 Διεθνή Επιστημονικά Συνέδρια [1] Markellou, P., Mousourouli, I., Sirmakessis, S., & Tsakalidis, A. (2005). Personalized E-commerce Recommendations. Proceedings of the IEEE International Conference on e-business Engineering (ICEBE 2005), Beijing, China, October. [2] Markellos, K., Markellou, P., Mousourouli, I., Sirmakessis, S., & Tsakalidis, A. (2005). Semantic Web Usage Mining for E-commerce Personalization. Proceedings of the 4th International Conference New Horizons in Industry, Business and Education (NHIBE 05), Corfu, Greece, August. [3] Markellou, P., Mousourouli, I., Sirmakessis, S., & Tsakalidis, A. (2005). Using Semantic Web Mining Technologies for Personalized e-learning Experiences. Proceedings of the 4th IASTED International Conference on Web-Based Education (WBE-2005), Web Based Teaching and Learning Technologies, Grindelward, Switzerland, February 2005,

20 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN Κεφάλαιο 1 E-LEARNING DOMAIN 1.1 Εισαγωγή Στις μέρες μας ο Παγκόσμιος Ιστός (World Wide Web) μεγαλώνει ταχύτατα με αποτέλεσμα να μετατρέπεται σε μία τεράστια αποθήκη δεδομένων, με διάφορες ιστοσελίδες και πάνω από 800 εκατομμύρια χρήστες παγκοσμίως (Internet World Stats, 2006). Δίκαια λοιπόν θεωρείται ως το πιο σημαντικό μέσο συλλογής και διανομής πληροφοριών και υπηρεσιών. Από την άλλη πλευρά όμως, η αύξηση του όγκου των πληροφοριών προκαλεί πολλά προβλήματα τα οποία σχετίζονται με τη δυσκολίας εύρεσης, οργάνωσης, πρόσβασης και διατήρησης των απαιτούμενων δεδομένων από το χρήστη. Όλα αυτά επηρεάζουν τον τρόπο σχεδιασμού, ανάπτυξης και υλοποίησης των διαδικτυακών εφαρμογών και τα συστήματα ηλεκτρονικής μάθησης (e-learning) δεν αποτελούν εξαίρεση. Εκτός αυτού η ηλεκτρονική εκπαίδευση είναι μία από τις πιο γρήγορα αναπτυσσόμενες περιοχές του πεδίου των δικτυακών εφαρμογών. Η ηλεκτρονική εκπαίδευση αντιπροσωπεύει όλες τις μορφές εκπαίδευσης που βασίζονται στον Παγκόσμιο Ιστό. Χρησιμοποιεί υπολογιστές και δίκτυα υπολογιστών για να κατασκευάσει, να παραδώσει, να διαχειριστεί και να υποστηρίξει online μαθήματα εκπαίδευσης. Συγκεκριμένα εξαιτίας της προαναφερθείσας εκρηκτικής ανάπτυξης του Παγκόσμιου Ιστού, η έρευνα στο πεδίο της ηλεκτρονικής εκπαίδευσης έχει κερδίσει περισσότερη προσοχή. Εκπαιδευτικοί και εμπορικοί οργανισμοί δείχνουν συνεχές ενδιαφέρον στην περιοχή αυτή, το οποίο δίνει ώθηση σε πολλές ερευνητικές και εμπορικές προσπάθειες που έχουν γίνει τα τελευταία χρόνια. Η ποικιλία των διαθέσιμων συστημάτων ηλεκτρονικής μάθησης και εφαρμογών είναι μία αναμφισβήτητη ένδειξη της ωριμότητας στην περιοχή (Urban & Weggen, 2000; Wenlting et al., 2000; Fry, 2001). Παρόλα αυτά, τα μαθήματα και το εκπαιδευτικό υλικό στην πλειοψηφία των παλαιότερων συστημάτων ηλεκτρονικής μάθησης δεν ήταν αρκετά δυναμικά, αλλά παρείχαν ένα σχετικά περιορισμένο και προκαθορισμένο σύνολο ή παρουσίαζαν μία πολύπλοκη δομή. Συνεπώς, δεν μπορούσαν να ανταποκριθούν αποδοτικά στις ανάγκες και στις ικανότητες των μαθητών. Γενικά, το διασυνδεδεμένο υλικό των μαθημάτων επιτρέπει στους μαθητευόμενους να ακολουθήσουν οποιοδήποτε μονοπάτι πλοήγησης επιλέξουν και όχι αναγκαστικά να χρησιμοποιήσουν την καθορισμένη δομή από τους σχεδιαστές του ιστότοπου ή τους δημιουργούς του περιεχομένου (οι οποίοι έχουν στο μυαλό τους μία συγκεκριμένη δομή των σχηματομορφών). Η ελευθερία αυτή στις κινήσεις μπορεί να αποκαλύψει έναν παράγοντα παρεμπόδισης, αφού στις περισσότερες περιπτώσεις οι μαθητευόμενοι δεν έχουν την απαραίτητη ωριμότητα και τις ικανότητες για να επιλέξουν ένα 8

21 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN αποδοτικό μονοπάτι. Είναι συχνή η περίπτωση κατά την οποία πλοηγούνται μεταξύ θεμάτων τα οποία είναι είτε πολύ δύσκολα, είτε πολύ εύκολα, ή απλώς άσχετα με τις προσωπικές τους μαθησιακές ανάγκες (Markellos et al., 2004a). Μια απάντηση στο πρόβλημα αυτό, η οποία αποτελεί επίσης μία πρόκληση για τα συστήματα μάθησης μέσω του Παγκόσμιου Ιστού, είναι η βελτίωσή τους ενσωματώνοντας σε αυτά προσαρμοστικά χαρακτηριστικά, που να επιτρέπουν τη διάθεση εξατομικευμένης μάθησης (Brusilovsky, 2001). Τέτοια συστήματα αποτελούν τη λύση στα προβλήματα που πηγάζουν από τις παραδοσιακές τεχνικές «one-fits-toall» οι οποίες παρουσιάζουν το ίδιο στατικό εκπαιδευτικό υλικό σε όλους τους χρήστες, ανεξάρτητα από το ατομικό επίπεδο εξειδίκευσης, τις πληροφοριακές ανάγκες και τις προτιμήσεις, που μπορεί να διαφέρουν σε μεγάλο βαθμό (De Bra et al., 1999). Αυτές οι εξελιγμένες εφαρμογές ηλεκτρονικής εκπαίδευσης παρέχουν υψηλής ποιότητας περιεχόμενο, αποδοτική δομή, καθώς και πλήρη υποστήριξη για όλες τις ποικίλες εργασίες όλων των προφίλ των χρηστών που συμμετέχουν σε μία τυπική περίπτωση μάθησης από απόσταση (Mödritscher et al., 2004). Συγκεκριμένα, το σύστημα ανάλογα από τις γνώσεις που έχει ο χρήστης, τις ικανότητες και τις αδυναμίες του, καθώς και τις προτιμήσεις του στον τρόπο μάθησης αλλά και της προόδου που έχει κάνει μέχρι εκείνη τη στιγμή, αποφασίζει ποιο περιεχόμενο και με ποιο τρόπο πρέπει να παρουσιαστεί στο επόμενο βήμα. Οι πιθανές παράμετροι είναι τα διαφορετικά μαθησιακά μονοπάτια μέσα στο περιεχόμενο, οι διαφορετικοί τρόποι παρουσίασης του ίδιου του περιεχομένου (π.χ. με ή χωρίς ήχο) ή προσφέροντας ένα διαφορετικό σύνολο από συναρτήσεις οι οποίες παρέχονται στο χρήστη μέσω του περιβάλλοντος διεπαφής για να μειωθεί η πολυπλοκότητα (Dietinger et al., 2003). Για να επιτευχθεί αυτό χρησιμοποιούνται μέθοδοι και τεχνικές από διάφορα επιστημονικά πεδία και περιοχές εφαρμογών. Οι πιο γνωστές είναι οι περιοχές των Data Mining (Εξόρυξη Δεδομένων), Web Data Mining (Εξόρυξη Δεδομένων που προέρχονται από τον Ιστό), Knowledge Discovery (Ανακάλυψη Γνώσης), User Modeling (Μοντελοποίηση Χρήστη), User Profiling (Δημιουργία Προφίλ Χρήστη), Artificial Inteligence (Τεχνητή Νοημοσύνη) και Agent Technology (Τεχνολογίες Πρακτόρων), κτλ. Ειδικότερα, το Web Data Mining ορίζεται ως η χρήση τεχνικών Data Mining για την ανακάλυψη και την εξαγωγή πληροφοριών και υπηρεσιών από τον Παγκόσμιο Ιστό και διαχωρίζεται σε Web Content, Structure ή Usage Mining (Εξόρυξη Περιεχομένου, Δομής ή Δεδομένων Χρήσης του Παγκόσμιου Ιστού) ανάλογα από ποιο κομμάτι του Παγκόσμιου Ιστού γίνεται η εξόρυξη (Kosala & Blockeel, 2000). Στην πλειοψηφία των περιπτώσεων, οι εφαρμογές e-learning βασίζουν την εξατομίκευση στην τεχνική του Web Usage Mining, που αναλαμβάνει το έργο της συγκέντρωσης και της εξαγωγής όλων των δεδομένων που απαιτούνται για την κατασκευή και τη διατήρηση των προφίλ των εκπαιδευόμενων σύμφωνα με τη συμπεριφορά κάθε χρήστη όπως αυτή καταγράφεται στα log αρχεία του εξυπηρετητή (Markellou et al., 2004a; Pierrakos, et al. 2003). Τέλος, η περιοχή του Σημασιολογικού Ιστού (Semantic Web) έρχεται να προσθέσει ένα επίπεδο ευφυΐας σε αυτές τις εφαρμογές. Σύμφωνα με τους (Berners-Lee et al., 2001): 9

22 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN «the Semantic Web is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation». Ένας πιο επίσημος ορισμός από τη W3C ( αναφέρει ότι: «the Semantic Web is the representation of data on the World Wide Web. It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners. It is based on the Resource Description Framework (RDF), which integrates a variety of applications using XML for syntax and URIs for naming». Η ικανότητα του Σημασιολογικού Ιστού να προσθέτει νόημα στις πληροφορίες, αποθηκευμένο με τέτοιο τρόπο ώστε να μπορεί να αναζητηθεί και να υποβληθεί σε επεξεργασία, παρέχει πολλές δυνατότητες επέκτασης στις διαδικτυακές εφαρμογές (Anderson & Whitelock, 2004). Ο συνδυασμός των τεχνικών του Web Mining και του Σημσιολογικού Ιστού έχουν δημιουργήσει μία νέα και πολύ γρήγορα εξελισσόμενη ερευνητική περιοχή του Semantic Web Mining (Εξόρυξη Δεδομένων Σημασιολογικού Ιστού). Η ιδέα πίσω από τη χρήση του Σημασιολογικού Ιστού για τη δημιουργία εξατομικευμένων (personalised) εμπειριών Παγκόσμιου Ιστού είναι να βελτιωθεί το Web Mining με τη χρήση νέων σημασιολογικών δομών (Markellou et al., 2994b). Με την ενοποίηση των τεχνολογιών του Semantic Web Mining, οι διαδικτυακές εφαρμογές και ειδικά οι υπηρεσίες e-learning θα γίνουν εξυπνότερες. Στο κεφάλαιο αυτό θα εξεταστεί πώς οι τεχνολογίες Semantic Web Mining και συγκεκριμένα οι οντολογίες μπορούν να ενοποιηθούν στο πεδίο του e-learning και ειδικότερα στην εξατομικευμένη διδασκαλία βασισμένη στον Παγκόσμιο Ιστό και στα συστήματα μάθησης όπου η ατομικότητα του κάθε μαθητή παίζει σημαντικό ρόλο. 1.2 Semantic Web Mining και E-Learning Οι παραδοσιακές προσεγγίσεις για την επίτευξη της εξατομίκευσης συμπεριλαμβάνουν τόσο τις βασισμένες στο περιεχόμενο τεχνικές (content-based) όσο και τις βασισμένες στο χρήστη (user-based) (Dai, & Mobasher, 2004). Οι συστάσεις που γίνονται με την πρώτη ομάδα τεχνικών βασίζονται στην ομοιότητα του περιεχομένου με το προφίλ των χρηστών, ενώ η δεύτερη ομάδα τεχνικών συγκεντρώνεται στις ομοιότητες του προφίλ ενός χρήστη με τους υπόλοιπους χρήστες του συστήματος (Mobasher et al., 2003). Η αδυναμία των παραπάνω τεχνικών εντοπίζεται στη δυσκολία να αιχμαλωτίσουν τη σημασιολογική γνώση της περιοχής της εφαρμογής π.χ. έννοιες, συσχετίσεις μεταξύ διαφορετικών εννοιών, κληρονομικές ιδιότητες που σχετίζονται με τις έννοιες, αξιώματα και άλλους κανόνες, κτλ. Η ανάπτυξη του Σημασιολογικού Ιστού δημιουργώντας νέα πρότυπα που βασίζονται στην εξέλιξη των τεχνολογιών του Παγκόσμιου Ιστού, επιτρέπει την επαναχρησιμοποίηση του περιεχομένου σε διαφορετικά πεδία, παρέχει ευέλικτες λύσεις και αξιόπιστη διαχείριση. Για την επίτευξη των παραπάνω, στο διαδικτυακό περιεχόμενο προστίθενται μέτα-πληροφορίες ή μεταδεδομένα (metadata). Αυτά τα μεταδεδομένα ορίζουν το θέμα που αφορά το περιεχόμενο και το περιγράφουν με ένα τρόπο επεξεργάσιμο και κατανοητό από τις μηχανές. Οι οντολογίες προσφέρουν έναν 10

23 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN τρόπο συνεργασίας μεταξύ των ετερογενών αναπαραστάσεων των πληροφοριών στον Παγκόσμιο Ιστό, αποτελούν το σκελετό του Σημασιολογικού Ιστού και είναι μία πολλά υποσχόμενη τεχνολογία υλοποίησης εφαρμογών e-learning. Ο λόγος που οι οντολογίες έχουν γίνει τόσο διάσημες είναι γι αυτό που υπόσχονται σύμφωνα με τον Davies (et al., 2003): «a share and common understanding of a domain that can be communicated between people and applications systems». Μία οντολογία μπορεί να μορφοποιήσει μία αναπαράσταση του πεδίο μάθησης ορίζοντας όλες τις έννοιες σε αυτό, τις πιθανές σχέσεις μεταξύ τους και άλλα χαρακτηριστικά, συνθήκες ή κανόνες της περιοχής. Η ανάπτυξη μίας οντολογίας είναι συνυφασμένη με τον ορισμό του συνόλου των δεδομένων και της δομής τους. Άρα, η οντολογία μπορεί να θεωρηθεί ως μία βάση γνώσης που χρησιμοποιείται επιπλέον για την εξαγωγή χρήσιμης γνώσης και την παραγωγή εξατομικευμένων εμπειριών του e-learning συστήματος. Υπάρχουν διάφοροι τύποι οντολογιών και πολλές διάφορες ομαδοποιήσεις κάτω από τους τύπους αυτούς. Αρχικά, ο Mizoguchi (1995) πρότεινε τέσσερα διαφορετικά είδη οντολογιών: 1) Οντολογίες περιεχομένου (Content Ontologies) για την επαναχρησιμοποίηση γνώσης. Οι οντολογίες αυτές περιλαμβάνουν τις υποκατηγορίες που είναι οι: οντολογίες εργασιών (task ontologies), οι οντολογίες περιοχής (domain ontologies) και οι γενικευμένες ή κοινές οντολογίες (general or common ontologies). 2) Οντολογίες επικοινωνίας (communication ontologies tell & ask) για την διαμοίραση της γνώσης. 3) Οντολογίες ταξινόμησης (indexing ontologies) για την εύρεση και ανάκτηση της περίπτωσης περιεχομένου. 4) Μέτα οντολογίες (meta-ontologies), οι οποίες για τον Mizoguchi είναι ισοδύναμες με εκείνες που άλλοι συγγραφείς ονομάζουν οντολογίες αναπαράστασης γνώσης (knowledge representation ontologies). Ο Van Heijst (1997) ομαδοποίησε τις οντολογίες σύμφωνα με δύο ορθογώνιες διαστάσεις: 1) το μέγεθος και τον τύπο της δομής της αντίληψης και 2) το θέμα. Στην πρώτη διάσταση, διέκρινε τρεις κατηγορίες: τις ονοματολογικές οντολογίες (terminological ontologies) όπως είναι τα λεξικά, τις πληροφοριακές οντολογίες (information ontologies) όπως είναι τα σχεσιακά σχήματα των βάσεων δεδομένων, και τις οντολογίες μοντελοποίησης γνώσης (knowledge modeling ontologies) που καθορίζουν την αντίληψη της γνώσης. Στη δεύτερη διάσταση, διέκρινε τέσσερις κατηγορίες: οντολογίες αναπαράστασης (representation), περιεχομένου (domain), εφαρμογών (application) και γενικευμένες (generic). Άλλες κατηγοριοποιήσεις που έγιναν από τον Guarino (1998), ο οποίος ομαδοποίησε τους τύπους των οντολογιών σύμφωνα με το επίπεδο εξάρτησης από μία συγκεκριμένη περιοχή ή άποψη, και τους Lassila και McGuinness (2001), οι οποίοι 11

24 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN ομαδοποίησαν τις οντολογίες σύμφωνα με τις πληροφορίες που χρειάζεται η οντολογία για να εκφράσει την εσωτερική δομή της. Η έρευνα σχετικά με τις οντολογίες έδειξε το σημαντικό ρόλο που μπορούν να παίξουν στο πεδίο του e-learning. Στο (Stojanovic et al., 2001) οι συγγραφείς περιγράφουν πως οι τεχνολογίες του Σημασιολογικού Ιστού βασισμένες στις οντολογίες μπορούν να χρησιμοποιηθούν για την κατανόηση απλών σεναρίων e-learning και να βελτιώσουν τη διαχείριση των πηγών τους. Σε αυτή την περίπτωση οι οντολογίες χρησιμοποιούνται για την περιγραφή των σημασιολογικών στοιχείων και τον ορισμό του περιεχομένου του εκπαιδευτικού υλικού, καθώς και τη δομή των μαθημάτων. Στο (Henze et al., 2004) προτάθηκε ένα πλαίσιο για εξατομικευμένο e-learning στον Σημασιολογικό Ιστό και ένας τρόπος περιγραφής της διάταξης των πηγών η οποία μπορεί να χρησιμοποιηθεί για την αυτόματη δημιουργία των δομών υπερκειμένου από τα κατανεμημένα μεταδεδομένα. Συγκεκριμένα, χρησιμοποιήθηκαν διάφορες οντολογίες για την περιγραφή των χαρακτηριστικών των περιοχών και των χρηστών. Στο (Tane et al., 2004) παρουσιάζεται ένα εργαλείο βασισμένο στην τεχνολογία των οντολογιών, το Courseware Watchdog, το οποίο επιτρέπει την οντολογική οργάνωση των διαθέσιμων πηγών e-learning στον Παγκόσμιο Ιστό. Το εργαλείο παρουσιάζει τις διαφορετικές ανάγκες μεταξύ των εκπαιδευτών και των εκπαιδευόμενων και οργανώνει το εκπαιδευτικό υλικό σύμφωνα με αυτούς. Μια επισκόπηση στη χρήση των οντολογιών και των μεταδεδομένων στο e-learning, καθώς και για τις καινοτόμες προσεγγίσεις περιγράφονται στο (Brase & Nejdl, 2004). Οι συγγραφείς δίνουν έμφαση στα συσχετιζόμενα πρότυπα μεταδεδομένων, στους συνδέσμους, στα σχήματα και στους σχολιασμούς, στις ομαδοποιήσεις για την περιγραφή του περιεχομένου μία πηγής, κτλ. Επίσης, προτείνουν διάφορες οντολογίες και παρουσιάζουν ένα peer-to-peer δίκτυο βασισμένο σε RDF για ψηφιακές πηγές και για την ανταλλαγή αντικειμένων και υπηρεσιών μάθησης. 1.3 Προτεινόμενο σενάριο εξατομίκευσης Στη συγκεκριμένη προσέγγιση δημιουργίας εξατομικευμένου e-learning, η δομή της γνώσης και οι πληροφορίες παίζουν πολύ σημαντικό ρόλο. Η προτεινόμενη οντολογική οργάνωση της περιοχής βοηθάει στη δόμηση και τη διαχείριση του περιεχομένου που σχετίζεται με κάποιο μάθημα ή θέμα. Συγκεκριμένα, το περιβάλλον δημιουργίας εξατομίκευσης, το οποίο βασίζεται σε συλλογικά προφίλ χρήσης του περιεχομένου και στην οντολογία της περιοχής, αντικατοπτρίζεται στην Εικόνα 1. Η διαδικασία διαχωρίζεται σε δύο στάδια: το offline στάδιο που περιλαμβάνει την προετοιμασία των δεδομένων, τη κατασκευή της οντολογίας και την εξόρυξη των δεδομένων χρήσης και το online στάδιο της εξατομίκευσης. Ξεκινώντας με το offline κομμάτι, οι προπαρασκευαστικές εργασίες που πρέπει να γίνουν οδηγούν στη δημιουργία ενοποιημένων δομών όπως είναι το αρχείο με τα transactions του χρήστη, από το οποίο θα προκύψουν οι σχηματομορφές που 12

25 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN περιγράφουν τη συμπεριφορά πλοήγησης του χρήστη και θα χρησιμοποιηθεί στο στάδιο της εξόρυξης. Ένα σύνολο από εργασίες εξόρυξης δεδομένων μπορούν να εκτελεστούν χρησιμοποιώντας τις προεπεξεργασμένες πληροφορίες. Η εύρεση των κανόνων συσχέτισης γίνεται με χρήση του Apriori Αλγόριθμου. Το σύστημα χρησιμοποιεί τα log αρχεία του εξυπηρετητή, τα οποία περιγράφουν τη συμπεριφορά πλοήγησης του χρήστη. Ουσιαστικά, τα αρχεία αυτά ενθυλακώνουν όλες τις σχετικές πληροφορίες με τη χρήση του πεδίου της διαδικτυακής μάθησης από τους χρήστες. Σε αυτό το στάδιο, τα log αρχεία του εξυπηρετητή πρέπει να καθαριστούν σύμφωνα με τα αρχεία του ιστότοπου. Η εργασία αυτή περιλαμβάνει την απομάκρυνση πλεονάζουσας πληροφορίας και αναφορών. Απαιτείται λεπτομερής γνώση της δομής του ιστότοπου, προκειμένου να βρεθεί το καθαρό περιεχόμενο που αντιστοιχεί στις κλήσεις του χρήστη. Οι προπαρασκευαστικές εργασίες που περιγράφηκαν καταλήγουν σε ένα σύνολο από: n pageviews, P = p, p,..., p } { 1 2 n όπου κάθε pageview αναπαρίσταται μοναδικά από το συνδεδεμένο με αυτό URL, και ένα σύνολο από: όπου κάθε m user transactions, T = t, t,..., t } t i ÎT είναι ένα υποσύνολο του P. { 1 2 m Σε ένα σύνολο από transactions Τ, το πρόβλημα εξόρυξης κανόνων συσχέτισης είναι η παραγωγή όλων των κανόνων συσχέτισης που έχουν support s και confidence a μεγαλύτερα από κάποια καθορισμένα κατώφλια minimum support (minsup) και minimum confidence (minconf) αντίστοιχα. Ο αλγόριθμος εύρεσης των κανόνων συσχέτισης είναι ο Apriori (Agrawal & Srikant, 1994). 13

26 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN Εικόνα 1: Προτεινόμενο σενάριο για την παραγωγή συστάσεων σε ένα σύστημα διαδικτυακή μάθησης. Ο Apriori θα εφαρμοστεί στα transactions που προέκυψαν από το προηγούμενο στάδιο. Στόχος είναι να βρει το σύνολο των κανόνων συσχέτισης που αντιστοιχούν στο συγκεκριμένο σύνολο από transactions. Ο αλγόριθμος αρχικά βρίσκει ομάδες από αντικείμενα (στην περίπτωση αυτή είναι URLs του προεπεξεργασμένου log αρχείου) που εμφανίζονται συχνά μαζί σε πολλά transactions. Τέτοιες ομάδες αντικειμένων αναφέρονται ως frequent item sets. Έστω ένα σύνολο I = I, I,..., I } από frequent itemsets, το support του I i ορίζεται ως: { 1 2 k s ( I ) = i { t ÎT : I T i Í t} και αντιστοιχεί στο λόγο των transactions μέσα στο transaction set, που περιέχουν το frequent item I. i Το κατώφλι για το support (minsup) χρησιμοποιείται από τον αλγόριθμο για τον περιορισμό του πεδίου αναζήτησης και γενικά ορίζεται πριν το στάδιο της εξόρυξης. Οι κανόνες συσχέτισης αιχμαλωτίζουν τις σχέσεις μεταξύ των αντικειμένων σύμφωνα με τις σχηματομορφές συνύπαρξής τους μέσα στα transactions. Στην περίπτωση των 14

27 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN web transactions, οι κανόνες συσχέτισης αιχμαλωτίζουν τις σχέσεις μεταξύ των URL αναφορών σύμφωνα με τις σχηματομορφές πλοήγησης των χρηστών. Ένας κανόνας συσχέτισης r είναι μία έκφραση της μορφής: X Þ Y s, a ) ( r r όπου s r είναι το support του X È Y, και ar είναι το confidence του κανόνα r που s ( X È Y ) δίνεται από. Το confidence του κανόνα r αντιστοιχεί στο λόγο των s ( X ) transactions, μέσα στο transaction set T, που περιέχουν το Χ περιέχουν επίσης και στο Υ. Χρησιμοποιούνται frequent itemsets και κανόνες συσχέτισης για να παραχθούν οι συστάσεις στους εκπαιδευόμενους. Για να εξασφαλιστεί αποδοτική εξατομίκευση, συνδυάζεται η ύπαρξη της οντολογίας του περιεχομένου με τη γνώση που προέρχεται από τα μονοπάτια πλοήγησης του χρήστη. Το τελευταίο θα χρησιμοποιηθεί για να εκμαιευτεί ο τρόπος με τον οποίο οι χρήστες κατανοούν του περιεχόμενο. Οι συστάσεις στους χρήστες θα γίνουν σύμφωνα με τις συνδέσεις στην οντολογία και τα συμπεράσματα που αναφέρθηκαν παραπάνω σχετικά με την τρέχουσα θέση του χρήστη. Ο ρόλος της οντολογίας είναι να ορίσει ποιο εκπαιδευτικό υλικό είναι πιο κατάλληλο για να προταθεί στο χρήστη, και σύμφωνα με τα frequent itemsets (τα μονοπάτια πλοήγησης του χρήστη) ποιες από αυτές τις επιλογές έχει το μεγαλύτερο support. Η οντολογία του πεδίου e-learning στοχεύει να περιγράψει το περιεχόμενο και τις σχέσεις μεταξύ διάφορων εννοιών. Αποτελεί μία λεπτομερή αναπαράσταση της περιοχής προσδιορίζοντας όλα τα θέματα, τις υπάρχουσες σχέσεις μεταξύ τους και άλλα χαρακτηριστικά, περιορισμούς ή συνθήκες του πεδίου. Ένα παράδειγμα μίας οντολογίας φαίνεται στην Εικόνα 2. Αυτό το σχήμα αφορά ένα μάθημα «Web Mining» και ακολουθεί την ταξονομία που πρωτοπαρουσιάστηκε στο (Cooley et al., 1997; Chakrabarti et al., 1999). Μέσω της οντολογίας το σύστημα παρουσιάζει ιεραρχικούς συνδέσμους μεταξύ των οντοτήτων. Με αυτή την κατεύθυνση η οντολογία μπορεί να θεωρηθεί ως μία βάση γνώσης που χρησιμοποιείται περεταίρω για την εξαγωγή χρήσιμης γνώσης και την παραγωγή εξατομικευμένων όψεων του συστήματος. Στη συγκεκριμένη προσέγγιση χρησιμοποιήθηκε μία απλή οντολογία που εκφράζει τη γνώση που περιγράφεται σε κάθε περιοχή με τη βοήθεια υπο-γράφων και ονομάζοντάς τις περιοχές με τα ονόματα των αντίστοιχων κόμβων. Η τεχνική αυτή επιτρέπει την εύκολη σύγκριση της γνώσης για ένα χρήστη σε σχέση με κάθε περιοχή. Μία άλλη προσέγγιση θα ήταν ο διαχωρισμός της οντολογίας σε κάθε περιοχή, δημιουργώντας έτσι μία οντολογία για κάθε θεματική ενότητα και μία κεντρική οντολογία αντιστοιχίζοντας τις υπο-οντολογιές. Όμως, η προσέγγιση αυτή δεν δίνει τη δυνατότητα να αντιστοιχηθεί η γνώση του χρήστη σε κάθε θεματική ενότητα και είναι λιγότερο ευέλικτη. 15

28 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN Εικόνα 2: Παράδειγμα οντολογίας για ένα μάθημα «Web Mining». Η web mining ταξονομία έχει υιοθετηθεί από το (Cooley et al., 1997; Chakrabarti et al., 1999). Συγκεκριμένα, η τεχνική που παρουσιάζεται στην ενότητα αυτή βασίζεται στα παρακάτω για την εύρεση των καταλληλότερων συστάσεων: Την οντολογία του εγγράφου. Τα έγγραφα σημειώνονται σύμφωνα με προτυποποιημένα σχήματα μεταδεδομένων για έγγραφα όπως το Dublin Core ή DC ( ή στην περιοχή της εκπαίδευσης σύμφωνα με το Learning Objects Metadata Standard LOM ( Στην προσέγγιση που προτείνεται σε αυτό το κεφάλαιο η περιγραφή των μεταδεδομένων γίνεται με το LOM. Το αρχείο με τους παραγόμενους κανόνες συσχέτισης. Οι συγκεκριμένοι κανόνες προέρχονται από τα transactions του χρήστη και υπολογίζονται κατά το στάδιο της προεπεξεργασίας των δεδομένων. Ο ρόλος του recommender είναι ο υπολογισμός ενός συνόλου συστάσεων, το οποίο αποτελείται από συνδέσμους σε ιστοσελίδες που ο χρήστης πιθανόν να θέλει να επισκεφθεί. Ουσιαστικά αναπαριστά μία σύντομη όψη από πιθανόν χρήσιμους συνδέσμους σύμφωνα με την πλοήγηση του χρήστη μέσα στον ιστότοπο. Αυτοί οι προτεινόμενοι σύνδεσμοι στη συνέχεια προστίθενται στην τελευταία σελίδα της συνόδου (session) πριν αυτή σταλεί στο χρήστη. 16

29 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN Χρησιμοποιώντας ένα παράθυρο ολίσθησης σταθερού μεγέθους πάνω στην τρέχουσα σύνοδο, μπορούμε να αιχμαλωτίσουμε το μέγεθος του τρέχοντος ιστορικού του χρήστη. Για παράδειγμα, εάν η τρέχουσα σύνοδος (με μέγεθος παραθύρου ίσο με 3) είναι <Α,Β,C> και ο χρήστης επιλέξει το URL D, τότε η νέα τρέχουσα σύνοδος θα είναι <Β,C,D>. Οι παράγοντες που πρέπει να ληφθούν υπόψη κατά τη διαδικασία δημιουργίας συστάσεων είναι: η οντολογία της περιοχής, τα κριτήρια συνταίριαξης με τα frequent itemset, αν ο χρήστης έχει επισκεφθεί στην τρέχουσα σύνοδο τα πιθανά για σύσταση URLs, το γράφο του ιστότοπου. Στη συνέχεια υπολογίζεται το πιθανό σύνολο συστάσεων χρησιμοποιώντας την οντολογία της περιοχής. Ο στόχος είναι να βρεθεί το σύνολο των συστάσεων σύμφωνα με την οντολογία της περιοχής. Το σύνολο αυτό φιλτράρεται μέσω των frequent itemset, τα οποία προέκυψαν κατά τη διάρκεια του προπαρασκευαστικού σταδίου. Τα frequent itemset ουσιαστικά απεικονίζουν τη γνώση που προέρχεται από την πλοήγηση άλλων χρηστών, οι οποίοι συμπεριφέρονται παρόμοια με τον τρέχον χρήστη. Όπως έχει ήδη προαναφερθεί, στους παραπάνω παράγοντες έχει συμπεριληφθεί ο γράφος του ιστότοπου. Ο τελευταίος θα χρησιμοποιηθεί για τον υπολογισμό της απόστασης του υποψήφιου προς σύσταση URL από την τρέχουσα θέση του χρήστη. Ως απόσταση θεωρούμε τον αριθμό των κλικ (click stream) που ο χρήστης πρέπει να κάνει για να πάει από την τρέχουσα θέση του στο προτεινόμενο URL. Ο αλγόριθμος που χρησιμοποιήθηκε για την παραγωγή των συστάσεων παρουσιάζεται στον Πίνακας 1. Αλγόριθμος Input: -Active user session z (session window max size n). -Domain ontology. -Frequent itemsets and association rules. -Minsup threshold σ. -Minconf threshold α. -Site graph. Recommendation set r = Ø. Potential recommendation set w = Ø. Potential recommendation set w according to the ontology w = {w1, w2,, wk}. For each set z+wi, wi W for each frequent itemset Ii = z+wi if sup(ii) σ then 17

30 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN c=conf( z wi ) if c α w i_score = c * click_num (*) r = r w i end if end if end for end for Πίνακας 1: Ο προτεινόμενος αλγόριθμος για την παραγωγή συστάσεων στους χρήστης. Ο αλγόριθμος αρχικά υπολογίζει τα πιθανά σύνολα συστάσεων σύμφωνα με την οντολογία του συγκεκριμένου πεδίου. Αυτό είναι το σύνολο w. Στη συνέχεια, ανακαλύπτει όλα τα frequent itemsets I i συνδυάζοντας την τρέχουσα σύνοδο του χρήστη z με τις συστάσεις w που προήλθαν από την οντολογία. Για κάθε frequent itemset επαληθεύεται εάν το support του είναι μεγαλύτερο ή ίσο με το μικρότερο κατώφλι για το support σ. Στο βήμα αυτό ο αλγόριθμος φιλτράρει τις συστάσεις με χαμηλό support. Για τα frequent itemset που περνούν το προηγούμενο βήμα, ο αλγόριθμος επαληθεύει εάν το confidence των αντίστοιχων κανόνων συσχέτισης είναι μεγαλύτερο ή ίσο με το μικρότερο κατώφλι του confidence α. Εάν τα frequent iemset έχουν support μεγαλύτερο ή ίσο με το α τότε ακολουθεί το υπολογιστικό βήμα (*). Στη φάση αυτή ο αλγόριθμος υπολογίζει το σκορ του προτεινόμενου συνδέσμου w i. Αυτό το σκορ έχει υπολογιστεί πολλαπλασιάζοντας το confidence του frequent itemset με το πλήθος των κλικ του ποντικιού που πρέπει να γίνουν για να πάμε από τη θέση του τρέχοντος χρήστη στο προτεινόμενο URL, σύμφωνα με το γράφο του ιστότοπου. Στη συνέχεια το προτεινόμενο URL w i προστίθεται στο σύνολο με τις συστάσεις r. Ας δούμε ένα παράδειγμα για να περιγραφεί πιο καθαρά το υπολογιστικό βήμα (*). Παράδειγμα: έστω δύο προτεινόμενα URLs w i και w j, με confidence c i =0,3 και c j =0,6 και αριθμό κλικ cli_n i =6 και cli_n j =3, αντίστοιχα. Τότε: w i _score = c i * cli_n i = 1,8 w j _score = c j * cli_n j = 1,8 Όπως παρατηρούμε τα δύο URLs έχουν του ίδιο σκορ. Αυτό σημαίνει ότι ο αλγόριθμος εξισορροπεί τις διαφορές μεταξύ της απόστασης και του confidence. Τα URLs με μεγάλη απόσταση και μικρό confidence θα είναι στο ίδιο επίπεδο με αυτά που είναι σε μικρή απόσταση και έχουν μεγάλο confidence. Συνεπώς, εάν υπάρχει ένα πλήθος από χρήστες που αποφασίζουν να επισκεφτούν ένα URL το οποίο είναι σε μεγάλη απόσταση από την τρέχουσα θέση τους, ο αλγόριθμος θα το βρει και θα δώσει σε αυτό το ίδιο βάρος με τα υπόλοιπα URLs με μεγαλύτερο confidence και μικρότερη απόσταση. Άρα, ο αλγόριθμος λαμβάνει υπόψη τις επιλογές που οι άλλοι χρήστες έκαναν. Συγκεκριμένα, ο προτεινόμενος αλγόριθμος ταξινομεί τις συστάσεις που προέρχονται από την οντολογία σύμφωνα με το υπολογιστικό βήμα (*), και αποκλείει αυτές τις συστάσεις με χαμηλό support και confidence. Το αρχικό σύνολο συστάσεων έχει φιλτραριστεί και βελτιωθεί μέσω των frequent itemset και των κανόνων συσχέτισης. 18

31 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN 1.4 Συμπεράσματα Το προτεινόμενο σενάριο εξατομίκευσης ενσωματώνει το όραμα του Σημασιολογικού Ιστού χρησιμοποιώντας οντολογίες μαζί με τεχνικές Web Usage Mining με σκοπό να εξυπηρετήσει καλύτερα τους μαθητευόμενους. Οι οντολογίες και τα συσχετιζόμενα μεταδεδομένα διανέμουν σημασιολογική πληροφορία για τη συμπεριφορά των χρηστών και τα ενδιαφέροντά τους. Ο συνδυασμός της οντολογίας της περιοχής και των frequent itemsets, τα οποία εμπεριέχουν όλες τις πληροφορίες σχετικά με τη συμπεριφορά πλοήγησης του χρήστη, βελτιώνει την όλη διαδικασία και παράγει καλύτερες συστάσεις. Το σύστημα αρχικά βρίσκει ένα αρχικό σύνολο συστάσεων και στη συνέχεια χρησιμοποιώντας τα frequent itemsets το εμπλουτίζει, λαμβάνοντας υπόψη την συμπεριφορά πλοήγησης των άλλων χρηστών. Κατά αυτό τον τρόπο, μειώνεται ο χρόνος που ανάλυσης των frequent itemsets και των κανόνων συσχέτισης. Περιορίζεται η ανάλυση μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της συνόδου του τρέχοντος χρήστη και των συστάσεων της οντολογίας. Η μείωση του χρόνο προέρχεται από το γεγονός ότι τα frequent itemsets φιλτράρονται μέσω του συνόλου συστάσεων της οντολογίας οδηγώντας σε μικρότερες περιοχές αναζήτησης. Επιπλέον, η προσέγγιση αυτή ξεπερνάει το πρόβλημα των μεγάλων χρόνων απόκρισης, οι οποίοι μπορούν να οδηγήσουν σε μείωση της χρήσης του συστήματος εκπαίδευσης από απόσταση. Παρόλο που η εξατομίκευση απαιτεί της εκτέλεση ενός πλήθους βημάτων επεξεργασίας, η προσέγγιση που περιγράφηκε στις προηγούμενες ενότητες, καταφέρνει να αποφύγει το εμπόδιο αυτό διατηρώντας ένα μεγάλο τμήμα των υπολογισμών offline. Από την άλλη πλευρά, έναν περιορισμό αυτής της προσέγγισης αποτελεί το γεγονός ότι η μηχανή δημιουργίας συστάσεων δεν δίνει πάντα τα καλύτερα αποτελέσματα εξαιτίας της άμεσης εξάρτησής της από το συγκεκριμένο πεδίο. Εκτός αυτού, η οντολογία που δημιουργείται αντικατοπτρίζει τον τρόπο με τον οποίο η περιοχή του συστήματος εκπαίδευσης από απόσταση πρέπει να διδαχτεί στους μαθητές και επιπλέον αντανακλά την άποψη του ατόμου που τη σχεδίασε. Εάν η οντολογία την έχει κατασκευαστεί σωστά, τότε το αρχικό σύνολο συστάσεων θα αποκλίνει από τον τρόπο με τον οποίο οι χρήστες μαθαίνουν την περιοχή και ο αλγόριθμος δεν μπορεί να το βελτιώσει αυτό. Η συγκεκριμένη τεχνική δεν προσθέτει νέες συστάσεις στο αρχικό σύνολο, αλλά μόνο επαναδιατάσει και απομακρύνει αντικείμενα σύμφωνα με τα κατώφλια minsup και minconf. Επιπλέον, η δημιουργία μίας οντολογίας δεν αποτελεί μία τετριμμένη και άμεση διαδικασία. Απαιτεί την συμμετοχή ειδικών, με αφαιρετική σκέψη και πολύ καλή γνώση της περιοχής που πρέπει να περιγραφεί, ώστε να παρέχουν μία μεριζόμενη κοινή αντίληψη αυτής στους χρήστες. Η επιλογή και ο ορισμός των εννοιών και οι σχέσεις μεταξύ τους, όπως επίσης και το επίπεδο των λεπτομεριών είναι μία ακριβή και χρονοβόρα εργασία, αφού όσο πιο αναλυτική είναι η οντολογία τόσο μεγαλύτερη είναι η πολυπλοκότητα και η δυσκολία που απαιτείται για τη διαχείρισή της (Wilson et al., 2004). Συχνά, οι αποφάσεις που αφορούν τις οντολογίες ενσωματώνονται με το σχεδιασμό των αποθετηρίων των δεδομένων. Το τελευταίο παρατηρείται σε πολλά περιβάλλοντα εκπαίδευσης από απόσταση, όπου οι διαφορές μεταξύ εννοιών μπορεί 19

32 ΚΕΦΑΛΑΙΟ 1 E-LEARNING DOMAIN συχνά να μην διακρίνονται. Μία λύση σε αυτό αποτελεί η χρήση πολλαπλών οντολογιών, μία για κάθε προφίλ χρήστη, αντί μίας μοναδικής γενικής οντολογίας (Markellou et al., 2005). Μία άλλη περιοχή ενδιαφέροντος σχετίζεται με τις ανθρώπινες πλευρές (Markellos et al., 2004b). Τα προσαρμοστικά συστήματα και οι διαδικασίες δημιουργίας και καταχώρησης προφίλ των χρηστών φέρνουν στην επιφάνεια το πρόβλημα προστασίας προσωπικών δεδομένων, το οποίο παραμένει έως ένα βαθμό μη επιλύσιμο. Η έρευνα στην περιοχή της εξόρυξης δεδομένων χρήσης από τον Παγκόσμιο Ιστό συνοδεύεται από μεθόδους διατήρησης τα ασφάλειας για να ενισχυθεί η εμπιστοσύνη των χρηστών κατά την αλληλεπίδρασή τους με μία online εφαρμογή. Η ανάγκη του ιδιοαπόρρητου έχει δημιουργήσει νέα αγορά αφιερωμένη στη σχεδίαση και την ανάπτυξη προϊόντων προστασίας προσωπικών πληροφοριών. Οι μελλοντικές προκλήσεις και η έρευνα στην κατεύθυνση της διανομής προσαρμοστικών εφαρμογών στον Παγκόσμιο Ιστό χωρίς να διακινδυνεύεται το ιδιοαπόρρητο, συνοψίζονται ως εξής (Kobsa et al., 2001): P3P υποστήριξη, αποκάλυψη μεθόδων, πρόβλεψη οργανωτικών και τεχνικών μέσων για να μπορούν οι χρήστες να τροποποιούν τις εισαγωγές στο δικό τους μοντέλο-χρήστη, οι εξυπηρετητές των μοντέλων-χρήστη που υποστηρίζουν ένα πλήθος μεθόδων ανωνυμίας και η προσαρμογή μεθόδων μοντελοποίησης χρήστη σε προτιμήσεις σχετικά με το ιδιοαπόρρητο και τους κανονισμούς. Τέλος, μελλοντική εργασία συγκεντρώνεται στην εκτέλεση περισσότερων πειραμάτων με διαφορετικούς συνδυασμούς των λειτουργιών του συστήματος, περισσότερες δυνατότητες συγκειμενικών πληροφοριών στην περιοχή της Εξόρυξης Δεδομένων Σημασιολογικού Ιστού και μία αξιολόγηση της προτεινόμενης προσέγγισης σε αντιστοιχία με την υποστήριξη μάθησης και τον ανοιχτού πεδίου μάθησης. 20

33 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Κεφάλαιο 2 MOVIE DOMAIN 2.1 Εισαγωγή Η αλματώδης ανάπτυξη του Παγκόσμιου Ιστού προκάλεσε ριζικές αλλαγές και εξελίξεις στον τομέα των επιχειρήσεων. Η δυνατότητα των εταιριών να συνεργάζονται και να διεκπεραιώνουν τις υποθέσεις με τους συνεταίρους και τους πελάτες τους οπουδήποτε στον κόσμο δεν έγινε μόνο πραγματικότητα αλλά αποτελεί και αναγκαιότητα. Κάτω από αυτό το πρίσμα γίνεται εμφανές ότι το επόμενο βήμα εξέλιξης στον τομέα των επιχειρήσεων είναι η ανάπτυξη μίας παγκόσμια διαδικτυακής οικονομίας. Από την άλλη πλευρά όμως, μία τέτοια οικονομία χαρακτηρίζεται από την απρόσωπη φύση του on-line περιβάλλοντος και της εκτεταμένης χρήσης της τεχνολογίας της πληροφορίας (Information Technology IT), σε σχέση με την άμεση επαφή στις διάφορες δοσοληψίες. Εφόσον οι τεχνολογίες διαδικτύου και οι απαραίτητες υποδομές υποστήριξης του ηλεκτρονικού εμπορίου (e-commerce) είναι σε χρήση, η προσοχή στρέφεται στους ψυχολογικούς παράγοντες που επηρεάζουν την αποδοχή του από τους on-line πελάτες και την αντίληψη που έχουν σχετικά με τις on-line δοσοληψίες. Ένας τέτοιος παράγοντας είναι η ατομικότητα (μοναδικότητα) των e-πελατών, η οποία αποτελεί σημείο κλειδί στην εξάπλωση του ηλεκτρονικού εμπορίου. Το ερώτημα είναι πόσο εύκολα οι χρήστες του Παγκόσμιου Ιστού μπορούν να γίνουν e-πελάτες, και ποιοί είναι οι εσωτερικοί μηχανισμοί και οι εξωτερικοί παράγοντες που μετέχουν κατά τη διάρκεια μίας ηλεκτρονικής αγοράς. Το αρχικό πρόβλημα πηγάζει από το γεγονός ότι οι αγοραστές με πολυποίκιλες ανάγκες, προτιμήσεις και ιστορικό, πλοηγούνται χρησιμοποιώντας εκτεταμένες και περίπλοκες δομές του Παγκόσμιου Ιστού και κατακλύζονται από πολλές επιλογές και πληροφορίες, η πλειονότητα των οποίων δεν σχετίζονται με τις ανάγκες και τα ενδιαφέροντά τους. Ως επί το πλείστον χρησιμοποιήθηκαν μηχανές αναζήτησης για το φιλτράρισμα των σελίδων με βάση ερωτημάτων που διατυπώνονταν απευθείας από το χρήστη. Όμως τα αποτελέσματα που έδιναν ήταν φτωχά, διότι συνήθως παρήγαγαν μεγάλες λίστες, δύσκολα διαχειρίσιμες και με πολλές άσχετες σελίδες (Middeleton et. al., 2004). Πολλά ηλεκτρονικά καταστήματα εξετάζουν την ανάλυση της συμπεριφοράς των πελατών και την ανάπτυξη νέων στρατηγικών μάρκετινγκ, για να δημιουργήσουν νέες καταναλωτικές αγορές και νέους αφοσιωμένους πελάτες. Συνεπώς, προτάθηκαν νέες τεχνικές που συμβάλουν στην πρόοδο της ηλεκτρονικής επιχειρηματικότητας και η πιο διαδεδομένη από αυτή είναι η εξατομίκευση του Παγκόσμιου Ιστού (Web Personalizaion). Σύμφωνα με τους Eirinaki & Vazirgiannis (2003): 21

34 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN «personalization is defined as any action that adapts the information or services provided by a web site to the knowledge gained from the users navigational behaviour and individual interests, in combination with the content and the structure of the site». Σύμφωνα με την παραπάνω κατεύθυνση, τα πλεονεκτήματα που παρέχονται από τον Παγκόσμιο Ιστό βοηθούν τις on-line εταιρίες να αποκτήσουν πληροφορίες για τους πελάτες τους σε πραγματικό χρόνο και με χαμηλό κόστος. Βασισμένες σε αυτές τις πληροφορίες κατασκευάζουν λεπτομερή προφίλ και παρέχουν εξατομικευμένες ηλεκτρονικές υπηρεσίες. Συνεπώς, τα ηλεκτρονικά καταστήματα έχουν πλέον τη δυνατότητα να βελτιώσουν την απόδοσή τους εντοπίζοντας τις ξεχωριστές ανάγκες και επιθυμίες των πελατών και αυξάνοντας την ικανοποίησή τους, προωθώντας την εμπιστοσύνη και δημιουργώντας εξατομικευμένες σχέσεις (one-to-one relationships). Η εξατομίκευση αποτελεί το σημαντικότερο μέσο για την ανάπτυξη του ηλεκτρονικού εμπορίου (e-commerce) και της ηλεκτρονικής επιχειρηματικότητας (e-business). Τα Συστήματα Δημιουργίας Συστάσεων (Recommendation Systems RSs) (Adomavicius & Tuzhilin, 2005) αποτελούν σημαντικά εργαλεία των επιχειρήσεων διότι συντελούν στη δημιουργία εξατομικευμένων μορφών. Εμφανίστηκαν στα μέσα του 1990 και λόγω των καινοτόμων βελτιώσεων που προκάλεσαν στους ιστότοπους που εφαρμόστηκαν, έχουν μετατραπεί σε πολύ σημαντικά εργαλεία που χρησιμοποιούνται σε πολλές εφαρμογές ηλεκτρονικού εμπορίου (π.χ. Amazon.com, ebay.com, CDNow.com, etc.) με σκοπό να βοηθήσουν τους καταναλωτές να αγοράσουν τα προϊόντα που επιθυμούν. Πιο συγκεκριμένα, τα συστήματα αυτά εκμεταλλεύονται τις ιδιαιτερότητες των χρηστών με σκοπό να τους διευκολύνουν στο να προσδιορίσουν ακριβέστερα τις πληροφορίες ή τα προϊόντα για τα οποία ενδιαφέρονται περισσότερο ή σχετίζονται με τις ανάγκες τους. Για παράδειγμα, ένα RS μπορεί να «θυμάται» τα άρθρα που έχει διαβάσει κάποιος χρήστης, οπότε την επόμενη φορά που θα επισκεφθεί ο χρήστης τον ιστότοπο, το σύστημα μπορεί να του προτείνει νέα άρθρα σύμφωνα με τη θεματολογία αυτών που είχε διαβάσει στο παρελθόν και τα οποία πιθανόν να τον ενδιέφεραν. Οι συστάσεις μπορούν να υλοποιηθούν με διάφορους τρόπους (Brusilovsky, 2001): εξατομικευμένες προσφορές, τιμές, προϊόντα και υπηρεσίες, ενδιαφέρουσες ή μη θεματικές ενότητες, τμήματα, παράγραφοι, ταξινόμηση, απόκρυψη, εμφάνιση, προσθήκη, απομάκρυνση, επισήμανση συνδέσμων, προαιρετικές επεξηγήσεις ή λεπτομερείς πληροφορίες, κτλ. Σύμφωνα με τον Schafer et. al. (2001) τα RSs μπορούν να βελτιώσουν τις πωλήσεις των ιστότοπων ηλεκτρονικού εμπορίου (e-commerce sites) με πολλούς τρόπους: Μετατρέποντας τους επισκέπτες σε πελάτες. Οι επισκέπτες συνήθως πλοηγούνται σε ένα ιστοχώρο χωρίς να αγοράζουν τίποτα. Τα RSs μπορούν να τους βοηθήσουν να βρουν προϊόντα που επιθυμούν να αγοράσουν. 22

35 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Αυξάνοντας τις cross πωλήσεις. Τα RSs βελτιώνουν τις cross-πωλήσεις προτείνοντας επιπρόσθετα προϊόντα στον πελάτη να αγοράσει. Εάν οι συστάσεις είναι καλές, το μέσο μέγεθος των παραγγελιών θα πρέπει να αυξάνεται. Για παράδειγμα, ένας ιστότοπος θα μπορούσε να προτείνει επιπρόσθετα προϊόντα κατά τη διαδικασία της εξόφλησης, σύμφωνα με αυτά τα προϊόντα που ο χρήστης έχει βάλει ήδη στο καλάθι αγορών του. Χτίζοντας ηλεκτρονική εμπιστοσύνη (e-loyalty). Σε ένα κόσμο όπου οι ανταγωνιστές απέχουν μεταξύ τους όχι περισσότερο από ένα ή δύο κλικ του ποντικιού, το να κερδίσει κανείς την εμπιστοσύνη των πελατών είναι μία βασική επιχειρηματική στρατηγική. Οι ιστότοποι επενδύουν στο να μαθαίνουν τους πελάτες τους, χρησιμοποιούν RSs για να δημιουργήσουν τα προφίλ των χρηστών και να παρουσιάσουν εξατομικευμένες διεπιφάνειες που ταιριάζουν με τις ανάγκες των καταναλωτών. Οι τελευταίοι επιλέγουν αυτούς τους ιστότοπους που ταιριάζουν καλύτερα στις ανάγκες τους. Όσο περισσότερο ένας χρήστης χρησιμοποιεί το RSs, τόσο καλύτερα το σύστημα τον μαθαίνει παράγοντας καλύτερες συστάσεις. Το δίλημμα πώς να επιλέξει κανείς τα πιο κατάλληλα προϊόντα και υπηρεσίες αποτελεί ένα πρόβλημα ιδιαίτερα ενδιαφέρον στους ερευνητές. Πολλές προσεγγίσεις έχουν χρησιμοποιηθεί για την παραγωγή συστάσεων, όπως το συνεργατικό φιλτράρισμα (collaborative filtering), το οποίο βασίζεται στη βαθμολογία των προϊόντων από τους χρήστες. Στην περίπτωση αυτή το σύστημα προτείνει τα προϊόντα που έχουν αξιολογηθεί θετικά από χρήστες που μοιάζουν με τον τρέχον χρήστη. Μία άλλη προσέγγιση είναι το φιλτράρισμα βασισμένο στο περιεχόμενο (content-based filtering), το οποίο χρησιμοποιεί τα χαρακτηριστικά των προϊόντων και προτείνει τα προϊόντα που έχουν παρόμοια χαρακτηριστικά με εκείνα που αξιολογήθηκαν θετικά στο παρελθόν από το χρήστη. Εκτός από αυτές τις δύο τεχνικές υπάρχει και το φιλτράρισμα που βασίζεται σε δημογραφικά στοιχεία των χρηστών (demographic filtering) όπως τα ηλικία, φύλο, επάγγελμα, κτλ., προκειμένου να εξάγει κανόνες συστάσεων και τεχνικές που βασίζονται σε στατιστικά δεδομένα, όπως είναι τα χαρακτηριστικά τύπου best-seller τα οποία χρησιμοποιούνται συνήθως όταν δεν εφαρμόζεται καμία τεχνική εξατομίκευσης. Κάθε μία από τις τεχνικές που προαναφέρθηκαν δεν αποτελεί πανάκια στο πρόβλημα της εξατομίκευσης των χρηστών, αλλά έχει σημαντικά προτερήματα και ελαττώματα. Μέσα σε αυτό το πλαίσιο, στο κεφάλαιο αυτό παρουσιάζονται τα υβριδικά συστήματα δημιουργίας συστάσεων τα οποία συνδυάζουν διαφορετικές προσεγγίσεις που μπορούν να εφαρμοστούν σε εφαρμογές ηλεκτρονικού εμπορίου. Η συγκεκριμένη προσέγγιση που θα παρουσιαστεί παρακάτω εστιάζεται σε ένα ηλεκτρονικό κατάστημα ενοικίασης και πώλησης ταινιών. Στην επόμενη ενότητα παρουσιάζονται ορισμοί και πληροφορίες από το πεδίο των συστημάτων δημιουργίας συστάσεων. Αναφέρονται, συγκρίνονται και αναλύονται οι σημαντικότερες ερευνητικές και εμπορικές προσεγγίσεις στο πεδίο των movie e-shops, οι οποίες υποστηρίζουν τη δημιουργία «έξυπνων» συστάσεων. Επιπλέον, παρουσιάζεται γιατί οι υβριδικές τεχνολογίες είναι πιο αλληλεπιδραστικές με τους χρήστες και παρέχουν καλύτερες συστάσεις. Ακόμη αναλύεται μία νέα προσέγγιση για ένα movie e-shop στο οποίο η γνώση για τους πελάτες και τις ταινίες εξάγεται από οντολογικά και usage mining δεδομένα σε συνδυασμό με τη βαθμολογία του χρήστη (customer-movie ratings) και τις τεχνικές συνταίριαξης (matching techniques) μεταξύ των πελατών. Αυτή η 23

36 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN ενοποίηση παρέχει επιπρόσθετη πληροφορία για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή καλών συστάσεων. Ακόμη και στην περίπτωση του coldstart προβλήματος το οποίο είναι η έλλειψη αρχικών πληροφοριών σχετικά με τη συμπεριφορά των χρηστών η προσέγγιση αυτή μπορεί να παράγει λογικές και σχετικές συστάσεις στους πελάτες. Οι συστάσεις αναμένεται να έχουν μεγαλύτερη ακρίβεια και να ταιριάζουν περισσότερο με τις προτιμήσεις των χρηστών, και συνεπώς να επιλέγονται τελικά από αυτούς. Στο τέλος του κεφαλαίου παρουσιάζονται μελλοντικές προκλήσεις και αναλύονται θέματα τα οποία παραμένουν αδιευκρίνιστα και πρέπει να επισημανθούν Background Το Συνεργατικό Φιλτράρισμα (Collaborative filtering) (GoldBerg et al., 1992; Resnick et al., 1994; Shardanand & Maes, 1995; Sarwar et al., 2001; Basilico & Hofmann, 2004) μοντελοποιεί τον τρόπο με τον οποίο οι άνθρωποι δέχονται συστάσεις από φίλους. Τα πλεονεκτήματά του περιλαμβάνουν τη δυνατότητα εφαρμογής του σε cross-domain recommenders και την απλότητα του σε σχέση με άλλες τεχνικές δημιουργίας συστάσεων, αφού δεν απαιτείται η εξαγωγή γνωρισμάτων ή η αναπαράσταση αντικειμένων αλλά μόνο η βαθμολόγηση (rating) αυτών από τους χρήστες. Τα ελαττώματά του περιλαμβάνουν το λεγόμενο πρόβλημα νέου αντικειμένου (new-item problem), όπου ένα νέο αντικείμενο δεν συστήνεται μέχρις ότου ένα συγκεκριμένο πλήθος χρηστών να το αξιολογήσουν, και το περισσότερο διαδεδομένο πρόβλημα νέου χρήστη (new-user problem), που είναι εκείνο κατά το οποίο ένας νέος χρήστης εγγράφεται στο σύστημα και δεν έχει βαθμολογήσει αρκετά αντικείμενα, οπότε ο recommender δεν μπορεί να δημιουργήσει ακριβής συστάσεις γι αυτόν. Ένα ακόμη πρόβλημα είναι το sparsity problem, στο οποίο ο αριθμός των διαθέσιμων βαθμολογήσεων (ratings) είναι πολύ μεγαλύτερος από τον αριθμό των ratings που προβλέπονται από τον recommender. Το collaborative filtering είναι επίσης ευαίσθητο στις επιθέσεις κακόβουλων χρηστών. Οι επιθέσεις αυτές μπορούν να συμβάλλουν στην ενίσχυση ενός αντικειμένου ή στο αντίθετο. Το Φιλτράρισμα Βασισμένο στο Περιεχόμενο (Content-based filtering) (Balabanovic & Shoham, 1997; Pazzani, 1999; Mooney & Roy, 2000) από την άλλη πλευρά παρουσιάζει παρόμοιους περιορισμούς με το collaborative filtering. Αυτό συμβαίνει επειδή βασίζεται στο φιλτράρισμα αντικείμενο με αντικείμενο και μερικές φορές τα αποτελέσματα των συστάσεων χαρακτηρίζονται από έλλειψη ποικιλότητας. Η διαδικασία εξαγωγής γνωρισμάτων όταν για παράδειγμα πρόκειται για πολυμεσικό περιεχόμενο μπορεί να είναι ιδιαίτερα δύσκολη και η κατάλληλη παρουσίαση των αντικειμένων να μην είναι εύκολη. Το πρόβλημα του νέου χρήστη υπάρχει και σε αυτή την περίπτωση. Παρόλο αυτά, το content-based filtering μπορεί να δώσει καλύτερα αποτελέσματα, όταν χρησιμοποιείται με μεθόδους implicit feedback (έμμεσης ανάδρασης) όπως είναι η καταγραφή των αγορών που έχει κάνει ο χρήστης και του ιστορικού των αναζητήσεων στη βάση με τα προϊόντα. Ενώ το collaborative filtering τις περισσότερες φορές απαιτεί την αξιολόγηση των προϊόντων ευθέως από το χρήστη (explicit feedback). Το Δημογραφικό Φιλτράρισμα (Demographic Filtering) (Pazzani, 1999) μπορεί να χρησιμοποιηθεί για την εξαγωγή συστάσεων βασισμένες σε στερεότυπα. Όμως, προκύπτουν θέματα που πρέπει να ληφθούν υπόψη όπως: πώς θα ανακτηθούν οι πληροφορίες που αφορούν προσωπικά δεδομένα του χρήστη και ποια είναι η 24

37 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN πολιτική της εταιρίας σε σχέση με την προστασία προσωπικών δεδομένων απέναντι στον πελάτη. Συγκεκριμένα, η εχεμύθεια αποτελεί σημαντικό θέμα στις τεχνικές του demographic και του collaborative filtering. Τέλος, οι στατιστικές μέθοδοι (statisticsbased methods) (Schafer et al., 2001) δεν παρέχουν εξατομίκευση αλλά αν λάβει κανείς υπόψη την ευκολία στον τρόπο υλοποίησής τους τότε τα αποτελέσματα που δίνουν είναι ιδιαίτερα αξιόλογα. Πολλά συστήματα τις ενσωματώνουν στην στρατηγική που ακολουθούν για τη δημιουργία συστάσεων ώστε να προκύψει μία πιο «σταθερή» τεχνική. Εξαιτίας των αδυναμιών της κάθε μεθόδου δημιουργίας συστάσεων, προτάθηκαν τα υβριδικά μοντέλα (Burke, 2002) με στόχο να συνδυάσουν τη στιβαρότητα και να εξαλείψουν τα ελαττώματα των ξεχωριστών τεχνικών. Τα υβριδικά συστήματα συστάσεων συνδυάζουν περισσότερες από μία τεχνικές δημιουργίας συστάσεων με σκοπό να παρέχουν στους χρήστες συστάσεις με περισσότερη ακρίβεια. Σαν αποτέλεσμα τα υβριδικά μοντέλα λειτουργούν σε περισσότερο από μια πηγές δεδομένων (collaborative δεδομένα, content δεδομένα ή demographic δεδομένα) και παρέχουν εφτά τρόπους να συνδυάσουν τις ξεχωριστές τεχνικές δημιουργίας συστάσεων σε έναν υβριδικό. Ο πιο απλός και άμεσος είναι ο σταθμισμένος συνδυασμός τεχνικών (weighted combination), ο οποίος χρησιμοποιεί την κάθε τεχνική για να εξάγει ένα σκορ σύστασης (recommendation score) για κάθε αντικείμενο και στη συνέχεια υπολογίζει το μέσο όρο των σκορ ώστε να προκύψει το τελικό σκορ σύστασης για κάθε αντικείμενο. Ο μεικτός συνδυασμός τεχνικών (mixed combination) εκτελεί όλους αλγόριθμους δημιουργίας συστάσεων ταυτόχρονα και παράγει την τελική λίστα συστάσεων συγχωνεύοντας (merging) τις λίστες που προέκυψαν από τους ξεχωριστούς αλγόριθμους. Ο συνδυασμός με μεταγωγή (switching combination) χρησιμοποιεί ένα κριτήριο το οποίο καθορίζει το είδος της τεχνικής που θα χρησιμοποιηθεί για συγκεκριμένες περιπτώσεις αιτήσεων συστάσεων. Ο υβριδικός συνδυασμός γνωρισμάτων (feature combination hybrid) συμπεριφέρεται στα collaborative δεδομένα ως επιπρόσθετα content δεδομένα και εφαρμόζει τεχνικές content-based στο επαυξημένο διάνυσμα του συνόλου των γνωρισμάτων. Ο υβριδικός σειριακός (cascade hybrid) εκτελεί όλες τις τεχνικές ακολουθιακά. Κάθε τεχνική λαμβάνει ως είσοδο τη λίστα με τις συστάσεις της προηγούμενης τεχνικής και βελτιώνει τις βαθμολογίες των αντικειμένων αξιολογώντας τα πάλι σύμφωνα με το σύνολο εισόδου. Ο υβριδικός επαυξημένων γνωρισμάτων (feature augmentation hybrid) εκτελεί και αυτός όλες τις τεχνικές ακολουθιακά όμως σε αυτή την περίπτωση κάθε τεχνική λαμβάνει σαν είσοδο μία αξιολόγηση ή μία κατάταξη που παράχθηκε από τον προηγούμενο αλγόριθμο. Τέλος, στον υβριδικό μέτα-επιπέδου (meta-level hybrid), κάθε τεχνική λαμβάνει σαν είσοδο το μοντέλο που δημιουργήθηκε από την προηγούμενη τεχνική και όχι μόνο τα στιγμιότυπα που παρήχθησαν από αυτή. Στο υπόλοιπο της ενότητας αυτής αναλύονται τα πιο πρόσφατα υβριδικά RSs ταξινομημένα ανά ερευνητικές περιοχές Movies Domain Στο σύστημα MovieMagician (Grant & McCalla, 2001) συνδυάζονται το collaborative και το content-based filtering και κατασκευάζονται κλίκες σχετικότητας (relativistic cliques), η οποίες είναι κλίκες από χρήστες που έχουν παρόμοια ενδιαφέροντα σχετικά με ταινίες ενός συγκεκριμένου είδους. Τα γνωρίσματα των ταινιών είναι οργανωμένα ιεραρχικά, έχοντας στην κορυφή πιο γενικευμένους όρους, όπως «Genre» και στη βάση πιο λεπτομερής όρους όπως «Action». Κατ αυτό τον τρόπο, 25

38 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN κάθε ταινία μπορεί να θεωρηθεί ως ένα στιγμιότυπο αυτής της ιεραρχίας και η ομοιότητα δύο ταινιών μπορεί να οριστεί ως ο βαθμός επικάλυψης των ιεραρχιών τους. Κάθε φορά που δημιουργείται ένα στιγμιότυπο μίας ταινίας κατασκευάζεται και μία λίστα ομοιότητας, που είναι μία λίστα με όλες τις ταινίες που μοιάζουν με τη συγκεκριμένη ταινία. Οι προτιμήσεις του χρήστη αποκτούνται μέσω της συνολικής βαθμολόγησης, με χρήση μίας 7-βαθμιας κλίμακας, για την ταινία ή μέσω βαθμολόγησης των ξεχωριστών γνωρισμάτων (π.χ. ηθοποιοί, υπόθεση, etc.). Για να προβλεφθεί ο βαθμός μίας ταινίας που δεν έχει δει ο χρήστης, το σύστημα βρίσκει: πρώτον τις κλίκες των χρηστών που έχουν παρόμοια ενδιαφέρονται με τον τρέχον χρήστη σχετικά με τη συγκεκριμένη ταινία και δεύτερον τη λίστα ομοιότητας, και στη συνέχεια αξιολογεί τους χρήστες της κλίκας σύμφωνα με το πόσο όμοιοι είναι με τον τρέχον χρήστη. Ο βαθμός που θα συσταθεί για την ταινία θα είναι ο βαθμός που έβαλε στη συγκεκριμένη ταινία ο χρήστης της κλίκας που μοιάζει περισσότερο με τον τρέχον χρήστη. Ένα πολύ σημαντικό γνώρισμα που το MovieMagician ενσωματώνει είναι η επεξήγηση των συστάσεων για τις ταινίες μέσω εξατομικευμένων αναφορών. Η προσέγγιση του Melville et al (2002) καλείται Content Booster Collaborative filtering (CBCF) και χρησιμοποιεί έναν content-based predictor για να κατασκευάσει έναν πλήρη πίνακα από ψευδο-βαθμολογίες χρηστών βασισμένο στον αραιό πίνακα από βαθμολογίες χρηστών που προέρχονται από το EachMovie σύνολο δεδομένων. Στη συνέχεια χρησιμοποιείται collaborative filtering εφαρμόζοντας τον τύπο του Pearson στον πλήρη πίνακα με τις ψευδοβαθμολογίες. Ο content-based predictor χρησιμοποιεί έναν naïve Bayesian classifier κειμένου στο πεδίο των ταινιών έχοντας σαν είσοδο ένα διάνυσμα από bag-of-words όπως ο τίτλος ή το cast και παράγει σαν έξοδο τις προβλεπόμενες βαθμολογίες για τις ταινίες που δεν έχει δει ο χρήστης. Ο collaborative filtering αλγόριθμος που χρησιμοποιήθηκε είναι ένας neighbourhood-based αλγόριθμος ο οποίος αρχικά υπολογίζει με τη σχέση του Pearson την ομοιότητα των χρηστών με τον τρέχον χρήστη, επιλέγει τους Ν περισσότερο όμοιους χρήστες και στη συνέχεια υπολογίζει τις προβλέψεις με συνδυασμούς βαρών των Ν πιο όμοιων χρηστών. Το Recommendz (Garden, 2004) είναι ένα cross-domain σύστημα το οποίο χρησιμοποιεί collaborative και content-based filtering για να δημιουργήσει συστάσεις, ενώ οι τελικές συστάσεις προκύπτουν από το συνδυασμό των βαρών των αρχικών συστάσεων, όπως συμβαίνει στο MovieMagician που παρέχει στους χρήστες τη δυνατότητα να βαθμολογήσουν τα ξεχωριστά χαρακτηριστικά μίας ταινίας. Επιπλέον, το σύστημα ενθαρρύνει τη χρήση διαφορετικών τύπων ανατροφοδοτήσεων: τη συνολική βαθμολόγηση μίας ταινίας, την επιλογή χαρακτηριστικών μια σχετικής ταινίας με την τρέχουσα, τον καθορισμό του βαθμού συμμετοχής (θετικός είτε αρνητικός) κάθε γνωρίσματος του αντικειμένου καθώς και την ποιότητα του κάθε γνωρίσματος. Επιπλέον, οι χρήστες μπορούν να προσθέσουν τα δικά τους χαρακτηριστικά που πιστεύουν ότι περιγράφουν καλύτερα μία ταινία, παρόλο που μία τέτοια δυνατότητα μπορεί να φορτώσει το σύστημα με πολλά πλεονάζοντα στοιχεία. Ο υβριδικός αλγόριθμος φιλτραρίσματος ενσωματώνει τρεις μετρικές ομοιότητας οι οποίες μετρούν την ομοιότητα μεταξύ δύο χρηστών: 1) τη σχέση του Pearson για τις βαθμολογήσεις των αντικειμένων, 2) τη σχέση του Pearson των ξεχωριστών χαρακτηριστικών και 3) τη σχέση του Pearson των κοινών χαρακτηριστικών που βαθμολογούνται. Αυτές οι τρεις τιμές ομοιότητας συνδυάζονται σε ένα σταθμισμένο μέσο όρο για να παράγουν τις προτεινόμενες βαθμολογίες μίας ταινίας στον τρέχον χρήστη. 26

39 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Το Cinemascreen (Salter & Antonopoulos, 2006; Cinemascreen, 2006) είναι επίσης ένα σύστημα που παρέχει συστάσεις για ταινίες. Αρχικά, χρησιμοποιεί collaborative filtering για να παράγει μία αρχική λίστα συστάσεων και στη συνέχεια δίνει τη λίστα αυτή σαν είσοδο σε ένα content-based αλγόριθμο. Με τον τρόπο αυτό το σύστημα ξεπερνά του πρόβλημα του νέου αντικειμένου, αφού η τελική λίστα συστάσεων μπορεί να περιέχει ταινίες που δεν έχουν βαθμολογηθεί, αλλά έχουν χαρακτηριστικά παρόμοια με αυτές που άλλοι χρήστες έχουν βαθμολογήσει. Το σύστημα χρησιμοποιεί μία μηχανή διαδικτύου η οποία συγκεντρώνει πληροφορίες για τις ταινίες και τις ώρες προβολής από πολλαπλές πηγές από τον Παγκόσμιο Ιστό. Ο collaborative filtering αλγόριθμος είναι ένας τυπικός αλγόριθμος που βασίζεται στη γειτονικότητα (neighbourhood-based). Αυτό σημαίνει ότι βρίσκει τους χρήστες που έχουν παρόμοιο ιστορικό βαθμολογήσεων με τον τρέχον χρήστη χρησιμοποιώντας τη σχέση του Pearson. Το σύστημα χρησιμοποιεί ένα κατώφλι για να ξεχωρίσει του χρήστες που μοιάζουν με τον τρέχον σε μεγάλο βαθμό σε σχέση με αυτούς που απλώς μοιάζουν. Οι βαθμολογίες για τον τρέχον χρήστη προκύπτουν από τις βαθμολογίες των χρηστών που είναι γειτονικοί σε αυτόν. Στη συνέχεια, η λίστα με τις collaborative filtering συστάσεις δίνεται σαν είσοδος στον content-based filtering αλγόριθμο. Ο τελευταίος προσθέτει τη βαθμολογία κάθε ταινίας στο σύνολο του κάθε γνωρίσματος της ταινίας (actors, directors, genre, etc.) και μετά υπολογίζεται ο μέσος όρος κάθε γνωρίσματος. Στη συνέχεια, για κάθε ηθοποιό, το σύστημα αναζητά τις ταινίες στις οποίες εμφανίζεται και προσθέτει το σκορ του ηθοποιού στο σκορ κάθε ταινίας. Ο Schafer et al. (2004) πρότεινε ένα ελαφρώς διαφορετικό είδος μοντέλου συστάσεων που είναι το meta-recommender σύστημα. Ένα meta-recommender σύστημα προσπελαύνει πολλές διαφορετικές πηγές πληροφοριών ή/και συστήματα δημιουργίας συστάσεων και επιστρέφει αποτελέσματα που σχετίζονται με το ερώτημα κάποιου χρήστη και αντανακλούν εφήμερες ανάγκες. Ένα στιγμιότυπο αυτού του μοντέλου στο πεδίο των ταινιών, το Metalens, έχει μία αρχική οθόνη προτιμήσεων, όπου ο τρέχον χρήστης μπορεί να επιλέξει τα γνωρίσματα που επιθυμεί να έχουν οι προτεινόμενες ταινίες και να καθορίσει και το βάρος του καθενός. Το σύστημα μορφοποιεί τις απαιτήσεις του χρήστη σε ένα ερώτημα και το προωθεί στις πηγές πληροφοριών, συγκεκριμένα στα Yahoo Movies, Rotten Tomatoes και Movielens. Το Yahoo Movies παρέχει τις πληροφορίες που αφορούν τις ταινίες, το Rotten Tomatoes παρέχει κριτικές των ταινιών και το Movielens παρέχει εξατομικευμένες προτάσεις βασισμένες σε collaborative filtering. Τα αποτελέσματα που προέρχονται από όλες τις πηγές ενώνονται και βαθμολογούνται σύμφωνα με το εκτεταμένο Boolean μοντέλο και στη συνέχεια παρουσιάζονται στον τρέχον χρήστη. Τα δυνατά σημεία ενός τέτοιου συστήματος συστάσεων είναι η ικανότητα να δημιουργεί εφήμερες και μακροχρόνιες συστάσεις, και ο συνδυασμός πολλαπλών τεχνικών δημιουργίας συστάσεων. Μια πρόσφατη βελτίωση στη διεπιφάνεια επικοινωνίας του Metalens με το χρήστη οδήγησε στο DynamicLens (Schafer, 2005), το οποίο χρησιμοποιεί τον εσωτερικό μηχανισμό του Metalens και επιπρόσθετα ενοποιεί τις «οθόνες» των προτιμήσεων και των συστάσεων σε μία. Ο χρήστης μπορεί να επιλέξει τα γνωρίσματα που επιθυμεί και να δει δυναμικά τις συστάσεις που επιφέρουν, κάνοντας έτσι ευκολότερη για το χρήστη την επιλογή των σωστών γνωρισμάτων και βαρών. 27

40 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN TV Domain Στο πεδίο της τηλεόρασης, το PTV (Smyth & Cotter, 2000) έχει να αντιμετωπίσει τα τηλεοπτικά προγράμματα και κανάλια που φορτώνονται συνεχώς στο σύστημα λόγω της εμφάνισης της ψηφιακής τηλεόρασης. Το PTV είναι ένας web-based recommender ο οποίος συνδυάζει το case-based reasoning με το collaborative filtering. Το σύστημα διαθέτει μία βάση στην οποία αποθηκεύει της πληροφορίες σχετικά με την εγγραφή των χρηστών στο σύστημα και τις βαθμολογίες τους για τα προγράμματα. Οι πληροφορίες του προφίλ περιλαμβάνουν γενικές προτιμήσεις των χρηστών όπως κανάλια και ώρες προβολής, καθώς και προγράμματα που ο χρήστης προτιμά ή απεχθάνεται. Το PTV διαθέτει επίσης και μία case-based βάση δεδομένων, η οποία αποθηκεύει πληροφορίες για όλα τα προγράμματα. Κάθε περίπτωση (case) είναι ένα διάνυσμα από χαρακτηριστικά (feature vector) και η ομοιότητα μεταξύ δύο περιπτώσεων (cases) είναι το ισοσταθμισμένο άθροισμα μεταξύ των αντίστοιχων χαρακτηριστικών τους. Για να μπορέσει να υπολογιστεί η ομοιότητα μεταξύ των προτιμήσεων του χρήστη και μίας περίπτωσης (given case), το προφίλ μετατρέπεται σε ένα διάγραμμα (profile schema), το οποίο αποτελεί μία αναπαράσταση του προφίλ βασισμένη στα χαρακτηριστικά (feature-based representation). Συνεπώς, το σύστημα υπολογίζει την ομοιότητα αντικείμενο προς αντικείμενο για να βρει προγράμματα όμοια με προηγούμενα που άρεσαν στο χρήστη. Χρησιμοποιείται, επίσης, το user-based collaboration filtering (συνεργατικό φιλτράρισμα βασισμένο στο χρήστη), το οποίο βρίσκει επιπλέον k παρόμοια προφίλ και ανακτά r προγράμματα από αυτά, τα οποία όμως απουσιάζουν από την αρχική λίστα συστάσεων Research Papers και Books Domain Το TechLens + (Torres et al., 2004) σύστημα συστάσεων στρέφεται στο πρόβλημα δημιουργίας συστάσεων επιστημονικών άρθρων (ο αριθμός των οποίων αυξήθηκε ραγδαία) στους ερευνητές τα οποία είναι πιθανό να τους ενδιαφέρουν. Συνδυάζει έναν k-nearest neighbor collaborative filtering αλγόριθμο μαζί με ένα TF-IDF (Van Rijsbergen, 1979) content-based filtering αλγόριθμο με στόχο τη δημιουργία συστάσεων. Μεταξύ των διάφορων συνδυασμών υλοποιήσεων, η μεικτή προσέγγιση είχε την καλύτερη απόδοση. Σε αυτή την προσέγγιση, οι δύο αλγόριθμοι συστάσεων εκτελούνται παράλληλα και ενώνουν τα αποτελέσματά τους οπότε προκύπτει η τελική λίστα με τις συστάσεις των άρθρων. Η λίστα βαθμολογείται σύμφωνα με ένα σκορ που προκύπτει από την άθροιση των δύο σκορ που υπολογίζονται από τους δύο αλγόριθμους. Το TechLens + διατηρεί ένα άρθρο, που περιέχει ιστορικά στοιχεία του προφίλ του χρήστη και αντικατοπτρίζει τα τρέχοντα ενδιαφέροντά του, και αποκτάται απευθείας από τα δεδομένα ανατροφοδότησης του χρήστη. Στον Huang et al. (2004), χρησιμοποιείται μια υβριδική graph-based προσέγγιση (GBHA) στο πεδίο των βιβλίων ενσωματώνοντας collaborative και content based filtering. Σε αυτή την προσέγγιση τα βιβλία, οι πελάτες και οι δοσοληψίες μοντελοποιούνται σε ένα γράφο δύο επιπέδων, ο οποίος αποτελείται από ένα επίπεδο από κόμβους βιβλίων, ένα επίπεδο από κόμβους πελατών και συνδέσμους μεταξύ των κόμβων-βιβλίων στους κόμβους-πελάτες, που αναπαριστούν τις αγορές δοσοληψίες. Κάθε πελάτης και κάθε βιβλίο αναπαρίσταται από διανύσματα χαρακτηριστικών που περιέχουν δημογραφικά δεδομένα, όπως το φύλο και ο τίτλος αντίστοιχα. Οι ακμές που συνδέουν τους κόμβους στο ίδιο επίπεδο αναπαριστούν την 28

41 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN ομοιότητα των συνδεδεμένων κόμβων, η οποία υπολογίζεται από μία συνάρτηση ομοιότητας (similarity function). Ο αλγόριθμος δημιουργίας συστάσεων θεωρείται πλέον ως ένας αλγόριθμος αναζήτησης σε γράφο (graph search algorithm). Για να παράξει βαθμολογία για ένα βιβλίο για τον τρέχον χρήστη, υπολογίζει το συντομότερο μονοπάτι από τον κόμβο του τρέχοντος πελάτη, στο επίπεδο των κόμβων-πελατών, στον κόμβο του συγκεκριμένου βιβλίου, στο επίπεδο των κόμβωνβιβλίων. Εάν το μονοπάτι περιέχει μόνο βιβλίο προς βιβλίο βάρη ομοιότητας τότε η δημιουργία συστάσεων είναι content-based, ενώ εάν περιέχει μόνο πελάτη προς πελάτη και συνδέσμους παρελθοντικών αγορών, τότε χρησιμοποιεί μόνο collaborative filtering. Άρα, ένα μονοπάτι που χρησιμοποιεί και τα δύο είδη ακμών χρησιμοποιεί την υβριδική προσέγγιση. Το Quickstep (Middleton, 2003) εφαρμόστηκε επίσης στο πεδίο των επιστημονικών άρθρων. Χρησιμοποιεί έναν θεματολογικό classifier, ο οποίος κατατάσσει τις ιστοσελίδες στις οποίες πλοηγούνται οι ερευνητές σύμφωνα με μία θεματολογική οντολογία. Ένα training set χρησιμοποιείται κατά την εκκίνηση για να αρχικοποιηθεί ο classifier. Στη συνέχεια, εμπλουτίζεται από τα ταξινομημένα άρθρα του συστήματος στο οποίο οι χρήστες πλοηγούνται. Συνεπώς, χρησιμοποιούνται σαν μια διαμοιραζόμενη δεξαμενή πληροφοριών και προσθέτουν μία αίσθηση collaboration στο σύστημα. Το Quickstep συγκεντρώνει με έμμεσο τρόπο (unobtrusive feedback) την πληροφορία ανάδρασης για να βρει τα άρθρα στα οποία έχει πλοηγηθεί ο χρήστης και χρησιμοποιεί απευθείας ανάδραση (explicit feedback) μόνο όταν παρουσιάζει τη λίστα με τις συστάσεις στο χρήστη. Για κάθε χρήστη διατηρεί ένα προφίλ, το οποίο είναι μία λίστα από θέματα η οποία περιλαμβάνει και τα ταξινομημένα άρθρα, και χρησιμοποιεί μία χρονικά φθίνουσα συνάρτηση, η οποία διατηρεί τα τρέχοντα ενδιαφέροντα των επιστημόνων. Οι τελικές συστάσεις προκύπτουν συσχετίζοντας τα τρέχοντα ενδιαφέροντα των χρηστών με τα ταξινομημένα άρθρα σε αυτά τα θέματα που ενδιαφέρουν τους χρήστες. Τελικά, τα αποτελέσματα ταξινομούνται σύμφωνα με μία τιμή που ονομάζεται recommendation confidence, η οποία βασίζεται στο πόσο «σίγουρο» είναι το σύστημα για την ορθότητα της ταξινόμησης των άρθρων. Το FoxTrot αποτελεί μία βελτιωμένη έκδοση του Quickstep, και έχει πολλές προσθήκες, όπως είναι η αναζήτηση στη βάση των άρθρων, οπτικοποιημένη αναπαράσταση του προφίλ του χρήστη, η οποία καθιστά ευκολότερη την εξαγωγή των δεδομένων ανάδρασης και τον υπολογισμό της λίστας συστάσεων μέσω collaborative και content-based filtering. Η χρήση της θεματολογικής οντολογίας και στα δύο συστήματα δίνει τη δυνατότητα της εύρεσης των προτιμήσεων του χρήστη χωρίς να δηλωθούν ευθέως από αυτόν Other Domains Το Windowls (Kazienko & Kolodziejski, 2005) είναι ένα υβριδικό RS το οποίο χρησιμοποιείται σε έναν ιστότοπο ηλεκτρονικού εμπορίου για windsurfing. Υποστηρίζει content-based filtering μέσω ενός αλγορίθμου κανόνων συσχέτισης ώστε να εντοπίσει αντικείμενα που συνήθως αγοράζονται μαζί. Για τους καταχωρημένους χρήστες παρέχει συνεχή εξατομίκευση χρησιμοποιώντας collaborative και demographic filtering. Από τους χρήστες ζητείται να δώσουν προσωπικά δεδομένα, που σχετίζονται με τις προτιμήσεις τους ή τη συμπεριφορά τους. Επιπλέον, το collaborative filtering εκμεταλλεύεται τα αντικείμενα που βαθμολογούν οι χρήστες ώστε να προτείνει αντικείμενα που έχουν αγοράσει άλλοι χρήστες με παρόμοιο γούστο. Μία ενδιαφέρουσα δυνατότητα του Windowls είναι αυτή της προσαρμοστικότητας. Κάθε 29

42 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN μέθοδος δημιουργίας συστάσεων έχει ένα βάρος, το οποίο σύμφωνα με το βαθμό που ο κάθε χρήστης επιλέγει τα αντικείμενα που του προτείνονται από αυτό, προσαρμόζεται ώστε να αντανακλά τη χρησιμότητα της μεθόδου γα το συγκεκριμένο πελάτη. Το Stef (Guo et al., 2005) είναι ένα άλλο RS το οποίο συνδυάζει collaborative και content-based filtering που βασίζεται στα σημασιολογικά χαρακτηριστικά των προϊόντων. Χρησιμοποιεί το SPR (Semantic Product Relevance), το οποίο βασίζεται στη σημασιολογική ομοιότητα και στην ταξινόμηση των προϊόντων. Η σημασιολογική ομοιότητα, που εκφράζεται με μία 5-βάθμια κλίμακα, ανατίθεται από τους ειδικούς στο συγκεκριμένο πεδίο και δείχνει τη σχέση μίας κλάσης προϊόντων με μία άλλη κλάση, υποκλάση ή υπερκλάση. Η ταξινόμηση των προϊόντων, που αναπαρίσταται από μία δενδρική δομή, ομαδοποιεί τα όμοια προϊόντα σε υποκλάσεις προϊόντων. Η διαδικασία δημιουργίας συστάσεων αρχικά χρησιμοποιεί το συσχετισμό που βασίζεται στο μέτρο της ομοιότητας για να υπολογίσει την ομοιότητα μεταξύ δύο αντικειμένων. Στη συνέχεια υπολογίζει τη σημασιολογική ομοιότητα του συγκεκριμένου αντικειμένου και της κατηγορίας αυτού χρησιμοποιώντας το μέτρο της ομοιότητας του διανυσματικού συνημίτονου και προσθέτει τις δύο τιμές της ομοιότητας ώστε να υπολογίσει την τελική τιμή της ομοιότητας. Οι k υψηλότερες τιμές επιλέγονται ως τα περισσότερα όμοια αντικείμενα και προτείνονται στο χρήστη. Το Viscors (Kim et al., 2004) είναι ένα RS υλοποιήθηκε για WAP ώστε να βοηθήσει τους χρήστες να επιλέξουν το φόντο (wallpapers) που τους αρέσει. Για τους νέους πελάτες, χρησιμοποιεί collaborative filtering το οποίο βασίζεται στο προφίλ του χρήστη, που είναι ο πίνακας με τις βαθμολογίες. Η μονάδα του collaborative filtering υπολογίζει τα k «κοντινότερα» σύμφωνα με τη neighbor-based σχέση του Pearson. Στη συνέχεια δημιουργεί μία λίστα με συστάσεις βασισμένη σε ένα σκορ που ονομάζεται Purchase Likeness Score, η οποία αποτελείται από εικόνες που δεν έχει προσπελάσει ο χρήστης. Ο χρήστη μετά μπορεί να αγοράσει το συγκεκριμένο wallpaper ή να το χρησιμοποιήσει ως ερώτημα για να βρει παρόμοια με αυτό wallpapers. Η δυνατότητα αυτή συνδυάζει το Content Based Information Retrieval (CBIR) και δεδομένα ανάδρασης: το wallpaper στο ερώτημα συγκρίνεται ως προς τα οπτικά χαρακτηριστικά του με τα υπόλοιπα wallpapers της βάσης και από αυτά επιστρέφονται τα περισσότερο όμοια με το αρχικό. Ο χρήστης μπορεί να σημειώσει τα προτεινόμενα wallpapers ως αποδεκτά ή όχι. Η τελευταία δυνατότητα αποτελεί μία διαδικασία η οποία συνεχώς βελτιώνει το αρχικό ερώτημα μέχρι να μάθει το σύστημα τα τρέχοντα ενδιαφέροντα του χρήστη. Το FDRAS (Jung et al., 2003) είναι ένα σύστημα που χρησιμοποιείται για τη δημιουργία συστάσεων υφασμάτων. Σε αυτό έχει χρησιμοποιηθεί ένα πλήθος από επίθετα τα οποία περιγράφουν την υφή των υφασμάτων και 512 χρήστες έχουν εκτιμήσει, με χρήση μίας 5-βάθμιας κλίμακας, για κάθε ύφασμα πόσο περιγράφεται από κάθε επίθετο. Για κάθε επίθετο υπολογίζεται ο μέσος όρος των βαθμολογιών που έδωσαν οι χρήστες και τα επίθετα με τη μεγαλύτερη βαθμολογία επιλέγονται ως εκείνα που περιγράφουν καλύτερα το ύφασμα. Όταν ο χρήστης εισέρχεται στο σύστημα, του ζητείται να βαθμολογήσει ένα πλήθος από υφάσματα και στη συνέχεια μπορούν να του γίνουν συστάσεις με δύο τρόπους. Είτε με το παραδοσιακό collaborative filtering και τη σχέση του Pearson, το οποίο χρησιμοποιείται μαζί με ένα χαρακτηριστικό γνώρισμα που αντιπροσωπεύει τη γειτονικότητα ώστε να δημιουργήσει ομάδες σύμφωνα με την ηλικία, το φύλλο και την περιοχή. Επιπλέον χρησιμοποιείτε το 30

43 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN content-based filtering μέσω χρωματικών ιστογραμμάτων και συντελεστών που περιγράφουν τα σχέδια των υφασμάτων. Οι προβλέψεις και των δύο μεθόδων υπολογίζονται για ένα τρέχον ύφασμα και στη συνέχεια τα δύο σκορ προστίθενται ώστε να δώσουν την τελική βαθμολογία του υφάσματος. Στους παρακάτω πίνακες, παρουσιάζεται μία σύγκριση μεταξύ των παραπάνω RSs. 31

44 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN User-item matrix Feature vectors History of purchases Demographic features Stereotyping Training set Manual IR techniques i.e. TF-IDF Clustering Classifiers Explicit feedback Implicit feedback Semantic feedback Domain knowledge Weighted Mixed Meta-level Cascade Feature augmented Switching Featurecombination MovieMagician X X X X X X CBCF X X X X X Recommendz X X X X Cinemascreen X X X Metalens PTV X X X X X X Quickstep X X X X X X X X GBHA X X X X TechLens X X X X X Viscors X X X X X X Stef X X X X X FDRAS X X X X X Windowls X X X X X Πίνακας 2: Σύγκριση των διάφορων RSs που αναλύθηκαν. 32

45 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Column Description User-item ratings matrix Feature vectors History of purchases Demographic features Stereotyping Training set Manual IR techniques Clustering Classifiers Explicit feedback Implicit feedback Semantic feedback Domain knowledge Weighted Mixed Meta-level Cascade Feature augmented Switching Feature combination Matrix storing the historical user ratings. Vectors of features that represent an item. The vectors store usually an integer or Boolean value that indicates the amount of a feature in an item. Historical data usually in forms of listings. Demographic data about users e.g. age, sex, occupation, etc. Use of demographic features to build stereotypes in order to classify users in certain categories. A set of examples to initialize the profile of a user or to train a classifier. User sets his own parameters. Information retrieval techniques, for example TF-IDF algorithm. Grouping. Neural nets, decision trees, association rules, etc. User provides explicitly information. User behaviour is observed and information about the user is inferred. User provides information about particular features of the items he prefers. Uses domain knowledge. Uses weighted combination hybrid. Uses mixed combination hybrid. Uses meta-level combination hybrid. Uses cascade combination hybrid. Uses feature augmented combination hybrid. Uses switching combination hybrid. Uses feature combination hybrid. Πίνακας 3: Ειδικά χαρακτηριστικά για τη σύγκριση των RSs. Η αναπαράσταση του προφίλ που χρησιμοποιείται από τα περισσότερα συστήματα είναι η κλασική του πίνακα με τους βαθμούς που έδωσε ο χρήστης σε αντικείμενα (user-item ratings matrix). Διανύσματα γνωρισμάτων χρησιμοποιήθηκαν από το σύστημα συστάσεων επιστημονικών άρθρων TechLens, και από το graph-based μοντέλο (GBHA). Επιπρόσθετα, το Quickstep χρησιμοποιεί μία οντολογία για να αντικατοπτρίσει το προφίλ του χρήστη ως μία δενδρική δομή από υψηλού επιπέδου έννοιες. Τα συστήματα δημιουργίας συστάσεων συνήθως ξεκινούν με ένα άδειο προφίλ και περιμένουν να αλληλεπιδράσουν με το χρήστη για να μπορέσουν να μάθουν ποιες είναι οι προτιμήσείς του. Το FDRAS, ένα σύστημα που δημιουργεί συστάσεις σχετικά με τη μόδα, αποτελεί μία εξαίρεση διότι απαιτεί από το χρήστη να βαθμολογήσει ένα πλήθος από δείγματα υφασμάτων προκειμένου να εκπαιδευτεί με ένα συγκεκριμένο σύνολο για να μπορέσει να αρχικοποιηθεί ο 33

46 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN μηχανισμός δημιουργίας συστάσεων. Επιπλέον, το Quickstep έχει την επιθυμητή ιδιότητα να μπορούν οι χρήστες να προσθέσουν χειροκίνητα, οποιαδήποτε χρονική στιγμή, πληροφορίες σχετικά με τις προτιμήσεις τους μέσω οπτικών αναπαραστάσεων του προφίλ τους. Σχετικά με τα μοντέλα μάθησης που χρησιμοποιούνται από τα συστήματα δημιουργίας συστάσεων, το CBCF χρησιμοποιεί το naïve classifier για να συμπληρώσει τον πίνακα αντικειμένων του χρήστη με τις υπάρχουσες τιμές. Το Quickstep χρησιμοποιεί έναν k-nearest neighbor classifier για να ταξινομήσει διάφορα επιστημονικά άρθρα σε θεματικές ενότητες. Τα δύο πολυμεσικά συστήματα δημιουργίας συστάσεων, Viscors και FDRAS, χρησιμοποιούν Content-Based Image Retrieval Techniques, όπως είναι τα χρωματικά ιστογράμματα για να βρουν παρόμοιες εικόνες. Τα FDRAS χρησιμοποιούν και ταξινόμηση με βάση δημογραφικά δεδομένα όπως το φύλο και η ηλικία. Τα άλλα συστήματα βασίζονται στην ομοιότητα του προφίλ ως προς τα αντικείμενα και δεν χρησιμοποιούν μοντέλα μάθησης. Ο τύπος των δεδομένων ανάδρασης (feedback) που χρησιμοποιείται ευρέως είναι εκείνα που αποκτούνται απευθείας από το χρήστη και όχι εκείνα που αποκτούνται από το ίδιο το σύστημα χρησιμοποιώντας αφανής μηχανισμούς. Όμως κάποια συστήματα, όπως είναι το Quickstep και το TechLens, διαθέτουν τους κατάλληλους αλγόριθμους που τους επιτρέπουν να εξάγουν το προφίλ των χρηστών και τις προτιμήσεις των τελευταίων χωρίς να δηλωθούν ευθέως από τους ίδιους. Τα συστήματα αυτά παρατηρούν την πλοήγηση των χρηστών χωρίς να τους «ενοχλούν» και συμφωνά με αυτή συνάγουν τις προτιμήσεις τους. Παρόλο που η αφανής απόκτηση δεδομένων ανάδρασης έχει μειονεκτήματα σε σχέση με την απευθείας, σε μερικά πεδία εφαρμογών οι χρήστες είναι απρόθυμοι να παρέχουν λεπτομερής πληροφορίες σχετικά με τις προτιμήσεις τους. Σε αυτές τις περιπτώσεις η υβριδική μέθοδος που συνδυάζει τη χρήση και των δύο τύπων δεδομένων ανάδρασης αποτελεί την καλύτερη λύση. Επιπλέον, υπάρχει ένα ιδιαίτερο είδος δεδομένων απευθείας ανάδρασης (explicit feedback), που είναι τα σημασιολογικά δεδομένα ανάδρασης, όπου οι χρήστες βαθμολογούν συγκεκριμένα χαρακτηριστικά των αντικειμένων. Τα σημασιολογικά δεδομένα ανάδρασης μπορούν να παρέχουν μία πιο λεπτομερή αξιολόγηση ενός αντικειμένου και μία καλύτερη αναπαράσταση των προτιμήσεων του χρήστη. Μόνο τα MovieMagician και Recommendz χρησιμοποιούν αυτού του είδους δεδομένα ανάδρασης για το πεδίο των ταινιών. Τέλος, τα συστήματα δημιουργίας συστάσεων έχουν ταξινομηθεί σε συνδυαστικές κλάσεις όπως παρουσιάζονται στον Burke (2002). Ο σταθμισμένος συνδυασμός (weighted combination) χρησιμοποιείται από τα συστήματα Stef και Windowls. Ο συνδυασμός αυτός είναι ο πιο άμεσος και απλός, ενώ παρέχει ευελιξία στην ενημέρωση του βάρους κάθε τεχνικής. Όμως, θεωρητικά δεν επιλύει το πρόβλημα νέου αντικειμένου, στο οποίο ανατίθεται ο μικρότερος βαθμός αφού δεν έχει αξιολογηθεί από κανένα χρήστη, όπως συμβαίνει στο συνεργατικό φιλτράρισμα. Στο μεικτό υβριδικό, που χρησιμοποιείται από το PTV και το TechLens, το πρόβλημα νέου αντικειμένου αντιμετωπίζεται από το content-based module το οποίο παράγει μία ειδική λίστα με k περισσότερο όμοια αντικείμενα. Το MovieMagician σύστημα χρησιμοποιεί ένα συνδυασμό συνεργατικού και με βάση το περιεχόμενο φιλτράρισμα, υπολογίζοντας αρχικά μία λίστα από όμοιες ταινίες για κάθε ταινία και στη συνέχεια εφαρμόζοντας συνεργατικό φιλτράρισμα σε όλες τις ταινίες. Το CBCF χρησιμοποιεί τον ίδιο συνδυασμό χρησιμοποιώντας τον απλό ταξινομητή για να προβλέψει τις 34

47 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN βαθμολογίες των ταινιών τις οποίες δεν έχει βαθμολογήσει ο χρήστης. Ένα υβριδικό σύστημα μεταγωγής (switching hybrid) έχει χρησιμοποιηθεί από το graph-based recommender (GBHA). Το σύστημα εναλλάσσει τις δύο τεχνικές σύμφωνα με το επίπεδο που διασχίζεται από το συντομότερο μονοπάτι από τον τρέχον πελάτη στο βιβλίο-στόχο. Στο Viscors, χρησιμοποιείται ένα είδος διαδοχικών συνδεδεμένων συνδυασμών. Στην αρχή χρησιμοποιείται collaborative filtering και στη συνέχεια content based filtering για τα wallpapers που επιλέγει ο χρήστης. 2.2 Τα στάδια επεξεργασίας των συστημάτων δημιουργίας συστάσεων (RSs) Παρά το γεγονός ότι τα RSs είναι πολύπλοκες εφαρμογές που συνδυάζουν διάφορα μοντέλα, αλγορίθμους και ευρετικές μεθόδους, πολλά από αυτά εφαρμόζουν τα βασικά βήματα της διαδικασίας Ανακάληψης Γνώσης σε Βάσεις Δεδομένων (KDD). Η διαδικασία αυτή περιλαμβάνει τα βήματα που φαίνονται και στην παρακάτω εικόνα και είναι: η Επιλογή (Data Selection), η Προεπεξεργασία και Μετατροπή (Data Pre-Processing & Transformation), η Ανάλυση (Data Analysis), η Ερμηνεία και η Αξιολόγηση (Interpretation & Evaluation), και η Αναπαράσταση (Presentation) των Δεδομένων Επιλογή των δεδομένων Εικόνα 3: Τα στάδια λειτουργίας των RSs. Το βήμα αυτό αναφέρεται στην επιλογή του συνόλου των δεδομένων το οποίο θα χρησιμοποιηθεί στη δημιουργία των συστάσεων και μπορεί να προέρχεται από διάφορες πηγές. Η συλλογή σωστών, κατάλληλων και επαρκών δεδομένων αποτελεί κρίσιμη εργασία για κάθε RS. Συγκεκριμένα, μπορεί να περιλαμβάνει δεδομένα που αφορούν το χρήστη (δημογραφικά, μορφωτικά, ικανοτήτων, ενδιαφερόντων, προτιμήσεων, κτλ), τη χρήση (επιλεγμένες επιλογές, βαθμολογίες, συχνότητα χρήσης, ακολουθίες ή συσχετίσεις ενεργειών, κτλ.) και το περιβάλλον χρήσης (υλικό, λογισμικό όπως η έκδοση του φυλλομετρητή, τα διαθέσιμα plug-ins, το bandwidth, συσκευή οθόνης). Τα δεδομένα μπορούν να συγκεντρώνονται είτε απευθείας από το χρήστη (συμπληρώνοντας φόρμες με τις προτιμήσεις του είτε βαθμολογώντας μία λίστα από αντικείμενα) είτε με αφανής μηχανισμούς (τα δεδομένα αποκτώνται χωρίς να αρχικοποιηθεί το σύστημα από το χρήστη, αλλά χρησιμοποιώντας κανόνες, σχέδια αναγνώρισης και τυποποιημένους συλλογισμούς). Παρόλο αυτά και στις δύο προσεγγίσεις, έχουμε να χειριστούμε διαφορετικά αλλά εξίσου σημαντικά προβλήματα. Στην περίπτωση της δημιουργίας προφίλ με δεδομένα από το χρήστη, ο τελευταίος είναι συνήθως απρόθυμος να συμπληρώσει ερωτηματολόγια και να δώσει προσωπικές πληροφορίες σε on-line εφαρμογές, το κάνει μόνο όταν απαιτείται από το σύστημα. Όμως και πάλι στην περίπτωση αυτή τα δεδομένα που δίνουν είναι συνήθως λίγα ή λανθασμένα. Από την άλλη πλευρά ο αφανής τρόπος απόκτησης δεδομένων ανάδρασης, παρόλο που δεν επηρεάζεται από την αρνητική στάση των χρηστών, έχει να αντιμετωπίσει προβλήματα που προέρχονται από το πεδίο της 35

48 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN παραβίασης των προσωπικών δεδομένων και της έλλειψης ανωνυμίας. Η διαδικασία της εξατομίκευσης προσπαθεί να προσδιορίσει την ταυτότητα των χρηστών, καταγράφει λεπτομερώς τη δικτυακή (online) συμπεριφορά τους και εξάγει τις προτιμήσεις και τις ανάγκες τους με ένα τρόπο που δεν τον καταλαβαίνουν ούτε και τον ελέγχουν οι χρήστες (Kramer et al., 2000; Mesquita et al., 2002). Οι πιο σημαντικές πληροφορίες που ένα RS μπορεί να χρησιμοποιήσει είναι: τα δεδομένα εγγραφής (login/password), το ιστορικό του χρήστη, δεδομένα πλοήγησης, αναζήτησης λέξεων-κλειδιών, υποστήριξης, αξιολόγησης των προϊόντων/υπηρεσιών, κτλ Προεπεξεργασία των δεδομένων Μετά από τη συγκέντρωση των δεδομένων, η οποία αποτελεί μία συνεχή εργασία, το επόμενο βήμα είναι η προεπεξεργασία τους. Το βήμα αυτό περιλαμβάνει το καθάρισμά τους από άχρηστες πληροφορίες και τη μετατροπή τους σε εσωτερικές αναπαραστάσεις μοντέλων, που θα επιτρέπουν την περεταίρω επεξεργασία και ενημέρωση τους. Το καθάρισμα των δεδομένων απομακρύνει όλες τις άσχετες εγγραφές από τα log αρχεία του web server με σκοπό να εξυπηρετήσει το χειρισμό τους. Για παράδειγμα, εγγραφές που δεν παρουσιάζουν κάποιο ενδιαφέρον απομακρύνονται και δεδομένα που λείπουν συμπληρώνονται. Επιπλέον, σε αυτό το στάδιο μπορούν να χρησιμοποιηθούν αλγόριθμοι συμπίεσης δεδομένων για να μικρύνει το μέγεθος και οι διαστάσεις των δεδομένων και να επιτευχθεί αποδοτική εξόρυξη των σχηματορφών (patterns) των δεδομένων. Τα προβλήματα που παρουσιάζονται συχνά στη φάση αυτή περιλαμβάνουν: την ταυτοποίηση του χρήστη, την ταυτοποίηση του session (συνόδου), την ολοκλήρωση του μονοπατιού και την ταυτοποίηση του transaction. Ταυτοποίηση χρήστη. Διαδικασίες εγγραφής και login/password, καθώς και συνδυασμός άλλων ευρετικών μεθόδων μπορούν να χρησιμοποιηθούν για να διασφαλίσουν τη μοναδική ταυτοποίηση του χρήστη. Ταυτοποίηση του session. Το session είναι ένα σύνολο από επιλογές (κλικ) του χρήστη σε έναν ή και περισσότερους web servers και η ταυτοποίησή του έχει σαν στόχο να ομαδοποιήσει τις προσπελάσεις στις σελίδες που γίνονται από κάποιον χρήστη σε ένα session. Χρονικά παράθυρα μπορούν να χρησιμοποιηθούν για να προσδιορίσουν τα διαφορετικά sessions ενός χρήστη. Ολοκλήρωση του μονοπατιού. Αυτό το πρόβλημα προκαλείται από το τοπικό caching και τις ενέργειες των proxy server που δημιουργούν κενά στα μονοπάτια προσπέλασης του χρήστη. Το σχετικό log για τον προσδιορισμό της σελίδας από την οποία ήρθε μία αίτηση καθώς και η τοπολογία του site μπορούν να χρησιμοποιηθούν για να καλυφθεί το συγκεκριμένο θέμα. Ταυτοποίηση του transaction. Αυτό το πρόβλημα (η ομαδοποίηση των αναφορών για κάθε χρήστη) μπορεί να λυθεί με τη χρήση χρονικών παραθύρων τα οποία διαιρούν μία σύνοδο σύμφωνα με τις χρονικές παύσης (καθορισμένα κατώφλια). 36

49 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Στη συνέχεια, μπορεί να κατασκευαστεί ο χάρτης με τις απαιτούμενες δομές των δεδομένων. Τα μοντέλα αυτά μπορεί να είναι είτε μεμονωμένα είτε ολοκληρωμένα (στην περίπτωση των ομάδων χρηστών) προφίλ Ανάλυση των δεδομένων Στη συνέχεια, ακολουθεί η εφαρμογή στατιστικών και data mining τεχνικών, με σκοπό να εντοπιστούν οι ενδιαφέρουσες σχηματομορφές στα προ-επεξεργασμένα δεδομένα. Οι πιο ευρέως γνωστές τεχνικές που έχουν χρησιμοποιηθεί στην ανάλυση δεδομένων περιλαμβάνουν τις clustering, classification και association rule mining, sequential pattern discovery και prediction. Ακολουθεί μία πιο λεπτομερής περιγραφή αυτών των τεχνικών. Clustering. Οι αλγόριθμοι clustering χρησιμοποιούνται κυρίως για σκοπούς κατάτμησης. Ο στόχος τους είναι να εντοπίσουν «φυσικές» ομάδες στις συλλογές των δεδομένων (π.χ. προφίλ πελατών, προϊόντα βάσεων δεδομένων, transaction βάσεων δεδομένων, κτλ.). Υπολογίζουν ένα μέτρο ομοιότητας στη συλλογή με σκοπό να ομαδοποιήσουν αντικείμενα που έχουν παρόμοια χαρακτηριστικά. Τα αντικείμενα αυτά μπορούν να είναι είτε χρήστες, που παρουσιάζουν παρόμοια on-line συμπεριφορά, είτε σελίδες, που χρησιμοποιούνται από τους χρήστες με παρόμοιο τρόπο. Οι παραγόμενες ομάδες (τμηματοποίηση της βάσης δεδομένων σε cluster από παρόμοιους ανθρώπους π.χ. πελάτες, επίδοξους πελάτες, τους πιο επικερδείς πελάτες, τους πιο ενεργούς πελάτες, τους παρεκκλίνοντες πελάτες, κτλ.) μπορούν να βασίζονται σε πολλά διαφορετικά χαρακτηριστικά γνωρίσματα των πελατών (π.χ. συμπεριφορά πλοήγησης, αγοραστική συμπεριφορά ή δημογραφικά στοιχεία). Υπάρχουν διαθέσιμοι διάφοροι αλγόριθμοι clustering: Hierarchical Agglomerative Clustering (HAC) (Rasmussen, 1992; Willett, 1988), k-means clustering (MacQueen, 1967), Self-Organizing Maps (SOMs) or Kohonen clustering (Kohonen, 1997). Classification. Ο σημαντικότερος στόχος των classification αλγορίθμων είναι να ανατεθούν τα αντικείμενα σε ένα σύνολο από προκαθορισμένες κλάσεις. Αυτές οι κλάσεις συνήθως αντιπροσωπεύουν διαφορετικά προφίλ χρηστών και το classification εκτελείται χρησιμοποιώντας τα επιλεγμένα χαρακτηριστικά με υψηλή ικανότητα διακριτοποίησης αφού αναφέρεται στο σύνολο των κλάσεων που περιγράφουν το κάθε προφίλ. Αυτή η πληροφορία μπορεί να χρησιμοποιηθεί για να προσελκύσει πιθανούς πελάτες. Αντίθετα προς το clustering, το οποίο περιλαμβάνει μη εποπτευόμενη μάθηση, στο classification απαιτείται ένα σύνολο εκπαίδευσης δεδομένων με προεκχωρημένες ετικέτες στις κλάσεις (το classification έχει κατηγοριοποιηθεί στις τεχνικές της εποπτευόμενης μάθησης των μηχανών). Στη συνέχεια, ο classifier (παρατηρώντας την ανάθεση των κλάσεων στο σύνολο εκπαίδευσης) μαθαίνει να αναθέτει νέα αντικείμενα δεδομένων σε μία από τις κλάσεις. Είναι συχνή η περίπτωση κατά την οποία εφαρμόζεται το clustering πριν από το classification για να καθορίσει το σύνολο των κλάσεων. Ορισμένοι ευρέως χρησιμοποιούμενοι αλγόριθμοι classification είναι οι: K-Nearest Neighbor (KNN), Decision Trees, Naïve Bayes and Neural Networks (Chakrabati, 2003). 37

50 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Association Rule Mining. Οι κανόνες συσχέτισης συνδέουν ένα ή περισσότερα γεγονότα. Ο στόχος τους είναι να ανακαλύψουν συσχετίσεις και συνδυασμούς μεταξύ διαφορετικών τύπων πληροφοριών χωρίς εμφανή σημασιολογική εξάρτηση. Στο πεδίο της εξατομίκευσης στον Παγκόσμιο Ιστό, η μέθοδος αυτή μπορεί να υποδείξει συσχετίσεις μεταξύ σελίδων οι οποίες δεν συνδέονται άμεσα και να αποκαλύψει προηγούμενες άγνωστες συσχετίσεις μεταξύ ομάδων χρηστών με συγκεκριμένα ενδιαφέροντα (Agrawal et al., 1993; Chen et al., 1996; Chen et al., 1998). Τέτοιου είδους πληροφορία μπορεί να αποδειχτεί πολύτιμη για e-commerce και e-business ιστότοπους, αφού μπορεί να χρησιμοποιηθεί για να βελτιώσει το Customer Relationship Management (CRM). Ο περισσότερο γνωστός αλγόριθμος εύρεσης κανόνων συσχέτισης είναι ο Apriori (Agrawal & Srikant, 1994) Παραγωγή των συστάσεων, αξιολόγηση και αναπαράστασή τους Μετά την ανάλυση των δεδομένων, η παραγόμενη γνώση πρέπει να μετατραπεί σε «έξυπνη» πληροφορία, αλληλεπίδραση ή διεπαφή για κάθε πελάτη. Στο βήμα αυτό οι σχηματομορφές που βρέθηκαν πρέπει να μεταφραστούν για να μπορέσουν να είναι κατανοητές από τους χρήστες. Ουσιαστικά, κάθε σχηματομορφή αποτελεί μία ξεχωριστή e-market ευκαιρία και η εγκυρότητα, η πρωτοτυπία και η χρησιμότητά της πρέπει να αξιολογηθεί και να αξιοποιηθεί με διαφορετικό τρόπο. Τελικά, το RS παρουσιάζει τις παραγόμενες συστάσεις σε μία κατάλληλη για το χρήστη μορφή. Ο σκοπός τους είναι να παρέχουν πρόσβαση σε συγκεκριμένα αντικείμενα μέσω διαφημιστικών συνδέσμων, όπως αυτοί των cross-selling ή up-selling επιλογών. Για παράδειγμα: Cross-selling. Προτείνει προϊόντα συσχετιζόμενα με εκείνα που ο χρήστης προσπελαύνει την τρέχουσα χρονική στιγμή. Σε πολλές περιπτώσεις, αυτά τα συμπληρωματικά προϊόντα π.χ. το να προτείνει κάποιο μουσικό CD μαζί με ένα βιβλίο ή μπαταρίες μαζί με παιχνίδια. Up-selling. Προτείνει προϊόντα πιθανόν πιο ακριβά ή εξελιγμένα σε σχέση με εκείνα που έχει επιλέξει ο χρήστης. Ο πελάτης θα ενημερωθεί για διαθέσιμα προϊόντα στο αμέσως επόμενο τιμολογιακό επίπεδο, τα οποία μπορεί να μην γνώριζε. Ο βαθμός εφαρμογής αυτής της τακτικής εξαρτάται από τον τύπο των προϊόντων και επιπλέον εφαρμόζεται σε cross-selling. Opinions of other customers. Προτείνονται επιπρόσθετα προϊόντα τα οποία ο πελάτης πιθανόν να θέλει να αγοράσει, σύμφωνα με άλλες παρελθοντικές επιλογές του. History data. Αναλύοντας το ιστορικό αγορών του χρήστη (που είναι αποθηκευμένο σε μία transaction βάση δεδομένων), το e-shop μπορεί να προτείνει στους πελάτες μία στοχευμένη ποικιλία από επιλογές που είναι πιθανό να ταιριάζουν με το προφίλ τους Μειωνεκτήματα της μεθόδου Τα περισσότερα RSs δεν λαμβάνουν υπόψη τα σημασιολογικά χαρακτηριστικά, με άμεση συνέπεια τη χαμηλή ακρίβεια των προβλέψεων που κάνουν. Χωρίς βαθιά 38

51 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN σημασιολογική γνώση της υποκείμενης περιοχής, το RS δεν μπορεί να χειριστεί ετερογενή και πολύπλοκα αντικείμενα σύμφωνα με τις ιδιότητες και τις συσχετίσεις τους. Στην επόμενη ενότητα προτείνεται μία υβριδική RS προσέγγιση που προσπαθεί να ξεπεράσει τις αδυναμίες των περισσότερων RSs και παράγει πλήρη εξατομίκευση. Με τον τρόπο αυτό μπορούμε να προσφέρουμε σε κάθε χρήστη διαφορετικές συστάσεις οι οποίες αλλάζουν καθώς πλοηγείται στον Παγκόσμιο Ιστό Ενωποίηση των οντολογικών και των Usage Mining δεδομένων Το πιλοτικό ηλεκτρονικό κατάστημα ενοικιάζει ταινίες στους πελάτες και παράγει συστάσεις βασισμένο σε τεχνικές εξόρυξης δεδομένων χρήσης του διαδικτύου, σημασιολογικά μεταδομένα, βαθμολογίες των προϊόντων από τους πελάτες και τεχνικές προσαρμογής μεταξύ των πελατών. Η λειτουργία του ηλεκτρονικού καταστήματος είναι απλή και άμεση. Στην περίπτωση ενός νέου πελάτη το ηλεκτρονικό κατάστημα τον προτρέπει να γίνει μέλος συμπληρώνοντας τη φόρμα εγγραφής. Με αυτό τον τρόπο το ηλεκτρονικό κατάστημα συλλέγει την απαραίτητη αρχική πληροφορία για να μπορέσει να τον υποστηρίξει κατά τη διάρκεια της πλοήγησής του σε αυτό. Στην περίπτωση ενός ήδη εγγεγραμμένου πελάτη το σύστημα τον αναγνωρίζει μέσω διαδικασίας login/password και παρέχει έναν εξατομικευμένο χαιρετισμό. Στη συνέχεια, ο πελάτης πλοηγείται στο ηλεκτρονικό κατάστημα, επιλέγει ταινίες από τον online κατάλογο ή χρησιμοποιεί τη δυνατότητα αναζήτησης, ενημερώνεται γι αυτές π.χ. υπόθεση, ηθοποιοί, κτλ., τις προσθέτει στο καλάθι του και πληρώνει το σύνολο ενοικίασης. Επιπλέον, μπορεί να βαθμολογήσει συγκεκριμένες ταινίες χρησιμοποιώντας μία κλίμακα από το 1 έως το 10, όπου το 1 αντιστοιχεί σε μία πολύ κακή ταινία και το 10 σε μία πολύ καλή. Η προσέγγιση συνδυάζει classification και εξόρυξη με κανόνες συσχέτισης. Οι επόμενες παράγραφοι περιγράφουν τον τρόπο με τον οποίο παράγονται οι συστάσεις. Η προτεινόμενη προσέγγιση απεικονίζεται σχηματικά στην Εικόνα 4. 39

52 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN E-shop Ontological Schema Εικόνα 4: Προτεινόμενη προσέγγιση δημιουργίας συστάσεων. Πολλά online καταστήματα υιοθετούν ένα βασικό classification σχήμα για τα προϊόντα που προσφέρουν. Αυτό το σχήμα μπορεί να απεικονιστεί ως ένα δένδρο, όπου η ρίζα αναπαριστά την πιο γενική κλάση, οι εσωτερικοί κόμβοι αναπαριστούν όλες τις ενδιάμεσες κλάσεις και τα φύλλα αντιπροσωπεύουν τα συγκεκριμένα προϊόντα. Ο ρόλος του είναι σημαντικός ειδικά κατά τη διαδικασία εύρεσης γνώσης, αφού αναπαριστά την εξαρτώμενη από το ηλεκτρονικό κατάστημα γνώση και η οποία επηρεάζει τα αποτελέσματα. Σε αυτό το πλαίσιο, η προτεινόμενη προσέγγιση δημιουργίας συστάσεων βασίζεται σε ένα οντολογικό σχήμα, το οποίο έχει ενσωματωθεί σε ένα πιλοτικό ηλεκτρονικό κατάστημα που ενοικιάζει ταινίες στους πελάτες. Ο ιστότοπος αποτελείται από μία συλλογή από σελίδες που περιέχουν πληροφορίες για τα γνωρίσματα των ταινιών όπως ο τίτλος, η κατηγορία, το στούντιο, οι ηθοποιοί, ο σκηνοθέτης, ο παραγωγός, τα βραβεία, η χρονιά, η διάρκεια, το κοινό, το σενάριο, κτλ. Τα αρχικά δεδομένα έχουν ανακτηθεί από το Internet Movie Database ( έχουν οργανωθεί σε ένα οντολογικό σχήμα και έχουν βελτιστοποιηθεί ώστε να παράγουν ένα πλούσιο υπερσύνολο που να καλύπτει όλες τις αναγκαίες ιδέες και συσχετίσεις. Η υποκείμενη οντολογία διατυπώνει μία αναπαράσταση του πεδίου του ηλεκτρονικού καταστήματος προσδιορίζοντας όλες τις έννοιές του, τις σχέσεις μεταξύ τους και άλλες ιδιότητες, συνθήκες και ρυθμίσεις. Επιτρέπει το σημασιολογικό σχολιασμό και έχει την ικανότητα να εκτελέσει σημασιολογικά ερωτήματα και οντολογικά βασισμένη πλοήγηση. Η κατασκευή της οντολογίας αποτελεί μία πολύπλοκη και χρονοβόρα εργασία και βασίζεται στις γνώσεις των δημιουργών της ώστε να μπορέσει να απεικονίσει όλες τις έννοιες του ηλεκτρονικού καταστήματος, να οργανώσει τις ταξονομικές ιεραρχίες και να αναπαραστήσει τις συσχετίσεις τους. Η ανάπτυξη της είναι συναφής με τον ορισμό ενός συνόλου αντικειμένων και της δομής τους. Με αυτό τον τρόπο, η οντολογία μπορεί να θεωρηθεί ως μία βάση γνώσης η οποία χρησιμοποιείται περαιτέρω για την εξαγωγή χρήσιμης γνώσης. Συγκεκριμένα, ο ρόλος της είναι να χρησιμοποιηθεί ως είσοδος για τη φάση της εξόρυξης για να εξάγει, να 40

53 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN συνδυάσει και να μετατρέψει την υπάρχουσα εμφανή και αφανή γνώση (την κλάση του χρήστη, το ιστορικό, το προφίλ, το περιεχόμενο του ηλεκτρονικού καταστήματος και τη δομή του) σε νέες φόρμες. Για την υλοποίηση της οντολογίας χρησιμοποιήθηκε το Protégé Editor (2006). Το Protégé μπορεί να υλοποιήσει συμπαγή OWL (Web Ontology Language) περιβάλλοντα. Η έξοδος αυτής της εργασίας είναι μία λίστα από πιθανές συστάσεις. Ένα υποσύνολο της οντολογίας του ηλεκτρονικού καταστήματος φαίνεται στην Εικόνα 5. Ειδικότερα, η οντολογία δημιουργεί συνδέσεις μεταξύ των ταινιών σύμφωνα με τα διαφορετικά γνωρίσματα που τις χαρακτηρίζουν. Χρησιμοποιώντας το συγκεκριμένο αρχείο με το ιστορικό του χρήστη το σύστημα υπολογίζει τις προτιμήσεις του. Για παράδειγμα μπορεί να βρει αν αρέσει στον πελάτη να βλέπει ταινίες: από μία συγκεκριμένη κατηγορία π.χ. «δράσης», «κωμωδίες», «γουέστερν», «δραματικές», «μιούζικαλ», κτλ. ενός συγκεκριμένου σκηνοθέτη π.χ. «Steven Spielberg», «Francis Ford Copolla», «Sydney Pollack», κτλ. κάποιου συγκεκριμένου ηθοποιού π.χ. «Sean Penn», «Nicole Kidman», «Brad Pitt», «Julia Roberts», κτλ. ή κάποιου άλλου συνδυασμού στοιχείων. Όταν ταιριάζουν περισσότερα από ένα στοιχεία ομοιότητας τότε άλλες ταινίες μπορούν να προκύψουν σύμφωνα με το οντολογικό σχήμα, ταινίες που έχουν παρόμοια αντικείμενα με εκείνες που ο πελάτης έχει ήδη ενοικιάσει. Στην περίπτωση ενός νέου πελάτη (history file = Ø), οι πληροφορίες από τη φόρμα εγγραφής του αναλύονται και οι συστάσεις βασίζονται στην οντολογία. 41

54 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Εικόνα 5: Τμήμα της οντολογίας του ηλεκτρονικού καταστήματος (εκτεταμένη έκδοση από Mobasger et al. (2004)) Κατηγοριοποίηση των πελατών Ο κυριότερος στόχος του βήματος του classification είναι να αναθέτει στους πελάτες ένα σύνολο από προκαθορισμένες κλάσεις. Αυτές οι κλάσεις αντιπροσωπεύουν διαφορετικά προφίλ χρηστών και το classification εκτελείται χρησιμοποιώντας επιλεγμένα γνωρίσματα με υψηλή δυνατότητα διακριτοποίησης. Τα γνωρίσματα που ορίζουν μία συγκεκριμένη κλάση μπορούν να ρυθμιστούν και περιλαμβάνουν το userid, την ηλικία, το φύλο, την εθνικότητα, το επάγγελμα, το γνωστικό επίπεδο, προτιμήσεις, κτλ. Για παράδειγμα, από την κλάση «ενοικίαση κωμωδιών», μπορούν να βρεθούν οι πελάτες που επιθυμούν να νοικιάζουν κωμωδίες και οι πελάτες που δεν επιθυμούν. Το προφίλ ενός ενεργού πελάτη μπορεί να είναι όπως αυτό που απεικονίζεται στον Πίνακας 4. Θεωρούμε τα γνωρίσματα και τις τιμές τους που παρουσιάζονται στον Πίνακας 5 και υποθέτουμε ότι θέλουμε να αποφασίσουμε εάν ο επόμενος άγνωστος χρήστης X νοικιάζει ή όχι κωμωδίες: Χ={userID=101, ηλικία=22, φύλο=θ, επάγγελμα=μαθητής, μορφ. επίπεδο=μέτριο} Στο classification, απαιτείται η ύπαρξη ενός συνόλου δεδομένων εκπαίδευσης με ανατεθειμένες ετικέτες κλάσεων (είναι κατηγοριοποιημένο ως μία τεχνική εποπτευόμενης μηχανικής εκμάθησης). Στη συνέχεια ο classifier (παρατηρώντας την ανάθεση των κλάσεων στο σύνολο εκπαίδευσης) μαθαίνει να αναθέτει τα νέα αντικείμενα σε μία από τις κλάσεις. Συχνά εφαρμόζεται clustering πριν το classification προκειμένου να καθοριστούν οι κλάσεις. userid «67» ηλικία «30» φύλο «άρρεν» επάγγελμα «πωλητής» 42

55 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN μορφ. επίπεδο «ανώτερη» Πίνακας 4: Τμήμα από προφίλ χρήστη Η κατηγοριοποίηση βασίζεται στον απλό Bayes classifier (Hand et al., 2002), όπου κάθε στιγμιότυπο X αποτελείται από ένα σύνολο από γνωρίσματα c c,..., c Ορίζονται m κλάσεις 1, 2 n. 1, C2 Cm. Έστω ένα άγνωστο στιγμιότυπο X για το C,..., οποίο δεν γνωρίζουμε την κλάση του, ο classifier προβλέπει ότι το X ανήκει στην κλάση με τη μεγαλύτερη πιθανότητα. Ο classifier αναθέτει το X στην κλάση C εάν P( Ci X ) > P( C j X ) για 1 j m, j ¹ i. Σύμφωνα με το θεώρημα του Bayes P( C X ) = P( X C ) P( C ) / P( X ). Το P (X ) είναι σταθερό για όλα τα i i * i στιγμιότυπα, για αυτό χρειάζεται να μεγιστοποιηθεί ο όρος P X C ) * P( C ). Για ( i j ( X Ci ) P( C j την κατηγοριοποίηση του X, υπολογίζουμε την πιθανότητα P * ) για κάθε κλάση C i. Το X ανατίθεται στην κλάση C i εάν P X C ) * P( C ) > P( X C ) * P( C ) για 1 j m, j ¹ i. Αυτό σημαίνει ότι το ( i i j j X ανατίθεται στην κλάση με τη μεγαλύτερη πιθανότητα. i userid Ηλικία Φύλο Επάγγελμα Μορφ. Επίπεδο Κλάση: ενοικίαση κωμωδιών 1 30 Γ Μηχανικός Υψηλό Ναι 2 25 Α Μαθητής Μέτριο Όχι 3 34 Α Πωλητής Χαμηλό Ναι 4 18 Α Μαθητής Χαμηλό Ναι 5 45 Γ Σκηνοθέτης Υψηλό Όχι Γ Καλλιτέχνης υψηλό Ναι Πίνακας 5: Ένα στιγμιότυπο από τη βάση δεδομένων Αυτό το μοντέλο classification μπορεί να επαναλαμβάνεται κατά τη διάρκεια του χρόνου και να ενημερώνεται σύμφωνα με τα συγκεντρωμένα δεδομένα από τα transaction. Επιπρόσθετα, η εκχώρηση χρηστών σε κλάσεις μπορεί να χρησιμοποιηθεί στην εύρεση αλληλεπιδράσεων μεταξύ των χρηστών και επιπλέον στη βελτίωση της συνεργασίας και της επικοινωνίας. Ακόμα, παρέχει στο ηλεκτρονικό κατάστημα τη δυνατότητα να αντιλαμβάνεται τις εικονικές κοινωνίες που υπάρχουν. Σε κάθε κλάση αντιστοιχεί ένα σύνολο συστάσεων. Οι συστάσεις αυτές είναι λίστες με π.χ. τις καλύτερες και τις χειρότερες ταινίες που οι υπόλοιποι χρήστες, που είναι «κοντά» στον τρέχον, έχουν δει. 43

56 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Association Rule Mining στα Click-streams Το σύστημα παρακολουθεί τις ενέργειες του χρήστη ως τις καταγεγραμμένες επιτυχείς αιτήσεις σελίδων στα log αρχεία του εξυπηρετητή. Τα log αρχεία, μετά καθαρίζονται από όλες τις περιττές πληροφορίες (όπως δευτερεύουσες, αυτόματα δημιουργούμενες αιτήσεις για εικόνες, κτλ.). Συνδυάζοντας τις υπόλοιπες αιτήσεις με πληροφορίες για τον τρόπο δόμησης του περιεχομένου του ιστότοπου, το σύστημα αποσπά τις προσπελάσεις του χρήστη στις σελίδες των ταινιών. Το σύνολο των ταινιών, που έχουν προσπελαστεί από ένα συγκεκριμένο χρήστη κατά τη διάρκεια όλων των προηγούμενων επισκέψεών του στο ηλεκτρονικό κατάστημα, αποθηκεύονται στο προφίλ του, και εκεί ψάχνει το σύστημα για να ανακαλύψει τους κανόνες συσχέτισης. Παρακάτω παρουσιάζεται ένα παράδειγμα κανόνα συσχέτισης: {movie i, movie j } {movie x } με support=0.02 και confidence=0.68. Ο παραπάνω κανόνας περιέχει τη σχέση ότι χρήστες που έχουν προσπελάσει την movie i και τη movie j επιπλέον τείνουν (με confidence 68%) να ενδιαφέρονται για τη movie x. Το support αντιπροσωπεύει το γεγονός ότι το σύνολο {movie i, movie j, movie x } υπάρχει στο 2% των συνόλων των ταινιών που προσπελάστηκαν. Άλλα παραδείγματα κανόνων συσχέτισης είναι τα ακόλουθα: 60% των χρηστών που νοικιάζουν την ταινία «Lord of the Rings The Fellowship» στη σειρά επιλέγουν να δουν το «Lord of the Rings The Two Towers» και το «Lord of the Rings The Return of the King». 75% των χρηστών που προσπέλασαν την ταινία «Shrek» ανήκουν στην ηλικιακή ομάδα μεταξύ 15 έως 20 ετών. 25% των χρηστών που νοικιάζουν την ταινία «Harry Potter» είναι στο ηλικιακή ομάδα και μένουν στην Αθήνα. 45%των χρηστών που προσπέλασαν το ηλεκτρονικό κατάστημα ξεκίνησαν την πλοήγησή τους από την ιστοσελίδα «Top movies of the week». Οι κανόνες συσχέτισης που έχουν εξαχθεί μπορούν να χρησιμοποιούν ως είσοδο είτε τα σύνολα των ταινιών που έχουν προσπελαστεί από όλους τους χρήστες, είτε μόνο εκείνες που έχουν προσπελαστεί από τους χρήστες που ανήκουν στην ίδια κλάση με τον τρέχον. Μία άλλη επιλογή είναι να χρησιμοποιηθούν και οι δύο προσεγγίσεις και να προταθεί η ένωση των θεμάτων που βρέθηκαν. Το σενάριο αυτό είναι πολύ χρήσιμο όταν οι κανόνες συσχέτισης μέσα στις κλάσεις αποτυγχάνουν στο να δημιουργήσουν αξιόπιστες συστάσεις εξαιτίας των ανεπαρκών δεδομένων εισόδου Παραγωγή των συστάσεων Η ενότητα αυτή περιγράφει λεπτομερώς τον αλγόριθμο που χρησιμοποιεί το ηλεκτρονικό κατάστημα για τη δημιουργία των συστάσεων για τις ταινίες. Οι συστάσεις αυτές προτείνονται στον πελάτη στη μορφή «πελάτες που άρεσε/ενοικίασαν αυτή την ταινία ενοικίασαν ακόμη». Η διαδικασία φιλτραρίσματος βασίζεται σε διαφορετικού είδους δεδομένων. Συγκεκριμένα, εξαρτάται από την κλάση (cluster), στην οποία ταξινομήθηκε ο χρήστης, την ακολουθία των κλικ που έκανε, το ιστορικό των transaction και τις βαθμολογίες, και από τα μεταδεδομένα της οντολογίας του 44

57 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN ιστότοπου. Η κεντρική ιδέα είναι η παραγωγή ενός αρχικού συνόλου συστάσεων συνδυάζοντας όλα τα προαναφερόμενα δεδομένα και στη συνέχεια ο περιορισμός («κλάδεμα») χρησιμοποιώντας ένα προκαθορισμένο κατώφλι α αυτού του συνόλου και η ταξινόμηση των υπόλοιπων αντικειμένων σε αύξουσα σειρά (πρώτα η ταινία με τη μεγαλύτερη προβλεπόμενη βαθμολογία). Διαχωρίζουμε δύο περιπτώσεις σύμφωνα με την ύπαρξη παρελθοντικών επιλογών του χρήστη στο κατάστημα (history data). Περίπτωση 1: όταν ο χρήστης είναι γνωστός και το σύστημα έχει ιστορικό των επιλογών του. Ορίζουμε ως M το σύνολο των ταινιών που ο History χρήστης έχει παρακολουθήσει και βαθμολογήσει. Στην περίπτωση αυτή, το σύστημα σύμφωνα με το M, βρίσκει τους χρήστες που είναι «κοντά» History (μοιάζουν) στον τρέχον και έχουν παρόμοιο ιστορικό και βαθμολογίες. Ορίζουμε αυτό το σύνολο των χρηστών ως U. Κάθε χρήστης U που ανήκει στο U L είναι συνδεδεμένος με ένα αριθμό s i ο οποίος αντικατοπτρίζει την ομοιότητα του U i με τον τρέχον χρήστη. Επιπλέον, ορίζουμε ως U M το σύνολο των χρηστών που ανήκουν στο U L και έχουν δει την ταινία M. Ακόμη, σύμφωνα με το M History το μοντέλο χρησιμοποιεί την οντολογία για να βρει τις συσχετίσεις μεταξύ των αντικειμένων που έχουν βαθμολογηθεί από το χρήστη. Συνεπώς, ορίζουμε ως R log τη λίστα με τις συστάσεις που προήλθε από την οντολογία βασισμένη στο προφίλ ιστορικού του χρήστη. Περίπτωση 2: όταν ο χρήστης είναι νέος. Στην περίπτωση αυτή, το σύστημα χρησιμοποιεί πληροφορίες από τη φόρμα εγγραφής του χρήστη και συνεπώς από σύμφωνα με αυτά τα δεδομένα υπολογίζεται η αρχική κλάση στην οποία ανατίθεται ο χρήστης. Ορίζουμε ως U το σύνολο των χρηστών στην κλάση που έχουν παρόμοια γνωρίσματα με τον τρέχον. Τα γνωρίσματα αυτά είναι οι πληροφορίες που ο χρήστης έδωσε στο σύστημα μετά τη συμπλήρωση της φόρμας εγγραφής, π.χ. ηλικία, φύλο, επάγγελμα, μορφ. επίπεδο, προτιμήσεις, κτλ. Κάθε χρήστης U που ανήκει στο U συνδέεται με έναν αριθμό s ο οποίος αντικατοπτρίζει την ομοιότητα του U i με τον τρέχον χρήστη σύμφωνα με τα προαναφερόμενα γνωρίσματα. Ορίζουμε ως U M το σύνολο των χρηστών που ανήκουν στο U K και έχουν παρακολουθήσει την ταινία M. Κάθε κλάση συνδέεται με ένα σύνολο ταινιών. Ορίζουμε ως R τις προτεινόμενες ταινίες σύμφωνα με την κλάση του χρήστη. Συνεχίζοντας, ορίζουμε ως Cluster L i K Onto W Current το τρέχον session παράθυρο, το οποίο περιέχει τις ταινίες που ο χρήστης έχει προσπελάσει στο τρέχον transaction. Μπορούμε να παράγουμε συστάσεις σύμφωνα με την τρέχουσα ακολουθία από κλικ του χρήστη χρησιμοποιώντας κανόνες συσχέτισης και την οντολογία του ιστότοπου. Άρα, ως R - εννοούμε τις συστάσεις που προέρχονται από το τρέχον session Rules current παράθυρο και τους εξορυγμένους κανόνες συσχέτισης και ως i y K ROnto log y-current i 45

58 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN θεωρούμε τις συστάσεις που προέρχονται από το τρέχον session παράθυρο και την οντολογία. Χρησιμοποιούμε δύο μεθόδους για να επεξεργαστούμε τις πληροφορίες από το τρέχον session παράθυρο καθώς επιτυγχάνονται καλύτερες προβλέψεις από το συνδυασμό τους. Κάθε μέθοδος χρησιμοποιεί διαφορετικούς τρόπους για να προβλέψει τις προτιμήσεις του χρήστη, π.χ. οι κανόνες συσχέτισης εσωκλείουν τη συμπεριφορά του χρήστη κατά την πλοήγηση, ενώ η οντολογία αντανακλά τις συνδέσεις μεταξύ των γνωρισμάτων των αντικειμένων και ανακαλύπτει σχηματομορφές που περιγράφουν τις προτιμήσεις του χρήστη. Συνεχίζοντας, ονομάζουμε R Initial το αρχικό σύνολο συστάσεων το οποίο θα φιλτραριστεί από τον αλγόριθμο και θα ταξινομηθεί σε αύξουσα σειρά. Υπολογίζεται από την ένωση των R -, και για την πρώτη περίπτωση ROntolog y-current, Rules current (όπου ο χρήστης έχει ιστορικό) χρησιμοποιούμε περίπτωση (όπου ο χρήστης είναι νέος) χρησιμοποιούμε Συνεπώς, υπολογίζεται το RInitial R log, ενώ στη δεύτερη Onto y R Cluster. για κάθε περίπτωση ως εξής: Case 1: RInitial = ROntolog y-current È RRules-current È ROntolog y Case 2: RInitial = ROntolog y-current È RRules-current È RCluster Ο αλγόριθμος που χρησιμοποιήθηκε για την παραγωγή των συστάσεων προς τους πελάτες του ηλεκτρονικού καταστήματος παρουσιάζεται στον Πίνακας 6. Σχετικά με την ομοιότητα μεταξύ των χρηστών, θεωρούμε ότι κάθε χρήστης έχει ένα διάνυσμα με τις ταινίες που έχει βαθμολογήσει (π.χ. ένα history vector). Για παράδειγμα, υποθέτουμε ότι X και Y είναι δύο χρήστες. Ορίζουμε ως X R και Y R τα history vectors και R X και R Y τα αντίστοιχα σύνολα με τις ταινίες που βαθμολόγησαν. Τότε C είναι το σύνολο με τις κοινές βαθμολογημένες ταινίες, δηλαδή C = R X Ç RY. Εάν οι χρήστες δεν έχουν κοινές ταινίες, τότε C = Æ. Επιπροσθέτως, ορίζουμε X C και Y C, τα διανύσματα με τις κοινές ταινίες που και οι δύο χρήστες έχουν βαθμολογήσει (δηλαδή ταινίες που ανήκουν στο C ). Input U : όλοι οι χρήστες U : ο χρήστης με το ID i i M : όλες οι ταινίες M : η ταινία j j M History : οι ταινίες που ένας χρήστης έχει βαθμολογήσει R Initial : αρχικό σύνολο recommendations Algorithm 46

59 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN For each M j in RInitial If M = Æ then History Find U M in U K Else Find U M in U L For each U i in U M r = R * S end end Output if M j rm j UiM j f a R = R È then { M j } i Μια λίστα R από συστάσεις ταινιών σε αύξουσα σειρά (πρώτα η ταινία με το μεγαλύτερο r) της οποίες ο χρήστης U δεν έχει δει και πιθανόν να θέλει να δει. i Πίνακας 6: Ο αλγόριθμος που χρησιμοποιήθηκε για τη δημιουργία συστάσεων Ένας περιορισμός εμφανίζεται στο σημείο αυτό ο οποίος αφορά το ποσοστό των κοινών ταινιών που έχουν βαθμολογήσει οι χρήστες σε σχέση με το σύνολο των βαθμολογημένων ταινιών κάθε χρήστη. Για παράδειγμα, εάν ο χρήστης X έχει βαθμολογήσει 60 ταινίες, R X = 60 και ο χρήστης Y έχει βαθμολογήσει 40 ταινίες, R = 40 και οι κοινές ταινίες που έχουν βαθμολογήσει είναι 5, C = 5, τότε οι Y χρήστες αυτοί δεν θεωρούνται ως όμοιοι. Για να μπορούν δύο χρήστες να θεωρηθούν ως όμοιοι πρέπει να έχουν κοινές περισσότερες από 50% του συνόλου του χρήστη με τις λιγότερες βαθμολογημένες ταινίες. Τότε η ομοιότητα μεταξύ των χρηστών X και Y είναι η απόσταση μεταξύ των διανυσμάτων X και Y και μπορεί να υπολογιστεί από τον παρακάτω τύπο: C C sim( X C, Y C ) = N å i= 1 ( R( X C, M ) - R( Y i C, M )) i 2 Όταν ο χρήστης είναι νέος, υπολογίζουμε την ομοιότητα μεταξύ των χρηστών της ίδιας κλάσης. Σε αυτή την περίπτωση, χρησιμοποιούμε τα χαρακτηριστικά που προέρχονται από τη φόρμα εγγραφής του χρήστη στο σύστημα. Αυτά τα χαρακτηριστικά έχουν συγκεκριμένες θέσεις στο διάνυσμα, που περιγράφουν του προφίλ του χρήστη. Για παράδειγμα, αν τα χαρακτηριστικά είναι ηλικία, φύλο, επάγγελμα και μορφωτικό επίπεδο, τότε ένα στιγμιότυπο του διανύσματος αυτού για το χρήστη X μπορούσε να είναι {22, 0, 3, 2}. Το οποίο σημαίνει: {ηλικία=22, φύλο=άρρεν, επάγγελμα=μαθητής, μορφ. επίπεδο=μέτριο}. Με άλλα λόγια, κάθε χαρακτηριστικό παίρνει τιμές που αντιστοιχούν σε συγκεκριμένες πληροφορίες, όπως το επάγγελμα=3 υποδηλώνει μαθητή. 47

60 ΚΕΦΑΛΑΙΟ 2 MOVIE DOMAIN Ο υπολογισμός της ομοιότητας μεταξύ των χρηστών είναι μία αρκετά χρονοβόρα διαδικασία. Είναι εύκολο να συμπεράνει κανείς ότι στην περίπτωση ενός μεγάλου καταστήματος με πολλούς χρήστες και μία πλούσια ποικιλία από ταινίες η πολυπλοκότητα του υπολογισμού της ομοιότητας θα να είναι μεγάλη. Συνοψίζοντας, χρησιμοποιήσαμε τα απευθείας από το χρήστη δεδομένα από τη συμπλήρωση της φόρμας εγγραφής και κατηγοριοποιήθηκε σύμφωνα με αυτά σε μία κλάση από προκαθορισμένες ομάδες. Αυτές οι ομάδες (κλάσεις) είναι στατικές και δημιουργούνται σύμφωνα με τα χαρακτηριστικά του συστήματος. Ένας χρήστης μπορεί να ανήκει σε διαφορετικές κλάσεις. Αυτή η κατηγοριοποίηση δεν αλλάζει ανάλογα με την πλοήγηση του χρήστη στο σύστημα. Μπορεί να τροποποιηθεί αν ο χρήστης αλλάξει τις προτιμήσεις του, π.χ. τα δεδομένα που συμπλήρωσε στη φόρμα εγγραφής. Από την άλλη πλευρά, χρησιμοποιούνται κανόνες συσχέτισης και η οντολογία του ιστότοπου. Οι πληροφορίες αυτές παράγονται δυναμικά από τη συμπεριφορά πλοήγησης του χρήστη. Η εξαγωγή των κανόνων εκτελείται κατά την off-line διαδικασία ενώ η επιλογή των καταλληλότερων (σύμφωνα με το τρέχον session παράθυρο) εκτελείται κατά τη διάρκεια της on-line διαδικασίας. Οι κανόνες συσχέτισης δημιουργούνται από τον Apriori αλγόριθμο (Agrawal et al., 1993) και είναι υλοποιημένος σε C++. Ορισμένα στιγμιότυπα της εφαρμογής παρουσιάζονται στην Εικόνα 6. Εικόνα 6: Το πιλοτικό ηλεκτρονικό κατάστημα ταινιών. Για την αξιολόγηση της προσέγγισης χρησιμοποιήθηκαν δύο σύνολα δεδομένων. Το πρώτο σύνολο περιλαμβάνει 100 στιγμιότυπα του οντολογικού σχήματος του πιλοτικού ηλεκτρονικού καταστήματος ταινιών. Χρησιμοποιήθηκε μια spider για να κόψει τις HTML σελίδες ώστε να αποθηκευτούν σε μία βάση δεδομένων. Το δεύτερο σύνολο περιλαμβάνει δεδομένα σχετικά με τη συμπεριφορά πλοήγησης του χρήστη 48

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο Ιόνιο Πανεπιστήμιο, Τμήμα Πληροφορικής, 2015 Κωνσταντίνος Οικονόμου, Επίκουρος Καθηγητής

Διαβάστε περισσότερα

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής

Διαβάστε περισσότερα

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων». Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων». Με την υπ αριθμ. υπ αριθμ. ΣΕΠΠ/1671/9-5-2014 Πράξη

Διαβάστε περισσότερα

Social Web: lesson #3

Social Web: lesson #3 Social Web: lesson #3 tagging social organisation of information ratings democratic editorial control shared opinions collaborative filtering recommendations case studies del.icio.us digg last.fm το Tag...

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Τεχνολογία Πολυμέσων Ενότητα 6: Υπερκείμενο - Υπερμέσα Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον Κωνσταντίνος Σπυρόπουλος Διευθυντής Ινστιτούτου Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ Δημόκριτος Βελτίωση της Αποτελεσματικότητας Επιχειρήσεων/Οργανισμών,

Διαβάστε περισσότερα

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε)

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε) Τεχνολογίες Πληροφορίας & Επικοινωνιών στην Εκπαίδευση (ΤΠΕ-Ε) ΑΝΤΙΚΕΙΜΕΝΟ ΤΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Η αξιοποίηση των σύγχρονων Τεχνολογιών Πληροφορίας & Επικοινωνιών (ΤΠΕ) στην εκπαίδευση και τη µάθηση Πώς οι ΤΠΕ

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 1: Σημασιολογία και Μεταδεδομένα Μ.Στεφανιδάκης 5-2-2016. Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης) ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ Ακαδημαϊκή Μονάδα: Τομέας: Εργαστήριο/Σπουδαστήριο/Κλινική: Τίτλος Μαθήματος / Θέμα Εργασίας: Κωδικός Μαθήματος: Τύπος Μαθήματος: ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Πληροφοριακά Περιβάλλοντα

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας ΜΑΘΗΜΑ 6 195 Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων Το RDF Το Warwick Framework 196 1 Resource Data Framework RDF Τα πολλαπλά και πολλαπλής προέλευσης σχήµατα παραγωγής δηµιουργούν την ανάγκη δηµιουργίας

Διαβάστε περισσότερα

Κεφάλαιο 9: Διαδίκτυο, Web 2.0 και Web X.0. Εφαρμογές Πληροφορικής Κεφ. 9 Καραμαούνας Πολύκαρπος 1

Κεφάλαιο 9: Διαδίκτυο, Web 2.0 και Web X.0. Εφαρμογές Πληροφορικής Κεφ. 9 Καραμαούνας Πολύκαρπος 1 Κεφάλαιο 9: Διαδίκτυο, Web 2.0 και Web X.0 Καραμαούνας Πολύκαρπος 1 9.1 Ιστορικά Στοιχεία Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο και ήταν απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. Το 1966

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Διαδίκτυο και Επίπεδα ετερογένειας δεδομένων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΔΟΥΒΛΕΤΗΣ ΧΑΡΑΛΑΜΠΟΣ ΕΠΙΒΛΕΠΟΝΤΕΣ ΚΑΘΗΓΗΤΕΣ Μαργαρίτης Κωνσταντίνος Βακάλη

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 1: Σημασιολογία και Μεταδεδομένα Μ.Στεφανιδάκης 10-2-2017 Η αρχή: Το όραμα του Σημασιολογικού Ιστού Tim Berners-Lee, James Hendler and Ora Lassila, The Semantic

Διαβάστε περισσότερα

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. ΚΕΦΑΛΑΙΟ 9 Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. Το 1966 αρχίζει ο σχεδιασμός του ARPANET, του πρώτου

Διαβάστε περισσότερα

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

Αθηνά - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης "Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Προκήρυξη Υποτροφιών To Ινστιτούτο Πληροφοριακών Συστημάτων

Διαβάστε περισσότερα

Σχεδίαση και Ανάπτυξη Ιστότοπων

Σχεδίαση και Ανάπτυξη Ιστότοπων Σχεδίαση και Ανάπτυξη Ιστότοπων Ιστορική Εξέλιξη του Παγκόσμιου Ιστού Παρουσίαση 1 η 1 Βελώνης Γεώργιος Καθηγητής Περιεχόμενα Τι είναι το Διαδίκτυο Βασικές Υπηρεσίες Διαδικτύου Προηγμένες Υπηρεσίες Διαδικτύου

Διαβάστε περισσότερα

Οντολογία Ψηφιακής Βιβλιοθήκης

Οντολογία Ψηφιακής Βιβλιοθήκης Οντολογία Ψηφιακής Βιβλιοθήκης Αντωνάκης Δημήτρης Μητρέλης Άγγελος Παπουτσής Κωνσταντίνος Θεόδωρος Σιώχος Βασίλειος Νοέμβριος 2006 Πάτρα Χρήση Οντολογιών Οι ψηφιακές βιβλιοθήκες με τη βοήθεια των οντολογιών

Διαβάστε περισσότερα

DECO DECoration Ontology

DECO DECoration Ontology Πράξη: «Αρχιμήδης ΙΙI Ενίσχυση Ερευνητικών Ομάδων στο ΤΕΙ Κρήτης» Υποέργο 32 DECO DECoration Ontology Οντολογία και εφαρμογές σημασιολογικής αναζήτησης και υποστήριξης στον αρχιτεκτονικό σχεδιασμό εσωτερικού

Διαβάστε περισσότερα

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΣΧΥΕΙ ΚΑΤΑ ΤΟ ΜΕΡΟΣ ΠΟΥ ΑΦΟΡΑ ΤΟ ΛΥΚΕΙΟ ΓΙΑ ΤΗΝ ΥΠΟΧΡΕΩΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ ΙΣΧΥΟΥΝ ΤΟ ΔΕΠΠΣ

Διαβάστε περισσότερα

Διδακτικές Τεχνικές (Στρατηγικές)

Διδακτικές Τεχνικές (Στρατηγικές) Διδακτικές Τεχνικές (Στρατηγικές) Ενδεικτικές τεχνικές διδασκαλίας: 1. Εισήγηση ή διάλεξη ή Μονολογική Παρουσίαση 2. Συζήτηση ή διάλογος 3. Ερωταποκρίσεις 4. Χιονοστιβάδα 5. Καταιγισμός Ιδεών 6. Επίδειξη

Διαβάστε περισσότερα

ΚΑΙΝΟΤΟΜΕΣ ΛΥΣΕΙΣ ΕΚΠΑΙΔΕΥΣΗΣ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΟΔΗΓΟΣ E-LEARNING

ΚΑΙΝΟΤΟΜΕΣ ΛΥΣΕΙΣ ΕΚΠΑΙΔΕΥΣΗΣ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΟΔΗΓΟΣ E-LEARNING ΚΑΙΝΟΤΟΜΕΣ ΛΥΣΕΙΣ ΕΚΠΑΙΔΕΥΣΗΣ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗΣ ΑΘΗΝΑ 2014 1 1. Τι είναι το e-learning; Το e-learning, η ηλεκτρονική μάθηση, είναι μια διαδικασία μάθησης και ταυτόχρονα μια μεθοδολογία εξ αποστάσεως εκπαίδευσης

Διαβάστε περισσότερα

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης

Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης Από Θεωρίες Μάθησης σε Περιβάλλοντα Μάθησης Εργαστήριο Εκπαιδευτικής & Γλωσσικής Τεχνολογίας http://hermes.di.uoa.gr/ S.C.A.L.E. Μαρία Γρηγοριάδου A.L.M.A. Οµότιµη Καθηγήτρια SemanDix Τµήµα Πληροφορικής

Διαβάστε περισσότερα

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση Νίκος Λούτας (nlout@uom.gr) http://nikosloutas.com Υποψήφιος Διδάκτορας, Εργαστήριο Πληροφοριακών Συστημάτων,

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

Εισαγωγή στις Τεχνολογίες της

Εισαγωγή στις Τεχνολογίες της Εισαγωγή στις Τεχνολογίες της Πληροφορίας και των Επικοινωνιών Ενότητα 13 : Crowdsourcing, Τεχνητή Νοημοσύνη, Συστήματα σύστασης Διδάσκων: Νικόλαος Τσέλιος Τμήμα Επιστημών της Εκπαίδευσης και της Αγωγής

Διαβάστε περισσότερα

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή 1 Πίνακας Περιεχομένων 1. Εισαγωγή... 4 1.1 Περιβάλλον Moodle...4 1.2 Χρήση ονόματος χρήστη και κωδικού...4 1.3 Δημιουργία νέου μαθήματος...4 1.3.1

Διαβάστε περισσότερα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση Ηλεκτρονικό εμπόριο HE 8 Εξατομίκευση Πληροφοριακός υπερφόρτος (information overload) Αδυναμία διαχείρισης μεγάλου όγκου πληροφοριών και εντοπισμού της χρήσιμης πληροφορίας Η εξατομίκευση στοχεύει στην

Διαβάστε περισσότερα

Διδακτορική Διατριβή. Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο

Διδακτορική Διατριβή. Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΠΛΗΡΟΦΟΡΙΚΗΣ Διδακτορική Διατριβή Τεχνικές και Συστήματα Διαχείρισης Γνώσης στο Διαδίκτυο Πηνελόπη Θ. Μαρκέλλου Επιβλέπων

Διαβάστε περισσότερα

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό Αλέξανδρος Βαλαράκος (alexv@iit.demokritos.gr) (alexv@aegean.gr) Υποψήφιος ιδάκτορας Τµήµα Μηχανικών Υπολογιστικών και Πληροφοριακών Συστηµάτων.

Διαβάστε περισσότερα

Τεχνολογία Ηλεκτρονικού Εμπορίου

Τεχνολογία Ηλεκτρονικού Εμπορίου Τεχνολογία Ηλεκτρονικού Εμπορίου 7η διάλεξη: Τεχνολογίες Εξατομίκευσης (personalization) σε Περιβάλλοντα Ηλεκτρονικού Εμπορίου Χρήστος Γεωργιάδης ιαστάσεις της τεχνολογίας του ηλεκτρονικού εμπορίου Η πανταχού

Διαβάστε περισσότερα

Εισαγωγή στα Πληροφοριακά Συστήματα

Εισαγωγή στα Πληροφοριακά Συστήματα Εισαγωγή στα Πληροφοριακά Συστήματα Ενότητα 3: Η έννοια της ΠΛΗΡΟΦΟΡΙΑΣ - INFORMATION Κωνσταντίνος Ταραμπάνης Τμήμα Οργάνωσης & Διοίκησης Επιχειρήσεων ΕΙΣΑΓΩΓΗ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κωνσταντίνος Ταραμπάνης

Διαβάστε περισσότερα

Οντολογία σύμφωνα με τη Φιλοσοφία

Οντολογία σύμφωνα με τη Φιλοσοφία Οντολογία σύμφωνα με τη Φιλοσοφία κλάδος της Μεταφυσικής η επιστήμη της ύπαρξης ερευνά τα είδη και τη φύση των αντικειμένων καθώς και τις μεταξύ τους σχέσεις. η επιστήμη των κατηγοριών ερευνά τις κατηγορίες

Διαβάστε περισσότερα

Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475

Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475 «ΧΡΗΣΗ ΥΒΡΙΔΙΚΩΝ ΕΥΦΥΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΠΡΟΣΑΡΜΟΣΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΜΑΘΗΤΩΝ ΣΕ ΕΥΦΥΕΣ ΣΥΣΤΗΜΑ ΔΙΔΑΣΚΑΛΙΑΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ» Κωνσταντίνος Παπαβλασόπουλος ΑΜ:475 Τριμελής Εξεταστική Επιτροπή: Καθηγητής:Λυκοθανάσης

Διαβάστε περισσότερα

GoDigital.Store E-Commerce Platform

GoDigital.Store E-Commerce Platform GoDigital.Store E-Commerce Platform Πλήρης διαχείριση καταλόγου και καταστήματος banet Α.Ε. Βαλαωρίτου 20 54625 Θεσσαλονίκη Τ.2310253999 F.2310253998 www.banet.gr info@banet.gr GoDigital.Store Γενική περιγραφή

Διαβάστε περισσότερα

Ενότητες Γ3.1 - Γ3.2 - Γ3.3

Ενότητες Γ3.1 - Γ3.2 - Γ3.3 Ενότητες Γ3.1 - Γ3.2 - Γ3.3 3.1 Τo διαδίκτυο ως πηγή πληροφοριών 3.2 Αξιοποίηση- αξιολόγηση ιστοσελίδων, ιστοχώρων και πυλών 3.3 Σχεδίαση μαθημάτων με τη χρήση του διαδικτύου To Διαδίκτυο ως πηγή πληροφοριών

Διαβάστε περισσότερα

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014 Web Mining Χριστίνα Αραβαντινού aravantino@ceid.upatras.gr Ιούνιος 2014 1 / 34 Χριστίνα Αραβαντινού Web Mining Περιεχόµενα 1 2 3 4 5 6 2 / 34 Χριστίνα Αραβαντινού Web Mining Το Web Mining στοχεύει στην

Διαβάστε περισσότερα

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται:

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται: Μάθημα 10 Συστήματα Διάχυσης και Διαχείρισης Γνώσης Chapter 10 Knowledge Transfer In The E-world Chapter 13 Knowledge Management Tools and Knowledge Portals Συστήματα Διάχυσης και Διαχείρισης Γνώσης Λογισμικό

Διαβάστε περισσότερα

Εξέλιξη των Τεχνολογιών και Υπηρεσιών του Παγκόσμιου Ιστού και Εφαρμογές στην Εκπαίδευση. Oμάδα Ά

Εξέλιξη των Τεχνολογιών και Υπηρεσιών του Παγκόσμιου Ιστού και Εφαρμογές στην Εκπαίδευση. Oμάδα Ά Εξέλιξη των Τεχνολογιών και Υπηρεσιών του Παγκόσμιου Ιστού και Εφαρμογές στην Εκπαίδευση Oμάδα Ά Εισαγωγή Η ολοένα και αυξανόμενη πρόοδος στις τεχνολογίες και υπηρεσίες του Παγκόσμιου Ιστού Web, διευκολύνει

Διαβάστε περισσότερα

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους Επιμέλεια: Καρανικολάου Θεοδώρα Επιβλέπων καθηγητής: Δενδρινός Μάρκος Αθήνα, 2017 Σκοπός Στόχος της πτυχιακής

Διαβάστε περισσότερα

ΥΠΗΡΕΣΙΑ. Ηλεκτρονική ιαχείριση Τάξης. Οδηγίες χρήσης για τον µαθητή.

ΥΠΗΡΕΣΙΑ. Ηλεκτρονική ιαχείριση Τάξης. Οδηγίες χρήσης για τον µαθητή. ΥΠΗΡΕΣΙΑ Ηλεκτρονική ιαχείριση Τάξης Οδηγίες χρήσης για τον µαθητή http://eclass.sch.gr Η υπηρεσία ηλεκτρονικής διαχείρισης τάξης αναπτύχθηκε από το Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών για λογαριασµό

Διαβάστε περισσότερα

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων Ο ΡΟΛΟΣ ΤΩΝ ΔΙΑΣΥΝΔΕΔΕΜΕΝΩΝ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΤΩΝ ΒΙΒΛΙΟΘΗΚΩΝ Δρ. Χαράλαμπος Μπράτσας - OKGR CEO, Σωτήριος Καραμπατάκης - OKGR Open G.L.A.M.

Διαβάστε περισσότερα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα 6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά

Διαβάστε περισσότερα

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις Άγγελος Μητρέλης 1, Λεωνίδας Παπαχριστόπουλος 1, Γιάννης Τσάκωνας 1,2, Χρήστος Παπαθεοδώρου

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

Αύξηση της αναγνωρισιµότητας µίας πράσινης επιχείρησης Υποενότητα 1

Αύξηση της αναγνωρισιµότητας µίας πράσινης επιχείρησης Υποενότητα 1 2O16-1-DEO2-KA2O2-003277 Αύξηση της αναγνωρισιµότητας µίας πράσινης επιχείρησης Υποενότητα 1 Αύξηση αναγνωρισιµότητας -Τι είναι; Όνομα Διεξάγων εδώ This project has been funded with support from the European

Διαβάστε περισσότερα

Περίληψη Λαμπρόπουλος

Περίληψη Λαμπρόπουλος Περίληψη Λαμπρόπουλος 1. Αντικείμενο και Περιγραφή της Διατριβής H διδακτορική διατριβή με τίτλο «Σχεδιασμός και υλοποίηση συστήματος διαχείρισης και ενοποίησης διαφορετικών ταυτοτήτων χρηστών σε δίκτυα

Διαβάστε περισσότερα

Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών

Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών Οδηγός Εργαστηρίου:

Διαβάστε περισσότερα

Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015

Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015 Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015 Εισαγωγή Πρόβλημα Ορισμός Μέθοδοι πρόβλεψης προτιμήσεων Δημιουργία βέλτιστων προτάσεων Τεκμηρίωση προτάσεων Ενημέρωση και επεκτασιμότητα People read around 10 MB worth

Διαβάστε περισσότερα

Βάσεις Δεδομένων Ενότητα 1

Βάσεις Δεδομένων Ενότητα 1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 1: Εισαγωγή στις Ιωάννης Μανωλόπουλος, Καθηγητής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Ανάπτυξη μιας προσαρμοστικής πολιτικής αντικατάστασης αρχείων, με χρήση

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 1.1 Εισαγωγή... 16 1.2 Διαδίκτυο και Παγκόσμιος Ιστός Ιστορική αναδρομή... 17 1.3 Αρχές πληροφοριακών συστημάτων

Διαβάστε περισσότερα

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος

Περιγραφή Μαθήματος. Περιγραφή Περιεχόμενο του Μαθήματος + Περιγραφή Μαθήματος Τίτλος Κωδικός Αριθμός του Πληροφοριακά Συστήματα Μαθήματος : Επίπεδο Τύπος του Μαθήματος : ΠΡΟΠΤΥΧΙΑΚΟ - ΥΠΟΧΡΕΩΤΙΚΟ Έτος Σπουδών Εξάμηνο : 5 Ε Αριθμός Ευρωπαϊκών Πιστωτικών Μονάδων

Διαβάστε περισσότερα

Μαθηματικά και Πληροφορική. Διδακτική Αξιοποίηση του Διαδικτύου για τη Μελέτη και την Αυτο-αξιολόγηση των Μαθητών.

Μαθηματικά και Πληροφορική. Διδακτική Αξιοποίηση του Διαδικτύου για τη Μελέτη και την Αυτο-αξιολόγηση των Μαθητών. Μαθηματικά και Πληροφορική. Διδακτική Αξιοποίηση του Διαδικτύου για τη Μελέτη και την Αυτο-αξιολόγηση των Μαθητών. Α. Πέρδος 1, I. Σαράφης, Χ. Τίκβα 3 1 Ελληνογαλλική Σχολή Καλαμαρί perdos@kalamari.gr

Διαβάστε περισσότερα

O7: Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7-A1: Αναπτύσσοντας εργαλεία για το Πρόγραμμα Κατάρτισης Εκπαιδευτικών

O7: Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7-A1: Αναπτύσσοντας εργαλεία για το Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7: Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7-A1: Αναπτύσσοντας εργαλεία για το Πρόγραμμα Κατάρτισης Εκπαιδευτικών Prepared by University Paderborn 30/11/2015 Project name: Project acronym: Project number:

Διαβάστε περισσότερα

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud Το Oracle Analytics Cloud αποτελεί ένα ολοκληρωμένο σύνολο δυνατοτήτων που περιλαμβάνει έτοιμο περιεχόμενο, εξειδικευμένα

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS Ακαδημαϊκό Έτος 2016-2017, Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS A. Εισαγωγή στις βάσεις δεδομένων - Γνωριμία με την ACCESS B. Δημιουργία Πινάκων 1. Εξήγηση των

Διαβάστε περισσότερα

Σχεδιασµός βασισµένος σε συνιστώσες

Σχεδιασµός βασισµένος σε συνιστώσες Σχεδιασµός βασισµένος σε συνιστώσες 1 Ενδεικτικά περιεχόµενα του κεφαλαίου Ποια είναι τα "άτοµα", από τα οποία κατασκευάζονται οι υπηρεσίες; Πώς οργανώνουµε τις συνιστώσες σε ένα αρµονικό σύνολο; Τι είναι

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 www.iatrolexi.cti.gr 1 Ερευνητικό Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών (ΕΑΙΤΥ) Σελίδα 1 Ημερομηνία:

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Α_ΤΕΤΡΑΜ_ ΕΣΠΕΡΙΝΟ ΛΥΚΕΙΟ ΛΑΡΙΣΑΣ. ΘΕΜΑ: E-LEARNING Αντζελα Πιετρη-Αριστελα Γκιονι ESPERINO LYKEIO LARISAS

ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Α_ΤΕΤΡΑΜ_ ΕΣΠΕΡΙΝΟ ΛΥΚΕΙΟ ΛΑΡΙΣΑΣ. ΘΕΜΑ: E-LEARNING Αντζελα Πιετρη-Αριστελα Γκιονι ESPERINO LYKEIO LARISAS ΕΡΕΥΝΗΤΙΚΗ ΕΡΓΑΣΙΑ Α_ΤΕΤΡΑΜ_2014-15 ΕΣΠΕΡΙΝΟ ΛΥΚΕΙΟ ΛΑΡΙΣΑΣ ΘΕΜΑ: E-LEARNING Αντζελα Πιετρη-Αριστελα Γκιονι ΜΑΘΗΣΗ Μάθηση είναι μια μόνιμη αλλαγή στη συμπεριφορά του ατόμου, η οποία είναι αποτέλεσμα εμπειρίας

Διαβάστε περισσότερα

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α Πολιτισμική Τεχνολογία Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α Δυνατότητες: Σύλληψη, συντήρηση, ανάδειξη Χρήση : Ψηφιακών βίντεο, ήχων, εικόνων, γραφικών παραστάσεων Οι συλλογές καθίστανται διαθέσιμες

Διαβάστε περισσότερα

Πίνακας Μαθησιακών Αποτελεσμάτων

Πίνακας Μαθησιακών Αποτελεσμάτων Πίνακας Μαθησιακών Αποτελεσμάτων Τα Μαθησιακά Αποτελέσματα στον παρακάτω πίνακα έχουν σχηματιστεί με βάση τα συμπεράσματα στη Διεθνική Αναφορά Έρευνας Ο1 που περιέχει τα ευρήματα της έρευνας που διεξήχθη

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής ΕΠΛ 451 Εξόρυξη Δεδομένων στον Παγκόσμιο Ιστό I. Στόχος ΑΣΚΗΣΗ 1 Ανάλυση συσχετίσεων ανάμεσα σε προϊόντα Διδάσκων: Γιώργος Πάλλης Υπεύθυνος Εργασίας: Παύλος Αντωνίου

Διαβάστε περισσότερα

ΔΙΑΣΥΝΔΕΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΙΣΤΟΣΕΛΙΔΩΝ ΣΕ ΕΝΙΑΙΟ ΠΕΡΙΒΑΛΛΟΝ: ΕΦΑΡΜΟΓΗ ΣΤΟΝ ΙΣΤΟΤΟΠΟ ΤΗΣ ΣΧΟΛΗΣ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ

ΔΙΑΣΥΝΔΕΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΙΣΤΟΣΕΛΙΔΩΝ ΣΕ ΕΝΙΑΙΟ ΠΕΡΙΒΑΛΛΟΝ: ΕΦΑΡΜΟΓΗ ΣΤΟΝ ΙΣΤΟΤΟΠΟ ΤΗΣ ΣΧΟΛΗΣ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ ΔΙΑΣΥΝΔΕΣΗ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΙΣΤΟΣΕΛΙΔΩΝ ΣΕ ΕΝΙΑΙΟ ΠΕΡΙΒΑΛΛΟΝ: ΕΦΑΡΜΟΓΗ ΣΤΟΝ ΙΣΤΟΤΟΠΟ ΤΗΣ ΣΧΟΛΗΣ ΧΗΜΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΕΜΠ Ι.Π. Τζιγκουνάκης, Ν.Γ. Καλογερόπουλος, Ε.Α. Παυλάτου, Α.Γ. Μπουντουβής, Ι.Α. Παλυβός

Διαβάστε περισσότερα

Βάσεις δεδομένων και Microsoft Access

Βάσεις δεδομένων και Microsoft Access Περιεχόμενα Κεφάλαιο 1 Βάσεις δεδομένων και Microsoft Access... 7 Κεφάλαιο 2 Microsoft Access 2010... 16 Κεφάλαιο 3 Σχεδιασμός βάσης δεδομένων και δημιουργία πίνακα... 27 Κεφάλαιο 4 Προβολές πινάκων και

Διαβάστε περισσότερα

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής Εισαγωγή στις Βάσεις Δεδομένων Εισαγωγή στις Βάσεις Δεδομένων Ορισμός Βάσης Δεδομένων Σύστημα Διαχείρισης Βάσης Δεδομένων ΣΔΒΔ (DBMS) Χαρακτηριστικά προσέγγισης συστημάτων αρχειοθέτησης Χαρακτηριστικά

Διαβάστε περισσότερα

Εννοιολογική Ομοιογένεια

Εννοιολογική Ομοιογένεια Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας Βιβλιοθηκονομίας Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Εννοιολογική Ομοιογένεια Αξιοποίηση Ταξινομικών Συστημάτων Γεωργία Προκοπιάδου, Διονύσης

Διαβάστε περισσότερα

2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ 2018 / 19 ΜΕΤΑΠΤΥΧΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ 2 ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ: ΑΣΦΑΛΕΙΑ ΠΛΗΡΟΦΟΡΙΑΚΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Διαβάστε περισσότερα

Εισαγωγή στο Auto Moto Cube

Εισαγωγή στο Auto Moto Cube POWERED BY ACT Εισαγωγή στο Auto Moto Cube 1 Version: 01 Μάιος 2017 Εισαγωγή Εγχειριδίου Pylon-Auto Moto Cube Ο σκοπός της παρούσας σειράς εγχειριδίων για το Auto Moto Cube είναι η εισαγωγή του αναγνώστη

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση Ομάδα: Αριστερίδου Δανάη Ελένη (08) Ευαγγελόπουλος Νίκος (670)

Διαβάστε περισσότερα

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT Σκοπός της αξιολόγησης είναι να αποτιμηθεί ο παιδαγωγικός σχεδιασμός και η ψηφιακή αναπαράσταση της προτεινόμενης συνθετικής

Διαβάστε περισσότερα

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη Όνοµα: Νικολαΐδης Αντώνιος Επιβλέπων: Τ. Σελλής Περίληψη ιπλωµατικής Εργασίας Συνεπιβλέποντες: Θ. αλαµάγκας, Γ. Γιαννόπουλος

Διαβάστε περισσότερα

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Στο πλαίσιο της πράξης «Αναβάθμιση και Εμπλουτισμός των Ψηφιακών Υπηρεσιών της Βιβλιοθήκης του Παντείου Πανεπιστημίου». Η Πράξη συγχρηματοδοτείται από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).

Διαβάστε περισσότερα

Έκδοσης 2005 Π. Κεντερλής

Έκδοσης 2005 Π. Κεντερλής Σύστημα «Ηλέκτρα» Το Σύστημα «Ηλέκτρα» αποτελεί μια ολοκληρωμένη διαδικτυακή εφαρμογή διαχείρισης πληροφοριών μαθημάτων και χρηστών. Αναπτύχθηκε εξολοκλήρου από τον εργαστηριακό συνεργάτη Παναγιώτη Κεντερλή

Διαβάστε περισσότερα

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting

ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting ΔΙΑΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΒΕΛΤΙΣΤΗΣ ΔΙΑΧΕΙΡΙΣΗΣ ΕΝΕΡΓΕΙΑΚΩΝ ΠΟΡΩΝ E.M.I.R. - Energy Management & Intelligent Reporting Διαδικτυακό OLAP Σύστημα Λήψης Αποφάσεων και δημιουργίας έξυπνων προσαρμοστικών γραφημάτων

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Διαχείριση Πολιτισμικών Δεδομένων Ενότητα 6: Εισαγωγή στις Βάσεις Δεδομένων Το περιεχόμενο του μαθήματος διατίθεται με άδεια Creative Commons εκτός και

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01 Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #01 Διαδικαστικά μαθήματος Εισαγωγικές έννοιες & Ορισμοί Συστήματα ανάκτησης πληροφορίας 1

Διαβάστε περισσότερα

Εννοιολογική χαρτογράφηση. Τ. Α. Μικρόπουλος

Εννοιολογική χαρτογράφηση. Τ. Α. Μικρόπουλος Εννοιολογική χαρτογράφηση Τ. Α. Μικρόπουλος Οργάνωση γνώσης Η οργάνωση και η αναπαράσταση της γνώσης αποτελούν σημαντικούς παράγοντες για την οικοδόμηση νέας γνώσης. Η οργάνωση των εννοιών που αναφέρονται

Διαβάστε περισσότερα

Τεχνολογίες Υποστήριξης Συνεργασίας - Εισαγωγή

Τεχνολογίες Υποστήριξης Συνεργασίας - Εισαγωγή Τεχνολογίες Υποστήριξης Συνεργασίας - Εισαγωγή Νίκος Καρακαπιλίδης Industrial Management & Information Systems Lab MEAD, University of Patras, Greece nikos@mech.upatras.gr Ανάγκες οµάδας ατόµων που δρα

Διαβάστε περισσότερα

Συστήματα Πληροφοριών Διοίκησης

Συστήματα Πληροφοριών Διοίκησης ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Συστήματα Πληροφοριών Διοίκησης Ενότητα 2: Γενική θεώρηση και κατάταξη συστημάτων πληροφοριών διοίκησης Διονύσιος Γιαννακόπουλος, Καθηγητής Τμήμα

Διαβάστε περισσότερα

Διπλωματικές των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη

Διπλωματικές των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΓΛΩΣΣΩΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΛΟΓΙΣΜΙΚΟΥ Διπλωματικές 2006-2007 των κ. Ι. Βλαχάβα και Ν. Βασιλειάδη Επιβλέπων: Ι. Βλαχάβας 1.

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ

ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ ΤΙΤΛΟΣ ΑΝΑΦΟΡΑΣ: ΕΦΑΡΜΟΓΗ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΕΠΙΛΕΓΜΕΝΕΣ ΠΕΡΙΤΠΩΣΕΙΣ ΚΩΔΙΚΟΣ ΠΑΡΑΔΟΤΕΟΥ: Π18 ΑΡΙΘΜΟΣ ΠΡΩΤΟΚΟΛΛΟΥ ΈΡΓΟΥ: ΤΠΕ/ΟΡΖΙΟ/0308(ΒΕ)/03 ΤΙΤΛΟΣ ΕΡΓΟΥ: ΓΕΝΙΚΕΥΜΕΝΟ ΣΥΣΤΗΜΑ ΑΣΑΦΟΥΣ ΓΝΩΣΤΙΚΟΥ ΧΑΡΤΗ

Διαβάστε περισσότερα

Εξατομίκευση (Personalization) Τεχνολογίες & Υπηρεσίες (ΙΙ)

Εξατομίκευση (Personalization) Τεχνολογίες & Υπηρεσίες (ΙΙ) Εξατομίκευση (Personalization) Τεχνολογίες & Υπηρεσίες (ΙΙ) Δρ. Δημήτριος Α. Κουτσομητρόπουλος Τμήμα Επιχειρηματικού Σχεδιασμού και Πληροφοριακών Συστημάτων Α.Τ.Ε.Ι. Πάτρας 2012-2013 Δομή Μαθήματος Τι

Διαβάστε περισσότερα

ΤΠΕ στη Διδακτική των γλωσσών - Πολύγλωσσα ψηφιακά περιβάλλοντα γλωσσικής διδασκαλίας

ΤΠΕ στη Διδακτική των γλωσσών - Πολύγλωσσα ψηφιακά περιβάλλοντα γλωσσικής διδασκαλίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΤΠΕ στη Διδακτική των γλωσσών - Πολύγλωσσα ψηφιακά περιβάλλοντα γλωσσικής διδασκαλίας Ενότητα 1: Γενική Εισαγωγή στο μάθημα Παναγιώτης

Διαβάστε περισσότερα

Δράση Α8. Πρακτική εκπαίδευση του προσωπικού ενδοσχολικής τεχνικής υποστήριξης. Υπηρεσίες Πανελλήνιου Σχολικού Δικτύου

Δράση Α8. Πρακτική εκπαίδευση του προσωπικού ενδοσχολικής τεχνικής υποστήριξης. Υπηρεσίες Πανελλήνιου Σχολικού Δικτύου Οριζόντιο Έργο Υποστήριξης Σχολείων, Εκπαιδευτικών και Μαθητών στο Δρόμο για το ΨΗΦΙΑΚΟ ΣΧΟΛΕΙΟ, νέες υπηρεσίες Πανελλήνιου Σχολικού Δικτύου και Στήριξη του ΨΗΦΙΑΚΟΥ ΣΧΟΛΕΙΟΥ Δράση Α8 Πρακτική εκπαίδευση

Διαβάστε περισσότερα

Ενότητα 1: Πληροφοριακά Συστήματα και Άνθρωποι

Ενότητα 1: Πληροφοριακά Συστήματα και Άνθρωποι Ενότητα 1: Πληροφοριακά Συστήματα και Άνθρωποι Google «Αποστολή της Google είναι να οργανώσει τις παγκοσμίως διαθέσιμες πληροφορίες». Η πρόσβαση στις πληροφορίες έχει μεταμορφώσει τον τρόπο εργασίας και

Διαβάστε περισσότερα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. Eυφυή Πληροφοριακά Συστήματα. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. Eυφυή Πληροφοριακά Συστήματα. Δρ. Κωνσταντίνος Χ. Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας Eυφυή Πληροφοριακά Συστήματα Δρ. Κωνσταντίνος Χ. Γιωτόπουλος Ανάγκη για Ευφυή Πληροφοριακά Συστήματα Η συσσώρευση ολοένα και μεγαλύτερου

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.)

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.) ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.) 1.1 Κωνσταντίνος Ταραμπάνης Καθηγητής Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων Πανεπιστήμιο Μακεδονίας Γρ. 307 2310-891-578 kat@uom.gr

Διαβάστε περισσότερα

SilverPlatter WebSPIRS 4.1.

SilverPlatter WebSPIRS 4.1. WebSPIRS 4.1. Η υπηρεσία WebSPIRS από τη SilverPlatter αποτελεί ένα φιλικό εργαλείο πρόσβασης και αναζήτησης σε περιεχόμενα βάσεων δεδομένων. Η Βιβλιοθήκη και Κέντρο Πληροφόρησης του Πανεπιστημίου Θεσσαλίας

Διαβάστε περισσότερα

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Μεταδεδομένα στο Ψηφιακό περιβάλλον Μεταδεδομένα στο Ψηφιακό περιβάλλον Μονάδα Αριστείας Ανοικτού Λογισμικού - Χαροκόπειο Πανεπιστήμιο Ψηφιακό Τεκμήριο Οτιδήποτε υπάρχει σε ηλεκτρονική μορφή και μπορεί να προσπελαστεί μέσω υπολογιστή Μεταδεδομένα

Διαβάστε περισσότερα

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Τμήμα Διοίκησης Συστημάτων Εφοδιασμού Μάθημα: Εισαγωγή στην Εφοδιαστική (Εργαστήριο) Ανάλυση του άρθρου με τίτλο: «Intelligent Decision Support Systems» των Stephanie Guerlain,

Διαβάστε περισσότερα

Η αξιοποίηση του εργαλείου ASK-LOM-AP για την δημιουργία και διαχείριση προφίλ εφαρμογών του προτύπου IEEE LOM

Η αξιοποίηση του εργαλείου ASK-LOM-AP για την δημιουργία και διαχείριση προφίλ εφαρμογών του προτύπου IEEE LOM Η αξιοποίηση του εργαλείου ASK-LOM-AP για την δημιουργία και διαχείριση προφίλ εφαρμογών του προτύπου IEEE LOM Περίληψη Γεώργιος Χλωρός 1, Παναγιώτης Ζέρβας 1,2, Δημήτριος Γ. Σάμψων 1,2 gchloros@tellas.gr,

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης 1 ΕΙΣΑΓΩΓΗ (1) Ταξινόμηση ΠΣ ανάλογα με τις λειτουργίες που υποστηρίζουν: Συστήματα Επεξεργασίας Συναλλαγών ΣΕΣ (Transaction

Διαβάστε περισσότερα