ΔΙΑΔΡΑΣΤΙΚΗ ΕΞΑΤΟΜΙΚΕΥΣΗ ΙΣΤΟΣΕΛΙΔΩΝ. Παρασκευή Δ. Τζέκου ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ



Σχετικά έγγραφα
1 Συστήματα Αυτοματισμού Βιβλιοθηκών

ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΧΡΗΣΗ ΣΗΜΑΣΙΟΛΟΓΙΚΩΝ ΔΙΚΤΥΩΝ. Νικόλαος Α. Ζώτος ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ

Τεχνικές Εξόρυξης Δεδομένων

Σεπτέμβριος 1998 Σεπτέμβριος 2004 Δίπλωμα Μηχανικού Η/Υ & Πληροφορικής. του Παγκόσμιου ιστού προσαρμοσμένες στις ιδιαιτερότητες της Νέας Ελληνικής.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Εννοιολογική Ομοιογένεια

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Υπηρεσίες ιστού και ιδιωτικότητα: Μια προσέγγιση βασισμένη στη δημιουργία προφίλ χρήστη για προσαρμοστικούς ιστότοπους

Βελτιωμένη Εφαρμογή. Νέες δυνατότητες. Νέα Ιστοσελίδα

Ανάκτηση Πληροφορίας

Τεχνολογία Ηλεκτρονικού Εμπορίου

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

ΕΘΝΙΚΟ & ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝ/ΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ: ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ. Μεταπτυχιακό Πρόγραμμα Σπουδών: Συστήματα Επικοινωνιών και Δίκτυα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΕΙΣΑΓΩΓΗ ΣΤΟ ΣΥΣΤΗΜΑ ΑΞΙΟΛΟΓΗΣΗΣ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

Διερευνητική μάθηση We are researchers, let us do research! (Elbers and Streefland, 2000)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Ποια cookies χρησιμοποιούμε στον ιστότοπό μας;

Υπηρεσίες Υποστήριξης, Δικτύωσης, Προδιαγραφών & Πιστοποίησης Ιδρυματικών Αποθετηρίων

Εγχειρίδιο Διαχειριστή. (Υπηρεσία Αναζήτησης Συνεπιβατών)

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

Integraste. N e w s l e t t e r. Newsletter ΙI Ιούνιος Επιστηµονικές συναντήσεις

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

Αξιοποίηση και διάθεση ελληνικού ψηφιακού έγκριτου περιεχομένου

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΑΓΡΟΝΟΜΩΝ ΚΑΙ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ. Σπύρος Τσιπίδης. Περίληψη διατριβής

h t t p s : / / k p p. c t i. g r


Σκοπός του έργου. και η πιλοτική λειτουργία ενός ολοκληρωμένου δικτύου σχολείων

Εξατομίκευση στο Ηλεκτρονικό Επιχειρείν. ΤΕΙ Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων - Πάτρα Κουτσονίκος Γιάννης

Τομέας Εκπαιδευτικής Τεχνολογίας Παιδαγωγικό Ινστιτούτο Κύπρου ATS2020 ΤΟΜΕΙΣ ΙΚΑΝΟΤΗΤΩΝ ΚΑΙ ΔΕΞΙΟΤΗΤΩΝ ΜΕ ΣΤΟΧΟΥΣ ΕΠΙΤΕΥΞΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #03

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Σχεδιασμός και Υλοποίηση ενός πληροφοριακού συστήματος για τους τεχνικούς του φυσικού αερίου

Οδηγός. Σχολιασμού. Διπλωματικής Εργασίας

1 Ανάλυση Προβλήματος

Αναλυτικό Πρόγραμμα Μαθηματικών

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ ΣΥΝΘΕΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΚΑΙ ΣΥΝΟΔΕΥΤΙΚΟΥ ΥΛΙΚΟΥ ΣΤΟ MYPROJECT

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Πολιτική ιδιωτικού απορρήτου

Ανάκτηση Πληροφορίας

Εγχειρίδιο Επιμελητή Δράσεων. (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις)

Γουλή Ευαγγελία. 1. Εισαγωγή. 2. Παρουσίαση και Σχολιασµός των Εργασιών της Συνεδρίας

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Ερευνητική Καινοτομία και Δημιουργικότητα

Περιεχόμενα. Δημιουργία σύνδεσης ΤΙ ΕΙΝΑΙ ΙΣΤΟΣΕΛΙΔΕΣ ΚΑΙ ΤΙ ΤΟΠΟΘΕΣΙΕΣ ΙΣΤΟΥ Γνωριμία με μια ιστοσελίδα:... 38

Eκπαίδευση Εκπαιδευτών Ενηλίκων & Δία Βίου Μάθηση

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Μία αξιωματική προσέγγιση για τη διαφοροποίηση των αποτελεσμάτων

Εισαγωγή στη Σχεδίαση Λογισμικού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

ΜΕ ΕΠΕΑΕΚ: ΑΝΑΜΟΡΦΩΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΤΟΥ ΤΕΦΑΑ ΠΘ ΑΥΤΕΠΙΣΤΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Μεθοδολογία ερευνητικής εργασίας

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

International Conference Quality and Equity in Education: Theories, Applications and Potentials

Πρόταση θέµατος πτυχιακής εργασίας

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΘΕΜΑ: Πρόσκληση εκδήλωσης ενδιαφέροντος για την παροχή υπηρεσιών με τίτλο «Σχεδιασμός λογοτύπου και σχεδιασμός και κατασκευή δυναμικής ιστοσελίδας»

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Διαχείριση Πολιτισμικών Δεδομένων

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση. Κορφιάτης Γιώργος ιπλωµατική Εργασία

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Εκπαιδευτικό Σενάριο 2

...στις µέρες µας, όσο ποτέ άλλοτε, οι χώρες καταναλώνουν χρόνο και χρήµα στη µέτρηση της απόδοσης του δηµόσιου τοµέα...(oecd)

ΚΕΝΤΡΟ ΕΡΕΥΝΩΝ ΓΙΑ ΘΕΜΑΤΑ ΙΣΟΤΗΤΑΣ (Κ.Ε.Θ.Ι.)

Τριμηνιαίο ενημερωτικό Η.R. Newsletter. 14o ΤΕΥΧΟΣ

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις

ΥΠΗΡΕΣΙΑ. Ηλεκτρονική ιαχείριση Τάξης. Οδηγίες χρήσης για τον µαθητή.

ΒΟΗΘΕΙΑ για τη χρήση του ιδρυματικού αποθετηρίου ΥΠΑΤΙΑ ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

1. Οι Τεχνολογίες της Πληροφορίας και των Επικοινωνιών στην εκπαιδευτική διαδικασία

ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ ΤΟΥ ΤΜΗΜΑΤΟΣ ΣΤΟΧΟΙ ΓΙΑ ΤΗΝ ΠΕΡΙΟΔΟ ΠΑΡΑΡΤΗΜΑ ΧΙ

ΜΟ.ΔΙ.Π.Α.Β. Κεντρική Υποδομή Επιχειρησιακής Ευφυΐας για Βιβλιοθήκες και Υπηρεσίες Πληροφόρησης

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας.

προετοιμασίας και του σχεδιασμού) αρχικά στάδια (της αντιμετώπισή τους. προβλήματος της ΔΕ Ειρήνη Γεωργιάδη Καθηγήτρια Σύμβουλος της ΕΚΠ65 του ΕΑΠ

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

Συγγραφή ερευνητικής πρότασης

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΔΡΑΣΤΙΚΗ ΕΞΑΤΟΜΙΚΕΥΣΗ ΙΣΤΟΣΕΛΙΔΩΝ Παρασκευή Δ. Τζέκου ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ Οκτώβριος 2007

2

PATRAS UNIVERCITY SCHOOL OF ENGINEERING COMPUTER ENGINEERING AND INFORMATICS DEPARTMENT ADAPTIVE SITE CUSTOMIZATION Paraskevi D. Tzekou MASTER S THESIS October 2007 3

4

Διαδραστική Εξατομίκευση Ιστοσελίδων Παρασκευή Δ. Τζέκου Μεταπτυχιακό Δίπλωμα Ειδίκευσης Επιβλέπων: Καθηγητής Δημήτριος Ν. Χριστοδουλάκης, Τμήμα Μηχανικών Η/Υ και Πληροφορικής, Πανεπιστήμιο Πατρών Συνεπιβλέπουσα: Σοφία Στάμου, μεταδιδακτορικός στο Τμήμα Μηχανικών Η/Υ και Πληροφορικής, Πανεπιστήμιο Πατρών. Στην Τριμελή Συμβουλευτική Επιτροπή, εκτός από τον επιβλέποντα καθηγητή, συμμετείχαν οι: Αναπληρωτής Καθηγητής Μπούρας Χρήστος, Τμήμα Μηχανικών Η/Υ και Πληροφορικής, Πανεπιστήμιο Πατρών Καθηγητής Παυλίδης Γεώργιος, Τμήμα Διοίκησης Επιχειρήσεων, Πανεπιστήμιο Πατρών 5

6

Στους γονείς, τη γιαγιά και τον αδερφό μου 7

8

ΕΥΧΑΡΙΣΤΙΕΣ Αρχικά θα ήθελα να ευχαριστήσω την οικογένειά μου για την αμέριστη στήριξη και συμπαράσταση καθόλη τη διάρκεια των σπουδών μου. Στην υλική και συναισθηματική υποστήριξη των γονιών, της γιαγιάς και του αδερφού μου οφείλω οτιδήποτε έχω καταφέρει να κάνω μέχρι σήμερα. Τους αφιερώνω την εργασία αυτή γιατί θεωρώ ότι κατά ένα μεγάλο βαθμό είναι και δικό τους έργο. Επίσης θα ήθελα να ευχαριστήσω τον καθηγητή και επιβλέποντα της παρούσας εργασίας κ. καθηγητή Δημήτρη Χριστοδουλάκη που μου έδωσε την ευκαιρία να γίνω μέλος της ομάδας του Εργαστηρίου Βάσεων και να αποκτήσω πολύτιμες εμπειρίες κατά τη διάρκεια των δύο τελευταίων χρόνων. Επιπλέον οφείλω στον κ. Χριστοδουλάκη ένα ευχαριστώ για το ότι μου έδωσε την απαραίτητη υποστήριξη για να πραγματοποιήσω ερευνητικό έργο στα πλαίσια του Μεταπτυχιακού Διπλώματος και να εκπονήσω τη συγκεκριμένη εργασία. Οφείλω επίσης να ευχαριστήσω τα υπόλοιπα μέλη της τριμελούς συμβουλευτικής επιτροπής, τον αναπληρωτή καθηγητή Χρήστο Μπούρα και τον καθηγητή Γεώργιο Παυλίδη για τη συνεισφορά τους στην ολοκλήρωση της εργασίας αυτής. Ένα πολύ μεγάλο ευχαριστώ οφείλω στην μεταδιδακτορική ερευνήτρια του εργαστηρίου Βάσεων Δεδομένων, Στάμου Σοφία για την πολύτιμη βοήθεια και συμπαράσταση που μου έδωσε όλο αυτόν τον καιρό. Η Σοφία στάθηκε κάτι παραπάνω από συνεργάτης όλο αυτό το διάστημα και μου πρόσφερε πραγματική στήριξη, καθοδήγηση και φιλία. Την ευχαριστώ για την υπομονή της και για όλα όσα έχει προσφέρει και προσφέρει ακόμα. Θέλω επίσης να ευχαριστήσω και τους φίλους και συνεργάτες μου σε αυτή την ερευνητική προσπάθεια, τον Νίκο Ζώτο και τον Λευτέρη Κοζανίδη. Η συνεργασία μας ήταν άψογη και η βοήθειά τους σημαντική. Τους ευχαριστώ πολύ που ήταν δίπλα μου στις δυσκολίες της ερευνητικής μας προσπάθειας και κυρίως που έδειξαν απέραντη υπομονή στις περιόδους που πλησίαζαν τα deadlines. Επίσης θέλω να ευχαριστήσω και τους υπόλοιπους φίλους από το εργαστήριο, τον Νίκο Μπουλούμπαση και τον Αλέξανδρο Σπύρου, για τη στήριξη και τη βοήθειά τους. Με όλα τα παιδιά του εργαστηρίου συνεργαστήκαμε πολύ καλά τα τελευταία δυο χρόνια και σ αυτό οφείλεται κατά ένα μεγάλο μέρος η δουλειά που έγινε. Τέλος θα ήθελα να ευχαριστήσω και όλους τους άλλους ανθρώπους που στάθηκαν δίπλα μου αυτή την περίοδο. Τους φίλους που άκουγαν όλα τα παράπονα και με βοήθησαν να ξεπεράσω το άγχος και τις δυσκολίες και που θα είναι δίπλα μου στα δύσκολα που έρχονται. 9

10

ΠΡΟΛΟΓΟΣ Η εκρηκτική αύξηση του μεγέθους των δεδομένων που είναι διαθέσιμα στο Δίκτυο καθώς και η ποικιλία των εργασιών οι οποίες μπορούν να πραγματοποιηθούν μέσω του Δικτύου έχουν αυξήσει σημαντικά την νομισματική αξία της κίνησης στο Δίκτυο. Για να κερδίσουν από αυτή την αναπτυσσόμενη αγορά, οι διαχειριστές ιστοσελίδων προσπαθούν να αυξήσουν την κίνηση χρηστών στην ιστοσελίδα τους, διαμορφώνοντάς τη κατάλληλα έτσι ώστε να ικανοποιεί τις ανάγκες συγκεκριμένων χρηστών. Η διαμόρφωση και η παραμετροποίηση των ιστοσελίδων παρουσιάζει δύο μεγάλες προκλήσεις: την αποτελεσματική αναγνώριση των ενδιαφερόντων κάθε χρήστη και την ενσωμάτωση των ενδιαφερόντων του στην παρουσίαση και στο περιεχόμενο της ιστοσελίδας. Σε αυτή την εργασία μελετάται ο τρόπος με τον οποίο μπορούμε να αναγνωρίσουμε με ακρίβεια τα ενδιαφέροντα ενός χρήστη χρησιμοποιώντας τα μοτίβα πλοήγησης και παρουσιάζεται ένας καινοτόμος μηχανισμός προτάσεων ο οποίος εφαρμόζει τεχνικές εξόρυξης στο Δίκτυο για να πραγματοποιήσει τη συσχέτιση μεταξύ των ενδιαφερόντων του χρήστη και του περιεχομένου και της δομής της ιστοσελίδας. Στόχος της τεχνικής που παρουσιάζεται είναι να παραμετροποιηθεί η σελίδα για κάθε συγκεκριμένο χρήστη με βάση τα ενδιαφέροντά του. Η πειραματική αξιολόγηση αποδεικνύει ότι είναι δυνατόν να συμπεράνουμε με ακρίβεια τα ενδιαφέροντα ενός χρήστη από την συμπεριφορά του κατά την πλοήγηση και ότι ο μηχανισμός προτάσεων, ο οποίος χρησιμοποιεί τα συμπεράσματα για τα ενδιαφέροντα του χρήστη, έχει σαν αποτέλεσμα σημαντικές βελτιώσεις στη λειτουργικότητα μιας ιστοσελίδας. 11

12

ABSTRACT The explosive growth of online data and the diversity of goals that may be pursued over the web have significantly increased the monetary value of the web traffic. To tap into this accelerating market, web site operators try to increase their traffic by customizing their sites to the needs of specific users. Web site customization involves two great challenges: the effective identification of the user interests and the encapsulation of those interests into the sites presentation and content. In this paper, we study how we can effectively detect the user interests that are hidden behind navigational patterns and we introduce a novel recommendation mechanism that employs web mining techniques for correlating the identified interests to the sites semantic content, in order to customize them to specific users. Our experimental evaluation shows that the user interests can be accurately detected from their navigational behavior and that our recommendation mechanism, which uses the identified interests, yields significant improvements in the sites usability. 13

14

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΕΥΧΑΡΙΣΤΙΕΣ...9 ΠΡΟΛΟΓΟΣ...11 ABSTRACT...13 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ...15 ΕΥΡΕΤΗΡΙΟ ΣΧΗΜΑΤΩΝ...17 ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ...19 ΚΕΦΑΛΑΙΟ 1...21 ΕΙΣΑΓΩΓΗ...21 1.1 ΕΞΑΤΟΜΙΚΕΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΔΙΚΤΥΟΥ...22 1.2 ΠΡΟΚΛΗΣΕΙΣ ΕΞΑΤΟΜΙΚΕΥΣΗΣ...24 1.3 ΑΝΤΙΚΕΙΜΕΝΟ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ...25 1.4 ΣΥΝΕΙΣΦΟΡΑ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ...27 1.5 ΔΟΜΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ...28 1.6 ΔΗΜΟΣΙΕΥΣΕΙΣ...30 ΚΕΦΑΛΑΙΟ 2...31 ΕΞΑΤΟΜΙΚΕΥΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΚΑΙ ΟΙ ΕΦΑΡΜΟΓΕΣ ΤΗΣ...31 2.1 ΕΞΑΤΟΜΙΚΕΥΣΗ ΑΝΑΖΗΤΗΣΗΣ...33 2.1.1 ΑΠΟΣΑΦΗΝΙΣΗ ΕΡΩΤΗΜΑΤΩΝ...35 2.1.2 ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ...37 2.1.3 ΤΑΥΤΟΠΟΙΗΣΗ ΕΡΩΤΗΜΑΤΩΝ ΚΑΙ ΣΕΛΙΔΩΝ ΓΙΑ ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΚΑΤΑΤΑΞΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ...37 2.2 ΕΞΑΤΟΜΙΚΕΥΣΗ ΠΛΟΗΓΗΣΗΣ...41 2.2.1 ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΤΑ ΔΕΔΟΜΕΝΑ ΠΛΟΗΓΗΣΗΣ...42 2.2.2 ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ ΔΟΜΗΣ ΚΑΙ ΤΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΣΤΟΤΟΠΩΝ...43 2.2.2.1 ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΟΜΗΣ ΙΣΤΟΤΟΠΩΝ...43 2.2.2.2 ΑΝΑΠΑΡΑΣΤΑΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΣΤΟΤΟΠΩΝ...44 2.2.2.3 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΕΔΟΜΕΝΩΝ...45 2.2.3 ΤΕΧΝΙΚΕΣ ΣΥΜΠΕΡΑΣΜΟΥ ΠΡΟΦΙΛ ΠΛΟΗΓΗΣΗΣ...46 2.2.4 ΕΠΙΛΟΓΗ ΠΡΟΤΕΙΝΟΜΕΝΩΝ ΕΞΑΤΟΜΙΚΕΥΜΕΝΩΝ ΑΝΑΠΑΡΑΣΤΑΣΕΩΝ ΙΣΤΟΤΟΠΩΝ...47 ΚΕΦΑΛΑΙΟ 3...51 ΜΟΝΤΕΛΑ ΕΞΑΤΟΜΙΚΕΥΜΕΝΗΣ ΠΛΟΗΓΗΣΗΣ...51 3.1 ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ...52 3.1.1 ΠΙΘΑΝΟΤΙΚΕΣ ΤΕΧΝΙΚΕΣ ΑΥΤΟΜΑΤΗΣ ΔΗΜΙΟΥΡΓΙΑΣ ΠΡΟΦΙΛ...53 3.1.2 ΤΟΠΙΚΑ ΚΑΙ ΚΑΤΑΝΕΜΗΜΕΝΑ ΜΟΝΤΕΛΑ ΕΞΑΤΟΜΙΚΕΥΣΗΣ..53 3.2 ΠΡΟΣΕΓΓΙΣΗ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ...54 3.2.1 ΚΑΝΟΝΕΣ ΣΥΣΧΕΤΙΣΗΣ...56 3.2.2 ΣΥΝΕΡΓΑΤΙΚΟ ΦΙΛΤΡΑΡΙΣΜΑ...57 3.2.3 ΤΕΧΝΙΚΕΣ ΑΝΑΝΕΩΣΗΣ ΠΡΟΦΙΛ ΧΡΗΣΤΩΝ...67 3.3 ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ...68 3.3.1 Η ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΤΗ ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΦΙΛ...70 3.4 ΔΙΑΔΡΑΣΤΙΚΟΤΗΤΑ...71 ΚΕΦΑΛΑΙΟ 4...73 ΠΡΟΤΕΙΝΟΜΕΝΗ ΠΡΟΣΕΓΓΙΣΗ...73 15

4.1 ΑΡΧΙΤΕΚΤΟΝΙΚΗ...73 4.2 ΠΡΟΑΠΑΙΤΟΥΜΕΝΟΙ ΠΟΡΟΙ...74 4.3 ΤΟ ΜΟΝΤΕΛΟ ΔΗΜΙΟΥΡΓΙΑΣ ΠΡΟΦΙΛ...79 4.4 ΜΟΝΤΕΛΟ ΑΠΟΣΑΦΗΝΙΣΗΣ...84 4.5 ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ...85 4.6 ΑΛΓΟΡΙΘΜΟΣ ΤΑΥΤΟΠΟΙΗΣΗΣ...88 4.7 ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΑΠΕΙΚΟΝΙΣΗ ΤΩΝ ΠΡΟΤΕΙΝΟΜΕΝΩΝ ΙΣΤΟΣΕΛΙΔΩΝ...90 ΚΕΦΑΛΑΙΟ 5...93 ΠΕΙΡΑΜΑΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΕΞΑΤΟΜΙΚΕΥΣΗΣ...93 5.1 ΠΕΙΡΑΜΑΤΙΚΑ ΔΕΔΟΜΕΝΑ...93 5.2 ΜΕΤΡΙΚΕΣ ΑΞΙΟΛΟΓΗΣΗΣ...94 5.3 ΑΚΡΙΒΕΙΑ ΤΗΣ ΑΠΟΔΟΣΗΣ ΔΗΜΙΟΥΡΓΙΑΣ ΠΡΟΦΙΛ ΧΡΗΣΤΩΝ...96 5.4 ΑΠΟΤΕΛΕΣΜΑΤΙΚΟΤΗΤΑ ΤΗΣ ΑΠΟΔΟΣΗΣ ΠΑΡΑΜΕΤΡΟΠΟΙΗΣΗΣ ΙΣΤΟΤΟΠΩΝ...97 5.5 ΕΠΙΣΚΟΠΗΣΗ ΠΕΙΡΑΜΑΤΙΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ...99 ΚΕΦΑΛΑΙΟ 6...101 ΣΧΕΤΙΚΗ ΕΡΕΥΝΑ...101 6.1 ΠΑΡΑΔΕΙΓΜΑΤΑ ΕΦΑΡΜΟΓΩΝ ΕΞΑΤΟΜΙΚΕΥΣΗΣ...102 6.2 ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΤΑΞΙΝΟΜΗΣΗ ΙΣΤΟΣΕΛΙΔΩΝ...103 6.3 ΕΞΑΤΟΜΙΚΕΥΜΕΝΗ ΔΙΕΥΡΥΝΣΗ ΑΝΑΖΗΤΗΣΗΣ...104 6.4 ΕΞΑΤΟΜΙΚΕΥΣΗ ΙΣΤΟΤΟΠΩΝ...104 6.4.1 ΕΞΑΤΟΜΙΚΕΥΣΗ ΥΠΕΡΣΥΝΔΕΣΜΩΝ...104 6.4.2 ΕΞΑΤΟΜΙΚΕΥΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ...105 6.5 ΘΕΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΕΝΗ ΠΡΟΣΚΟΜΙΔΗ ΔΕΔΟΜΕΝΩΝ...106 ΚΕΦΑΛΑΙΟ 7...109 ΣΥΜΠΕΡΑΣΜΑΤΑ ΜΕΛΛΟΝΤΙΚΕΣ ΚΑΤΕΥΘΥΝΣΕΙΣ...109 7.1 ΑΠΟΤΙΜΗΣΗ ΤΟΥ ΕΡΓΟΥ...109 7.2 ΜΕΛΛΟΝΤΙΚΕΣ ΚΑΤΕΥΘΥΝΣΕΙΣ...110 ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΑΝΑΦΟΡΕΣ...113 ΕΥΡΕΤΗΡΙΟ ΟΡΩΝ...123 ΠΑΡΑΡΤΗΜΑ...125 ΕΦΑΡΜΟΓΗ ΚΑΤΑΓΡΑΦΗΣ ΣΥΜΠΕΡΙΦΟΡΑΣ ΠΛΟΗΓΗΣΗΣ ΤΟΥ ΧΡΗΣΤΗ...125 16

ΕΥΡΕΤΗΡΙΟ ΣΧΗΜΑΤΩΝ Σχήμα 1 Τμήματα ενός συστήματος εξατομίκευσης Παγκόσμιου Ιστού...34 Σχήμα 2 Διαδικασία εξόρυξης πληροφορίας για το προφίλ του χρήστη με εφαρμογή τεχνικών έμμεσης ανατροφοδότησης....41 Σχήμα 3 Παράδειγμα XML δεδομένων...46 Σχήμα 4 Αρχικτεκτονική συστήματος...73 Σχήμα 5 Σχέσεις υπερωνυμίας/υπωνυμίας μεταξύ των συνόλων συνώνυμων όρων..77 Σχήμα 6 Διαδικασία δημιουργίας του προφίλ χρήστη...82 Σχήμα 7 Γραφική αναπαράσταση πολύσημου όρου "jaguar" στο WordNet...84 Σχήμα 8 Σχετικά λάθη στα εκτιμώμενα ενδιαφέροντα των χρηστών...96 Σχήμα 9 Διαφορές στην ταξινόμηση των 10 πρώτων προτάσεων...97 Σχήμα 10 Μέση διαφορά μεταξύ της εκτιμώμενης και πραγματικής χρησιμότητας των ιστοσελίδων στους ιστότοπους τους οποίους επισκέφτηκαν οι συμμετέχοντες...99 Σχήμα 11 Αρχιτεκτονική Εξατομικευμένου Προσκομιστή με χρήση μεταδεδομένων...107 Σχήμα 12 Κεντρική διεπαφή εφαρμογής καταγραφής δεδομένων ιστορικού πλοήγησης του χρήστη...125 Σχήμα 13 Παρουσίαση κατηγοριοποίησης των περιεχομένων ενός ιστότοπου...126 17

18

ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ Πίνακας 1 Χαρακτηριστικά που χρησιμοποιούνται για τη αναπαράσταση των αλληλεπιδράσεων μετά από τη διενέργεια της αναζήτησης, για ένα δεδομένο ερώτημα και ένα αποτέλεσμα της αναζήτησης...56 Πίνακας 2 Στατιστικά αποτελέσματα των πειραμάτων...94 19

20

ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ Εκατομμύρια ανθρώπων χρησιμοποιούν το Διαδίκτυο καθημερινά για διάφορους λόγους: για να βρουν πληροφορίες, για να πραγματοποιήσουν οικονομικές δοσοληψίες, για να επικοινωνήσουν με άλλους κλπ. Λόγω της εκρηκτικής αύξησης του μεγέθους των δεδομένων που είναι διαθέσιμα στο Διαδίκτυο και της ποικιλίας των εργασιών των οποίων οι χρήστες επιδιώκουν να πραγματοποιήσουν δεν αποτελεί έκπληξη το γεγονός ότι η κίνηση στο Διαδίκτυο έχει αποκτήσει μεγάλη νομισματική αξία τα τελευταία χρόνια. Για να εκμεταλλευτούν αυτή την αναπτυσσόμενη αγορά, οι διαχειριστές ιστοσελίδων επιδιώκουν να αυξήσουν την κίνηση στις ιστοσελίδες τους παραμετροποιώντας τις σύμφωνα με τις ανάγκες των χρηστών. Η παραμετροποίηση ιστοσελίδων είναι η διαδικασία διαμόρφωσης των πληροφοριών ή των υπηρεσιών μιας ιστοσελίδας έτσι ώστε να ικανοποιεί τις ανάγκες των χρηστών. Η προσαρμογή του περιεχομένου και της δομής των δεδομένων του Διαδικτύου σε συγκεκριμένα ενδιαφέροντα αποτελεί ένα ενεργό πεδίο έρευνας για αρκετά χρόνια. Κάποιοι διαχειριστές επιχειρούν να βελτιώσουν τις ιστοσελίδες τους βασισμένοι σε ανάλυση των δεδομένων χρήσης του Διαδικτύου. Οι περισσότερες από αυτές τις προσπάθειες[14][115][118], επικεντρώνονται στην εξαγωγή χρήσιμων μοτίβων και κανόνων, χρησιμοποιώντας τεχνικές εξόρυξης δεδομένων, έτσι ώστε να γίνει κατανοητή η συμπεριφορά πλοήγησης του χρήστη. Οι αποφάσεις, οι οποίες αφορούν στην κατάλληλη δόμηση της ιστοσελίδας και του περιεχομένου της, μπορούν να γίνουν από ανθρώπους με βάση τα συμπεράσματα που εξήχθησαν για τη συμπεριφορά του χρήστη. Παρόλα αυτά, η παραμετροποίηση μιας ιστοσελίδας με βάση τη χρήση που έχει πραγματοποιηθεί από χρήστες μπορεί να αποδειχτεί προβληματική όταν δεν υπάρχουν αρκετά δεδομένα για να εξαγχθούν τα μοτίβα πλοήγησης που αφορούν σε συγκεκριμένες κατηγορίες ή όταν στην ιστοσελίδα πραγματοποιούνται αλλαγές στο περιεχόμενο ή προστίθενται νέες σελίδες οι οποίες δεν συμπεριλαμβάνονται ακόμα στο ιστορικό προσβάσεων στην ιστοσελίδα[84]. Για να ξεπεραστούν τέτοιου είδους δυσκολίες, ερευνητές έχουν προτείνει την εκμετάλλευση πληροφορίας που εξάγεται από το περιεχόμενο των ιστοσελίδων [32][93] και τη δομή [30] των ιστότοπων. Συγκεκριμένα προτείνουν να συνδυαστεί η χρησιμοποίηση της ιστοσελίδας με τη γνώση για το περιεχόμενο έτσι ώστε να προσαρμόζονται δυναμικά οι ιστότοποι. Η εξόρυξη πληροφορίας από το ιστορικό προσβάσεων σε έναν ιστότοπο για να βγουν συμπεράσματα για τα ενδιαφέρονται του χρήστη, έχει επίσης προταθεί στα πλαίσια μηχανών προτάσεων [36] [123]. Σε αυτή την εργασία, στηριζόμαστε σε ήδη υπάρχουσα δουλειά και προτείνουμε μια καινοτόμο μέθοδο παραμετροποίησης η οποία εφαρμόζει τεχνικές εξόρυξης πληροφορίας για να συγκεντρώσει γνώση τόσο για τη χρησιμοποίηση ενός ιστότοπου όσο και για το σημασιολογικό του περιεχόμενο. Με βάση αυτή τη γνώση, δημιουργούνται προτεινόμενοι σύνδεσμοι οι οποίοι ομαδοποιούνται σε δέντρα προτάσεων και παρουσιάζονται στον χρήστη έτσι ώστε αυτός να είναι σε θέση να 21

αποφασίσει με βάση την παραμετροποιημένη παρουσίαση του ιστότοπου που επιθυμεί να πλοηγηθεί. Για την πραγματοποίηση της συγκεκριμένης προσέγγισης, παρουσιάζουμε τη χρήση μιας θεματικής ιεραρχίας η οποία χρησιμοποιείται για να χαρακτηριστούν σημασιολογικά τόσο το ιστορικό προσβάσεων στον ιστότοπο, όσο και τα περιεχόμενα του ιστότοπου. Προτείνουμε τη χρήση της συγκεκριμένης ιεραρχίας στη διαδικασία επιλογής των προτάσεων που θα γίνουν στον χρήστη. Η συνεισφορά της δουλειάς που πραγματοποιήθηκε συνίσταται στις εξής παραμέτρους: Αναλύουμε τα δεδομένα χρησιμοποίησης του Διαδικτύου από σημασιολογική πλευρά αντί από στατιστική. Βασιζόμενοι στο σημασιολογικό περιεχόμενο των δεδομένων χρησιμοποίησης εξασφαλίζουμε ότι είναι δυνατή η αποτελεσματική αναγνώριση των ενδιαφερόντων του χρήστη ακόμα και στην περίπτωση που είναι λίγα τα δεδομένα που είναι διαθέσιμα για το ιστορικό πλοήγησης του χρήστη. Καθορίζουμε την παραμετροποιημένη μορφή του ιστότοπου βασιζόμενοι στη συσχέτιση μεταξύ των ενδιαφερόντων του χρήστη και του σημασιολογικού περιεχομένου του ιστότοπου. Με αυτόν τον τρόπο εξασφαλίζουμε ότι οι μετατροπές στον ιστότοπο είναι εναρμονισμένες με τα συγκεκριμένα ενδιαφέροντα και ότι όλες οι ιστοσελίδες στον ιστότοπο (ακόμα και αυτές που μόλις έχουν προστεθεί) συμμετέχουν στην παραμετροποιημένη παρουσίαση. Παρέχουμε παραμετροποιημένη παρουσίαση του ιστότοπου σε μορφή δέντρων προτεινόμενων συνδέσμων και επιτρέπουμε στον χρήστη να ακολουθήσει κάποιον από τους προτεινόμενους συνδέσμους. Με αυτό τον τρόπο εξασφαλίζουμε ότι η προσέγγιση παραμετροποίησης που ακολουθήθηκε είναι δυναμική, δηλαδή προσαρμόζει την παρουσίαση του ιστότοπου ανάλογα με τη γνώση που αποκτά σε βάθος χρόνου από την αλληλεπίδραση του χρήστη με τον ιστότοπο. Για να επιδείξουμε την αποτελεσματικότητα της μεθόδου που προτείνεται σε παραμετροποίηση ιστότοπων, πραγματοποιήσαμε μια έρευνα με χρήστες, όπου μετρήσαμε την ακρίβεια του μοντέλου μας στην εξαγωγή συμπερασμάτων για τα ενδιαφέροντα των χρηστών με βάση τη σημασιολογική ανάλυση του ιστορικού πλοήγησης. Επίσης εξετάσαμε τις δυνατότητες της τεχνικής προτάσεων στο να βελτιώνει την χρηστικότητα του ιστότοπου και με αυτό τον τρόπο να συντελεί στο να έχει ο χρήστης πιο ικανοποιητική εμπειρία πλοήγησης. Τα αποτελέσματα που εξήχθησαν αποδεικνύουν την αποδοτικότητα της προσέγγισής μας σ ότι αφορά στην αυτόματη εξαγωγή συμπερασμάτων για τα ενδιαφέροντα του χρήστη καθώς και την χρησιμότητα των συμπερασμάτων αυτών στη μετατροπή της παρουσίασης του ιστότοπου. 1.1 ΕΞΑΤΟΜΙΚΕΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΔΙΚΤΥΟΥ Στη σύγχρονη εποχή του ηλεκτρονικού εμπορίου, η αλληλεπίδραση των χρηστών με ιστότοπους πραγματοποιείται με προηγμένους τρόπους φυλλομέτρησης και τούτο διότι οι απαιτήσεις των χρηστών από τα δεδομένα που επισκοπούν είναι ευρύτερες και ποικιλόμορφες. Κατά συνέπεια η διασφάλιση της ικανοποίησης του χρήστη από τα αποτελέσματα της πλοήγησης εκτείνεται σε ευρεία κλίμακα και απαιτεί την αξιοποίηση τεχνικών παραμετροποίησης και εξατομίκευσης στα δεδομένα και στις υπηρεσίες των ιστότοπων. Παρόλο που οι όροι εξατομίκευση και παραμετροποίησης 22

συγχέονται ως προς την κοινή τους χρήση, ωστόσο στην περιοχή των εφαρμογών Διαδικτύου, η εννοιολογική τους διάκριση είναι αναγκαία. Πιο συγκεκριμένα, παραμετροποίηση είναι η διαδικασία κατά την οποία ορίζονται τα χαρακτηριστικά και οι τιμές αυτών των χαρακτηριστικών στη διεπαφή χρήστη και τα οποία ελέγχονται από τις επιλογές του χρήστη ως προς την υιοθέτησή τους. Από την άλλη πλευρά, εξατομίκευση είναι η διαδικασία κατά την οποία επιχειρείται η συλλογή πληροφοριών αναφορικά με την αλληλεπίδραση των χρηστών με συγκεκριμένους ιστότοπους με απώτερο στόχο την ανάλυση και την αξιοποίηση αυτών των πληροφοριών για μεταγενέστερη παροχή υπηρεσιών και δεδομένων στου χρήστες του ιστότοπου. Η ανάπτυξη εφαρμογών εξατομίκευσης, οι οποίες καλούνται να ανταποκριθούν σε συγκεκριμένες ανάγκες χρηστών, είναι μια προκλητική εργασία κυρίως διότι περιλαμβάνει την αντιμετώπιση πλήθους ζητημάτων όπως η εγγύηση της ασφάλειας και η διαφύλαξη της ανωνυμίας στα δεδομένα που συλλέγονται για το χρήστη, η ευχρηστία των εφαρμογών, η εξασφάλιση της δυναμικότητας των αποφάσεων που λαμβάνονται, η παροχή συστάσεων επισκόπησης ανάλογα με τα προφίλ των χρηστών ή ακόμα και ομάδων χρηστών, κτλ. Οι δύο πιο κοινές προσεγγίσεις για την επίτευξη της εξατομίκευσης είναι η εξατομίκευση της δομής και η εξατομίκευση του περιεχομένου. Η εξατομίκευση της δομής περιλαμβάνει τη μεταβολή της τοποθεσίες των διαθέσιμων υπερσυνδέσμων καθώς και της τοποθεσίας του περιεχομένου και στοχεύει στην παροχή περισσότερων και πιο σχετικών με τα ενδιαφέροντα του χρήστη συνδέσμων με την ταυτόχρονη προβολή τους σε σημείο της διεπαφής που είναι εύκολα αντιληπτό από το χρήστη. Η εξατομίκευση του περιεχομένου αφορά στην αλλαγή στα δεδομένα του ιστότοπου ανάλογα με τα ενδιαφέροντα του χρήστη ως προς τη θεματολογία τους. Για παράδειγμα ο ιστότοπος myyahoo.com παρέχει τη δυνατότητα εύκολης αλλαγής του περιεχομένου σύμφωνα με τις προτιμήσεις των χρηστών με τρόπο τέτοιο ώστε κάποιος να μπορεί να επιλέγει και να διαγράφει σχετικά θέματα ή να εξειδικεύει σε υποκατηγορίες των γενικών θεμάτων, ακόμα και να προτείνει νέα θέματα ενδιαφέροντος για μελλοντική συμπερίληψή τους στις θεματικές κατηγορίες των ιστότοπων. Για την εξατομίκευση των δεδομένων Διαδικτύου έχουν προταθεί διάφορες τεχνικές, οι πιο σημαντικές από τις οποίες εντάσσονται σε τρεις γενικές κει ευρέως αποδεκτές κατηγορίες: τη συλλογή πληροφοριών για τον χρήστη, την ανάλυση των πληροφοριών αυτών και την παροχή περιεχομένου. Πιο αναλυτικά, βασικό ζητούμενο για τη συλλογή πληροφοριών αναφορικά με την αλληλεπίδραση του χρήστη με τα δεδομένα ιστότοπων είναι η δημιουργία του προφίλ ενδιαφερόντων του χρήστη και η αυτόματη ενημέρωση του προφίλ αυτού κάθε φορά που υπάρχει διαφοροποίηση στα δεδομένα των καταγεγραμμένων πληροφοριών για τον χρήστη. Οι πιο κοινές μέθοδοι συλλογής πληροφοριών για το χρήστη είναι μέσω της τεχνικής άμεσης ή έμμεσης δημιουργίας προφίλ. Κατά την άμεση κατασκευή του προφίλ του χρήστη, απαιτείται η προγενέστερη εγγραφή του χρήστη σε ειδική φόρμα του ιστότοπου και η συλλογή πληροφοριών πραγματοποιείται κατά τη διαδικασία εγγραφής με τη συμπλήρωση ερωτηματολογίων. Αντίθεα, κατά την έμμεση κατασκευή του προφίλ του χρήστη, η πληροφορία που συλλέγεται για τις αλληλεπιδράσεις του τελευταίου γίνεται μέσω της καταγραφής επαναλαμβανόμενων προτύπων στο μοντέλο πλοήγησης που υιοθετεί 23

κάθε φορά που επισκέπτεται τα δεδομένα συγκεκριμένων ιστότοπων, τα οποία αφού αναλυθούν αποκρυπτογραφούν τις προτιμήσεις και τα ενδιαφέροντά του. Η ανάλυση της πληροφορίας που συλλέγεται για τον χρήστη πραγματοποιείται αφού ολοκληρωθεί η συλλογή των απαραίτητων δεδομένων για την κατασκευή του προφίλ ενδιαφερόντων του χρήστη και αποβλέπει στην προβολή εξατομικευμένων συστάσεων πλοήγησης κατά τις μελλοντικές αλληλεπιδράσεις του χρήστη με τον ιστότοπο. Η διαδικασία της ανάλυσης της πληροφορίας που έχει συγκεντρωθεί για τον χρήστη ενέχει με τη σειρά της διάφορες προκλήσεις όπως για παράδειγμα το φιλτράρισμα των δεδομένων που έχουν συλλεχθεί άμεσα ή έμμεσα, η θεματικά προσανατολισμένη ανάλυση του περιεχομένου των δεδομένων που έχουν επισκεφθεί από τον χρήστη, η εξόρυξη συμπερασμάτων αναφορικά με το βαθμό προτιμήσεων του χρήστη για συγκεκριμένους τύπους δεδομένων, κτλ. Τέλος, η παροχή εξατομικευμένου περιεχομένου υπό τη μορφή συστάσεων πλοήγησης αφορά στη δυναμική προβολή των δεδομένων που ανταποκρίνονται στο προφίλ και τα ενδιαφέροντα του χρήστη καθώς και στην επεξεργασία αποτελεσμάτων έμμεσης ταξινόμησης των προτεινόμενων συστάσεων για μελλοντική τροποποίηση της εξατομικευμένης πλοήγησης. 1.2 ΠΡΟΚΛΗΣΕΙΣ ΕΞΑΤΟΜΙΚΕΥΣΗΣ Η δυναμική φύση των δεδομένων του Παγκόσμιου Ιστού, το πλήθος των χρηστών που διεκπεραιώνουν τις καθημερινές τους εργασίες μέσω αυτού, αλλά και η πρόοδος της τεχνολογίας στα κατανεμημένα συστήματα διαχείρισης και οργάνωσης δεδομένων υπαγορεύει στην αντίστοιχη εξέλιξη και πρόοδο στις εφαρμογές εξατομίκευσης των δεδομένων Διαδικτύου. Πριν μελετήσουμε αναλυτικά τις διαθέσιμες προσεγγίσεις εξατομίκευσης και προτού παρουσιάσουμε διεξοδικά μια νέα προσέγγιση που υλοποιήσαμε στα πλαίσια της παρούσας εργασίας, στην παρούσα ενότητα θα παρουσιάσουμε τις βασικές προκλήσεις που καλούνται να αντιμετωπίσουν τα συστήματα, οι εφαρμογές και οι υπηρεσίες εξατομίκευσης που απευθύνονται στους τελικούς χρήστες. Πιο συγκεκριμένα, οι υφιστάμενες προκλήσεις αφορούν στα εξής: Ενσωμάτωση δεδομένων: αποτελεί μια από τις βασικές προτεραιότητες για πολλούς διαχειριστές και ιδιοκτήτες ιστότοπων καθώς καλείται να προσομοιώσει και να συγχωνεύει τις πληροφορίες που προέρχονται τόσο από τα εσωτερικά δεδομένα του ιστότοπου όσο από εξωτερικά δεδομένα άλλων ιστότοπων που συνδέονται με αυτόν στην τοπολογία του Παγκόσμιου Ιστού. Διαδραστική ενσωμάτωση: αφορά στη δυναμική ενσωμάτωση πληροφορίας για τα μοντέλα πλοήγησης που υιοθετούν οι επισκέπτες ενός ιστότοπου καθώς και στην αυτόματη ενημέρωση των προτύπων πλοήγησης. Βελτιστοποίηση: λαμβάνοντας υπόψη τόσο το πλήθος των δεδομένων που διακινούνται στον Παγκόσμιο Ιστό αλλά και σε κάθε μεμονωμένο ιστότοπο όσο και το πλήθος των χρηστών που προσπελαύνουν τα δεδομένα αυτά καθίσταται σαφής η ανάγκη για την αποτελεσματική εξατομίκευση των ιστότοπων με τρόπο που να διασφαλίζει την εγκυρότητα των δεδομένων, την άμεση ενημέρωσή τους όσο και την ταχύτητα των υπολογιστικών μοντέλων που ενσωματώνονται σε υπηρεσίες εξατομίκευσης. 24

Διαχείριση περιεχομένου: αφορά στην αποδοτική ανάλυση και επεξεργασία του περιεχομένου των ιστότοπων καθώς και την αποτελεσματική εξόρυξη πληροφορίας από αυτά με στόχο την προβολή συστάσεων εξατομικευμένης πλοήγησης. Ένα βασικό ζητούμενο της διαχείρισης περιεχομένου αφορά στην άρση της σημασιολογικής ασάφειας που χαρακτηρίζει τις φυσικές γλώσσες, στην ανάλυση μετα-δεδομένων καθώς και στον αποτελεσματικό συνδυασμό και την ταυτοποίηση των δεδομένων περιεχομένου με τα δεδομένα πλοήγησης και προφίλ προτιμήσεων των χρηστών. Διασφάλιση ανωνυμίας χρηστών: αφορά στη διασφάλιση της προστασίας των δεδομένων του χρήστη καθώς και στη διαφύλαξη της ανωνυμίας αυτού κατά το στάδιο συλλογής και επεξεργασίας των δεδομένων αλληλεπίδρασης των χρηστών με δικτυακούς τόπους. Οι παραπάνω προκλήσεις παρουσιάζονται αναλυτικά στα κεφάλαια που ακολουθούν και για καθεμία από αυτές περιγράφονται τόσο οι υπάρχουσες τεχνικές όσο και η συμβολή του προτεινόμενου μοντέλου εξατομίκευσης ιστότοπων και παραγωγής συστάσεων πλοήγησης που υλοποιήσαμε. 1.3 ΑΝΤΙΚΕΙΜΕΝΟ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ Η εξατομίκευση πληροφορίας στον Παγκόσμιο Ιστό έχει ως κύριο στόχο την βελτίωση της εμπειρίας πλοήγησης ή αναζήτησης του χρήστη (βλ. Κεφάλαιο 2). Η εξατομίκευση πραγματοποιείται είτε για την υπηρεσία της αναζήτησης, είτε για την αρωγή του χρήστη κατά την πλοήγηση σε έναν ιστότοπο. Η διαδικασία εξατομίκευσης στο ανώτερο επίπεδο περιλαμβάνει δύο βασικούς στόχους: την αναγνώριση των ενδιαφερόντων του χρήστη και την εξατομίκευση των αποτελεσμάτων της αναζήτησης ή των περιεχομένων μιας ιστοσελίδας σύμφωνα με το παραγόμενο προφίλ. Για την εφαρμογή της εξατομίκευσης στην διαδικασία της αναζήτησης είναι απαραίτητο να αντιμετωπιστούν σημαντικές προκλήσεις οι οποίες αφορούν γενικότερα στο πρόβλημα της αναζήτησης. Πιο συγκεκριμένα, αναλογιζόμενοι πως τα περισσότερα από τα ερωτήματα των χρηστών στις αναζητήσεις τους παρουσιάζουν το φαινόμενο της πολυσημίας, κρίνεται αναγκαία η εφαρμογή μεθόδων σημασιολογικής αποσαφήνισης των ερωτημάτων. Επίσης είναι απαραίτητο να ληφθούν υπόψη και εγγενείς λειτουργίες της διαδικασίας αναζήτησης, όπως είναι για παράδειγμα οι αλγόριθμοι επιλογής των σχετικών κειμένων και οι μέθοδοι ταξινόμησης των αποτελεσμάτων, καθώς και η σημασιολογική αναπαράσταση των δεδομένων στο ευρετήριο της μηχανής αναζήτησης. Η εξατομίκευση πλοήγησης παρόλο που χρησιμοποιεί τεχνικές σημασιολογικής επεξεργασίας και αναπαράστασης δεδομένων, χρειάζεται πληροφορίες πιο εξειδικευμένες για το συγκεκριμένο πεδίο, όπως για παράδειγμα την περιγραφή των τεχνικών αναπαράστασης της δομής και του περιεχομένου των ιστότοπων, καθώς και τον τρόπο μοντελοποίησης του περιεχομένου του ιστότοπου. Το προφίλ των χρηστών συμπεραίνεται και στις δύο περιπτώσεις από δεδομένα που έχουν προκύψει από αλληλεπίδραση του χρήστη με το σύστημα, είτε τα δεδομένα αφορούν στη συμπεριφορά του χρήστη κατά την αναζήτηση είτε κατά την πλοήγησή του σε έναν ιστότοπο. 25

Πιο ειδικά, η παρούσα εργασία αφορά στην εξατομίκευση πλοήγησης. Παρουσιάζονται οι διάφορες προσεγγίσεις που έχουν προταθεί στη βιβλιογραφία για την πραγματοποίηση εξατομίκευσης της δομής και του περιεχομένου ιστότοπων ανάλογα με τις προτιμήσεις του χρήστη (Κεφάλαιο 3). Οι μέθοδοι που έχουν προταθεί από την διεθνή ερευνητική κοινότητα κατηγοριοποιούνται σε τρεις βασικές κατηγορίες: την στατιστική προσέγγιση, την προσέγγιση μηχανικής μάθησης και τη σημασιολογική προσέγγιση. Η στατιστική προσέγγιση αφορά στην εφαρμογή πιθανοτικών μοντέλων για τη δημιουργία προφίλ ή στη συλλογή πληροφορίας από τους ίδιους τους χρήστες. Οι προσεγγίσεις μηχανικής μάθησης έχουν προσελκύσει μεγάλο ενδιαφέρον. Συγκεκριμένα οι διάφορες παραλλαγές του συνεργατικού φιλτραρίσματος εφαρμόζονται ευρέως, ενώ αρκετά μεγάλος όγκος έρευνας αφορά στις μεθόδους εξαγωγής κανόνων συσχέτισης. Η σημασιολογική προσέγγιση παρουσιάζει το πλεονέκτημα ότι χρειάζεται μικρότερο όγκο δεδομένων για να εφαρμοστεί και συγκεκριμένα κάποιες μέθοδοι μπορούν να υιοθετηθούν στα δεδομένα αλληλεπίδρασης κάθε χρήστη με το σύστημα ξεχωριστά. Αναφορικά με τη σημασιολογική προσέγγιση, το κύριο ενδιαφέρον στρέφεται στη χρήση οντολογιών κατά τη διαδικασία εξατομίκευσης. Μια επιπλέον προσέγγιση που παρουσιάζεται στην εργασία μας και που έχει προταθεί τα τελευταία χρόνια αφορά στη δημιουργία του προφίλ του χρήστη μέσω συστημάτων διαλόγου και διάδρασης με το σύστημα. Με δεδομένο το μεγάλο ερευνητικό ενδιαφέρον που παρουσιάζει το ζήτημα της εξατομίκευσης πλοήγησης και με εφαλτήριο τον μεγάλο αριθμό ερευνητικών προσπαθειών που έχουν συντελεστεί έως τώρα, παρουσιάζουμε στην παρούσα εργασία μια πρότυπη εφαρμογή εξατομίκευσης ιστοσελίδων (Κεφάλαιο 4) με βάση τα δεδομένα χρήσης του Παγκόσμιου Ιστού. Το βασικό κίνητρο για την εκπόνηση της συγκεκριμένης έρευνας είναι η διαπίστωση πως η εξατομίκευση της δομής και του περιεχομένου ενός ιστότοπου μπορεί να βελτιώσει σημαντικά τη λειτουργικότητα του ιστότοπου και να βοηθήσει τον χρήστη να καλύψει τις πληροφοριακές του ανάγκες. Η μέθοδος στο ανώτερο επίπεδο επιχειρεί να αναγνωρίσει τα ενδιαφέροντα ενός χρήστη με βάση δεδομένα που συλλέγει από τα αρχεία ιστορικού προσβάσεων του ιστότοπου και στη συνέχεια να επιλέξει κάποιες ιστοσελίδες οι οποίες είναι πιο σχετικές με τα ενδιαφέροντα που αναγνώρισε για να τις προτείνει στο χρήστη. Για την πραγματοποίηση της αναγνώρισης των ενδιαφερόντων του χρήστη, την αναγνώριση του θέματος των ιστοσελίδων και την ταυτοποίηση των ενδιαφερόντων με τις αντίστοιχες ιστοσελίδες η συγκεκριμένη μέθοδος βασίζεται στη χρήση οντολογίας. Η επεξεργασία του περιεχομένου του ιστότοπου αλλά και του αρχείου ιστορικού προσβάσεων πραγματοποιήθηκε με χρήση σημασιολογικών μεθόδων επεξεργασίας. Για την αναπαράσταση των ιστοσελίδων καταφύγαμε στο κλασσικό μοντέλο διανυσματικού χώρου, ενώ για την αντιστοίχηση των λέξεων ιστοσελίδων με τις αντίστοιχες έννοιες στην οντολογία χρειάστηκε να εφαρμοστούν μέθοδοι αποσαφήνισης, βασισμένες σε μετρήσεις ομοιότητας μεταξύ εννοιών σε μια οντολογία. Μια σημαντική πρόκληση που πρέπει να απαντήσει ένα σύστημα παροχής συστάσεων για εξατομικευμένες πλοηγήσεις στα δεδομένα ιστότοπων είναι το λεγόμενο portfolio effect πρόβλημα, δηλαδή το αν ο χρήστης επιθυμεί να συμπεριληφθούν στις προτάσεις ιστοσελίδες που έχει επισκεφτεί πρόσφατα ή όχι. Η προτεινόμενη εφαρμογή αντιμετωπίζει το πρόβλημα προτείνοντας μια μέθοδο διαχωρισμού μεταξύ των εφήμερων και των μόνιμων ενδιαφερόντων του χρήστη. Ο ρόλος των προτάσεων που παρουσιάζεται στον χρήστη εστιάζεται τόσο στην βελτίωση της λειτουργικότητας του ιστότοπου, όσο και στη διευκόλυνση του χρήστη 26

να βρει κάποια πληροφορία που αναζητά αλλά και να ενημερωθεί για πληροφορίες οι οποίες ενδεχομένως να του διέφευγαν, ενώ είναι πιθανό να τον ενδιαφέρουν. Το μοντέλο που υλοποιήσαμε ενσωματώνει μια οντολογία θεματικών κατηγοριών στην οποία αντιστοιχίζεται το περιεχόμενο ενός ιστότοπου. Το μοντέλο διαθέτει μεθόδους για την αντιστοίχιση των ιστοσελίδων στο κατάλληλο διάνυσμα όρων, την αποσαφήνιση των λέξεων και τη μέτρηση ομοιότητας μεταξύ δύο εννοιών. Η προεπεξεργασία του περιεχομένου του ιστότοπου αφορά στην αντιστοίχιση των ιστοσελίδων σε ένα από τα θέματα της ιεραρχίας. Το λειτουργικό μέρος το οποίο πραγματοποιεί τη δημιουργία του προφίλ δέχεται σαν είσοδο τα επεξεργασμένα αρχεία ιστορικού προσβάσεων και παράγει έναν αριθμό θεμάτων από την ιεραρχία τα οποία αποτελούν το προφίλ του χρήστη. Ο μηχανισμός προτάσεων του συστήματος δέχεται σαν είσοδο το προφίλ που έχει παραχθεί και τις κατηγοριοποιημένες ιστοσελίδες του συστήματος και σύμφωνα με την προτεινόμενη μέθοδο παράγει ένα σύνολο ταξινομημένων προτάσεων που παρουσιάζει στον χρήστη. Η πειραματική εφαρμογή και αξιολόγηση του προτεινόμενου μοντέλου εξατομίκευσης σε ένα σύνολο πραγματικών δεδομένων χρήσης του Παγκόσμιου Ιστού καταδεικνύει τη συνεισφορά της προτεινόμενης μεθόδου στη βελτίωση της εμπειρίας πλοήγησης του χρήστη (Κεφάλαιο 5). Σύμφωνα με τα αποτελέσματα των πειραματικών μετρήσεων η ακρίβεια της μεθόδου δημιουργίας προφίλ είναι πολλά υποσχόμενη, ενώ εξίσου ικανοποιητική είναι η ποιότητα των εξαγόμενων συστάσεων εξατομικευμένης πλοήγησης και της γενικότερης διαδικασίας παραμετροποίησης του ιστότοπου. Η παρούσα εργασία ολοκληρώνεται με την σύγκριση της προτεινόμενης μεθόδου με τις ήδη υπάρχουσες και την επισήμανση των διαφοροποιήσεων που παρουσιάζει, με στόχο την παρουσίαση των σημείων καινοτομίας της παρούσας διπλωματικής εργασίας (Κεφάλαιο 5). Εξετάζεται επιπλέον η δυνατότητα περεταίρω επεκτάσεων της προτεινόμενης μεθόδου και πραγματοποιείται η αποτίμηση του συνολικού έργου καθώς και μια εκτίμηση για το πως θα ήταν δυνατόν να αξιοποιηθεί αποτελεσματικά το σύστημα που υλοποιήθηκε στα πλαίσια της διπλωματικής εργασίας (Κεφάλαιο 6). 1.4 ΣΥΝΕΙΣΦΟΡΑ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ Η παρούσα διπλωματική εργασία προτείνει μια καινοτόμο τεχνική για την εξατομίκευση της πλοήγησης στον Παγκόσμιο Ιστό. Η τεχνική που προτείνεται σχεδιάστηκε έπειτα από μελέτη της σχετική διεθνούς βιβλιογραφίας που αφορούσε στις μεθόδους εξατομίκευσης της πλοήγησης με χρήση δεδομένων που προέκυψαν από αρχεία ιστορικού πλοήγησης χρηστών στον Παγκόσμιο Ιστό. Τελικός στόχος της προτεινόμενης τεχνικής είναι η εξατομίκευση της όψης μιας ιστοσελίδας μέσω της αναγνώρισης των ενδιαφερόντων του χρήστη έμμεσα, με δεδομένη την αλληλεπίδρασή του με έναν ιστότοπο. Η εξατομίκευση της όψης του ιστότοπου πραγματοποιείται μέσω ενός συστήματος προτάσεων το οποίο με βάση το προφίλ του χρήστη επιλέγει προτάσεις τις οποίες του παρουσιάζει. Η προτεινόμενη τεχνική είναι καινοτόμος εφόσον στηρίζεται στη σημασιολογική ανάλυση, επεξεργασία και δομή του Παγκόσμιου Ιστού, καθώς και στην χρήση σημασιολογικών εργαλείων όπως θεματικές ιεραρχίες και μέτρα σημασιολογικής ομοιότητας για να επιτύχει την εξατομίκευση των ιστότοπων. Η ερευνητική συνεισφορά της διπλωματικής συνοψίζεται στα παρακάτω συμπεράσματα: 27