Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση. Κορφιάτης Γιώργος ιπλωµατική Εργασία

Σχετικά έγγραφα
Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση µεθόδων Συµπερασµού Γραµµατικών ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Τεχνικές Εξόρυξης Δεδομένων

Σειρά Προβλημάτων 1 Λύσεις

Εξόρυξη Γνώσης από εδοµένα (data mining)

Εισαγωγή στη Θεωρία Αποφάσεων. Λήψη απλών αποφάσεων για έναν πράκτορα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Συλλογή,, αποθήκευση, ανανέωση και παρουσίαση στατιστικών δεδοµένων

Web Mining. Χριστίνα Αραβαντινού Ιούνιος 2014

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

o AND o IF o SUMPRODUCT

Ανάλυση της συµπεριφοράς των πεζών ως προς τη διάσχιση οδών σε αστικές περιοχές

Ε Ξ Α Γ Ω Γ H Γ Ε Ω Γ ΡΑ Φ Ι Κ H Σ Π Λ Η Ρ Ο Φ Ο Ρ Ί Α Σ Α Π O Η Μ Ι Δ Ο Μ Η Μ E Ν Ο Κ Ε I Μ Ε Ν Ο ( G E O P A R S I N G W E B P A G E S )

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

Σύµφωνα µε την Υ.Α /Γ2/ Εξισώσεις 2 ου Βαθµού. 3.2 Η Εξίσωση x = α. Κεφ.4 ο : Ανισώσεις 4.2 Ανισώσεις 2 ου Βαθµού

3 η Θεµατική Ενότητα : Απλοποίηση Συναρτήσεων Boole. Επιµέλεια διαφανειών: Χρ. Καβουσιανός

Αλγόριθμος Ομαδοποίησης

Παρατηρήσεις στα ϑέµατα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΕΠΛ 035: οµές εδοµένων και Αλγόριθµοι για Ηλεκτρολόγους Μηχανικούς και Μηχανικούς Υπολογιστών

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Εξετάζεται ο βαθµός στον οποίο οι παρακάτω. που αποδέχεται ο πεζός και στην επιλογή του να διασχίσει ή όχι την οδό

Στατιστική Εισαγωγικές Έννοιες

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Γλώσσες που περιγράφονται από Κανονικές Εκφράσεις

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών

Είδη Μεταβλητών. κλίµακα µέτρησης

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Διοίκηση Ολικής Ποιότητας ΔΙΑΛΕΞΗ 2 η : Εργαλεία και Τεχνικές

PServer. Θεωρία & Εφαρμογές. Δημήτριος Βογιατζής, dimitrv@iit.demokritos.gr Γεώργιος Παλιούρας, paliourg@iit.demokritos.gr

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

Integrated Project. Ambient Intelligence System of Agents for Knowledgebased and Integrated Services for Mobility Impaired users

ειγµατοληψία ΜΕΘΟ ΟΛΟΓΙΑ ΤΗΣ ΕΡΕΥΝΑΣ Μέρη της Έρευνας Μέθοδος Πώς ερευνήθηκε το πρόβληµα? Μέθοδος

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Επεξεργασία Ερωτήσεων

Υ ΑΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΚΑΙ ΑΝΑΠΤΥΞΗ. Πιθανοτική προσέγγιση υδρολογικών µεταβλητών

Επεξεργασία Ερωτήσεων

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Ειρήνη Φλώρου ΕΚΠΑ, 01/03/2019

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

ΕΥΡΕΣΗ ΕΛΑΧΙΣΤΩΝ ΜΟΝΟΠΑΤΙΩΝ & ΚΑΤΗΓΟΡΙΕΣ ΑΛΓΟΡΙΘΜΩΝ

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

Το εσωτερικό ενός Σ Β

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Ασκήσεις μελέτης της ενότητας «Συντακτική Ανάλυση»

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 7: Ασυμφραστικές Γλώσσες (Γλώσσες Ελεύθερες Συμφραζομένων)

ΕΥΡΕΣΗ ΕΛΑΧΙΣΤΩΝ ΜΟΝΟΠΑΤΙΩΝ & ΚΑΤΗΓΟΡΙΕΣ ΑΛΓΟΡΙΘΜΩΝ

µεθόδων αυτών, είναι απαραίτητη η δηµιουργία αντιπροσωπευτικού δείγµατος του Ιστού. Στόχος της εργασίας είναι η υλοποίηση και αξιολόγηση µεθόδων δειγµ

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Σειρά Προβλημάτων 5 Λύσεις

Ο ΗΓΟΣ ΕΠΙΜΟΡΦΩΤΗ. ηµοτικό ιαδικτυακό Ραδιόφωνο και Τηλεόραση. Y4 ηµιουργία διαδικτυακής ραδιοφωνικής εκποµπής µε τα εργαλεία

ιαχείριση Αποβλήτων Ηλεκτρικού και Ηλεκτρονικού Εξοπλισµού (AHHE) - Σχεδιασµός για Αποσυναρµολόγηση

Σειρά Προβλημάτων 4 Λύσεις

1 Συνοπτική ϑεωρία. 1.1 Νόµοι του Προτασιακού Λογισµού. p p p. p p. ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών

ΑΞΙΟΠΟΙΗΣΗ ΑΝΟΙΧΤΩΝ ΔΕΔΟΜΕΝΩΝ ΣΤΗΝ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΓΙΑ ΕΥΦΥΕΙΣ ΔΗΜΟΥΣ

ΑΝΑΛΥΤΙΚΟ ΠΡΟΓΡΑΜΜΑ B ΤΑΞΗΣ. χρησιμοποιήσουμε καθημερινά φαινόμενα όπως το θερμόμετρο, Θετικοί-Αρνητικοί αριθμοί.

Εισαγωγή στην επιστήμη των υπολογιστών. Οργάνωση εδομένων Κεφάλαιο 11ο ομές εδομένων

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Προσομοίωση Μοντέλων Επιχειρησιακών Διαδικασιών

...στις µέρες µας, όσο ποτέ άλλοτε, οι χώρες καταναλώνουν χρόνο και χρήµα στη µέτρηση της απόδοσης του δηµόσιου τοµέα...(oecd)

Απλοποιεί τα γεγονότα έτσι ώστε να περιγράφει τι έχει γίνει και όχι πως έχει γίνει.

Ηλεκτρονικά Καταστήµατα. Νικόλαος Πρωτόγερος Πανεπιστήµιο Μακεδονίας

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Σειρά Προβλημάτων 3 Λύσεις

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

Τυχαία μεταβλητή (τ.μ.)

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 2 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

GPS NAVIGATION SYSTEM QUICK START USER MANUAL

Ο ΗΓΟΣ ΕΠΙΜΟΡΦΩΤΗ. ηµοτικό ιαδικτυακό Ραδιόφωνο και Τηλεόραση. Y4 ηµιουργία διαδικτυακής ραδιοφωνικής εκποµπής µε το εργαλείο

Εξόρυξη γνώσης από δεδομένα δικτύου υπολογιστών: Συστήματα ανίχνευσης εισβολής.

ΕΠΕΞΕΡΓΑΣΙΑ ΚΕΙΜΕΝΟΥ

Επιμόρφωση Εκπαιδευτικών Α Τάξης Δημοτικού. Νοέμβρης /11/2012. Φιλοσοφία διδασκαλίας. What you learn reflects how you learned it.

Άνοιγµα και διαφάνεια των εργασιών του Συµβουλίου

Σύνοψη Προηγούµενου. Κανονικές Γλώσσες (1) Προβλήµατα και Γλώσσες. Σε αυτό το µάθηµα. ιαδικαστικά του Μαθήµατος.

Ασκήσεις 3 ου Κεφαλαίου

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Περιεχόµενα. 1 Tο βιβλίο "µε µια µατιά" Εισαγωγή στη Microsoft Access Γνωριµία µε τις βάσεις δεδοµένων της Access...

Μοντελοποίηση υπολογισμού. Θέματα Υπολογισμού στον Πολιτισμό Πεπερασμένα αυτόματα

ΑΣΠΑΙΤΕ Εργαστήριο Ψηφιακών Συστημάτων & Μικροϋπολογιστών Εργαστηριακές Ασκήσεις για το μάθημα «Λογική Σχεδίαση» ΑΣΚΗΣΗ 3 ΠΙΝΑΚΕΣ KARNAUGH

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Αριστοµένης Μακρής Εργαστήρια Η/Υ

Μεταπτυχιακή Διατριβή

Μάθηµα 11. Κεφάλαιο: Στατιστική

ΣΕΤ ΑΣΚΗΣΕΩΝ 2. Προθεσµία: 25/11/12, 22:00

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Μηχανική Μάθηση: γιατί;

Transcript:

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση µεθόδων Συµπερασµού Γραµµατικών Κορφιάτης Γιώργος ιπλωµατική Εργασία

Αντικείµενο Κατασκευή µοντέλου ικανού να περιγράψει την πλοήγηση των χρηστών στον Παγκόσµιο Ιστό Χρήση του µοντέλου για πρόταση σελίδων Μάρτιος 2006 Γ. Κορφιάτης 2

Περιεχόµενα Εξατοµίκευση Μέθοδοι Συµπερασµού Γραµµατικών Μέθοδος µοντελοποίησης της πλοήγησης στον Ιστό Πειραµατική Αξιολόγηση Συµπεράσµατα Μάρτιος 2006 Γ. Κορφιάτης 3

Παγκόσµιος Ιστός Ανεξάντλητη πηγή πληροφοριών αλλά Έλλειψη δοµής Υπερσυσσώρευση πληροφοριών Χρήστες µη ειδικοί Μάρτιος 2006 Γ. Κορφιάτης 4

Παγκόσµιος Ιστός Ανάγκη υποβοήθησης του χρήστη στον εντοπισµό χρήσιµης πληροφορίας Λύση: Εξατοµίκευση των υπηρεσιών Μάρτιος 2006 Γ. Κορφιάτης 5

Εξατοµίκευση Σε επίπεδο ιστοχώρου: Αναγνώριση χρήστη Προσαρµογή ιστοσελίδας στα µέτρα του χρήστη Καθοδήγηση (πρόταση συνδέσµων) Μοντελοποίηση χρήστη µε τεχνικές Εξόρυξης Γνώσης από εδοµένα (Data Mining) Μάρτιος 2006 Γ. Κορφιάτης 6

Ανακάλυψη Προτύπων Πλοήγησης Στόχος η πρόταση συνδέσµων Μοντελοποίηση της πλοήγησης ιαδικασία εξόρυξης γνώσης από δεδοµένα χρήσης Μάρτιος 2006 Γ. Κορφιάτης 7

Προσεγγίσεις Ντετερµινιστικές Εύρεση συχνά επαναλαµβανόµενων ακολουθιών σελίδων Κανόνες διαδοχής, Κοινότητες χρηστών Στοχαστικές Κατασκευή µοντέλου πιθανοτήτων Χρήση µαρκοβιανών µοντέλων Χρήση Συµπερασµού Γραµµατικών Μάρτιος 2006 Γ. Κορφιάτης 8

Προσεγγίσεις Κατάλληλες για έναν ιστοχώρο αλλά Ακατάλληλες για τον Παγκόσµιο Ιστό Μεγάλος όγκος Ανοµοιογένεια περιεχοµένου Μάρτιος 2006 Γ. Κορφιάτης 9

Μοντελοποίηση της πλοήγησης σε όλο τον Παγκόσµιο Ιστό Τα δεδοµένα χρήσης δεν επαρκούν Χρειάζεται επιπλέον πληροφορία π.χ. σύγκριση περιεχοµένου των σελίδων Μάρτιος 2006 Γ. Κορφιάτης 10

Ηπροσέγγισήµας Περιγραφή πλοήγησης µε γραµµατική Χρήση µεθόδων Συµπερασµού Γραµµατικών Αξιοποίηση δεδοµένων χρήσης και πληροφορίας για οµοιότητα περιεχοµένου σελίδων Μάρτιος 2006 Γ. Κορφιάτης 11

Συµπερασµός Γραµµατικών Κλάδος της Μηχανικής Μάθησης Επαγωγική εκµάθηση γραµµατικής από δεδοµένα G 0 Παραγωγή εδοµένα Συµπερασµός G Μάρτιος 2006 Γ. Κορφιάτης 12

Κανονικές Γραµµατικές Απλούστερη κλάση γραµµατικών Κανόνες της µορφής: A ab a ε { n n } L = ab S ab 1 B ε B bb Μάρτιος 2006 Γ. Κορφιάτης 13

Πιθανοτικές Κανονικές Γραµµατικές Πιθανότητα εµφάνισης συµβολοσειράς Πιθανότητες πάνω στις µεταβάσεις και στους κόµβους Μάρτιος 2006 Γ. Κορφιάτης 14

Μέθοδος Alergia Συµπερασµός πιθανοτικής κανονικής γραµµατικής (αυτοµάτου) Ξεκινά από δενδρική δοµή (PPTA) Εφαρµογή: Σύµβολα Ιστοσελίδες Συµβολοσειρές Σύνοδοι χρήσης S = { ab, ab, ab, ad, de, def, gb, gb} Μάρτιος 2006 Γ. Κορφιάτης 15

Alergia: Αρχικό PPTA Μάρτιος 2006 Γ. Κορφιάτης 16

Alergia Συγχωνεύει κόµβους Κριτήριο Συµβατότητας: όµοιες µεταβάσεις Μάρτιος 2006 Γ. Κορφιάτης 17

Alergia: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 18

Alergia: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 19

Alergia: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 20

Alergia: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 21

Alergia: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 22

Μέθοδος Blue Fringe Παρόµοια µε τονalergia Πιο έξυπνη επιλογή συγχωνεύσεων Σύνολα κόκκινων και µπλε κόµβων Βαθµολογεί τα ζευγάρια κόκκινων-µπλε Επιλέγει το καλύτερο ζευγάρι Μεγαλύτερη χρονική πολυπλοκότητα Μάρτιος 2006 Γ. Κορφιάτης 23

Blue Fringe: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 24

Blue Fringe: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 25

Blue Fringe: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 26

Blue Fringe: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 27

Blue Fringe: Εκτέλεση Μάρτιος 2006 Γ. Κορφιάτης 28

Αξιοποίηση για µοντελοποίηση πλοήγησης στον Ιστό Σύµβολα Συµβολοσειρές Ιστοσελίδες Σύνοδοι χρήσης Συγχώνευση κόµβων Πιθανότητες στις µεταβάσεις ηµιουργία οµάδων σελίδων Συχνότητα µετάβασης µεταξύ σελίδων / οµάδων Μάρτιος 2006 Γ. Κορφιάτης 29

Νέα µέθοδος CANUMGI Content-Aware Navigational User Modeling with Grammatical Inference Τροποποίηση µεθόδων Alergia και Blue Fringe Κατασκευή του µοντέλου off-line Υπολογισµός συµβατότητας καταστάσεων Μετρικό χρήσης (όµοιες µεταβάσεις) Μετρικό περιεχοµένου (οµοιότητα περιεχοµένου σελίδων) Μάρτιος 2006 Γ. Κορφιάτης 30

Οµοιότητα περιεχοµένου Ιστοσελίδες ιάνυσµα λέξεων-κλειδιών (,,...,,...), { 0,1} x= x x x x 1 2 i i Χρήση µετρικού συνηµιτόνου COSINE x, y ( ) = i ( 2)( 2 x ) i yi i xy i i i Μάρτιος 2006 Γ. Κορφιάτης 31

Οµοιότητα περιεχοµένου Παράδειγµα: x = y = 1,0,0,1,0,1 ( ) 0,0,0,1,1,1 ( ) ( x 2)( y 2) i i i i xy i i i 10+00+00+ 1 1+01+ 1 1 3 3 Μάρτιος 2006 Γ. Κορφιάτης 32

CANUMGI-A Βασίζεται στον Alergia Τα δύο µετρικά λογικές τιµές Συνδυασµός µετρικών Σύζευξη ιάζευξη Μάρτιος 2006 Γ. Κορφιάτης 33

CANUMGI-B Βασίζεται στον Blue Fringe Τα δύο µετρικά πραγµατικές τιµές Συνδυασµός µετρικών Ελάχιστη τιµή Μέγιστη τιµή Σταθµισµένο άθροισµα Μάρτιος 2006 Γ. Κορφιάτης 34

CANUMGI-C Μείωση ιαστασιµότητας Αρχική οµαδοποίηση των σελίδων ως προς το περιεχόµενο Στόχος: Εκ των προτέρων χωρισµός σελίδων σε θεµατικές κατηγορίες Χρήση οµάδων αντί για σελίδες Ακολουθεί η επαγωγική διαδικασία Μάρτιος 2006 Γ. Κορφιάτης 35

CANUMGI-C Παράδειγµα: S + = { abc, de, ad, def, gb} C1 = a,f, C2 = c,e, C3 = b,d,g { } { } { } S + = { C1C3C2, C3C2, C1C3, C3C2C1, C3C3} Μάρτιος 2006 Γ. Κορφιάτης 36

CANUMGI-C PPTA χωρίς µείωση διαστασιµότητας Μάρτιος 2006 Γ. Κορφιάτης 37

CANUMGI-C PPTA µε µείωση διαστασιµότητας Μάρτιος 2006 Γ. Κορφιάτης 38

Χρήση του µοντέλου On-line λειτουργία Εξατοµικευµένη πλοήγηση Πρόταση σελίδων στους χρήστες ιαδικασία σε δύο στάδια: ιάσχιση του γράφου Επιλογή σελίδων Μάρτιος 2006 Γ. Κορφιάτης 39

ιάσχιση του γράφου Αλληλουχία σελίδων µεταβάσεις στο γράφο Αν δεν υπάρχει ρητή µετάβαση, επιλογή του πιο όµοιου κόµβουπαιδιού Αν δεν υπάρχει αρκετά όµοιος κόµβος, επιστροφή στον κόµβο εκκίνησης Μάρτιος 2006 Γ. Κορφιάτης 40

Επιλογή σελίδων Προσέγγιση 1 Επιλογή κόµβου-παιδιού µε µεγαλύτερη πιθανότητα µετάβασης Επιλογή σελίδων πιο κοντά στο κέντρο βάρους Προσέγγιση 2 Επιλογή σελίδων µε µεγαλύτερο γινόµενο πιθανότητας µετάβασης επί εγγύτητα στο κέντρο βάρους Μάρτιος 2006 Γ. Κορφιάτης 41

Πειραµατική αξιολόγηση εδοµένα χρήσης από αρχεία καταγραφής εταιρείας ISP Προεπεξεργασία Χωρισµός σε συνόδους χρήσης Εύρεση λέξεων-κλειδιών Χωρισµός δεδοµένων σε δύο σύνολα είγµα εκπαίδευσης(κατασκευή µοντέλου) είγµα ελέγχου(αξιολόγηση) Μάρτιος 2006 Γ. Κορφιάτης 42

Πειραµατική αξιολόγηση ιαδικασία Αξιοποίηση συνόδων χρήσης δείγµατος ελέγχου Αποκρύβουµε τελευταία σελίδα συνόδου χρήσης Χρησιµοποιούµε τις υπόλοιπες για διάσχιση του γράφου και επιλογή σελίδων Μάρτιος 2006 Γ. Κορφιάτης 43

Πειραµατική αξιολόγηση Μέτρο αξιολόγησης Αναµενόµενη χρησιµότητα της λίστας προτεινόµενων σελίδων για όλες τις προτεινόµενες σελίδες EU w οµοιότητα a0, a1,..., an 1 n 1 = j= 0 2 jh (, ) similarity w a j περιεχοµένου κρυµµένη σελίδα Μάρτιος 2006 Γ. Κορφιάτης 44

Πειραµατική αξιολόγηση Βάση σύγκρισης Απλό µοντέλο µε δηµιουργία οµάδων σελίδων βάσει οµοιότητας περιεχοµένου Πρόταση σελίδων Εύρεση οµάδων πιο όµοιων µε τις σελίδες που ήδη επισκέφτηκε ο χρήστης Επιλογή των πιο χαρακτηριστικών σελίδων από τις οµάδες αυτές Μάρτιος 2006 Γ. Κορφιάτης 45

Πειραµατική αξιολόγηση Μέθοδος Αναµ. Χρησιµότητα CANUMGI-A 8.57 CANUMGI-B 21.72 CANUMGI-C 20.59 Βάση σύγκρισης 24.25 Μάρτιος 2006 Γ. Κορφιάτης 46

Συµπεράσµατα Η νέαµέθοδος δεν ξεπέρασε το µοντέλο σύγκρισης Η γνώση της σειράς επίσκεψης µάλλον δε συµβάλλει στην πρόταση σελίδων Μεγάλη ανοµοιογένεια δεδοµένων χρήσης Πλοήγηση µέσα σε µία θεµατική κατηγορία Μάρτιος 2006 Γ. Κορφιάτης 47

Συµπεράσµατα Αυτοµεταβάσεις µε υψηλή πιθανότητα Μάρτιος 2006 Γ. Κορφιάτης 48

Συµπεράσµατα CANUMGI-B αποδίδει καλύτερα από τις άλλες Πιο έξυπνη επιλογή κόµβων Η µείωση διαστασιµότητας δε βελτίωσε τα αποτελέσµατα ε βοηθά η οµαδοποίηση Η γνώση των λίγων προηγούµενων επισκέψεων πιο χρήσιµη Μάρτιος 2006 Γ. Κορφιάτης 49

Μελλοντικές Κατευθύνσεις υναµικός προσδιορισµός παραµέτρων Μελέτη του µετρικού αξιολόγησης Προσεγγίσεις µε µαρκοβιανά µοντέλα Επιλεκτική χρησιµοποίηση δεδοµένων χρήσης + µοντέλο µε βάση το περιεχόµενο Χρήση πιθανοτικών γραµµατικών υπερκειµένου (HPG) Μάρτιος 2006 Γ. Κορφιάτης 50