Recommendation συστήματα

Σχετικά έγγραφα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗ ΣΥΣΤΗΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ ΑΠΟΦΑΣΕΩΝ

Συστήματα Προτάσεων σε on-line Καταστήματα

Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015


Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής

Τεχνικές Εξόρυξης Δεδομένων

Social Web: lesson #3

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Ηλεκτρονικό Εμπόριο

Εισαγωγή στα Πληροφοριακά Συστήματα

Διεθνής έρευνα για την εξάπλωση των Smartphones και Tablets

ΠΡΟΔΙΑΓΡΑΦΕΣ ΕΝΟΣ ΗΛΕΚΤΡΟΝΙΚΟΥ ΚΑΤΑΣΤΗΜΑΤΟΣ

GoDigital.Store E-Commerce Platform

ΕΡΓΑΣΙΑ. (στο μάθημα: Τεχνολογίες Εφαρμογών Διαδικτύου του Η εξαμήνου σπουδών του Τμήματος Πληροφορικής & Τηλ/νιών)

Εξατομίκευση στο Ηλεκτρονικό Επιχειρείν. ΤΕΙ Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων - Πάτρα Κουτσονίκος Γιάννης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Τεχνικές ταξινόµησης αποτελεσµάτων µηχανών αναζήτησης µε βάση την ιστορία του χρήστη

Αναλυτική περιγραφή διδακτικών ενοτήτων. e-commerce Project Manager

Σασών Ισαάκ Σπηλιάκος Κωνσταντίνος Τσιάνα Καλλιόπη

Ηλεκτρονικό εμπόριο. HE5 Ηλεκτρονικό κατάστημα Σχεδιασμός και λειτουργίες

ΕΓΧΕΙΡΙΔΙΟ ΟΡΘΩΝ ΠΡΑΚΤΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΜΕΣΟΛΟΓΓΙΟΥ

Εισαγωγή στις Τεχνολογίες της

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εισαγωγή

Εξόρυξη Δεδομένων Χρήσης για Συστήματα Συστάσεων Mining Usage Data for Recommender Systems

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Διαδικαστικά

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ανάκτηση Πληροφορίας

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΑΡΑΓΩΓΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ

Πληροφορική 2. Τεχνητή νοημοσύνη

website guide B2B e-shop

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

Ενότητα 1: Πληροφοριακά Συστήματα και Άνθρωποι

Social Media. Chapter 2 Social Media Marketing

Η συνολική εικόνα. Ποιοτική Αναβάθμιση δεδομένων. Λογισμικό Επικοινωνιών DATA WAREHOUSE. Σχεδιασμός Ενοποίηση Επιλογή Συγχρονισμός Συντονισμός

Collaborative Filtering

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

Ηλεκτρονικά Καταστήματα E Shops

Οδηγός LinkedIn. «10 συμβουλές επέκτασης της επιχείρησης σας, χρησιμοποιώντας το LinkedIn» Provided to you by

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Κατηγορίες Πληροφοριακών Συστημάτων Διοικητικής Υποστήριξης

Data Mining: Στοχεύοντας στους σωστούς πελάτες. Αριστομένης Μακρής

Kenta OKU and Fumio HATTORI


10 λόγοι να φτιάξω ιστοσελίδα

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος

E-COMMERCE Προκλήσεις & παράγοντες επιτυχίας. Χριστιάνα Κογεβίνα, Greek Geeks

Λίγα λόγια από το συγγραφέα Βάσεις δεδομένων και Microsoft Access Microsoft Access... 22

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Βάσεις δεδομένων και Microsoft Access

Βασικές πηγές ιδεών για έναρξη επιχείρησης. προηγούμενη εμπειρία στον εργασιακό χώρο. ρωτώντας και συζητώντας με άλλους ανθρώπους

Marketing in E-commerce: A Competitive Landscape. Ομιλητής : Τσίγκρος Κυριάκος

Ποια cookies χρησιμοποιούμε στον ιστότοπό μας;

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Έρευνα Ηλεκτρονικού Εμπορίου 2015 Β-C στην Ελλάδα: Η Συμπεριφορά των Online Καταναλωτών Καθ. Γεώργιος Ι. Δουκίδης Δρ.

Πανεπιστήμιο Αιγαίου Σχολή Κοινωνικών Επιστημών Τμήμα Πολιτισμικής Τεχνολογίας Και Επικοινωνίας

ΤΙΜΗ ΠΑΚΕΤΟΥ ΚΑΤΟΠΙΝ ΠΑΡΑΓΓΕΛΙΑΣ ΕΝΔΕΙΚΤΙΚΕΣ ΔΥΝΑΤΟΤΗΤΕΣ BASIC E-SHOP. Απεριόριστος Αριθμός Προϊόντων με κείμενο, φωτογραφίες, βίντεο κλπ

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη

Agile Προσέγγιση στη Διαχείριση Έργων Λογισμικού

PServer. Θεωρία & Εφαρμογές. Δημήτριος Βογιατζής, dimitrv@iit.demokritos.gr Γεώργιος Παλιούρας, paliourg@iit.demokritos.gr

ΕΚΦΩΝΗΣΗ ΥΠΟΧΡΕΩΤΙΚΗΣ ΕΡΓΑΣΙΑΣ σε UML

Ο ΚΑΤΑΝΑΛΩΤΗΣ ΣΤΟ INTERNET

Τ.Ε.Ι. Δυτικής Ελλάδας Τμήμα Διοίκησης Επιχειρήσεων Μεσολόγγι. 8 η Διάλεξη. Μάθημα: Τεχνολογίες Διαδικτύου

MICRO: Ενίσχυση της ανταγωνιστικότητας των πολύ μικρών επιχειρήσεων σε αγροτικές περιοχές Ενότητα No 1 : Marketing/Προώθηση & Ηλεκτρονικό εμπόριο

QEMS TUTORIAL CRM. Οδηγίες για το νέο πρωτοποριακό πρόγραμμα της QEMS.

Προτεινόμενες Διπλωματικές Εργασίες 2009

Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες

Δίνουμε λύσεις, δεν προτείνουμε

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Συνοπτικό εγχειρίδιο χρήσης ηλεκτρονικού καταστήματος

Τι είναι το TPT (Teachers Pay Teachers) Πώς γίνομαι μέλος; Πώς αγοράζω υλικό από εκεί; Τι είναι το PayPal; Πώς φτιάχνω λογαριασμό στο PayPal; Τι

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Η επιχείρηση μετά τα e

Εκπαιδευτική Τεχνολογία - Πολυμέσα. Ελένη Περιστέρη, Msc, PhD

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

Πανεπιστήμιο Πατρών Μεταπτυχιακό Τμήμα Διοίκησης Επιχειρήσεων

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

Σχεδίαση Βάσεων Δεδομένων

Περιεχόμενα σχετικά με τις λειτουργίες του

ΜΕΤΑΠΤΥΧΙΑΚΟ ΤΜΗΜΑ ΣΠΟΥ ΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

INBOUND MARKETING CRASH COURSE!

Διαφέρουμε από τον ανταγωνισμό Τη στιγμή που οι περισσότεροι οραματίζονται το μέλλον εμείς το δημιουργούμε.

ΜΕΘΟΔΟΛΟΓΙΑ ΑΝΑΠΤΥΞΗΣ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΤΑΣΕΩΝ ΣΤΙΣ ΤΟΥΡΙΣΤΙΚΕΣ ΥΠΗΡΕΣΙΕΣ

ecommerce at a Glance Δρ. Κατερίνα Φραϊδάκη Καθ. Γεώργιος Ι. Δουκίδης

Πολιτική για τα cookies

Web Sites Το τρίπτυχο της επιτυχίας

ΣυνοπτικόςΟδηγόςΧρήσηςτουMoodle για το Φοιτητή

Μια καλή επιλογή θα ήταν (χωρίζοντας τις λέξεις με παύλα -) ή

ΜΟΝΤΕΛΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Συνοπτικός Οδηγός Χρήσης του Moodle για το Φοιτητή

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Internet Marketing

Πληροφοριακά Συστήματα Διοίκησης

Σχεδιασμός & Λειτουργικότητα e-shop

Ηλεκτρονικό Επιχειρείν & Νέες Τεχνολογίες για Επιχειρηματικότητα ΔΕΟ45

± ² ² ² Đ ā ĉ Ĕ Ė ĉ ę Đ Ē ď Ē ć ă ĉ Ĕ ö ìñéòöëöù ėēę îđċďėĕēđďďēġ ìó öøðöû 134 1)"3."$: NBOBHFNFOU,"* & i ² ³ ] ΔΕΚΕΜΒΡΙΟΣ 2014

Δημιουργία Συστήματος Συστάσεων Βασισμένο σε Χωροχρονικές Πληροφορίες

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Transcript:

Recommendation συστήματα Δρ., Μαρκέλλου Πηνελόπη Μηχανικός Η/Υ & Πληροφορικής Δομή μαθήματος Recommendation σύστημα. Ορισμός. Βασικά χαρακτηριστικά. Ταξινόμηση recommendation συστημάτων. Είσοδος Έξοδος. Μέθοδος προτάσεων. Βαθμός personalization. Αποστολή. Αλγόριθμοι και τεχνικές. Search-based RSs. Category-based RSs. Collaborative filtering. Clustering. Association rules. Information filtering. Classification. Παραδείγματα. Βιβλιογραφία & URLs. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 2/56 1

Εισαγωγή Τα τελευταία χρόνια ένας μεγάλος αριθμός από ηλεκτρονικά καταστήματα (e-shop, e-mall, e-auctions, κλπ.) λειτουργούν στο Web. Το e-εμπόριο έδωσε τη δυνατότητα στους πελάτες να επιλέξουν προϊόντα και υπηρεσίες μέσα από μια μεγάλη ποικιλία. www.amazon.com Για παράδειγμα, αντί για τα μερικές εκατοντάδες βιβλία που ο πελάτης μπορεί να βρει σε ένα παραδοσιακό βιβλιοπωλείο έχει τώρα πρόσβαση σε χιλιάδες βιβλία που διαθέτουν τα on-line καταστήματα. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 3/56 Information overload Με την αύξηση όμως των προσφερόμενων επιλογών, αυξάνει παράλληλα και ο φόρτος που απαιτείται από τον χρήστη για να επιλέξει τα προϊόντα που ταιριάζουν με τις ανάγκες και τις απαιτήσεις του. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 4/56 2

Η λύση Για να αντιμετωπισθεί αυτό το πρόβλημα τα e-shops εφαρμόζουν τεχνικές personalization σε μια προσπάθεια να προσφέρουν στους πελάτες τους εξατομικευμένα προϊόντα και υπηρεσίες. Ένα σημαντικό κομμάτι αυτών των τεχνικών αποτελούν τα recommendation ή recommender systems (RSs) ή συστήματα προτάσεων/συστάσεων. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 5/56 Ορισμός RS Ένα recommendation ή recommender system (RS) είναι ένα σύστημα προτάσεων/ συστάσεων που προτείνει προϊόντα στους πελάτες του και τους παρέχει επαρκή πληροφόρηση ώστε να αποφασίσουν ποια προϊόντα επιθυμούν να αγοράσουν. www10.org/cdrom/posters/p1039/index.htm Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 6/56 3

Βασικά χαρακτηριστικά Τα προϊόντα που προτείνονται μπορεί να βασίζονται: στις μεγαλύτερες συνολικές πωλήσεις του site. στα δημογραφικά δεδομένα του πελάτη. στην ανάλυση της προηγούμενης αγοραστικής συμπεριφοράς του πελάτη (ιστορικό) σαν πρόβλεψη της μελλοντικής συμπεριφοράς του. σε στοιχεία από κοινότητες πελατών με παρόμοια χαρακτηριστικά και αγοραστική συμπεριφορά με τον συγκεκριμένο πελάτη. Μορφή recommendations: προτάσεις προϊόντων στους πελάτες. παροχή εξατομικευμένης (personalized) πληροφόρησης για τα προϊόντα. συνόψιση απόψεων μιας κοινότητας. παροχή κριτικών από έναν πελάτη ή μια κοινότητα, κλπ. Οι τεχνικές recommendation αποτελούν τμήμα του personalization ενός site και το βοηθούν να προσαρμοστεί σε κάθε πελάτη ξεχωριστά. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 7/56 Ένα παράδειγμα Πελάτης Α Έχει αγοράσει CD των Metalica. Αγοράζει CD των Megadeth. Πελάτης Β Ψάχνει για τους Metalica. Το RS του προτείνει τους Megadeth με βάση τα δεδομένα που συνέλεξε από τον πελάτη Α. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 8/56 4

Γιατί τα χρησιμοποιούμε; Τα RSs ενισχύουν τις πωλήσεις ενός e-shop. Μετατρέπουν τους επισκέπτες σε αγοραστές. Οι επισκέπτες ενός site συχνά περιηγούνται σε αυτό χωρίς να αγοράζουν κάποιο προϊόν. Τα RSs τους βοηθούν να βρουν τα προϊόντα που επιθυμούν να αγοράσουν. Αυξάνουν το cross-selling και το up-selling. Τα RS βελτιώνουν το cross-selling προτείνοντας συμπληρωματικά προϊόντα στον πελάτη, ενώ βελτιώνουν και το up-selling προτείνοντας προϊόντα καλύτερα σε ποιότητα και τιμές. Εάν οι προτάσεις είναι καλές, τότε οι παραγγελίες θα αυξηθούν. Για παράδειγμα, ένα e-shop μπορεί να προτείνει συμπληρωματικά προϊόντα κατά τη διάρκεια ολοκλήρωσης της παραγγελίας (checkout) βασιζόμενο στα προϊόντα που βρίσκονται ήδη στο καλάθι αγορών (shopping cart) του πελάτη. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 9/56 Γιατί τα χρησιμοποιούμε; «Χτίζουν» την εμπιστοσύνη των πελατών. Σε έναν κόσμο όπου οι ανταγωνιστές είναι μόνο ένα «κλικ» μακριά, η e-εμπιστοσύνη (e-trust) των πελατών αποτελεί μια σημαντική επιχειρηματική στρατηγική. Τα RSs βελτιώνουν την e-πίστη (e-loyalty) αφού δημιουργούν μια ιδιαίτερη σχέση μεταξύ του πελάτη και του e-shop. Τα sites που επενδύουν στο να μάθουν τους πελάτες τους, χρησιμοποιούν τα RSs για να προτείνουν προϊόντα/υπηρεσίες που ταιριάζουν καλύτερα στις ανάγκες τους. Οι πελάτες από τη μεριά τους ανταποδίδουν αυτές τις ευκολίες με το να ξαναγυρίσουν στα sites που τους ικανοποιούν. Όσο περισσότερο ο πελάτης χρησιμοποιεί το σύστημα (το οποίο μαθαίνει τι αυτός χρειάζεται), τόσο μεγαλύτερη είναι η εμπιστοσύνη του σε αυτό το site. Δίνοντας τη δυνατότητα δημιουργίας σχέσεων μεταξύ των πελατών π.χ. μέσω μιας κοινότητας χρηστών με κοινά χαρακτηριστικά/ενδιαφέροντα, αυξάνεται η πιθανότητα οι πελάτες να επιστρέψουν στο site αφού το προτείνουν και άλλοι χρήστες με τους οποίους έχουν επικοινωνία. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 10/56 5

Ταξινόμηση Τα RSs για εφαρμογές e-commerce μπορούν να ταξινομηθούν με βάση: την είσοδο, την έξοδο, τη μέθοδο των προτάσεων, άλλα χαρακτηριστικά σχεδίασης (βαθμός personalization, αποστολή recommendations). Αυτές οι κατηγορίες δεν είναι ανεξάρτητες αφού για παράδειγμα: συγκεκριμένες σχεδιαστικές επιλογές απαιτούν συγκεκριμένες εισόδους. ή συγκεκριμένες έξοδοι μπορούν να παραχθούν μόνο με κάποιες και όχι με όλες τις μεθόδους προτάσεων. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 11/56 Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 12/56 6

Είσοδος και έξοδος Θεωρούμε σαν δεδομένα την είσοδο και την έξοδο του συστήματος. Το σύστημα δέχεται μια συλλογή από δεδομένα εισόδου όπως: προτιμήσεις των πελατών, χαρακτηριστικά των προϊόντων, άλλες συσχετίσεις, κλπ. Αφού αυτά τα δεδομένα καλύπτουν ένα μεγάλο εύρος, τα χωρίζουμε σε σχέση με την προέλευσή τους: δεδομένα σχετικά με τον πελάτη για τον οποίο θέλουμε να παράγουμε τις προτάσεις, γενικά δεδομένα σχετικά με την κοινότητα άλλων πελατών. Τα RSs χρησιμοποιούν αυτά τα δεδομένα και παράγουν προτάσειςεξόδους για τα προϊόντα. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 13/56 Προσανατολισμένη στον πελάτη Τα δεδομένα αυτά εισάγονται στο RS για να παράγουν προτάσεις προσανατολισμένες στον πελάτη. Όταν το RS δεν χρησιμοποιεί δεδομένα για τους συγκεκριμένους πελάτες παράγει μόνο γενικές προτάσεις. Προσθέτοντας περισσότερους τύπους δεδομένων, επιτρέπουμε στο RS να κάνει πιο ειδικές προτάσεις βασισμένες στην τρέχουσα δραστηριότητα του πελάτη, στις προτιμήσεις του, κλπ. H τάση είναι ότι όλο και περισσότερο τα RSs ανταποκρίνονται στην τρέχουσα κατάσταση του πελάτη λαμβάνοντας υπόψη την πλοήγησή του στο site για να βελτιώσουν τις προτάσεις τους. Η συμπεριφορά των πελατών που μεταφράζεται σαν είσοδος περιλαμβάνει: τις κινήσεις που εκτέλεσαν, ενώ δεν ήταν ενήμεροι για το RS -> implicit navigation (υπονοούμενη πλοήγηση). τις κινήσεις που εκτέλεσαν, με στόχο να βελτιώσουν τις προτάσεις -> explicit navigation (σαφής πλοήγηση). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 14/56 7

Υπονοούμενη πλοήγηση Τα δεδομένα εξάγονται από τη συμπεριφορά του πελάτη χωρίς αυτός να γνωρίζει την παρουσία του RS και μπορεί να περιλαμβάνουν τα συγκεκριμένα προϊόντα που ο πελάτης βλέπει την τρέχουσα στιγμή στον κατάλογο (catalogue) ή αυτά που περιέχονται στο καλάθι αγορών (shopping cart). Ο πελάτης διαβάζει τις λεπτομέρειες του βιβλίου «Άρχοντας τον Δακτυλιδιών Η Παρέα του Δακτυλιδιού». Το RS του προτείνει άλλα βιβλία του ίδιου συγγραφέα είτε το DVD της ταινίας. Τα δεδομένα μπορεί επίσης να περιλαμβάνουν την κατηγορία ή το χαρακτηριστικό στο οποίο ο πελάτης πλοηγείται. Ξένη λογοτεχνία. Βιβλία με τιμή έως 20 ευρώ. Το RS προσπαθεί να πείσει τον πελάτη να αγοράσει το συγκεκριμένο προϊόν, ενώ του προτείνει και συμπληρωματικά προϊόντα (cross-selling). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 15/56 Σαφής πλοήγηση Σε αντίθεση με την υπονοούμενη, στη σαφή πλοήγηση οι πελάτες εισάγουν τα δεδομένα με σκοπό να πληροφορήσουν το σύστημα για τις προτιμήσεις τους. Εγγραφή στο e-shop. Μέλος ομάδων, κοινοτήτων, κλπ. Συμπλήρωση φορμών/ερωτηματολογίων με προτιμήσεις, ενδιαφέροντα, κλπ. Βαθμολογήσεις προϊόντων. Λέξεις κλειδιά. Τα RSs μπορούν να παράγουν λίστες με τα «top-n» προϊόντα. Λίστα links με τα «top-10» βιβλία που επιλέγουν οι κριτικοί. Λίστα links με τα «top-10» βιβλία που προτιμούν οι πελάτες. Ο πελάτης μπορεί να πλοηγηθεί στη λίστα που τον ενδιαφέρει και να δει προτάσεις για μια συγκεκριμένη κατηγορία ή προϊόν. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 16/56 8

Λέξεις κλειδιά χαρακτηριστικά προϊόντων Τα δεδομένα από τον πελάτη δεν περιορίζονται σε μια απλή κατηγορία ή κάποιο προϊόν που τον ενδιαφέρει. Μπορεί να δώσει λέξεις κλειδιά (keywords) ή χαρακτηριστικά των προϊόντων (attributes) με σαφή τρόπο: μέσω μιας μηχανής αναζήτησης. Ή με υπονοούμενο τρόπο: από τα προϊόντα που ο πελάτης βλέπει την τρέχουσα στιγμή στον κατάλογο. Σε κάθε περίπτωση, τα δεδομένα μεταφράζονται σαν είσοδος που υποδεικνύει τα τρέχοντα ενδιαφέροντα του πελάτη. Ο πελάτης ζητά να λάβει προτάσεις για τα best sellers της Ελληνικής Λογοτεχνίας για τον μήνα Μάιο. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 17/56 Βαθμολόγηση Οι πελάτες παρέχουν χρήσιμες και σαφείς πληροφορίες στο RS όταν βαθμολογούν τα προϊόντα που έχουν ήδη αγοράσει. Η αξιολόγηση μπορεί να γίνει με βαθμούς π.χ. «βαθμολόγησε κάθε προϊόν σε μια κλίμακα από 1-5» ή με απλή ερώτηση της μορφής «σου άρεσε αυτό;». Οι προκαθορισμένες απαντήσεις μπορούν να αναλυθούν αυτόματα από το σύστημα. Οι ανοικτές απαντήσεις απαιτούν περισσότερη επεξεργασία και ανάλυση (απαραίτητος ίσως και ο ανθρώπινος παράγοντας). Ο πελάτης λαμβάνει μια λίστα με τα «top-10» προϊόντα που συγκεντρώνουν τις υψηλότερες βαθμολογίες των πελατών. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 18/56 9

Ιστορικό αγορών Μερικά e-shops δεν ζητάνε από τους πελάτες να βαθμολογήσουν τα προϊόντα αλλά χρησιμοποιούν το ιστορικό των αγορών τους σαν μια υπονοούμενη μορφή βαθμολόγησης. Στη συνέχεια παρέχουν λίστες από προϊόντα για τα οποία οι πελάτες έχουν εκφράσει σαφή προτίμηση. Σε αυτή την περίπτωση οι καλές προτάσεις αναγνωρίζονται όταν: σχετίζονται με βαθμολογίες, και επιπλέον επιτρέπουν στους πελάτες να τις βαθμολογήσουν. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 19/56 Δεδομένα από κοινότητες Τα δεδομένα από κοινότητες περιλαμβάνουν πληροφορίες για το πως τα διάφορα άτομα που ανήκουν στην κοινότητα ή ολόκληρη η κοινότητα αντιλαμβάνεται τα προϊόντα. Δεδομένα εισόδου που αντανακλούν τις απόψεις όλης της κοινότητας περιλαμβάνουν τα χαρακτηριστικά των προϊόντων (attributes) αποδίδοντας κατηγορίες και ετικέτες. Το είδος ενός βιβλίου/ταινίας αντανακλά την αντίληψη της κοινωνίας. Η δημοτικότητα ενός προϊόντος (popularity) μπορεί να εκφράζει τις συνολικές πωλήσεις ή μια λίστα με best-sellers. Όπως χρησιμοποιείται το ιστορικό αγορών για να παραχθούν προτάσεις για κάθε πελάτη ξεχωριστά μπορεί να χρησιμοποιηθεί και το ιστορικό αγορών της κοινότητας (community purchase history). Μπορούν να συνδυασθούν για να παραχθεί η λίστα των καλύτερων πωλήσεων ενός e-shop ή να εξαχθούν συμπεράσματα σχετικά με την κίνηση των πωλήσεων ή τις ομοιότητες/διαφοροποιήσεις των προϊόντων. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 20/56 10

Δεδομένα από κοινότητες Υπάρχουν και πληροφορίες που σχετίζονται με ξεχωριστά μέλη της. Πολλά sites ενθαρρύνουν τα σχόλια κειμένου (text comments) από τους πελάτες τους. Το RS συλλέγει σχόλια για ένα προϊόν και τα παρουσιάζει στους πελάτες για να τους βοηθήσει να κάνουν την επιλογή τους. Είναι πολύ χρήσιμα, αλλά απαιτούν αρκετό χρόνο επεξεργασίας. Ο πελάτης πρέπει να διαβάσει το κείμενο για να καταλάβει αν το σχόλιο είναι θετικό ή αρνητικό. Για να διευκολυνθεί αυτή η διαδικασία εκτός από τη δυνατότητα σχολίωνκειμένου ενθαρρύνουν τα μέλη τους να υποδείξουν την προτίμησή τους ή όχι με κάποιο αριθμητικό τρόπο ή με μια βαθμολογία (rating). Όπως ακριβώς τα RSs χρησιμοποιούν τις βαθμολογίες των πελατών μπορούν επίσης να συγκεντρώνουν τις βαθμολογίες όλων των πελατών μιας κοινότητας και να παράγουν προτάσεις. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 21/56 Έξοδος Η έξοδος των RSs μπορεί να διαφέρει ανάλογα: με τον τύπο, την ποσότητα, και την ποιότητα, των δεδομένων που οι πελάτες έχουν προσφέρει. Τρεις βασικές μορφές εξόδου: Προτάσεις. Προβλέψεις. Βαθμολογίες και κριτικές. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 22/56 11

Προτάσεις Ο πιο κοινός τύπος εξόδου είναι οι προτάσεις (suggestions): συχνά έχουν τη μορφή «δοκίμασε αυτό» ή «αυτό». Η πρόταση μπορεί να αφορά μόνο ένα προϊόν (στοχευόμενη). Αυξάνεται η πιθανότητα ο πελάτης να ενδιαφερθεί σοβαρά για το προϊόν, αφού η πρόταση απαιτεί πολύ λίγο χρόνο για να την επεξεργασθεί. Ενέχει τον κίνδυνο ο πελάτης να έχει ήδη αγοράσει το προϊόν ή να μην τον ενδιαφέρει. Τα RSs παρέχουν ένα σύνολο από προτάσεις για έναν πελάτη. Παρουσίαση των προϊόντων σε τυχαία σειρά για να μη δώσουν την αίσθηση ότι κάποιο προϊόν είναι καλύτερο από κάποιο άλλο. Αποφεύγουν την απόρριψη ολόκληρης της λίστας σε περίπτωση που ο πελάτης απορρίψει το πρώτο προϊόν στην κατάταξη. Βέβαια κάθε λίστα έχει μια σειρά π.χ. αλφαβητική παρουσίαση προϊόντων. Άλλα RSs βαθμολογούν τα προτεινόμενα προϊόντα. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 23/56 Προβλέψεις Άλλοι αλγόριθμοι παρουσιάζουν στους χρήστες προβλέψεις (prediction) για τη βαθμολόγηση που θα έδιναν σε ένα προϊόν. Αυτές οι εκτιμήσεις μπορούν να παρουσιασθούν σαν: προσανατολισμένες σε κάθε πελάτη (διαφορετικές), ή μη-προσανατολισμένες (ίδιες για όλα τα μέλη μιας κοινότητας), και βοηθούν τους πελάτες να κατανοήσουν τη δυναμική μιας πρότασης. Οι προβλέψεις μπορούν να παρουσιάζονται: σαν μια μεμονωμένη πρόταση, σαν μια λίστα προτάσεων, ή μπορεί να εμφανίζονται μέσα στο περιεχόμενο της σελίδας παρουσίασης ενός προϊόντος. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 24/56 12

Βαθμολογίες και κριτικές Όταν οι κοινότητες είναι μικρές ή τα μέλη τους γνωρίζονται είναι χρήσιμες οι βαθμολογίες (rating) συγκεκριμένων μελών ώστε κάθε χρήστης να εξάγει τα δικά του συμπεράσματα για τη σημασία της πρότασης. Ο πελάτης επιλέγει γνωστά μέλη της κοινότητας βλέπει βαθμολογίες και κριτικές (reviews). Οι κριτικές δεν μπορούν να κατανοηθούν πλήρως από το RS αφού είναι δύσκολο να διακριθούν τα θετικά/αρνητικά σχόλια για ένα προϊόν (λύση: σχόλια κειμένου και αριθμητικές βαθμολογίες). Amazon.com: εμφανίζει σχόλια κειμένου και βαθμολογίες με μηπροσανατολισμένο τρόπο. Κάθε πελάτης βλέπει το ίδιο, ολοκληρωμένο σύνολο από σχόλια. Δυνατότητα ταξινόμησης των σχολίων με βάση την ιστορία συμφωνίας/ ασυμφωνίας του με τον κριτή. Παρουσίαση των διαπιστευτηρίων του κριτή για να πεισθούν οι πελάτες. Δυνατότητα οι αναγνώστες των σχολίων να βαθμολογήσουν τα ίδια τα σχόλια. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 25/56 Μέθοδοι παραγωγής προτάσεων Ποιες είναι οι πιο συχνές μέθοδοι που χρησιμοποιούνται στα RSs για e-commerce εφαρμογές; Ένα RS μπορεί να χρησιμοποιεί συνδυαστικά περισσότερες από μία μεθόδους. Κάθε κατηγορία μεθόδων στην ουσία αντιπροσωπεύει ένα σύνολο από αλγορίθμους και προσεγγίσεις. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 26/56 13

Raw retrieval Παρέχεται στους πελάτες ένα interface αναζήτησης μέσω του οποίου μπορούν να κάνουν ερωτήσεις στις βάσεις δεδομένων των προϊόντων. Το σύστημα προτείνει οτιδήποτε ο πελάτης έχει ζητήσει. Ο πελάτης ζητά από ένα μουσικό e-shop ένα άλμπουμ των Beatles. Το σύστημα επιστρέφει μια λίστα από όλα τα άλμπουμ τους. Αυτό μπορεί να είναι πολύ χρήσιμο αφού ο πελάτης μπορεί να δει κάποιο άλμπουμ που πριν δεν ήξερε και τον ενδιαφέρει να το αγοράσει. Αυτά τα RS είναι ευρέως διαδεδομένα στα e-shops. Η λειτουργία τους μοιάζει με αυτή των μηχανών αναζήτησης. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 27/56 Manual selection Τα recommendations συλλέγονται με το χέρι (manual selection): συντάκτες, κριτικούς, άλλους ειδικούς. Οι προτάσεις υποδεικνύουν προϊόντα με βάση τα γούστα, τα ενδιαφέροντα, τους αντικειμενικούς σκοπούς τους και δημιουργούν μια λίστα από προτεινόμενα προϊόντα διαθέσιμα για τα μέλη της κοινότητας. Οι προτάσεις συχνά συνοδεύονται από σχόλια κειμένου που βοηθούν τους πελάτες να τις κατανοήσουν. O χρήστης επιλέγει ένα συγκεκριμένο είδος ταινιών π.χ. θρίλερ για τις οποίες θα ήθελε recommendations. Tου παρέχεται μια λίστα από προτάσεις από κάποιο κριτικό με τις ταινίες που θεωρεί ως τα καλύτερα θρίλερ όλων των εποχών. Η διαδικασία δεν κάνει υπολογιστική επεξεργασία απλώς αναπαράγει αυτό που μπορεί να εμφανιζόταν στον τοίχο ενός video club. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 28/56 14

Statistical summaries Πολλές εφαρμογές παρέχουν στατιστικές αναλύσεις (statistical summaries) των απόψεων μιας κοινότητας. Αυτά τα στοιχεία μπορεί να περιλαμβάνουν μετρήσεις δημοτικότητας (popularity) μέσα στην κοινότητα όπως: ποσοστό ανθρώπων που τους αρέσει ή αγόρασαν ένα συγκεκριμένο προϊόν. συνοπτικές βαθμολογίες π.χ. ο αριθμός των ατόμων που προτείνουν ένα προϊόν, ή μέση βαθμολογία για ένα προϊόν, κλπ. Το RS παρουσιάζει μέσες τιμές βαθμολογίων αγοραστών/πωλητών. Οι πελάτες μπορούν να συμβουλευτούν τις μέσες τιμές και τις εκτιμήσεις αλλά δεν μπορούν να δουν βαθμολογίες από πελάτες με τους οποίους συμφωνούν. Non-personalized προτάσεις: είναι δημοφιλείς, μπορούν εύκολα να υπολογισθούν και να χρησιμοποιηθούν. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 29/56 Attribute-based Τα recommendations βασίζονται στα συντακτικά χαρακτηριστικά των προϊόντων. Ένας πελάτης πλοηγείται στο τμήμα «κλασσική μουσική» ενός καταστήματος. Έχει στο καλάθι αγορών του διάφορα Cds ειδικής προσφοράς. Μπορεί να λάβει μια πρόταση για έκπτωση σε κάποιο Cd κλασσικής μουσικής. Παρόμοια συστήματα χρησιμοποιούν τα προφίλ των χρηστών που υποδεικνύουν τι τους αρέσει και τι δεν τους αρέσει για να παράγουν τα recommendations. Το e-shop μαθαίνει ότι ένας πελάτης αγοράζει μόνο Cds που έχουν έκπτωση, ενώ κάποιος άλλος ποτέ δεν αγοράζει μουσική της δεκαετίας του 70. Ανάλογα προσαρμόζει τις προτάσεις του. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 30/56 15

Item-to-item correlation Αναγνωρίζονται προϊόντα που εμφανίζονται πιο συχνά μαζί με τα προϊόντα για τα οποία ο χρήστης έχει εκφράσει κάποιο ενδιαφέρον. Η συσχέτιση μπορεί να βασίζεται σε δεδομένα αγορών, προτιμήσεων από κοινούς πελάτες, ή άλλες μετρικές. Απλή μορφή: άλλου είδους ρουχισμός που αγοράζεται συνήθως μαζί με ένα παντελόνι π.χ. σακάκι, πουκάμισο, πουλόβερ, κλπ. Σύνθετη μορφή: συσχετισμός των προϊόντων που έχει ο χρήστης στο καλάθι του ώστε να του προτείνουν άλλα προϊόντα. Χρησιμοποιούνται συνήθως οι τρέχουσες πωλήσεις ή άλλα τρέχοντα ενδιαφέροντα του πελάτη. Πολύ χρήσιμες για προτάσεις δώρων. Στην περίπτωση αυτή ο πελάτης θα πρέπει να υποδείξει και κάποια πρόσθετα χαρακτηριστικά ή προϊόντα που μπορεί να αρέσουν σε αυτόν που θα λάβει το δώρο. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 31/56 User-to-user correlation Προτείνονται προϊόντα σε έναν πελάτη με βάση τη συσχέτισή του με άλλους πελάτες που έχουν αγοράσει προϊόντα από το e-shop. Αυτή η τεχνολογία συχνά αναφέρεται και σαν collaborative filtering (συνεργατικό φιλτράρισμα). Το My CDNOW ήταν ένα σύστημα που χρησιμοποιούσε το user-to-user correlation για να αναγνωρίσει μια κοινότητα από πελάτες που έτειναν να έχουν και να τους αρέσουν τα ίδια σύνολα από Cds. Η τεχνική στηριζόταν στην αρχή ότι εάν διάφορα μέλη της κοινότητας που ανήκει ο πελάτης έχουν και τους αρέσει το τελευταίο άλμπουμ του Sting τότε είναι αρκετά πιθανό να αρέσει και σε αυτόν. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 32/56 16

Online και offline προτάσεις Ο υπολογισμός γίνεται εξολοκλήρου online, όταν δηλαδή ο πελάτης αλληλεπιδρά με το e-shop, ή μέρη του να υπολογίζονται offline, κυρίως για λόγους απόδοσης. Οι online recommendations προτιμούνται γιατί απαντούν απευθείας στις προτιμήσεις του χρήστη (πρέπει να διασφαλισθεί ότι το on-line σύστημα θα παράγει αποτελέσματα που θα ανταποκρίνονται όσο το δυνατόν περισσότερο στην αλληλεπιδραστική είσοδο του χρήστη). Οι raw retrieval, manual selection, statistical summaries, attributebased μέθοδοι εκτελούν απλούς υπολογισμούς που συνήθως γίνονται στη διάρκεια της αλληλεπίδρασης του πελάτη με το site. Οι item-to-item correlation και user-to-user correlation τεχνικές είναι περισσότερο πολύπλοκες υπολογιστικά και συχνά απαιτούν μια offline επεξεργασία που θα προετοιμάσει το μοντέλο για την online εκτέλεση. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 33/56 Βαθμός personalization Όταν το RS προτείνει τα ίδια recommendations σε κάθε πελάτη τότε η εφαρμογή θεωρείται ότι είναι non-personalized. Recommendations που βασίζονται σε επιλογή με το χέρι, στατιστικά στοιχεία, κλπ. όπως οι μεγαλύτερες πωλήσεις, οι επιλογές των κριτικών, οι μέσοι όροι καθώς και τα ακατέργαστα σχόλια. Τα RSs που χρησιμοποιούν τα τρέχοντα δεδομένα των πελατών για να προσαρμόσουν τις προτάσεις στα ενδιαφέροντά τους παρέχουν ephemeral personalization. Βασίζονται συνήθως σε item-to-item correlation, attribute-based recommendation ή και τα δυο μαζί. Ένα RS με υψηλό βαθμό ephemeral personalization χρησιμοποιεί όλη την τρέχουσα πληροφορία από την πλοήγηση του πελάτη ή το καλάθι αγορών για να προτείνει προϊόντα, ενώ ένα RS που απλώς συνδέει προτάσεις με το τρέχον προϊόν είναι πιο κοντά στο non-personalized. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 34/56 17

Βαθμός personalization Οι περισσότερο personalized εφαρμογές χρησιμοποιούν persistent personalization για να δημιουργήσουν προτάσεις που θα είναι διαφορετικές για διαφορετικούς πελάτες ακόμα και αν αυτοί κοιτάνε τα ίδια προϊόντα. Αυτά τα συστήματα χρησιμοποιούν user-to-user correlation, attributebased recommendation χρησιμοποιώντας προτιμήσεις με βάση τα χαρακτηριστικά, ή item-to-item correlation δηλαδή προτιμήσεις για τα προϊόντα. Απαιτούν από τους πελάτες να συντηρούν μόνιμες ταυτότητες. Τους επιβραβεύουν με το μεγαλύτερο βαθμό personalization. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 35/56 Αποστολή recommendations Κρίσιμη απόφαση. Push τεχνολογίες: φτάνουν στον πελάτη όταν αυτός δεν αλληλεπιδρά με το κατάστημα π.χ. το e-mail. Τρόπος να επιστρέψει ο πελάτης στο site (προτάσεις, προσφορές, κλπ). Ο πελάτης επιλέγει το link του e-mail και μεταφέρεται στο προϊόν online. Pull τεχνολογίες: ο πελάτης ελέγχει πότε θα παρουσιασθούν οι προτάσεις. Ενημερώνεται για το πότε είναι ενεργές (π.χ. link) αλλά δεν του παρουσιάζονται αν δεν τις ζητήσει (π.χ. προτάσεις δώρων). Passive τεχνολογίες: παρουσιάζουν τα recommendations στο φυσικό περιβάλλον της εφαρμογής e-εμπορίου. Προτάσεις προϊόντων που σχετίζονται με το τρέχον προϊόν, το περιεχόμενο ή την πλοήγηση του χρήστη, κλπ. Φτάνουν στον πελάτη όταν ο ίδιος είναι ανοικτός στην ιδέα. Μέρος της διαδικασίας παραγγελίας ή όταν ο πελάτης την ολοκληρώνει. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 36/56 18

Αλγόριθμοι και τεχνικές: παραδείγματα Search-based RSs. Category-based RSs. Collaborative filtering. Clustering. Association rules. Information filtering. Classification. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 37/56 Search-based RSs Ο πελάτης πληκτρολογεί μια ερώτηση (query): «data mining». Το σύστημα βρίσκει όλα τα προϊόντα που αντιστοιχούν στο query: π.χ. 6 βιβλία. Το σύστημα προτείνει κάποια από τα βιβλία με βάση γενικά, non-personalized στοιχεία (π.χ. πωλήσεις). + Εύκολο στην υλοποίηση. - Όχι πολύ αποδοτικό. - Στην ουσία δεν είναι recommendations. - Ποια κριτήρια χρησιμοποιεί; - Ο πελάτης παίρνει μόνο ότι ζητάει. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 38/56 19

Category-based RSs Κάθε προϊόν ανήκει σε μια ή περισσότερες κατηγορίες. Σαφής/υπονοούμενη επιλογή: Ο πελάτης επιλέγει την κατηγορία που τον ενδιαφέρει: «Subjects->Computers & Internet->Databases->Data Storage & Management->Data Mining». Το σύστημα επιλέγει κατηγορίες ενδιαφέροντος για λογαριασμό του πελάτη με βάση το τρέχον προϊόν που κοιτάει, προηγούμενες παραγγελίες, κλπ. Προτείνει συγκεκριμένα προϊόντα (π.χ. best sellers, νέα προϊόντα). - Ίδια με την προηγούμενη τεχνική. - Εξαρτάται από τις κατηγορίες Πολύ συγκεκριμένο: όχι αποδοτικό. Πιο γενικό: μη σχετικές προτάσεις. + Εύκολο στην υλοποίηση. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 39/56 Collaborative filtering Η τεχνική αυτή συγκρίνει πελάτες με βάση τις προηγούμενες αγορές τους και κάνει προτάσεις σε «παρόμοιους» πελάτες. Ονομάζεται και social filtering. Τα βήματα: Εύρεση των πελατών που είναι παρόμοιοι (κοντινότεροι γείτονες) σε σχέση με τα γούστα, τις προτιμήσεις και τις προηγούμενες συμπεριφορές. Απόδοση βαρών στις προτιμήσεις αυτών των γειτόνων. Παραγωγή recommendations με βάση τα παραπάνω (περισσότερο επιλεγμένα μη αγορασμένα προϊόντα). + Πολύ αποδοτικό + Πολύ σχετικά recommendations (όσο μεγαλύτερη είναι η βάση δεδομένων και τα στοιχεία για τις προηγούμενες αγορές τόσο καλύτερα τα recommendations). - Δύσκολο στην υλοποίηση, απαιτεί χρόνο και πόρους. - Τι γίνεται με νέα προϊόντα που δεν έχουν ακόμα αγοραστεί; (δεν προτείνονται). - Τι γίνεται με νέους πελάτες που δεν έχουν κάνει αγορές; (δεν συγκρίνονται με άλλους, δεν τους προτείνονται προϊόντα). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 40/56 20

Collaborative filtering Έστω ότι το σύστημα θέλει να κάνει προτάσεις στον πελάτη C. Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Customer A X X Customer B X X X Customer C X X Customer D X X Customer E X X Ο πελάτης B είναι πολύ κοντά στο C (έχει αγοράσει όλα τα βιβλία που ο C έχει αγοράσει). Το Book 5 προτείνεται οπωσδήποτε. Ο πελάτης D είναι σχετικά κοντά. Το Book 6 μπορεί να προταθεί σαν επόμενο. Οι πελάτες A και E δεν είναι παρόμοιοι (βάρη=0). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 41/56 Clustering Ένας άλλος τρόπος για παραγωγή recommendations με βάση τις προηγούμενες αγορές άλλων πελατών είναι η ομαδοποίηση των πελατών σε κατηγορίες. Κάθε ομάδα (cluster) καθορίζεται από «τυπικές προτιμήσεις» βάσει των προτιμήσεων των πελατών που ανήκουν σε αυτή. Οι πελάτες κάθε ομάδας θα λάβουν recommendations που θα προκύψουν για τη συγκεκριμένη ομάδα. + Δουλεύει πολύ γρήγορα για συναθροισμένα δεδομένα. + Μπορεί να είναι το πρώτο βήμα για να μειώσουμε την επιλογή των γειτόνων στο collaborative filtering. - Τα recommendations (για κάθε cluster) είναι λιγότερο σχετικά από ότι αυτά του collaborative filtering (για κάθε άτομο). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 42/56 21

Clustering Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Customer A X X Customer B X X X Customer C X X Customer D X X Customer E X X Οι πελάτες B, C και D είναι ομαδοποιημένοι μαζί. Οι πελάτες A και E είναι ομαδοποιημένοι σε άλλο cluster. Τυπικές προτιμήσεις για το CLUSTER είναι: Book 2, πολύ υψηλή προτίμηση. Book 3, υψηλή προτίμηση. Books 5 και 6, μπορούν να προταθούν. Books 1 και 4, δεν προτείνονται καθόλου. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 43/56 Clustering Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Customer A X X Customer B X X X Customer C X X Customer D X X Customer E X X Customer F X X Πως δουλεύει; Κάθε πελάτης που θα ταξινομηθεί σαν μέλος του CLUSTER θα λάβει recommendations με βάση τις προτιμήσεις της ομάδας: Book 2 θα προταθεί οπωσδήποτε στον πελάτη F. Book 6 θα προταθεί επίσης. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 44/56 22

Customers who bought Customers who bought Association rules Clustering: δουλεύει σε επίπεδο ομάδας (cluster). Collaborative filtering: δουλεύει σε επίπεδο πελάτη (customer). Association rules (ARs): δουλεύει σε επίπεδο προϊόντος (item). Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Customer A X X Customer B X X X Customer C X X Customer D X X Customer E X X Customer F X X Also bought Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Book 1 1 1 Book 2 2 1 1 Book 3 2 2 Book 4 1 Book 5 1 1 2 Book 6 1 Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 45/56 Association rules Οι προηγούμενες αγορές μεταμορφώνονται σε σχέσεις από κοινές αγορές π.χ. Α Β που σημαίνει ότι αν το προϊόν Α υπάρχει σε μια παραγγελία τότε είναι πολύ πιθανό να υπάρχει και το Β. Τα recommendations περιορίζονται από ένα ελάχιστο επίπεδο: support (υποστήριξη): ποσοστό παραγγελιών που περιέχουν και το Α Β. confidence (εμπιστοσύνη): ποσοστό παραγγελιών που περιέχουν το Α περιέχουν επίσης και το Β (support(α Β)/support(A)). Οι ARs χρησιμοποιούνται για να παραχθούν recommendations. Εάν ο πελάτης ενδιαφέρεται για το Book 5, θα του προταθεί το Book 3. Also bought Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Book 1 1 1 Book 2 2 1 1 Book 3 2 2 Book 4 1 Book 5 1 1 2 Book 6 1 Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 46/56 23

Customers who bought Association rules Τι γίνεται αν το RS χρησιμοποιεί περισσότερες πληροφορίες; Εάν ο πελάτης ενδιαφέρεται για το Book 3 και 5, τότε θα του προταθεί να αγοράσει το Book 2, αντί το Book 1. Also bought Book 1 Book 2 Book 3 Book 4 Book 5 Book 6 Book 1 1 1 Book 2 2 1 1 Book 3 2 2 Book 4 1 Book 5 1 1 2 Book 6 1 + Γρήγορο στην υλοποίηση/εκτέλεση. + Δεν απαιτεί χώρο. + Πολύ καλά αποτελέσματα για μεγάλους πληθυσμούς (π.χ. ράφια σούπερ-μάρκετ). - Όχι κατάλληλο αν οι προτιμήσεις αλλάζουν γρήγορα. - Μπορεί να προκύψουν άχρηστα recommendations. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 47/56 Information filtering Association rules: συγκρίνουν items με βάση προηγούμενες πωλήσεις. Information filtering: συγκρίνει items με βάση το content. Ονομάζεται και content-based filtering. Τι είναι όμως το «content» ενός item; Μπορεί να είναι συγκεκριμένα «attributes» του item π.χ. για μια ταινία: Είδος ταινίας: περιπέτεια. Πρωταγωνιστής: Bruce Willis. Έτος: 1995. Μπορεί να είναι επίσης «textual content» (τίτλος ταινίας, περίληψη ταινίας, κλπ.) Διάφορες τεχνικές υπάρχουν που υπολογίζουν την απόσταση μεταξύ δύο textual documents. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 48/56 24

Information filtering Πως δουλεύει; Το textual document διαβάζεται. Υπολογίζονται οι συχνότητες των words. Αρκετές λέξεις δεν λαμβάνονται υπόψη (άρθρα, προθέσεις, και όσες εμφανίζονται με μικρή συχνότητα στα documents). Κάθε document μετατρέπεται σε ένα κανονικοποιημένο TF-IDF (Term Frequency/Inverted Document Frequency) πίνακα. Η απόσταση μεταξύ κάθε ζευγαριού του πίνακα υπολογίζεται από τους τύπους: TFIDF N TF IDF TF IDF 2 TF log( count 1) # docs 1 IDF log # docs the term occurs in Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 49/56 Information filtering Παράδειγμα: πως υπολογίζουμε τα recommendations για 8 βιβλία με βάση μόνο τον τίτλο τους; Επιλεγμένα βιβλία: «Building Data Mining Applications for CRM». «Accelerating Customer Relationships: Using CRM and Relationship Technologies». «Mastering Data Mining: The Art and Science of Customer Relationship Management». «Data Mining Your Website». «Introduction to Marketing». «Consumer Behavior». «Marketing Research, a Handbook». «Customer Knowledge Management». Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 50/56 25

building data mining applications for crm Accelerating Customer Relationships: Using CRM and Relationship Technologies Mastering Data Mining: The Art and Science of Customer Relationship Management Data Mining Your Website COUNT Introduction to marketing consumer behavior marketing research, a handbook customer knowledge management a 1 accelerating 1 and 1 1 application 1 art 1 behavior 1 building 1 consumer 1 crm 1 1 customer 1 1 1 data 1 1 1 for 1 handbook 1 introduction 1 knowledge 1 management 1 1 marketing 1 1 mastering 1 mining 1 1 1 of 1 relationship 2 1 research 1 science 1 technology 1 the 1 to 1 using 1 website 1 your 1 Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 51/56 building data mining applications for crm Data Accelerating Customer Relationships: Using CRM and Relationship Technologies Mastering Data Mining: The Art and Science of Customer Relationship Management TFIDF Normed Vectors Data Mining Your Website Data Mining your Website Introduction to marketing consumer behavior marketing research, a handbook customer knowledge management a 0.000 0.000 0.000 0.000 0.000 0.537 0.000 accelerating 0.000 0.432 0.000 0.000 0.000 The Art 0.000and Science 0.000 0.000 and 0.000 0.296 0.256 0.000 0.000 0.000 0.000 0.000 application 0.502 0.000 0.000 0.000 0.000 of Customer 0.000 Relationship 0.000 0.000 art 0.000 0.000 0.374 0.000 0.000 0.000 0.000 0.000 behavior 0.000 0.000 0.000 0.000 0.000 Management 0.707 0.000 0.000 building 0.502 0.000 0.000 0.000 0.000 0.000 0.000 0.000 consumer 0.000 0.000 0.000 0.000 0.000 0.707 0.000 0.000 crm 0.344 0.296 0.000 0.000 0.000 0.000 0.000 0.000 customer 0.000 0.216 0.187 0.000 0.000 0.000 0.000 0.381 data 0.251 0.000 0.187 0.316 0.000 0.000 0.000 0.000 for 0.502 0.000 0.000 0.000 0.000 0.000 0.000 0.000 handbook 0.000 0.000 0.000 0.000 0.000 0.000 Building 0.537Data 0.000 introduction 0.000 0.000 0.000 0.000 0.636 0.000 0.000 0.000 knowledge 0.000 0.000 0.000 0.000 0.000 Mining 0.000 Applications 0.000 0.763 management 0.000 0.000 0.256 0.000 0.000 0.000 0.000 0.522 marketing 0.000 0.000 0.000 0.000 0.436 0.000 for CRM 0.368 0.000 mastering 0.000 0.000 0.374 0.000 0.000 0.000 0.000 0.000 mining 0.251 0.000 0.187 0.316 0.000 0.000 0.000 0.000 of 0.000 0.000 0.374 0.000 0.000 0.000 0.000 0.000 relationship 0.000 0.468 0.256 0.000 0.000 0.000 0.000 0.000 research 0.000 0.000 0.000 0.000 0.000 0.000 0.537 0.000 science 0.000 0.000 0.374 0.000 0.000 0.000 0.000 0.000 technology 0.000 0.432 0.000 0.000 0.000 0.000 0.000 0.000 the 0.000 0.000 0.374 0.000 0.000 0.000 0.000 0.000 to 0.000 0.000 0.000 0.000 0.636 0.000 0.000 0.000 using 0.000 0.432 0.000 0.000 0.000 0.000 0.000 0.000 website 0.000 0.000 0.000 0.632 0.000 0.000 0.000 0.000 your 0.000 0.000 0.000 0.632 0.000 0.000 0.000 0.000 0.251 0.187 0.316 Mastering Data Mining: Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 52/56 26

Information filtering Πελάτης ενδιαφέρεται για το βιβλίο «Accelerating Customer Relationships: Using CRM and Relationship Technologies». Το RS υπολογίζει τις αποστάσεις μεταξύ αυτού του βιβλίου και των 7 υπολοίπων. Τα πιο κοντινά βιβλία προτείνονται: #1: Data Mining Your Website #2: Building Data Mining Applications for CRM. #3: Mastering Data Mining: The Art and Science of Customer Relationship Management. Δεν προτείνονται: Introduction to Marketing. Consumer Behavior. Marketing Research, a Handbook. Customer Knowledge Management. + Δεν απαιτούνται στοιχεία προηγούμενων αγορών. + Δεν είναι ιδιαίτερα δύσκολο στην υλοποίηση. - Στατικά recommendations. - Όχι αποδοτικό αν το content δεν είναι περιγραφικό π.χ. το information filtering είναι πιο κατάλληλο για recommendations τεχνικών βιβλίων παρά λογοτεχνικών βιβλίων ή ταινιών. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 53/56 Classification Classifiers: γενικά υπολογιστικά μοντέλα για την ταξινόμηση νέων άγνωστων στιγμιότυπων ενός προβλήματος σε μια από τις προκαθορισμένες κλάσεις. Μπορεί να πάρουν σαν είσοδο: Πίνακα (vector) με τα χαρακτηριστικά των items. Είδος ταινίας: περιπέτεια. Πρωταγωνιστής: Bruce Willis. Προτιμήσεις των πελατών. Μου αρέσει το είδος: περιπέτεια. Σχέσεις μεταξύ των items. Μπορεί να δώσουν σαν έξοδο: Ταξινόμηση (classification). Βαθμολόγηση (rank). Προσεγγίσεις προτιμήσεων. + Μπορεί να συνδυαστεί με άλλες μεθόδους για να βελτιώσει τα recommendations. - Απαιτείται ένα εκπαιδευτικό σύνολο. Χρησιμοποιούν δέντρα απόφασης (decision trees), νευρωνικά δίκτυα (neural network), Bayesian ταξινομητές, κλπ. Ο classifier εκπαιδεύεται με βάση ένα training set (σύνολο στιγμιότυπων για τα οποία γνωρίζουμε εκ των προτέρων σε ποια κλάση ανήκουν). Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 54/56 27

Ανοικτά θέματα Τα RSs για να παράγουν επιτυχή αποτελέσματα θα πρέπει να έχουν στη διάθεσή τους ικανοποιητικά δεδομένα. Ανάδραση από τους χρήστες από την oποία δεν μπορούν να Recommendation εξαχθούν χρήσιμα συμπεράσματα. Χρήστες που θα συμμετάσχουν στις έρευνες και θα δώσουν δεδομένα. «Αδύναμοι» αλγόριθμοι. «Φτωχά» αποτελέσματα. «Έλλειψη» δεδομένων. «Μη επαρκή» δεδομένα. Έλεγχος της ιδιωτικότητας (privacy). Η διάσταση του σημασιολογικού ιστού (Semantic Web) Privacy Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 55/56 Βιβλιογραφία Recommender Systems Konstan, J., Miller, B., Maltz, D., Herlocker, J., Gordon, L., Riedl, J., GroupLens: Applying Collaborative Filtering to Usenet News, Communication of the ACM, 40(3):77-87, 1997. Resnick, P., Varian, H., Recommender Systems, Communication of the ACM, 40(3):56-58, 1997. Basu, C., Hirsh, H., Cohen, W., Recommendation as Classification: Using Social and Content-based Information in Recommendation, Proc. of National Conf. on Artificial Intelligence (AAAI-98), 714-720, 1998. Herlocker, J., Konstan, J., A., Riedl, J., Explaining Collaborative Filtering Recommendations, Proc. of ACM CSCW 00 Conf. on Computer-Supported Cooperative Work, 241-250, 2000. McDonald, D., Ackerman, M., Expertise Recommender: a Flexible Recommendation System and Architecture, Proc. of ACM CSCW 00 Conf. on Computer-Supported Cooperative Work, 231-240, 2000. Sarwar, B., Karypis, G., Konstan, J., Riedl, J., Item-based Collaborative Filtering Recommendation Algorithms, Proc. of ACM WWW10, 285-295, 2001. Nakagawa, Μ., Mobasher, Β., Impact of Site Characteristics on Recommendation Models Based On Association Rules and Sequential Patterns, Proc. of the IJCAI'03 Workshop on Intelligent Techniques for Web Personalization, Acapulco, Mexico, 2003. Jin, Χ., Mobasher, Β., Using Semantic Similarity to Enhance Item-Based Collaborative Filtering, Proc. of the 2nd IASTED International Conf. on Information and Knowledge Sharing, Scottsdale, Arizona, 2003. Jin, Χ., Zhou, Υ., Mobasher, Β., A Maximum Entropy Web Recommendation System: Combining Collaborative and Content Features, Proc. of the ACM SIGKDD Conf. on Knowledge Discovery and Data Mining (KDD'05), Chicago, 2005. E-Commerce Recommendation Applications Schafer, B., Konstan, J., Riedl, J., Recommender Systems in E-Commerce, Proc. of ACM E-Commerce 99, 158-166, 1999. Sarwar, B., Karypis, G., Konstan, J., Riedl, J., Analysis of Recommendation Algorithms for E-Commerce, Proc. of ACM E-Commerce 00, 158-167, 2000. Schafer, B., Konstan, J., Riedl, J., E-commerce Recommendation Applications, Data Mining and Knowledge Discovery, 5:115-153, 2001. Δρ., Μαρκέλλου Πηνελόπη, Μηχανικός Η/Υ & Πληροφορικής 56/56 28