onstrained HDMS 200, Αθήνα, Αύγουστος 2-26, 200 ptimalities in Query Personalization Γεωργία Κούτρικα, Γιάννης Ιωαννίδης Πανεπιστήµιο Αθηνών Constrained Query Personalization 1. 1. Εισαγωγή στη CQP οικογένεια 2. 2. Αρχιτεκτονική Συστήµατος.. Αναζήτηση στον Χώρο Καταστάσεων.. Πειράµατα.. Σύνοψη 1
1 Η CQP οικογένεια Εξατοµίκευση Ερώτησης Οδυναµικός εµπλουτισµός µίας ερώτησης µε σχετικές προτιµήσεις προερχόµενες από ένα προφίλ χρήστη µε στόχο την παροχή εξατοµικευµένων απαντήσεων 1 Η CQP οικογένεια Η Εξατοµίκευση Ερώτησης είναι Ένα πρόβληµα βελτιστοποίησης µεγιστοποίηση του ενδιαφέροντος χρήστη στην απάντηση µε βάσητο προφίλ του 2
1 Η CQP οικογένεια Η Εξατοµίκευση Ερώτησης είναι Ένα πρόβληµα βελτιστοποίησης µεγιστοποίηση του ενδιαφέροντος χρήστη στην απάντηση µε βάσητο προφίλ του Υπερεξατοµικευµένες ερωτήσεις µπορεί να είναι ακριβές παράγουν κενές λίστες αποτελεσµάτων 1 Η CQP οικογένεια Η Εξατοµίκευση Ερώτησης είναι Ένα πρόβληµα βελτιστοποίησης µε περιορισµούς µεγιστοποίηση του ενδιαφέροντος χρήστη στην απάντηση µε περιορισµούς στο κόστος εκτέλεσης και/ή στο µέγεθος της απάντησης ελαχιστοποίηση κόστους εκτέλεσης ερώτησης µε περιορισµούς στο ενδιαφέρον και/ή στο µέγεθος της απάντησης
1 Η CQP οικογένεια ενδιαφέρον κόστος µέγεθος max - s low µέγεθος s up max κόστος κ µεγ - max κόστος κ µεγ s low µέγεθος s up - min s low µέγεθος s up d ελ ενδιαφέρον min - d ελ ενδιαφέρον min s low µέγεθος s up 1 Η CQP οικογένεια Παράδειγµα Ακριβές ερωτήσεις Εκτενή αποτελέσµατα Γρηγορότερη απόκριση Λιγότερα αποτελέσµατα
2 CQP Αρχιτεκτονική Συστήµατος Q Προφίλ χρήστη CQP κριτήρια Χώρος Προτιµήσεων Αναζήτηση Χώρου Καταστάσεων P= { προτιµήσεις σχετικές µε τοq } P optimal P Κατασκευή Κατασκευή εξατοµικευµένης εξατοµικευµένης ερώτησης ερώτησης P i P d i, c i, s i of Q P i Εκτίµηση Παραµέτρων Q P optimal 2 CQP Αρχιτεκτονική Συστήµατος Προτιµήσεις < q, d> Ατοµική συνθήκη q Βαθµός ενδιαφέροντος d [0, 1]
2 CQP Αρχιτεκτονική Συστήµατος Προτιµήσεις DIRECTOR DID NAME 0.9 W. Allen DID TITLE YEAR MID < DIRECTOR.name = W.Allen, 0.9 > < MOVIE.did = DIRECTOR.did, 1 > MOVIE < MOVIE.did = DIRECTOR.did and DIRECTOR.name = W.Allen, 0.9 1 > 1 Αποθηκευµένες προτιµήσεις Έµµεσες προτιµήσεις 2 CQP Αρχιτεκτονική Συστήµατος Κατασκευή εξατοµικευµένης ερώτησης Q: SELECT title FROM MOVIE p 1 : MOVIE.did=DIRECTOR.did and DIRECTOR.name= W. Allen p 2 : MOVIE.mid=MGENRE.mid and MGENRE.genre= comedy Q 1 : SELECT title FROM MOVIE M, DIRECTOR DIR WHERE M.did=DIR.did and DIR.name= W. Allen Q 2 : SELECT title FROM MOVIE M, MGENRE G WHERE M.mid=G.mid and G.genre = comedy SELECT title FROM Q 1 union all Q 2 GROUP BY title HAVING count(*)>1 6
2 CQP Αρχιτεκτονική Συστήµατος Εκτίµηση Παραµέτρων p 6 ενδιαφέρον κόστος µέγεθος p 6 p 1 1 p QQQQQQQQ p 2 2 p p 2 CQP Αρχιτεκτονική Συστήµατος Q Προφίλ χρήστη CQP κριτήρια Χώρος Προτιµήσεων Αναζήτηση Χώρου Καταστάσεων P= {προτιµήσεις σχετικές µε τοq } P optimal P Κατασκευή Κατασκευή εξατοµικευµένης εξατοµικευµένης ερώτησης ερώτησης P i P d i, c i, s i of Q P i Εκτίµηση Παραµέτρων Q P optimal 7
CQP Χώρος Καταστάσεων Ένα CQP πρόβληµα Μεγιστοποίηση ενδιαφέροντος µε κόστος c upper Q, P οαριθµός των δυνατών υποσυνόλων του P είναι εκθετικός P x Κατάσταση, P x P P x P y Μετάβαση µε βάση: το κόστος, το µέγεθος, ή τοενδιαφέρον CQP Χώρος Καταστάσεων Καταστάσεις Έστω P διατεταγµένο κατά φθίνουσα σειρά κόστους: cost(p i ) cost(p i+1 ) 2 p 120 80 60 0 0 8
CQP State Space Search 2 1 2 2 2 1 1 p p 1 1 2 p p p1 1 2 2 1 1 p p 2 2 1 p p 1 p p p1 1 p p p 2 p 2 2 p p CQP Χώρος Καταστάσεων Μεταβάσεις µε βάση το κόστος Horizontal( ) p p Vertical( ) p p p p 1 1 p p 1 2 p p 2 9
CQP Χώρος Καταστάσεων Μεταβάσεις µε βάση το κόστος interest( p ) interest( ) cost( p ) cost( ) cost( ) cost( ) Μερική ταξινόµηση καταστάσεων µε βάση συντακτικές αλλαγές CQP State Space Search 2 1 2 2 2 1 1 p p 1 1 2 p p p1 1 2 2 1 1 p p 2 2 1 p p 1 p p p1 1 p p p 2 p 2 2 p p 10
p CQP 1 p State p p 1 2 Space p p 1 2 Search 1 p 1 2 2 p1 p p 1 1 2 2 1 p 1 1 2 p 2 2 2 p 2 1 p 1 p 1 p 1 p 2 p 2 p p p p CQP Χώρος Καταστάσεων Βασική Ιδέα Αναζήτησης p 1 2 p p p p p1 1 p 2 p p 1 2 p p 1 p 2 2 p p 1 1 Περιοχή A p 1 2 p p 1 2 p p 1 2 p p 1 p p 1 p p 1 p p p 2 p 2 2 p p 1 2 p p p p 2 p p 1 p p 2 p p 1 p p p p 1 p p p p p p 1 p p p p p 2 2 p p p2 2 p p p 2 p p p p p p 2 p p p p p Περιοχή B p p p p p p p p p p 11
CQP Χώρος Καταστάσεων C_Boundaries Φάση 1: βρες boundaries Φάση 2: βρες βέλτιστη λύση π.χ. Μεγιστοποίηση του ενδιαφέροντος µε κόστος< 18 p1 p p pqp 1 p State p p 1 Space p 1 2 2 Search 200 p p1 1 p 1 2 2 120 p 1 1 2 2 220 p 1 p 180 p p1 1 p 1 1 2 80 p 2 2 2 p 1 p 210 p 1 p 180 1 2 60 p p 210 190 p 1 p 2 p 2 0 p 10 p p 0 p 12
CQP Χώρος Καταστάσεων C_Boundaries (φάση 2) Αναζήτηση µέσα σε µία οµάδα για τη βέλτιστη λύση p p 2 p 1 p p Φθίνουσα σειρά κόστους p 2 p p p Φθίνουσα σειρά ενδιαφέροντος Ηβέλτιστηλύσητηςοµάδας CQP Χώρος Καταστάσεων Μεταβάσεις κόστους C_Boundaries C_MaxBounds Μεταβάσεις ενδιαφέροντος D_MaxDoi D_SingleMaxDoi D_HeurDoi 1
Πειράµατα Execution Times K = # προτιµήσεων στο P C µεγ = 00 Πειράµατα 1000 900 800 CQP Optimization Time (s) 700 600 00 00 00 200 100 D_MaxDoi D_SingleMaxDoi C_Boundaries C_MaxBounds D_HeurDoi 0 10 20 0 0 Number of preferences K 1
Πειράµατα Execution Times C µεγ = % του χρόνου εκτέλεσης της ερώτησης που ενσωµατώνει όλες τις προτιµήσεις (Supreme Cost) K = 20 Πειράµατα CQP Optimization Time (s) 100 1200 1000 800 600 00 D_MaxDoi D_SingleMaxDoi C_Boundaries C_MaxBounds D_HeurDoi 200 0 10 20 0 0 0 60 70 80 90 100 % Supreme Cost 1
Πειράµατα Quality of Solution doi optimal by C_Boundaries, D-MaxDoi Quality = doi optimal - doi found doi(p x ) = 1 - (1 doi(p i )) p i P x K = # προτιµήσεων στο P C µεγ = 00 Πειράµατα 10 Difference in quality (10-7 ) 9 8 7 6 2 D_HeurDoi C_MaxBounds D_SingleMaxDoi 1 0 10 20 0 0 Number of preferences K 16
Σύνοψη Εισαγωγή της οικογένενειας προβληµάτων εξατοµίκευσης υπό περιορισµούς ιατύπωση του προβλήµατος ως πρόβληµα αναζήτησης σε χώρο καταστάσεων «Συντακτικές» µεταβάσεις Πειράµατα Μελλοντική Εργασία Πολιτικές για CQP προβλήµατα Ενσωµάτωση µε location-based services Multi-objective constrained optimization 17
Τέλος Ερωτήσεις? Experiments CQP Optimization Time (s) 0 0 2 20 1 10 C_Boundaries C_MaxBounds D_HeurDoi 0 10 20 0 0 0 60 70 80 90 100 % Supreme Cost 18
Experiments 160 10 120 Execution Time (ms) 100 80 60 0 20 Estimated Query Exec.Time Real Query Exec.Time 0 10 20 0 0 Number of preferences K 2 CQP System Architecture Personalized Query Construction Q: SELECT title FROM MOVIE p 1, references q 1 : Q p 1 q 2 : Q p 2 Personalized Query SELECT title FROM q 1 union all q 2 GROUP BY title HAVING count(*) > 1 19
2 CQP System Architecture Parameter Estimation Subsets of preferences: P x P y P interest(q P x ) interest(q P y ) result_size(q P x ) result_size(q P y ) Q x := q i cost(q x ) = cost( q i ) = cost(q i ) cost(q P x ) cost(q P y ) p1 p p pqp 1 p State p p 1 Spape p 1 2 2 Searph 2 200 p1 2 120 p 1 1 2 2 220 p 1 p 180 p p1 1 p 1 1 2 80 p 2 2 2 p 1 p 210 p p 1 p 180 1 2 60 p p 210 190 p 1 p p 2 p 2 0 p 10 p p 0 p 20
CQP State Space Search C_MaxBounds Phase 1: find maximal boundaries Phase 2: find optimal solution e.g. maximize interest while cost < 18 p CQP 1 p State p p 1 2 Space p p 1 2 Search p1 1 p 1 2 2 p1 p 200 120 p 1 1 2 2 220 1 p 1 p 180 p 2 160 1 10 p 2 2 80 2 p 1 p 210 p 1 p p 180 1 2 60 p p 210 190 p 1 p 2 p 2 0 p p p 0 p 21