Πετράκης Κώστας ΓΤΠ-61 Μάρτιος 2015
Εισαγωγή Πρόβλημα Ορισμός Μέθοδοι πρόβλεψης προτιμήσεων Δημιουργία βέλτιστων προτάσεων Τεκμηρίωση προτάσεων Ενημέρωση και επεκτασιμότητα
People read around 10 MB worth of material a day, hear 400 MB a day, and see 1 MB of information every second - The Economist, November 2006 In 2015, consumption will raise to 74 GB a day
Ο αριθμός νέων τραγουδιών και καλλιτεχνών αυξάνονται καθημερινά Η επιλογή μουσικής γίνεται όλο και πιο δύσκολη διαδικασία ανάλογα με το προσωπικό γούστο του ακροατή Συνεπώς καταναλώνεται περισσότερος χρόνος στην αναζήτηση παρά στην ακρόαση μουσικής
Ένα σύστημα πρότασης μουσικής (recommender system) είναι ένα πληροφοριακό σύστημα το οποίο είναι ικανό να αναλύει τις μουσικές προτιμήσεις ενός ακροατή και να αναγνωρίζει ένα σύνολο τραγουδιών που θα του προτείνει ως ενδιαφέροντα.
Τα συστήματα προτάσεων είναι μια χρήσιμη εναλλακτική λύση που βοηθά το χρήστη να ανακαλύψει πληροφορία την οποία δεν θα μπορούσε να αναζητήσει μόνος του σε μια κλασσική μηχανή αναζήτησης
Ένα σύστημα πρότασης μουσικής θα πρέπει να είναι ικανό να: Προβλέπει το πόσο αρέσει στον εκάστοτε χρήστη κάποιο μουσικό κομμάτι Δημιουργεί μια λίστα από Ν κομμάτια για ένα συγκεκριμένο χρήστη Δημιουργεί μια λίστα από Ν χρήστες που θα τους άρεσε κάποιο συγκεκριμένο κομμάτι Τεκμηριώνει στο χρήστη γιατί προτείνει τα συγκεκριμένα κομμάτια Ενημερώνεται και να προσαρμόζει τις προτάσεις του λαμβάνοντας υπόψιν τις αλλαγές στα δεδομένα του
Ένα σύστημα πρότασης μουσικής θα πρέπει να είναι ικανό να: Προβλέπει το πόσο αρέσει στον εκάστοτε χρήστη κάποιο μουσικό κομμάτι Δημιουργεί μια λίστα από Ν κομμάτια για ένα συγκεκριμένο χρήστη Δημιουργεί μια λίστα από Ν χρήστες που θα τους άρεσε κάποιο συγκεκριμένο κομμάτι Τεκμηριώνει στο χρήστη γιατί προτείνει τα συγκεκριμένα κομμάτια Ενημερώνεται και να προσαρμόζει τις προτάσεις του λαμβάνοντας υπόψιν τις αλλαγές στα δεδομένα του
Συνδυαστικό φιλτράρισμα (Collaborative filtering) Με βάση το χρήστη (user-based) Με βάση το αντικείμενο (Item-based method) Φιλτράρισμα βάση του περιεχομένου (Content based filtering)
Με βάση το χρήστη Το τραγούδι «Tαδε» αρέσει σε πολλά άτομα Σε τι βαθμό θα αρέσει σε μένα; Η ιδέα είναι να δημιουργήσουμε μια λίστα από 20-50 άτομα με παρόμοιο γούστο Το πόσες φορές υπάρχει το συγκεκριμένο κομμάτι στη λίστα εκτιμά το βαθμό αρεσκείας μου Άρα ίσως να μου αρέσει διότι αρέσει και στους «φίλους» μου. Με βάση το αντικείμενο Έχω ακούσει πολλά τραγούδια Θα μου προτείνατε το «Tαδε»; Η ιδέα είναι να πάρουμε μια λίστα από 20-50 τραγούδια που έχω ακούσει και να συγκρίνουμε κατά πόσο μοιάζει με το συγκεκριμένο. Άρα θα προτείναμε να το ακούσεις διότι συνήθως ακούς παρόμοια τραγούδια
Το Last.fm (2002) είναι μια online υπηρεσία μουσικής που δημιουργεί προτάσεις τραγουδιών στον κάθε χρήστη ξεχωριστά Συλλέγει πληροφορίες σχετικές με το ποιους καλλιτέχνες, συγκροτήματα και τραγούδια ακούει ο κάθε χρήστης και πόσο συχνά, και συγκρίνει τη συμπεριφορά του με άλλους χρήστες με παρόμοιο γούστο. Έτσι θα προτείνει στο χρήστη τραγούδια τα οποία δεν έχει ξανακούσει μέσα από το σύστημα αλλά ακούγονται συχνά από άλλους χρήστες με παρόμοια ενδιαφέροντα
Tι μπορούμε να κάνουμε με αυτή τη μέθοδο; Να υπολογίσουμε την ομοιότητα ανάμεσα σε τραγούδια ή ακροατές Να ψάξουμε κομμάτια που έχουν κοινά στοιχεία (είδος, καλλιτέχνη, ρυθμό) Να ταιριάξουμε τα κατάλληλα κομμάτια στον κατάλληλο χρήστη.
Το Pandora Radio (2000) είναι μια online υπηρεσία μουσικής που δημιουργεί προτάσεις τραγουδιών στον κάθε χρήστη ξεχωριστά (όπως το Last.fm) To σύστημα αυτό συλλέγει συγκεκριμένα κομμάτια πληροφορίας (περίπου 400 attributes όπως τονικότητα, bpm, φωνητική αρμονία κα.) για κάθε τραγούδι καθώς ο χρήστης το ακούει, το βαθμολογεί ή επιλέγει το επόμενο Χρησιμοποιεί την παραπάνω πληροφορία για προτείνει στον χρήστη τραγούδια που περιέχουν κοινά στοιχεία με τα κομμάτια στα οποία έχει εκφράσει ενδιαφέρον
Η κάθε μέθοδος έχει τα δικά της πλεονεκτήματα και μειονεκτήματα. Το συνδυαστικό φιλτράρισμα (Last.fm) απαιτεί τεράστιο όγκο πληροφορίας για να είναι σε θέση να κάνει ακριβείς προτάσεις (cold start problem) To φιλτράρισμα βάση περιεχομένου (Pandora Radio) χρειάζεται ελάχιστη πληροφορία για να αρχίσει τις προτάσεις, αλλά υπάρχει περιορισμός στο εύρος τους διότι θα είναι αρκετά κοντά στο αρχικό κομμάτι
Ένα σύστημα πρότασης μουσικής θα πρέπει να είναι ικανό να: Προβλέπει το πόσο αρέσει στον εκάστοτε χρήστη κάποιο μουσικό κομμάτι Δημιουργεί μια λίστα από Ν κομμάτια για ένα συγκεκριμένο χρήστη Δημιουργεί μια λίστα από Ν χρήστες που θα τους άρεσε κάποιο συγκεκριμένο κομμάτι Τεκμηριώνει στο χρήστη γιατί προτείνει τα συγκεκριμένα κομμάτια Ενημερώνεται και να προσαρμόζει τις προτάσεις του λαμβάνοντας υπόψιν τις αλλαγές στα δεδομένα του
Πως δημιουργείται η τελική λίστα προτάσεων για κάποιο χρήστη; Εύρεση παρόμοιων χρηστών, συλλογή των κομματιών που έχει εκδηλωθεί ενδιαφέρον Φιλτράρισμα και αφαίρεση αυτών που ήδη έχει ακούσει ο χρήστης Ταξινόμηση των υπολοίπων λαμβάνοντας υπόψιν Τον αριθμό ακροάσεων από τους άλλους χρήστες Τη δημοτικότητα του κομματιού Τη βαθμολογία του Το βαθμό ομοιότητας με τα κομμάτια που ακούει συνήθως ο χρήστης
Ένα σύστημα πρότασης μουσικής θα πρέπει να είναι ικανό να: Προβλέπει το πόσο αρέσει στον εκάστοτε χρήστη κάποιο μουσικό κομμάτι Δημιουργεί μια λίστα από Ν κομμάτια για ένα συγκεκριμένο χρήστη Δημιουργεί μια λίστα από Ν χρήστες που θα τους άρεσε κάποιο συγκεκριμένο κομμάτι Τεκμηριώνει στο χρήστη γιατί προτείνει τα συγκεκριμένα κομμάτια Ενημερώνεται και να προσαρμόζει τις προτάσεις του λαμβάνοντας υπόψιν τις αλλαγές στα δεδομένα του
Οι χρήστες που άκουσαν το συγκεκριμένο κομμάτι άκουσαν επίσης... Κομμάτια του ίδιου καλλιτέχνη... Το συγκεκριμένο τραγούδι είναι hit Ακούστε κάτι από παρόμοιους καλλιτέχνες... Έχει την καλύτερη βαθμολογία... Δοκιμάστε κάτι νέο... Το τραγούδι της ημέρας... Ακούσατε πρόσφατα...
Ένα σύστημα πρότασης μουσικής θα πρέπει να είναι ικανό να: Προβλέπει το πόσο αρέσει στον εκάστοτε χρήστη κάποιο μουσικό κομμάτι Δημιουργεί μια λίστα από Ν κομμάτια για ένα συγκεκριμένο χρήστη Δημιουργεί μια λίστα από Ν χρήστες που θα τους άρεσε κάποιο συγκεκριμένο κομμάτι Τεκμηριώνει στο χρήστη γιατί προτείνει τα συγκεκριμένα κομμάτια Ενημερώνεται και να προσαρμόζει τις προτάσεις του λαμβάνοντας υπόψιν τις αλλαγές στα δεδομένα του
Τα δεδομένα τέτοιων συστημάτων ανανεώνονται, αλλάζουν και αυξάνονται συνεχώς και ταχύτατα Συνεπώς τα συστήματα προτάσεων θα πρέπει να : Να ενημερώνονται με τη νέα πληροφορία και να τη διαχειρίζονται όσο το δυνατόν γρηγορότερα ούτως ώστε οι προτάσεις να δημιουργούνται σχεδόν στιγμιαία Αν ο αλγόριθμος που χρησιμοποιείται χρειάζεται αρκετό χρόνο να επεξεργαστεί την μεταλλασσόμενη πληροφορία τότε οι προτάσεις που θα κάνει δεν θα είναι ακριβείς ή θα αναφέρονται στο παρελθόν Να είναι επεκτάσιμα και ικανά να να διαχειριστούν τον συνεχώς αυξανόμενο όγκο πληροφοριών
http://www.inf.ed.ac.uk/teaching/courses/cdi1/lectures/2014/cdisem2.pdf http://slideplayer.com/slide/2494575/# http://techtites.com/how-do-music-recommendation-services-work/ http://tidbits.com/article/13211 http://en.wikipedia.org/wiki/recommender_system http://www.slidefinder.net/r/recommender_systems_aalap_kohojkar_yang/reco mmender_systems/7613692 http://www.powershow.com/view1/df12d- ZDc1Z/Music_Recommendation_Systems_A_Progress_Report_powerpoint_ppt_ presentation http://artemisnew.cslab.ece.ntua.gr:8080/jspui/bitstream/123456789/5588/1/dt2011-0166.pdf http://notes.variogr.am/post/37675885491/how-music-recommendation-worksand-doesnt-work