Μειέηε εθαξκνγώλ κεζόδωλ εμόξπμεο γλώζεο ζε θνηλωληθά δίθηπα Χριςτακοποφλου Ευαγγελία Επιβλέποντες καθηγητές: Αβοφρησ Νικόλαοσ Δαςκαλάκη Σοφία
Οξγάλωζε Παξνπζίαζεο Στόχοσ τησ διπλωματικήσ εργαςίασ Εξόρυξη των datasets Ομοφιλία Link prediction/ recommendation Web application Συμπεράςματα & καινοτομία 2
Σηόρνο Διερεφνηςη ομοφιλίασ ςε Facebook & Twitter Καταςκευή application για homophilybased recommendations 3
Εμόξπμε Facebook dataset- Urls Ego Χωρίσ Ego 4
Εμόξπμε Facebook dataset- Hobbies Hobbies: 10320 Clusters: 112 5
Εμόξπμε Twitter dataset- Twitterers 1o dataset 2o dataset 6
Εμόξπμε Twitter dataset- Tweets Tweets (89825) Tweets πνπ πεξηιακβάλνπλ ηνπιάρηζηνλ 1 hashtag (11624) Τα tweets εμνξύρζεθαλ ην δηάζηεκα Μάηνο- Ινύληνο 2011. Τν παιαηόηεξν tweet ρξνλνινγείηαη ζηηο 7 10/1/2007, ελώ ην λεόηεξν ζηηο 23/06/2011.
Εμόξπμε Twitter dataset- Following relationships Τν δηπιαλό γξάθεκα απεηθνλίδεη ηηο following ζρέζεηο κεηαμύ ηωλ twitterers, όπωο απηέο ήηαλ δηακνξθωκέλεο ζηελ 11/06/2011. 8
Εμόξπμε Twitter dataset- Power law α=2.2 & xmin=614 9
Πηζαλνηηθό κνληέιν Οκνθηιίαο Περίπτωςη 2 ομάδων Εάν το κλάςμα των cross-gender ακμϊν είναι ςημαντικά μικρότερο του 2pq, τότε υπάρχει ζνδειξη για ομοφιλία. Περίπτωςη ν ομάδων Ομοφιλία δικτφου: Εάν το ποςοςτό των ακμϊν μεταξφ μελϊν διαφορετικϊν ομάδων είναι μικρότερο από τότε υπάρχει ζνδειξη για ομοφιλία. Ομοφιλία στην ίδια ομάδα: Αν το ποςοςτό των ακμϊν μεταξφ των μελϊν τησ i ομάδασ είναι ςημαντικά μεγαλφτερο του ςυγκεκριμζνη ομάδα., τότε υπάρχει ομοφιλία ςτη 10
Οκνθηιία ζην Facebook G2 : Flatmates, G3 : Επηπρηζκέλνη Χαηδεγηάλλεο, καδί, 50-50, Είζαη Michael Jackson ην ηαίξη κνπ G1 : How I met your mother, Gossip Girl, The Big Bang Theory 11
G4 : #greekrevolution, #aganaktismenoi, #syntagma, #m25gr Οκνθηιία ζην Twitter G1: #aws, #sna, G2 : #Jelena, #skype, #microsoft #LoveYouBieber 12
Recommendation- Μέζνδνη Οκνηόηεηαο Common Neighbors Vector Space Model 13
Recommendation-Αιγόξηζκνο ειέγρνπ πνηόηεηαο 14
Recommendation ζην Facebook Common Neighbors Vector Space Model Θεωροφμε τον facebook user ςαν το ςφνολο από τα hobbies του. 15
Recommendation ζην Twitter Common Neighbors Vector Space Model Θεωροφμε τον twitterer ςαν ζνα ςφνολο από hashtags που ζχει χρηςιμοποιήςει ςτα tweets του. 16
Web Application - Facebook 17
Web Application - Twitter 18
Empirical Evaluation Είςαι φίλοσ με τον X που είναι φίλοσ του Y. Θζλεισ να γίνεισ φίλοσ του Y? Ζχεισ πολλά κοινά hobbies/hashtags με τον Z. Θζλεισ να γίνεισ φίλοσ του Z? Facebook www.facebook.com/pages/browser.php Μεγαλφτερη ομοιότητα με χρήςτεσ με πολλά hobbies Προςπζλαςη ςυγκεκριμζνου url & όχι αυτόματα recommendations Δεν προτείνει καινοφριουσ φίλουσ, αλλά δείχνει ομοφιλία με τουσ ήδη υπάρχοντεσ. Twitter twitter.com/#!/who_to_follow/interests Υπερβολικά γενικζσ κατηγορίεσ Δε λαμβάνει υπόψη τα ενδιαφζροντα των twitterers βάςει των hashtags & τησ περιγραφήσ Προςπζλαςη ςυγκεκριμζνου url & όχι αυτόματα recommendations Στο search, να επιςτρζφονται και παρόμοια hashtags, πζρα από τα live tweets. 19
Σπκπεξάζκαηα Οκνθηιία ππάξρεη θαη ζην Facebook & ζην Twitter Τα νιηγνκειή clusters δε ραξαθηεξίδνληαη από νκνθηιία Σην Facebook, ε νκνθηιία είλαη ιίγν πην έληνλε απ' όηη ζην Twitter! Οη following ζρέζεηο ζην Twitter αθνινπζνύλ θαηαλνκή power law κε α=2.2 θαη xmin=614 Τν adapted vector space model δνπιεύεη πνιύ ηθαλνπνηεηηθά. 20
Μειινληηθέο θαηεπζύλζεηο Χρήςη και άλλων μεθόδων recommendation επιςτροφή ατόμων από το ίδιο cluster επιςτροφή ατόμων όμοιων με τουσ ήδη υπάρχοντεσ φίλουσ του χρήςτη. Δημιουργία clusters και με kmetis. Αξιοποίηςη του 1 ο dataset του Facebook που εξορφχθηκε. Διεφρυνςη του αριθμοφ των ατόμων από τουσ οποίουσ λαμβάνουμε τα tweets. Προςθήκη επιπλζον βίντεο ςτη ςελίδα video. 21
Σαο επραξηζηώ πνιύ! 22