ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ

Σχετικά έγγραφα
Ομαδοποίηση ΙΙ (Clustering)

Δυναμικές Δομές Δεδομένων Λίστες Δένδρα - Γράφοι

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Το μοντέλο Perceptron

Τμηματοποίηση με χρήση τυχαίων πεδίων Markov. Κοινή ιδιότητα σημείων τμήματος Εισαγωγή χωρικής πληροφορίας Εξομάλυνση πεδίου κατατάξεων

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

Μαθησιακοί Στόχοι Προγράμματος Σπουδών

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Αναγνώριση Προτύπων Ι

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναγνώριση Προτύπων Ι

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

09 Η γλώσσα UML I. Τεχνολογία Λογισμικού. Τμήμα Πληροφορικής & Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών. Εαρινό εξάμηνο

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Ευφυής Προγραμματισμός

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Αξιολόγηση ακρίβειας στη συνόρθωση δικτύων (μέρος IΙ)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΤΕΛΙΚΟ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ

ΧΡΟΝΟΣΕΙΡΕΣ. Διαχείριση Πληροφοριών

E [ -x ^2 z] = E[x z]

Εισαγωγή στην Εκτιμητική

Ασφαλή Συστήματα Μέθοδοι ελέγχου και εξακρίβωσης ορθής λειτουργίας

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Υλοποίηση Συστήματος Ανίχνευσης Εισβολών σε Περιβάλλον Android για Ασύρματα Δίκτυα Πρόσβασης

ΔΙΑΧΩΡΙΣΤΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ

Συστήματα Αναμονής. Ενότητα 1: Εισαγωγή. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

2.2.5 ΑΝΑΠΑΡΑΣΤΑΣΗ ΑΛΓΟΡΙΘΜΟΥ

09 Η γλώσσα UML II. Τεχνολογία Λογισμικού. Σχολή Hλεκτρολόγων Mηχανικών & Mηχανικών Yπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο. Χειμερινό εξάμηνο

Εισαγωγή στους Αλγορίθμους

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Φυσικής Εξέταση στο μάθημα Ανάλυση Ι & Εφαρμογές 26 Φεβρουαρίου 2015

Detecting Duplicates over Distributed Data Sources. Δημήτρης Σουραβλιάς

Τεχνικές Εξόρυξης Δεδομένων

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

Non Linear Equations (2)

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

Πληροφορική 2. Τεχνολογία Λογισμικού

Οικονομετρία Ι. Ενότητα 5: Ανάλυση της Διακύμανσης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΛΟΓΙΚΑ ΔΙΑΓΡΑΜΜΑΤΑ. Γ Λυκείου Κατεύθυνσης Mike Trimos

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Θέματα Μεταγλωττιστών

Αξιολόγηση ακρίβειας στη συνόρθωση δικτύων (μέρος IΙ)

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

Τεχνολογία Πολυμέσων. Ενότητα # 16: Πολυεκπομπή Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ημερίδα διάχυσης αποτελεσμάτων έργου Ιωάννινα, 14/10/2015

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

Τεχνολογία Πολυμέσων. Ενότητα # 15: Συγχρονισμός πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Αναζήτηση Κατά Πλάτος

Θεωρητικές Ασκήσεις. ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ. 1 ο Μέρος

Αναγνώριση Προτύπων Ι

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΦΑΛΜΑΤΩΝ

ΑΝΑΛΥΣΗ 2. Μ. Παπαδημητράκης.

Διάλεξη 3: Αλγόριθμοι σε Γράφους ΙΙ. ΕΠΛ 432: Κατανεμημένοι Αλγόριθμοι

ΜΕΘΟΔΟΣ ΠΕΠΕΡΑΣΜΕΝΩΝ ΣΤΟΙΧΕΙΩΝ

ΜΕΛΕΤΗ ΣΧΕΔΙΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΥΠΟΛΟΓΙΣΤΙΚΟ ΝΕΦΟΣ (CLOUD COMPUTING) ΜΕ ΕΜΦΑΣΗ ΣΤΗΝ ΚΑΤΑΣΚΕΥΗ ΔΕΝΤΡΩΝ.

ΕΞΟΡΥΞΗ ΔΕΔΟΜΕΝΩΝ. Εξόρυξη Δεδομένων. Ανάλυση Δεδομένων. Η διαδικασία εύρεσης κρυφών (ήκαλύτεραμηεμφανών) ιδιοτήτων από αποθηκευμένα δεδομένα,

Πληροφοριακά Συστήματα Διοίκησης

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

HY213. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ

HMY 799 1: Αναγνώριση Συστημάτων

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Γ. Πειραματισμός Βιομετρία

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα

Network Science. Θεωρεία Γραφηµάτων (2)

Παρασκευάς Τσανταρρλιώτης Τμήμα Μηχανικών Η/Υ και Πληροφορικής, Πανεπιστήμιο Ιωαννίνων

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα.

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Περιεχόμενα. Εισαγωγή του επιμελητή, Γιάννης Σταματίου 15 Πρόλογος 17 Εισαγωγή 23. Μέρος I. ΕΠΑΝΑΛΗΠΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΚΑΙ ΑΝΑΛΛΟΙΩΤΕΣ ΣΥΝΘΗΚΕΣ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

ΣΥΣΤΗΜΑΤΑ ΑΝΑΜΟΝΗΣ Queuing Systems

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι Οπισθοδρόµησης

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ & ΣΤΑΤΙΣΤΙΚΗ. Δειγματοληψία & Μετρήσεις

Κατανεμημένα Συστήματα Ι

Λογισμικό για Μαθηματικά

Transcript:

ΑΝΑΓΝΩΡΙΣΗ ΚΟΙΝΟΤΗΤΩΝ ΚΑΙ ΣΥΣΤΑΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΜΕ ΤΗΝ ΧΡΗΣΗ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Παπαδάκης Χαράλαμπος 1, Παναγιωτάκης Κώστας 2, Παρασκευή Φραγκοπούλου 1 1 Τμήμα Μηχ/κών Πληροφορικής, ΤΕΙ Κρήτης 2 Τμήμα Διοίκησης Επιχειρήσεων (Αγίου Νικολάου), ΤΕΙ Κρήτης

VIVALDI: ΔΙΚΤΥΑΚΟ ΣΥΣΤΗΜΑ ΣΥΝΘΕΤΙΚΩΝ ΣΥΝΤΕΤΑΓΜΕΝΩΝ Αρχική εφαρμογή: Αντιστοίχηση συντεταγμένων σε μηχανήματα ώστε η Ευκλείδεια απόστασή τους να αντιστοιχεί στην δικτυακή καθυστέρηση μεταξύ τους. Κάθε μηχάνημα μεταβάλλει τις συντεταγμένες του με βάση τις θέσεις ένα μικρού αριθμού άλλων μηχανημάτων Μεταβάλει περιοδικά και σταδιακά τη θέση του με στόχο την εξομοίωση της Ευκλείδειας απόστασης και της καθυστέρησης με κάθε ένα από αυτά Γραμμική πολυπλοκότητα

ΑΝΑΓΝΩΡΙΣΗ «ΚΟΙΝΟΤΗΤΩΝ» Ένα πρόβλημα με πολλές εφαρμογές Πολλά προβλήματα μπορούν να εκφραστούν με μορφή γράφων, ενός συνόλου από κόμβους συνδεδεμένων μεταξύ τους με κάποιο είδος (άμεσης) σχέσης. Ομάδες στενότερα συνδεδεμένων κόμβων μπορούν να οριστούν, ακόμα και αν δεν είναι όλοι οι κόμβοι μιας ομάδας όλοι συνδεδεμένοι μεταξύ τους. Αυτές οι ομάδες λέγονται «κοινότητες»

SCCD: ΠΡΟΤΙΝΟΜΕΝΟΣ ΑΛΓΟΡΙΘΜΟΣ Αξιοποιεί το σύστημα συνθετικών συντεταγμένων 1. Φάση 1: Συνθετικές συντεταγμένες Ορισμός απόστασης κόμβων στην ίδια κοινότητα Ορισμός απόστασης κόμβων σε διαφορετική κοινότητα Χρήση Vivaldi για την ανάθεση συντεταγμένων με βάση αυτές τις αποστάσεις 2. Φάση 2: Ιεραρχική ομαδοποίηση Τοπικός, γραμμικός αλγόριθμος ομαδοποίησης σημείων στο χώρο

ΧΡΗΣΗ VIVALDI Απόσταση (latency) μεταξύ των κόμβων 0, για τις ενδοκοινοτικούς κόμβους 100, για εξωκοινοτικών κόμβους Κάθε κόμβος διατηρεί δύο σύνολα γειτόνων Τοπικό σύνολο: ένα σύνολο ενδοκοινοτικών κόμβων Ξένο σύνολο: ένα σύνολο εξωκοινοτικών κόμβων Προφανώς, δεν υπάρχει a-priori γνώση των κοινοτήτων των κόμβων, προκειμένου να κατασκευαστούν τα σύνολα Το τοπικό σύνολο προσεγγίζεται από το σύνολο των γειτόνων του κάθε κόμβου στο γράφο. Εξ ορισμού, η πλειοψηφία των κόμβων είναι ενδοκοινοτικοί κόμβοι. Το ξένο σύνολο προσεγγίζεται από έναν πεπερασμένο αριθμό τυχαίων κόμβων του γράφου. Στατιστικά η πλειοψηφία τους θα είναι εξωκοινοτικοί κόμβοι.

ΙΕΡΑΡΧΙΚΗ ΟΜΑΔΟΠΟΙΗΣΗ Κάθε κόμβος αποτελεί αρχικά τη δική του ομάδα. Οι ακμές διατηρούνται μεταξύ ομάδων όπως και τη τελική θέση κάθε κόμβου. Εάν οι ομάδες Χ και Υ αποτελούν τον κοντινότερο γείτονα για την κάθε μια, συγχωνεύονται σε μια ομάδα με την ένωση των κόμβων που τις αποτελούν. Η θέση της νέας ομάδας είναι ο σταθμισμένος μέσος όρος των δύο θέσεων, με βάση τους πληθυσμούς των δύο αρχικών ομάδων. Η διαδικασία επαναλαμβάνεται εώς ότου να μην υπάρχουν δύο ομάδες που να μπορούν να συγχωνευτούν.

ΑΠΛΟ ΠΑΡΑΔΕΙΓΜΑ Κόμβοι που ανήκουν στην ίδια κοινότητα συγκλίνουν στον ίδια περιοχή στον χώρο.

ΠΕΙΡΑΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ - ΑΚΡΙΒΕΙΑ Συνολικα: SCCD > Blondel κατά 4% ακρίβεια κατά μέσο όρο

ΠΕΙΡΑΜΑΤΑ ΠΡΑΓΜΑΤΙΚΩΝ ΓΡΑΦΩΝ Μετρικες: Modularity, Convergance, Coverage

ΕΦΑΡΜΟΓΕΣ ΣΕ ΠΟΛΥΜΕΣΑ: ΤΜΗΜΑΤΟΠΟΙΗΣΗ ΕΙΚΟΝΑΣ Αρχική εικόνα Ο χρήστης δίνει αρχικές περιοχές στα 2 αντικείμενα με κύκλους Τμηματοποίηση σε μικρές περιοχές Ομαδοποίηση μικρών περιοχών με χρήση Vivaldi Τελική τμηματοποίηση εικόνας [1] C. Panagiotakis, H. Papadakis, E. Grinias, N. Komodakis, P. Fragopoulou and G. Tziritas, Interactive Image Segmentation Based on Synthetic Graph Coordinates, Pattern Recognition, vol. 46, no. 11, pp. 2940-2952, Nov. 2013. 10

ΚΑΤΑΝΕΜΗΜΕΝΗ ΑΝΙΧΝΕΥΣΗ ΚΟΙΝΟΤΗΤΩΝ ΜΕ ΧΡΗΣΗ ΡΟΩΝ Τοπική μέθοδος κατάλληλη για εφαρμογή σε μεγάλου μεγέθους κοινωνικά δίκτυα όπως το facebook, twitter Μπορεί να χρησιμοποιηθεί για τον εντοπισμό φίλων μέσω κοινών γνωστών και την αναπαράσταση τους με σπείρα [1] C. Panagiotakis, H. Papadakis, and P. Fragopoulou, Local Community Detection via Flow Propagation, International conference on Advances in Social Network Analysis and Mining (ASONAM), 2015.

ΣΥΣΤΗΜΑΤΑ ΣΥΣΤΑΣΕΩΝ (RECOMMENDATION SYSTEMS) Συστήματα για τη σύσταση αντικειμένων (π.χ. βιβλία, ταινίες, CD, ιστοσελίδες, μηνύματα ομάδων συζήτησης) για χρήστες με βάση τα παραδείγματα των προτιμήσεών τους. Κυρίως χρησιμοποιούνται για σελίδες ηλεκτρονικού εμπορίου για να διευκολυνθεί η αναζήτηση προϊόντων. Με την κατάλληλη διαμόρφωση του προβλήματος, θα μπορούσε να χρησιμοποιηθεί σε ένα ευρύτερο πεδίο εφαρμογών. Για παράδειγμα εικασία/προβλέψη αγνώστων σχέσεων μεταξύ των δύο συνόλων διαφορετικών τύπων οντοτήτων Τα συστήματα συστάσεων αποτελούν είδος λογισμικού εξατομίκευσης (personalization software). Συμπεριλαμβάνουν: Συστάσεις Φιλτράρισμα Προβλέψεις

ΔΙΑΤΥΠΩΣΗ ΠΡΟΒΛΗΜΑΤΟΣ Η είσοδος του αλγόριθμου είναι μια λίστα L από τριάδες της μορφής (u, I, r), όπου: 1. u ϵ στο σύνολο U = {1, 2,,N} από μοναδικά αναγνωριστικά για τους χρήστες που έχουν βαθμολογήσει αντικείμενα. 2. i ϵ στο σύνολο I = {1, 2,,M} από μοναδικά αναγνωριστικά για τα αντικείμενα που έχουν βαθμολογηθεί από τους χρήστες. 3. r ϵ R και αντιστοιχεί στην βαθμολογία του χρήστη u για το αντικείμενο i. Στόχος: ο υπολογισμός μιας νέας τιμής r (u, i) για κάθε u, I ζευγάρι του L, έτσι ώστε οι τιμές r να είναι το κατά δυνατόν ίσες με τις αντίστοιχες τιμές τους στο L. Η ακρίβεια του υπολογισμού γίνεται με την χρήση της μετρικής του Μέσου Ριζικού Τετραγωνικού Σφάλματος (Root Mean Square Error Metric):

SCOR Χρήστες και Αντικείμενα τοποθετούνται τυχαία σε ένα 20- διάστατο χώρο. Επαναληπτικά, κάθε κόμβος (χρήστης ή αντικείμενο) τροποποιεί ελαφρώς τη θέση του, ώστε η Ευκλείδεια απόσταση του για να ταιριάζει με μια βαθμολογία που σχετίζεται με αυτό το αντικείμενο. Για παράδειγμα, ένας κόμβος χρήστης τροποποιεί ελαφρώς τη θέση του για να ταιριάζει με την βαθμολογία ενός από τα αντικείμενα που έχει βαθμολογήσει. Την επόμενη επανάληψη, η απόσταση ελέγχεται με βάση (τυχαία) κάποιο άλλο στοιχείο που ο χρήστης έχει βαθμολογήσει. Μετά τη σύγκλιση, η ευκλείδεια απόσταση μεταξύ κάθε χρήστη και ενός αντικειμένου που έχει βαθμολογήσει, θα πρέπει να ταιριάζει με την βαθμολογία που έχει βάλει. Ομοίως, η απόσταση ενός χρήστη με ένα αντικείμενο που δεν έχει βαθμολογήσει θα πρέπει να παρέχει μια πρόβλεψη προτίμησης του χρήστη σε αυτό.

ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ 4 πραγματικά σύνολα δεδομένων 7 state-of-the-art αλγόριθμοι συγκρίθηκαν με τον SCoR. ALS ALS COORD BIASSGD BIASSGD2 RBM SGD SVDPP

ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ Για κάθε σύνολο δεδομένων, 10% των βαθμολογιών χρησιμοποιήθηκαν για επιβεβαίωση. Αποτελέσματα RMSE σε όλα τα σύνολα δεδομένων (τα καλύτερα αποτελέσματα σε κάθε σύνολο δεδομένων εμφανίζεται εντονότερα)

ΤΕΛΙΚΗ ΚΑΤΑΤΑΞΗ ΤΩΝ ΠΕΙΡΑΜΑΤΙΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Κάθε αλγόριθμος κατατάσσεται, για κάθε σύνολο δεδομένων, με βάση την αποτελεσματικότητά του, από 1 ως 8 (το 1 αντιστοιχεί στον αλγόριθμο με την καλύτερη αποτελεσματικότητα στο συγκεκριμένο σύνολο δεδομένων) Συνολική κατάταξη των αλγορίθμων σε όλα τα σύνολα δεδομένων.