Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Σχετικά έγγραφα
Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Στοχαστικές Στρατηγικές. διαδρομής (1)

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Η κεντρικότητα στην χωροθέτηση επιχειρήσεων σε οδικό δικτυο

Μέτρα σε δίκτυα-ιδιότητες και εφαρμογές

Αριθμητική Ανάλυση 4.5 Ιδιοτιμές και ιδιοδιανύσματα πινάκων. Γ. Παπαευαγγέλου, ΕΔΙΠ, ΤΑΤΜ/ΑΠΘ

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Δοµές Δεδοµένων & Ανάλυση Αλγορίθµων 3ο Εξάµηνο. Γραφήµατα. (Graphs)

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

Network Science. Θεωρεία Γραφηµάτων (2)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Εισαγωγή στην επιστήμη των υπολογιστών. Οργάνωση εδομένων Κεφάλαιο 11ο ομές εδομένων

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Σήματα και Συστήματα. Διάλεξη 6: Ανάλυση Σημάτων σε Ανάπτυγμα Σειράς Fourier. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Κατευθυνόµενα γραφήµατα. Στοιχεία Θεωρίας Γραφηµάτων (1) Πολυγραφήµατα (Multigraphs)

[1] είναι ταυτοτικά ίση με το μηδέν. Στην περίπτωση που το στήριγμα μιας συνάρτησης ελέγχου φ ( x)

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

Στοιχεία Θεωρίας Γραφηµάτων (3)

Απαρίθµηση Μονοπατιών. Στοιχεία Θεωρίας Γραφηµάτων (3) Μονοπάτια και Κυκλώµατα Euler. Ορέστης Τελέλης

Σειρά Προβλημάτων 5 Λύσεις

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Στοιχεία Θεωρίας Γραφηµάτων (1)

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων.

Στοχαστικές Στρατηγικές

Κατανεμημένα Συστήματα Ι

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

Ανάκτηση Πληροφορίας

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

HY118- ιακριτά Μαθηµατικά. Θεωρία γράφων / γραφήµατα. Τι είναι οι γράφοι; Εφαρµογές των γράφων Γράφοι

Βάσεις ιαδικτύου. Θέματα. Εισαγωγή στην XML. Ευρετήρια για την Ανάκτηση Κειμένων. Ο αλγόριθμος HITS. είναι η XML. Παράδειγμα XML

Σπιν 1 2. Γενικά. Ŝ και S ˆz γράφονται. ιδιοκαταστάσεις αποτελούν ορθοκανονική βάση στον χώρο των καταστάσεων του σπιν 1 2.

HY118-Διακριτά Μαθηματικά

Κατανεμημένα Συστήματα Ι

Μη κατευθυνόµενα γραφήµατα. Στοιχεία Θεωρίας Γραφηµάτων (1) Υπογραφήµατα.

Matrix Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι. Αλγόριθμοι» Γ. Καούρη Β. Μήτσου

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μιγαδικός λογισμός και ολοκληρωτικοί Μετασχηματισμοί

3η Σειρά Γραπτών Ασκήσεων

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

ΔΙΑΣΧΙΣΗ ΓΡΑΦΗΜΑΤΩΝ 1

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

Υπολογιστικό Πρόβληµα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

Εισαγωγή ενός νέου στοιχείου. Επιλογή i-οστoύ στοιχείου : Εύρεση στοιχείου με το i-οστό μικρότερο κλειδί

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Λυσεις προβλημάτων τελικής φάσης Παγκύπριου Μαθητικού Διαγωνισμού Πληροφορικής 2007

Σύνοψη Προηγούμενου. Πίνακες (Arrays) Πίνακες (Arrays): Βασικές Λειτουργίες. Πίνακες (Arrays) Ορέστης Τελέλης

Ενδεικτικές Λύσεις 1ου Σετ Ασκήσεων

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας

Ταξινόμηση. 1. Ταξινόμηση με Εισαγωγή 2. Ταξινόμηση με Επιλογή. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση

HY118- ιακριτά Μαθηµατικά. Θεωρία γράφων / γραφήµατα. Τι είναι οι γράφοι; Εφαρµογές των γράφων Γράφοι

Κεφάλαιο 4ο: Δικτυωτή Ανάλυση

ΜΥΕ003: Ανάκτηση Πληροφορίας. Διδάσκουσα: Ευαγγελία Πιτουρά Κεφάλαιο 21: Ανάλυση Συνδέσμων.

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 2: Μαθηματικό Υπόβαθρο

9. Συστολικές Συστοιχίες Επεξεργαστών

Δομές Δεδομένων και Αλγόριθμοι

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

a n = 3 n a n+1 = 3 a n, a 0 = 1

Κατανεμημένα Συστήματα Ι

Αναζήτηση. 1. Σειριακή αναζήτηση 2. Δυαδική Αναζήτηση. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

Λυμένες ασκήσεις στροφορμής

Εξίσωση 1 η 1 ο μέλος 2 ο μέλος

ΑΝΑΛΥΣΗ 2. Μ. Παπαδημητράκης.

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

μαγνητικό πεδίο τυχαίας κατεύθυνσης

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

ΑΝΑΛΥΣΗ 1 ΔΩΔΕΚΑΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Matrix Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Γ. Καούρη Β. Μήτσου

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

Εφαρμοσμένα Μαθηματικά ΙΙ Τελική Εξέταση Ι. Λυχναρόπουλος

f e Γράφημα (Graph) Δηµοσθένης Σταµάτης Τµήµα Πληροφορικής ΑΤΕΙ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τμήμα Μηχανικών Πληροφορικής ΤΕ Πρόβλημα Μεταφοράς. Γεωργία Φουτσιτζή ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα

HY Λογική Διδάσκων: Δ. Πλεξουσάκης Εαρινό Εξάμηνο. Φροντιστήριο 6

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

1. Σε ένα τουρνουά με 8 παίκτες μπορεί οι παίκτες να συμμετείχαν σε: 6,5,4,4,4,3,1,1 αγώνες αντίστοιχα;

Διαγωνοποίηση μητρών. Στοιχεία Γραμμικής Άλγεβρας

Transcript:

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr

Δομή του WWW

Ορισμός Προβλήματος Υποθέτουμε ότι οι πηγές πληροφοριών αναπριστώνται ως κόμβοι σε έναν κατευθυνόμενο γράφο. Οι σύνδεσμοι αναπαριστούν τις παραπομπές (links) μεταξύ των διαφόρων πηγών πληροφορίας. Ο χρήστης αναζητά πηγές πληροφοριών με βάση ένα σύνολο από λέξεεις-κλειδιά και ο αλγόριθμος επιστρέφει ένα σύνολο κόμβων σχετικών με τις λέξεις-κλειδιά που όρισε ο χρήστης. Αρχικά ως μετρο της σχετικότητας χρησιμοποιήθηκαν διάφορες παραλλαγές της συνολικής συχνότητας με την οποία εμφανίζοντας οι συγκεκριμένες λέξεις σε κάθε κόμβο. Το κύριο μειονέκτημα της συγκεκριμένης προσέγγισης ήταν ότι ενώ λαμβάνει υπόψη της την εσωτερική δομή του κάθε κόμβου αγνοεί τις παραπομπές που περιέχει σε άλλους κόμβους και δεν έχει κάποιο τρόπο να αξιολογήσει την ποιότητα της πληροφορίας που περιέχει ο συγκεκριμένος κόμβος.

Προγενέστερες Μεθοδολογίες Αρχικά ως μετρο της σχετικότητας χρησιμοποιήθηκαν διάφορες παραλλαγές της συνολικής συχνότητας με την οποία εμφανίζοντας οι συγκεκριμένες λέξεις σε κάθε κόμβο. Το κύριο μειονέκτημα της συγκεκριμένης προσέγγισης ήταν ότι ενώ λαμβάνει υπόψη της την εσωτερική δομή του κάθε κόμβου αγνοεί τις παραπομπές που περιέχει σε άλλους κόμβους και δεν έχει κάποιο τρόπο να αξιολογήσει την ποιότητα της πληροφορίας που περιέχει ο συγκεκριμένος κόμβος.

Σύγχρονες Μεθοδολογίες Ανάλυση της δομής του δικτύου στο οποίο ανήκουν οι πηγές πληροφορίας και εκτίμηση της σπουδαιότητας κάθε κόμβου. Δύο είδη κόμβων: Αυθεντίες (Authorities) Κόμβοι που διαθέτοιυν μεγάλο βαθμό αναγνώρισης από άλλους κόμβους Κέντρα Πληροφόρησης (Hubs) Κόμβοι που περιέχουν συνδέσμους σε άλλους κόμβους και αναγνωρίζονται ως χρήσιμα κέντρα συγκέντρωσης πληροφοριών

Εκτίμηση Σχετικότητας- Link- Based Ranking Αν ή αναζήτηση αφορά μουσεία ποιοί από τους κόμβους στα δεξιά είναι πιο σχετικοί; Κάθε κόμβος έχει δύο βαθμούς: Auth, Hub

PageRank Ο υπολογισμός της σπουδαιότητας κάθε κόμβου στηρίζεται στον υπολογισμό του έσω- και έξω- βαθμού κάθε κόμβου. Kάθε κόμβος διαμοιράζει την σπουδαιότητα του ισομερώς σε όλες τις συνδέσεις που αρχίζουν από αυτόν και δέχεται σπουδαιότητα από τους κόμβους από στους οποίους καταλήγουν συνδέσεις σε αυτόν. Ουσιαστικά η σπουδαιότητα εκτιμά την πιθανότητα επίσκεψης ενός κόμβου κατά την εκτέλεση ενός περιπάτου στο γράφο κατά τον οποίο αρχίζοντας από ένα τυχαίο κόμβο Α ακολουθούμε τυχαία κάποια από τις ακμές που αρχίζουν από τον Α και επαναλαμβάνουμε τη διαδικασία στο νέο κόμβο...

Βήματα Η αρχική τιμή σπουδιαότητας για κάθε κόμβο στο γράφο είναι 1/n, όπου n το πλήθος των κόμβων. Επιλέγουμε ένα αριθμό επναλήψεων k και έναν κόμβο αναφοράς Α. Για καθεμία από τις k επαναλήψεις κάθε κόμβος επαναυπολογίζει τη σπουδαιότητα του με βάση τη σπουδαιότητα που εισρέει και εκρέει από αυτόν και τη σπουδαιότητα που διαθέτει κάθε στιγμή.

Παράδειγμα

Χαρακτηριστικά Αποδεικνύεται ότι εκτός από ορισμένες ειδικές περιπτώσεις οι τιμές σπουδαιότητας για κάθε κόμβο συγκλίνουν σε οριακές τιμές όσο ο αριθμός των επαναλήψεων k τείνει στο άπειρο. Στην περίπτωση πλήρως συνδεδεμένων κατευθυνόμεννων γράφων αποδεικνύεται ότι υπάρχει ένα μοναδικό τέτοιο σύνολο τιμών.

Προβλήματα Κόμβοι οι οποίοι έχουν έσω-βαθμό μεγαλύτερο της μονάδας αλλά μηδενικό έξω βαθμό. Μη πλήρως συνδεδεμένος γράφος

Επίλυση Προβλημάτων Μετά την εφαρμογή του κανόνα επαναυπολογισμού που περιγράψαμε σε όλους τους κόμβους αντιστοίχισε τις τιμές σπουδιαότητας όλων των κόμβων που προκύπτουν σε μια κλίμακα από 0 έως s όπου s μια σταθερά 0<s<1. Επομένως η συνολική σπουδιαότητα των κόμβων τώρα θα μειωθεί από 1 σε s. Διαμοίρασε την υπόλοιπη σπουδαιότητα (1-s) ισομερώς σε όλους τους κόμβους. Ο συγκεκριμένος κανόνας ουσιαστικά μετατρέπει τον γράφο σε πλήρως συνδεδεμένο καθώς ο διαμοιρασμός της υπόλοιπης σπουδιαότηττας είναι ισοδύναμος με τη σύνδεση κάθε κόμβου με όλους τους άλλους στο δίκτυο.

Επεκτάσεις Ενσωμάτωση γεωγραφικών, χρονικών και προσωποποιημένων πληροφοριών Αναπαράσταση μη κειμενικών πηγών πληροφορίας Αντιμετώπιση κρουσμάτων αποπροσανατολισμού των μεθόδων αναζήτησης

Eigenvector Centrality Η μέθοδος PageRank αξιοποιεί την ιδεά της eigenvextor centrality στην περίπτωση του WWW. Σε μια κοινωνία δεν είναι τόσο σημαντική η ποσότητα όσο η ποιότητα των γνωριμιών σου. Επομένως θεωρούμε ότι η κεντρικότητα ενός κόμβου είναι ανάλογη του αθροίσματος της κεντρικότητας καθενός από τους γείτονες του. Μια τέτοια σχέση είναι αυτοαναφορική. Αν αναπαραστήουμε ως V το διάνυσμα που περιέχει την κεντρικότητα κάθε κόμβου ενός δικτύο τότε η κεντρικότητα Vi του i-στου κόμβου του δικτύου εκφράζεται ώς: V i = k*σ(adj ij *V j ) όπου k ένας συντελεστής αναλογίας και Adj είναι ο πίνακας γειτνίασης για το δίκτυο. Άρα το διάνυσμα V αποτελεί ένα ιδιοδιάνυσμα του πίνακα Adj. Αν τα κελιά του Adj lπεριέχουν θετικές τιμές τότε επιλέγουμε να αντιστοιχίσουμε το V με την κανονικοποιημένη μορφή του μεγαλύτερου από όλα τα ιδιοδιανύσματα του Adj

Katz-Bonacich Centrality