Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Σχετικά έγγραφα
Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ενηµέρωση του διανύσµατος PageRank. Η εξέλιξη του Web

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

2. dim(p ) = n rank(a = )

x y z d e f g h k = 0 a b c d e f g h k

Θεώρημα της αντιστροφής

n = dim N (A) + dim R(A). dim V = dim ker L + dim im L.

1 Arq thc Majhmatik c Epagwg c

Σημειώσεις Μαθηματικών 1

1.3 ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ ΑΡΙΘΜΟΥ ΜΕ ΔΙΑΝΥΣΜΑ

ΜΕΜ251 Αριθμητική Ανάλυση

rec(p ) rec(p ) = {y Ay = 0}. lin(p ) := rec(p ) rec(p ) = {y Ay = 0}. Ax b = α T i x = b i. P = {x R n Ax b} { x R n α T i x = b i 11-1 α T i x b i

u v 4 w G 2 G 1 u v w x y z 4

από t 1 (x) = A 1 x A 1 b.

Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων

x 3 = 0 x 6 = 0 x 4 = 0 x 5 = 0 x 2 = 0 x 1 = 0 aff(p )

Αγγύλες Poisson. Ας θεωρήσουμε κάποια συνάρτηση των κανονικών μεταβλητών. Οι

e 2 S F = [V (H), V (H)]. 3-1 e 1 e 3

Ερωτήσεις θεωρίας για τα Μαθηματικά Γ γυμνασίου. Άλγεβρα...

1.4 ΣΥΝΤΕΤΑΓΜΕΝΕΣ ΣΤΟ ΕΠΙΠΕΔΟ

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

1.2 Συντεταγμένες στο Επίπεδο

ΑΝΑΛΥΣΗ 1 ΠΕΜΠΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Αριθμητική Ανάλυση και Εφαρμογές

(a) = lim. f y (a, b) = lim. (b) = lim. f y (x, y) = lim. g g(a + h) g(a) h g(b + h) g(b)

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων 1ο Σετ Ασκήσεων - Λύσεις

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ. ΕΝΟΤΗΤΑ: Άλγεβρα των Πινάκων (1) ΔΙΔΑΣΚΩΝ: Βλάμος Παναγιώτης ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

, ο αριθμός στον οποίο αντιστοιχεί ο 2 καλείται δεύτερος όρος της ακολουθίας και τον συμβολίζουμε συνήθως με

Ανασκόπηση-Μάθημα 17 Κανόνας αλυσίδας - Παράγωγος κατά κατεύθυνση

ΕΝΟΤΗΤΑ 1: ΟΡΙΣΜΟΣ ΠΕΔΙΟ ΟΡΙΣΜΟΥ ΠΡΑΞΕΙΣ ΣΥΝΑΡΤΗΣΕΩΝ ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΛΥΜΕΝΑ ΘΕΜΑΤΑ ΘΕΜΑ Α

Φυλλάδιο 1 - Σημεία Προσοχής στις Παραγράφους 1.1, 1.2 και 1.3

d(v) = 3 S. q(g \ S) S

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Κεφάλαιο 4ο: Δικτυωτή Ανάλυση

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Ανάκτηση Πληροφορίας

Εξίσωση γραμμικού αρμονικού κύματος

ΘΕΜΑ 1 ο (3.5 μονάδες) V CC R C1 R C2. R s. v o v s R L. v i I 1 I 2 ΛΥΣΗ R 10 10

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 8: Ανάλυση ευστάθειας & Συναγωγή και διάχυση

Διάλεξη 3: Σχήμα 3.3: Το σύνολο των κόκκινων ακμών είναι ακμοδιαχωριστής αλλά όχι τομή. Το σύνολο ακμών {1, 2, 3} είναι τομή. Από

ΠΛΗ 12 - Ιδιοτιμές και ιδιοδιανύσματα

Γραμμική Αλγεβρα ΙΙ Διάλεξη 7 Βάσεις Διάσταση Χρήστος Κουρουνιώτης Πανεπισ τήμιο Κρήτης 7/3/2014 Χ.Κουρουνιώτης (Παν.Κρήτης) Διάλεξη 7 7/3/ / 1

8. Σύνθεση και ανάλυση δυνάμεων

Β ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ. Ημερομηνία: Τρίτη 27 Δεκεμβρίου 2016 Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ

Ανάλυση Ηλεκτρικών Κυκλωμάτων

ΜΕΜ251 Αριθμητική Ανάλυση

4. 1 Η ΣΥΝΑΡΤΗΣΗ Y=AX 2 ME A 0

S A : N G (S) N G (S) + d S d + d = S

Ανάλυση Ηλεκτρικών Κυκλωμάτων

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

Συνδυασμοί αντιστάσεων και πηγών

Τετραγωνικά μοντέλα. Τετραγωνικό μοντέλο συνάρτησης. Παράδειγμα τετραγωνικού μοντέλου #1. Παράδειγμα τετραγωνικού μοντέλου #1

0 + a = a + 0 = a, a k, a + ( a) = ( a) + a = 0, 1 a = a 1 = a, a k, a a 1 = a 1 a = 1,

ΠΑΝΑΓΟΠΟΥΛΟΣ ΑΝΤΩΝΗΣ ΜΑΘΗΜΑΤΙΚΟΣ Β ΛΥΚΕΙΟΥ ΓΕΩΜΕΤΡΙΑ Σελίδα 1

ΕΝΝΟΙΑ ΤΟΥ ΜΙΓΑΔΙΚΟΥ ΑΡΙΘΜΟΥ ΠΡΑΞΕΙΣ ΣΤΟ ΣΥΝΟΛΟ ΤΩΝ ΜΙΓΑΔΙΚΩΝ

Τμήμα Μηχανικών Οικονομίας και Διοίκησης Εφαρμοσμένη Θεωρία Πινάκων. Quiz 3. Σύντομες Λύσεις

ΤΡΙΦΑΣΙΚΑ ΚΥΚΛΩΜΑΤΑ ΕΝΑΛΛΑΣΣΟΜΕΝΟΥ ΡΕΥΜΑΤΟΣ

Τετραγωνικά μοντέλα. Τετραγωνικό μοντέλο συνάρτησης. Παράδειγμα τετραγωνικού μοντέλου #1. Παράδειγμα τετραγωνικού μοντέλου #1

Κεφάλαιο 2: Διανυσματικός λογισμός συστήματα αναφοράς

ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ. Ημερομηνία: Πέμπτη 12 Απριλίου 2018 Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ

ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΚΙΝΗΣΗΣ ΤΩΝ ΣΩΜΑΤΩΝ ΣΕ ΜΙΑ ΔΙΑΣΤΑΣΗ. υ = σταθερη (1) - Με διάγραμμα :

1.3 ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ ΑΡΙΘΜΟΥ ΜΕ ΔΙΑΝΥΣΜΑ

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

1 ο Διαγώνισμα περιόδου στις Συναρτήσεις και τα Όρια

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ζητήµατα Μεγάλης-Κλίµακας Υλοποίησης του PageRank. Αρχιτεκτονική Μηχανής Αναζήτησης

ΤΑ ΔΕΚΑΔΙΚΑ ΚΛΑΣΜΑΤΑ ΚΑΙ ΟΙ ΔΕΚΑΔΙΚΟΙ ΑΡΙΘΜΟΙ

a ) a ) = lim f( a + h u ) f( a ) = lim (2) h = 0 f( a + h u ) f( a ) hdf( a )( u ) lim = 0 lim u ) f( a + h lim = 0 u ) = 0 lim = Df( a )( u ) lim

ΘΕΩΡΙΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

5. 1 ΣΥΝΟΛΑ. Η έννοια του συνόλου

ΚΕΦΑΛΑΙΟ 4 Ο ΣΤΟΙΧΕΙΑ ΟΛΟΚΛΗΡΩΤΙΚΟΥ ΛΟΓΙΣΜΟΥ

Παράδειγμα 14.2 Να βρεθεί ο μετασχηματισμός Laplace των συναρτήσεων

7.7 Ασκήσεις σχολικού βιβλίου σελίδας 156

2 Η ΠΡΟΟΔΟΣ. Ενδεικτικές λύσεις κάποιων προβλημάτων. Τα νούμερα στις ασκήσεις είναι ΤΥΧΑΙΑ και ΟΧΙ αυτά της εξέταση

Διάλεξη 7: X Y Σχήμα 7.2: Παράδειγμα για το Πόρισμα 7.2, όπου: 1 = {1, 2, 5}, 2 = {1, 2, 3}, 3 = {4}, 4 = {1, 3, 4}. Θ

Μέθοδος Ελαχίστων Τετραγώνων (για την προσαρμογή (ή λείανση) δεδομένων/μετρήσεων)

9 Πολυώνυμα Διαίρεση πολυωνύμων

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

ΚΕΦ.6:ΤΕΤΡΑΓΩΝΙΚΕΣ ΜΟΡΦΕΣ. ΣΥΜΜΕΤΡΙΚΟΙ ΠΙΝΑΚΕΣ

Στοχαστικές Στρατηγικές. διαδρομής (1)

ΔΙΑΝΥΣΜΑΤΙΚΕΣ ΣΥΝΑΡΤΗΣΕΙΣ

Παρατήρηση. 1. Το άθροισμα των διανυσμάτων και είναι ανεξάρτητο από το σημείο. 2. Το άθροισμα των διανυσμάτων και μπορεί να βρεθεί να βρεθεί και με

Ο αλγόριθμος PageRank της Google

Να υπολογίζουμε τους τριγωνομετρικούς αριθμούς οξείας γωνίας. Τη γωνία σε κανονική θέση και τους τριγωνομετρικούς αριθμούς γωνίας σε κανονική θέση.

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

2 Ο ΚΕΦΑΛΑΙΟ Ενότητα 5.

Κεφάλαιο 5 Γραμμικοί Μετασχηματισμοί

Φυσική Β Γυμνασίου Κεφάλαιο 3 Δυνάμεις

Πώς λειτουργεί το Google?

Ανάλυση Ηλεκτρικών Κυκλωμάτων

ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΑΝΑΛΥΣΗΣ ΙΙ, ΣΕΜΦΕ (1/7/ 2013) y x + y.

Transcript:

Ανάκληση Πληροφορίας Διδάσκων Δημήτριος Κατσαρός Διάλεξη 18η: 28/05/2014 1

Spamming PageRank 2

Link Spam Farms Spamming: Παραπλάνηση των μηχανών αναζήτησης για να αποκτηθεί υψηλότερη διάταξη (ranking) για κάποιες σελίδες (ή ιστοτόπους) απ αυτή που πραγματικά αξίζουν. Τεχνικές Spamming Hiding Term Link Content hiding Cloaking Redirection 3

ΟαλγόριθμοςPageRank c: η σταθερά damping T: ο πίνακας μεταβάσεων Ν: συνολικός αριθμός σελίδων του Web 1 N : διάνυσμα που όλα τα στοιχεία του είναι ίσα με 1 Στην ουσία, αυτή η έκφραση οδηγεί σε διατύπωση του προβλήματος PageRank ως γραμμικό σύστημα 4

Υποθέσεις: Spam Farm για εξύψωση μιας σελίδας (1/4) Κάθε σελίδα της φάρμας δείχνει μόνο προς τη μια και μοναδική σελίδα-στόχο, τηςοποίαςο spammer θέλει ν αυξήσει το PageRank. Αυτή η σελίδα είναι μέρος της φάρμας Η φάρμα αποτελείται από δεδομένο αριθμό k σελίδων, λόγω κόστους συντήρησης, ή πόρων Είναι πιθανό, εκτός των σελίδων της φάρμας, ο spammer να κατορθώσει να αποκτήσει συνδέσμους προς τη σελίδα που θέλει και διαμέσου έγκριτων πηγών, π.χ., από Web directory, ήαπόunmoderated bulletin boards. Αυτούς τους συνδέσμους θα τους ονομάζουμε hijacked links και το PageRank που φτάνει στη φάρμα διαμέσου αυτών θα καλείται leakage λ Ενώ ο spammer έχει πλήρη έλεγχο των σελίδων της φάρμας, δεν έχει τον πλήρη έλεγχο των σελίδων που περιέχουν τους hijacked links 5

Spam Farm για εξύψωση μιας σελίδας (2/4) ΘΕΩΡΗΜΑ. Η τιμήpagerank p 0 της σελίδας-στόχος του προηγούμενου σχήματος είναι: ΑΠΟΔΕΙΞΗ. Σύμφωνα με την προηγούμενη διατύπωση του PageRank, η τιμήpagerank των σελίδων της φάρμας είναι: Αντικαθιστώντας την τιμή των p i, έχουμε: 6

Spam Farm για εξύψωση μιας σελίδας (3/4) Βέλτιστη δομή της φάρμας. Έστω ότι με p και λ συμβολίζουμε τα διανύσματα που αντιπροσωπεύουν τις τιμές PageRank και του leakage των σελίδων της φάρμας: Τότε η εξίσωση του PageRank για τις σελίδες της φάρμας είναι: ΘΕΩΡΗΜΑ. ΗτιμήPageRank p 0 της σελίδας-στόχος του προηγούμενου σχήματος είναι μέγιστη εάν e=1 k, 1 kf=1, G=0 kxk και λ 0 =λ (=λ 0 +λ 1 +λ 2 + ) και λ i =0 i=1,,k 7

Spam Farm για εξύψωση μιας σελίδας (4/4) Μ άλλα λόγια, η δομή της φάρμας είναι βέλτιστη, εάν: Όλες οι boosting σελίδες δείχνουν και δείχνονται από τη σελίδα-στόχο (e=1 k ) Δεν υπάρχουν σύνδεσμοι μεταξύ των boosting σέλίδων (G=0 kxk ) Η σελίδα-στόχος δείχνει σε μερικές ή όλες τις boosting σελίδες (1 kf=1) Όλοι οι hijacked σύνδεσμοι δείχνουν στη σελίδα-στόχο (λ 0 =λκαι λ i =0 i=1,,k) 8

Συμμαχίες link spam farms: Δυο φάρμες Η μία φάρμα έχει k boosting σελίδες και η άλλη έχει m boosting σελίδες Χωρίς να συνδέονται οι φάρμες μεταξύ τους, η μέγιστη τμή της σελίδας-στόχος είναι: Εάν κάνουμε την συνδεσμολογία των δυο farms με τον τρόπο που φαίνεται στο πιο πάνω σχήμα, τότε: Συνεπώς, κερδίζει ο spammer που έχει τις λιγότερες σελίδες στη φάρμα του! 9

Συμμαχίες link spam farms: Δυο φάρμες Εάν εκτελέσουμε τη διπλανή συνδεσμολογία, τότε p 0 = q 0 και: Άρα ωφελούνται και οι δυο, κατά ποσά ανάλογα του μεγέθους της άλλης φάρμας, που είναι το ζητούμενο για τους spammers: 10

Συμμαχίες link spam farms: Δακτύλιοι Εάν έχουμε F φάρμες, και συμβολίσουμε με t i την τιμή PageRank της σελίδας-στόχου κάθε φάρμας και με b i τον αριθμό των boosting σελίδων κάθε φάρμας, τότε το PageRank score τηςπρώτηςσελίδας-στόχου θα είναι: Γενικά, η τιμήpagerank της i-οστής σελίδας-στόχου θα είναι: 11

Συμμαχίες link spam farms: Κλίκες Εάν συμβολίσουμε με t i την τιμή PageRank της σελίδας-στόχου κάθε φάρμας και με b i τον αριθμό των boosting σελίδων κάθε φάρμας, τότε το PageRank score τηςπρώτηςσελίδας-στόχου θα είναι: Γενικά, η τιμήpagerank της i-οστής σελίδας-στόχου θα είναι: 12

Ζητήματα στη δομή των link spam farms Πότεέχεινόημανασυμμετάσχειμιανέαφάρμασεμιαήδη υπάρχουσα συμμαχία; Πόσες σελίδες πρέπει να έχει η νέα φάρμα, ώστε να ωφελήσει και τις υπάρχουσες φάρμες; Πότε έχει νόημα να αποχωρήσει μια φάρμα από μια συμμαχία στην οποία συμμετέχει; Υπάρχει κάποιος critical αριθμός κόμβων, πέρα από τον οποίο είναι καλύτερα η φάρμα να υπάρχει μόνη της; Αφού οι βέλτιστες δομές των link spam farms είναι εύκολα ανιχνεύσιμες από τις μηχανές αναζήτησης, είναι πιθανό ότι οι spammers θα δημιουργήσουν ακανόνιστες δομές που όμως θα μοιάζουν με τις βέλτιστες; Πώς τις ανιχνεύουμε αυτές; 13