Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Σχετικά έγγραφα
Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός. Διάλεξη 14η

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό

Εύρεση & ιαχείριση Πληροφορίας στον Παγκόσµιο Ιστό. Ενηµέρωση του διανύσµατος PageRank. Η εξέλιξη του Web

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Information Retrieval

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

ΗΥ-150 Πξνγξακκατησκόο Ταμηλόκεσε θαη Αλαδήτεσε

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Ανάκληση Πληποφοπίαρ. Information Retrieval. Διδάζκων Δημήηριος Καηζαρός

Σύλζετα Δίθτπα. com+plex: with+ -fold (having parts) Διδάζκων Δημήηριος Καηζαρός

x y z d e f g h k = 0 a b c d e f g h k

Δξγαζηεξηαθή άζθεζε 03. Σηεξενγξαθηθή πξνβνιή ζην δίθηπν Wulf

Ανάκληση Πληροφορίας. Διδάσκων Δημήτριος Κατσαρός

Θεώρημα της αντιστροφής

ΥΛΙΚΑ ΠΑΡΟΝ ΚΑΙ ΜΕΛΛΟΝ ΠΑΝΕΠΙΣΗΜΙΟ ΚΡΗΣΗ ΣΜΗΜΑ ΕΠΙΣΗΜΗ ΚΑΙ ΣΕΧΝΟΛΟΓΙΑ ΤΛΙΚΩΝ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

u v 4 w G 2 G 1 u v w x y z 4

Άσκηση 1 - Μοπυοποίηση Κειμένου

Αντισταθμιστική ανάλυση

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΤΙΚΗ ΣΚΥΤΑΛΟΓΡΟΜΙΑ 2015 ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ Τεηάπηη 28 Ιανουαπίου 2015 ΛΔΥΚΩΣΙΑ Τάξη: Α Γυμναζίου

Κβαντικοί Υπολογισμοί. Πέκπηε Γηάιεμε

ΜΕΜ251 Αριθμητική Ανάλυση

2. dim(p ) = n rank(a = )

Έλαο πίνακας σσμβόλων ππνζηεξίδεη δύν βαζηθέο ιεηηνπξγίεο:

Κεφάλαιο 4ο: Δικτυωτή Ανάλυση

Σύνθετα Δίκτυα. com+plex: with+ -fold (having parts) Διδάζκων Δημήηριος Καηζαρός

ΜΑΘΗΜΑΤΙΚΑ ΘΔΤΙΚΗΣ ΚΑΙ ΤΔΦΝΟΛΟΓΙΚΗΣ ΚΑΤΔΥΘΥΝΣΗΣ Β ΛΥΚΔΙΟΥ ΤΔΣΤ(1) ΣΤΑ ΓΙΑΝΥΣΜΑΤΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 8: Ανάλυση ευστάθειας & Συναγωγή και διάχυση

ΑΝΑΛΥΣΗ 1 ΠΕΜΠΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

ΣΥΣΤΗΜΑΤΑ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. 1. Να ιπζνύλ ηα ζπζηήκαηα. 1 0,3x 0,1y x 3 3x 4y 2 4x 2y ( x 1) 6( y 1) (i) (ii)

1.4 ΠΥΘΑΓΟΡΕΙΟ ΘΕΩΡΗΜΑ

ΓΔΧΜΔΣΡΙΑ ΓΙΑ ΟΛΤΜΠΙΑΓΔ

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

1. Οδηγίερ εγκαηάζηαζηρ και σπήζηρ έξςπνυν καπηών και τηθιακών πιζηοποιηηικών με σπήζη ηος λογιζμικού Μοzilla Thunderbird

Ερωτήσεις θεωρίας για τα Μαθηματικά Γ γυμνασίου. Άλγεβρα...

Ζαχαρίας Μ. Κοντοπόδης Εργαστήριο Λειτουργικών Συστημάτων ΙΙ

1 Arq thc Majhmatik c Epagwg c

Ανάλυση Ηλεκτρικών Κυκλωμάτων

Συνδυασμοί αντιστάσεων και πηγών

Μονοψϊνιο. Αγνξά κε ιίγνπο αγνξαζηέο. Δύναμη μονοψωνίος Η ηθαλόηεηα πνπ έρεη ν αγνξαζηήο λα επεξεάζεη ηελ ηηκή ηνπ αγαζνύ.

ΚΕΦΑΛΑΙΟ Γείμηε όηη : ΡΑ ΡΒ ΡΓ 2 ΒΑ.

3 η Ε π α ν α λ η π τ ι κ ή Ά σ κ η σ η

n = dim N (A) + dim R(A). dim V = dim ker L + dim im L.

ΕΝΟΤΗΤΑ 1: ΟΡΙΣΜΟΣ ΠΕΔΙΟ ΟΡΙΣΜΟΥ ΠΡΑΞΕΙΣ ΣΥΝΑΡΤΗΣΕΩΝ ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΛΥΜΕΝΑ ΘΕΜΑΤΑ ΘΕΜΑ Α

από t 1 (x) = A 1 x A 1 b.

Φςζική Πποζαναηολιζμού Γ Λςκείος. Αζκήζειρ Ταλανηώζειρ 1 ο Φςλλάδιο

ΒΗΜΑ 2. Εηζάγεηε ηνλ Κωδηθό Πξόζβαζεο πνπ ιακβάλεηε κε SMS & δειώλεηε επηζπκεηό Όλνκα Πξόζβαζεο (Username) θαη ην ζαο

E-commerce Networks & Applications. Η διαφήμιση στο Internet. Νίκος Κωνσταντίνου

, ο αριθμός στον οποίο αντιστοιχεί ο 2 καλείται δεύτερος όρος της ακολουθίας και τον συμβολίζουμε συνήθως με

1 ο Διαγώνισμα περιόδου στις Συναρτήσεις και τα Όρια

ΚΕΦΑΛΑΙΟ 4 Ο ΣΤΟΙΧΕΙΑ ΟΛΟΚΛΗΡΩΤΙΚΟΥ ΛΟΓΙΣΜΟΥ

Βάσεις Δεδομέμωμ. Εξγαζηήξην V. Τκήκα Πιεξνθνξηθήο ΑΠΘ

Το αγόρι στο θεωρείο Αγγελική Δαρλάση ΜΕΛΙΝΑ ΣΟΥΣΟΥΝΗ

1.3 ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ ΑΡΙΘΜΟΥ ΜΕ ΔΙΑΝΥΣΜΑ

Παράδειγμα 14.2 Να βρεθεί ο μετασχηματισμός Laplace των συναρτήσεων

Α. Εηζαγσγή ηεο έλλνηαο ηεο ηξηγσλνκεηξηθήο εμίζσζεο κε αξρηθό παξάδεηγκα ηελ εκx = 2

ΕΞΙΣΩΣΕΙΣ. Α. Πρωτοβάθμιεσ Εξιςώςεισ. Β. Διερεφνηςη Εξιςώςεων. 1x είναι αδφνατθ. x 1 x 1. Άλγεβρα Α Λυκείου

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια

(a) = lim. f y (a, b) = lim. (b) = lim. f y (x, y) = lim. g g(a + h) g(a) h g(b + h) g(b)

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

d(v) = 3 S. q(g \ S) S

1.2 Συντεταγμένες στο Επίπεδο

Airsoft Gun κε Φσηεηλό Γείθηε LASER Εμπορική Air Sport Gun 777 Ονομαζία: Διανομέας: V&P MANOLI ΔΠΙΧΔΙΡΗΔΙ ΛΣΓ Item No.: 777 Χώρα Προέλεσζης:

ΤΑΞΙΝΟΜΗΣΗ ΤΩΝ ΤΔΡΗΓΟΝΙΚΩΝ ΒΛΑΒΩΝ ΚΑΤΑ ΤΑ ICDAS II ΚΡΙΤΗΡΙΑ ΜΔ ΒΑΣΗ ΤΗ ΚΛΙΝΙΚΗ ΔΞΔΤΑΣΗ

7.7 Ασκήσεις σχολικού βιβλίου σελίδας 156

Ο αλγόριθμος PageRank της Google

Πώς λειτουργεί το Google?

Σημειώσεις Μαθηματικών 1

5. 1 ΣΥΝΟΛΑ. Η έννοια του συνόλου

Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο κόζηος ανά μονάδα παραγωγής. Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο ζηαθερό κόζηος ανά μονάδα παραγωγής

Λεκηική έκθραζη, κριηική, οικειόηηηα και ηύπος δεζμού ζηις ζηενές διαπροζωπικές ζτέζεις

ηδάζθσλ: εµήηξεο Εετλαιηπνύξ

Information Retrieval

ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΙ ΜΕΘΟΔΟΣ SIMPLEX, διαλ. 3. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 29/4/2017

ΓΡΑΠΣΔ ΠΡΟΑΓΩΓΗΚΔ ΔΞΔΣΑΔΗ ΜΑΪΟΤ Θέμα Α ( Α1 =10, Α2 = 15 ) 1) Υαξαθηεξίζηε ηηο παξαθάησ πξνηάζεηο κε - Λ

ΘΔΚΑ ΡΖΠ ΑΛΑΓΛΩΟΗΠΖΠ

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

ΘΕΜΑ 1 ο (3.5 μονάδες) V CC R C1 R C2. R s. v o v s R L. v i I 1 I 2 ΛΥΣΗ R 10 10

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 9: Συναγωγή και διάχυση (συνέχεια)

ΤΕΣΤ ❶ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΚΑΤΕΥΘΥΝΣΗΣ Β ΛΥΚΕΙΟΥ

x-1 x (x-1) x 5x 2. Να απινπνηεζνύλ ηα θιάζκαηα, έηζη ώζηε λα κελ ππάξρνπλ ξηδηθά ζηνπο 22, 55, 15, 42, 93, 10 5, 12

ΜΑΘΗΜΑΤΙΚΑ Β ΓΥΜΝΑΣΙΟΥ. Μέρος Β Κεφάλαιο 1ο Εμβαδά επίπεδων σχημάτων Πυθαγόρειο Θεώρημα 1.4 Πυθαγόρειο Θεώρημα

IV. Συνέχεια Συνάρτησης. math-gr

Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων

Αγορές Χρήματος & Κεφαλαίου

H ΜΑΓΕΙΑ ΤΩΝ ΑΡΙΘΜΩΝ

iii. iv. γηα ηελ νπνία ηζρύνπλ: f (1) 2 θαη

(άρθρο 8 Ν.1599/1986)

e 2 S F = [V (H), V (H)]. 3-1 e 1 e 3

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηπιορ Καηζαπόρ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙΜΟ Α ΛΤΚΔΙΟΤ. Ημεπομηνία: 10/12/11 Ώπα εξέτασηρ: 09:30-12:30 ΠΡΟΣΔΙΝΟΜΔΝΔ ΛΤΔΙ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

4. 1 Η ΣΥΝΑΡΤΗΣΗ Y=AX 2 ME A 0

Να ζρεδηάζεηο ηξόπνπο ζύλδεζεο κηαο κπαηαξίαο θαη ελόο ιακπηήξα ώζηε ν ιακπηήξαο λα θσηνβνιεί.

B-Δέλδξα. Τα B-δέλδξα ρξεζηκνπνηνύληαη γηα ηε αλαπαξάζηαζε πνιύ κεγάισλ ιεμηθώλ πνπ είλαη απνζεθεπκέλα ζην δίζθν.

5.2 ΑΡΙΘΜΗΤΙΚΗ ΠΡΟΟΔΟΣ

Ανασκόπηση-Μάθημα 17 Κανόνας αλυσίδας - Παράγωγος κατά κατεύθυνση

x 3 = 0 x 6 = 0 x 4 = 0 x 5 = 0 x 2 = 0 x 1 = 0 aff(p )

Transcript:

Ανάκληση Πληποφοπίαρ Διδάζκων Δημήηριος Καηζαρός Διάλεξη 17η: 15/05/2017 1

Spamming PageRank 2

(Link Spam Farms) Spamming: Παξαπιάλεζε ησλ κεραλώλ αλαδήηεζεο γηα λα απνθηεζεί πςειόηεξε δηάηαμε (ranking) γηα θάπνηεο ζειίδεο (ή ηζηνηόπνπο) απ απηή πνπ πξαγκαηηθά αμίδνπλ. Τεχνικές Spamming Hiding Term Link Content hiding Cloaking Redirection 3

Ο αιγόξηζκνο PageRank c: ε ζηαζεξά damping T: ν πίλαθαο κεηαβάζεσλ Ν: ζπλνιηθόο αξηζκόο ζειίδσλ ηνπ Web 1 N : δηάλπζκα πνπ όια ηα ζηνηρεία ηνπ είλαη ίζα κε 1 Σηελ νπζία, απηή ε έθθξαζε νδεγεί ζε δηαηύπσζε ηνπ πξνβιήκαηνο PageRank σο γξακκηθό ζύζηεκα 4

Spam Farm για εξύψωση μιας σελίδας (1/4) Υποθέσεις: Κάθε σελίδα της φάρμας δείχνει μόνο προς τη μια και μοναδική σελίδα-στόχο, της οποίας ο spammer θέλει ν αυξήσει το PageRank. Αυτή η σελίδα είναι μέρος της φάρμας Η φάρμα αποτελείται από δεδομένο αριθμό k σελίδων, λόγω κόστους συντήρησης, ή πόρων Είναι πιθανό, εκτός των σελίδων της φάρμας, ο spammer να κατορθώσει να αποκτήσει συνδέσμους προς τη σελίδα που θέλει και διαμέσου έγκριτων πηγών, π.χ., από Web directory, ή από unmoderated bulletin boards. Αυτούς τους συνδέσμους θα τους ονομάζουμε hijacked links και το PageRank που φτάνει στη φάρμα διαμέσου αυτών θα καλείται leakage λ Ενώ ο spammer έχει πλήρη έλεγχο των σελίδων της φάρμας, δεν έχει τον πλήρη έλεγχο των σελίδων που περιέχουν τους hijacked links 5

Spam Farm για εξύψωση μιας σελίδας (2/4) ΘΕΩΡΗΜΑ. Η τιμή PageRank p 0 της σελίδας-στόχος του προηγούμενου σχήματος είναι: ΑΠΟΔΕΙΞΗ. Σύμφωνα με την προηγούμενη διατύπωση του PageRank, η τιμή PageRank των σελίδων της φάρμας είναι: Αντικαθιστώντας την τιμή των p i, έχουμε: 6

Spam Farm για εξύψωση μιας σελίδας (3/4) Βέλτιστη δομή της φάρμας. Έστω ότι με p και λ συμβολίζουμε τα διανύσματα που αντιπροσωπεύουν τις τιμές PageRank και του leakage των σελίδων της φάρμας: Τότε η εξίσωση του PageRank για τις σελίδες της φάρμας είναι: ΘΕΩΡΗΜΑ. Η τιμή PageRank p 0 της σελίδας-στόχος του προηγούμενου σχήματος είναι μέγιστη εάν e=1 k, 1 kf=1, G=0 kxk και λ 0 =λ (=λ 0 +λ 1 +λ 2 + ) και λ i =0 i=1,,k 7

Spam Farm για εξύψωση μιας σελίδας (4/4) Μ άλλα λόγια, η δομή της φάρμας είναι βέλτιστη, εάν: Όλες οι boosting σελίδες δείχνουν και δείχνονται από τη σελίδα-στόχο (e=1 k ) Δεν υπάρχουν σύνδεσμοι μεταξύ των boosting σέλίδων (G=0 kxk ) Η σελίδα-στόχος δείχνει σε μερικές ή όλες τις boosting σελίδες (1 kf=1) Όλοι οι hijacked σύνδεσμοι δείχνουν στη σελίδα-στόχο (λ 0 =λ και λ i =0 i=1,,k) 8

Συμμαχίες link spam farms: Δυο φάρμες Η μία φάρμα έχει k boosting σελίδες και η άλλη έχει m boosting σελίδες Χωρίς να συνδέονται οι φάρμες μεταξύ τους, η μέγιστη τμή της σελίδαςστόχος είναι: Εάν κάνουμε την συνδεσμολογία των δυο farms με τον τρόπο που φαίνεται στο πιο πάνω σχήμα, τότε: Συνεπώς, κερδίζει ο spammer που έχει τις λιγότερες σελίδες στη φάρμα του! 9

Συμμαχίες link spam farms: Δυο φάρμες Εάν εκτελέσουμε τη διπλανή συνδεσμολογία, τότε p 0 = q 0 και: Άρα ωφελούνται και οι δυο, κατά ποσά ανάλογα του μεγέθους της άλλης φάρμας, που είναι το ζητούμενο για τους spammers: 10

Συμμαχίες link spam farms: Δακτύλιοι Εάν έχουμε F φάρμες, και συμβολίσουμε με t i την τιμή PageRank της σελίδας-στόχου κάθε φάρμας και με b i τον αριθμό των boosting σελίδων κάθε φάρμας, τότε το PageRank score της πρώτης σελίδας-στόχου θα είναι: Γενικά, η τιμή PageRank της i-οστής σελίδας-στόχου θα είναι: 11

Συμμαχίες link spam farms: Κλίκες Εάν συμβολίσουμε με t i την τιμή PageRank της σελίδαςστόχου κάθε φάρμας και με b i τον αριθμό των boosting σελίδων κάθε φάρμας, τότε το PageRank score της πρώτης σελίδας-στόχου θα είναι: Γενικά, η τιμή PageRank της i-οστής σελίδας-στόχου θα είναι: 12

Ζητήματα στη δομή των link spam farms Πότε έχει νόημα να συμμετάσχει μια νέα φάρμα σε μια ήδη υπάρχουσα συμμαχία; Πόσες σελίδες πρέπει να έχει η νέα φάρμα, ώστε να ωφελήσει και τις υπάρχουσες φάρμες; Πότε έχει νόημα να αποχωρήσει μια φάρμα από μια συμμαχία στην οποία συμμετέχει; Υπάρχει κάποιος critical αριθμός κόμβων, πέρα από τον οποίο είναι καλύτερα η φάρμα να υπάρχει μόνη της; Αφού οι βέλτιστες δομές των link spam farms είναι εύκολα ανιχνεύσιμες από τις μηχανές αναζήτησης, είναι πιθανό ότι οι spammers θα δημιουργήσουν ακανόνιστες δομές που όμως θα μοιάζουν με τις βέλτιστες; Πώς τις ανιχνεύουμε αυτές; 13