Έξι βαθμοί διαχωρισμού Βασισμένα στα 1. http://snap.stanford.edu/class/cs224w-readings/kleinberg99smallworld.pdf 2. http://snap.stanford.edu/class/cs224w-readings/kleinberg01smallworld.pdf
Το πείραμα του Milgram 300 άνθρωποι από διάφορα μέρη της Αμερικής Να παραδώσουν ένα γράμμα στη Βοστώνη Χέρι-χέρι ανάμεσα σε ανθρώπους που χαιρετάνε με το μικρό τους όνομα
Το πείραμα του Milgram Μέσος όρος 6.2
Είναι ένας μικρός κόσμος Λέμε ότι ένα γράφημα εμφανίζει την ιδιότητα του μικρού κόσμου όταν έχει μικρή διάμετρο ή μικρή μέση απόσταση. Συνήθως η μέση απόσταση είναι της τάξης του logn
Μικροί κόσμοι Collaboration graph 401,000 nodes, 676,000 edges (average degree 3.37) Diameter: 23, Average distance: 7.64 Cross-post graph, giant component 30,000 nodes, 800,000 edges (average degree 53.3) Diameter: 13, Average distance: 3.8 Web graph 200 million nodes, 1.5 billion edges (average degree 15) Average connected distance: 16 Inter-domain Internet 3500 nodes, 6500 edges (average degree 3.71) 95% of pairs of nodes within distance 5
Μικροί τυχαίοι κόσμοι Ας προσπαθήσουμε να μοντελοποιήσουμε ένα σύστημα ανθρώπινων γνωριμιών ως τυχαίο γράφημα. Έστω ότι κάθε άνθρωπος γνωρίζει k άλλους Αν αυτό γίνεται ομοιόμορφα τυχαία τότε Θεώρημα (E,R): η διάμετρος είναι logn/logk Δυστυχώς όμως οι ανθρώπινες γνωριμίες δεν είναι ομοιόμορφα τυχαίες
Ένα γεωγραφικό τυχαίο μοντέλο Ένα πλέγμα. Σύνδεση με τους γείτονες και κάποιον μακρινό κόμβο. πιθανότητα μακρινής σύνδεσης ανάλογη της απόστασης d -r. p(u,v)=d(u,v) -r /Σd(u,w) -r
Γεωγραφία Αν r είναι μεγάλο (r>2), η σύνδεση γίνεται γεωγραφικά συγκεντρωμένα Το γράφημα έχει μεγάλη μέση απόσταση Θεώρημα: Κάθε αποκεντρωμένος αλγόριθμος πραγματοποιεί μέση διαδρομή (n (r 2)/(r 1) )
Γεωγραφία Αν r είναι μικρό (r<2), η σύνδεση γίνεται ομοιόμορφα τυχαία. Το γράφημα έχει μικρή μέση απόσταση Αλλά δεν μπορούμε να βρούμε εύκολα τη συντομότερη διαδρομή Θεώρημα: Κάθε αποκεντρωμένος αλγόριθμος πραγματοποιεί μέση διαδρομή (n (2 r)/3 )
r=2 Για r=2 και η μέση απόσταση είναι μικρή και μπορούμε να βρούμε μια διαδρομή εύκολα Πρόβλημα: Σε ένα πλέγμα nxn, ξεκινώντας από έναν κόμβο s, θέλουμε να φτάσουμε σε κόμβο t (γνωρίζουμε τις συντεταγμένες) γνωρίζοντας μόνο τις ακμές των κόμβων που επισκεπτόμαστε Αλγόριθμος: Διάλεξε κάθε φορά την ακμή που πλησιάζει (L1) περισσότερο στον t Θεώρημα: Ο παραπάνω αλγόριθμος έχει μέση διαδρομή Ο((logn) 2 )
Απόδειξη Ας ορίσουμε φάσεις του αλγορίθμου. Βρισκόμαστε στη φάση j όταν είμαστε σε απόσταση από 2 j+1 έως 2 j Θα δείξουμε ότι δεν πραγματοποιούμε πολλά βήματα σε κάθε φάση Xj ο αριθμός των βημάτων στη φάση j, ψάχνουμε το E[Xj]
Απόδειξη Για 0 j log(logn), στη χειρότερη περίπτωση χρησιμοποιούμε μόνο τις γειτονικές επαφές Άρα θα χρειαστούμε το πολύ 2 log(logn)+1 βήματα Το πολύ O(logn) βήματα
Για log(logn) j logn Απόδειξη Θα υπολογίσουμε την πιθανότητα κάθε κόμβος που επισκεπτόμαστε να έχει μακρινή επαφή που μας βγάζει από την φάση j. X w6=u,v d(u, w) 2 apple =4 2n 2 X j=1 2n 2 X j=1 (4j)(j 2 ) j 1 apple 4+4ln(2n 2) apple 4ln(6n)
Απόδειξη Πιθανότητα να επιλέξουμε μια κορυφή d(u, v) 2 4ln(6n) Πόσες κορυφές μας πηγαίνουν στην επόμενη φάση; Όλες που είναι σε απόσταση 2 j X 1+ 2 j i =1+ 1 2 2j (1 + 2 j ) > 2 2j 1 i=1 Απόσταση από την τρέχουσα κορυφή; Κάθε μία apple 2 j+1 +2 j < 2 j+2 Άρα πιθανότητα να αλλάξουμε φάση 2 2j 1 4ln(6n)2 2j+4 = 1 128 ln(6n)
Απόδειξη Μέσος αριθμός βημάτων μέχρι να αλλάξουμε φάση 1X E[X j ]= Pr[X j i] apple i=1 1X 1 1 128 ln(6n) i=1 i 1 = 128 ln(6n) =O(log n) Από γραμμικότητα μέσης τιμής ο μέσος αριθμός βημάτων του αλγορίθμου O(log 2 n)
Ιεραρχικά μοντέλα Ένα b-αδικό δέντρο ιεραρχίας Οι κόμβοι του γραφήματος είναι τα φύλλα Ορίζουμε ως απόσταση h(u,v), το ύψος του χαμηλότερου κοινού προγόνου στο δέντρο Από την κορυφή u δημιουργούμε μια ακμή προς μία κορυφή v με πιθανότητα ανάλογη f(h(u,v))/σ f(h(u,w)). Δημιουργούμε k τέτοιες ακμές. Θα εξετάσουμε την περίπτωση f(h)=b -ah και k=clog 2 n
Θεώρημα Θεώρημα: Για a=1, υπάρχει αποκεντρωμένος αλγόριθμος που έχει μέσο αριθμό βημάτων O(logn) Ας δούμε πρώτα το άθροισμα στην πιθανότητα κάθε ακμής
Ιεραρχικά μοντέλα Έστω οι κορυφές u και t. Έστω w ο ελάχιστος κοινός τους πρόγονος, Τ το υποδέντρο με ρίζα w και Τ το υποδέντρο του Τ ύψους i-1 που περιέχει την t. Υπάρχουν b i-1 φύλλα στο Τ Κάθε τέτοιο φύλλο έχει απόσταση i από την u. Άρα κάθε ακμή της u έχει πιθανότητα τουλάχιστον b -i /logn προς κάποιο τέτοιο φύλλο.δ Κάθε ακμή της u έχει πιθανότητα τουλάχιστον 1/blogn να συνδεθεί με φύλλο του Τ Συνολικά η πιθανότητα να μην συνδεθεί με κάποιο φύλλο του Τ είναι το πολύ
Ιεραρχικά μοντέλα Από union bound με πιθανότητα τουλάχιστον 1-n -θ+1 όλες οι κορυφές του γραφήματος έχουν ακμή προς φύλλο του Τ Μπορούμε να φτάσουμε από οποιαδήποτε κορυφή στην t σε O(logn) βήματα: Ακολουθούμε μια ακμή προς Τ και επαναλαμβάνουμε επαγωγικά. Θεώρημα: Για a<>1, δεν υπάρχει αποκεντρωμένος αλγόριθμος με μέσο αριθμό βημάτων O(logn)