Σύνθετα Δίκτυα com+plex: with+ -fold (having parts) Δηδάζθωλ Δεκήηξηνο Καηζαξόο Διάλεξη 7η: 21/03/2016 1
Ασκήσεις (Εξέλιξη δικτύου) Άσκηση 1. Θυμηθείτε το μοντέλο Barabasi-Albert ( the rich gets richer ή Matthew effect ) Ναι, αλλά η Google, αν και μεταγενέστερη της Yahoo, την ξεπέρασε σε δημοφιλία! Κάποια άρθρα που γράφονται σήμερα θα ξεπεράσουν σε αριθμό αναφορών (citations) πολλά από τα σημερινά που έχουν μεγάλους αριθμούς αναφορών! Άρα, υπάρχει κάποιος παράγοντας που δεν περιγράφεται καλά από τους BA, και τελικά οι νικητές δεν τα παίρνουν όλα 2
Ασκήσεις (Εξέλιξη δικτύου) Άσκηση 1 (συνέχεια). Πράγματι, μελετώντας τον in-degree ιστοσελίδων του ίδιου τύπου (π.χ., πανεπιστημιακών, δημοσίων εταιρειών, κ.τ.λ.) παρατηρήθηκε ότι για μικρά και μεσαία k η κατανομή αποκλίνει από τον δυναμο-νόμο: t=4923, m=1356, α=0.95 Φτιάξτε ένα μοντέλο που η attachment probability δεν μοιράζεται αυστηρά αναλογικά με βάση τον βαθμό κάθε κόμβου. 3
Ασκήσεις (Εξέλιξη δικτύου) Άσκηση 2. Για το προηγούμενο μοντέλο, να δείξετε ότι to degree distribution υπακούει σε δυναμο-νόμο. Είναι ένα μοντέλο με μείξη προνομιακής και ομοιόμορφης προσκόλλησης, γνωστό ως μοντέλο του David Pennock 4
Degree distribution γηα ην Pennock et al. Λύση άσκησης 2. Υποθέτουμε ότι το k i είναι μια συνεχής πραγματική μεταβλητή, και ότι ο Π(k i ) είναι ο ρυθμός αύξησης του k i. Τότε: Αφού το Π(k i ) αθροίζει στο ένα, και η συνολική συνδεσιμότητα αυξάνει κάθε χρονικό quantum κατά 2m, το Α πρέπει να ισούται με 2m. Για το υπόλοιπο των πράξεων υποθέτουμε ότι t >> m 0. Αντικαθιστώντας το Α, βρίσκουμε ότι: 5
Καηαλνκή βαζκώλ γηα ην Pennock et al. Με την αρχική συνθήκη ότι ο κόμβος i ξεκινά τη στιγμή t i χωρίς ακμές, δηλ., k i (t i )= 0: Τόηε ε πηζαλόηεηα όηη ε ζπλδεζηκόηεηα ki(t) ηνπ θόκβνπ i, είλαη κηθξόηεξε από k είλαη: 6
Καηαλνκή βαζκώλ γηα ην Pennock et al. όπου το τελευταίο βήμα υποθέτει ότι οι κόμβοι προστίθενται σε ίσα διαστήματα στο χρόνο, και έτσι η pdf του t i είναι ομοιόμορφη, δηλ., Pr(t i )=1/t. H pdf του k είναι η μερική παράγωγος της cdf (δηλ., της προηγούμενης σχέσης) σε σχέση με το k: Kαθώς k, η density Pr(k) είναι ανάλογη του k -(1+1/α), δηλαδή δυναμο-νόμος με εκθέτη γ= 1 + 1/α Για παράδειγμα, εάν α=1/2, τότε γ=3, δηλαδή ο ίδιος με αυτόν του μοντέλου BA 7
Μεηξηθέο θεληξηθόηεηαο Centrality measures 8
Περιεχόμενα Παρουσιάσαμε Degree centrality (DC) και centralization Shortest-Path Betweenness Centrality (SPBC) σε μη-κατευθυνόμενα δίκτυα Θα παρουσιάσουμε Closeness centrality Bridging centrality επεκτάσεις όλων σε κατευθυνόμενα δίκτυα 9
Κεντρικότητα εγγύτητας (closeness centrality) Εάν δεν μας ενδιαφέρει να έχουμε πολλούς άμεσους φίλους? Ή να είμαστε μεταξύ άλλων; Αλλά, εξακολουθεί να μας ενδιαφέρει να είμαστε στο μέσον των πραγμάτων, όχι μακριά από το κέντρο; 10
Κεντρικότητα εγγύτητας Η θεληξηθόηεηα εγγύηεηαο βαζίδεηαη ζην κέζν κήθνο ηνπ ειάρηζηωλ κνλνπαηηώλ κεηαμύ ηνπ θόκβνπ θαη όιωλ ηωλ ππόινηπωλ θόκβωλ ηνπ δηθηύνπ Closeness Centrality (CC): Καλνληθνπνηεκέλε CC C C ' 1 N C c (i) d(i, j) j 1 (i) (C C (i))/(n 1) 11
Κεντρικότητα εγγύτητας: Παράδειγμα A B C D E C c ' (A) N j 1 1 d(a, j) N 1 1 1 2 3 4 4 10 4 1 0.4 12
Κεντρικότητα εγγύτητας: Παράδειγμα 13
Πόσο κοντά είναι η DC και η SPBC στην CC; degree μέγεθος του κύκλου closeness χρώμα του κύκλου betweenness χρώμα του κύκλου 14
Περιεχόμενα Παρουσιάσαμε: Degree centrality (DC) και centralization Shortest-Path Betweenness Centrality (SPBC) σε μη-κατευθυνόμενα δίκτυα Θα παρουσιάσουμε: Closeness centrality Bridging centrality επεκτάσεις σε κατευθυνόμενα δίκτυα 15
Παρατήρηση Βασικές ιδιότητες των scale-free δικτύων Power-law degree distribution Small world Robustness (αργότερα) Hierarchical modularity (αργότερα) Assortative (αργότερα) Θα υπάρχουν μερικές/οί bridging κόμβοι/ακμές μεταξύ modules σε scale-free δίκτυα με βάση αυτές τις ιδιότητες, και μπορούμε να τις/τους αναγνωρίσουμε οπτικά Η εύρεση των bridging κόμβων/ακμών, που βρίσκονται μεταξύ των modules, είναι ενδιαφέρουσα και χρήσιμη εργασία (ευρωστία δικτύου, προστασία μονοπατιών, κ.τ.λ.) 16
Κίνητρο Οι υπάρχουσες μετρικές δεν είναι ικανές να αναγνωρίσουν τους bridging nodes/edges: κυρίως κυριαρχούνται από το βαθμό του κόμβου που εξετάζουμε Η ενδιαμεσότητα μιας ακμής(!?) έχει επίσης ισχυρή ροπή προς τους κόμβους με μεγάλο βαθμό Υψηλή τάση για cluttering στο κέντρο του δικτύου. Έτσι, είναι δύσκολο να διαχωρίσουμε τους bridging nodes/edges από άλλα είδη nodes/edges 17
Γέφυρα Μια γέφυρα θα πρέπει να βρίσκεται πάνω σε κάποιο σημαντικό μονοπάτι, π.χ., ελάχιστο μονοπάτι Μια γέφυρα θα πρέπει να βρίσκεται μεταξύ modules Οι γειτονικές περιοχές ενός κόμβου θα πρέπει να έχουν low range of public domain μεταξύ τους 18
Ενδιαμεσότητα και Συντελεστής Γέφυρας (bridging coefficient) Betweenness: καθολική σημαντικότητα ενός κόμβου/ακμής από την σκοπιά των ελαχίστων μονοπατιών st( v) SPBC ( v) SPBC ( e) s v t V Bridging Coefficient: μετρική που μετρά την έκταση του πόσο καλά ένας κόμβος ή ακμή βρίσκεται μεταξύ καλά διασυνδεδεμένων περιοχών Ο αριθμός των ακμών που εισέρχονται ή εξέρχονται το άμεσο γειτονικό υπογράφημα ενός κόμβου v σχετικά με τον αριθμό των ακμών που είναι εντός του άμεσου γειτονικού υπογραφήματος του v είναι υψηλός στις γέφυρες Η μέση πιθανότητα του να εγκαταλείψεις το άμεσο υπογραφήμα ενός κόμβου v st s t V st( e) st 19
Bridging coefficient θόκβνπ Bridging Coefficient: ( v) d 1 ( v) ( i) i N ( v) d( i) 1 όπνπ d(v) είλαη ν βαζκόο ελόο θόκβνπ v θαη δ(v) είλαη ν αξηζκόο ηωλ αθκώλ πνπ εμέξρνληαη από ην άκεζν γεηηνληθό ππνγξάθεκα (direct neighbor subgraph) ηνπ θόκβνπ v από εθείλεο πνπ πξνζπίπηνπλ ζε θάζε άκεζν γεηηνληθό θόκβν i ηνπ θόκβνπ v C b : SP Betweenness centality BC: Bridging coefficient C R : Bridging centrality 20
Bridging coefficient αθκήο Bridging Coefficient: ( e) d( i) ( i) d( j) ( j) ( d( i) d( j))( C( i, j) 1) όπνπ νη θόκβνη i θαη j είλαη ηα δπν άθξα ηεο αθκήο e, d(i) είλαη ν βαζκόο ηνπ θόκβνπ i, Ψ(i) είλαη ν bridging coefficient ηνπ θόκβνπ i, C(i, j) είλαη ην ζύλνιν ηωλ θνηλώλ άκεζωλ γεηηόλωλ ηωλ θόκβωλ i θαη j Δειαδή: Ο bridging coefficient γηα κηα αθκή e νξίδεηαη ωο ην γηλόκελν ηνπ δηαβακηζκέλνπ κέζνπ όξνπ (weighted average) ηωλ bridging coefficient ηωλ δπν άθξωλ i θαη and j ηεο αθκήο e θαη ηνπ αληίζηξνθνπ ηνπ αξηζκνύ ηωλ θνηλώλ άκεζωλ γεηηόλωλ ηωλ θόκβωλ i θαη j 21
Bridging Centrality Η bridging centrality νξίδεηαη ωο ην γηλόκελν ηνπ rank ηεο ελδηακεζόηεηαο επί ην rank ηνπ the bridging coefficient C Br ( v) R R SPBC ( v) ( v) C Br ( e) R R SPBC ( e) ( e) 22
BC: Παξαδείγκαηα από ην Web Results for Web Networks: Figures A and B show the results for the AT&T Web Network and RPI Web Network, respectively. The nodes with the highest 0-5th percentile of values for the bridging centrality are highlighted in red circles; the nodes with the lowest values of bridging centrality are the 85th-100th percentiles and are highlighted in white circles. The color map for the percentile values is shown in the Figure. 23
BC: Παξαδείγκαηα από θνηλωληθά δίθηπα Results for Social Networks: Figures A and B show the results for the Les Miserable Character Network and Physics Collaboration Network, respectively. The nodes with the highest 0-5th percentile of values for the bridging centrality are highlighted in red circles; the nodes with the lowest values of bridging centrality are the 85th-100th percentiles and are highlighted in white circles. The nodes corresponding to Valjean (V), Javert (J), Pontmercy (P) and Cosette (C) are labeled in Figure A. The nodes corresponding to Rothman (R), Redner (R2), Dodds (D), Krapivsky (K) and Stanley (S) are labeled in Figure B. The color map for the percentile values is shown in the Figure. 24
BC: Παξαδείγκαηα από βηνινγηθά δίθηπα Results for Biological Networks: Figures A and B show the results the Cardiac Arrest Network and Yeast Metabolic Network, respectively. The nodes corresponding to Src, Shc and Jak2 (J2) are labeled in Figure A. The nodes with the highest 0-5th percentile of values for the bridging centrality are highlighted in red circles; the nodes with the lowest values of bridging centrality are the 85th- 100th percentiles and are highlighted in white circles. The color map for the percentile values is shown in the Figure. 25
Περιεχόμενα Παρουσιάσαμε Degree centrality (DC) και centralization Shortest-Path Betweenness Centrality (SPBC) σε μη-κατευθυνόμενα δίκτυα Θα παρουσιάσουμε Closeness centrality Bridging centrality επεκτάσεις σε κατευθυνόμενα δίκτυα 26
Prestige in directed social networks Όταν το prestige είναι η σωστή λέξη: Θαυμασμός (admiration) Επιρροή (influence) Χορηγός (gift-giving) Εμπιστοσύνη (trust) Η κατεύθυνση ειδικά σημαντική σε περιπτώσεις όπου δεν υπάρχει αμοιβαιότητα (π.χ., δίκτυο επιλογής συνδαιτυμόνων) Όταν το prestige δεν είναι η σωστή λέξη Σύμβουλος gives advice to (can reverse direction) Εντολέας (gives orders to) Δανειστής (lends money to) Αντιπαθεί (dislikes) Δεν εμπιστεύεται (distrusts) 27
Επεκτάσεις της DC σε κατευθυνόμενα δίκτυα degree centrality indegree centrality Ένα άρθρο που αναφέρεται (is cited) από πολλά άλλα έχει υψηλό prestige Κάποιο πρόσωπο που υποδεικνύεται από πολλούς άλλους για π.χ., κάποιο έπαινο έχει υψηλό prestige 28
Επεκτάσεις της CC σε κατευθυνόμενα δίκτυα H CC συνήθως υπονοεί Όλα τα μονοπάτια οδηγούν σε σένα Τα μονοπάτια από σένα θα πρέπει να οδηγούν παντού Συνήθως, εξετάζει μόνο κόμβους στους οποίους ο κόμβος i έχει πρόσβαση 29
Εμβέλεια επιρροής Η εμβέλεια επιρροής (influence range) του κόμβου i είναι το σύνολο των κόμβων που είναι προσβάσιμο από τον i (μετά από πεπερασμένο αριθμό βημάτων) i Απχή 1 ο βήμα 2 ο βήμα 3 ο βήμα 4 ο βήμα 5 ο βήμα 30
Κατευθυνόμενα geodesics Κάποιος κόμβος δεν βρίσκεται απαραίτητα επάνω σε ένα ελάχιστο μονοπάτι από το j προς το k, εάν βρίσκεται επάνω σε ένα ελάχιστο μονοπάτι από το k προς το j j k 31
Επέκταση της SPBC σε κατευθυνόμενα δίκτυα Εξετάζουμε το κλάσμα όλων των κατευθυνόμενων μονοπατιών μεταξύ δυο οποιονδήποτε κόμβων που διέρχονται από κάποιο κόμβο betweenness ηνπ θόκβνπ i C B (i) κνλνπάηηα κεηαμύ j θαη k πνπ δηέξρνληαη από ηνλ i j,k g jk (i)/g jk όια ηα κνλνπάηηα κεηαμύ j θαη k Μόλε ηξνπνπνίεζε: όηαλ θαλνληθνπνηνύκε, έρνπκε (N-1)*(N-2) αληί γηα (N-1)*(N-2)/2, επεηδή ππάξρνπλ δηπιάζηα ordered δεύγε απ όηη unordered δεύγε ' C B (i) C B (i)/[(n 1)(N 2)] 32
Σύνοψη Κεντρικότητα Πολλές μετρικές: degree, betweenness, closeness, bridging και οι group versions αυτών, π.χ., Group Betweenness Centrality Θα δούμε και τις φασματικές κεντρικότητες (spectral centralities), όπως η Katz, PageRank, Bonacich στην επόμενη διάλεξη Μπορεί να είναι ανομοιόμορφα κατανεμημένες Μέτρηση με την έννοια της centralization Επεκτάσεις σε κατευθυνόμενα δίκτυα: Prestige 33
Οικογένειες μετρικών κεντρικότητας Centrality metrics Geodesic-based Degree-based Influence-based Shortest-Path Betweenness Power Community Index Spectral Percolation Control Stress Degree Katz status index Closeness PageRank Bridging Bonacich Information 34