Τυχαία Γραφήματα. Τυχαία Δίκτυα. Τρία μοντέλα τυχαίων γραφημάτων Η συνάρτηση κατωφλίου και παραδείγματα με την R Μέσος βαθμός, μέσο μήκος μονοπατιών,

Σχετικά έγγραφα
1. Σε ένα τουρνουά με 8 παίκτες μπορεί οι παίκτες να συμμετείχαν σε: 6,5,4,4,4,3,1,1 αγώνες αντίστοιχα;

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

u v 4 w G 2 G 1 u v w x y z 4

S A : N G (S) N G (S) + d S d + d = S

Διάλεξη 7: X Y Σχήμα 7.2: Παράδειγμα για το Πόρισμα 7.2, όπου: 1 = {1, 2, 5}, 2 = {1, 2, 3}, 3 = {4}, 4 = {1, 3, 4}. Θ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Έξι βαθμοί διαχωρισμού

d(v) = 3 S. q(g \ S) S

Τίτλος Μαθήματος: Θεωρία Γραφημάτων. Ενότητα: Εισαγωγή σε βασικές έννοιες. Διδάσκων: Λέκτορας Xάρης Παπαδόπουλος. Τμήμα: Μαθηματικών

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Τυχαίοι γράφοι Η διάμετρος του G(n, 2 ln n/n) Ioannis Giotis

Το πιο απλό δίκτυο είναι η δυάδα ή το ζευγάρι. Οι δυάδες συνδέονται μεταξύ τους για να δημιουργήσουν μεγαλύτερα δίκτυα

Θεωρία Γραφημάτων 5η Διάλεξη

q(g \ S ) = q(g \ S) S + d = S.

Σύνθετα Δίκτυα. com+plex: with+ -fold (having parts) Διδάζκων Δημήηριος Καηζαρός

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

P (A B) = P (AB) P (B) P (A B) = P (A) P (A B) = P (A) P (B)

Αριθμητική Ανάλυση και Εφαρμογές

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Αλγόριθµοι και Πολυπλοκότητα

Διάλεξη 4: Απόδειξη: Για την κατεύθυνση, παρατηρούμε ότι διαγράφοντας μια κορυφή δεν μπορούμε να διαχωρίσουμε τα u και v. Αποδεικνύουμε

Θεωρία Γραφημάτων 5η Διάλεξη

Ασκήσεις στους Γράφους. 1 ο Σετ Ασκήσεων Βαθμός Μονοπάτια Κύκλος Euler Κύκλος Hamilton Συνεκτικότητα

Θεωρία Γραφημάτων 6η Διάλεξη

jτο πλήθος των ταξιδιών που κάνει η αεροσυνοδός µέχρι την j ηµέρα. Σχηµατίζω µία ακολουθία που αποτελείται από τα a.

Οδηγίες για το SKETCHPAD Μωυσιάδης Πολυχρόνης - Δόρτσιος Κώστας. Με την εκτέλεση του Sketchpad παίρνουμε το παρακάτω παράθυρο σχεδίασης:

P(200 X 232) = =

Network Science. Θεωρεία Γραφηµάτων (2)

3. Κατανομές πιθανότητας

Τυχαία και Κοινωνικά Δίκτυα Random and Social Networks

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

Πανεπιστήμιο Στερεάς Ελλάδας Τμήμα Πληροφορικής Εξάμηνο ΣΤ ΘΕΩΡΙΑ ΓΡΑΦΩΝ

HMY 795: Αναγνώριση Προτύπων

Διάλεξη 4: Θεωρία Γραφημάτων Γραφέας: Σ. Κ. Διδάσκων: Σταύρος Κολλιόπουλος συνεκτικά γραφήματα (συνέχεια) Πρόταση 4.1 Δύο μπλοκ ενός

z 1 E(G) 2(k 1) = 2k 3. x z 2 H 1 H 2

ΠΛΗ 20, 4 η ΟΣΣ: Βασικές Έννοιες Θεωρίας Γραφημάτων

Θεωρία Γραφημάτων 11η Διάλεξη

Τυχαία μεταβλητή (τ.μ.)

e 2 S F = [V (H), V (H)]. 3-1 e 1 e 3

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

Θεωρία Γραφημάτων 4η Διάλεξη

Μέτρα σε δίκτυα-ιδιότητες και εφαρμογές

Θεωρία Γραφημάτων: Ορολογία και Βασικές Έννοιες

ΠΛΗ 20, 4 η ΟΣΣ: Βασικές Έννοιες Θεωρίας Γραφημάτων

Βασικές Έννοιες Θεωρίας Γραφημάτων

Στατιστική Συμπερασματολογία

Ξέρουμε ότι: Συνάρτηση-απεικόνιση με πεδίο ορισμού ένα σύνολο Α και πεδίο τιμών ένα σύνολο Β είναι κάθε μονοσήμαντη απεικόνιση f του Α στο Β.

Μη κατευθυνόµενα γραφήµατα. Στοιχεία Θεωρίας Γραφηµάτων (1) Υπογραφήµατα.

Αριθμητική Ανάλυση και Εφαρμογές

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

2 ) d i = 2e 28, i=1. a b c

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

Βασικές Έννοιες Θεωρίας Γραφημάτων

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

E(G) 2(k 1) = 2k 3.

Η Θεωρία στα Μαθηματικά κατεύθυνσης της Γ Λυκείου

Θεωρία Γραφημάτων και Εφαρμογές - Διακριτά Μαθηματικά ΙΙ Φεβρουάριος 2017

έντρα ιδάσκοντες:. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

1 Η εναλλάσσουσα ομάδα

Στοχαστικές Στρατηγικές

Γνωστό: P (M) = 2 M = τρόποι επιλογής υποσυνόλου του M. Π.χ. M = {A, B, C} π. 1. Π.χ.

Αλγόριθμοι εύρεσης ελάχιστων γεννητικών δέντρων (MST)

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόγχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΦΡΟΝΤΙΣΤΗΡΙΟ ΑΛΓΟΡΙΘΜΩΝ ΒΟΗΘΟΣ: ΒΑΓΓΕΛΗΣ ΔΟΥΡΟΣ

... a b c d. b d a c

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΧΑΡΑΚΤΗΡΙΣΤΙΚΟ ΠΟΛΥΩΝΥΜΟ ΠΙΝΑΚΑ: Έστω Α ένας n nπίνακας επί ενός σώματος F. Για χ στο F, ορίζεται το πολυώνυμο ( ως προς χ ) : h ( x) = det( A- xi ).

Θεωρία Γραφημάτων: Ορολογία και Βασικές Έννοιες

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

Η κεντρικότητα στην χωροθέτηση επιχειρήσεων σε οδικό δικτυο

ιδάσκοντες: Φ. Αφράτη,. Φωτάκης,. Σούλιου Επιμέλεια διαφανειών:. Φωτάκης Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Μαθηματική Εισαγωγή Συναρτήσεις

ΑΝΑΛΥΣΗ 1 ΕΙΚΟΣΤΟ ΠΡΩΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

ΠΛΗ 20, 4 η ΟΣΣ: Βασικές Έννοιες Θεωρίας Γραφημάτων

Μαθηματική Εισαγωγή Συναρτήσεις

m = 18 και m = G 2

Κατανεμημένα Συστήματα Ι

ΜΑΘΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Network Science Θεωρεία Γραφηµάτων (1)

Σημειωματάριο Δευτέρας 4 Δεκ. 2017

ΓΕΛ ΝΕΑΣ ΠΕΡΑΜΟΥ ΠΙΘΑΝΟΤΗΤΕΣ ΚΛΑΣΙΚΟΣ ΟΡΙΣΜΟΣ-ΛΟΓΙΣΜΟΣ. Στατιστική ομαλότητα ή Νόμος των μεγάλων αριθμών

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Μαθηματικά Πληροφορικής Πιθανοτικά Εργαλεία. Υποπροσθετικότητα. Η Πιθανοτική Μέθοδος (The Probabilistic Method)

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Transcript:

Τυχαία Γραφήματα Τρία μοντέλα τυχαίων γραφημάτων Η συνάρτηση κατωφλίου και παραδείγματα με την R Μέσος βαθμός, μέσο μήκος μονοπατιών, Τυχαία Δίκτυα Ένα τυχαίο δίκτυο σχηματίζεται από ένα σύνολο V={v,v,,v }, n κορυφών, στο οποίο προσθέτουμε ακμές με τυχαίο τρόπο. Υπάρχουν διάφοροι τρόποι να επιλέξουμε τυχαία τις ακμές που οδηγούν σε διαφορετικά μοντέλα και σε διαφορετικές κατανομές πιθανοτήτων στα γραφήματα που προκύπτουν. Τα συνήθη μοντέλα που μελετήθηκαν είναι: -2-

Το μοντέλο Erdős Rényi (G(n, M)) Στο μοντέλο G(n, M) αντιστοιχίζεται ίση πιθανότητα σε όλα τα γραφήματα που έχουν ακριβώς Μ ακμές (0 M N), όπου N = n 2. Αφού το ζητούμενο είναι να σχηματιστεί γράφημα με Μ ακμές, οι N οποίες είναι από τις Ν υπάρχουσες, άρα υπάρχουν M τρόποι επιλογής αυτών των M ακμών, που είναι ισοπίθανες. N Έτσι ο δειγματοχώρος G(n, M) περιέχει στοιχεία καθένα με M N πιθανότητα. M Το Μ, σχεδόν πάντα, είναι συνάρτηση του n, δηλαδή M =M(n)και τότε το μοντέλο συμβολίζεται G(n, M n). Το μοντέλο αυτό ορίστηκε αρχικά στην εργασία On Random Graphs I (959) των Erdős και Rényi (από όπου προέρχεται και η ονομασία) Το μοντέλο Gilbert (G(n, p)) Στο μοντέλο G(n, p) θεωρείται ότι κάθε μία από τις N = n 2 δυνατές ακμές που μπορούν να συνδέσουν δύο από τις n κορυφές, επιλέγεται με πιθανότητα p, όπου 0 <p<. Ισοδύναμα μπορούμε να θεωρήσουμε ότι έχουμε το πλήρες γράφημα K και από αυτό διαγράφουμε τις ακμές του με πιθανότητα q = p. Ένα στοιχείο G στο δειγματοχώρο G(n,p) που έχει n κορυφές και m ακμές έχει πιθανότητα εμφάνισης P G =P G=G =p p Αν p = τότε G(n, ) είναι ο δειγματοχώρος που περιέχει όλα τα γραφήματα n κορυφών G με την ίδια πιθανότητα P G=G = Το μοντέλο αυτό προτάθηκε από τον Edgar Gilbert στην εργασία του Random Graphs (959). -3- -4-

Ο δειγματοχώρος G Θεωρούμε ένα τυχαίο γράφημα να σχηματίζεται ως εξής: Ξεκινούμε από το γράφημα n κορυφών χωρίς ακμές (G ). Φέρουμε μία ακμή ενώνοντας δύο από τις κορυφές, άρα σχηματίζεται το G (γράφημα με μία ακμή). Συνεχίζουμε, προσθέτοντας σε κάθε βήμα μία ακμή, σχηματίζοντας την ακολουθία γραφημάτων: G G G G όπου G γράφημα με ακριβώς t ακμές. Υπάρχουν Ν! τέτοιες ακολουθίες που συνιστούν το δειγματοχώρο G. Ο Bollobas (985) διαπίστωσε ότι οι τρεις χώροι που περιγράψαμε είναι περίπου ταυτόσημοι (closely related) Παράδειγμα στο χώρο G(3, m) Εδώ έχουμε 4 δειγματοχώρους για m = 0,, 2, 3, όλοι με ίσες πιθανότητες. 3 0 G(3,0) G(3,3) 3 0 = G(3,) 3 = 3 G(3,2) 3 2 = 3 3 3 = -5- -6-

Παράδειγμα στο χώρο G(3, p) Ποια η πιθανότητα ότι ένα τυχαίο γράφημα G στο χώρο G(3, p) να είναι συνδετικό; P A = 3p p +p =p (3 2p) Ποια η πιθανότητα ότι ένα τυχαίο γράφημα G στο χώρο G(3, p) να είναι διμερές; P B = p π.χ. αν p =, τότε P A =, P B = και P AB = δηλαδή τα γεγονότα το γράφημα είναι διμερές και είναι συνδετικό δεν είναι ανεξάρτητα. Παράδειγμα στο χώρο G(3, p) Ποια η μέση τιμή της τυχαίας μεταβλητής που δίνει το πλήθος των παραγόντων του γραφήματος; Εδώ οι παράγοντες είναι είτε, είτε 2 είτε 3 με πιθανότητα: k P(X=k) p +3p ( p) 3 p p p και άρα EX= P(X=+2 P(X=2+3 P X=3 = =p +3p p +2 3 p p +3 p = 3 3p + p -7- -8-

Παράδειγμα Ο δειγματοχώρος G με N! = 3 2!=6 στοιχεία, και P G G G G =! = Η κατανομή των βαθμών στο G(n, p) Αν μία κορυφή έχει βαθμό d τότε σημαίνει ότι d από τους n- δυνατούς n γείτονες, που επιλέγονται με τρόπους, συνδέθηκαν με πιθανότητα p d και οι υπόλοιποι δεν συνδέθηκαν με πιθανότητα p. Άρα η πιθανότητα να συμβαίνει αυτό είναι: P d = n p p d δηλαδή η τ.μ. που μετρά το βαθμό μιας κορυφής ακολουθεί διωνυμική κατανομή με μέση τιμή d = n pκαι διασπορά σ = n p( p). Αν τώρα αφήσουμε το n να τείνει στο άπειρο, τότε η κανονική τείνει σε Poisson, P d = e n p d! Αντίστροφα, αν θεωρήσουμε ένα τυχαίο δίκτυο στο οποίο οι βαθμοί των κορυφών είναι ισόνομες και ανεξάρτητες κατανομές Poisson(λ) με λ=n(p-) (i.i.d. Poisson(λ) distributions), τότε διαπιστώνεται ότι αυτό είναι ισοδύναμο με το Erdős Rényi μοντέλο, του n τείνοντος στο άπειρο. Για το λόγο αυτό τα μοντέλα αυτά λέγονται επίσης μοντέλα Poisson. -9- -0-

Παράδειγμα G(00, 0.0) Min. st Qu. Median Mean 3rd Qu. Max. Variance 0.00 0.00.00.04 2.00 4.00,02 Κατανομή Βαθμών P(0) = 0.35345468 P() = 0.36759287 P(2) = 0.94829 P(3) = 0.06626474 P(4) = 0.0722883 Άσκηση Έστω G τυχαίο γράφημα στο G(50, 0.02) α) Ποιο μέρος των κορυφών του G αναμένεται να έχουν βαθμό ; β) Ποιο μέρος των κορυφών του G αναμένεται να έχουν βαθμό τουλάχιστον ίσο με ; γ) Ποια η πιθανότητα να υπάρχει κορυφή στο G με βαθμό 5; -- -2-

Ιδιότητες του μοντέλου G(n, p) Ποιες είναι οι ιδιότητες (τοπολογικά χαρακτηριστικά) του μοντέλου G(n, p); Είναι συνδετικό; Έχει κύκλους ή είναι δέντρο-δάσος; Υπάρχει συσχέτιση των βαθμών των γειτόνων; Ποιες κορυφές παίζουν κεντρικό ρόλο; Υπάρχουν κλίκες; Υπάρχουν κοινότητες; Πολλές από τις ιδιότητες αυτές εμφανίζονται ξαφνικά καθώς η πιθανότητα p αυξάνει από 0 έως. Υπάρχει μία χαρακτηριστική τιμή, ένα κατώφλι, που από κει και μετά εμφανίζεται κάποια ιδιότητα. Συνάρτηση κατωφλίου για υπογραφήματα Αν Q η ιδιότητα ένα τυχαίο γράφημα περιέχει υπογράφημα με k κορυφές και l ακμές, αποδεικνύεται ότι η συνάρτηση p n = cn είναι συνάρτηση κατωφλίου. Π.χ. για να εμφανίζονται τρίγωνα στο τυχαίο γράφημα πρέπει p =, (διότι στο τρίγωνο k =3 και l =3) F F -3- -4-

Συνάρτηση κατωφλίου Οι R.Albert and A-L. Barabasi σε εργασία τους του 2002, βρήκαν ότι αν η πιθανότητα p είναι ανάλογη της δύναμης n,όπου το z παίρνει τιμές που φαίνονται στην πρώτη γραμμή του παρακάτω σχήματος : Τότε στο τυχαίο γράφημα θα αρχίσουν να εμφανίζονται δομές όπως αυτές που φαίνονται στη δεύτερη γραμμή του σχήματος. n = 00, M = 50 n 2 p M άρα p ( ) n = 00, p = 0.0 βαθμοί 0 34 38 22 6 βαθμοί 0 4 38 33 8 9 2-5- -6-

n = 00, p = 00 n = 00, p = 5 00 βαθμοί 0 00 βαθμοί 0 98 2-7- n = 00, p = 00 / n = 00, p = 00 / βαθμοί 0 2 95 4 βαθμοί 0 2 85 4-8-

n = 00, p = 00 / n = 00, p =. 00 βαθμοί 0 2 76 22 2 βαθμοί 0 4 44 27 25 3 n = 00, p = 00 / βαθμοί 4 5 6 7 8 9 0 7 9 7 6 20 5 9 3 3-9- -20-

n = 00, p = 00 / βαθμοί 3 4 5 6 7 8 9 0 4 5 6 2 4 7 9 0 3 4 0 0 0 4 5 Μέσος βαθμός, διάμετρος κτλ Σχέση μεταξύ G(n, p) και G(n, M) M= n p άρα p= και d = 2 =p(n ) ( ) Λόγω της ξαφνικής εμφάνισης ιδιοτήτων, η διάμετρος εκτιμάται διαφορετικά για διάφορες τιμές της p: Αν p <, τότε η διάμετρος είναι αυτή ενός παράγοντα δέντρου και είναι L =log n /log(p n ) Αν p >, τότε εμφανίζεται γιγάντια συνιστώσα και αν p. τότε η διάμετρος είναι αυτή της γιγάντιας συνιστώσας και είναι L = log n /log(p n ) Αν p > ( ), τότε το γράφημα είναι σχεδόν βέβαια συνδετικό και η διάμετρος εκτιμάται ίση με L = +ε log n /log(p n ) -2- -22-

Μέσο μήκος μονοπατιών Ο Fronczak κ.α. το 2004 έδειξε ότι για μεγάλα τυχαία γραφήματα το μέσο μήκος μονοπατιού (ή η μέση απόσταση μεταξύ των κορυφών) ισούται με: l = +0.5, όπου γ 0.5772 η σταθερά Euler Δηλαδή αυξανομένου του n και ανάλογα με το p, το μέσο μήκος μονοπατιού αυξάνει, όμως η αύξηση είναι πολύ μικρή όπως φαίνεται στο σχήμα. -23- Πλήθος τριγώνων και τριάδων σε γράφημα Έστω N συμβολίζει το σύνολο των γειτόνων της κορυφής v, και k τον πληθικό αριθμό του N (επομένως k ισούται με τον βαθμό της κορυφής v). Τότε το σύνολο των τριγώνων με κορυφή v, έστω τ(v), δίνεται από τον πληθικό αριθμό τ v = u, w E: u, w N, δηλ. με το πλήθος των συνδέσεων μεταξύ των γειτόνων μεταξύ τους. Αθροίζοντας για όλες τις κορυφές βρίσκουμε το σύνολο των τριγώνων του G, ίσο με: τ G = τ v, 3 διότι κάθε τρίγωνο το μετρούμε τρεις φορές, μία για κάθε κορυφή του. Το πλήθος των τριάδων ρ(v) (δηλαδή μονοπατιών μήκους 2) με κέντρο μια κορυφή v ισούται με το πλήθος των συνδυασμών των γειτόνων ανά δύο, δηλαδή: ρ v = k = k k, 2 2 και αθροίζοντας βρίσκουμε όλες τις τριάδες του G, που είναι: ρ G = ρ v = k k. 2-24-

Συντελεστές και μέτρα Συντελεστής Σύμπλεξης Λόγος μεταβατικότητας Μέτρα Κεντρικότητας Βαθμική κεντρικότητα Ιδιοκεντρικότητα Κατά Katz κεντρικότητα Βαθμική κεντρικότητα Page Κεντρικότητα Εγγύτητας Ενδιάμεση Κεντρικότητα Συντελεστής σύμπλεξης (clustering coefficient) Ο συντελεστής σύμπλεξης μιας κορυφής v μετρά κατά πόσον οι γείτονές της απέχουν από το να αποτελούν κλίκα. Ορίζεται από τη σχέση: τ v πλήθος τριγώνων με κορυφή την v C v = = ρ v πλήθος τριάδων με κορυφή την v, στην περίπτωση που ο βαθμός της v είναι k 2, ενώ θεωρείται ίσος με 0, αν ο βαθμός είναι το πολύ ίσος με. Η ελάχιστη τιμή του C v είναι 0 και πετυχαίνεται όταν το G είναι αστέρι με κορυφή v (τότε οι γείτονες της v σχηματίζουν πλήρως ασυνδετικό γράφημα). Η μέγιστη τιμή του C v είναι και πετυχαίνεται όταν το G είναι κλίκα (τότε και οι γείτονες της v σχηματίζουν πλήρες γράφημα δηλ. κλίκα). Ο μέσος όρος των συντελεστών σύμπλεξης όλων των κορυφών ονομάζεται συντελεστής σύμπλεξης το γραφήματος, δηλαδή: C G = C v n Η ελάχιστη τιμή του C G είναι 0 και πετυχαίνεται όταν το G είναι πλήρως ασυνδετικό γράφημα και η μέγιστη τιμή του είναι που πετυχαίνεται όταν το G είναι πλήρες γράφημα).. -25- -26-

Μεταβατικότητα Σε ένα τυχαίο κοινωνικό δίκτυο Poisson ένα από τα ζητούμενα είναι αν, στην περίπτωση που ο k έχει φίλους τον i και τον j, οι i και j είναι φίλοι μεταξύ τους. Αν δηλαδή οι φίλοι μου είναι και μεταξύ τους φίλοι. Μια τέτοια τριάδα θεωρείται μεταβατική τριάδα. Προφανώς κάθε τρίγωνο δίνει τρεις μεταβατικές τριάδες. Αν η πιθανότητα στο δίκτυο είναι p τότε: P i εἰναι φἰλος του j = P υπάρχει η ακμἠ i, j = p Οπότε: P i, j εἰναι φἰλοι δοθἐντος ότι και οι δύο εἰναι φἰλοι του k = P i, j, k εἰναι όλοι φἰλοι /P i, j εἰναι φἰλοι του k =p /p =p k i j Συντελεστής μεταβατικότητας (transitivity ratio) Ο λόγος μεταβατικότητας (transitivity ratio) ενός γραφήματος G ορίζεται ως ο λόγος: πλἠθος μεταβατικών τριάδων T G = πλἠθος δυνατών συνδετικών τριάδων 3 πλἠθος τριγώνων του G = πλἠθος δυνατών συνδετικώντριάδων του G T G = 3 τ(g) ρ(g) = τ v ρ v Ο λόγος μεταβατικότητας (Transitivity ratio) δεν ταυτίζεται με το συντελεστή σύμπλεξης όπως εύκολα προκύπτει από παραδείγματα -27- -28-

5 Παράδειγμα v τ(v) ρ(v) C(v) 4 6 2 2/3 3 3 6 /2 4 2 6 /3 5 6 0 0 0 Ο συντελεστής σύμπλεξης κάθε κορυφής δίνεται στον πίνακα (τελευταία στήλη). Ο συντελεστής σύμπλεξης του γραφήματος είναι: C G = C v n Ο λόγος μεταβατικότητας του γραφήματος είναι: τ v T G = ρ v = + + 2 + 3 ++0 6 = 7 2 = +2+3+2++0 + 3 + 6 + 6 + + 0 = 9 7-29- Centrality Measures Μέτρα κεντρικότητας Ποιες είναι οι «σημαντικότερες» κορυφές; Ως προς ποια κριτήρια; Πλήθος Συνδέσεων Σημαντικότητα συνδέσεων Μικρότερες αποστάσεις Κομβική σπουδαιότητα Έχουν οριστεί διάφορα μέτρα κεντρικότητας (centrality measures) 30

Βαθμική Κεντρικότητα (Degree Centrality) Ο βαθμός κορυφής deg v, δηλ. το πλήθος ακμών που συνδέονται με την κορυφή, είναι ένας δείκτης κεντρικότητας. Η Βαθμική Κεντρικότητα ορίζεται ως το πηλίκο deg v n Αντικαθιστώντας το βαθμό με τον έσω- (ή έξω-) βαθμό (σε κατευθυνόμενα γραφήματα) έχουμε ανάλογα εσω-(έξω-) βαθμική κεντρικότητα. Σε κοινωνικά δίκτυα σημαίνει όσο περισσότερες φιλίες (γνωριμίες, σχέσεις) έχει ένα άτομο (κορυφή) τόσο σημαντικότερο είναι στο δίκτυο. 3 5 Παράδειγμα Βαθμοί κορυφών 4 5 6 4 6 4 4 2 Βαθμική κεντρικότητα 4 5 6 2 5 3 5 4 5 4 5 2 5 5 Βαθμική κεντρικότητα (κανονικοποιημένη) 4 5 6.50.75.50.25-32-

Ιδιοκεντρικότητα (Eigenvector Centrality) Είναι φυσική γενίκευση της βαθμικής κεντρικότητας (θα οριστεί πιο κάτω). Στο Σχήμα. Οι κορυφές, 6 έχουν βαθμό 3. Όμως οι γείτονες της έχουν συνολικό άθροισμα βαθμών 5, ενώ οι γείτονες της 6 έχουν συνολικό άθροισμα βαθμών. Αυτό μπορεί να ερμηνευτεί ότι η κορυφή 6 έχει μεγαλύτερη σημαντικότητα από την κορυφή (έχει βαθμικά σημαντικότερους γείτονες). Ιδιοκεντρικότητα Έστω ο πίνακας αντιστοίχισης του G, (i, j) E(G) A=(A, ), όπου A, = 0, (i, j) E(G) Αν x 0 ==,,, τότε x =Α x 0 (οι βαθμοί κορυφών) Διαπιστώνουμε x 2 =Α x =Α x 0 (είναι το άθροισμα βαθμών άμεσων γειτόνων) Συνεχίζοντας βρίσκουμε x n =Α x 0 (αθροίσματα n-τάξης) 33 34

Ιδιοκεντρικότητα Αποδεικνύεται ότι οριακά ισχύει x n k v, όπου v το ιδιοδιάνυσμα που αντιστοιχεί στη μεγαλύτερη ιδιοτιμή του πίνακα Α. Η κανονικοποιημένη μορφή (normalize) του ιδιοδιανύσματος v του πίνακα Α, δηλαδή αυτή που προκύπτει με διαίρεση των συνιστωσών του με το μέτρο του v, είναι η ιδιοκεντρικότητα των κορυφών του γραφήματος που παριστάνει το Α. 35 Ύπαρξη Ιδιοκεντρικότητας Η ύπαρξή του διανύσματος v και το ότι είναι πραγματικό και θετικό εξασφαλίζεται από το θεώρημα Peron-Frobenius (P-F). Πράγματι σε συνδετικά απλά γραφήματα ο πίνακας αντιστοίχισης είναι συμμετρικός και πρωταρχικός (δηλ. υπάρχει δύναμη του A, έστω η A, με όλα τα στοιχεία διάφορα του 0), προϋποθέσεις για την ισχύ του θεωρήματος P-F. Στα κατευθυνόμενα γραφήματα: δεν ορίζεται μονοσήμαντα το ιδιοδιάνυσμα της μέγιστης ιδιοτιμής. ο πίνακας Α είναι μη-συμμετρικός. Έτσι η ιδιοκεντρικότητα δεν λειτουργεί καλά. Η ιδιοκεντρικότητα ορίστηκε αρχικά από τον Bonacich το 987. 36

Κεντρικότητα Katz Είναι γενίκευση της ιδιοκεντρικότητας. Αν θεωρήσουμε την σχέση x =α A x +β για θετικές ποσότητες α, β, τότε είναι σαν να δίνουμε μία «ποσότητα κεντρικότητας» σε όλους τους κόμβους (να μην είναι 0). Προτάθηκε το 957 από τον Katz και υπολογίζεται από τη σχέση: x=β I αa Ως β μπορούμε να πάρουμε το, ενώ ως α μία τιμή μικρότερη του (στην οποία μηδενίζεται το διάνυσμα). WS.04 lecture on Random Graphs- C. Moyssiadis V. Karagiannis 37 Βαθμική κεντρικότητα Page (PageRank centrality) Η κατά Katz κεντρικότητα έχει το εξής μειονέκτημα: αν ένα κόμβος έχει μεγάλη κεντρικότητα, τότε και όσοι συνδέονται με αυτόν έχουν επίσης μεγάλη κεντρικότητα. Για παράδειγμα κάποιος κόμβος που συνδέεται με τη Google, ή την Yahoo που έχουν μεγάλη κεντρικότητα θα έχει και αυτός μεγάλη κεντρικότητα. Οι Larry Page και Sergey Brin που δημιούργησαν την Google ανέπτυξαν έναν νέο αλγόριθμο για αξιολόγηση της σημαντικότητας των σελίδων που συνδέονται με την Google, που ήταν βελτίωση της κατά Katz κεντρικότητας, που τον ονόμασαν PageRank centrality (Βαθμική κεντρικότητα Page). Αυτό που διορθώθηκε είναι ότι έγινε διαίρεση με τον εξω-βαθμό, δηλαδή: x =α A x k +β 38

Κεντρικότητα Εγγύτητας (closeness centrality) Αν d,j =,2,,d οι αποστάσεις της κορυφής i από τις άλλες κορυφές του γραφήματος, τότε: l = n d η μέση απόσταση, είναι μικρή για τις κεντρικές κορυφές και μεγαλύτερη για τις απομακρυσμένες κορυφές. Αν δεν υπάρχει μονοπάτι μεταξύ δύο κορυφών θέτουμε ως απόσταση το πλήθος όλων των κορυφών (αυθαίρετο). Η αντίστροφη ποσότητα C =, είναι η κεντρικότητα εγγύτητας. 39 Κεντρικότητα Εγγύτητας (συν.) Η κεντρικότητα αυτή χρησιμοποιείται πολύ σε κοινωνικά δίκτυα, έχει όμως κάποια μειονεκτήματα. Το εύρος των τιμών είναι πολύ μικρό και έτσι δεν μπορεί να γίνει καλός διαχωρισμός και ταξινόμηση των κορυφών ιδιαίτερα σε μεγάλα δίκτυα. Μεταβάλλεται εύκολα με την προσθήκη ή διαγραφή κορυφών. Έχουν προταθεί και άλλοι ορισμοί, όπως το να χρησιμοποιηθεί ο αρμονικός μέσος των αποστάσεων ο οποίος έχει ωραίες ιδιότητες και δεν έχει πρόβλημα με κορυφές που δεν συνδέονται, αφού το αντίστροφό τους είναι 0 και δεν μεταβάλλει την κεντρικότητα. 40

Ενδιάμεση Κεντρικότητα (betweenness centrality) Η ενδιάμεση κεντρικότητα μετρά το κατά πόσον μια κορυφή βρίσκεται σε μονοπάτια (γεωδαισιακές) μεταξύ άλλων κορυφών. Προτάθηκε από τον Freeman το 977, αλλά είχε ήδη προταθεί από τον Anthonisse σε αδημοσίευτη εργασία του. Αν n = όταν η κορυφή i βρίσκεται στη γεωδαισιακή που συνδέει τις κορυφές s, t και 0 σε άλλη περίπτωση, τότε η ενδιάμεση κεντρικότητα ορίζεται ως x=(x ), όπου x =, n, Η ενδιάμεση κορυφή έχει μικρή βαθμική κεντρικότητα αλλά μεγάλη ενδιάμεση κεντρικότητα Αν n το πλήθος των γεωδαισιακών από το s προς το t που περνούν από το i και g το πλήθος των γεωδαισιακών από το s προς το t, τότε η ενδιάμεση κεντρικότητα της κορυφής i γράφεται: x =,, 4 Μικρόκοσμοι και Αυτοόμοια Δίκτυα

Το πείραμα του Stanley Milgram (967) Ο ψυχολόγος Stanley Milgram θέλοντας να αποδείξει ότι οι άνθρωποι αλληλοσυνδέονται πολύ περισσότερο από όσο νομίζουμε, διάλεξε τυχαία 96 άτομα από τον τηλεφωνικό κατάλογο και τους έστειλα από ένα δέμα που είχε το λογότυπο του Harvard (όπου δίδασκε ο Milgram) που έπρεπε να το παραδώσουν σε κάποιον (που ήταν φίλος του Milgram) και για τον οποίο ξέρανε μόνο το όνομά του, τη διεύθυνσή του και το ότι ήταν χρηματιστής. Κάθε παραλήπτης διάβαζε στο δέμα ότι θα έπρεπε να στείλει το δέμα σε κάποιον γνωστό του που κατά τη γνώμη του να ήταν κοινωνικά πλησιέστερα στον τελικό παραλήπτη. Από τα 96 δέματα τα 8 πήγαν στον τελικό παραλήπτη, κάτι που ήταν περισσότερο από το αναμενόμενο. Σε μια μοντέρνα επανάληψη του πειράματος που έκανε ο Dodds το 2003, με αποστολή e-mails σε γνωστούς, η επιτυχία ήταν πολύ μικρότερη. Ο Milgram είχε ζητήσει από τους παραλήπτες των δεμάτων να σημειώνουν επάνω στο δέμα τα άτομα που συμμετείχαν στην αναζήτηση του τελικού παραλήπτη. Ο μέσος όρος των βημάτων που χρειάστηκαν ήταν 5.9 Real-World Networks - Small World Model While random graphs exhibit some futures of real-world networks (small diameters or average distances relative to growing average degree), they lack other characteristics. Stanley Milgram (967), Harvard, what is the probability that two randomly selected people would know each other? On average 5.5 hops (in a sparse network) Six degrees of separation Why? In social networks (which are sparse networks) it has observed that the friends of us are usually also friends between them, or in other words people tend to group into relative small (or large clusters) in a way that in some cases does not depend to the place of living. -43- -44-

Small World Model Ένα δίκτυο λέγεται μικρόκοσμος όταν η μέγιστη απόσταση μεταξύ των κορυφών του είναι σχετικά «μικρή». Αν δηλαδή το πλήθος των βημάτων ή hops μεταξύ τυχαία επιλεγμένων κόμβων είναι κατά κάποια έννοια μικρό. Ειδικότερα θα λέμε ότι ένα δίκτυο έχει την ιδιότητα του μικρόκοσμου (the small-world property) αν η μέση γεωδαισιακή απόσταση l μεταξύ των κόμβων του δικτύου είναι μικρή σε σχέση με το πλήθος Ν των κόμβων του δικτύου. Αυτή η σχέση συνήθως λαμβάνεται με το λογάριθμο του Ν. Δηλαδή θέλουμε η απόσταση l να μην αυξάνεται γρηγορότερα από το logn, ή όπως γράφουμε με το κεφαλαίο «Ο» να ισχύει l=o(logn) καθώς N. Η βάση των λογαρίθμων δεν ενδιαφέρει. Πιθανότητα επανασύνδεσης (rewiring probability) Αν έχουμε ένα κανονικό γράφημα με βαθμό κορυφών 2k, τότε μπορούμε να τοποθετήσουμε τις κορυφές του σε κυκλικό σχηματισμό, με τρόπο ώστε κάθε κορυφή να συνδέεται με τις k κοντινότερες κορυφές από δεξιά του και τις k κοντινότερες κορυφές από αριστερά του. Π.χ. Για n=20,k=2, έχουμε το παρακάτω σχήμα αριστερά. Έστω πιθανότητα p, π.χ. p = 0.2, με την οποία επιλέγουμε κάθε μία από τις υπάρχουσες, ακμές και τις επανασυνδέουμε (rewire) με πιθανότητα p, ή τις αφήνουμε όπως είναι με πιθανότητα p. Στο παράδειγμα Υπάρχουν =40ακμές και άρα αναμένεται 40 p = 40 0.2 = 8 να επανασυνδεθούν (σχήμα δεξιά). Η διάμετρος από 5 που ήταν αρχικά, έγινε 4 (π.χ. d(,3)=4), ενώ θεωρητικά αναμένονταν να είναι κοντά το 3, διότι log20 = 2.996 = 3. -45- -46-

Watts and Strogatz - Small World Model Η ιδέα του rewiring ξεκίνησε σε μια εργασία των Watts and Strogatz (998). Ξεκινώντας από ένα 2k-κανονικό γράφημα και αυξάνοντας την πιθανότητα επανασύνδεσης από 0 μέχρι μελέτησαν τα προκύπτοντα γραφήματα. Με p=0 έχουμε κανονικά γραφήματα, με p= έχουμε τυχαία δίκτυα ενώ με τιμές ενδιάμεσες παίρνουμε μικρόκοσμους. Αυτό φαίνεται στην παρακάτω εικόνα από την εργασία των Watts and Strogatz. Watts and Strogatz - Small World Model Από την ίδια εργασία των Watts and Strogatz διαπιστώνεται ότι όσο αυξάνει η Rewiring πιθανότητα τόσο μειώνεται το μέσο μήκος μονοπατιού, αρχικά απότομα και μετά αργά. Αντίθετα ο συντελεστής σύμπλεξης μειώνεται αρχικά αργά και για μεγάλα p απότομα. Αυτά φαίνονται στο παρακάτω σχήμα. Έτσι σε ένα μικρόκοσμο (π.χ. p=0.0) βλέπουμε ότι έχουμε σχεδόν ελάχιστη τιμή στο μέσο μήκος μονοπατιού, ενώ έχουμε σχετικά μεγάλο συντελεστή σύμπλεξης -47- -48-

Αυτοόμοια (scale-free) δίκτυα Έτσι ονομάζονται τα δίκτυα που η κατανομή των βαθμών τους είναι δυναμοκατανομή (power-low) αντί να είναι Poisson όπως είναι στα τυχαία δίκτυα Erdos-Renyi. Συμβαίνει στα δίκτυα αυτά η μορφή τους να είναι παρόμοια αν περιοριστούμε σε μέρη τους. Στο σχήμα το πράσινο δίκτυο είναι Poisson, το μώβ είναι αυτοόμοιο Παράδειγμα : World Wide Web Nodes: WWW documents Links: URL links ROBOT: collects all URL s found in a document and follows them recursively. Over 3 billion documents R. Albert, H. Jeong, A-L Barabasi, Nature, 40 30 (999). Expected Scale-free NetworkExponential Network P(k) ~ k - Found -49- -50-

Παράδειγμα: Σεξουαλικές σχέσεις Nodes: people (Females; Males) Links: sexual relationships 478 Swedes; 8-74; 59% response rate. Liljeros et al. Nature 200 Το μοντέλο BA (Barabasi-Albert) Έστω αρχικά ένα δίκτυο με m κορυφές. Αυξάνουμε τις κορυφές του δικτύου, ανά μία κάθε στιγμή (t =l,t=2,...)και τις ακμές του με τον εξής αλγόριθμο. Κάθε νέα κορυφή συνδέεται με m m ακμές με τις προϋπάρχουσες κορυφές ανάλογα με τον έως τότε βαθμό των κορυφών. Έτσι η πιθανότητα p η νέα κορυφή που προστέθηκε σε κάποιο βήμα να συνδεθεί με την κορυφή i είναι: p = k k = k 2M, όπου k είναι ο βαθμός της κορυφής i, το άθροισμα διατρέχει όλες τις προϋπάρχουσες κορυφές μέχρι τη στιγμή αυτή, και Μ το πλήθος των ακμών που είχε το δίκτυο πριν τη στιγμή αυτή. Ο τρόπος αυτός αρχίζει να ευνοεί κάποιους κόμβους οι οποίοι στη συνέχεια γίνονται όλο και περισσότερο πιθανό να συνδέονται με τους νέους κόμβους. Αυτοί οι κόμβοι λέγονται ομφαλοί (hubs). Η διαδικασία αυτή λέγεται preferential attachement. Θα μπορούσαμε εδώ να πούμε ότι στα δίκτυα αυτά οι «πλούσιοι γίνονται πλουσιότεροι» -5- -52-

The Matthew effect Σε μια παραλλαγή, ιδιαίτερα σε οικονομικά δίκτυα, εκτός από το να αυξάνουν (πλουτίζουν) αυτοί που έχουν ήδη πολλά, αυτοί οι κόμβοι που έχουν λίγες συνδέσεις με κάποια πιθανότητα τις χάνουν (φτωχαίνουν). Σε ένα τέτοιο μοντέλο θα λέγαμε ότι «οι πλούσιοι γίνονται πλουσιότεροι και οι φτωχοί φτωχότεροι». Αυτό το φαινόμενο που το παρατηρούμε και στην πραγματική ζωή λέγεται Matthew effect, από ένα απόσπασμα του «Κατά Ματθαίον» Ευαγγελίου, το 25:29, που λέει: «τῷ γὰρ ἔχοντι παντὶ δοθήσεται καὶ περισσευθήσεται, ἀπὸ δὲ τοῦ μὴ ἔχοντος καὶ ὃ ἔχει ἀρθήσεται ἀπ αὐτοῦ.» Ελεύθερη μετάφραση: «Στον καθένα που έχει θα δοθεί και θα περισσέψει, ενώ απ αυτόν που δεν έχει και αυτό που έχει θα του αφαιρεθεί» Preferential Attachment BA model -53- -54-

Preferential Attachment BA model Δεν δημιουργούνται κύκλοι στο μοντέλο ΒΑ The growth of BA network Albert-László Barabási, 2008-55- -56-

Ιδιότητες του μοντέλου ΒΑ Η κατανομή βαθμών είναι P(k)~k δηλαδή είναι «δυναμοκατανομή» (power low distribution) και το δίκτυο είναι ανεξάρτητο κλίμακος (scale free). Το «μέσο μήκος μονοπατιού» του μοντέλου ΒΑ είναι συστηματικά μικρότερο του αντίστοιχου μέσου μήκους μονοπατιού για τα τυχαία δίκτυα και εκφραζεται από τη σχέση l =. Έχει αποδειχθεί (Klemm and Eguiluz, Bollobas) ότι ο συντελεστής σύμπλεξης ακολουθεί ένα νόμο γινομένου C~N.. Αυτό συνιστά σημαντική διαφορά από τους μικρόκοσμους, όπου ο συντελεστής σύμπλεξης δεν έχει σχέση με το μέγεθος του δικτύου, αλλά ακολουθεί ένα νόμο γινομένου ως προς το βαθμό κάποιας κορυφής C(k)~k. Δίκτυο συνεργασιών του ΕΣΙ -57- -58-