Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Σχετικά έγγραφα
Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

Κοινωνικά Δίκτυα Χαρακτηριστικά & Μοντέλα Γράφων

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθμοι Γραφημάτων

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Γράφημα. Συνδυαστικό αντικείμενο που αποτελείται από 2 σύνολα: Σύνολο κορυφών (vertex set) Σύνολο ακμών (edge set) 4 5 πλήθος κορυφών πλήθος ακμών

Κεφάλαιο 3. Γραφήµατα v1.0 ( ) Χρησιµοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Διάλεξη 29: Γράφοι. Διδάσκων: Παναγιώτης Ανδρέου

ΔΙΑΣΧΙΣΗ ΓΡΑΦΗΜΑΤΩΝ 1

Έξι βαθμοί διαχωρισμού

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Αλγόριθμοι για Ασύρματα Δίκτυα. Θεωρία Γραφημάτων

Κεφάλαιο 3. Γραφήµατα v1.1 ( ) Χρησιµοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Κεφάλαιο 3. Γραφήματα. v1.3 ( ) Χρησιμοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

ΕΠΛ 231 Δοµές Δεδοµένων και Αλγόριθµοι 11-1

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σχήμα 8.46: Δίκτυο αεραγωγών παραδείγματος.

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Network Science. Θεωρεία Γραφηµάτων (2)

Στοιχεία Θεωρίας Γράφων (Graph Theory)

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Γραφήματα. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Μετασχηματισμοί, Αναπαράσταση και Ισομορφισμός Γραφημάτων

Βασικές Δοµές Δεδοµένων. Σύντοµη επανάληψη (ΕΠΛ 035).

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου

Κατανεμημένα Συστήματα Ι

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόγχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

ΠΛΗ 20, 4 η ΟΣΣ: Βασικές Έννοιες Θεωρίας Γραφημάτων

Κυκλώματα με ημιτονοειδή διέγερση

HY118- ιακριτά Μαθηµατικά. Θεωρία γράφων / γραφήµατα. Τι είναι οι γράφοι; Εφαρµογές των γράφων Γράφοι

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Γράφηµα (Graph) Εργαστήριο 10. Εισαγωγή

6. Στατιστικές μέθοδοι εκπαίδευσης

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο

Αναγνώριση Προτύπων Ι

Εύρεση ν-στού πρώτου αριθμού

Άλγεβρα Α Λυκείου Κεφάλαιο 2ο. οι πράξεις και οι ιδιότητές τους

Κατανεμημένα Συστήματα Ι

3. Προσομοίωση ενός Συστήματος Αναμονής.

Θέματα Υπολογισμού στον Πολιτισμό - Δένδρα. Δένδρα

ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Δομές Δεδομένων και Αλγόριθμοι

21/11/2013 ETY-202 ETY-202 ΎΛΗ & ΦΩΣ 06. Ο ΑΡΜΟΝΙΚΟΣ ΤΑΛΑΝΤΩΤΗΣ. 1396; office Δ013 ΙΤΕ. Στέλιος Τζωρτζάκης

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 1: Δικτυωτή Ανάλυση (Θεωρία Γράφων)

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΛΗ 20, 5 η ΟΣΣ: Θεωρία Γραφημάτων

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Αναζήτηση Κατά Πλάτος

Γράφοι. Ορολογία. Ορισµός: G = (V, E) όπου. Ορολογία (συνέχεια) γράφος ή γράφηµα (graph) V:ένα σύνολο E:µια διµελής σχέση στο V

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Θεωρία Γραφημάτων 6η Διάλεξη

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Εισαγωγή στην Επιστήμη των Υπολογιστών

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων

Κατανεμημένα Συστήματα Ι

Εισαγωγή στην Επιστήμη των Υπολογιστών

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

Γράφοι. Ένας γράφος ή αλλιώς γράφηµα αποτελείται απο. Εφαρµογές: Τηλεπικοινωνιακά και Οδικά ίκτυα, Ηλεκτρονικά Κυκλώµατα, Β.. κ.ά.

Σειρά Προβλημάτων 1 Λύσεις

3η Σειρά Γραπτών Ασκήσεων

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

ΚΕΦΑΛΑΙΟ 4 ο : ΑΝΙΣΩΣΕΙΣ ΤΟ 2 Ο ΘΕΜΑ

ΠΛΗ 20, 5 η ΟΣΣ: Θεωρία Γραφημάτων

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Δοµές Δεδοµένων & Ανάλυση Αλγορίθµων 3ο Εξάµηνο. Γραφήµατα. (Graphs)

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Ανάλυση Ηλεκτρικών Κυκλωμάτων

Γράφοι: κατευθυνόμενοι και μη

Δυναμικές Δομές Δεδομένων Λίστες Δένδρα - Γράφοι

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Αριθμητική Ανάλυση και Εφαρμογές

Αναζήτηση Κατά Πλάτος

Ομαδοποίηση ΙΙ (Clustering)

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

Πανεπιστήμιο Στερεάς Ελλάδας Τμήμα Πληροφορικής Εξάμηνο ΣΤ ΘΕΩΡΙΑ ΓΡΑΦΩΝ

Μέθοδος μέγιστης πιθανοφάνειας

Αριθμητική Ανάλυση & Εφαρμογές

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Μαθηματική Εισαγωγή Συναρτήσεις

ΕΠΛ 231 οµές εδοµένων και Αλγόριθµοι Άννα Φιλίππου,

Αναγνώριση Προτύπων Ι

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

Εφαρμοσμένα Μαθηματικά ΙΙ 7ο Σετ Ασκήσεων (Λύσεις) Ορίζουσες Επιμέλεια: Ι. Λυχναρόπουλος

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ C ΣΕΙΡΑ 1 η

Bubble Hack Οπτικοποίηση του αλγορίθμου ταξινόμησης Bubble Sort στο Scratch

Transcript:

ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΓΡΑΦΩΝ Οι γράφοι μας επιτρέπουν να αποτυπώσουμε τη δομή διαφόρων κοινωνικών δικτύων δεδομένου ότι μπορούν να αναπαραστήσουν σχέσεις ανάμεσα σε ένα σύνολο αντικειμένων. Ένας γράφος αποτελείται από ένα σύνολο αντικειμένων που ονομάζονται κόμβοι (nodes) και από ένα σύνολο ζευγών από αντικείμενα τα οποία αποτελούν τις ακμές (edges) του γράφου. Δύο κόμβοι που συνδέονται με μια ακμή χαρακτηρίζονται ως γείτονες (neighbors). Όταν κάθε ακμή ενός γράφου έχει μια συγκεκριμένη κατεύθυνση, αναπαριστά δηλαδή μια συμμετρική σχέση μεταξύ δύο κόμβων, τότε ο γράφος ονομάζεται κατευθυνόμενος (directed). Παραδείγματα κατευθυνόμενων ακμών σε κοινωνικά δίκτυα αποτελούν ακμές που αναπαριστούν σχέσεις προγόνων-απογόνων σε γενεαλογίες ή αγαπημένους καλλιτέχνες. Στην αντίθετη περίπτωση ο γράφος ονομάζεται μη κατευθυνόμενος (non-directed) (π.χ. σχέσεις μεταξύ αδελφών σε γενεαλογίες ή μέλη αθλητικών ομάδων). Υπάρχουν δύο κύριοι τρόποι αναπαράστασης των ακμών σε έναν γράφο, οι πίνακες γειτνίασης και οι λίστες γειτνίασης. Ο πίνακας γειτνίασης Adj για ένα γράφο n κόμβων έχει διάσταση nxn. Η γραμμή i και η στήλη i του Adj αντιστοιχούν στον i-στο κόμβο του γράφου, Στον πίνακα Adj η τιμή ενός κελιού i, j υπολογίζεται ως εξής: Adj[i,j] = 1 όταν οι κόμβοι i και j συνδέονται με μια ακμή 0 σε όλες τις άλλες περιπτώσεις Σε έναν πίνακα γειτνίασης η τιμή ενός κελιού μπορεί να λαμβάνει πραγματικές τιμές οι οποίες αντιστοιχούν στο βάρος (weight) κάθε ακμής. Το βάρος μιας ακμής σε ένα κοινωνικό δίκτυο μπορεί να υποδηλώνει διάφορα χαρακτηριστικά της ακμής όπως την ισχύ της σύνδεσης μεταξύ δύο κόμβων, την απόσταση τους κλπ. Επίσης οι πίνακες γειτνίασης διευκολύνουν τον υπολογισμό συγκεκριμένων χαρακτηριστικών στους γράφους. Για παράδειγμα, ο υπολογισμός του αριθμού των μονοπατιών μήκους n που συνδέουν οποιουσδήποτε δυο κόμβους επιτυγχάνεται υψώνοντας τον Adj στη n-στη δύναμη (Adj n ). Ο δεύτερος τρόπος χρησιμοποιεί λίστες γειτνίασης (adjacency lists). Στην περίπτωση αυτή οι κόμβοι του γράφου αποθηκεύονται σε έναν μονοδιάστατο πίνακα nx1 από κάθε θέση i του οποίου κρέμεται μια λίστα με όλους τους κόμβους που γειτνιάζουν με τον i-στο κόμβο. Οι πίνακες γειτνίασης προσφέρουν καλύτερη ταχύτητα ανάκτησης δεδομένων από ότι οι λίστες γειτνίασης αλλά η συνολική μνήμη που απαιτούν είναι σταθερή (nxn θέσεις). Αυτό σημαίνει ότι σε περίπτωση αραιών γράφων (δηλ. γράφων με συνολικό αριθμό ακμών μικρότερο από το 10% του αριθμού των κόμβων τους) οι πίνακες γειτνίασης χρησιμοποιούν αρκετή περιττή μνήμη. Σε αυτή την περίπτωση οι λίστες γειτνίασης υπερτερούν έναντι των πινάκων γειτνίασης. Ένα σημαντικό χαρακτηριστικό των κόμβων ενός γράφου είναι ο βαθμός (degree) τους. Ο έσωβαθμός (in-degree) ενός κόμβου ισούται με τον αριθμό ταν ακμών που καταλήγουν σε αυτόν ενώ ο έξω-βαθμός (out-degree) ισούται με τον αριθμό των ακμών που αρχίζουν από αυτόν. Το άθροισμα του έσω- και του εξω-βαθμού ενός κόμβου καθορίζει τον βαθμό του. Όπως θα δούμε αργότερα ο βαθμός ενός κόμβου χρησιμοποιείται στα κοινωνικά δίκτυα για να χαρακτηρίσει τη δημοφιλία του συγκεκριμένου κόμβου. Ένα μονοπάτι (path) σε έναν γράφο είναι μια ακολουθία κόμβων στην οποία κάθε ζευγάρι διαδοχικών κόμβων συνδέεται με μια ακμή. Ένα μονοπάτι στο οποίο κάθε κόμβος εμφανίζεται μια και μόνο φορά ονομάζεται απλό. Μια σημαντική περίπτωση μη απλού μονοπατιού αποτελεί ο

κύκλος (cycle). Ένας κύκλος ορίζεται ως ένα μονοπάτι στο οποίο ο αρχικός και ο τελικός κόμβος είναι ίδιοι. Σε αρκετές περιπτώσεις οι κύκλοι στα δίκτυα χρησιμοποιούνται για να εξασφαλίσουν εναλλακτικούς τρόπους διάσχισης όταν ορισμένες από τις ακμές παύουν να είναι ενεργές. Σε κοινωνικά δίκτυα κύκλοι εμφανίζονται σε περιπτώσεις κοινών γνωστών αποτελώντας με αυτόν τον τρόπο τη βάση για τη δημιουργία ευρύτερων κοινωνικών ομάδων. Ένας γράφος ονομάζεται συνδεδεμένος (connected) όταν για κάθε ζεύγος κόμβων υπάρχει τουλάχιστον ένα μονοπάτι που τους συνδέει. Τα δίκτυα επικοινωνιών αποτελούν μια κλασσική περίπτωση συνδεδεμένων γράφων ενώ το ίδιο δεν συμβαίνει με τα κοινωνικά δίκτυα στα οποία μπορεί να εμφανίζονται κόμβοι που είναι μεταξύ τους ασύνδετοι. Το ενδιαφέρον χαρακτηριστικό των μη συνδεδεμένων γράφων είναι ότι μπορούν να αναλυθούν σε συνδεδεμένους υπογράφους. Πιο συγκεκριμένα ορίζουμε ως μια συνδεδεμένη συνιστώσα (connected component) ενός γράφου ένα υποσύνολο των κόμβων του, τέτοιο ώστε να υπάρχει ένα τουλάχιστον μονοπάτι μεταξύ δυο οποιωνδήποτε κόμβων στο υποσύνολο και το συγκεκριμένο υποσύνολο να μην αποτελεί τμήμα κάποιου μεγαλύτερου συνόλου συνδεδεμένων κόμβων του γράφου. Μια αρκετά ενδιαφέρουσα εμπειρική παρατήρηση που αφορά στα κοινωνικά δίκτυα μεγάλου μεγέθους είναι η συνήθης εμφάνιση σε αυτά μιας γιγάντιας συνιστώσας (giant component). Με το όρο αυτό αναφερόμαστε σε μια συνδεδεμένη συνιστώσα του γράφου η οποία περιλαμβάνει την πλειοψηφία των κόμβων του δικτύου. Το αξιοσημείωτο στην περίπτωση αυτή είναι ότι όταν σε ένα κοινωνικό δίκτυο εμφανίζεται μια γιγάντια συνιστώσα αυτή είναι και μοναδική δεδομένου ότι αν υπήρχαν δύο τέτοιες συνιστώσες η πιθανότητα στην πάροδο του χρόνου να συνδεθούν δύο οποιοιδήποτε κόμβοι από καθεμία από αυτές είναι αρκετά μεγάλη. Ιστορικά η συνένωση δύο γιγάντιων συνιστωσών σε ένα κοινωνικό δίκτυο αποτελεί ένα γεγονός με συνήθως καταστροφικές συνέπειες. Για παράδειγμα, η ανακάλυψη της Αμερικής ή ο αποικισμός της Αφρικής από τους Ευρωπαίους οδήγησε στην συνένωση δυο γιγάντιων πληθυσμιακών συνιστωσών στην Ευρώπη και την Αμερική/Αφρική με συνέπεια την εξόντωση και τον εξανδραποδισμό των γηγενών αμερικανικών/αφρικανικών πληθυσμών από τους ευρωπαϊκούς. Ορίζουμε ως μήκος (length) ενός μονοπατιού τον αριθμό των ακμών που περιέχει και ως απόσταση (distance) μεταξύ δυο κόμβων το μήκος του μονοπατιού με το ελάχιστο μήκος που συνδέει τους δυο αυτούς κόμβους. Ορίζουμε ως διάμετρο (diameter) του γράφου το μήκος του μονοπατιού με το μεγαλύτερο μήκος μεταξύ όλων των μονοπατιών ελάχιστου μήκους που υπάρχουν στον γράφο. Ο πιο απλός τρόπος για να υπολογίσουμε την απόσταση μεταξύ δυο κόμβων σε έναν γράφο είναι μέσω του αλγορίθμου αναζήτησης κατά πλάτος (breadth-first search). Στην περίπτωση αυτή η αναζήτηση αρχίζει από έναν από τους δύο κόμβους και προχωρά σε βήματα υπολογίζοντας όλους τους γείτονες αυτού του κόμβου οι οποίοι και απέχουν μοναδιαίο μήκος από τον αρχικό κόμβο, στη συνέχεια υπολογίζει όλους τους γείτονες των κόμβων που παρήχθησαν στο προηγούμενο βήμα οι οποίοι και απέχουν απόσταση 2 από τον αρχικό κόμβο κ.ο.κ. μέχρις ότου ανιχνευθεί ο τελικός κόμβος σε κάποιο από τα σύνολα των γειτονικών κόμβων κάποιου βήματος. Σε κάθε υπολογισμό γειτονικών κόμβων επιλέγουμε να υπολογίσουμε τους γείτονες κόμβων τους οποίους δεν έχουμε συναντήσει σε κάποιο προηγούμενο βήμα. Ένα συνηθισμένο φαινόμενο σε κοινωνικά δίκτυα μεγάλων διαστάσεων είναι ότι η μέση απόσταση μεταξύ δυο οποιονδήποτε κόμβων είναι απροσδόκητα μικρή (σε ορισμένες μελέτες έχει βρεθεί περίπου ίση με τον αριθμό 6). Το φαινόμενο αυτό είναι γνωστό ως το φαινόμενο του μικρού κόσμου (small-world phenomenon ή six degrees of separation) και περιλαμβάνει περιπτώσεις στις οποίες το μέσο μήκος μονοπατιού μεταξύ δύο τυχαίων κόμβων είναι ανάλογο του λογαρίθμου του πληθυσμού των κόμβων. Αν και ο ακριβής υπολογισμός του μήκους της απόστασης σε τέτοιου είδους δίκτυα είναι διαφιλονικούμενος το γεγονός είναι ότι όπως θα εξηγήσουμε στη συνέχεια μια τέτοια μικρή απόσταση επηρεάζει άμεσα την ταχύτητα διάδοσης της πληροφορίας σε αυτά.

Η μελέτη της δομής των κοινωνικών δικτύων στηρίζεται στη χρήση διαφόρων μαθηματικών μοντέλων που προσομοιώνουν τη δυναμική συμπεριφορά τέτοιων δικτύων. Δυο αρκετά δημοφιλή μοντέλα αποτελούν το μοντέλο του Erdős-Renyi και τα δίκτυα power-law με τα οποία θα ασχοληθούμε στη συνέχεια. ΜΟΝΤΕΛΟ ERDŐS-RENYI Μια από τις πλέον διαδεδομένες μεθόδους αναπαράστασης κοινωνικών δικτύων ως γράφων αποτελούν οι γράφοι Erdős-Renyi, μια υποπερίπτωση των τυχαίων γράφων (δηλ. των γράφων που δημιουργούνται με βάση μια στατιστική κατανομή). Το μοντέλο είναι αρκετά ενδιαφέρον γιατί περιγράφει ένα πιθανό σύνολο προϋποθέσεων κάτω από τις οποίες μπορεί να εμφανιστεί το φαινόμενο του μικρού κόσμου και μια γιγάντια συνιστώσα σε ένα κοινωνικό δίκτυο. Επιπλέον οι γράφοι Erdős-Renyi αποτελούν μια βάση σύγκρισης της δομής διαφόρων ειδών δικτύων. Αν η δομή κάποιου δικτύου διαφέρει αρκετά από αυτή ενός συγκρίσιμου γράφου Erdős-Renyi τότε υπάρχουν σοβαρές ενδείξεις ότι το δίκτυο δεν εμφανίζει συμπεριφορά τυχαίου γράφου αλλά υπάρχουν ιδιαιτερότητες στον τρόπο με τον οποίο εξελίσσεται στο χρόνο/χώρο (π.χ. δίκτυα power-law τα οποία εξετάζουμε παρακάτω). Οι Erdős-Renyi γράφοι κατασκευάζονται χρησιμοποιώντας δύο κύριες υποθέσεις: 1. οι κόμβοι συνδέονται μεταξύ τους με τυχαίο τρόπο 2. ο γράφος είναι μη κατευθυνόμενος Υπάρχουν δύο κύριες παράμετροι που χαρακτηρίζουν τους συγκεκριμένους γράφους: 1. Ν, είναι ο συνολικός αριθμός των κόμβων του γράφου 2. p, είναι η πιθανότητα να υπάρχει μια ακμή μεταξύ δύο τυχαίων κόμβων. Η πιθανότητα αυτή είναι σταθερή και ίδια για όλους τους κόμβους του δικτύου. Χρησιμοποιώντας τις παραμέτρους Ν και p μπορούμε να δημιουργήσουμε έναν πληθυσμό από τέτοιους γράφους και να περιγράψουμε τα βασικά χαρακτηριστικά τους. Πιο συγκεκριμένα, η πιθανότητα C ένας τυχαίος κόμβος να έχει k γείτονες εξαιρουμένου του εαυτού του μπορεί να υπολογιστεί χρησιμοποιώντας τη διωνυμική κατανομή ως ακολούθως: C=( N 1 ) p k (1 p) ( N 1 k ) k Κατά συνέπεια σε ένα τέτοιο μοντέλο η μέση τιμή μ degree του βαθμού των κόμβων του γράφου προκύπτει ως: μ degree = (Ν-1)*p ενώ η διασπορά των τιμών του βαθμού ενός κόμβου υπολογίζεται ως: σ degree 2 = (N-1)*p*(1-p) Για μεγάλες τιμές του N και μικρές τιμές του p η διωνυμική κατανομή μπορεί να προσεγγιστεί ικανοποιητικά από μια κατανομή Poisson. Σε αυτή την περίπτωση ισχύει ότι: C=(( N 1) d /d!) p d ((N 1) p) e

Χρησιμοποιώντας τις ανωτέρω σχέσεις μπορούμε να περιγράψουμε τα κύρια ποιοτικά χαρακτηριστικά των δικτύων που ακολουθούν το μοντέλου Erdős-Renyi: Η μέση τιμή των βαθμών των κόμβων είναι ανάλογη του πληθυσμού των κόμβων. Η κατανομή των βαθμών των κόμβων δεν παρουσιάζει ιδιαίτερη κύρτωση. Αυτό σημαίνει ότι όσο ο πληθυσμός των κόμβων αυξάνεται η εμφάνιση κόμβων με βαθμό πολλαπλάσιο ή υποπολλαπλάσιο της μέσης τιμής των βαθμών των κόμβων γίνεται όλο και πιο σπάνια. Επομένως σε τέτοιου είδους δίκτυα σπανίως εμφανίζονται κόμβοι με πάρα πολύ υψηλή ή πάρα πολύ χαμηλή δημοφιλία. Επίσης ένα σημαντικό χαρακτηριστικό των γράφων που παράγονται από το συγκεκριμένο μοντέλο είναι ότι το μήκος του μονοπατιού L που συνδέει δύο τυχαίους κόμβους είναι περίπου ανάλογο του λογαρίθμου του πληθυσμού των κόμβων (Ν) δηλ: L ~ log(n) Ειδικότερα όταν για τον βαθμό d ι (Ν) οποιουδήποτε κόμβου i σε έναν γράφο συναρτήσει του συνολικού αριθμού κόμβων στο γράφο ισχύει ότι: d ι (Ν) (1+ε)*log(Ν), όπου ε > 0, δηλαδή η τιμή του βαθμού ενός κόμβου είναι τουλάχιστον λογαριθμική σε σχέση με τον συνολικό αριθμό κόμβων και επομένως ο γράφος με μεγάλη πιθανότητα είναι συνδεδεμένος d ι (Ν)/N 0, δηλαδή ο βαθμός ενός οποιουδήποτε κόμβου είναι πολύ μικρότερος του πληθυσμού N των κόμβων τότε αποδεικνύεται ότι για μεγάλες τιμές του N το μέσο μήκος μονοπατιού και η διάμετρος του γράφου είναι περίπου ανάλογες του λόγου log(n)/log(d) όπου d η μέση τιμή των βαθμών των κόμβων. Από την ανωτέρω σχέση προκύπτει και το φαινόμενο του μικρού κόσμου στο οποίο αναφερθήκαμε προηγουμένως δεδομένου ότι αν θεωρήσουμε ότι ο πληθυσμός της γης είναι περίπου 6.7 δισεκατομμύρια και ότι ο μέσος αριθμός ανθρώπων με τους οποίους σχετίζεται κάθε ένας από εμάς είναι περίπου 50 τότε το μέσο μήκος μονοπατιού που συνδέει δύο τυχαίους ανθρώπους στην γη είναι κατά μέσο όρο ίσο με το 6 Η τελευταία παρατήρηση μας επιτρέπει να προτείνουμε το μοντέλο Erdős-Renyi ως ένα πιθανό γεννήτορα κοινωνικών δικτύων στα οποία εμφανίζεται το φαινόμενο του μικρού κόσμου. Τέλος, σε δίκτυα που ακολουθούν το συγκεκριμένο μοντέλο έχει παρατηρηθεί η εμφάνισης μιας γιγάντιας συνιστώσας για βαθμούς κόμβων μεγαλύτερους ή ίσους από την μονάδα. ΜΟΝΤΕΛΑ POWER-LAW Τα μοντέλα Power-Law χρησιμοποιούνται για την αναπαράσταση δικτύων στα οποία είναι πιθανόν να εμφανιστούν κόμβοι με βαθμό πολλαπλάσιο της μέσης τιμής των βαθμών των κόμβων τους. Σε μια τέτοια περίπτωση και σε αντίθεση με τα μοντέλα Erdős-Renyi η πιθανότητα εμφάνισης κόμβων με ακραίες τιμές ελαττώνεται μεν όσο απομακρυνόμαστε από τη μέση τιμή αλλά για μεγάλο διάστημα παραμένει μη αμελητέα. Η πιθανότητα αυτή αποτυπώνεται καλύτερα σε διαγράμματα στα οποία οι κλίμακες στις οποίες αναπαριστούμε τόσο τις πιθανότητες εμφάνισης διαφόρων βαθμών όσο και όλους τους βαθμούς που εμφανίζονται στον γράφο είναι λογαριθμικές. Σε αυτές τις

περιπτώσεις η σχέση μεταξύ των δύο αυτών μεγεθών σε λογαριθμικές κλίμακες είναι γραμμική και μπορεί να εκφραστεί ως: log(p k ) = c- b * log(k) όπου k ο βαθμός ενός κόμβου και p k η τιιθανότητα ένας τυχαίος κόμβος του γράφου να έχει βαθμό k. Λύνοντας την ανωτέρω εξίσωση ως προς p k οδηγούμσατε στη σχέση: p k = M * k -b όπου Μ ένας συντελεστής κανονικοποίησης που εξασφαλίζει ότι όλα τα p k αθροίζονται στην μονάδα. Η ανωτέρω εξίσωση θεωρούμε ότι επιτρέπει την εμφάνιση κόμβων με ακραίες τιμές βαθμών για b 3. Υπάρχουν δύο προϋποθέσεις κάτω από τις οποίες οι βαθμοί των κόμβων ενός γράφου έχει παρατηρηθεί ότι ακολουθούν μια κατανομή power-law: 1. Ο αριθμός των κόμβων του γράφου αυξάνεται με την πάροδο του χρόνου 2. Η πιθανόιτητα σύνδεσης ενός νέου κόμβου με έναν προϋπάρχοντα είναι ανάλογη του βαθμού του προϋπάρχοντος κόμβου. Το φαινόμενο αυτό ονομάζεται επιλεκτική προσκόλληση (preferential attachment) και υποδηλώνει την προτίμηση που έχουν νέα μέλη σε διάφορες κοινωνικές ομάδες να δημιουργούν σχέσεις με παλαιότερα μέλη τα οποία θεωρούνται αρκετά δημοφιλή. Υπάρχουν διάφορα μοντέλα για τη δημιουργία γράφων που εμφανίζουν power-law κατανομές στους βαθμούς των κόμβων τους. Στην επόμενη ενότητα θα περιγράψουμε μια ακολουθία από μοντέλα που προοδευτικά καταλήγουν σε μοντέλα power-law. Μοντέλα Αυξανόμενου Πλήθους Κόμβων Το πιο απλό μοντέλο που θα περιγράψουμε εφαρμόζει τους ακόλουθους κανόνες: 1. Το δίκτυο αναπτύσσεται σε διακριτά βήματα dt στο χρόνο t. Υποθέτουμε ότι dt = 1. Σε κάθε βήμα προστίθεται ένας νέος κόμβος στο δίκτυο. Επομένως σε κάθε βήμα ο χρόνος t ισούται με το πλήθος των κόμβων στο δίκτυο. 2. Κάθε νέος κόμβος δημιουργεί m νέες συνδέσεις με προϋπάρχοντες κόμβους στο δίκτυο. Κάθε ένας από τους προϋπάρχοντες κόμβους επιλέγεται με μια σταθερή πιθανότητα p. 3. Το δίκτυο αρχικοποιείται με m πλήρως συνδεδεμένους κόμβους. Επομένως κάθε προϋπάρχων κόμβος έχει πιθανότητα ίση με m/t να συνδεθεί με έναν νέο κόμβο. Ο αναμενόμενος βαθμός κάποιου κόμβου i στο χρόνο t, όπου m<i<t υπολογίζεται ως: m+ m/(i+1)+m/(i+2)+...+m/t m*(1+log(t/i)) Ο αναμενόμενος χρόνος i μετά από τον οποίο αναμένεται να έχουν δημιουργηθεί κόμβοι με βαθμό μικρότερο από d κατά το χρόνο t υπολογίζεται ως: d > m*(1+log(t/i)) i > t * e (d-m)/m

και ο αναμενόμενος λόγος των κόμβων με βαθμό μικρότερο από d προς το συνολικό πλήθος των κόμβων υπολογίζεται ως Μοντέλο Barabasi-Albert (t - t * e (d-m)/m )/t = 1 - e (d-m)/m Η κύρια διαφορά του απλού μοντέλου που περιγράψαμε με αυτό των Barabasi-Albert προκύπτει από το γεγονός ότι στο απλό μοντέλο η πιθανότητα κάποιος νέος κόμβος να συνδεθεί με έναν προϋπάρχοντα είναι σταθερή και ίδια για όλους τους προϋπάρχοντες κόμβους. Tο μοντέλο των Barabasi-Albert χρησιμοποιεί τα ακόλουθα βήματα: 1. Αρχικά δημιούργησε ένα πλήρως συνδεδεμένο γράφο q κόμβων. 2. Σταδιακά πρόσθεσε στο γράφο νέους κόμβους καθένας εκ των οποίων εισφέρει m νέες ακμές που μπορούν να συνδέσουν τον εαυτό του με κάποιον από τους ήδη προϋπάρχοντες κόμβους. Η πιθανότητα κάποια από τις νέες αυτές ακμές να συνδεθεί με κάποιον προϋπάρχοντα κόμβο g είναι ανάλογη του βαθμού του g. Για να διευκολυνθεί η εκτέλεση του συγκεκριμένου βήματος για καθεμία προύπάρχουσα ακμή πρόσθεσε σε μια λίστα L τους κόμβους στα άκρα της. Στη συνέχεια διαλεξε ένα τυχαίο στοιχείο της λίστας L και σύνδεσε το με τον νέο κόμβο. Με τον τρόπο αυτό η πιθανότητα να επιλεγεί κάποιος κόμβος είναι ανάλογος της συχνότητας εμφάνισης του στην L η οποία με τη σειρά της είναι ανάλογη του βαθμού του συγκεκριμένου κόμβου. Πιο συγκεκριμένα αν k i ο βαθμός του κόμβου i τότε η πιθανότητα p i να συνδεθεί ο κόμβος i με ένα νέο κόμβο δίνεται από τον τύπο: Για την ανάλυση της συμπεριφοράς τους μοντέλου θα πρέπει να λάβουμε υπόψη μας τα εξής: Σε κάθε βήμα t στο δίκτυο θα υπάρχουν συνολικά t*m ακμές και επομένως το άθροισμα των βαθμών όλων των κόμβων του δικτύου θα είναι 2*t*m. Η πιθανότητα ένας κόμβος να αποκτήσει μια καινούργια σύνδεση ισούται με d i (t)/(2*t*m) Αν εξετάσουμε την περίπτωση στην οποία το t είναι συνεχές η μεταβολή του βαθμού του κόμβου i ισούται με (d i (t)) ' = m * d i (t)/(2*t*m) = d i (t)/(2*t) με αρχική τιμή του βαθμού κάθε κόμβου ίση με m. Λύνοντας την ανωτέρω διαφορική εξίσωση προκύπτει ότι d i (t) = m * (t/i) 1/2 Από την προηγούμενη σχέση προκύπτει ότι ο αριθμός i των κόμβων με βαθμό μικρότερο από d για κάποιο χρόνο t ικανοποιεί τη σχέση d > m * (t/i) 1/2 i > t * m 2 /d 2 ενω η πιθανότητα εμφάνισης τέτοιων κόμβων υπολογίζεται ως (t - t * m 2 /d 2 )/t = 1 - m 2 /d 2 Επομένως η πιθανότητα κάποιος κόμβος να έχει βαθμό d ισούται με την παράγωγο της προηγούμενης έκφρασης δηλαδή με 2* m 2 /d 3 Συνοψίζοντας, τα κύρια χαρακτηριστικά δικτύων που παράγονται από το μοντέλο Barabasi-Albert είναι τα ακόλουθα: Η στατιστική κατανομή με την οποία παράγονται οι ακμές στο δίκτυο είναι ανεξάρτητη από την κλίμακα παρατήρησης (μια τέτοια κατανομή χαρακτηρίζεται ως scale-free). Στα δίκτυα που ακολουθούν το συγκεκριμένο μοντέλο η πιθανότητα p k ένας οποισοδήποτε κόμβος να

έχει βαθμό k είναι ανάλογη του k -3 δηλ: p k ~ k -3 Ο γράφος που παράγεται είναι πλήρως συνδεδεμένος Οι βαθμοί των παλαιοτέρων κόμβων είναι συνήθως μεγαλύτεροι από τους βαθμούς των νεοτέρων. Πιο συγκεκριμένα παλαιότεροι κόμβοι συσσωρεύουν με την πάροδο του χρόνου μεγαλύτερο αριθμό συνδέσεων από ότι οι νεώτεροι σε μια ανατροφοδοτούμενη διαδικασία δεδομένου ότι νέοι κόμβοι προτιμούν να συνδέονται με προϋπάρχοντες κόμβους με υψηλή δημοφιλία. Το φαινόμενο αυτό είναι γνωστό και ως the rich-get-richer effect.