ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ"

Transcript

1 ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΨΗΦΙΑΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΜΑΤΙΚΗΣ Οι τυχαίοι γράφοι ως μοντέλα δικτύων (με έμφαση στα κοινωνικά δίκτυα) ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΝΙΚΟΛΑΟΥ ΠΙΖΑΝΙΑ Επιβλέπουσα : Δρ. Μαλβίνα Βαμβακάρη Καθηγήτρια Χαροκοπείου Πανεπιστημίου Αθήνα, Ιούνιος 2016

2

3 ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΨΗΦΙΑΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΜΑΤΙΚΗΣ Οι τυχαίοι γράφοι ως μοντέλα δικτύων (με έμφαση στα κοινωνικά δίκτυα) ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΝΙΚΟΛΑΟΥ ΠΙΖΑΝΙΑ Επιβλέπουσα : Δρ. Μαλβίνα Βαμβακάρη Καθηγήτρια Χαροκοπείου Πανεπιστημίου Εγκρίθηκε από την τριμελή εξεταστική επιτροπή στις Μαλβίνα Βαμβακάρη Δημοσθένης Αναγνωστόπουλος Ηρακλής Βαρλάμης Καθηγήτρια Χ.Π. Καθηγητής Χ.Π. Καθηγητής Χ.Π. Αθήνα, Ιούνιος 2016

4

5 (Υπογραφή)... ΠΙΖΑΝΙΑΣ ΝΙΚΟΛΑΟΣ 2016 All rights reserved Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς το συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευθεί ότι αντιπροσωπεύουν τις επίσημες θέσεις του Χαροκοπείου Πανεπιστημίου.

6 Περίληψη Το θέμα της παρούσας μεταπτυχιακής διπλωματικής εργασίας είναι οι τυχαίοι γράφοι ως μοντέλα δικτύων, με έμφαση στα κοινωνικά δίκτυα. Η εργασία αυτή χωρίζεται θεματικά σε τέσσερα διακριτά μέρη. Στο πρώτο μέρος, που αποτελείται από τα κεφάλαια 1, 2 και 3, γίνεται μια εισαγωγή στην επιστήμη των δικτύων και παρουσιάζονται οι απαιτούμενες βασικές έννοιες. Επίσης γίνεται μια λεπτομερής παρουσίαση του μοντέλου Erdos Renyi και συζητούνται οι βασικές διαφορές που παρουσιάζει αυτό το μοντέλο (κατανομή των βαθμών των κόμβων και συντελεστής συσταδοποίησης) σε σχέση με τα δίκτυα του πραγματικού κόσμου. Επιπλέον, γίνεται μια συνοπτική αλλά επαρκής παρουσίαση δύο εναλλακτικών μοντέλων δικτύων: του μοντέλου Watts Strogatz και του μοντέλου Barabasi Albert. Το κεφάλαιο 4 αποτελεί το δεύτερο μέρος και είναι μια μελέτη περίπτωσης. Συγκεκριμένα, γίνεται μελέτη του δικτύου επιστημονικών συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου Πανεπιστημίου. Το τρίτο μέρος αποτελείται από το κεφάλαιο 5. Σκοπός του κεφαλαίου αυτού είναι να αναδειχθεί η σχέση μεταξύ των κοινωνικών δικτύων, του μάρκετινγκ και της θεωρίας του χάους. Αυτό επιτυγχάνεται με την παράθεση της απόδειξης για το γεγονός ότι, στην πραγματικότητα, τα κοινωνικά δίκτυα είναι δυναμικά συστήματα τα οποία χαρακτηρίζονται από αυτο-οργάνωση, ενώ επιπλέον παρουσιάζουν και δομή fractal. Το τέταρτο και τελευταίο μέρος αποτελείται από το κεφάλαιο 6, το οποίο περιλαμβάνει ορισμένα συμπεράσματα, καθώς και κάποιες μελλοντικές κατευθύνσεις σχετικά με την εφαρμογή της επιστήμης των δικτύων σε διάφορους επιστημονικούς τομείς, όπως είναι η βιολογία, οι τηλεπικοινωνίες, η κοινωνιολογία κλπ. Λέξεις κλειδιά: τυχαίοι γράφοι ; κοινωνικά δίκτυα ; μάρκετινγκ ; θεωρία του χάους ; επιστήμη δικτύων

7 Abstract The subject of this master's degree thesis is random graphs as models of networks, with an emphasis on social networks. It is conceptually divided into four distinct parts. The first part, which is comprised of chapters 1, 2 and 3, serves as an introduction to the science of networks and basic notions are being introduced. Further more, it includes a detailed presentation of the Erdos Renyi random graph model and the two basic differences between this model and real world networks (node degree distribution and clustering coefficient) are being discussed. Apart from that, it also includes a concise presentation of two other random graph models: the Watts Strogatz model and the Barabasi Albert model. Chapter 4 is the second part of this thesis and it is a case study of a real world network. The network being studied is the scientific collaboration network of the department of Informatics and Telematics of Harokopio University of Athens. Chapter 5 is the third part. The purpose of this chapter is to present the connection between social networks, marketing and chaos theory by proving that, in reality, social networks are chaotic dynamical systems which are self-organizing and further more, they exhibit fractal structure. Finally, there is chapter 6 which is the fourth and last part. Chapter 6 includes a number of conclusions and also some possible future directions concerning the utilization of network science in other scientific disciplines such as biology, telecommunications, sociology etc. Keywords: random graphs ; social networks ; marketing ; chaos theory ; network science

8 Ευχαριστίες Θα ήθελα να ευχαριστήσω την επιβλέπουσα καθηγήτρια, Δρ. Μ. Βαμβακάρη, για την ευκαιρία που μου έδωσε ώστε να ασχοληθώ με ένα τόσο ενδιαφέρον και σύγχρονο θέμα, καθώς και για την πολύτιμη καθοδήγηση που μου παρείχε κατά την πορεία της συγγραφής της παρούσας εργασίας. Επίσης θα ήθελα να ευχαριστήσω τους μαθηματικούς κυρίους Σ. Χριστόπουλο, Ε. Αμαργιανάκη και Α. Παπαϊωάννου για τους δρόμους που μου έδειξαν. Αθήνα, Ιούνιος 2016

9 i Περιεχόμενα 1 ο κεφάλαιο Εισαγωγή Η έννοια του κοινωνικού δικτύου Μελέτη των κοινωνικών δικτύων Τα μαθηματικά των κοινωνικών δικτύων Αναπαράσταση δικτύων με γράφους Μέτρα κεντρικότητας ενός γράφου Κεντρικότητα βαθμού (degree centrality) Κεντρικότητα ιδιοδιανύσματος (eigenvector centrality) Κεντρικότητα εγγύτητας (closeness centrality) Κεντρικότητα ενδιαμεσότητας (betweenness centrality) Το φαινόμενο του μικρού κόσμου (small-world effect) Άλλες σημαντικές ιδιότητες των δικτύων Ο τυχαίος γράφος (random graph) ως μοντέλο δικτύου Διαφορά μεταξύ του μοντέλου τυχαίου γράφου και των δικτύων του πραγματικού κόσμου Ο νόμος δυνάμεως (power law) και τα scale free δίκτυα 14 2 ο κεφάλαιο - Το μοντέλο Erdos-Renyi Το μοντέλο Erdos-Renyi Πρώτη διαφορά των τυχαίων γράφων σε σχέση με τα δίκτυα του πραγματικού κόσμου: Το φαινόμενο της συσταδοποίησης (clustering) Δεύτερη διαφορά των τυχαίων γράφων σε σχέση με τα δίκτυα του πραγματικού κόσμου: Η κατανομή των βαθμών των κόμβων 25

10 ii 2.2 Τυχαίοι γράφοι με προκαθορισμένες κατανομές βαθμών (μέθοδος Bender-Canfield) Γεννήτριες συναρτήσεις Ιδιότητες των γεννητριών συναρτήσεων Παραδείγματα χρήσης των γεννητριών συναρτήσεων Ιδιότητες των μη προσανατολισμένων γράφων Κατανομή των μεγεθών των συνιστωσών Μέσο μέγεθος συνιστώσας Το στάδιο μετά την μετάβαση φάσης Προσανατολισμένοι γράφοι Γεννήτριες συναρτήσεις σε προσανατολισμένους γράφους Υπολογισμός χαρακτηριστικών μεγεθών σε προσανατολισμένους γράφους Δίκτυα με συσταδοποίηση Τυχαίοι γράφοι με συσταδοποίηση Γενίκευση του κλασικού μοντέλου τυχαίου γράφου Υπολογισμός του συντελεστή συσταδοποίησης Κατανομές των πλεοναζόντων βαθμών των κόμβων (excess degree distributions) Υπολογισμός του μεγέθους της γιγαντιαίας συνιστώσας Υπολογισμός των μεγεθών των μικρών συνιστωσών του δικτύου 84 3 ο κεφάλαιο - Άλλα μοντέλα τυχαίων γράφων Πρόλογος κεφαλαίου Το μοντέλο Watts-Strogatz Λογική του μοντέλου Watts-Strogatz Αλγόριθμος του μοντέλου Watts-Strogatz 93

11 iii Ιδιότητες του μοντέλουwatts-strogatz Μέσο μήκος μονοπατιού Συντελεστής συσταδοποίησης Κατανομή των βαθμών των κόμβων Περιορισμοί του μοντέλου Watts-Strogatz Κοινωνιολογικές προεκτάσεις του μοντέλου Watts-Strogatz Το μοντέλο Barabasi-Albert Λογική του μοντέλου Barabasi-Albert Κοινωνιολογικές προεκτάσεις του μοντέλου Barabasi-Albert Αλγόριθμος του μοντέλου Barabasi-Albert Ιδιότητες του μοντέλου Barabasi-Albert Κατανομή των βαθμών των κόμβων Μέσο μήκος μονοπατιού Συντελεστής συσταδοποίησης ο κεφάλαιο - Μελέτη περίπτωσης: Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου Πανεπιστημίου Πρόλογος κεφαλαίου Συγκέντρωση και καταχώρηση των δεδομένων Ανωνυμοποίηση και δημιουργία της λίστας των κλάδων (edge list) του δικτύου Δημιουργία του δικτύου συνεργασιών Ανάλυση του δικτύου συνεργασιών Υπολογισμός του πλήθους των κόμβων του δικτύου Υπολογισμός του πλήθους των ακμών του δικτύου 113

12 iv Υπολογισμός του έξω-βαθμού (out-degree) κάθε κόμβου του δικτύου Εύρεση του κόμβου με τον μεγαλύτερο έξω-βαθμό Εύρεση του κόμβου με τον μικρότερο έξω-βαθμό Εντοπισμός κόμβου/κόμβων με συγκεκριμένο έξω-βαθμό Υπολογισμός του πλήθους των τριγώνων στα οποία συμμετέχει ο κάθε κόμβος του δικτύου Υπολογισμός των συντελεστών συσταδοποίησης του δικτύου Υπολογισμός της πυκνότητας του δικτύου Υπολογισμός της διαμέτρου του δικτύου Εύρεση των πιο απομακρυσμένων κόμβων του δικτύου Υπολογισμός της συνδεσιμότητας μέσω των ακμών Υπολογισμός της αμοιβαιότητας του δικτύου Εύρεση των συστάδων του δικτύου Εύρεση των κόμβων στους οποίους έχει πρόσβαση κάποιος συγκεκριμένος κόμβος του δικτύου Εύρεση των κόμβων που έχουν πρόσβαση σε κάποιον συγκεκριμένο κόμβο του δικτύου Κατανομή των έξω-βαθμών των κόμβων του δικτύου Ταίριασμα ενός νόμου δυνάμεως στην κατανομή των έξω-βαθμών των κόμβων Εντοπισμός κοινοτήτων εντός του δικτύου Υπολογισμός της κεντρικότητας ιδιοδιανύσματος για κάθε κόμβο του δικτύου Υπολογισμός της κεντρικότητας εγγύτητας για κάθε κόμβο του δικτύου Υπολογισμός της κεντρικότητας ενδιαμεσότητας για κάθε κόμβο του δικτύου Εύρεση του συντομότερου μονοπατιού μεταξύ δύο κόμβων του δικτύου Εντοπισμός ενός ή περισσοτέρων κόμβων μέσα στο δίκτυο Εξαγωγή ενός συγκεκριμένου υπογράφου 158

13 v 4.6 Σύγκριση του δικτύου συνεργασιών με μοντέλα τυχαίων γράφων Σύγκριση του δικτύου συνεργασιών με το μοντέλο Erdos-Renyi Σύγκριση του δικτύου συνεργασιών με το μοντέλο Barabasi-Albert Σύγκριση του δικτύου συνεργασιών με το μοντέλο Watts-Strogatz Δημιουργία συγκεντρωτικού πίνακα και σχολιασμός των αποτελεσμάτων ο κεφάλαιο - Κοινωνικά δίκτυα, μάρκετινγκ και θεωρία του χάους Πρόλογος κεφαλαίου Κοινωνικά δίκτυα και μάρκετινγκ Κοινωνικά δίκτυα και θεωρία του χάους ο κεφάλαιο - Συμπεράσματα, προτάσεις και μελλοντικές κατευθύνσεις 193 Παραρτήματα 196 Παράρτημα Α Υπολογισμός της μέσης τιμής μιας διακριτής τυχαίας μεταβλητής η οποία ακολουθεί διωνυμική κατανομή 197 Παράρτημα Β Οριακό θεώρημα Poisson Νόμος των σπάνιων γεγονότων 199 Παράρτημα Γ Απόδειξη της συνθήκης z = 1 για τον σχηματισμό γιγαντιαίας συνιστώσας εντός ενός τυχαίου γράφου 203 Παράρτημα Δ Ο οικουμενικός συντελεστής συσταδοποίησης 208

14 vi log( n ) z Παράρτημα Ε Απόδειξη της σχέσης l= 1 log( z +1 που δίνει την μέση απόσταση μέσα σε ένα 2 ) z 1 συνεκτικό δίκτυο 210 Παράρτημα ΣΤ Υπολογισμός της πιθανότητας σύνδεσης δύο τυχαίων κόμβων του δικτύου 211 Παράρτημα Ζ Σχέση μεταξύ της χαρακτηριστικής συνάρτησης μιας τυχαίας μεταβλητής και της γεννήτριας συνάρτησης που παράγει την κατανομή που αυτή η τυχαία μεταβλητή ακολουθεί 213 Παράρτημα Η Απόδειξη της τρίτης ιδιότητας των γεννητριών συναρτήσεων 215 Παράρτημα Θ Απόδειξη της σχέσης h 0 (z) = z g 0 ( h 1 (z) ) 218 Βιβλιογραφία 222 Λογισμικό και εργαλεία που χρησιμοποιήθηκαν 230

15 vii Κατάλογος σχημάτων Σχήμα 1.1 Σχηματισμός κοινωνικού δικτύου με χρήση δημοφιλών κοινωνικών μέσων 3 Σχήμα 1.2 Τυπική μορφή κοινωνικού δικτύου 4 Σχήμα 1.3 Μη προσανατολισμένος γράφος 6 Σχήμα 1.4 Μη προσανατολισμένος γράφος με βάρη 7 Σχήμα 1.5 Προσανατολισμένος γράφος 7 Σχήμα 1.6 Διωνυμική κατανομή 15 Σχήμα 1.7 Κατανομή Poisson 15 Σχήμα 1.8 Νόμος δυνάμεως 16 Σχήμα 2.1 Κατανομές των βαθμών των κόμβων δικτύων του πραγματικού κόσμου 26 Σχήμα 2.2 Σύγκριση μεταξύ θεωρητικών και πραγματικών τιμών για την μέση απόσταση εντός δικτύων 36 Σχήμα 2.3 Διάφορες δυνατές μορφές συστάδων 46 Σχήμα 2.4 Μέγεθος γιγαντιαίας συνιστώσας και μέσο μέγεθος μικρότερων συνιστωσών του δικτύου 55 Σχήμα 2.5 Συσταδοποίηση σε τυχαίους γράφους 67 Σχήμα 2.6 Τρίγωνο κόμβων 70 Σχήμα 2.7 Τρίγωνα εντός δικτύων 73 Σχήμα 2.8 Μεταβολή του μεγέθους της γιγαντιαίας συνιστώσας συναρτήσει του συντελεστή συσταδοποίησης 83 Σχήμα 3.1 Πλέγμα σημείων 91 Σχήμα κανονικός γράφος σε μορφή δακτυλιοειδούς πλέγματος 92 Σχήμα κανονικός γράφος σε μορφή δακτυλιοειδούς πλέγματος 93

16 viii Σχήμα 3.4 Σχηματισμός δικτύου σύμφωνα με το μοντέλο Watts-Strogatz 95 Σχήμα 3.5 Αλγόριθμος Watts-Strogatz 96 Σχήμα 3.6 Επίπτωση της μεταβολής της παραμέτρου p στην μορφή ενός δικτύου Watts-Strogatz 101 Σχήμα 3.7 Σχηματισμός δικτύου σύμφωνα με το μοντέλο Barabasi-Albert 104 Σχήμα 4.1 Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου πανεπιστημίου 111 Σχήμα 4.2 Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου πανεπιστημίου 112 Σχήμα 4.3 Εντοπισμός κοινοτήτων εντός του δικτύου συνεργασιών (1ος τρόπος αναπαράστασης) 137 Σχήμα 4.4 Εντοπισμός κοινοτήτων εντός του δικτύου συνεργασιών (2ος τρόπος αναπαράστασης) 138 Σχήμα 5.1 Νόμος δυνάμεως 183 Σχήμα 5.2 Fractal με κύβους 185 Σχήμα 5.3 Εστίαση σε ένα σύνολο Mandelbrot 185 Σχήμα 5.4 Σύνολο Mandelbrot 186 Σχήμα 5.5 Νόμος δυνάμεως για τα κοινωνικά μέσα 190

17 ix Κατάλογος πινάκων Πίνακας 2.1 Δίκτυα του πραγματικού κόσμου και οι συντελεστές συσταδοποίησης αυτών 23

18 1 1 ο Κεφάλαιο Εισαγωγή

19 2 1.1 Η έννοια του κοινωνικού δικτύου Σκοπός του παρόντος εισαγωγικού κεφαλαίου είναι η παράθεση των βασικών ορισμών και μαθηματικών εργαλείων που απαιτούνται για την ανάλυση των κοινωνικών δικτύων. Κρίνεται αναγκαίο επομένως, πρώτα από όλα να δοθεί ένας ορισμός της έννοιας του κοινωνικού δικτύου. Ως κοινωνικό δίκτυο ορίζουμε εκείνη την κοινωνική δομή η οποία αποτελείται από: ένα σύνολο συμμετεχόντων (οι οποίοι δύνανται να είναι μεμονωμένα άτομα ή οργανισμοί), ένα σύνολο δυαδικών δεσμών, καθώς και οποιεσδήποτε άλλες πιθανές κοινωνικές αλληλεπιδράσεις μεταξύ των συμμετεχόντων. Τα μοντέλα κοινωνικών δικτύων μας παρέχουν ένα σύνολο μεθόδων για την ανάλυση της δομής των διαφόρων κοινωνικών σχηματισμών, καθώς και μια ποικιλία θεωριών οι οποίες μπορούν να εξηγήσουν την εμφάνιση προτύπων/μοτίβων (patterns) εντός αυτών. Η μελέτη αυτών των σχηματισμών, γίνεται με την χρήση μεθόδων ανάλυσης κοινωνικών δικτύων που ως απώτερο σκοπό έχουν: τον εντοπισμό τοπικών αλλά και μη τοπικών προτύπων, τον εντοπισμό εκείνων των οντοτήτων που έχουν την μεγαλύτερη επιρροή, καθώς και την εξέταση της δυναμικής του ίδιου του δικτύου. Τα κοινωνικά δίκτυα και η ανάλυση αυτών, είναι ένα διεπιστημονικό ακαδημαϊκό πεδίο το οποίο προέκυψε από την σύγκλιση διαφόρων επιστημών όπως η κοινωνική ψυχολογία, η κοινωνιολογία, η στατιστική και η θεωρία γράφων. Η ανάλυση κοινωνικών δικτύων είναι ένα από τα κύρια πλαίσια εργασίας της σύγχρονης κοινωνιολογίας, ενώ παράλληλα χρησιμοποιείται και από έναν σημαντικό αριθμό άλλων κοινωνικών και θετικών επιστημών. Μαζί με άλλα είδη πολύπλοκων δικτύων, αποτελούν μέρος αυτού που συνολικά ονομάζουμε επιστήμη των δικτύων (network science). Προς αποφυγή παρεξηγήσεων, κρίνεται σκόπιμο, σε αυτό το σημείο να τονιστεί η διαφορά μεταξύ κοινωνικών δικτύων (social networks) και κοινωνικών μέσων (social media) καθώς πολλές φορές αυτοί οι δύο όροι χρησιμοποιούνται ισοδύναμα και εναλλάξ. Με τον όρο κοινωνικό μέσο (social media), εννοούμε το μέσο (media) και κατά συνέπεια το περιεχόμενο αυτού που δημοσιεύει κάποιος στο διαδίκτυο (πχ. blog, slide show, video, podcast, newsletter ή e-book). Με άλλα λόγια, μπορούμε να θεωρήσουμε τα κοινωνικά μέσα σαν μια μέθοδο επικοινωνίας από τον έναν προς τους πολλούς. Παρόλο που μπορεί οποιοσδήποτε να απαντήσει ή να

20 3 σχολιάσει επί αυτού, το περιεχόμενο της δημοσίευσης ανήκει αποκλειστικά στον χρήστη που το δημιούργησε και το δημοσίευσε. Από την άλλη μεριά, τα κοινωνικά δίκτυα (social networks), όπως είναι για παράδειγμα το Facebook, το Twitter, το Google+ κλπ., φέρνουν σε άμεση επαφή τους συμμετέχοντες και έτσι σχηματίζονται ομάδες ανθρώπων οι οποίοι έχουν κοινά ενδιαφέροντα ή μοιράζονται τις ίδιες απόψεις και κατά αυτόν τον τρόπο δημιουργούνται σχέσεις μεταξύ τους. Σε αυτήν την περίπτωση, η επικοινωνία είναι αμφίδρομη και όχι μονόδρομη όπως στην περίπτωση των κοινωνικών μέσων. Στο επόμενο σχήμα γίνεται άμεσα αντιληπτό το πως μπορεί να γίνει η μετάβαση από τα κοινωνικά μέσα, στα κοινωνικά δίκτυα και στον σχηματισμό ενός δικτύου χρηστών. Σχήμα 1.1 Σχηματισμός κοινωνικού δικτύου με χρήση δημοφιλών κοινωνικών μέσων

21 4 1.2 Μελέτη των κοινωνικών δικτύων Η μελέτη των κοινωνικών δικτύων περιλαμβάνει τρεις διακριτές συνιστώσες οι οποίες την συναποτελούν: (α) Πρώτα έχουμε τις εμπειρικές μελέτες επί των δικτύων οι οποίες θα αναδείξουν την δομή του. Προκειμένου να επιτευχθεί αυτό, χρησιμοποιείται ένα πλήθος τεχνικών όπως συνεντεύξεις, συμπλήρωση ερωτηματολογίων, απευθείας παρατήρηση των συμμετεχόντων, χρήση αρχειακού υλικού, καθώς και εξειδικευμένα εργαλεία. Σκοπός αυτών των μελετών είναι να μας δώσουν μία εικόνα των συνδέσμων μεταξύ των συμμετεχόντων οπότε και να σχηματίσουμε μια εικόνα της παρακάτω μορφής. Σχήμα 1.2 Τυπική μορφή κοινωνικού δικτύου

22 5 Στο σχήμα 1.2, οι κόμβοι αντιπροσωπεύουν τους συμμετέχοντες και οι ακμές αντιπροσωπεύουν τις σχέσεις μεταξύ αυτών. Μιας και είναι δυνατόν να υπάρχουν πολλές και διαφορετικού είδους συνδέσεις μεταξύ των ιδίων συμμετεχόντων (πχ. εργασιακές σχέσεις, προσωπικές σχέσεις κλπ.), θα πρέπει οι μελέτες να έχουν σχεδιαστεί εκ των προτέρων κατάλληλα προκειμένου να μπορέσει να γίνει σωστή μέτρηση των συνδέσμων του είδους που μας ενδιαφέρει. (β) Από την στιγμή που κάποιος έχει ανακτήσει τα εμπειρικά δεδομένα για ένα δίκτυο, είναι πλέον σε θέση να απαντήσει ερωτήματα σχετικά με την κοινότητα που το εν λόγω δίκτυο αντιπροσωπεύει χρησιμοποιώντας μαθηματική ή στατιστική ανάλυση. Αυτό είναι το πεδίο της κλασικής ανάλυσης κοινωνικών δικτύων που επικεντρώνεται σε ερωτήματα του τύπου: Ποια είναι τα πιο κεντρικά μέλη μέλη του δικτύου και ποια είναι τα πιο περιφερειακά? Ποια είναι εκείνα τα άτομα που έχουν την μεγαλύτερη επιρροή πάνω στους άλλους? Η κοινότητα υποδιαιρείται σε μικρότερες ομάδες? Αν ναι, ποιες είναι αυτές? Ποιες είναι εκείνες οι συνδέσεις που είναι οι πιο κρίσιμες για την λειτουργία μιας ομάδας? (γ) Με τα δεδομένα που έχει ανακτήσει πλέον κάποιος από τις παρατηρήσεις του, αλλά και από τις ποσοτικές αναλύσεις που έχει διεξάγει, είναι πλέον σε θέση να κατασκευάσει τα μαθηματικά ή υπολογιστικά μοντέλα εκείνων των διαδικασιών που λαμβάνουν χώρα σε συστήματα που έχουν μορφή δικτύου (για παράδειγμα την διάδοση πληροφοριών, τις συναλλαγές μεταξύ των συμμετεχόντων κλπ.). Με αυτού του είδους την μοντελοποίηση, έχουμε την δυνατότητα να κάνουμε προβλέψεις για το πως θα συμπεριφερθεί μια κοινότητα συναρτήσει εκείνων των παραμέτρων που επηρεάζουν το σύστημα. 1.3 Τα μαθηματικά των κοινωνικών δικτύων Στην συνέχεια αυτού του κεφαλαίου θα επικεντρωθούμε στις μαθηματικές τεχνικές που αφορούν την δεύτερη και την τρίτη συνιστώσα της μελέτης των κοινωνικών δικτύων, δηλαδή την ποσοτική ανάλυση των δεδομένων που λαμβάνονται από το δίκτυο και την μαθηματική μοντελοποίηση των συστημάτων που έχουν μορφή δικτύων.

23 Αναπαράσταση δικτύων με γράφους Ένα δίκτυο (σε μαθηματική ορολογία: γράφος) αποτελείται από σημεία που ονομάζονται κόμβοι (ή κορυφές) και από γραμμές οι οποίες τα ενώνουν και ονομάζονται ακμές (ή κλάδοι). Μαθηματικά, ένα δίκτυο μπορεί να παρασταθεί με έναν πίνακα που ονομάζεται πίνακας γειτνίασης A (adjacency matrix), ο οποίος στην απλούστερη περίπτωση είναι ένας n n συμμετρικός πίνακας, όπου n είναι το συνολικό πλήθος των κόμβων του δικτύου. Τα στοιχεία του πίνακα γειτνίασης A έχουν την παρακάτω μορφή: Α ij ={ 1, αν υπάρχει ακμή μεταξύ του κόμβου i και του κόμβου j 0, αλλιώς } Όπου i=1,2,,n και j=1,2,,n. Ο πίνακας αυτός είναι συμμετρικός ως προς την κύρια διαγώνιο, αφού εάν υπάρχει ακμή μεταξύ του κόμβου i και του κόμβου j, τότε προφανώς θα υπάρχει και ακμή μεταξύ των κόμβων j και i, οπότε Α ij = A ji. Σχήμα 1.3 Μη προσανατολισμένος γράφος Σε μερικά δίκτυα οι ακμές έχουν βάρη, εννοώντας ότι κάποιες ακμές αναπαριστούν ισχυρότερη

24 7 σύνδεση από ότι άλλες ακμές. Προφανώς όσο μεγαλύτερο είναι το βάρος μιας ακμής, τόσο ισχυρότερη είναι η σύνδεση που αναπαριστά. Σε αυτήν την περίπτωση, τα μη μηδενικά στοιχεία του πίνακα γειτνίασης μπορούν να γενικευθούν και να λάβουν τιμές διαφορετικές της μονάδας προκειμένου να αναπαραστήσουν ισχυρότερες και ασθενέστερες συνδέσεις. Σχήμα 1.4 Μη προσανατολισμένος γράφος με βάρη Ένα άλλο είδος δικτύων είναι τα κατευθυνόμενα (ή προσανατολισμένα) δίκτυα, στα οποία οι ακμές δείχνουν προς μια συγκεκριμένη κατεύθυνση μεταξύ δύο κόμβων. Σχήμα 1.5 Προσανατολισμένος γράφος

25 8 Τα κατευθυνόμενα δίκτυα αναπαρίστανται με μη συμμετρικούς πίνακες γειτνίασης στους οποίους ο συμβολισμός Α ij =1 σημαίνει την ύπαρξη μιας ακμής η οποία ξεκινάει από τον κόμβο i και καταλήγει στον κόμβο j και αυτό δεν συνεπάγεται απαραίτητα και την ύπαρξη ακμής που θα ξεκινάει από τον κόμβο j και θα καταλήγει στον κόμβο i. Σε αυτό ακριβώς οφείλεται και η έλλειψη συμμετρίας ως προς την κύρια διαγώνιο στον πίνακα γειτνίασης. Σε ένα δίκτυο επίσης μπορεί να υπάρχουν: α) Πολλαπλές ακμές (multiedges), εννοώντας επαναλαμβανόμενες ακμές μεταξύ του ιδίου ζεύγους κόμβων. β) Αυτοβρόχοι (selfedges), εννοώντας τις ακμές που ξεκινούν και καταλήγουν στον ίδιο κόμβο. γ) Υπερακμές (hyperedges), εννοώντας εκείνες τις ακμές που ενώνουν περισσότερους από δύο κόμβους. Καθώς και πολλά άλλα ιδιαίτερα γνωρίσματα. Στο παρόν κεφάλαιο, θα επικεντρωθούμε στα απλούστερης μορφής δίκτυα, τα οποία διαθέτουν μη κατευθυνόμενες και χωρίς βάρη ακμές οι οποίες συνδέουν ζεύγη κόμβων του δικτύου Μέτρα κεντρικότητας ενός γράφου Επιστρέφοντας στο ζήτημα της ανάλυσης δεδομένων που λαμβάνονται από δίκτυα, ξεκινάμε δίνοντας κάποια μέτρα κεντρικότητας (centrality measures) που είναι και από τα πιο βασικά και συχνότερα χρησιμοποιούμενα μέτρα της δομής ενός δικτύου. Τα μέτρα κεντρικότητας δίνουν απάντηση στο ερώτημα: Ποιο είναι το πιο σημαντικό ή κεντρικό πρόσωπο (συμμετέχον) εντός του δικτύου? Υπάρχουν πολλές δυνατές απαντήσεις για αυτό το ερώτημα, ανάλογα με το τι εννοούμε με τον όρο σημαντικός Κεντρικότητα βαθμού (degree centrality) Το απλούστερο ίσως μέτρο κεντρικότητας είναι η κεντρικότητα βαθμού (degree centrality) που ονομάζεται και απλά βαθμός (degree).

26 9 Ο βαθμός k i ενός κόμβου i του δικτύου, ισούται με τον συνολικό αριθμό των ακμών που είναι συνδεδεμένες σε αυτόν. Με μαθηματικούς όρους, αυτό γράφεται ως εξής: n k i = A ij j= 1, όπου i=1,2,,n Αν και απλό ως ιδέα, ο βαθμός είναι συχνά ένα ιδιαίτερα αποτελεσματικό μέτρο της επιρροής ή της σημαντικότητας ενός κόμβου καθότι σε κοινωνικά πλαίσια, οι άνθρωποι που έχουν τους περισσότερους συνδέσμους τείνουν να έχουν και περισσότερη δύναμη Κεντρικότητα ιδιοδιανύσματος (eigenvector centrality) Μια πιο εκλεπτυσμένη εκδοχή της ίδιας ιδέας είναι η ονομαζόμενη κεντρικότητα ιδιοδιανύσματος (eigenvector centrality). Ενώ η κεντρικότητα βαθμού (degree centrality) κάνει μια απλή καταμέτρηση του αριθμού των συνδέσεων (επαφών) που έχει ένας κόμβος, η κεντρικότητα ιδιοδιανύσματος μας δείχνει ότι δεν έχουν όλοι οι σύνδεσμοι (επαφές) την ίδια βαρύτητα/σημασία. Στην γενική περίπτωση, οι σύνδεσμοι ενός ατόμου με άλλους ανθρώπους που οι ίδιοι έχουν μεγάλη επιρροή, προσδίδουν στο άτομο μεγαλύτερη επιρροή από ότι όταν συνδέεται με ανθρώπους που έχουν μικρότερη επιρροή. Σκοπός της κεντρικότητας ιδιοδιανύσματος είναι να υπολογίζει την κεντρικότητα ενός κόμβου συναρτήσει των κεντρικοτήτων των γειτόνων αυτού. Αν συμβολίσουμε την κεντρικότητα ιδιοδιανύσματος (eigenvector centrality) ενός κόμβου i ως x i, τότε μπορούμε να λάβουμε τα παραπάνω υπόψη μας κάνοντας αυτό το x i ανάλογο των κεντρικοτήτων ιδιοδιανύσματος x j, j =1,2,, n των γειτόνων αυτού: n x i = 1 A λ ij x j, όπου λ είναι μία σταθερά και i=1,2,, n j= 1 Αν ορίσουμε το διάνυσμα των κεντρικοτήτων ιδιοδιανύσματος ( eigenvector centralities) των n

27 κόμβων του δικτύου ως X =[x 1 x 2 x n] μορφή:, τότε μπορούμε να ξαναγράψουμε την τελευταία σχέση σε μητρική 10 n x i = 1 λ j= 1 n A ij x j λ x i = A ij x j, i= 1 n λ X = A X ή A X = λ X j =1 Βλέπουμε λοιπόν ότι αν πολλαπλασιάσουμε τον πίνακα A με το διάνυσμα X, λαμβάνουμε ως αποτέλεσμα το ίδιο διάνυσμα X πολλαπλασιασμένο με τον αριθμό λ (βαθμωτό γινόμενο). Συνειδητοποιούμε λοιπόν, ότι πράγματι το X είναι ένα ιδιοδιάνυσμα του πίνακα γειτνίασης A το οποίο αντιστοιχεί στην ιδιοτιμή λ, με τα στοιχεία αυτού ( δηλαδή τα x 1, x 2,, x n ) να είναι οι κεντρικότητες ιδιοτιμής (degree centralities) των n κόμβων του δικτύου. Δεδομένου ότι επιθυμούμε οι κεντρικότητες ιδιοτιμής x i να είναι μη αρνητικές ποσότητες, μπορεί να αποδειχθεί (με την χρήση του θεωρήματος Perron-Frobenius) ότι το λ πρέπει να είναι η μεγαλύτερη ιδιοτιμή του πίνακα γειτνίασης A και X να είναι το αντίστοιχο ιδιοδιάνυσμα. Σε αυτό το σημείο θα υπενθυμίσουμε τι ακριβώς αναφέρει το θεώρημα Perron-Frobenius. Στην γραμμική άλγεβρα, το θεώρημα Perron-Frobenius μας λέει ότι ένας τετραγωνικός πίνακας με θετικά πραγματικά στοιχεία έχει μια μοναδική μέγιστη πραγματική ιδιοτιμή και ότι το ιδιοδιάνυσμα που αντιστοιχεί σε αυτήν την ιδιοτιμή μπορεί να επιλεγεί έτσι ώστε να περιλαμβάνει μόνο θετικά στοιχεία. Με τον τρόπο που ορίστηκε παραπάνω η κεντρικότητα ιδιοτιμής, αποδίδει σε κάθε κόμβο μια κεντρικότητα η οποία εξαρτάται τόσο από από το πλήθος των συνδέσεων/επαφών του, όσο και από την ποιότητα τους. Το να έχει ένας κόμβος μεγάλο αριθμό συνδέσεων είναι σίγουρα κάτι θετικό, όμως ένας κόμβος με μικρότερο αριθμό αλλά υψηλότερης ποιότητας συνδέσεις/επαφές μπορεί να υπερκεράσει έναν κόμβο ο οποίος έχει περισσότερες αλλά χαμηλότερης ποιότητας συνδέσεις/επαφές.

28 11 Μονοπάτια και γεωδαισιακά μονοπάτια Δύο άλλα χρήσιμα μέτρα της κεντρικότητας είναι η κεντρικότητα εγγύτητας (closeness centrality) και η κεντρικότητα ενδιαμεσότητας (betweenness centrality), οι οποίες βασίζονται στην ιδέα των μονοπατιών (paths) εντός των δικτύων. Με τον όρο μονοπάτι μέσα σε ένα δίκτυο, εννοούμε μια ακολουθία διαδοχικών κόμβων την οποία και διασχίζουμε ακολουθώντας τις ακμές που ενώνουν αυτούς τους διαδοχικούς κόμβους κατά μήκος του δικτύου. Θεωρώντας σαν μονάδα μέτρησης του μήκους εντός ενός δικτύου την ακμή, ορίζουμε ως γεωδαισιακό μονοπάτι το μικρότερο σε μήκος μονοπάτι που ενώνει ένα συγκεκριμένο ζεύγος κόμβων. Τα γεωδαισιακά μονοπάτια δεν είναι απαραίτητα και μοναδικά. Θα μπορούσαν για παράδειγμα να υπάρχουν δύο ή περισσότερα γεωδαισιακά μονοπάτια που να ενώνουν ένα συγκεκριμένο ζεύγος κόμβων εντός του ιδίου δικτύου Κεντρικότητα εγγύτητας (closeness centrality) Ως κεντρικότητα εγγύτητας (closeness centrality) ενός κόμβου i ορίζουμε την μέση γεωδαισιακή απόσταση (δηλαδή το μέσο μήκος γεωδαισιακού μονοπατιού) από τον κόμβο i προς όλους τους άλλους κόμβους του δικτύου. Η κεντρικότητα εγγύτητας είναι χαμηλότερη για τους κόμβους που είναι πιο κεντρικοί, με την έννοια ότι αυτοί οι κόμβοι απέχουν την μικρότερη απόσταση (κατά μέσο όρο) από τους υπόλοιπους κόμβους. Μερικοί συγγραφείς ορίζουν την κεντρικότητα εγγύτητας ως τον αντίστροφο του μέσου, έτσι ώστε οι μεγαλύτερες τιμές να δηλώνουν μεγαλύτερη κεντρικότητα. Επιπλέον, μερικοί κόμβοι μπορεί να μην είναι καν προσβάσιμοι από τον κόμβο i, καθότι μπορεί να ανήκουν σε συνιστώσες (components) του δικτύου οι οποίες δεν επικοινωνούν με την συνιστώσα στην οποία βρίσκεται ο i. Σε αυτήν την περίπτωση, ο ορισμός της εγγύτητας που δόθηκε στην αρχή αυτής της παραγράφου δεν είναι επαρκής. Η συνήθης λύση σε αυτό το πρόβλημα είναι να θεωρήσουμε την κεντρικότητα εγγύτητας ως την μέση γεωδαισιακή απόσταση προς όλους τους προσβάσιμους κόμβους, μη λαμβάνοντας υπόψη εκείνους τους κόμβους προς τους οποίους ο i δεν έχει πρόσβαση.

29 Κεντρικότητα ενδιαμεσότητας (betweenness centrality) Ως κεντρικότητα ενδιαμεσότητας (betweenness centrality) ενός κόμβου i ορίζουμε το υποσύνολο των γεωδαισιακών μονοπατιών (από το σύνολο των γεωδαισιακών μονοπατιών που συνδέουν μεταξύ τους όλους τους υπόλοιπους κόμβους), στα οποία παρεμβάλλεται ο κόμβος i. Δηλαδή, βρίσκουμε το μικρότερο μονοπάτι (ή τα μικρότερα μονοπάτια) μεταξύ κάθε δυνατού ζεύγους κόμβων και εντοπίζουμε σε ποιο υποσύνολο αυτών των μονοπατιών παρεμβάλλεται ο κόμβος i. Η ενδιαμεσότητα, είναι ένα αδρό μέτρο του ελέγχου που μπορεί να ασκήσει ο κόμβος i επί της ροής της πληροφορίας που πραγματοποιείται μεταξύ των υπολοίπων κόμβων. Εάν φανταστούμε την πληροφορία να ρέει μεταξύ των κόμβων ενός δικτύου πάντοτε μέσω των μικρότερων δυνατών μονοπατιών, τότε η κεντρικότητα ενδιαμεσότητας μετράει το υποσύνολο αυτής της πληροφορίας που θα διέλθει μέσω του κόμβου i κατά την πορεία της προς οποιοδήποτε κόμβο. Σε κοινωνικό επίπεδο, ένας κόμβος με υψηλή ενδιαμεσότητα έχει την δυνατότητα άσκησης μεγάλης επιρροής όχι επειδή βρίσκεται στο κέντρο του δικτύου (αν και κάτι τέτοιο μπορεί να συμβεί) αλλά επειδή παρεμβάλλεται μεταξύ των υπολοίπων κόμβων. Στις περισσότερες των περιπτώσεων, το να θεωρήσουμε ότι η πληροφορία ρέει πάντοτε μέσω γεωδαισιακών μονοπατιών είναι μια απλουστευτική προσέγγιση καθότι τις περισσότερες φορές κάτι τέτοιο δεν συμβαίνει. Για τον λόγο αυτό έχουν προταθεί διάφορες παραλλαγές της κεντρικότητας ενδιαμεσότητας όπως η ενδιαμεσότητα ροής (flow betweenness) και η ενδιαμεσότητα τυχαίου περιπάτου (random walk betweenness). Στην πράξη όμως, στις περισσότερες των περιπτώσεων, η απλή κεντρικότητα ενδιαμεσότητας (γεωδαισιακού μονοπατιού) μπορεί να δώσει πολύ καλές απαντήσεις Το φαινόμενο του μικρού κόσμου (small-world effect) Η μελέτη των συντομότερων μονοπατιών στα δίκτυα οδήγησε τους ερευνητές στην ανακάλυψη μιας άλλης ενδιαφέρουσας ιδέας, το φαινόμενο του μικρού κόσμου (small-world effect). Έχει βρεθεί ότι στα περισσότερα δίκτυα η μέση γεωδαισιακή απόσταση μεταξύ ζευγών κόμβων είναι μικρή συγκρινόμενη με το συνολικό μέγεθος του δικτύου. Σε ένα διάσημο πείραμα που πραγματοποιήθηκε την δεκαετία του 1960, ο Αμερικανός ψυχολόγος Stanley Milgram ζήτησε από τους συμμετέχοντες να μεταφέρουν ένα μήνυμα σε έναν συγκεκριμένο παραλήπτη που βρισκόταν κάπου αλλού στην χώρα, περνώντας το διαδοχικά ο ένας στον άλλο δια μέσω του πληθυσμού. Το

30 13 εντυπωσιακό εύρημα του Milgram ήταν ότι στην πλειονότητα των περιπτώσεων, το μήνυμα έφτανε στον παραλήπτη (κατά μέσο όρο) μέσω έξι παρεμβαλλόμενων τυχαίων ανθρώπων και αυτό αποτυπώθηκε στην έκφραση έξι βαθμοί διαχωρισμού (six degrees of separation). Από την εποχή του πειράματος του Milgram, το φαινόμενο του μικρού κόσμου έχει επαληθευθεί πειραματικά και σε πολλά άλλα δίκτυα, τόσο κοινωνικά όσο και μη κοινωνικά Άλλες σημαντικές ιδιότητες των δικτύων Άλλες ιδιότητες των δικτύων που έχουν τραβήξει την προσοχή των ερευνητών περιλαμβάνουν: α) Την συσταδοποίηση (clustering/transitivity), δηλαδή την τάση σχηματισμού τριγώνων επαφών που στην καθομιλουμένη μπορεί να αποδοθεί από την φράση ο φίλος του φίλου μου, είναι και δικός μου φίλος. β) Την ομοιότητα κόμβων, δηλαδή το αν δύο συγκεκριμένοι κόμβοι μπορούν ή δεν μπορούν να καταλάβουν παρόμοιες θέσεις εντός του δικτύου. γ) Τις κοινότητες που σχηματίζονται εντός των δικτύων και τις μεθόδους εντοπισμού αυτών. δ) Την κατανομή των βαθμών των κόμβων Ο τυχαίος γράφος (random graph) ως μοντέλο δικτύου Το πιο απλό μοντέλο δικτύου είναι ο τυχαίος γράφος Bernoulli, που απλούστερα αναφέρεται και ως τυχαίος γράφος. Σε αυτό το μοντέλο λαμβάνουμε ένα συγκεκριμένο πλήθος κόμβων n και δημιουργούμε ακμές μεταξύ αυτών, με ανεξάρτητη πιθανότητα p για κάθε ζεύγος κόμβων. Όταν το p είναι μικρό, υπάρχουν μόνο λίγες ακμές στο δίκτυο και οι περισσότεροι κόμβοι είναι είτε απομονωμένοι είτε ανήκουν σε μικρές ομάδες συνδεδεμένων μεταξύ τους κόμβων. Αντιθέτως, όταν το p είναι μεγάλο,

31 τότε είναι παρούσες σχεδόν όλες οι δυνατές ακμές μεταξύ των ( n 2) 14 δυνατών ζευγών κόμβων και όλοι (ή σχεδόν όλοι) οι κόμβοι συνδέονται μεταξύ τους σχηματίζοντας μία μεγάλη συνεκτική ομάδα. Θα μπορούσε κάποιος να υποθέσει, ότι για ενδιάμεσες τιμές του p τα μεγέθη των ομάδων θα αυξάνονταν με ομαλό τρόπο από το μικρό ως το μεγάλο μέγεθος. Κάτι τέτοιο όμως δεν συμβαίνει στην πράξη. Αντιθέτως, έχει βρεθεί ότι υπάρχει μια μετάβαση φάσης (phase transition) η οποία εμφανίζεται για την ειδική τιμή p= 1 n, πάνω από την οποία σχηματίζεται η ονομαζόμενη γιγαντιαία συνιστώσα (giant component) και πρόκειται για μια ομάδα συνδεδεμένων μεταξύ τους κόμβων η οποία καταλαμβάνει ένα σταθερό μέρος του συνολικού δικτύου (με το μέγεθος του να μπορεί να φτάσει ακόμα και το n ). Περισσότερες λεπτομέρειες για το πως προκύπτει η σχέση δώσουμε στο δεύτερο κεφάλαιο αυτής της εργασίας. p= 1 n θα Για p< 1 n, υπάρχουν μόνο μικρές ομάδες κόμβων, το μέγεθος των οποίων είναι ανεξάρτητο του n. Πολλά δίκτυα του πραγματικού κόσμου παρουσιάζουν συμπεριφορά παρόμοια με αυτή του τυχαίου γράφου, με μια μεγάλη συνιστώσα συνδεδεμένων μεταξύ τους κόμβους να καταλαμβάνει ένα υπολογίσιμο μέρος του συνολικού δικτύου και τους υπόλοιπους κόμβους να ανήκουν σε πολύ μικρότερου μεγέθους συνιστώσες οι οποίες δεν συνδέονται με το υπόλοιπο δίκτυο Διαφορά μεταξύ του μοντέλου τυχαίου γράφου και των δικτύων του πραγματικού κόσμου Ο νόμος δυνάμεως (power law) και τα ελεύθερα κλίμακας (scale free) δίκτυα Ο τυχαίος γράφος έχει ένα μεγάλο μειονέκτημα: Η κατανομή των βαθμών των κόμβων του, δεν μοιάζει με αυτήν που συναντάμε στα δίκτυα του πραγματικού κόσμου. Η πιθανότητα p k, ένας κόμβος του τυχαίου γράφου να έχει βαθμό ίσο με k δίνεται από την διωνυμική κατανομή, η οποία μεταπίπτει σε κατανομή Poisson όταν n z n k (αραιό δίκτυο):

32 15 p k = ( n 1 k ) pk (1 p) n 1 k zk e z k!, όπου z= k =(n 1) p n p είναι ο μέσος βαθμός των κόμβων του δικτύου Σχήμα 1.6 Διωνυμική κατανομή Σχήμα 1.7 Κατανομή Poisson

33 16 Οι παρατηρήσεις σε δίκτυα του πραγματικού κόσμου (κοινωνικά και μη κοινωνικά) έδειξαν ότι τα περισσότερα εξ αυτών παρουσιάζουν κατανομή βαθμών κόμβων που δεν είναι Poisson και η οποία συχνά παρουσιάζει μια σημαντική ασυμμετρία προς τα δεξιά η οποία μας δίνει μια παχιά ουρά που αντιστοιχεί σε κόμβους που έχουν ασυνήθιστα μεγάλο βαθμό. Αυτούς τους κόμβους που έχουν ασυνήθιστα μεγάλο βαθμό τους ονομάζουμε hubs και όπως έχει αποδειχθεί έχουν σημαντικές επιπτώσεις στην συμπεριφορά ενός δικτύου. Σχήμα 1.8 Νόμος δυνάμεως Σε αυτές τις περιπτώσεις, λέμε ότι η κατανομή των βαθμών των κόμβων ακολουθεί νόμο δυνάμεως (power law) και για να το δηλώσουμε αυτό χρησιμοποιούμε τον συμβολισμό p k k γ. Για γ <2, η μέση τιμή του βαθμού k αποκλίνει. Για γ <3, η τυπική απόκλιση του βαθμού k αποκλίνει. Επιπλέον, έχει βρεθεί πειραματικά ότι 2<γ<3. Τέτοιου είδους δίκτυα ονομάζονται ελεύθερα κλίμακας (scale-free) διότι το μέγεθος τους μπορεί να αυξάνεται χωρίς κανέναν περιορισμό.

34 17 2 ο Κεφάλαιο Το μοντέλο Erdos-Renyi

35 Το μοντέλο Erdos-Renyi Μέσα από μια σειρά μελετών που εξέδωσαν τις δεκαετίες του 1950 και 1960, οι Paul Erdos και Alfred Renyi πρότειναν ένα πρώιμο θεωρητικό μοντέλο για την αναπαράσταση και μελέτη δικτύων, τον ονομαζόμενο τυχαίο γράφο (Erdos & Renyi, 1959, 1960, 1961). Αυτό το απλοϊκό μοντέλο αποτελείται από n κόμβους, ή αλλιώς κορυφές, (στα Αγγλικά: nodes ή vertices ή sites) που ενώνονται μεταξύ τους με ακμές,ή αλλιώς συνδέσμους, (στα Αγγλικά: edges ή links) οι οποίες τοποθετούνται μεταξύ ζευγών κόμβων οι οποίοι επιλέγονται με ομοιόμορφα τυχαίο τρόπο. Οι Erdos και Renyi πρότειναν διάφορες εκδοχές για το μοντέλο τους. Η εκδοχή του μοντέλου που συναντάμε συνήθως στην πράξη συμβολίζεται ως G n, p και σύμφωνα με αυτήν, κάθε δυνατή ακμή μεταξύ δύο κόμβων μπορεί να εμφανιστεί με ανεξάρτητη πιθανότητα p, ενώ η μη εμφάνιση της (δηλαδή η απουσία της) αντιστοιχεί σε πιθανότητα 1 p ( συχνά χρησιμοποιείται και ο συμβολισμός q=1 p ). Ο αλγόριθμος που πρέπει να ακολουθήσει κάποιος για την κατασκευή ενός τυχαίου γράφου G n, p έχει ως εξής: Βήμα 1: Ξεκινάμε έχοντας στην διάθεση μας κόμβους. n απομονωμένους (δηλαδή ασύνδετους μεταξύ τους) Βήμα 2: Επιλέγουμε ένα τυχαίο ζεύγος κόμβων και με την βοήθεια μιας γεννήτριας τυχαίων αριθμών παράγουμε έναν τυχαίο αριθμό ο οποίος θα πρέπει να ανήκει στο διάστημα [0,1]. Αν αυτός ο παραχθείς αριθμός είναι μεγαλύτερος από το p τότε συνδέουμε τους δύο κόμβους μεταξύ τους, ενώ αν είναι μικρότερος από το p τους αφήνουμε ασύνδετους. Βήμα 3: Επαναλαμβάνουμε το Βήμα 2 για κάθε ένα από τα κόμβων. ( n 2) = 1 n(n 1) δυνατά ζεύγη 2 Για την ακρίβεια, G n, p είναι το σύνολο (συλλογή) των γράφων οι οποίοι διαθέτουν n το πλήθος

36 19 κόμβους και κάθε ένας εξ' αυτών δύναται να εμφανιστεί με πιθανότητα ανάλογη του πλήθους των ακμών του. Συγκεκριμένα, για έναν γράφο με n κόμβους και m ακμές, η πιθανότητα εμφάνισης ενός μέλους της συλλογής είναι p m (1 p) M m = p m q M m Όπου M = ( n 2) = n! (n 2!) 2! n (n 1) (n 2)! = = 1 n (n 1) είναι ο μέγιστος αριθμός ακμών που (n 2)! 2! 2 μπορούν να εμφανιστούν σε έναν γράφο με n κόμβους όταν όλοι αυτοί οι κόμβοι συνδεθούν μεταξύ τους. Προφανώς ισχύει ότι m M. Συχνά, επιθυμούμε να εκφράζουμε τις ιδιότητες του μοντέλου G n, p όχι χρησιμοποιώντας την πιθανότητα p αλλά τον μέσο βαθμό (average degree) z των κόμβων του δικτύου. Ο βαθμός (degree) ενός κόμβου, ισούται με τον αριθμό (πλήθος) των ακμών που είναι συνδεδεμένες σε αυτόν και συμβολίζεται ως k, οπότε ο μέσος βαθμός των κόμβων του δικτύου θα είναι z= k Σε αυτό το σημείο θα δείξουμε πως υπολογίζετε αναλυτικά το z. Η πιθανότητα P m ένας τυχαίος γράφος με n κόμβους να έχει ακριβώς m ακμές ισούται με το γινόμενο των τριών παρακάτω παραγόντων: 1. Την πιθανότητα p m, που είναι η πιθανότητα οι m δοκιμές που κάναμε για να συνδέσουμε τα ( n 2) = 1 2 n(n 1) ζεύγη κόμβων να οδήγησαν πράγματι στην εμφάνιση ακμών (επιτυχία) Την πιθανότητα (1 p) n(n 1) m, που είναι η πιθανότητα που αντιστοιχεί στις υπόλοιπες 1 n(n 1) m δοκιμές που έγιναν αλλά δεν οδήγησαν στον σχηματισμό ακμών (αποτυχία) Τον συνδυαστικό παράγοντα ( 1 2 n (n 1) m ) που μας δίνει όλους τους δυνατούς διαφορετικούς

37 τρόπους με τους οποίους μπορούμε να τοποθετήσουμε m ακμές μεταξύ των ( n 2) = 1 n (n 1) 2 ζευγών κόμβων. 20 Άρα είναι P m =( 1 2 n (n 1) m ) pm 1 2 (1 p) n(n 1) m Η τελευταία σχέση προφανώς είναι μια διωνυμική κατανομή, οπότε η μέση τιμή του αριθμού των ακμών m, δηλαδή ο μέσος αριθμός ακμών εντός του τυχαίου γράφου, θα είναι: 1 2 n (n 1) m = m P m = 1 2 n (n 1) p m=0 Η μέθοδος υπολογισμού αυτού του αθροίσματος παρουσιάζεται αναλυτικά στο παράρτημα Α της παρούσας εργασίας. Ο μέσος αριθμός των άκρων αυτών των ακμών θα είναι το διπλάσιο του τελευταίου αποτελέσματος, δηλαδή 2 1 n (n 1) p = n (n 1) p, αφού κάθε ακμή έχει δύο άκρα. 2 Συνεπώς, ο μέσος βαθμός ενός κόμβου είναι: z= k = n (n 1) p =(n 1) p np n Όπου η τελευταία προσεγγιστική ισότητα ισχύει για μεγάλες τιμές του n. Άρα, από την στιγμή που γνωρίζουμε το πλήθος των κόμβων n, κάθε ιδιότητα του γράφου που μπορεί να εκφραστεί συναρτήσει της πιθανότητας p, μπορεί να εκφραστεί και συναρτήσει του μέσου βαθμού z. Το μοντέλο Erdos-Renyi διαθέτει ένα πλήθος επιθυμητών ιδιοτήτων σαν μοντέλο δικτύου. Συγκεκριμένα, έχει βρεθεί ότι πολλές από τις μέσες (average) ιδιότητες αυτής της συλλογής γράφων μπορούν να υπολογιστούν επακριβώς στο όριο όπου το n γίνεται πολύ μεγάλο (Bollobas, 1985 ; Janson et al., 1999). Για παράδειγμα, ένα ενδιαφέρον χαρακτηριστικό που αναδείχθηκε μέσα από τις εργασίες των Erdos

38 και Renyi, είναι ότι το μοντέλο παρουσιάζει μια μετάβαση φάσης (phase transition) καθώς αυξάνεται το z= k, κατά την οποία σχηματίζεται μια γιγαντιαία συνιστώσα (giant component). Γενικά, με τον όρο συνιστώσα (component) εννοούμε ένα υποσύνολο συνδεδεμένων κόμβων του γράφου, κάθε ένας εκ των οποίων είναι προσεγγίσιμος από τους υπόλοιπους κόμβους του ιδίου υποσυνόλου μέσω κάποιου μονοπατιού. Για μικρές τιμές του z, όπου έχουμε λίγες ακμές μέσα στον γράφο, οι περισσότεροι κόμβοι δεν είναι συνδεδεμένοι μεταξύ τους και οι συνιστώσες είναι μικρές, έχοντας ένα μέσο μέγεθος το οποίο παραμένει σταθερό καθώς ο γράφος σταδιακά γίνεται μεγαλύτερος. Υπάρχει όμως μια κρίσιμη τιμή του γράφου περιέχει ένα πεπερασμένο υποσύνολο S το μέγεθος αυτής της συνιστώσας ( που είναι ίσο με z πάνω από την οποία, η μεγαλύτερη συνιστώσα εντός του 21 του συνολικού αριθμού n των κόμβων. Δηλαδή, Sn ) μεγαλώνει γραμμικά με το μέγεθος του συνολικού γράφου. Αυτή η μεγαλύτερη συνιστώσα είναι η γιγαντιαία συνιστώσα. Γενικά, θα συνυπάρχουν και άλλες συνιστώσες μαζί με την γιγαντιαία συνιστώσα αλλά αυτές θα είναι σημαντικά μικρότερες και έχουν ένα μέσο μέγεθος το οποίο παραμένει σταθερό καθώς ο γράφος μεγαλώνει. Η μετάβαση φάσης, κατά την οποία σχηματίζεται η γιγαντιαία συνιστώσα, συμβαίνει ακριβώς την στιγμή όπου γίνεται z= 1, όταν δηλαδή z=(n 1) p= 1 p= 1 n 1 Για μεγάλες τιμές του n η τελευταία σχέση γράφεται p= 1 n Αναλυτική απόδειξη για το πως προκύπτει η συνθήκη z= 1, υπάρχει στο παράρτημα Γ. Ο σχηματισμός της γιγαντιαίας συνιστώσας μέσα στον τυχαίο γράφο, θυμίζει έντονα την συμπεριφορά πολλών δικτύων του πραγματικού κόσμου, όπως είναι για παράδειγμα τα κοινωνικά δίκτυα. Θα μπορούσαμε εύκολα να φανταστούμε αραιά δίκτυα στα οποία υπάρχουν τόσο λίγες ακμές που δεν ευνοείται η εμφάνιση μιας γιγαντιαίας συνιστώσας και στα οποία όλοι οι κόμβοι είναι συνδεδεμένοι μονάχα με έναν μικρό αριθμό άλλων κόμβων. Αν θεωρούσαμε ένα κοινωνικό δίκτυο στο οποίο ζεύγη ανθρώπων συνδέονται μεταξύ τους στην περίπτωση που αυτοί είχαν μια συζήτηση τα τελευταία 60 δευτερόλεπτα της τρέχουσας ώρας, τότε

39 22 πιθανότατα το δίκτυο αυτό θα ήταν τόσο αραιό που δεν θα ήταν εφικτός ο σχηματισμός γιγαντιαίας συνιστώσας. Αντιθέτως, ένα κοινωνικό δίκτυο στο οποίο ζεύγη ανθρώπων συνδέονται μεταξύ τους στην περίπτωση που αυτοί είχαν γενικώς μια συζήτηση (την οποιαδήποτε χρονική στιγμή), θα ήταν πολύ πυκνά συνδεδεμένο και σίγουρα θα εμφανιζόταν σε αυτό μια γιγαντιαία συνιστώσα. Οι τυχαίοι γράφοι όμως, εκτός από ομοιότητες, παρουσιάζουν και κάποιες διαφορές σε σχέση με τα δίκτυα του πραγματικού κόσμου. Πιο συγκεκριμένα, έχει παρατηρηθεί ότι παρουσιάζουν δύο σημαντικές διαφορές (Strogatz, 2001 ; Albert & Barabasi, 2002) Πρώτη διαφορά των τυχαίων γράφων σε σχέση με τα δίκτυα του πραγματικού κόσμου: Το φαινόμενο της συσταδοποίησης (clustering) Καταρχήν, όπως έδειξαν οι Watts και Strogatz (Watts & Strogatz, 1998 ; Watts, 1999), τα δίκτυα του πραγματικού κόσμου παρουσιάζουν έντονη συσταδοποίηση (clustering) ή αλλιώς μεταβατικότητα (transitivity), σε αντίθεση με το μοντέλο Erdos-Renyi το οποίο αγνοεί πλήρως αυτό το φαινόμενο. Λέμε ότι ένα δίκτυο παρουσιάζει συσταδοποίηση (μεταβατικότητα) όταν η πιθανότητα δύο κόμβοι να συνδεθούν μεταξύ τους με μια ακμή είναι μεγαλύτερη όταν οι εν λόγω κόμβοι έχουν έναν κοινό γείτονα. Όταν δηλαδή υπάρχει ένας άλλος κόμβος μέσα στο δίκτυο, με τον οποίο συνδέονται και οι δύο. Οι Watts και Strogatz μπόρεσαν και μέτρησαν (ποσοτικοποίησαν) την συσταδοποίηση ορίζοντας τον λεγόμενο συντελεστή συσταδοποίησης C, που είναι η μέση πιθανότητα δύο κόμβοι που είναι γείτονες ενός τρίτου κόμβου να είναι και μεταξύ τους γείτονες. Έχει βρεθεί ότι σε πολλά δίκτυα του πραγματικού κόσμου, ο συντελεστής συσταδοποίησης έχει υψηλές τιμές. Ακόμα και της τάξης του 50% ή και περισσότερο. Αντιθέτως, στο μοντέλο Erdos-Renyi οι πιθανότητες να ενωθούν μεταξύ τους ζεύγη κόμβων με ακμές είναι εξ ορισμού ανεξάρτητες. Κατά συνέπεια, δεν είναι πιθανότερο να ενωθούν μεταξύ τους δύο κόμβοι αν έχουν ένα κοινό γείτονα από ότι αν δεν τον είχαν. Αυτό σημαίνει ότι ο συντελεστής συσταδοποίησης για έναν τυχαίο γράφο είναι απλώς C= p ή ισοδύναμα C z n.

40 23 Στον πίνακα που ακολουθεί, γίνεται σύγκριση των τιμών των συντελεστών συσταδοποίησης διαφόρων δικτύων του πραγματικού κόσμου με τις αντίστοιχες τιμές που παρουσιάζουν οι συντελεστές αυτοί στην περίπτωση τυχαίων γράφων οι οποίοι έχουν ακριβώς τον ίδιο αριθμό κόμβων και ακμών. Πίνακας 2.1 Δίκτυα του πραγματικού κόσμου και οι συντελεστές συσταδοποίησης αυτών Ακολουθεί σύντομη περιγραφή του κάθε γράφου που παρουσιάζεται σε αυτόν τον πίνακα: Internet (autonomous systems): Πρόκειται για ένα γράφο των συνδέσεων με οπτικές ίνες που αποτελούν το διαδίκτυο (internet) σε επίπεδο αυτόνομου συστήματος. Ένα αυτόνομο σύστημα είναι μια ομάδα υπολογιστών εντός του οποίου η διαχείριση της ροής των δεδομένων (data flow) γίνεται αυτόνομα, ενώ η ροή δεδομένων μεταξύ διαφορετικών ομάδων υπολογιστών γίνεται μέσω του δημοσίου διαδικτύου (public internet). (Pastor-Satorras et al., 2001). World-Wide Web: Είναι ένας γράφος των ιστοτόπων του WWW στον οποίο οι ακμές αντιπροσωπεύουν υπερσυνδέσμους (hyperlinks) οι οποίοι συνδέουν τον έναν ιστότοπο με τον άλλον. Με τον όρο ιστότοπος εννοούμε μια συλλογή ιστοσελίδων οι οποίες φιλοξενούνται σε έναν εξυπηρετητή (server). Αν και οι υπερσύνδεσμοι είναι κατευθυντικοί, για τον υπολογισμό του συντελεστή συσταδοποίησης έχει αγνοηθεί ο προσανατολισμός τους. (Adamic, 1999).

41 24 Power grid: Είναι ένας γράφος του δικτύου διανομής ηλεκτρικής ενέργειας των δυτικών πολιτειών των Η.Π.Α. Οι κόμβοι αναπαριστούν σταθμούς παραγωγής και υποσταθμούς ενώ οι ακμές αντιπροσωπεύουν γραμμές διανομής. (Watts & Strogatz, 1998). Biology collaborations: Είναι ένας γράφος των συνεργασιών μεταξύ ερευνητών που εργάζονται στους τομείς της βιολογίας και της ιατρικής. Σε αυτήν την περίπτωση, ως συνεργασία μεταξύ δύο επιστημόνων θεωρείται η ομαδική συγγραφή μιας μελέτης η οποία δημοσιεύθηκε στην βιβλιογραφική βάση δεδομένων Medline από το έτος 1995 εως και το έτος (Newman, 2001b). Mathematics collaborations: Πρόκειται για ένα γράφο συνεργασιών μεταξύ μαθηματικών, ο οποίος προέκυψε από εξέταση των αρχείων του Mathematical Reviews. (Newman, 2001d). Film actor collaborations: Είναι ένας γράφος συνεργασιών μεταξύ ηθοποιών, όπου συνεργασία σε αυτήν την περίπτωση σημαίνει ότι δύο συγκεκριμένοι ηθοποιοί εμφανίστηκαν στην ίδια ταινία. Τα δεδομένα λήφθηκαν από το Internet Movie Database (IMDB). (Newman et al., 2001). Company directors: Είναι ένας γράφος συνεργασιών μεταξύ των διευθυντών της κατηγορίας Fortune 1000 για το έτος Στην κατηγορία Fortune 1000 ανήκουν οι 1000 εταιρείες των Η.Π.Α. με τα μεγαλύτερα ετήσια κέρδη. Σε αυτήν την περίπτωση, συνεργασία σημαίνει ότι δύο συγκεκριμένοι διευθυντές υπηρέτησαν στο κεντρικό συμβούλιο της ίδιας εταιρείας εκείνη την συγκεκριμένη χρονιά. (Newman et al., 2001). Word co-occurences: Πρόκειται για ένα γράφο στον οποίο οι κόμβοι αντιπροσωπεύουν λέξεις της Αγγλικής γλώσσας και μια ακμή σημαίνει ότι οι δύο κόμβοι που συνδέει είναι λέξεις που συχνά εμφανίζονται μέσα στην ίδια πρόταση σε γειτονικές θέσεις. (Cancho & Sole, 2001). Neural network: Είναι ένας γράφος του νευρωνικού δικτύου του σκώληκα C. Elegans. (Watts & Strogatz, 1998). Metabolic network: Γράφος των αλληλεπιδράσεων οι οποίες σχηματίζουν ένα τμήμα της διαδικασίας παραγωγής ενέργειας και του μεταβολισμού του βακτηρίου E. Coli. Εδώ οι κόμβοι αναπαριστούν υποστρώματα και παράγωγα, ενώ οι ακμές αναπαριστούν αλληλεπιδράσεις. (Montoya & Sole, 2001). Food web: Το δίκτυο της τροφικής αλυσίδας των ζώων-θηρευτών στο Aberdeen της Σκωτίας. Όπως και στην περίπτωση των ακμών του World-Wide Web γράφου, δεν λήφθηκε υπόψη ο προσανατολισμός τους για τον υπολογισμό του συντελεστή συσταδοποίησης. (Fell & Wagner, 2000).

42 25 Όπως φαίνεται από τον πίνακα, οι τιμές που λαμβάνει ο συντελεστής συσταδοποίησης C όταν μετρήθηκε στα δίκτυα του πραγματικού κόσμου είναι πολύ διαφορετικές σε σχέση με εκείνες που λαμβάνει στους αντίστοιχους θεωρητικούς τυχαίους γράφους. Οι μετρούμενες και οι θεωρητικές τιμές μπορεί να διαφέρουν μεταξύ τους ακόμα και μέχρι τέσσερεις τάξεις μεγέθους. Είναι προφανές επομένως, ότι το μοντέλο του τυχαίου γράφου δεν λαμβάνει υπόψη του το φαινόμενο της συσταδοποίησης Δεύτερη διαφορά των τυχαίων γράφων σε σχέση με τα δίκτυα του πραγματικού κόσμου: Η κατανομή των βαθμών των κόμβων Το δεύτερο σημείο στο οποίο οι τυχαίοι γράφοι διαφέρουν από τα δίκτυα του πραγματικού κόσμου είναι στην κατανομή των βαθμών των κόμβων. Αυτό το σημείο αναδείχθηκε στις εργασίες των Albert και Barabasi (Albert et al., 1999 ; Barabasi & Albert, 1999). Η πιθανότητα p k ένας κόμβος του μοντέλου Erdos-Renyi ( n κόμβων ) να έχει βαθμό ακριβώς ίσο με k δίνεται από την διωνυμική κατανομή: p k = ( n 1 k ) pk (1 p) n 1 k = ( n 1 k ) pk q n 1 k = (n 1)! k! (n 1 k)! pk (1 p) n 1 k όπου (1) p k είναι η πιθανότητα να είναι συνδεδεμένες σε αυτόν τον κόμβο (δηλαδή να κάνουν την εμφάνιση τους) k ακμές του γράφου. (2) (1 p) n 1 k είναι η πιθανότητα οι υπόλοιπες n 1 k ακμές του γράφου να μην συνδέονται (δηλαδή να μην κάνουν την εμφάνιση τους) σε αυτόν τον κόμβο. (3) ( n 1 k ) είναι το πλήθος των διαφορετικών τρόπων με τους οποίους μπορούμε να επιλέξουμε k από τις n 1 συνολικά ακμές που είναι δυνατόν να συνδεθούν σε αυτόν τον κόμβο. Στο όριο όπου n z n k (προσέγγιση αραιού δικτύου), η παραπάνω σχέση γίνεται p k = zk e z k! που δεν είναι άλλη από την κατανομή Poisson.

43 Περισσότερες λεπτομέρειες σχετικά με το υπό ποιες συνθήκες και με ποιο τρόπο μπορεί μια διωνυμική κατανομή να προσεγγιστεί με μια κατανομή Poisson δίδονται στο παράρτημα Β. 26 Τόσο η διωνυμική κατανομή, όσο και η κατανομή Poisson, παρουσιάζουν μια έντονη κορυφή (peak) στην περιοχή γύρω από την μέση τιμή του z, καθώς και μια ουρά για τις μεγάλες τιμές του k η οποία φθίνει με ταχύ ρυθμό που είναι ανάλογος του 1 k!. Προκειμένου να συγκρίνουμε τα αποτελέσματα που θα μας έδινε μια τέτοια μαθηματική θεώρηση σε σχέση με τις κατανομές των βαθμών των κόμβων που παρουσιάζουν τα δίκτυα του πραγματικού κόσμου, παραθέτουμε τα επόμενα ιστογράμματα βαθμών κόμβων τα οποία κατασκευάστηκαν με μετρήσεις που έγιναν στα δίκτυα πραγματικού κόσμου που παρουσιάσαμε στον πίνακα 2.1. Σχήμα 2.1 Κατανομές των βαθμών των κόμβων δικτύων του πραγματικού κόσμου

44 27 Σχήμα 2.1 Κατανομές των βαθμών των κόμβων δικτύων του πραγματικού κόσμου (συνέχεια) Όπως γίνεται αμέσως φανερό, στις περισσότερες των περιπτώσεων οι κατανομές των βαθμών των κόμβων των δικτύων του πραγματικού κόσμου διαφέρουν σημαντικά από την κατανομή Poisson. Πολλά από αυτά τα δίκτυα (συμπεριλαμβανομένων των γράφων του World Wide Web και του Internet) παρουσιάζουν κατανομές των βαθμών των κόμβων τους οι οποίες ακολουθούν νόμο δυνάμεως (power law) (Albert et al., 1999 ; Faloutsos et al., 1999; Broder et al., 2000), που σημαίνει ότι ένα μικρό (αλλά όχι αμελητέο) υποσύνολο κόμβων σε αυτά τα δίκτυα έχουν πολύ μεγάλους βαθμούς. Αυτή η συμπεριφορά, δεν παρουσιάζει καμία ομοιότητα με την κατανομή Poisson η οποία φθίνει με γρήγορο ρυθμό και αυτό έχει σημαντικές επιπτώσεις στην συμπεριφορά του δικτύου. Κάποια δίκτυα, ειδικά οι γράφοι συνεργασιών, εμφανίζουν κατανομές των βαθμών των κόμβων οι

45 28 οποίες ακολουθούν νόμο δυνάμεως με εκθετική αποκοπή στην περιοχή των μεγάλων βαθμών (Amaral et al., 2000 ; Newman, 2001a,b), ενώ άλλα δίκτυα,όπως ο γράφος των διευθυντών επιχειρήσεων, φαίνονται να παρουσιάζουν κατανομή βαθμών με μια καθαρά εκθετική ουρά (Newman et al., 2001). Ο γράφος του δικτύου διανομής ηλεκτρικής ενέργειας είναι άλλο ένα παράδειγμα δικτύου το οποίο παρουσιάζει εκθετική κατανομή των βαθμών των κόμβων (Amaral et al., 2000). Σε αυτό το κεφάλαιο, θα παρουσιάσουμε τους τρόπους με τους οποίους είναι δυνατόν να γενικευτεί το μοντέλο Erdos-Renyi, προκειμένου να λαμβάνει υπόψη του την συσταδοποίηση και τις ιδιότητες των βαθμών των κόμβων των δικτύων του πραγματικού κόσμου. 2.2 Τυχαίοι γράφοι με προκαθορισμένες κατανομές βαθμών (μέθοδος Bender- Canfield) Το να κατασκευάσει κάποιος τυχαίους γράφους στους οποίους οι βαθμοί των κόμβων δεν θα ακολουθούν κατανομή Poisson, είναι κάτι σχετικά εύκολο. Η μέθοδος που θα περιγράψουμε εδώ παρουσιάστηκε το 1978 από τους Bender και Canfield. Το βασικό σημείο της μεθόδου έγκειται στο να προσδιοριστεί εξ αρχής μια συγκεκριμένη ακολουθία βαθμών, δηλαδή ένα συγκεκριμένο σύνολο {k i } το οποίο θα περιλαμβάνει τους βαθμούς των κόμβων i=1 n. Τα μέλη αυτού του συνόλου επιλέγονται έτσι ώστε το υποσύνολο των κόμβων που θα έχουν βαθμό k να τείνει στην επιθυμητή κατανομή βαθμών p k καθώς το n μεγαλώνει. Πρακτικά όμως, όπως όταν για παράδειγμα εκτελούμε αριθμητικές προσομοιώσεις, αρκεί απλώς να εκμαιεύσουμε μια ακολουθία βαθμών {k i } απευθείας από την κατανομή p k. Από την στιγμή που έχει καθοριστεί η ακολουθία των βαθμών, η μέθοδος για την κατασκευή του γράφου έχει ως εξής: Αποδίδουμε σε κάθε κόμβο i έναν αριθμό k i άκρων ακμών (stubs) οι οποίες θα εξέρχονται από τον συγκεκριμένο κόμβο και μετά επιλέγουμε ζεύγη τέτοιων stubs με ομοιόμορφο τυχαίο τρόπο και τα ενώνουμε μεταξύ τους προκειμένου να σχηματιστούν πλήρεις ακμές. Εφόσον έχουν χρησιμοποιηθεί όλα τα stubs, ο γράφος που θα προκύψει θα είναι ένα τυχαίο μέλος της συλλογής των γράφων που θα διαθέτουν την επιθυμητή ακολουθία βαθμών κόμβων.

46 Το λεπτό σημείο σε αυτόν τον αλγόριθμο είναι ότι ο συνολικός αριθμός των stubs θα πρέπει να είναι πάντοτε άρτιος, προκειμένου να μην περισσέψει στο τέλος της διαδικασίας κάποιο stub το οποίο δεν θα είναι ζευγαρωμένο. Για τον λόγο αυτό θα πρέπει να περιοριζόμαστε σε ακολουθίες βαθμών κόμβων για τις οποίες το αποτέλεσμα του αθροίσματος k i θα είναι πάντοτε άρτιος αριθμός. i Να σημειωθεί ότι, λόγω των k i! δυνατών αντιμεταθέσεων (permutations) των stubs που εξέρχονται από τον κόμβο i, υπάρχουν i k i! διαφορετικοί τρόποι για την κατασκευή κάθε ενός γράφου της συλλογής. Αυτός ο παράγοντας όμως είναι σταθερός όσο η ακολουθία βαθμών 29 {k i } διατηρείται σταθερή (fixed) και για αυτόν τον λόγο δεν εμποδίζει την μέθοδο από το να δειγματοληπτεί την συλλογή των τυχαίων γράφων σωστά. Αυτός είναι και ο λόγος για τον οποίο περιοριζόμαστε σε μια σταθερή ακολουθία βαθμών. Το να κρατήσουμε απλώς σταθερή (fixed) την κατανομή των βαθμών δεν αρκεί προκειμένου να εξασφαλίσουμε ότι η μέθοδος που περιγράψαμε παράγει γράφους με εξίσου ομοιόμορφο τυχαίο τρόπο από την επιθυμητή συλλογή τυχαίων γράφων. Η μέθοδος των Bender και Canfield δεν επιτρέπει τον ορισμό ενός συντελεστή συσταδοποίησης για τον προκύπτον γράφο. Εξάλλου την εποχή που οι δύο ερευνητές εξέδωσαν την μελέτη τους, δεν είχε επινοηθεί ακόμα η έννοια του συντελεστή συσταδοποίησης. Το γεγονός όμως ότι δεν ορίζεται συντελεστής συσταδοποίησης, είναι ταυτόχρονα και μια από τις κρίσιμες ιδιότητες αυτών των γράφων η οποία επιτρέπει την ακριβή επίλυση πολλών ιδιοτήτων τους στο όριο όπου το μέγεθος τους γίνεται πολύ μεγάλο. Σαν ένα παράδειγμα του γιατί κάτι τέτοιο είναι σημαντικό, ας θεωρήσουμε τον ακόλουθο απλό υπολογισμό: Ο μέσος αριθμός των γειτόνων ενός τυχαία επιλεγμένου κόμβου Α μέσα σε έναν γράφο με κατανομή βαθμών p k είναι z= k = k k p k. Ας υποθέσουμε ωστόσο ότι επιθυμούμε να βρούμε τον μέσο αριθμό των δεύτερων γειτόνων του κόμβου Α, δηλαδή τον μέσο αριθμό των κόμβων που απέχουν απόσταση δύο ακμών από τον κόμβο Α εντός του γράφου. Σε ένα δίκτυο το οποίο παρουσιάζει συσταδοποίηση, πολλοί από τους δεύτερους γείτονες ενός κόμβου

47 είναι επίσης και πρώτοι γείτονες αυτού (σαν να λέμε δηλαδή ότι ο φίλος του φίλου μου, είναι και δικός μου φίλος). Συνεπώς θα πρέπει να λάβουμε υπόψη μας αυτό το γεγονός προκειμένου να μετρήσουμε σωστά τον αριθμό των δεύτερων γειτόνων. Προκειμένου δηλαδή να αποφύγουμε το overcounting και να μην μετρήσουμε περισσότερους κόμβους ως δεύτερους γείτονες από όσους υπάρχουν στην πραγματικότητα. Για την περίπτωση όμως των γράφων που συζητάμε εμείς, δεν χρειάζεται να λάβουμε υπόψη μας κάποιον τέτοιο περιορισμό διότι η πιθανότητα ένας δεύτερος γείτονας του κόμβου Α να είναι ταυτόχρονα και πρώτος του γείτονας είναι ανάλογη της ποσότητας 1 n 30,ανεξάρτητα της κατανομής των βαθμών, και κατά συνέπεια μπορεί να αγνοηθεί στο όριο όπου το n γίνεται μεγάλο. Ωστόσο, υπάρχει ένα άλλο γεγονός το οποίο θα πρέπει να λάβουμε υπόψη μας προκειμένου να μπορέσουμε να μετρήσουμε σωστά το πλήθος των δεύτερων γειτόνων: Η κατανομή των βαθμών των πρώτων γειτόνων ενός κόμβου, δεν είναι ίδια με την κατανομή των βαθμών των κόμβων του γράφου ως σύνολο. Επειδή ένας κόμβος με μεγάλο βαθμό έχει περισσότερες ακμές συνδεδεμένες σε αυτόν, υπάρχει και μεγαλύτερη πιθανότητα οποιαδήποτε ακμή του γράφου να συνδεθεί με αυτόν. Δηλαδή η πιθανότητα σύνδεσης της ακμής με τον κόμβο είναι ανάλογη του βαθμού του κόμβου. Συνεπώς, η πιθανοτική κατανομή του βαθμού του κόμβου στον οποίο καταλήγει μια ακμή, είναι ανάλογη του γινομένου k p k και όχι απλά του p k (Feld, 1991 ; Molloy & Reed, 1995 ; Newman, 2001d). Αυτή η επισήμανση είναι ιδιαιτέρως κρίσιμη, καθώς θα γίνει συστηματική χρήση αυτής στα όσα ακολουθούν. Στην πραγματικότητα, αυτό που μας ενδιαφέρει δεν είναι ο πλήρης βαθμός k του κόμβου στον οποίο καταλήγουμε ακολουθώντας μια ακμή η οποία ξεκινάει από τον κόμβο Α, αλλά το πλήθος των ακμών που ξεκινούν από αυτόν τον κόμβο μη λαμβάνοντας υπόψη την ακμή με την οποία καταλήξαμε σε αυτόν τον κόμβο, καθότι μια τέτοια ακμή το μόνο που μπορεί να κάνει είναι να μας οδηγήσει πίσω στον κόμβο Α από τον οποίο ξεκινήσαμε και κατά συνέπεια δεν συνεισφέρει στον αριθμό των δευτέρων γειτόνων του Α. Αυτός ο αριθμός (δηλαδή το συγκεκριμένο πλήθος ακμών του κόμβου στον οποίο καταλήγουμε) είναι κατά μία μονάδα μικρότερος σε σχέση με τον πλήρη βαθμό του, δηλαδή είναι ίσος με k 1, και η κανονικοποιημένη κατανομή αυτού (δηλαδή η κανονικοποιημένη κατανομή της τυχαίας μεταβλητής k 1 ) είναι:

48 31 q k 1 = k p k q k = (k +1) p k +1 j p j j p j j j Η κατανομή q k ονομάζεται και κατανομή πλεονάζοντος βαθμού (excess degree distribution). Ο μέσος βαθμός ενός τέτοιου κόμβου είναι: k =0 k q k = k= 0 k (k +1) p k +1 = j p j j k = 0 (k 1) k p k = j p j j k = 0 k 2 p k k p k k =0 j j p j = k2 k k Αυτός είναι και ο μέσος κανονικοποιημένος αριθμός των κόμβων που απέχουν απόσταση δύο ακμών από τον κόμβο Α, παρεμβαλλόμενου κάποιου συγκεκριμένου γείτονα αυτού. Αν πολλαπλασιάσουμε αυτόν τον αριθμό με τον μέσο βαθμό των κόμβων του δικτύου, ο οποίος είναι z = k, βρίσκουμε ότι ο μέσος μη κανονικοποιημένος αριθμός των δεύτερων γειτόνων ενός οποιουδήποτε κόμβου του δικτύου είναι: z 2 = k k qk = k 2 k k = 0 Εφαρμόζοντας αυτήν την τελευταία σχέση για την περίπτωση της κατανομής Poisson, προκύπτει ότι z 2 = k 2. Δηλαδή, ο μέσος αριθμός των δεύτερων γειτόνων ενός κόμβου στο μοντέλο Erdos-Renyi ισούται με το τετράγωνο του μέσου αριθμού των πρώτων γειτόνων. Αυτή όμως είναι μια ειδική περίπτωση. Για τις περισσότερες κατανομές βαθμών των κόμβων, στην σχέση z 2 = k 2 k θα κυριαρχεί ο όρος k 2, οπότε ο αριθμός των δεύτερων γειτόνων ενός κόμβου θα είναι χονδρικά ίσος με την μέση τιμή του τετραγώνου του βαθμού του και όχι ίσος με το τετράγωνο της μέσης τιμής του βαθμού

49 32 του, όπως στην περίπτωση της κατανομής Poisson. Μπορούμε να επεκτείνουμε αυτόν τον υπολογισμό και για γειτονικούς κόμβους οι οποίοι βρίσκονται σε απόσταση μεγαλύτερη των δύο ακμών. Ο μέσος αριθμός ακμών που ξεκινούν από κάθε δεύτερο γείτονα, χωρίς να λαμβάνουμε υπόψη μας εκείνες τις ακμές με τις οποίες καταλήξαμε σε αυτούς τους δεύτερους γείτονες, δίνεται και πάλι από την σχέση k q k = k 2 k k =0 k m ακμών μακριά από τον κόμβο Α. και το ίδιο ισχύει για κάθε κόμβο ο οποίος βρίσκεται σε απόσταση Συνεπώς, ο μέσος κανονικοποιημένος αριθμός γειτόνων οι οποίοι απέχουν απόσταση m ακμών από τον κόμβο Α είναι: z m = k2 k k z m 1 = z 2 z 1 z m 1, όπου z 1 z = k και z 2 = k 2 k. Εφαρμόζοντας αυτήν την σχέση επαναληπτικά (iteration), βρίσκουμε ότι: z m =[ z 2 m 1 z 1 ] z 1 Ανάλογα με το αν είναι z 2 > z 1 ή z 1 >z 2, η τελευταία σχέση είτε θα αποκλίνει είτε θα συγκλίνει εκθετικά καθώς το m μεγαλώνει βαθμιαία. Έτσι, ο μέσος συνολικός αριθμός γειτόνων του κόμβου Α για όλες τις αποστάσεις θα είναι πεπερασμένος αν z 1 >z 2 ή άπειρος αν z 2 > z 1 (στο όριο όπου το n γίνεται άπειρο). Στην περίπτωση που ο αριθμός αυτός είναι πεπερασμένος, τότε προφανώς δεν μπορεί να σχηματιστεί γιγαντιαία συνιστώσα στον γράφο, ενώ στην περίπτωση που είναι άπειρος θα σχηματιστεί γιγαντιαία συνιστώσα. Δηλαδή ο γράφος παρουσιάζει μετάβαση φάσης παρόμοια με εκείνη του μοντέλου Erdos-Renyi την στιγμή όπου γίνεται z 2 = z 1. Δεδομένης αυτής της τελευταίας ιδέας, έχουμε: { z 2 = k 2 k } z 1 =z 2 z 1 = z = k k = k 2 k k 2 2 k =0 ή σε εναλλακτική μορφή:

50 33 k =0 k 2 p k 2 k p k = 0 (k 2 p k 2 k p k )= 0 k (k 2) p k =0 k = 0 k = 0 k = 0 Αυτή η τελευταία συνθήκη, η οποία μας προσδιορίζει την στιγμή κατά την οποία πραγματοποιείται η μετάβαση φάσης σε έναν τυχαίο γράφο με αυθαίρετη ακολουθία βαθμών κόμβων, δόθηκε για πρώτη φορά από τους Molloy και Reed το Μία ενδιαφέρουσα ιδιότητα της σχέσης k (k 2) p k =0 είναι ότι λόγω του παράγοντα k =0 k (k 2), οι κόμβοι που έχουν βαθμό k =0 ή k =2 δεν συνεισφέρουν καθόλου στο άθροισμα, με συνέπεια ο αριθμός (πλήθος) αυτών των κόμβων να μην επηρεάζει το σημείο εμφάνισης της μετάβασης φάσης ή την εμφάνιση της γιγαντιαίας συνιστώσας. Η ισχύς της παραπάνω πρότασης είναι προφανής για την περίπτωση των κόμβων με βαθμό k =0 καθώς η αφαίρεση (ή η πρόσθεση) τέτοιου είδους κόμβων είναι βέβαιο ότι δεν επηρεάζει την εμφάνιση ή την μη εμφάνιση γιγαντιαίας συνιστώσας μέσα στον γράφο. Τι γίνεται όμως με την περίπτωση των κόμβων που έχουν βαθμό k =2? Γιατί η προσθαφαίρεση τέτοιου είδους κόμβων δεν επηρεάζει καθόλου την εμφάνιση ή την απουσία γιγαντιαίας συνιστώσας? Η εξήγηση έχει ως εξής: Αφαιρώντας κόμβους με βαθμό k =2 δεν αλλάζει η τοπολογική δομή του γράφου επειδή όλοι αυτού του είδους οι κόμβοι παρεμβάλλονται στις ακμές που ενώνουν άλλα ζεύγη κόμβων. Κατά συνέπεια, μπορούμε να προσθαφαιρούμε τέτοιου είδους κόμβους χωρίς να επηρεάζουμε την ύπαρξη τη γιγαντιαίας συνιστώσας. Μια άλλη ποσότητα που παρουσιάζει ενδιαφέρον είναι η μέση απόσταση l μεταξύ δύο κόμβων του δικτύου (Milgram, 1967 ; Travers & Milgram, 1969 ; Pool & Kochen, 1978 ; Watts & Strogatz, 1998 ; Amaral et al., 2000). Για τον υπολογισμό αυτής της ποσότητας, μπορούμε να κάνουμε χρήση της σχέσης z m =[ z m 1 2 z z 1 ] 1

51 34 ως εξής: Αν βρισκόμαστε στο στάδιο πριν την μετάβαση φάσης, δηλαδή στην περιοχή όπου δεν έχει σχηματιστεί ακόμα γιγαντιαία συνιστώσα, τότε τα περισσότερα ζεύγη κόμβων δεν θα είναι συνδεδεμένα μεταξύ τους, οπότε η έννοια της απόστασης από κόμβο σε κόμβο δεν έχει κάποιο νόημα. Στο στάδιο όμως μετά την μετάβαση φάσης, όπου πλέον έχει σχηματιστεί η γιγαντιαία συνιστώσα, όλοι οι κόμβοι εντός αυτής συνδέονται μεταξύ τους μέσω κάποιου μονοπατιού. Η σχέση z m =[ z 2 m 1 z 1 ] z 1 μας δίνει τον μέσο αριθμό κόμβων οι οποίοι απέχουν απόσταση m ακμών από έναν δεδομένο κόμβο Α εντός της γιγαντιαίας συνιστώσας. Όταν ο συνολικός αριθμός των κόμβων που βρίσκονται εντός απόστασης m ακμών είναι ίσος με το μέγεθος n του συνολικού γράφου, τότε το m ισούται με αυτό που ονομάζουμε ακτίνα (radius) του δικτύου γύρω από τον κόμβο Α και την συμβολίζουμε με το γράμμα r. Πράγματι, αφού μετά την μετάβαση φάσης ισχύει ότι m μεγαλώνει γρήγορα καθώς αυτή η απόσταση z 2 z 1 1, ο αριθμός των κόμβων σε απόσταση m επίσης μεγαλώνει. Αυτό σημαίνει ότι η πλειοψηφία των κόμβων του δικτύου θα είναι μακριά από τον κόμβο Α, σε απόσταση ακτίνας r. Οπότε το r συμβολίζουμε ως l. ισούται κατά προσέγγιση με την μέση απόσταση από κόμβο σε κόμβο που την Στο στάδιο αρκετά μετά την μετάβαση φάσης, όπου z l n, το l δίνεται κατά προσέγγιση από την log ( n ) z σχέση l= 1 log ( z +1 (Η απόδειξη αυτής της σχέσης υπάρχει στο παράρτημα Ε). 2 ) z 1 Για την ειδική περίπτωση του μοντέλου Erdos-Renyi για το οποίο ισχύει ότι z 1 = z και z 2 = z 2, η τελευταία σχέση απλοποιείται και γίνεται l= log (n) log (z) (Bollobas, 1985).

52 35 log ( n ) z Αυτό που αξίζει να σημειωθεί για την σχέση l= 1 log ( z + 1 είναι ότι μας λέει πως η μέση 2 ) z 1 απόσταση από κόμβο σε κόμβο αυξάνεται λογαριθμικά με το μέγεθος του γράφου n, δηλαδή αυξάνεται με αργό ρυθμό. Ακόμα και για πολύ μεγάλα δίκτυα, αναμένεται η μέση απόσταση κατά μήκος του δικτύου από τον ένα κόμβο στον άλλο να είναι πολύ μικρή. Στα κοινωνικά δίκτυα, αυτό το φαινόμενο ονομάζεται φαινόμενο μικρού κόσμου (small world effect). Κάτι το οποίο αναλύσαμε στο πρώτο κεφάλαιο αυτής της εργασίας. Το φαινόμενο μικρού κόσμου εμφανίζεται πολύ συχνά και σε μη κοινωνικά δίκτυα (Watts & Strogatz, 1998 ; Amaral et al., 2000). Αυτό είναι κάτι που δεν θα έπρεπε να μας εκπλήσσει. Αντιθέτως, θα ήταν αξιοπερίεργο αν τα περισσότερα δίκτυα δεν παρουσίαζαν φαινόμενο μικρού κόσμου. Αν ορίσουμε την διάμετρο d ενός γράφου ως την μέγιστη απόσταση μεταξύ δύο οποιωνδήποτε συνδεδεμένων κόμβων αυτού, τότε μπορεί να αποδειχθεί ότι το υποσύνολο όλων των δυνατών γράφων για τους οποίους ισχύει d >c log (n), για κάποια σταθερά c τείνει στο μηδέν καθώς το n μεγαλώνει (Bollobas, 1985). Προφανώς, αν η διάμετρος αυξάνεται ανάλογα με το log(n) ή με ακόμα πιο αργό ρυθμό, τότε το ίδιο πρέπει να συμβαίνει και με την μέση απόσταση από κόμβο σε κόμβο. Οπότε η πιθανότητα να βρούμε ένα δίκτυο το οποίο δεν παρουσιάζει φαινόμενο μικρού κόσμου είναι πάρα πολύ μικρή για μεγάλες τιμές του n. log ( n ) z Ως μια δοκιμή, προκειμένου να διαπιστώσουμε την ισχύ της σχέσης l= 1 log ( z + 1,παραθέτουμε 2 ) z 1 το επόμενο σχήμα στο οποίο γίνεται σύγκριση των υπολογιζόμενων (με χρήση αυτής της σχέσης) τιμών της μέσης απόστασης l με τις απευθείας μετρούμενες πραγματικές τιμές, για 14 διαφορετικά δίκτυα συνεργασιών, συμπεριλαμβανομένων του mathematics network και του biology network που είδαμε σε προηγούμενη παράγραφο.

53 36 Σχήμα 2.2 Σύγκριση μεταξύ θεωρητικών και πραγματικών τιμών για την μέση απόσταση εντός δικτύων Τα δίκτυα που αναφέρονται στο σχήμα 2.2, κατασκευάστηκαν με την χρήση βιβλιογραφικών δεδομένων από δημοσιεύσεις στους τομείς: (i) της βιολογίας και της ιατρικής (Medline), (ii) της φυσικής (Los Alamos E-print Archive), (iii) της φυσικής υψηλών ενεργειών (SPIRES) και (iv) των μαθηματικών (Mathematical Reviews). (Newman, 2001c). Σε αυτό το σχήμα, κάθε δίκτυο αναπαρίσταται με ένα σημείο του οποίου η τετμημένη αντιστοιχεί στην θεωρητικά υπολογιζόμενη (βάσει της σχέσης) τιμή του l, ενώ η τεταγμένη αντιστοιχεί στην πραγματική τιμή που προκύπτει από την μέτρηση. log ( n ) z Αν η σχέση l= 1 log ( z + 1 έδινε ακριβή και σωστά αποτελέσματα, τότε όλα τα σημεία θα έπρεπε 2 ) z 1 να κείτονται επί της διάστικτης διαγώνιας γραμμής. Επειδή όμως γνωρίζουμε ότι αυτή η σχέση δίνει προσεγγιστικά αποτελέσματα, δεν μας κάνει καμία εντύπωση που τα σημεία δεν πέφτουν ακριβώς

54 37 πάνω στην εν λόγω γραμμή. Παρ' όλα αυτά όμως, τα λαμβανόμενα αποτελέσματα είναι ενθαρρυντικά, διότι στις περισσότερες περιπτώσεις οι θεωρητικές τιμές είναι αρκετά κοντά στις μετρούμενες και η κλιμάκωση (scaling) του l σε αναλογία με το log(n) είναι φανερή. Αν αυτή η θεωρία ήταν εξίσου επιτυχής και για άλλους τύπους δικτύων, θα ήταν ένας χρήσιμος τρόπος για την εκτίμηση της μέσης απόστασης από κόμβο σε κόμβο. Μιας και τα z 1, z 2 είναι τοπικές ποσότητες (local quantities) οι οποίες μπορούν να υπολογιστούν (τουλάχιστον κατά προσέγγιση) από μετρήσεις πάνω σε ένα μικρό μόνο μέρος του δικτύου, θα ήταν στις περισσότερες περιπτώσεις σαφώς απλούστερο και πρακτικότερο να εφαρμόσουμε την σχέση log ( n ) z l= 1 log ( z +1 από ότι να πάρουμε απευθείας μετρήσεις. 2 ) z 1 Αν και το μοντέλο τυχαίου γράφου στο οποίο αναφερόμαστε (σύμφωνα με την θεώρηση των Bender και Canfield ) δεν μας επιτρέπει να προσδιορίσουμε το επίπεδο της συσταδοποίησης του δικτύου, εν τούτοις μπορούμε να υπολογίσουμε έναν μέσο (average) συντελεστή συσταδοποίησης. Ας θεωρήσουμε για άλλη μια φορά έναν συγκεκριμένο κόμβο Α. Ο i γείτονας του Α έχει k i ακμές που ξεκινούν από αυτόν, μη λαμβάνοντας υπόψη αυτήν την ακμή που τον συνδέει απευθείας με τον Α, και η αυτή η διακριτή τυχαία μεταβλητή k i ακολουθεί κατανομή q k, έτσι όπως την περιγράψαμε στα προηγούμενα. Η πιθανότητα αυτός ο κόμβος i να είναι συνδεδεμένος με έναν άλλο κόμβο j είναι k i k j nz (η απόδειξη αυτής της σχέσης υπάρχει στο παράρτημα ΣΤ), όπου το k j ακολουθεί επίσης κατανομή q k και η μέση τιμή αυτής της πιθανότητας μας δίνει τον συντελεστή συσταδοποίησης C : C = k k i j nz = k k i j nz Όμως k q k = k2 k k k = 1 nz k k = 1 i j nz ( k q k ) ( k q k )= 1 k k nz [ k q k ] 2 k

55 38 Οπότε με συνδυασμό των δύο παραπάνω σχέσεων έχουμε: C= 1 nz [ k2 k k 2 ] = 1 nz [ k 2 2 k k k k ] = 1 nz [ k2 2 k ] k 2 = 1 k 2 nz [ k 2 2 k ] z 2 = z k 2 n [ k2 2 k ] k 2 Συνεχίζοντας τις πράξεις τελικά λαμβάνουμε: C = z n [ k2 z ] 2= z z 2 n [ k2 z+ z 2 z 2 2 ] = z z 2 n [ k 2 z 2 + z2 z ] 2= z z 2 z 2 n [ k2 z 2 + z (z 1) 2 ] z 2 z 2 C = z n [ k2 z 2 + z 1 z 2 z Όπου η ποσότητα c υ 2 ] = z n [( k2 z 2 1)+ z 1 2 ] = z z n [c υ 2 + z 1 z ονομάζεται συντελεστής διακύμανσης της κατανομής των βαθμών των κόμβων (coefficient of variation of the degree distribution) και είναι ο λόγος της τυπικής απόκλισης προς την μέση τιμή. 2 ] Βλέπουμε δηλαδή ότι ο συντελεστής συσταδοποίησης C ενός τυχαίου γράφου, με κατανομή βαθμών κόμβων που δεν είναι Poisson, ισούται με την τιμή z n (η οποία ισχύει στην περίπτωση που η κατανομή των βαθμών των κόμβων είναι Poisson) επί μια συνάρτηση της οποίας ο κυρίαρχος όρος είναι ο συντελεστής διακύμανσης της κατανομής των κόμβων c υ υψωμένος στην τέταρτη δύναμη. Μπορεί ο συντελεστής συσταδοποίησης C, να μηδενίζεται καθώς το μέγεθος n του γράφου z αυξάνει, καθότι lim C =lim n n n [c υ 2 + z 1 z σημαντικά καθώς αυξάνεται ο συντελεστής διακύμανσης c υ βαθμών με μακριές ουρές, όπως αυτές του σχήματος ] = 0, όμως η ποσότητα [c 2 υ + z 1 2 ] z μεγαλώνει. Αυτό ισχύει ειδικά για τις κατανομές Ας θεωρήσουμε ως παράδειγμα την περίπτωση του World-Wide Web. Αν αγνοήσουμε τον προσανατολισμό των ακμών, τότε αυτός ο γράφος παρουσιάζει αρκετά υψηλό συντελεστή συσταδοποίησης ίσο με 0.11 (Adamic, 1999). Αυτό φαίνεται και στον πίνακα 2.1.

56 Το αντίστοιχο μοντέλο Erdos-Renyi με τον ίδιο αριθμό κόμβων n και την ίδια τιμή μέσου βαθμού z, παρουσιάζει συντελεστή συσταδοποίησης ίσο με Τιμή η οποία είναι προφανώς πολλές τάξεις μεγέθους μικρότερη. Αν χρησιμοποιήσουμε την κατανομή βαθμών που φαίνεται στο σχήμα 2.1a για τον υπολογισμό του μέσου βαθμού και του συντελεστή διακύμανσης, βρίσκουμε ότι συνεπάγεται ότι [c 2 υ + z 1 2 ] =209.7 z Οπότε η εξίσωση C = z n [c 2 υ + z 1 z 2 ] 39 z=10.23 και c υ =3.685, που μας λέει ότι ο τυχαίος γράφος με την σωστή κατανομή βαθμών θα είχε στην πραγματικότητα συντελεστή συσταδοποίησης C= = Αυτός ο αριθμός εξακολουθεί να είναι κατά πολύ μικρότερος σε σχέση με την πραγματική τιμή αλλά είναι κάπως πιο κοντά σε σχέση με την αρχική εκτίμηση του Η κατανομή των βαθμών που χρησιμοποιήθηκαν για αυτούς τους υπολογισμούς (οι οποίοι έγιναν από τον καθηγητή M. Newman) έφτανε μέχρι και για την τιμή k =4096. Χωρίς αυτήν την αποκοπή στην τιμή του k, ενδεχομένως ο συντελεστής διακύμανσης c υ να ήταν ακόμα μεγαλύτερος. Φαίνεται επομένως, ότι η περισσότερη (αν όχι όλη) η συσταδοποίηση που συναντάται στο World-Wide Web οφείλεται στην μακριά ουρά που παρουσιάζει η κατανομή των βαθμών των κόμβων του. Οπότε, το γεγονός ότι το μοντέλο τυχαίου γράφου δεν λαμβάνει υπόψη του την συσταδοποίηση, δεν αποτελεί απαραίτητα και πρόβλημα. Από την άλλη μεριά, κάποια από τα άλλα δίκτυα του πίνακα 2.1 παρουσιάζουν σημαντικά υψηλότερη συσταδοποίηση από αυτήν που θα υπολογιζόταν θεωρητικά χρησιμοποιώντας την σχέση C = z n [c 2 υ + z 1 z ήταν ανεπαρκής ως μοντέλο. 2 ]. Για αυτές τις περιπτώσεις, ο τυχαίος γράφος θα 2.3 Γεννήτριες συναρτήσεις Σε αυτήν την παράγραφο,περιγράφεται το πως μπορούν να χρησιμοποιηθούν οι γεννήτριες συναρτήσεις πιθανοτήτων (probability generating functions) για τον υπολογισμό διαφόρων ιδιοτήτων των τυχαίων γράφων. Κατά κανόνα, παρουσιάζουμε τις μεθόδους που περιγράφει στις δημοσιεύσεις

57 40 του ο καθηγητής M. Newman (Newman et al. 2001). Μια γεννήτρια συνάρτηση (generating function) μπορεί να χρησιμοποιηθεί ως ένας εναλλακτικός τρόπος αναπαράστασης μιας κατανομής. Ας θεωρήσουμε ως παράδειγμα την κατανομή p k, που είναι η κατανομή των βαθμών των κόμβων ενός δικτύου. Η p k μας δίνει την πιθανότητα ένας κόμβος του δικτύου να έχει βαθμό ακριβώς ίσο με k. Η γεννήτρια συνάρτηση της p k είναι η G 0 (x)= p k x k = p 0 + p 1 x + p 2 x 2 + p 3 x 3 + k =0 Όπως φαίνεται, αυτή η συνάρτηση εμπεριέχει όλες εκείνες τις πληροφορίες που υπάρχουν και στην αρχική κατανομή, αφού οι συντελεστές των όρων της δυναμοσειράς είναι οι πιθανότητες p k. Η p k μπορεί να ανακτηθεί από την G 0 (x ) με παραγώγιση: p k = 1 k! d k G 0 d x k x = 0 Λέμε ότι η συνάρτηση G 0 παράγει την κατανομή p k. Με παρόμοιο τρόπο, μπορούμε να ορίσουμε μια γεννήτρια συνάρτηση και για την κατανομή q k των ακμών που εγκαταλείπουν έναν κόμβο στον οποίο καταλήγουμε αν ακολουθήσουμε μία άλλη ακμή κάπου μέσα στο δίκτυο: G 1 (x)= qk x k k= 0 = k= 0 (k +1) pk + 1 xk j j p j = k= 0 j k pk x k 1 j p j = G 0 ' (x) z όπου με G 0 ' (x) συμβολίζουμε την πρώτη παράγωγο της G 0 (x) ως προς x και z= k = j j p j είναι ο μέσος βαθμός των κόμβων του δικτύου.

58 Ιδιότητες των γεννητριών συναρτήσεων Ιδιότητα 1 Αν η κατανομή που παράγει μια γεννήτρια συνάρτηση είναι κανονικοποιημένη, τότε: G 0 (1)= k p k =1 Απόδειξη: Από τον ορισμό της γεννήτριας συνάρτησης έχουμε ότι G 0 (x)= k p k x k. Για x=1 G 0 (1)= k p k 1 k = k p k =1. Ιδιότητα 2 Η μέση τιμή της κατανομής που παράγεται από μια γεννήτρια συνάρτηση (δηλαδή η ροπή πρώτης τάξεως περί την αρχή) μπορεί να υπολογιστεί απευθείας με παραγώγιση της γεννήτριας συνάρτησης: G 0 ' (1)= k k p k = k Απόδειξη: Από τον ορισμό της γεννήτριας συνάρτησης έχουμε ότι G 0 (x)= k p k x k. Παραγωγίζοντας ως προς x βρίσκουμε G 0 ' (x)= k Για x=1 G 0 ' (1)= k p k k= k. p k k x k 1. Για την ακρίβεια, μπορούμε να υπολογίσουμε την ροπή οποιασδήποτε τάξεως n της κατανομής

59 42 p k λαμβάνοντας την κατάλληλη παράγωγο. Γενικά ισχύει ότι k n = k k n p k =(x d dx ) n G 0 (x) x=1 Ιδιότητα 3 Αν μια γεννήτρια συνάρτηση G 0 (x) παράγει την κατανομή p k κάποιας ιδιότητας k ενός αντικειμένου, πχ. τον βαθμό ενός κόμβου, τότε το άθροισμα αυτής της ιδιότητας εκφρασμένη επί n ανεξάρτητων μεταξύ τους τέτοιων αντικειμένων, κατανέμεται σύμφωνα με την n-δύναμη της γεννήτριας συνάρτησης. Συνεπώς, το άθροισμα των βαθμών n τυχαία επιλεγμένων κόμβων του γράφου ακολουθεί κατανομή η οποία παράγεται από την συνάρτηση [G 0 (x)] n. Η απόδειξη αυτής της ιδιότητας υπάρχει στο παράρτημα Η Παραδείγματα χρήσης των γεννητριών συναρτήσεων Προκειμένου να γίνουν περισσότερο κατανοητά τα όσα αναφέρθηκαν προηγουμένως για τις γεννήτριες συναρτήσεις, παραθέτουμε τρία παραδείγματα χρήσης αυτών. Παράδειγμα 1 Ας θεωρήσουμε το κλασικό μοντέλο Erdos-Renyi στο οποίο, όπως γνωρίζουμε, οι βαθμοί των κόμβων ακολουθούν κατανομή Poisson. Δηλαδή είναι p k = zk e z k!. Αρχικά υπολογίζουμε την γεννήτρια συνάρτηση G 0 (x) της κατανομής Poisson: G 0 (x)= k =0 pk x k = k= 0 z k e z k! x k = e z k =0 z k x k k! = e z ( zx) k = e z e zx z (x 1) = e k =0 k! Όπου χρησιμοποιήθηκε η σχέση αθροίσματος x j j = 0 j! =ex. Οπότε τώρα μπορούμε εύκολα να βρούμε και την γεννήτρια συνάρτηση G 1 (x) που αφορά τους

60 43 κόμβους στους οποίους καταλήγουμε ακολουθώντας μια τυχαία ακμή εντός του γράφου: G 1 (x)= G ' (x) 0 = 1 z z d dx ez (x 1) = 1 z z ez (x 1) z( x 1) = e Βλέπουμε δηλαδή ότι για την περίπτωση της κατανομής Poisson ισχύει G 1 (x)=g 0 (x). Εξαιτίας αυτής της ταυτότητας, είναι εύκολο να επιλυθούν με αναλυτικό τρόπο οι ιδιότητες του τυχαίου γράφου Erdos-Renyi. Παράδειγμα 2 Ας θεωρήσουμε τώρα έναν γράφο στον οποίο οι βαθμοί των κόμβων ακολουθούν εκθετική κατανομή. Συγκεκριμένα ότι είναι p k =(1 e 1c ) e k c, όπου c είναι μια σταθερά. Πρώτα βρίσκουμε την γεννήτρια συνάρτηση G 0 (x) αυτής της εκθετικής κατανομής: G 0 (x)= k =0 pk x k = 1c (1 e ) e kc x k =(1 e 1c ) k= 0 G 0 (x)=(1 e 1c c 1 1 e ) = 1 e 1 c x 1 x e 1 c 1 k =0 kc e x k =(1 e 1c ) 1c (e x) k Όπου χρησιμοποιήθηκε η σχέση αθροίσματος x j = 1 j = 0 1 x, x <1. Στην συνέχεια θέλουμε να υπολογίσουμε την γεννήτρια συνάρτηση G 1 (x). Γνωρίζουμε την p k αλλά δεν γνωρίζουμε τον τύπο της q k, οπότε δεν μπορούμε να εφαρμόσουμε k= 0 απευθείας τον ορισμό. Συνεπώς, καταφεύγουμε στην χρήση της σχέσης G 1 (x)= G 0 ' (x) z. Το πρόβλημα που προκύπτει τώρα είναι ότι στον τύπο της G 0 (x) δεν υπάρχει z ώστε να γίνει κάποια αντίστοιχη απλοποίηση όπως αυτή που έγινε στο παράδειγμα 1. Για να το αντιμετωπίσουμε αυτό, αντικαθιστούμε το z με j j p j, όπου p j είναι η εκθετική

61 44 συνάρτηση μάζας πιθανότητας που περιγράφει την κατανομή των βαθμών των κόμβων του δικτύου. Επειδή p k =(1 e 1c ) e k c p j =(1 e 1c ) e j c Οπότε, z= j j p j = j j (1 e 1c ) e jc =(1 e 1c ) j j e jc =(1 e 1c ) j j (e 1c ) j e 1 c e 1 c z=(1 e 1c ) = (1 e 1 c ) 2 1 e 1 c Όπου έγινε χρήση της σχέσης αθροίσματος i = 0 Τώρα πρέπει να υπολογίσουμε την G 0 ' (x) : i c i = c (1 c), c <1. 2 G 0 ' (x)=(1 e 1c ) d dx 1 =(1 e 1c e 1 c ) 1 xe 1 c (1 xe 1 c ) 2 Είμαστε πλέον σε θέση να υπολογίσουμε την G 1 (x) : G 1 (x)= G 0 ' (x) = z 1 c 1 e e 1 c e 1c (1 e 1c ) 1 e 1 c 2 =( ) (1 xe 1c ) 2 1 xe 1 c Παράδειγμα 3 Σαν ένα τελευταίο παράδειγμα, ας θεωρήσουμε έναν γράφο στον οποίο όλοι οι κόμβοι μπορούν να έχουν βαθμό 0, 1, 2 ή 3 με αντίστοιχες πιθανότητες p 0, p 1, p 2, p 3 οι οποίες θεωρούνται γνωστές ποσότητες. Σχηματικά: Δηλαδή ο βαθμός οποιουδήποτε κόμβου ανήκει σε αυτό το σύνολο και όπως είναι προφανές, δύο η περισσότεροι κόμβοι μπορούν να έχουν τον ίδιο ακριβώς βαθμό.

62 45 Πρώτα υπολογίζουμε την G 0 (x) εφαρμόζοντας τον ορισμό: 3 G 0 (x)= p k x k = p 0 + p 1 x + p 2 x 2 + p 3 x 3 = p 3 x 3 + p 2 x 2 + p 1 x + p 0 k =0 Τέλος, υπολογίζουμε την G 1 (x) : G 1 (x)= G 0 ' (x) z = G 0 ' (x) = 3 p 3 x p 2 x+ p 1 = 3 p 3 x 2 +2 p 2 x+ p 1 = q j p j 0 p 0 +1 p 1 +2 p 2 +3 p 3 3 p 3 +2 p 2 + p 2 x 2 +q 1 x +q 0 1 j 3 p όπου q 2 = 3 2 p, q 3 p 3 +2 p 2 + p 1 = 2 p και q 1 3 p 3 +2 p 2 + p 0 = p 3 +2 p 2 + p Ιδιότητες των μη προσανατολισμένων γράφων Σε αυτήν την παράγραφο θα εφαρμόσουμε την θεωρία των γεννητριών συναρτήσεων για τον υπολογισμό διαφόρων ιδιοτήτων των μη προσανατολισμένων γράφων Κατανομή των μεγεθών των συνιστωσών Η πιο βασική ιδιότητα που πρέπει να λάβουμε υπόψη μας είναι η κατανομή των μεγεθών των συνιστωσών (components) που δημιουργούνται καθώς οι κόμβοι συνδέονται μεταξύ τους. Αρχικά υποθέτουμε ότι βρισκόμαστε στο στάδιο πριν την μετάβαση φάσης, οπότε δεν έχει σχηματιστεί ακόμα κάποια γιγαντιαία συνιστώσα (giant component). Όπως αναφέρθηκε και στα προηγούμενα, οι υπολογισμοί μας θα εξαρτηθούν σημαντικά από το γεγονός ότι οι γράφοι που εξετάζουμε δεν παρουσιάζουν αξιοσημείωτη συσταδοποίηση. Για την ακρίβεια, ο συντελεστής συσταδοποίησης C = z n [c 2 υ + z 1 z προηγούμενη παράγραφο, τείνει στο μηδέν καθώς n. 2 ],ο οποίος υπολογίστηκε σε Η πιθανότητα δύο τυχαία επιλεχθέντες κόμβοι i και j (με βαθμούς k i και k j αντίστοιχα) να είναι συνδεδεμένοι, είναι η ίδια ανεξάρτητα από το που βρίσκονται μέσα στο δίκτυο.

63 46 Συγκεκριμένα, αυτή η πιθανότητα είναι ίση με k i k j nz και όπως βλέπουμε και αυτή τείνει στο μηδέν καθώς n. Αυτό σημαίνει ότι οποιαδήποτε πεπερασμένη, σε μέγεθος, συνιστώσα σχηματίζεται καθώς συνδέονται μεταξύ τους οι κόμβοι, δεν θα περιέχει βρόχους εντός της. Αυτή ακριβώς είναι και η ιδιότητα που μας δίνει την δυνατότητα να μπορούμε να κάνουμε αναλυτικούς υπολογισμούς. Δεν θα ήταν λάθος επομένως να ισχυριστούμε ότι λόγω της απουσίας βρόχων, όλες οι πεπερασμένες συνιστώσες σε ένα δίκτυο έχουν δομή δέντρου. Λαμβάνοντας τα παραπάνω υπόψη μας, προχωράμε στον υπολογισμό της κατανομής των μεγεθών των συνιστωσών του δικτύου για το στάδιο πριν την μετάβαση φάσης. Ας επιλέξουμε τυχαία μια ακμή που υπάρχει κάπου μέσα στον γράφο και ας θεωρήσουμε ότι την διασχίζουμε μέχρι να φτάσουμε στο ένα άκρο της και ότι από εκεί συνεχίζουμε μέχρι να φτάσουμε σε κάθε άλλο κόμβο ο οποίος είναι προσβάσιμος αν λάβουμε ως αφετηρία αυτό το άκρο. Θα αναφερόμαστε σε αυτό το σύνολο των προσβάσιμων κόμβων ως η συστάδα (cluster) στο άκρο (πέρας) μιας τυχαία επιλεχθείσας ακμής. Ας θεωρήσουμε επιπλέον ότι H 1 (x) είναι η γεννήτρια συνάρτηση η οποία παράγει την κατανομή των μεγεθών τέτοιου είδους συστάδων, όπου με τον όρο μέγεθος εννοούμε αριθμό (πλήθος) κόμβων. Οι συστάδες αυτές μπορούν να έχουν διάφορες μορφές, όπως μπορούμε να δούμε και στο σχήμα 2.3 : Σχήμα 2.3 Διάφορες δυνατές μορφές συστάδων

64 Μπορεί δηλαδή να διασχίσουμε την τυχαία επιλεχθείσα ακμή και στο πέρας της να συναντήσουμε έναν και μόνο κόμβο από τον οποίο δεν εξέρχονται άλλες ακμές. Θα μπορούσαμε όμως να είχαμε συναντήσει και έναν κόμβο από τον οποίο να εκκινούν μία η και περισσότερες ακμές, και κάθε μια από αυτές να οδηγεί σε μια άλλη πλήρη συστάδα, το μέγεθος της οποίας κατανέμεται επίσης σύμφωνα με την H 1 (x). Ο αριθμός k των ακμών που εξέρχονται από τον υπό εξέταση κόμβο, εξαιρουμένης φυσικά της ακμής την οποία διασχίσαμε μέχρι να καταλήξουμε σε αυτόν, κατανέμεται σύμφωνα με την q k που είδαμε σε προηγούμενη παράγραφο, και χρησιμοποιώντας την ιδιότητα 3 των γεννητριών συναρτήσεων, καταλήγουμε στο συμπέρασμα ότι η κατανομή του αθροίσματος των μεγεθών των συστάδων, στις οποίες οδηγούν οι k ακμές, παράγεται από την γεννήτρια συνάρτηση [H 1 (x)] k. Αποδεικνύεται (βλέπε παράρτημα Θ) ότι το συνολικό πλήθος των κόμβων στους οποίους μπορούμε να έχουμε πρόσβαση όταν ακολουθήσουμε μια τυχαία επιλεχθείσα ακμή εντός του δικτύου, ακολουθεί κατανομή η οποία παράγεται από την γεννήτρια συνάρτηση (M. Newman, 2007): H 1 (x)= x q k [H 1 (x)] k = x G 1 (H 1 (x)) k= 0 όπου ο παράγοντας x, μπροστά από το άθροισμα, αντιστοιχεί στον ένα κόμβο που υπάρχει στο πέρας της ακμής που ακολουθούμε και τον οποίο συναντάμε πρώτο. Η ποσότητα όμως που μας ενδιαφέρει στην πραγματικότητα, είναι η κατανομή των μεγεθών των συστάδων στις οποίες ανήκει ένας τυχαία επιλεχθείς κόμβος. Το πλήθος των ακμών που εξέρχονται από έναν τέτοιον κόμβο κατανέμεται σύμφωνα με την p k και κάθε τέτοια ακμή οδηγεί σε μια συστάδα της οποίας το μέγεθος, σε κόμβους, λαμβάνεται από την κατανομή η οποία παράγεται από την γεννήτρια συνάρτηση H 1 (x). Αποδεικνύεται ότι το μέγεθος της συνιστώσας στην οποία ανήκει ένας τυχαία επιλεχθείς κόμβος ακολουθεί κατανομή η οποία παράγεται από την γεννήτρια συνάρτηση (M. Newman, 2007): H 0 (x)= x p k [ H 1 (x)] k = x G 0 (H 1 (x)) k =0 Συνεπώς, είμαστε πλέον σε θέση να μπορούμε να υπολογίζουμε την κατανομή των μεγεθών των συνιστωσών του δικτύου (πριν την μετάβαση φάσης) λύνοντας την σχέση 47 H 1 (x)= x G 1 (H 1 (x)) ως k

65 48 προς H 1 (x) και αντικαθιστώντας το αποτέλεσμα στην σχέση H 0 (x)= x G 0 (H 1 (x)). Παράδειγμα Ας θεωρήσουμε και πάλι την περίπτωση του γράφου στον οποίο όλοι οι κόμβοι μπορούν να έχουν βαθμό 0, 1, 2 ή 3 με αντίστοιχες πιθανότητες p 0, p 1, p 2, p 3 οι οποίες θεωρούνται γνωστές ποσότητες. Θέτουμε u= H 1 (x) και αντικαθιστούμε στην σχέση οπότε έχουμε: H 1 (x)= x q k [H 1 (x)] k = x G 1 (H 1 (x)), k= 0 u= x G 1 (u)= x [q 2 u 2 +q 1 u+ q 0 ] u= x q x q 1 u+ x q 0 x q 2 2 +(x q 1 1) u+ x q 0 = 0 q 2 u 2 +(q 1 1 x ) u+q 0 = 0 Προφανώς, αυτή είναι μια πολυωνυμική εξίσωση δευτέρου βαθμού η οποία μπορεί να λυθεί με την μέθοδο της διακρίνουσας. Συνεπώς, οι λύσεις της είναι: H 1 (x)= 1 x q ± (q x ) 4 q 0 q 2 2 q 2 Αντικαθιστώντας αυτό το αποτέλεσμα στην σχέση H 0 (x)= x G 0 (H 1 (x)) και διαφορίζοντας m φορές, βρίσκουμε την πιθανότητα ένας τυχαία επιλεχθείς κόμβος να ανήκει σε μια συνιστώσα η οποία περιλαμβάνει ακριβώς m το πλήθος κόμβους (δηλαδή να έχει μέγεθος m ). Δυστυχώς στην πράξη, τα πράγματα δεν είναι τόσο εύκολα όπως στην περίπτωση του προηγουμένου παραδείγματος. Με αυτό εννοούμε ότι, στην πράξη σπάνια έχουμε την δυνατότητα να λύσουμε επακριβώς το δίκτυο και να υπολογίσουμε σε κλειστή μορφή τις H 0 (x) και H 1 (x). Ακόμα και στην περίπτωση του απλού μοντέλου Erdos-Renyi, στο οποίο οι βαθμοί των κόμβων ακολουθούν κατανομή Poisson, η εξίσωση H 1 (x)= x G 1 (H 1 (x)) είναι υπερβατική (transcendental) ως προς x και δεν μπορεί να βρεθεί λύση σε κλειστή μορφή.

66 49 Μπορούμε όμως, να βρούμε εκφράσεις σε κλειστή μορφή για τις γεννήτριες συναρτήσεις, για πεπερασμένες τάξεις του x, εφαρμόζοντας επαναληπτικά (iteration) την σχέση H 1 (x)= x G 1 (H 1 (x)). Για να το κάνουμε αυτό πιο σαφές, ας υποθέσουμε ότι έχουμε στην διάθεση μας μια αρχική εκτίμηση (μια αρχική προσέγγιση) για την έκφραση της γεννήτριας συνάρτησης H 1 (x), η οποία ξέρουμε ότι είναι σωστή μέχρι και για κάποια πεπερασμένη τάξη x m αλλά πιθανόν να μην ισχύει για τάξη x m+1 ή μεγαλύτερη. Αυτό σημαίνει ότι για τάξη μεγέθους μεγαλύτερη ή ίση της x m+1 ενδέχεται η σχέση H 1 (x)= x G 1 (H 1 (x)) να αποκλίνει και να μην δίνει σωστά αποτελέσματα. Υπενθυμίζουμε ότι με m συμβολίζουμε το μέγεθος της συνιστώσας (component) στην οποία ανήκει ο υπό εξέταση κόμβος. Αν αντικαταστήσουμε αυτήν την αρχική προσεγγιστική έκφραση της H 1 (x) στο δεξιό μέλος της σχέσης H 1 (x)= x G 1 (H 1 (x)), λαμβάνουμε μια νέα έκφραση για την H 1 (x). Λόγω του παράγοντα x, οι μόνες συμβολές στον συντελεστή του x m+1 σε αυτήν την νέα έκφραση προέρχονται αποκλειστικά από τους συντελεστές του x m, αλλά και από τους μικρότερους αυτού, στην παλιά έκφραση. Αφού γνωρίζουμε ότι αυτοί οι μικρότεροι συντελεστές ήταν όντως σωστοί, συμπεραίνουμε ότι και ο συντελεστής του x m+1 που προκύπτει στην νέα έκφραση θα πρέπει να είναι επίσης σωστός. Συνεπώς, αν ξεκινήσουμε με την έκφραση H 1 (x)=q 0 x, η οποία ξέρουμε ότι είναι σωστή μέχρι και για την τάξη x 1, την αντικαταστήσουμε στην H 1 (x)= x G 1 (H 1 (x)) και αρχίσουμε να εκτελούμε επαναλήψεις (iteration), τότε σε κάθε επανάληψη θα παράγουμε και μια έκφραση για την οποία θα είναι ακριβής και για μια τάξη μεγαλύτερη από αυτήν. H 1 (x) η Μετά από m επαναλήψεις, θα προκύψει μια έκφραση εντός της οποίας οι συντελεστές για όλες τις τάξεις, συμπεριλαμβανομένης και της x m+1, θα είναι πράγματι σωστοί. Παράδειγμα Ας θεωρήσουμε τον τυχαίο γράφο Erdos-Renyi για τον οποίο γνωρίζουμε ότι οι βαθμοί των κόμβων ακολουθούν κατανομή Poisson και ότι ισχύει G 0 (x)= G 1 (x)= e z(x 1).

67 50 Για την περίπτωση αυτή είναι q 0 = e z H 1 (x)= e z x Αντικαθιστούμε στην H 1 (x)= x G 1 (H 1 (x)) και εκτελούμε 5 επαναλήψεις (iterations): 1η επανάληψη: z H 1 (1) (x)= xze z +O (x 2 ) 2η επανάληψη: z H 1 (2) (x)= xze z +(xze z ) 2 + O (x 3 ) 5η επανάληψη: z H 1 (5) (x)= xze z +(xze z ) (xze z ) (xze z ) (xze z ) 5 + O (x 6 ) Οι πιθανότητες P s ένας τυχαία επιλεχθείς κόμβος να ανήκει σε μια συνιστώσα μεγέθους s =1 ή 2 ή 3 ή 4 ή 5 είναι αντίστοιχα: P s = 1 = e z, P s = 2 = z e 2 z, P s = 3 = 3 2 z2 e 3 z, P s = 4 = 5 3 z3 e 4 z, P s=5 = 8 3 z4 e 5 z Αν κάποιος έχει στην διάθεση του ένα πρόγραμμα συμβολικής άλγεβρας, τότε μπορεί να υπολογίσει τέτοιου είδους πιθανότητες μέχρι και για τάξη ίση με 100. Αν χρειαστεί να βρούμε πιθανότητες μεγαλύτερης τάξης, τότε μπορούμε και πάλι να χρησιμοποιήσουμε τις σχέσεις H 1 (x)= x G 1 (H 1 (x)) και H 0 (x)= x G 0 (H 1 (x)), λύνοντας επαναληπτικά την πρώτη σχέση ( ξεκινώντας από μια εκτίμηση H 1 (x)= q 0 x ). Κάνοντας το αυτό για διάφορες τιμές του x κοντά στο x=0, μπορούμε να χρησιμοποιήσουμε τα αποτελέσματα για τον υπολογισμό των παραγώγων της H 0 (x) και έτσι να βρούμε τις πιθανότητες P s. Δυστυχώς, αυτή η τεχνική μπορεί να χρησιμοποιηθεί μόνο για τις πρώτες τιμές P s διότι, όπως συμβαίνει συνήθως κατά τους υπολογισμούς παραγώγων με αριθμητικές μεθόδους, υπάρχουν περιορισμοί στην ακρίβεια των αριθμών τύπου κινούμενης υποδιαστολής (floating-point numbers), οι οποίοι μπορεί να οδηγήσουν σε μεγάλα σφάλματα κατά τους υπολογισμούς για τις μεγαλύτερες τάξεις. Προκειμένου να το παρακάμψουμε αυτό το πρόβλημα, μπορούμε να χρησιμοποιήσουμε μια τεχνική η οποία προτάθηκε από τους Moore και Newman (2000) και να αποτιμήσουμε τις παραγώγους με αριθμητική ολοκλήρωση του τύπου του Cauchy:

68 51 P s = 1 s! s H 0 x s x=0 = 1 H (ζ ) d ζ 0 2 π j ζ s όπου η ολοκλήρωση γίνεται πάνω σε οποιαδήποτε καμπύλη περικλείει την αρχή των αξόνων του μιγαδικού επιπέδου αλλά εντός του πρώτου πόλου της H 0 (ζ ). Για μεγαλύτερη ακρίβεια, οι Moore και Newman προτείνουν να χρησιμοποιείται η μεγαλύτερη σε εύρος καμπύλη (Newman et al., 2001) Μέσο μέγεθος συνιστώσας Αν και όπως έχουμε δει, συνήθως δεν είναι εφικτό να υπολογιστεί αυτή καθ' αυτή η κατανομή των μεγεθών των συνιστωσών P s για όλες τις τάξεις σε κλειστή μορφή, εν τούτοις μπορούμε να υπολογίσουμε τις διάφορες ροπές της. Αυτό συνήθως είναι και πιο χρήσιμο. Η απλούστερη περίπτωση είναι αυτή της ροπής πρώτης τάξεως, που είναι και η μέση τιμή του μεγέθους των συνιστωσών, δηλαδή το μέσο μέγεθος συνιστώσας. Γνωρίζουμε ότι η μέση τιμή μιας κατανομής η οποία παράγεται από μια γεννήτρια συνάρτηση, δίνεται από την παράγωγο της γεννήτριας συνάρτησης για x=1. Στο στάδιο πριν την μετάβαση φάσης, η κατανομή των μεγεθών των συνιστωσών παράγεται από την H 0 (x)= x G 0 (H 1 (x)). Επομένως, το μέσο μέγεθος συνιστώσας πριν την μετάβαση είναι: s = H 0 ' (1)=[G 0 (H 1 (x))+ x G 0 ' (H 1 (x)) H 1 ' (x)] x=1 s =G 0 (H 1 (1))+G 0 ' (H 1 (1)) H 1 ' (1)=G 0 (1)+G 0 ' (1) H 1 ' (1) s =1+G 0 ' (1) H 1 ' (1) Όπου κατά τις πράξεις λάβαμε υπόψη μας το γεγονός ότι οι κανονικοποιημένες γεννήτριες συναρτήσεις για x=1 δίνουν τιμή 1, οπότε G 0 (1)= H 1 (1)=1. Το H 1 ' (1) υπολογίζεται από την σχέση H 1 (x)= x G 1 (H 1 (x)) με παραγώγιση: H 1 (x)= x G 1 (H 1 (x)) d/dx H 1 ' (x)=g 1 (H 1 (x))+ xg 1 ' (H 1 ( x)) H 1 ' (x)

69 52 H 1 ' (x)= G 1 (H 1 ( x)) 1 xg 1 ' (H 1 (x)) Για x=1 H 1 ' (1)= G 1 (H 1 (1)) 1 G 1 ' (H 1 (1)) = G 1 (1) 1 G 1 ' (1) = 1 1 G 1 ' (1) και με αντικατάσταση στην προηγούμενη σχέση βρίσκουμε ότι: s =1+ G 0 ' (1) 1 G 1 ' (1) Η τελευταία σχέση μπορεί να γραφεί και σε άλλες μορφές. Για παράδειγμα, βλέποντας ότι: G 0 ' (1)= k k p k = k = z 1 και G 1 ' (1)= με αντικατάσταση προκύπτει: s =1 + z 2 1 z 1 z 2 k (k 1) p k k k p k k = k2 k k Αυτή η τελευταία έκφραση αποκλίνει όταν γίνει z 1 = z 2, κάτι που σηματοδοτεί τον σχηματισμό της γιγαντιαίας συνιστώσας και μας δίνει έναν εναλλακτικό τρόπο προσδιορισμού του κρίσιμου σημείου. Την ίδια ακριβώς συνθήκη μπορούμε να την γράψουμε και με άλλον τρόπο αν χρησιμοποιήσουμε τη = z 2 z 1 σχέση s =1+ G 0 ' (1) 1 G 1 ' (1), οπότε και το κρίσιμο σημείο σε αυτήν την περίπτωση προσδιορίζεται από την σχέση G 1 ' (1)= Το στάδιο μετά την μετάβαση φάσης Οι υπολογισμοί που έγιναν στις προηγούμενες παραγράφους αφορούσαν την συμπεριφορά του γράφου πριν γίνει η μετάβαση φάσης όπου ακόμα δεν έχει σχηματιστεί γιγαντιαία συνιστώσα. Στην πράξη όμως, όλοι οι γράφοι που έχουν μελετηθεί, φαίνονται να βρίσκονται στο στάδιο μετά την μετάβαση φάσης οπότε και εμφανίζουν εντός τους κάποια γιγαντιαία συνιστώσα.

70 53 Το ερώτημα επομένως είναι, αν είναι εφικτό να επεκτείνουμε τις τεχνικές των γεννητριών συναρτήσεων που είδαμε στα προηγούμενα προκειμένου να μπορέσουμε να μελετήσουμε τον γράφο ακόμα και στο στάδιο μετά την μετάβαση φάσης. Πράγματι, κάτι τέτοιο είναι όντως εφικτό και το μόνο που απαιτείται είναι η χρήση ορισμένων τεχνικών σε κάποια λεπτά σημεία. Το βασικό πρόβλημα είναι ότι η γιγαντιαία συνιστώσα δεν παρουσιάζει την ίδια συμπεριφορά με εκείνες τις μικρότερες συνιστώσες που μελετήσαμε στις προηγούμενες παραγράφους. Εκείνες οι συνιστώσες είχαν ένα πεπερασμένο μέσο μέγεθος, που σήμαινε ότι στο όριο όπου ο γράφος γίνεται μεγάλος αποκτούσαν μορφή δένδρου και δεν περιείχαν βρόχους. Αντιθέτως, η γιγαντιαία συνιστώσα μεγαλώνει καθώς αυξάνεται το συνολικό μέγεθος του γράφου και απειρίζεται όταν n. Αυτό σημαίνει ότι στην γενική περίπτωση θα υπάρχουν βρόχοι εντός της. Για αυτό ακριβώς τον λόγο δεν μπορούμε να χρησιμοποιήσουμε αυτούσιες τις τεχνικές των προηγούμενων παραγράφων. Καταφεύγουμε λοιπόν στην χρήση του παρακάτω τεχνάσματος. Για το στάδιο μετά την μετάβαση, ορίζουμε τις H 0 (x) και H 1 (x) ως τις γεννήτριες συναρτήσεις που παράγουν τις κατανομές των μεγεθών όλων των μικρών συνιστωσών, εκτός της γιγαντιαίας συνιστώσας. Οι μη γιγαντιαίες (μικρές) συνιστώσες εξακολουθούν να έχουν μορφή δένδρου ακόμα και μετά την μετάβαση φάσης, οπότε οι σχέσεις H 1 (x)= x G 1 (H 1 (x)) και H 0 (x)= x G 0 (H 1 (x)) εξακολουθούν να ισχύουν κανονικά. Η μόνη διαφορά είναι ότι το H 0 (1) δεν ισούται πλέον με 1. Το ίδιο ισχύει και για το H 1 (1). Πλέον είναι: H 0 (1)= s P s = υποσύνολο των κόμβων του γράφου που δεν ανήκουν στην γιγαντιαία συνιστώσα Αυτό ισχύει διότι το άθροισμα επί των s, είναι μόνο επί των μη γιγαντιαίων συνιστωσών, συνεπώς το άθροισμα των πιθανοτήτων P s δεν ισούται πλέον με 1. Το αποτέλεσμα αυτό είναι πολύ χρήσιμο διότι μας επιτρέπει να υπολογίσουμε το μέγεθος S της γιγαντιαίας συνιστώσας, σαν ένα υποσύνολο του συνολικού αριθμού των κόμβων που αποτελούν τον γράφο, καθότι θα είναι S =1 H 0 (1).

71 54 Από τις σχέσεις H 1 (x)= x G 1 (H 1 (x)) και H 0 (x)= x G 0 (H 1 (x)) συνεπάγεται ότι το S θα πρέπει να είναι λύση των εξισώσεων: S =1 G 0 (υ) και υ=g 1 (υ), όπου υ H 1 (1). Απόδειξη: Έχουμε ότι H 1 (x)= x G 1 (H 1 (x)) x=1 H 1 (1)= G 1 (H 1 (1)) υ= G 1 (υ) και H 0 (x)= x G 0 (H 1 (x)) x=1 S =1 G 0 (υ) H 0 (1)=G 0 (H 1 (1)) S=1 H 0 (1) 1 S = G 0 (υ) Αυτές οι εξισώσεις δεν έχουν λύση σε κλειστή μορφή, μπορούν όμως να επιλυθούν με αριθμητικές επαναληπτικές μεθόδους ξεκινώντας από μια κατάλληλη αρχική τιμή του υ, πχ. για υ= 0. Μπορούμε να υπολογίσουμε τα μέσα μεγέθη των μη γιγαντιαίων συνιστωσών με τον συνηθισμένο τρόπο, παραγωγίζοντας την σχέση H 0 (x)= x G 0 (H 1 (x)). Θα πρέπει να προσέξουμε όμως δύο σημεία: (1) Δεν μπορούμε να θεωρήσουμε πλέον ότι ισχύει H 0 (1)= H 1 (1)=1, όπως ίσχυε στο στάδιο πριν την μετάβαση. (2) Αφού η κατανομή P s δεν είναι πλέον κανονικοποιημένη θα πρέπει να κάνουμε την κανονικοποίηση εμείς οι ίδιοι. Η σωστή έκφραση για το μέσο μέγεθος μιας μη γιγαντιαίας συνιστώσας, μετά την μετάβαση φάσης, είναι: s = H ' (1) 0 H 0 (1) = 1 H 0 (1) [G (H (1))+ G ' (H (1)) G (H (1)) ] 1 G 1 ' (H 1 (1)) z υ 2 s =1+ [1 S] [1 G 1 ' (υ)]

72 55 Όπου οι ποσότητες υ και S υπολογίζονται από τις σχέσεις: S =1 G 0 (υ) και υ=g 1 (υ). Για S =0 και υ=1, η τελευταία σχέση μεταπίπτει στην s =1+ G 0 ' (1) 1 G 1 ' (1) που είχαμε υπολογίσει σε προηγούμενη παράγραφο. z υ 2 Πράγματι: s =1 + (1 S)(1 G 1 ' (υ)) S=0, υ=1 s =1+ z 1 G 1 ' (1) z=g 0 ' (1) s =1+ G 0 ' 1 G 1 ' (1) Δύο σχόλια ως υπενθύμιση: 1. Η πρώτη παράγωγος της γεννήτριας συνάρτησης H 0 (x) για x=1, δηλαδή η ποσότητα H 0 ' (1), μας δίνει την μέση τιμή (mean) της παραγόμενης κατανομής. 2. Ως H 0 (1) συμβολίζουμε το υποσύνολο των κόμβων που δεν ανήκουν στην γιγαντιαία συνιστώσα. Σαν ένα παράδειγμα των παραπάνω αποτελεσμάτων παραθέτουμε το επόμενο σχήμα: Σχήμα 2.4 Μέγεθος γιγαντιαίας συνιστώσας και μέσο μέγεθος μικρότερων συνιστωσών του δικτύου

73 Στο σχήμα 2.4 βλέπουμε πως μεταβάλλονται παράλληλα το μέγεθος της γιγαντιαίας συνιστώσας και το μέσο μέγεθος των υπολοίπων μη γιγαντιαίων συνιστωσών σε έναν γράφο ο οποίος παρουσιάζει 56 εκθετική κατανομή των βαθμών των κόμβων του, της μορφής μεταβάλλεται η σταθερά c. p k =(1 e 1c ) e k c, καθώς Όπως μπορούμε να παρατηρήσουμε, το μέσο μέγεθος μη γιγαντιαίας συνιστώσας αποκλίνει (απειρίζεται) κατά την στιγμή της μετάβασης φάσης και ταυτόχρονα αρχίζει να σχηματίζεται η γιγαντιαία συνιστώσα, το μέγεθος της οποίας αυξάνεται συνεχώς και με ομαλό τρόπο μετά την μετάβαση. Σε αυτό το σχήμα, η μετάβαση φάσης συμβαίνει για τιμή του c που είναι λίγο πριν το 1 (όπου G 1 ' (1)=1 ) και συγκεκριμένα αυτή η κρίσιμη τιμή είναι c cr =(log (3)) Προσανατολισμένοι γράφοι Κάποιοι από τους γράφους που είδαμε στην εισαγωγή αυτού του κεφαλαίου είναι προσανατολισμένοι (πολλές φορές ονομάζονται και κατευθυνόμενοι ). Αυτό σημαίνει ότι οι ακμές σε αυτούς τους γράφους έχουν έναν συγκεκριμένο προσανατολισμό. Παραδείγματα τέτοιων γράφων ήταν: 1. Το World-Wide Web, στο οποίο οι υπερσύνδεσμοι (hyperlinks) που μας μεταφέρουν από την μια ιστοσελίδα στην άλλη, δείχνουν προς μία μόνο συγκεκριμένη κατεύθυνση. 2. Τα δίκτυα τροφικών αλυσίδων (food webs), στα οποία οι αλληλεπιδράσεις μεταξύ θηρευτή και θηράματος είναι μη συμμετρικές και μπορούμε να τις φανταστούμε σαν να έχουν κατεύθυνση από τον θηρευτή προς το θήραμα. Άλλα πρόσφατα μελετημένα παραδείγματα προσανατολισμένων δικτύων είναι οι γράφοι τηλεφωνικών κλήσεων (telephone call graphs) (Abello et al., 1998 ; Hayes, 2000 ; Aiello et al., 2000), τα δίκτυα αναφορών (citation networks) (Redner 1998 ; Vasquez, 2001)) και τα δίκτυα ηλεκτρονικού ταχυδρομείου ( networks) (Ebel et al., 2002). Τα προσανατολισμένα δίκτυα είναι περισσότερο πολύπλοκα συγκρινόμενα με τα μη προσανατολισμένα δίκτυα.

74 57 Καταρχάς, κάθε κόμβος σε έναν προσανατολισμένο γράφο δεν έχει μόνο έναν, αλλά δύο βαθμούς. Συγκεκριμένα, έχει: 1. Έναν βαθμό εισερχομένων ακμών (in-degree / έσω-βαθμός), που είναι ο αριθμός των ακμών που εισέρχονται στον κόμβο. 2. Έναν βαθμό εξερχομένων ακμών (out-degree / έξω-βαθμός), που είναι αριθμός των ακμών που εξέρχονται από τον κόμβο. Για τον λόγο αυτό, έχουμε αντίστοιχα και δύο κατανομές για τους βαθμούς των κόμβων του γράφου. Προκειμένου να έχουμε μια πιο γενική αναπαράσταση, ορίζουμε την από κοινού κατανομή (joint degree distribution) για τον βαθμό των εισερχομένων ακμών (in-degree) και τον βαθμό των εξερχομένων ακμών (out-degree) ενός κόμβου και την συμβολίζουμε ως p jk. Οπότε ως p jk ορίζουμε την πιθανότητα ένας τυχαία επιλεχθείς κόμβος να έχει ταυτοχρόνως βαθμό εισερχομένων ακμών j και βαθμό εξερχομένων ακμών k. Ορίζοντας μια τέτοιου είδους από κοινού κατανομή μας επιτρέπει να εξετάσουμε και την περίπτωση όπου ενδεχομένως τα δύο είδη βαθμών είναι συσχετισμένα (correlated). Για παράδειγμα, σε έναν γράφο όπου σε κάθε κόμβο ο βαθμός των εξερχομένων ακμών είναι ίσος με τον βαθμό εισερχομένων ακμών, το p jk θα είναι μη μηδενικό όταν και μόνο όταν j =k. Η δομή των συνιστωσών σε έναν προσανατολισμένο γράφο είναι, επίσης, περισσότερο πολύπλοκη από ότι στην περίπτωση των μη προσανατολισμένων γράφων, διότι μπορεί για παράδειγμα να υπάρχει ένα προσανατολισμένο μονοπάτι μέσα στο δίκτυο το οποίο να οδηγεί από τον κόμβο Α στον κόμβο Β αλλά αυτό δεν μας εγγυάται ότι υπάρχει και ένα προσανατολισμένο μονοπάτι το οποίο θα μας οδηγεί από τον κόμβο Β πίσω στον κόμβο Α. Για τον λόγο αυτό, ένας οποιοσδήποτε κόμβος Α του δικτύου μπορεί να ανήκει σε κάποιο από τα επόμενα τέσσερα είδη συνιστωσών: 1. Στην έσω-συνιστώσα (in-component), που είναι το σύνολο των κόμβων από τους οποίους μπορούμε να ξεκινήσουμε και να καταλήξουμε στον κόμβο Α. Δηλαδή είναι το σύνολο των κόμβων που έχουν πρόσβαση στον κόμβο Α. 2. Στην έξω-συνιστώσα (out-component), που είναι το σύνολο των κόμβων στους οποίους μπορούμε

75 58 να καταλήξουμε αν ξεκινήσουμε από τον κόμβο Α. Δηλαδή είναι το σύνολο των κόμβων που είναι προσβάσιμοι από τον κόμβο Α. 3. Στην ισχυρά συνδεδεμένη συνιστώσα (strongly connected component), που είναι το σύνολο των κόμβων οι οποίοι έχουν πρόσβαση στον κόμβο Α και ταυτόχρονα ο κόμβος Α έχει πρόσβαση σε αυτούς. Δηλαδή υπάρχει αμφίδρομη σύνδεση μεταξύ του συνόλου των κόμβων και του μεμονωμένου κόμβου Α. 4. Στην ασθενώς συνδεδεμένη συνιστώσα (weakly connected component), που είναι το σύνολο των κόμβων στους οποίους μπορούμε να καταλήξουμε αν ξεκινήσουμε από τον κόμβο Α αγνοώντας όμως τον προσανατολισμό όλων των ακμών του δικτύου. Η ασθενώς συνδεδεμένη συνιστώσα είναι η συνηθισμένη συνιστώσα στην οποία ανήκει ο κόμβος Α αν θεωρήσουμε ότι ο γράφος δεν είναι προσανατολισμένος. Προφανώς, αυτή την περίπτωση μπορεί να την μελετήσει κάποιος με τις μεθόδους που ήδη περιγράψαμε σε προηγούμενες παραγράφους, οπότε δεν θα ασχοληθούμε περισσότερο με αυτό το είδος συνιστώσας. Προκειμένου ο κόμβος Α να ανήκει σε μια ισχυρά συνδεδεμένη συνιστώσα η οποία θα έχει μέγεθος μεγαλύτερο από 1, θα πρέπει να υπάρχει τουλάχιστον άλλος ένας κόμβος στον οποίο θα έχει πρόσβαση ο Α αλλά και αυτός ο άλλος κόμβος να έχει πρόσβαση πίσω προς τον Α. Κάτι τέτοιο όμως, συνεπάγεται την ύπαρξη βρόχου ο οποίος θα σχηματίζεται από κατευθυνόμενες ακμές. Αυτό όπως είδαμε σε προηγούμενες παραγράφους δεν μπορεί να συμβεί στο όριο που ο γράφος γίνεται μεγάλος, οπότε θα αγνοήσουμε και αυτήν την περίπτωση. Συνεπώς, οι δύο περιπτώσεις που μας απομένουν να εξετάσουμε σε βάθος είναι αυτές της έξωσυνιστώσας και της έσω-συνιστώσας Γεννήτριες συναρτήσεις σε προσανατολισμένους γράφους Λόγω του ότι στη περίπτωση των προσανατολισμένων γράφων η κατανομή των βαθμών των κόμβων p jk είναι συνάρτηση δύο μεταβλητών, η αντίστοιχη γεννήτρια συνάρτηση θα πρέπει να είναι και αυτή μια συνάρτηση δύο μεταβλητών: G (x, y)= p jk x j y k j, k = 0

76 59 Αυτή η συνάρτηση επαληθεύει την συνθήκη κανονικοποίησης G (1,1)=1 και οι μέσες τιμές των κατανομών του έσω-βαθμού και του έξω-βαθμού δίνονται από τις πρώτες μερικές παραγώγους ως προς x και y αντίστοιχα. Παρ' όλα αυτά όμως, θα υπάρχει μόνο ένας μέσος βαθμός z και στην περίπτωση του προσανατολισμένου γράφου, από την στιγμή που κάθε ακμή θα πρέπει να ξεκινάει από έναν κόμβο και να καταλήγει σε έναν άλλο κόμβο. Αυτό σημαίνει ότι τόσο ο συνολικός αριθμός,όσο και ο μέσος αριθμός, των εισερχομένων και εξερχομένων ακμών θα είναι ο ίδιος. Άμεση συνέπεια αυτού του συλλογισμού είναι ο παρακάτω περιορισμός (constraint) όσον αφορά την γεννήτρια συνάρτηση: G x x,y=1 = z = G y x,y=1 και ο αντίστοιχος περιορισμός που αφορά την ίδια την κατανομή p jk είναι: ( j k) p jk =0 jk Απόδειξη: Έχουμε G (x, y)= p jk x j y k j, k = 0, οπότε G x = p jk j x j 1 y k j, k =0 G y = p jk x j k y k 1 j, k =0 G x G y x,y=1 = p jk j j, k= 0 x,y=1 = p jk k j, k= 0 Εξισώνοντας τις δύο τελευταίες σχέσεις λαμβάνουμε j, k= 0 p jk j= j, k= 0 p jk k j, k= 0 p jk j j, k= 0 p jk k= 0 p jk ( j k)= 0 j, k =0 Από την G(x, y) μπορούμε να ορίσουμε τις γεννήτριες συναρτήσεις μίας μεταβλητής G 0 ( y) και G 1 ( y) οι οποίες αφορούν αντίστοιχα τον αριθμό των εξερχομένων ακμών οι οποίες εγκαταλείπουν

77 60 έναν τυχαία επιλεχθέντα κόμβο και τον αριθμό των εξερχομένων ακμών οι οποίες εγκαταλείπουν έναν κόμβο αν καταλήξουμε σε αυτόν ακολουθώντας μια τυχαία επιλεχθείσα ακμή μέσα στον γράφο. Μπορούμε με παρόμοιο τρόπο να ορίσουμε και τις γεννήτριες συναρτήσεις F 0 (x) και F 1 (x) οι οποίες θα αφορούν τον αριθμό των ακμών οι οποίες εισέρχονται σε έναν κόμβο. Οι γεννήτριες συναρτήσεις G 0 ( y), G 1 ( y), F 0 (x) και F 1 (x) δίνονται από τις επόμενες σχέσεις: G 0 ( y)=g(1, y) G 1 ( y)= 1 z G x x=1 F 0 (x)=g(x,1) F 1 (x )= 1 z G y y=1 Έχοντας στην διάθεση μας αυτές τις γεννήτριες συναρτήσεις, μπορούμε να κάνουμε πολλούς χρήσιμους υπολογισμούς Υπολογισμός χαρακτηριστικών μεγεθών σε προσανατολισμένους γράφους Η κατανομή των αριθμών των κόμβων που είναι προσεγγίσιμοι από έναν τυχαία επιλεγμένο κόμβο εντός ενός προσανατολισμένου γράφου, δηλαδή η κατανομή των μεγεθών των έξω-συνιστωσών, παράγεται από την γεννήτρια συνάρτηση: H 0 ( y)= y G 0 (H 1 ( y)) Όπου H 1 ( y) είναι μία λύση της H 1 ( y)= y G 1 (H 1 ( y)), με την ίδια λογική που συναντήσαμε και σε προηγούμενες παραγράφους. Ένα παρόμοιο ζεύγος σχέσεων θα ισχύει και για την περίπτωση της κατανομής των μεγεθών των έσωσυνιστωσών. Προφανώς, στην περίπτωση της κατανομής των μεγεθών των έσω-συνιστωσών, στις τελευταίες δύο σχέσεις θα εμπλέκονται οι γεννήτριες συναρτήσεις F 0 (x) και F 1 (x) αντί των G 0 ( y) και G 1 ( y).

78 Το μέσο μέγεθος έξω-συνιστώσας για την περίπτωση όπου δεν έχει σχηματιστεί ακόμα γιγαντιαία συνιστώσα (δηλαδή όταν βρισκόμαστε στο στάδιο πριν την μετάβαση φάσης) δίνεται από την σχέση 61 s =1+ G 0 ' (1) 1 G 1 ' (1), οπότε το σημείο κατά το οποίο εμφανίζεται για πρώτη φορά μια γιγαντιαία συνιστώσα προσδιορίζεται από την σχέση G 1 ' (1)=1. Αντικαθιστώντας το G 1 ( y )= 1 z j, k= 0 (2 jk j k) p jk = 0 G x x=1 στην G 1 ' (1)=1 προκύπτει η συνθήκη: Αυτή ακριβώς είναι η συνθήκη η οποία προσδιορίζει την στιγμή όπου εμφανίζεται για πρώτη φορά μία γιγαντιαία συνιστώσα μέσα σε ένα προσανατολισμένο δίκτυο και είναι η αντίστοιχη της συνθήκης k (k 2) pk =0 που είχαμε συναντήσει στην περίπτωση των μη προσανατολισμένων δικτύων. k =0 Το σημείο που κάνει για πρώτη φορά την εμφάνιση της η γιγαντιαία συνιστώσα, μπορεί ισοδύναμα να προσδιοριστεί και από την συνθήκη j, k= 0 (2 jk j k) p jk = 0. F 1 ' (1)=1, οπότε και καταλήγουμε πάλι στην σχέση Το ερώτημα που προκύπτει σε αυτό το σημείο είναι: Για τι είδους γιγαντιαία συνιστώσα μιλάμε? Όπως ακριβώς συμβαίνει και με τις μικρές (μη γιγαντιαίες) συνιστώσες, έτσι και για τις γιγαντιαίες συνιστώσες υπάρχουν τέσσερεις διαφορετικοί τύποι: 1. Οι γιγαντιαίες έσω-συνιστώσες (giant in-components). 2. Οι γιγαντιαίες έξω-συνιστώσες (giant out-components). 3. Οι ασθενώς συνδεδεμένες γιγαντιαίες συνιστώσες (giant weakly connected components). 4. Οι ισχυρώς συνδεδεμένες γιγαντιαίες συνιστώσες (giant strongly connected components). Μία ασθενώς συνδεδεμένη γιγαντιαία συνιστώσα είναι τετριμμένη περίπτωση, όπως ακριβώς και όταν είχαμε μελετήσει τις ασθενώς συνδεδεμένες μη γιγαντιαίες συνιστώσες στα προηγούμενα.

79 62 Μία ισχυρώς συνδεδεμένη γιγαντιαία συνιστώσα όμως, δεν εξαφανίζεται καθώς το δίκτυο μεγαλώνει, όπως συνέβαινε με τις ισχυρώς συνδεδεμένες μη γιγαντιαίες συνιστώσες. Δεν υπάρχει κάποιος λόγος που να απαγορεύει την ύπαρξη βρόχων στο εσωτερικό μιας γιγαντιαίας συνιστώσας και για αυτό ακριβώς τον λόγο είναι δυνατόν να σχηματίζονται ισχυρώς συνδεδεμένες γιγαντιαίες συνιστώσες μέσα σε ένα δίκτυο. Η συνθήκη που προσδιορίζει το σημείο στο οποίο γίνεται η μετάβαση φάσης σε ένα προσανατολισμένο δίκτυο, αντιστοιχεί στο σημείο όπου το μέσο μέγεθος της μη γιγαντιαίας έξωσυνιστώσας, η οποία είναι προσβάσιμη από έναν κόμβο, αποκλίνει. Αυτό είναι και το σημείο κατά το οποίο αρχίζει να σχηματίζεται η γιγαντιαία έσω-συνιστώσα. Επιπλέον, όπως είδαμε, μπορούμε να καταλήξουμε στην ίδια συνθήκη αν προσπαθήσουμε να προσδιορίσουμε το σημείο στο οποίο αποκλίνει το μέσο μέγεθος της μη γιγαντιαίας έσω-συνιστώσας. Δηλαδή όταν σχηματίζεται η γιγαντιαία έξω-συνιστώσα. Καταλήγουμε επομένως στο συμπέρασμα ότι η γιγαντιαία έσω-συνιστώσα και η γιγαντιαία έξωσυνιστώσα εμφανίζονται την ίδια στιγμή, η οποία προσδιορίζεται από την συνθήκη j, k= 0 (2 jk j k) p jk = 0. Στην συνέχεια θα υπολογίσουμε τα μεγέθη αυτών των δύο γιγαντιαίων συνιστωσών. Σύμφωνα με την τεχνική που ακολουθήσαμε και σε προηγούμενη παράγραφο, γενικεύουμε τις συναρτήσεις H 0 ( y) και H 1 ( y) για την περιοχή μετά την μετάβαση φάσης, θεωρώντας ότι είναι οι γεννήτριες συναρτήσεις που αφορούν μόνο τις μη γιγαντιαίες έξω-συνιστώσες. Για αυτήν την περίπτωση θα ισχύει ότι: H 0 (1) = το υποσύνολο όλων εκείνων των κόμβων που έχουν μία πεπερασμένη έξω-συνιστώσα. Κάθε κόμβος Α όμως, ο οποίος έχει μία πεπερασμένη έξω-συνιστώσα, δεν μπορεί εξ ορισμού να ανήκει και στην γιγαντιαία έσω-συνιστώσα. Συνεπώς, το μέγεθος της γιγαντιαίας έσω-συνιστώσας είναι: S in = 1 H 0 (1)

80 63 και μπορεί να υπολογιστεί όπως και στα προηγούμενα, με τις σχέσεις: S =1 G 0 (υ) και υ=g 1 (υ), όπου υ H 1 (1) Ομοίως, μπορούμε να υπολογίσουμε το μέγεθος S out της γιγαντιαίας έξω-συνιστώσας χρησιμοποιώντας τις ίδιες σχέσεις και κάνοντας απλώς τις αντικαταστάσεις: G 0 F 0 και G 1 F 1 Προκειμένου να υπολογίσουμε το μέγεθος S s της ισχυρώς συνδεδεμένης γιγαντιαίας συνιστώσας λαμβάνουμε υπόψη μας τις εξής παρατηρήσεις (Dorogovtsev et al., 2001): Αν τουλάχιστον μία από τις εξερχόμενες ακμές ενός κόμβου οδηγεί οπουδήποτε εντός της γιγαντιαίας έσω-συνιστώσας, τότε μπορούμε να φτάσουμε στην ισχυρώς συνδεδεμένη γιγαντιαία συνιστώσα αν ξεκινήσουμε από αυτόν τον κόμβο. Αν τουλάχιστον μία από τις εισερχόμενες σε έναν κόμβο ακμές προέρχεται από κάπου μέσα από την γιγαντιαία έξω-συνιστώσα, τότε ο κόμβος μπορεί να προσεγγιστεί αν ξεκινήσουμε από την ισχυρώς συνδεδεμένη συνιστώσα. Όταν και μόνο όταν αυτές οι δύο συνθήκες ικανοποιούνται ταυτόχρονα, λέμε ότι ο κόμβος ανήκει στην ισχυρώς συνδεδεμένη γιγαντιαία συνιστώσα. Ας θεωρήσουμε τις εξερχόμενες ακμές. Η γεννήτρια συνάρτηση H 1 (x) παράγει την κατανομή των μεγεθών των πεπερασμένων (μη γιγαντιαίων) έξω-συνιστωσών στις οποίες καταλήγουμε αν ακολουθήσουμε μια τυχαία επιλεχθείσα ακμή εντός του δικτύου. Αυτό συνεπάγεται ότι H 1 (1) είναι η συνολική πιθανότητα μια ακμή να οδηγεί σε μια πεπερασμένη έξω-συνιστώσα (δηλαδή όχι στην γιγαντιαία έσω-συνιστώσα) και όπως είδαμε και στα προηγούμενα H 1 (1) είναι το σταθερό σημείο (fixed point) της G 1 (x) το οποίο συμβολίζουμε ως υ. Δηλαδή είναι υ H 1 (1). Για έναν κόμβο με k εξερχόμενες ακμές, υ k είναι η πιθανότητα όλες αυτές οι ακμές να οδηγούν σε πεπερασμένες συνιστώσες ενώ 1 υ k είναι η πιθανότητα τουλάχιστον μια από αυτές τις ακμές να καταλήγει στην γιγαντιαία έσω-συνιστώσα. Ομοίως, η πιθανότητα τουλάχιστον μια εισερχόμενη ακμή να προέρχεται από την γιγαντιαία έξωσυνιστώσα είναι ίση με 1 u j, όπου u είναι το σταθερό σημείο της F 1 (x) και j είναι ο έσω-βαθμός του κόμβου.

81 Οπότε η πιθανότητα ένας κόμβος με έσω-βαθμό j και έξω-βαθμό k να βρίσκεται εντός της ισχυρώς συνδεδεμένης γιγαντιαίας συνιστώσας είναι (1 u j ) (1 υ k ). Η μέση τιμή αυτής της πιθανότητας, αν αυτή εκφραστεί επί όλων των κόμβων του δικτύου, είναι το μέσο μέγεθος της ισχυρώς συνδεδεμένης γιγαντιαίας συνιστώσας και δίνεται από την σχέση: S s = j, k S s = j, k p jk (1 u j ) (1 υ k )= j, k p jk j, k p jk u j j, k p jk (1 u j υ k +u j υ k ) p jk υ k + j, k S s =1 G (u,1) G (1, υ)+g (u, υ) p jk u j υ k Όπου u και υ είναι λύσεις των u=f 1 (u) και υ=g 1 (υ). Σημειώνοντας ότι είναι u =υ= 1 πριν την μετάβαση φάσης (κατά την οποία κάνουν την εμφάνιση τους η γιγαντιαία έσω-συνιστώσα και η γιγαντιαία έξω-συνιστώσα) και ότι 64 G(1,1)=1, βλέπουμε ότι και η ισχυρώς συνδεδεμένη γιγαντιαία συνιστώσα εμφανίζεται για πρώτη φορά στο σημείο μετάβασης που προσδιορίζεται από την συνθήκη j, k= 0 (2 jk j k) p jk = 0. Οπότε γενικά, σε έναν προσανατολισμένο γράφο δεν θα υπάρχει μόνο μία αλλά δύο μεταβάσεις φάσης: Στην μια μετάβαση φάσης θα κάνει την εμφάνιση της η ασθενώς συνδεδεμένη γιγαντιαία συνιστώσα και στην άλλη μετάβαση φάσης θα εμφανίζονται τα άλλα τρία είδη γιγαντιαίων συνιστωσών. Στην πράξη, έχει αποδειχθεί ότι η εφαρμογή της θεωρίας των προσανατολισμένων τυχαίων γράφων στα προσανατολισμένα δίκτυα του πραγματικού κόσμου είναι γενικά μια δύσκολη υπόθεση. Αυτό συμβαίνει διότι οι ερευνητές σπάνια ασχολούνται με το να μετρήσουν την από κοινού κατανομή του έσω-βαθμού και του έξω-βαθμού που χρειάζεται προκειμένου να μπορέσουν να γίνουν όλοι οι υπολογισμοί που περιγράψαμε στα προηγούμενα. Συνεπώς ακόμα βρισκόμαστε σε αναμονή, προκειμένου οι θεωρίες που παρουσιάστηκαν σε αυτήν την παράγραφο να επιβεβαιωθούν από εμπειρικές μελέτες. p jk

82 Δίκτυα με συσταδοποίηση Μια πρώτη προσπάθεια επέκτασης του κλασικού μοντέλου τυχαίου γράφου (μοντέλο Erdos-Renyi) έτσι ώστε να λαμβάνει υπόψη του και το φαινόμενο της συσταδοποίησης έγινε από τον καθηγητή M. Newman. Ο M. Newman μελέτησε τις διορθώσεις που μπορούν να γίνουν στην ποσότητα z 2 (δηλαδή στον μέσο αριθμό των γειτόνων που βρίσκονται σε απόσταση 2 ακμών) σε γράφους οι οποίοι εμφανίζουν μη μηδενικό συντελεστή συσταδοποίησης C (Newman, 2001d). Ας θεωρήσουμε έναν κόμβο Α, με τους πρώτους γείτονες (αυτούς δηλαδή που απέχουν απόσταση 1 ακμής από τον Α) και τους δεύτερους γείτονες (αυτούς δηλαδή που απέχουν απόσταση 2 ακμών από τον Α) αυτού να βρίσκονται τοποθετημένοι σε δύο ομόκεντρους δακτύλιους γύρω από αυτόν. Σε έναν τυχαίο γράφο που δεν παρουσιάζει συσταδοποίηση, ένας γείτονας του Α ο οποίος έχει βαθμό m θα συνεισφέρει m 1 κόμβους στον δακτύλιο των δεύτερων γειτόνων του Α. Αυτό σημαίνει ότι όλοι οι δεύτεροι γείτονες του Α είναι ανεξάρτητοι, εννοώντας κάθε ένας από αυτούς θα είναι και ένας καινούργιος κόμβος που δεν τον έχουμε ξανασυναντήσει. Σύμφωνα με αυτήν την λογική είχαμε καταλήξει και στην σχέση z 2 = k 2 k. Σε ένα δίκτυο όμως που παρουσιάζει συσταδοποίηση, τα πράγματα είναι πολύ διαφορετικά. Όταν έχουμε συσταδοποίηση, πολλοί γείτονες των γειτόνων του Α είναι είναι ταυτόχρονα και γείτονες του ίδιου του Α. Αυτή ακριβώς είναι και η έννοια της συσταδοποίησης: Ο φίλος του φίλου μου, να είναι και δικός μου φίλος. Για την ακρίβεια, κάποιο υποσύνολο C των m 1 γειτόνων θα είναι ταυτόχρονα και γείτονες του κεντρικού κόμβου Α. Κατά συνέπεια δεν θα πρέπει να προσμετρηθούν ως δεύτεροι γείτονες του Α. Αυτό ελαττώνει τον αριθμό των δεύτερων γειτόνων z 2 κατά έναν παράγοντα 1 C, οπότε θα έχουμε: z 2 =(1 C) ( k 2 k ) Το πρόβλημα όμως δεν σταματάει εδώ. Θα πρέπει να λάβουμε κάτι ακόμα υπόψη μας προκειμένου να μπορέσουμε υπολογίσουμε σωστά το z 2.

83 66 Υπάρχει πιθανότητα να καταμετρούμε λάθος τους δεύτερους γείτονες του Α και να τους βγάζουμε περισσότερους από ότι είναι στην πραγματικότητα (over-counting) επειδή κάποιοι από αυτούς ενδέχεται να είναι γείτονες περισσοτέρων του ενός πρώτων γειτόνων του Α. Με απλά λόγια: Μπορεί κάποιος να γνωρίζει δύο ανθρώπους οι οποίοι με την σειρά τους να έχουν έναν άλλο κοινό φίλο, τον οποίο όμως δεν τον γνωρίζει προσωπικά ο πρώτος. Τέτοιου είδους συνδέσεις δημιουργούν τετράγωνα εντός του δικτύου, η πυκνότητα (density) των οποίων μπορεί να ποσοτικοποιηθεί με χρήση του ονομαζόμενου συντελεστή αμοιβαιότητας (mutuality): Μ = μέσος αριθμός κόμβων που απέχουν απόσταση 2 ακμών από έναν συγκεκριμένο κόμβο μέσος αριθμός μονοπατιών μήκους 2 ακμών που οδηγούν σε αυτούς τους κόμβους Δηλαδή, ο συντελεστής Μ μετράει τον μέσο αριθμό των μονοπατιών τα οποία έχουν μήκος ίσο με 2 ακμές και οδηγούν σε έναν δεύτερο γείτονα ενός συγκεκριμένου κόμβου. Η νέα διορθωμένη έκφραση για το z 2 θα είναι: z 2 = M (1 C) ( k 2 k ) Τώρα όμως, προκύπτει ένα άλλο πρόβλημα: Ο υπολογισμός του συντελεστή Μ με χρήση της παραπάνω κλασματικής σχέσης, προϋποθέτει ότι ήδη γνωρίζουμε τον μέσο αριθμό των κόμβων που βρίσκονται σε απόσταση 2 ακμών από τον κεντρικό κόμβο Α (αριθμητής του κλάσματος). Αυτός όμως ο μέσος αριθμός είναι ακριβώς η ποσότητα z 2 που προσπαθούμε να προσδιορίσουμε εξ αρχής.

84 67 Μια μερική λύση σε αυτό το πρόβλημα είναι η παρακάτω: Σχήμα 2.5 Συσταδοποίηση σε τυχαίους γράφους Αρχικά θεωρούμε τα σχήματα 2.5(a) και 2.5(b). Στο σχήμα 2.5(a), βλέπουμε ότι ο κόμβος Α έχει γείτονες τους D και Ε, οι οποίοι και οι δύο είναι συνδεδεμένοι με τον κόμβο F, ο οποίος προφανώς δεν είναι πρώτος γείτονας του Α. Το ίδιο συμβαίνει και στο σχήμα 2.5(b), μόνο που σε αυτήν την περίπτωση οι κόμβοι D και Ε είναι συνδεδεμένοι μεταξύ τους. Η εμπειρία έχει δείξει, ότι στα δίκτυα του πραγματικού κόσμο συναντάμε συχνότερα την κατάσταση του σχήματος 2.5(b) και σπανιότερα την κατάσταση του σχήματος 2.5(a). Μπορούμε να υπολογίσουμε την συχνότητα εμφάνισης της κατάστασης του σχήματος 2.5(b) αν γνωρίζουμε τον συντελεστή συσταδοποίησης C. Τώρα θεωρούμε το σχήμα 2.5(c). Ο κεντρικός κόμβος Α, συνδέεται με μια ακμή με τον κόμβο D, ο οποίος με την σειρά του συνδέεται με μια ακμή με τον κόμβο F.

85 Το ερώτημα εδώ είναι: Πόσα άλλα μονοπάτια μήκους 2 ακμών υπάρχουν τα οποία συνδέουν τους κόμβους Α και F? 68 Αν ο Α έχει k 1 γείτονες, τότε σύμφωνα με τον ορισμό του συντελεστή συσταδοποίησης, ο κόμβος D θα συνδέεται κατά μέσο όρο με C (k 1 1) από αυτούς. Η ακμή που συνδέει τους κόμβους D και Ε, είναι ένα τέτοιου είδους παράδειγμα. Κατά αυτόν τον τρόπο όμως, ο κόμβος D είναι πλέον συνδεδεμένος τόσο με τον κόμβο Ε όσο και με τον κόμβο F και αν ξανακάνουμε χρήση του συντελεστή συσταδοποίησης, η πιθανότητα να συνδέονται μεταξύ τους οι κόμβοι Ε και F (διάστικτη γραμμή) θα είναι ίση με C. Οπότε, κατά μέσο όρο, θα υπάρχουν άλλα C 2 (k 1 1) μονοπάτια μήκους 2 ακμών τα οποία θα οδηγούν στον κόμβο F ή C 2 (k 1 1)+ 1 μονοπάτια συνολικά αν προσμετρήσουμε και αυτό που διαπερνά τον κόμβο D. Αυτός είναι ο μέσος παράγοντας σύμφωνα με τον οποίο θα καταμετρήσουμε περισσότερους δεύτερους γείτονες του Α από όσους υπάρχουν στην πραγματικότητα (over-counting) εξαιτίας του φαινομένου της αμοιβαιότητας. Σύμφωνα πάντοτε με τον Newman (2001d), o διορθωμένος συντελεστής αμοιβαιότητας Μ θα δίνεται από την σχέση: k C 2 (k 1)+1 M = k Με αντικατάσταση στην σχέση που δίνει το z 2 λαμβάνουμε: k C 2 (k 1)+1 z 2 = (1 C)( k 2 k ) k k C 2 (k 1)+1 Στην ουσία, αυτό που κάνει η σχέση M = είναι να υπολογίζει την αμοιβαιότητα σε k ένα δίκτυο στο οποίο εμφανίζονται τρίγωνα συνδεδεμένων κόμβων. Θεωρούμε όμως ότι τα τετράγωνα που δεν σχηματίζονται από προσκείμενα τρίγωνα εμφανίζονται με συχνότητα όχι μεγαλύτερη από αυτή που θα περίμενε κανείς να εμφανίζονται σε ένα καθαρά τυχαίο δίκτυο. Πρόκειται για μια

86 69 προσεγγιστική σχέση η οποία όμως όπως έχει δείξει η πρακτική, δίνει καλά αποτελέσματα. k C 2 (k 1)+1 Ο καθηγητής M. Newman εφάρμοσε την σχέση z 2 = (1 C)( k 2 k ) για τον k υπολογισμό του z 2 στην περίπτωση των δικτύων επιστημονικών συνεργασιών που είδαμε στο σχήμα 2.1(c) και έλαβε αποτελέσματα που είχαν απόκλιση μόλις 10% σε σχέση με τις πραγματικές μετρούμενες τιμές. Αυτού του είδους ο υπολογισμός είναι απλώς ένα πρώτο βήμα, καθώς ιδανικά θα θέλαμε να είμαστε σε θέση να μπορούμε να υπολογίζουμε με ακρίβεια (και όχι κατά προσέγγιση) τους αριθμούς των κόμβων οι οποίοι θα βρίσκονται σε οποιαδήποτε απόσταση (δηλαδή θα απέχουν οσεσδήποτε ακμές) από έναν συγκεκριμένο κόμβο ενώ ταυτόχρονα έχουμε και φαινόμενο συσταδοποίησης στο δίκτυο. Αν μπορούσαμε να κάνουμε τέτοιους ακριβείς υπολογισμούς, τότε θα μπορούσαμε να εξάγουμε και μια συνθήκη η οποία θα προσδιόριζε το σημείο όπου έχουμε μετάβαση φάσης και σχηματισμό γιγαντιαίας συνιστώσας και για την περίπτωση γράφων που παρουσιάζουν φαινόμενο συσταδοποίησης. Επί του παρόντος, δεν γνωρίζουμε αν ένας τέτοιος υπολογισμός είναι εφικτός.

87 2.7 Τυχαίοι γράφοι με συσταδοποίηση Γενίκευση του κλασικού μοντέλου τυχαίου γράφου 70 Σε αυτήν την παράγραφο θα παρουσιάσουμε μια λύση που έχει προταθεί από τον καθηγητή M. Newman (Newman, 2009) για την κατασκευή ενός επιλύσιμου μοντέλου δικτύου το οποίο θα λαμβάνει εξ αρχής υπόψη του (και όχι εκ των υστέρων) το φαινόμενο της συσταδοποίησης. Συγκεκριμένα, θα δείξουμε την μέθοδο σύμφωνα με την οποία μπορούν να γενικευθούν οι κλασικοί τυχαίοι γράφοι προκειμένου να λαμβάνουν υπόψη τους το φαινόμενο της συσταδοποίησης και έτσι να είμαστε σε θέση να μπορούμε να υπολογίσουμε επακριβώς διάφορες ιδιότητες τους όπως για παράδειγμα είναι: τα μεγέθη των μικρών συνιστωσών του δικτύου, το μέγεθος της γιγαντιαίας συνιστώσας (στην περίπτωση που αυτή πράγματι κάνει την εμφάνιση της μέσα στο δίκτυο), το σημείο κατά το οποίο γίνεται η μετάβαση φάσης και κάνει την εμφάνιση της η γιγαντιαία συνιστώσα για πρώτη φορά, καθώς και το σημείο στο οποίο έχουμε μετάβαση φάσης και εμφάνιση του φαινομένου που στην φυσική είναι γνωστό ως διύλιση/φιλτράρισμα (percolation). Είναι γεγονός, ότι τα περισσότερα δίκτυα του πραγματικού κόσμου παρουσιάζουν φαινόμενο συσταδοποίησης. Όπως έχουμε ήδη εξηγήσει, με τον όρο συσταδοποίηση εννοούμε την τάση που παρουσιάζουν δύο γείτονες ενός συγκεκριμένου κόμβου να είναι και μεταξύ τους γείτονες. Όταν συμβαίνει αυτό, έχουμε την δημιουργία ενός τριγώνου συνδεδεμένων κόμβων μέσα στο δίκτυο (A. Rapaport, 1948 ; D.J. Watts & S.H. Strogatz, 1998;M.A. Serrano & M. Boguna, 2006). Αυτό φαίνεται και στο παρακάτω σχήμα: Σχήμα 2.6 Τρίγωνο κόμβων Στο σχήμα αυτό θεωρήσαμε ότι ο υπό εξέταση κόμβος είναι ο κόμβος-0 και ότι οι δύο γείτονες του είναι οι κόμβοι 1 και 2. Αν οι κόμβοι 1 και 2 συνδεθούν μεταξύ τους, τότε έχουμε τον σχηματισμό

88 71 τριγώνου. Για παράδειγμα, σε ένα κοινωνικό δίκτυο το οποίο αναπαριστά φιλίες μεταξύ ανθρώπων, υπάρχει αυξημένη πιθανότητα δύο φίλοι ενός συγκεκριμένου ανθρώπου, να είναι και μεταξύ τους φίλοι. Η μέση τιμή αυτής της πιθανότητας ονομάζεται συντελεστής συσταδοποίησης (clustering coefficient) του δικτύου. Οι μετρούμενες τιμές των συντελεστών συσταδοποίησης για τα κοινωνικά δίκτυα, συνήθως είναι της τάξης του 10% και παρόμοιες τιμές εμφανίζονται και σε πολλά μη κοινωνικά δίκτυα, συμπεριλαμβανομένων των τεχνολογικών και των βιολογικών δικτύων (M.E.J. Newman & J. Park, 2003). Το φαινόμενο της συσταδοποίησης στα δίκτυα, έχει υπάρξει αντικείμενο μελέτης εδώ και πολλά χρόνια. Έχει αποδειχθεί όμως, ότι είναι αρκετά δύσκολο να μοντελοποιηθεί μαθηματικά. Κάποια μοντέλα δικτύων, όπως για παράδειγμα το μοντέλο μικρού κόσμου (small world model) των Watts και Strogatz, λαμβάνουν υπόψη τους το φαινόμενο της συσταδοποίησης και είναι σχεδόν επιλύσιμα, αλλά είναι πολύ εξειδικευμένα με αποτέλεσμα να μην είναι κατάλληλα για την μοντελοποίηση δικτύων του πραγματικού κόσμου (D.J. Watts & S.H. Strogatz, 1998 ; M.E.J. Newman, 2003 ; X. Shi, L. Adamic & M.J. Strauss, 2007). Κάποια πιο γενικά μοντέλα, που στηρίζονται σε εκθετικούς τυχαίους γράφους, μπορεί να φαίνεται ότι θα αποτελούσαν μια καλή λύση αλλά έχουν το πρόβλημα ότι δεν είναι επιλύσιμα ως προς τις περισσότερες από τις ιδιότητες τους. Μέχρι στιγμής, έχουν προταθεί διάφορα υπολογιστικά μοντέλα για την αναπαράσταση δικτύων με συσταδοποίηση, τα οποία είναι πράγματι αρκετά γενικά (δηλαδή, όχι τόσο εξειδικευμένα). Τα περισσότερα εξ αυτών, στηρίζονται σε κάποια διαδικασία τριαδικού κλεισίματος (triadic closure process) κατά την οποία ψάχνουμε σε έναν (αρχικά) μη συσταδοποιημένο γράφο για ζεύγη κόμβων τα οποία έχουν έναν κοινό γείτονα, τα οποία στην συνέχεια τα συνδέουμε και έτσι σχηματίζουμε τρίγωνα (P. Holme & B.J. Kim, 2002 ; K. Klemm & V.M. Eguiluz, 2002 ; M.A. Serrano & M. Boguna, 2005 ; S. Banzal, S. Khandelwal & L.A. Meyers, 2009). Το πρόβλημα σε αυτά τα μοντέλα είναι ότι οι υπολογισμοί των ιδιοτήτων τους μπορούν να γίνουν μόνο με αριθμητικές μεθόδους και όχι αναλυτικά.

89 72 Μια ιδανική προσέγγιση για την μοντελοποίηση δικτύων με συσταδοποίηση, θα ήταν η γενίκευση του κλασικού μοντέλου τυχαίου γράφου, το οποίο προφανώς αποτελεί και την βάση για όλη την μοντέρνα θεωρία δικτύων, έτσι ώστε να προκύψει ένα μοντέλο στο οποίο θα μπορούσαμε να υπολογίσουμε επακριβώς τις ιδιότητες του με αναλυτικό τρόπο. Μια τέτοια προσέγγιση όμως, δεν θα ήταν στην πράξη εφικτή διότι η ικανότητα μας να υπολογίζουμε τις ιδιότητες των τυχαίων γράφων στηρίζεται στο γεγονός ότι παρουσιάζουν σε τοπικό επίπεδο δομή δένδρου (locally tree-like structure), δηλαδή δεν περιέχουν βρόχους. Τα τρίγωνα που εμφανίζονται εντός των δικτύων με συσταδοποίηση, παραβιάζουν αυτήν την συνθήκη, οπότε θα περίμενε κάποιος ότι το να εισάγουμε τέτοιου είδους τρίγωνα σε έναν κλασικό τυχαίο γράφο, θα καθιστούμε το μοντέλο μη επιλύσιμο. Σύμφωνα όμως με τον καθηγητή M. Newman, κάτι τέτοιο δεν ισχύει. Αντιθέτως, αποδεικνύεται ότι είναι πράγματι εφικτή η γενίκευση του κλασικού μοντέλου τυχαίου γράφου προκειμένου να λαμβάνει εξ αρχής υπόψη του το φαινόμενο της συσταδοποίησης και ταυτόχρονα να είναι εφικτή η εξαγωγή αναλυτικών σχέσεων για πολλές από τις ιδιότητες του γενικευμένου μοντέλου. Το προτεινόμενο σε αυτήν την παράγραφο μοντέλο, γενικεύει το κλασικό μοντέλο διαμόρφωσης (configuration model) της επιστήμης των δικτύων, το οποίο είναι ο τυχαίος γράφος με αυθαίρετη κατανομή των βαθμών των κόμβων του, που προκύπτει με την εφαρμογή της μεθόδου Bender- Canfield (M.E.J. Newman, S.H. Strogatz & D.J. Watts, 2001 ; M. Molloy & B. Reed, 1995). Στο κλασικό μοντέλο διαμόρφωσης, αυτό που κάνουμε είναι να προσδιορίζουμε τον αριθμό των ακμών που είναι συνδεδεμένοι σε κάθε κόμβο. Στο γενικευμένο μοντέλο, προσδιορίζουμε τόσο τον αριθμό των ακμών, όσο και τον αριθμό των τριγώνων που είναι συνδεδεμένα σε κάθε κόμβο.

90 73 Αυτό φαίνεται στο επόμενο σχήμα: Σχήμα 2.7 Τρίγωνα εντός δικτύων Για ένα δίκτυο με n κόμβους, ορίζουμε ως t i τον αριθμό (πλήθος) των τριγώνων στα οποία συμμετέχει ο κόμβος i και ως s i τον αριθμό (πλήθος) των μεμονωμένων ακμών (single edges) οι οποίες είναι συνδεδεμένες στον κόμβο i και δεν ανήκουν/δεν συμμετέχουν σε τρίγωνα. Δηλαδή, σε αυτό το γενικευμένο μοντέλο, οι ακμές που συμμετέχουν στον σχηματισμό τριγώνων καταμετρούνται ξεχωριστά από εκείνες τις ακμές που είναι μεμονωμένες (και δεν συμμετέχουν σε τρίγωνα). Μπορούμε επομένως να θεωρούμε μια μεμονωμένη ακμή ως ένα στοιχείο του δικτύου (network element) το οποίο ενώνει δύο κόμβους μεταξύ τους και ένα τρίγωνο ως ένα στοιχείο του δικτύου το οποίο ενώνει τρεις κόμβους μεταξύ τους. Προφανώς, θα μπορούσε να γίνει και περαιτέρω γενίκευση του μοντέλου και να συμπεριληφθούν στοιχεία μεγαλύτερης τάξης (higher order elements) τα οποία θα συνέδεαν τέσσερεις ή και περισσότερους κόμβους μεταξύ τους. Οι τεχνικές που θα έπρεπε να ακολουθήσει κάποιος σε αυτήν την περίπτωση είναι ίδιες με αυτές που θα παρουσιάσουμε για την περίπτωση των τριγώνων. Θεωρούμε λοιπόν ότι το s i μας δίνει τον αριθμό των άκρων (γνωστά και ως stubs, όπως είχαμε αναφέρει και σε άλλη παράγραφο) των μεμονωμένων ακμών οι οποίες εξέρχονται από έναν κόμβο i και ότι το t i μας δίνει τον αριθμό των γωνιών στις οποίες συμμετέχει ο κόμβος i.

91 74 Επομένως, η πλήρης από κοινού ακολουθία των βαθμών των κόμβων (complete joint degree sequence) {s i,t i } μας δίνει: 1. Τον αριθμό των άκρων (stubs) του κόμβου i. Δηλαδή το πλήθος των μεμονωμένων ακμών που εκκινούν από έναν κόμβο i του δικτύου και που δεν συμμετέχουν σε σχηματισμό τριγώνου. 2. Τον αριθμό των γωνιών στις οποίες συμμετέχει ο κόμβος i. Δηλαδή το πλήθος των τριγώνων στα οποία συμμετέχει ο κόμβος i. Τα s i και t i μπορούν να είναι είτε συσχετισμένα (correlated), είτε ασυσχέτιστα (uncorrelated). Παράδειγμα Έστω το δίκτυο του παρακάτω σχήματος το οποίο αποτελείται από n =0,1,2,3,4,5. n=6 κόμβους. Δηλαδή είναι Ο κόμβος-0 έχει s 0 = 1 και t 0 =2, διότι συμμετέχει σε 2 γωνίες (άρα σε 2 τρίγωνα) και έχει άλλη 1 μεμονωμένη ακμή η οποία εξέρχεται από αυτόν και δεν συμμετέχει σε κάποιο τρίγωνο. Συνεπώς, ο βαθμός του κόμβου 0 είναι k = s 0 +2 t 0 =1+2 2=5.

92 75 Με γνωστή επομένως την ακολουθία βαθμών {s i, t i }, μπορούμε να κατασκευάσουμε ένα δίκτυο επιλέγοντας (με ομοιόμορφα τυχαίο τρόπο): 1. Ζεύγη άκρων εξερχομένων ακμών (stubs), τα οποία συνδέουμε μεταξύ τους έτσι ώστε να προκύψουν πλήρεις ακμές. 2. Τριάδες γωνιών, τις οποίες συνδέουμε μεταξύ τους έτσι ώστε να προκύψουν πλήρη τρίγωνα. Το δίκτυο που θα προκύψει από αυτήν την διαδικασία είναι μέλος του συνόλου όλων των δυνατών δικτύων που είναι δυνατόν να σχηματιστούν αν αρχίσουμε να συνδέουμε με τυχαίο τρόπο ζεύγη άκρων εξερχομένων ακμών μεταξύ τους και τριάδες γωνιών μεταξύ τους. Ο μόνος περιορισμός που οφείλει να υπάρξει προκειμένου μετά το τέλος της διαδικασίας να μην απομείνουν αζευγάρωτα άκρα ακμών και απομονωμένες γωνίες, είναι ο συνολικός αριθμός των άκρων των ακμών (stubs) να είναι πολλαπλάσιο του 2 και ο συνολικός αριθμός των γωνιών να είναι πολλαπλάσιο του 3. Ορίζουμε την από κοινού κατανομή των βαθμών των κόμβων (joint degree distribution) p st του δικτύου, ως το υποσύνολο εκείνων των κόμβων οι οποίοι είναι συνδεδεμένοι με s μεμονωμένες ακμές και t τρίγωνα. Ο κλασικός συμβατικός βαθμός ενός τέτοιου κόμβου θα είναι k = s+2 t, αφού κάθε τρίγωνο που συνδέεται σε έναν κόμβο συνεισφέρει κατά 2 στον βαθμό αυτού, ενώ κάθε μεμονωμένη ακμή που συνδέεται σε αυτόν συνεισφέρει κατά 1. Επομένως, η συμβατική κατανομή των βαθμών των κόμβων του δικτύου είναι: p k = p st δ k, s + 2 t s, t =0 Όπου δ ij είναι το γνωστό δέλτα του Kronecker. Υπενθυμίζουμε ότι το δέλτα του Kronecker ορίζεται ως εξής:

93 δ ij ={ 0, i j 1, i = j}, όπου i, j είναι θετικοί ακέραιοι 76 Συνεχίζουμε τους υπολογισμούς κάνοντας χρήση των γεννητριών συναρτήσεων, ακριβώς όπως κάναμε και σε προηγούμενες παραγράφους. Η γεννήτρια συνάρτηση για την από κοινού κατανομή των βαθμών p st είναι μια συνάρτηση δύο μεταβλητών: g p (x, y)= p st x s y t s, t = 0 Επομένως, η γεννήτρια συνάρτηση για την συνολική κατανομή των βαθμών p k θα είναι: f (z)= k= 0 pk z k = k = 0 s, t =0 f (z)= p st z s (z 2 ) t = g p (z, z 2 ) s, t = 0 p st δ k, s +2 t z s +2 t = s, t = 0 p st ( k =0 δ ) z s +2 t k, s + 2 t = p st z s + 2 t s, t = 0 Όπου κάναμε χρήση του γεγονότος ότι δk, s + 2 t = 1, που ισχύει διότι στο διάστημα [ 0, ) θα k =0 υπάρχει μόνο ένα k τέτοιο ώστε k = s+2 t δ k, s+ 2 t =1, ενώ για όλα τα υπόλοιπα k θα είναι k s+2 t δ k, s +2 t = Υπολογισμός του συντελεστή συσταδοποίησης Προκειμένου να υπολογίσουμε τον συντελεστή συσταδοποίησης C του δικτύου, θα κάνουμε χρήση των γεννητριών συναρτήσεων.

94 77 Ο συντελεστής συσταδοποίησης ορίζεται ως (M.E.J. Newman, S.H. Strogatz & D.J. Watts, 2001): 3 (αριθμός τριγώνων εντός του δικτύου) C = (αριθμός τριάδων συνδεδεμένων κόμβων εντός του δικτύου) = 3 N Δ N 3 Λέγοντας τριάδα συνδεδεμένων κόμβων εννοούμε έναν κόμβο ο οποίος συνδέεται μέσω δύο ακμών με δύο άλλους κόμβους. Δηλαδή, η διάταξη αυτή είναι ανοικτή, σε αντίθεση με την διάταξη τριγώνου που είναι κλειστή. Περισσότερες λεπτομέρειες για τον συντελεστή συσταδοποίησης παρέχονται στο παράρτημα Δ. Σχηματικά: Για το παρόν μοντέλο έχουμε: 3 N Δ = n t p st = n( g p s, t y )x= y =1 Όπου t p st = ( g p s, t y )x= y =1 = η μέση τιμή της διακριτής τυχαίας μεταβλητής t Αυτό συμβαίνει διότι στο αριστερό μέλος έχουμε την πρώτη ροπή της διακριτής τυχαίας μεταβλητής t, η οποία ως γνωστόν ισούται με την μέση τιμή της t και στο δεξιό μέλος έχουμε την πρώτη μερική παράγωγο της γεννήτριας συνάρτησης g p (x, y) ως προς y, στην θέση x= y=1, που

95 78 ως γνωστόν και αυτή ισούται με την μέση τιμή της t. Επίσης έχουμε: N 3 = n k ( k 2) p = n 1 k 2 ( 2 f z 2)z = 1 Όπου k ( k 2) p k = 1 2 ( 2 f z 2)z = 1 = η μέση τιμή της διακριτής τυχαίας μεταβλητής ( k 2) Με αντικατάσταση των σχέσεων 3 N Δ = n t p st = n( g p s, t y )x= y =1 και N 3 = n k ( k 2) p = n 1 k 2 ( 2 f z 2)z = 1 στην σχέση C = 3 N Δ N 3, προκύπτει ο ζητούμενος συντελεστής συσταδοποίησης του γενικευμένου μοντέλου τυχαίου γράφου: C = 2( g p y )x= y =1 ( 2 f z 2)z =1 Παρατηρούμε ότι το n απλοποιείται κατά την εν λόγω αντικατάσταση. Αυτό έχει ως αποτέλεσμα να είναι C 0 όταν n, οπότε το δίκτυο εξακολουθεί να εμφανίζει συσταδοποίηση ακόμα και όταν το μέγεθος του τείνει στο άπειρο. Αυτή είναι μια σημαντική διαφορά σε σχέση με το κλασικό (μη γενικευμένο) μοντέλο τυχαίου γράφου για το οποίο είχαμε βρει ότι C 0 όταν n.

96 Κατανομές των πλεοναζόντων βαθμών των κόμβων (excess degree distributions) Μια ακόμα ποσότητα που θα πρέπει να ορίσουμε, καθότι είναι σημαντική για την περαιτέρω ανάλυση που θα ακολουθήσει, είναι η λεγόμενη κατανομή των πλεοναζόντων βαθμών των κόμβων (excess degree distribution) (M.E.J. Newman, S.H. Strogatz & D.J. Watts, 2001). Για το γενικευμένο μοντέλο που εξετάζουμε, διακρίνουμε δύο διαφορετικές κατανομές πλεοναζόντων βαθμών: Την q st = (s+1) p s+1, t s και την r st = (t+1) p s,t +1 t. Όπου s και t είναι αντίστοιχα η μέση τιμή του s και η μέση τιμή του t επί όλων των κόμβων του δικτύου. Με q st συμβολίζουμε την κατανομή του αριθμού (πλήθους) των ακμών και τριγώνων που συνδέονται σε έναν κόμβο στον οποίο καταλήγουμε αν ακολουθήσουμε/διασχίσουμε μια τυχαία επιλεχθείσα ακμή κάπου μέσα στο δίκτυο, μη λαμβάνοντας όμως υπόψη την ακμή αυτή. Με r st συμβολίζουμε την αντίστοιχη ποσότητα για έναν κόμβο στον οποίο καταλήγουμε αν αυτήν την φορά ακολουθήσουμε/διασχίσουμε ένα τυχαία επιλεχθέν τρίγωνο, αντί για μια ακμή όπως κάναμε στην προηγούμενη περίπτωση. Οι γεννήτριες συναρτήσεις για αυτές τις κατανομές θα είναι αντίστοιχα: g q (x, y)= s, t q st x s y t = s, t (s +1) p s +1, t s x s y t = 1 (s+1) p s s +1, t x s y t s, t και g q (x, y)= 1 s s, t s p s, t x s 1 y t = 1 s (t +1) p g r (x, y)= r st x s y t = s, t +1 s, t s, t t g r (x, y)= 1 t p t s, t x s y t 1 = 1 s, t t g p x g p y x s y t = 1 (t +1) p t s, t + 1 x s y t s, t

97 Υπολογισμός του μεγέθους της γιγαντιαίας συνιστώσας Ένα από τα πιο καθοριστικής σημασίας χαρακτηριστικά, οποιουδήποτε δικτύου, είναι η γιγαντιαία συνιστώσα αυτού. Υπενθυμίζουμε ότι με τον όρο γιγαντιαία συνιστώσα εννοούμε εκείνο το τμήμα/μέρος του δικτύου στο οποίο έχουμε ένα σύνολο κόμβων οι οποίοι είναι όλοι συνδεδεμένοι μεταξύ τους, με αποτέλεσμα, ο οποιοσδήποτε κόμβος αυτού του συνόλου να μπορεί να έχει πρόσβαση σε οποιονδήποτε άλλο κόμβο του ιδίου συνόλου μέσω κάποιου μονοπατιού. Για παράδειγμα, σε ένα επικοινωνιακό δίκτυο (communication network), η γιγαντιαία συνιστώσα αντιστοιχεί στο υποσύνολο εκείνων των κόμβων του δικτύου οι οποίοι έχουν την δυνατότητα να επικοινωνούν μεταξύ τους αμφίδρομα (intercommunicate), ενώ οι υπόλοιποι κόμβοι είναι απομονωμένοι σε μικρές συνιστώσες οι οποίες είναι ασύνδετες μεταξύ τους. Μπορούμε να χρησιμοποιήσουμε τις γεννήτριες συναρτήσεις που παρουσιάσαμε στα προηγούμενα, προκειμένου να υπολογίσουμε το μέγεθος της γιγαντιαίας συνιστώσας σε ένα δίκτυο το οποίο παρουσιάζει φαινόμενο συσταδοποίησης. Έστω u η πιθανότητα ένας κόμβος στον οποίο καταλήγουμε διασχίζοντας μια μεμονωμένη ακμή (single edge) να μην είναι μέλος της γιγαντιαίας συνιστώσας και υ η πιθανότητα ένας κόμβος στον οποίο καταλήγουμε διασχίζοντας μια ακμή ενός τριγώνου (triangle) να μην είναι μέλος της γιγαντιαίας συνιστώσας. Συνεπώς, η πιθανότητα ένα τρίγωνο να μην οδηγεί στην γιγαντιαία συνιστώσα μέσω των κόμβων που υπάρχουν στις άλλες δύο γωνίες του θα είναι υ 2. Προκειμένου ένας κόμβος που βρίσκεται στο πέρας μιας μεμονωμένης ακμής να μην είναι μέλος της γιγαντιαίας συνιστώσας, θα πρέπει και όλοι οι άλλοι κόμβοι με τους οποίους συνδέεται (είτε μέσω ακμών, είτε μέσω τριγώνων) να μην είναι μέλη της γιγαντιαίας συνιστώσας. Αν αυτός ο κόμβος συνδέεται με s μεμονωμένες ακμές και t τρίγωνα, τότε αυτό που μόλις περιγράψαμε παραπάνω συμβαίνει με πιθανότητα u s υ 2 t. Οι γενικευμένοι βαθμοί s και t, κατανέμονται σύμφωνα με την κατανομή πλεοναζόντων βαθμών q st.

98 81 Συνεπώς, η μέση τιμή της πιθανότητας u s υ 2 t ως προς την κατανομή q st είναι: u = q st u s υ 2 t = q st u s (υ 2 ) t = g q (u, υ 2 ) s, t s, t Αντιστοίχως, η μέση τιμή της πιθανότητας u s υ 2 t ως προς την κατανομή r st είναι: υ= s, t r st u s υ 2 t = r st u s (υ 2 ) t = g r (u, υ 2 ) s, t Η μέση πιθανότητα ένας τυχαία επιλεχθείς κόμβος να μην ανήκει στην γιγαντιαία συνιστώσα, δηλαδή να μην είναι μέλος αυτής, είναι: s, t p st u s υ 2 t = s, t p st u s (υ 2 ) t = g p (u, υ 2 ) και το αναμενόμενο μέγεθος S περιέχει όλους τους κόμβους του δικτύου) θα είναι: S =1 g p (u, υ 2 ) της γιγαντιαίας συνιστώσας (ως υποσύνολο του συνόλου που Προκειμένου τα όσα αναφέρθηκαν να γίνουν πιο κατανοητά, παραθέτουμε ένα παράδειγμα. Παράδειγμα Θεωρούμε ένα δίκτυο στο οποίο οι βαθμοί των κόμβων ακολουθούν δισδιάστατη κατανομή Poisson (doubly Poisson degree distribution) η οποία δίνεται από την σχέση: μ μs νt p st =e e ν s! t! Όπου οι παράμετροι μ και ν είναι ο μέσος αριθμός (πλήθος) μεμονωμένων ακμών και ο μέσος αριθμός τριγώνων που είναι συνδεδεμένα σε κάθε κόμβο του δικτύου αντίστοιχα. Τότε θα είναι: g p (x, y)= s, t = 0 p st x s y t = s, t = 0 μ μs νt e e ν s! t! x s y t =e μ e ν s, t =0 μ s s! ν t t! xs y t

99 82 g p (x, y)= e μ e ν s= 0 t =0 μ s s! ν t t! xs y t = e μ e ν s =0 μ s x s s! t =0 ν t y t t! g p (x, y)= e μ e ν (μ x) s (ν y) t s= 0 s! t = 0 t! g p (x, y)= e μ (x 1) ν ( y 1) e =e μ e ν e μ x e ν y Όπου έγινε χρήση της σχέσης αθροίσματος j=0 Συνεχίζοντας έχουμε: g q (x, y)= 1 s x j j! =ex g p x = 1 s eν (y 1) e μ ( x 1) μ =e μ( x 1) e ν ( y 1) όπου για την απλοποίηση λάβαμε υπόψη μας το γεγονός ότι μ= s g r (x, y)= 1 t g p y = 1 t eμ(x 1 ) e ν ( y 1) ν= e μ(x 1) ν ( y 1) e όπου για την απλοποίηση λάβαμε υπόψη μας το γεγονός ότι ν = t Επίσης είναι: u= g q (u, υ 2 )= e μ(u 1) e ν (υ2 1) υ= g r (u, υ 2 )= e μ (u 1) e ν (υ2 1) g p (u, υ 2 )= e μ (u 1) e ν (υ2 1) = 1 S Δηλαδή βλέπουμε ότι για την συγκεκριμένη περίπτωση δικτύου ισχύει ότι u =υ=1 S. Άρα μπορούμε να γράψουμε την παρακάτω σχέση για το μέγεθος της γιγαντιαίας συνιστώσας: S =1 g p (u, υ 2 )=1 g p (1 S, (1 S) 2 )=1 e μ (1 S 1) e ν ((1 S)2 1 ) =1 e μs e ν (1 2 S + S2 1) S =1 e μs e ν (S2 2 S) =1 e μs e νs (2 S) [ μs + νs (2 S)] =1 e

100 83 Προφανώς αυτή η εξίσωση είναι υπερβατική (transcendental) ως προς S κλειστή μορφή ( εκτός φυσικά από την τετριμμένη λύση S=0 ). και δεν έχει λύση σε Μπορεί όμως να λυθεί με κάποια αριθμητική επαναληπτική μέθοδο αν ξεκινήσουμε από μία κατάλληλη αρχική τιμή για το S. Στο δεξιό μέρος του επόμενου σχήματος μπορούμε να δούμε πως μεταβάλλεται το μέγεθος της γιγαντιαίας συνιστώσας S συναρτήσει του συντελεστή συσταδοποίησης C για ένα δίκτυο στο οποίο οι βαθμοί των κόμβων ακολουθούν κατανομή με συνάρτηση μάζας πιθανότητας μ μs νt p st =e e ν s! t! z= k =μ+2 ν=2. (δισδιάστατη κατανομή Poisson) και μέσο βαθμό (average degree) Σχήμα 2.8 Μεταβολή του μεγέθους της γιγαντιαίας συνιστώσας συναρτήσει του συντελεστή συσταδοποίησης Όπως μπορούμε να δούμε, το μέγεθος της γιγαντιαίας συνιστώσας ελαττώνεται καθώς αυξάνεται ο συντελεστής συσταδοποίησης. Αυτό συμβαίνει διότι τα τρίγωνα (τα οποία προκαλούν την συσταδοποίηση) περιέχουν πλεονάζουσες (redundant) ακμές οι οποίες δεν συνεισφέρουν στο να συγκρατηθεί συνδεδεμένη η γιγαντιαία

101 84 συνιστώσα. Κατά αυτόν τον τρόπο, σε κάθε τρίγωνο, μία εκ των τριών ακμών είναι πλεονάζουσα. Οπότε, για συγκεκριμένο μέσο βαθμό κόμβων (άρα και για έναν συγκεκριμένο συνολικό αριθμό ακμών) λιγότεροι κόμβοι θα συνδεθούν μεταξύ τους σε ένα δίκτυο το οποίο αποτελείται μόνο από τρίγωνα από ότι σε ένα δίκτυο το οποίο αποτελείται μόνο από μεμονωμένες ακμές Υπολογισμός των μεγεθών των μικρών συνιστωσών του δικτύου Μπορούμε επίσης να υπολογίσουμε και τα μεγέθη των μικρών συνιστωσών (small components) του δικτύου. Λέγοντας μικρές συνιστώσες εννοούμε όλες εκείνες τις άλλες συνιστώσες που δεν επικοινωνούν με την γιγαντιαία συνιστώσα. Έστω h q (z) η γεννήτρια συνάρτηση η οποία παράγει την κατανομή του αριθμού (πλήθους) των κόμβων οι οποίοι είναι προσβάσιμοι (είτε άμεσα, είτε έμμεσα) από έναν κόμβο που βρίσκεται στο πέρας μιας μεμονωμένης ακμής. Την αντίστοιχη γεννήτρια συνάρτηση για την κατανομή του αριθμού των κόμβων στην περίπτωση που διασχίζουμε ένα τρίγωνο θα την συμβολίζουμε ως h r ( z). Σύμφωνα με τους Newman, Strogatz & Watts και την μελέτη που έκαναν το 2001 (M.E.J. Newman, S.H. Strogatz & D.J. Watts, 2001), αποδεικνύεται ότι: h q (z)= z g q (h q (z), h r 2 (z)) και h r (z)= z g r (h q (z), h r 2 (z)) Η πιθανότητα ένας τυχαία επιλεχθείς κόμβος, οπουδήποτε εντός του δικτύου, να ανήκει σε μια συνιστώσα συγκεκριμένου μεγέθους παράγεται από την γεννήτρια συνάρτηση: h p (z)= z g p [h q (z), h r 2 (z)] Όπου οι γεννήτριες συναρτήσεις g q (x, y ), g r (x, y) και g p (x, y) είναι ακριβώς αυτές που ορίσαμε στα προηγούμενα.

102 Με δεδομένα τα παραπάνω, μπορούμε πλέον να υπολογίσουμε το μέσο μέγεθος της συνιστώσας στην οποία ανήκει ένας κόμβος με την βοήθεια της σχέσης: 85 h p ' (1)=1 + g (1,0) p (1,1) h q ' (1)+2 g (0,1) p (1,1) h r ' (1) (m, n) Όπου ο συμβολισμός g p σημαίνει ότι η συνάρτηση g p (x, y) έχει υποστεί μερική παραγώγιση m φορές ως προς το πρώτο της όρισμα και n φορές ως προς το δεύτερο της όρισμα. Υπενθυμίζουμε ότι η πρώτη παράγωγος μιας γεννήτριας συνάρτησης, για τιμή ορίσματος ίση με την μονάδα, μας δίνει την μέση τιμή της κατανομής που παράγει. Οι τιμές h q ' (1) και h r ' (1) υπολογίζονται από τις σχέσεις h q (z)= z g q (h q (z), h r 2 (z)) και h r (z)= z g r (h q (z), h r 2 (z)) αν πρώτα τις παραγωγίσουμε, μετά θέσουμε x= y =1 και επίσης κάνουμε χρήση των σχέσεων g q (x, y)= 1 s g p x και g r (x, y)= 1 t g p y Οπότε τελικά λαμβάνουμε: h q ' (1)=1+ 1 s H xx h q ' (1)+ 2 s H xy h r ' (1) h r ' (1)=1+ 1 t H yx h q ' (1)+ 2 t H yy h r ' (1) Όπου τα H xx, H xy, H yx και H yy είναι στοιχεία του Hessian πίνακα H (τους πίνακες θα τους συμβολίζουμε με παχιά γράμματα) και αναφέρονται στις δεύτερες παραγώγους της γεννήτριας συνάρτησης g p (x, y) τις οποίες αποτιμούμε για x= y=1.

103 86 Δηλαδή είναι: H xx = g (2,0) p (1,1) H xy = g (1,1) p (1,1) H yx = g (1,1) p (1,1) H yy = g (0,2) p (1,1) και H = [ H xx H yx H xy H yy] Για λόγους πληρότητας υπενθυμίζουμε και τον επίσημο ορισμό ενός Hessian πίνακα: Ο Hessian πίνακας είναι ένας τετραγωνικός πίνακας που έχει ως στοιχεία τις μερικές παραγώγους δευτέρας τάξεως μιας βαθμωτής συνάρτησης n μεταβλητών. Πιο αυστηρά: Αν f : R n R είναι μια συνάρτηση η οποία απεικονίζει τα διανύσματα x R n στις τιμές f ( x) R και υπάρχουν όλες οι μερικές παράγωγοι δευτέρας τάξεως της f και μάλιστα είναι συνεχείς στο πεδίο ορισμού της, τότε ο Hessian πίνακας της f είναι ένας τετραγωνικός n n πίνακας της μορφής: [ 2 f 2 x 1 2 f H = x 2 x 1 2 f x n x 1 2 f x 1 x 2 2 f x f x n x 2 2 f x 1 x n ] 2 f x 2 x n 2 f 2 x n

104 87 Οι εξισώσεις: h q ' (1)=1+ 1 s H xx h q ' (1)+ 2 s H xy h r ' (1) h r ' (1)=1+ 1 t H yx h q ' (1)+ 2 t H yy h r ' (1) μπορούν να γραφούν και σε μορφή πινάκων ως εξής: h=1+α -1 Ηβh Όπου h = [ h ' q h r ' (1)], 1 = [ 1 1], α = [ s 0 0 t ] και β = [ ] Με αναδιάταξη, η παραπάνω σχέση μεταξύ των πινάκων γράφεται: (Ι-α -1 Ηβ)h= 1 Όπου Ι είναι μοναδιαίος πίνακας 2 2. Αν ο πίνακας Ι-α -1 Ηβ είναι αντιστρέψιμος, δηλαδή αν det(ι-α -1 Ηβ) 0, τότε η τελευταία σχέση μπορεί να λυθεί ως προς h. Με προσδιορισμένο το h, γνωρίζουμε πλέον τις τιμές h q ' (1) και h r ' (1), οπότε αν τις αντικαταστήσουμε στην σχέση h p ' (1)=1 + g (1,0) p (1,1) h q ' (1)+2 g (0,1) p (1,1) h r ' (1) μπορούμε να υπολογίσουμε το μέσο μέγεθος της μη γιγαντιαίας (μικρής) συνιστώσας.

105 88 Το μέσο μέγεθος της μη γιγαντιαίας συνιστώσας θα αποκλίνει (δηλαδή θα απειρίζεται) όταν: det(ι-α -1 Ηβ) = 0. Αν για αυτή την περίπτωση υπολογίσουμε τις μερικές παραγώγους (δηλαδή τα στοιχεία του Hessian πίνακα): H xx = g (2,0) p (1,1) H xy = g (1,1) p (1,1) H yx = g (1,1) p (1,1) H yy = g (0,2) p (1,1) τότε καταλήγουμε στην παρακάτω συνθήκη η οποία προσδιορίζει το σημείο στο οποίο κάνει την εμφάνιση της η γιγαντιαία συνιστώσα: [ s2 s ][ 2 2 t2 t ] 3 st 2 =2 s t Στην περίπτωση που δεν υπάρχουν τρίγωνα στο δίκτυο ( t = 0 ) η τελευταία σχέση μεταπίπτει στην: s 2 s 2=0 που είναι η σχέση στην οποία είχαν καταλήξει οι Molloy και Reed (M. Molloy & B. Reed, 1995), η οποία προσδιορίζει το σημείο στο οποίο γίνεται μετάβαση φάσης σε έναν κλασικό (μη γενικευμένο) τυχαίο γράφο.

106 89 3 ο Κεφάλαιο Άλλα μοντέλα τυχαίων γράφων

107 Πρόλογος κεφαλαίου Στο κεφάλαιο 2 έγινε εκτενής παρουσίαση και μελέτη του μοντέλου Erdos-Renyi, όπου αναδείχθηκαν οι βασικές διαφορές που παρουσιάζει σε σχέση με τα δίκτυα του πραγματικού κόσμου, καθώς και οι όποιες διορθώσεις και γενικεύσεις μπορούν να γίνουν σε αυτό προκειμένου να γίνει πιο ρεαλιστικό ως μοντέλο. Τα λογικά ερωτήματα που θα μπορούσε να θέσει κάποιος σε αυτό το σημείο είναι: Υπάρχουν και άλλα μοντέλα τυχαίων γράφων εκτός του μοντέλου Erdos-Renyi? Αυτά τα άλλα μοντέλα είναι καταλληλότερα για την αναπαράσταση δικτύων του πραγματικού κόσμου? Σε αυτά τα ερωτήματα θα προσπαθήσουμε να απαντήσουμε στην συνέχεια αυτού του κεφαλαίου. 3.2 Το μοντέλο Watts-Strogatz Το μοντέλο Watts-Strogatz είναι ένα μοντέλο σχηματισμού τυχαίων γράφων οι οποίοι εμφανίζουν ιδιότητες μικρού κόσμου. Το φαινόμενο του μικρού κόσμου παρουσιάστηκε αναλυτικά στο πρώτο κεφάλαιο της παρούσας εργασίας. Συνοπτικά, θα μπορούσαμε να πούμε ότι οι παραγόμενοι γράφοι περιέχουν (εντός τους) μονοπάτια μικρού μήκους, ενώ παράλληλα εμφανίζουν υψηλή συσταδοποίηση. Το συγκεκριμένο μοντέλο προτάθηκε από τους Watts και Strogatz το 1998 σε μια δημοσίευση που έκαναν από κοινού (Duncan J. Watts & Steven Strogatz, 1998) στο περιοδικό Nature και είναι επίσης γνωστό και ως μοντέλο βήτα (beta model) εξαιτίας της παραμέτρου β που χρησιμοποιεί ο αλγόριθμος του. Η παράμετρος β, μαζί με τον πλήρη αλγόριθμό, θα οριστούν σε επόμενη υποπαράγραφο Λογική του μοντέλου Watts-Strogatz Όπως έχουμε δει, το κλασικό μοντέλο Erdos-Renyi παρουσιάζει δύο βασικές διαφορές σε σχέση με τα δίκτυα του πραγματικού κόσμου:

108 91 (1) Δεν λαμβάνει υπόψη του το φαινόμενο της συσταδοποίησης και της δημιουργίας κλειστών τριαδικών σχηματισμών (triadic closures), δηλαδή τον σχηματισμό τριγώνων. Για την ακρίβεια, παρουσιάζει έναν πολύ μικρό συντελεστή συσταδοποίησης ο οποίος τείνει στο μηδέν καθώς το μέγεθος του δικτύου μεγαλώνει. (2) Οι βαθμοί των κόμβων ακολουθούν κατανομή Poisson και όχι νόμο δυνάμεως (power law), όπως οι βαθμοί των κόμβων των δικτύων του πραγματικού κόσμου. Το μοντέλο Watts-Strogatz επινοήθηκε προκειμένου να δώσει μια λύση στο πρώτο από τα δύο αυτά προβλήματα. Δηλαδή, λαμβάνει υπόψη του το φαινόμενο της συσταδοποίησης, διατηρώντας ταυτόχρονα τα μικρού μήκους μονοπάτια του μοντέλου Erdos-Renyi. Αυτό το επιτυγχάνει κάνοντας παρεμβολή (interpolation) μεταξύ ενός τυχαίου γράφου Erdos-Renyi και ενός κανονικού δακτυλιοειδούς πλέγματος (regular ring lattice). Στο σημείο αυτό κρίνεται σκόπιμο να πούμε τι είναι γενικά ένα πλέγμα σημείων (point lattice ή απλά lattice) αλλά και τι είναι συγκεκριμένα ένα κανονικό δακτυλιοειδές πλέγμα (regular ring lattice). Ένα πλέγμα σημείων είναι μια περιοχή (array) που περιέχει σημεία τα οποία ισαπέχουν μεταξύ τους (regularly spaced). Αυτό φαίνεται στο παρακάτω σχήμα. Σχήμα 3.1 Πλέγμα σημείων Δίνοντας έναν πιο επίσημο ορισμό:

109 92 Ένα πλέγμα σημείων είναι ένα διακριτό υποσύνολο του Ευκλείδειου χώρου το οποίο περιέχει την αρχή (origin). Ένα πλέγμα σημείων είναι κλειστό ως προς τις πράξεις της πρόσθεσης και της αντιστροφής, και κάθε σημείο έχει μια γειτονική περιοχή (neighborhood) εντός της οποίας είναι το μόνο σημείο που ανήκει στο πλέγμα. Παραδείγματα πλεγμάτων σημείων είναι το Z R και το Z 2 R 2. Δηλαδή, στην πρώτη περίπτωση το Z είναι διακριτό υποσύνολο του R, ενώ στην δεύτερη περίπτωση το Z 2 είναι διακριτό υποσύνολο του R 2. Ένα πλέγμα σημείων στον χώρο R n είναι ένα υποσύνολο {α 1 ν 1 +α 2 ν α n ν n }, όπου οι συντελεστές α i είναι ακέραιοι αριθμοί και τα ν i είναι γραμμικά ανεξάρτητα διανύσματα. Ένα δακτυλιοειδές πλέγμα (ring lattice) είναι ένας γράφος ο οποίος προκύπτει αν πάρουμε έναν κύκλο (cycle) ο οποίος σχηματίζεται από συνδεδεμένους μεταξύ τους κόμβους και στην συνέχεια συνδέσουμε τον κάθε έναν από αυτούς τους κόμβους με τους δεύτερους γείτονες αυτού (δηλαδή με τους κόμβους που απέχουν απόσταση 2 ακμών από αυτόν). Σε αυτήν την περίπτωση λέμε ότι προκύπτει ένας 4- κανονικός γράφος (4-regular graph). Ένα τέτοιο δακτυλιοειδές πλέγμα (4-κανονικός γράφος σε έναν κύκλο που περιέχει φαίνεται στο επόμενο σχήμα: n =12 κόμβους) Σχήμα κανονικός γράφος σε μορφή δακτυλιοειδούς πλέγματος

110 93 Ο παραπάνω ορισμός μπορεί να γενικευθεί και για άρτιους ακέραιους αριθμούς μεγαλύτερους του 4. Για παράδειγμα, συνδέοντας κάθε κόμβο με εκείνους τους γείτονες του που απέχουν απόσταση 3 ακμών από αυτόν, θα προκύψει ένας 6-κανονικός γράφος. Αυτήν την περίπτωση την δείχνουμε στο επόμενο σχήμα όπου απεικονίζεται ένας 6-κανονικός γράφος σε έναν κύκλο που περιέχει 12 κόμβους. Σχήμα κανονικός γράφος σε μορφή δακτυλιοειδούς πλέγματος Αλγόριθμος του μοντέλου Watts-Strogatz Έχοντας ως δεδομένα: 1. Τον επιθυμητό αριθμό κόμβων N. 2. Τον μέσο βαθμό K, ο οποίος θα πρέπει να είναι θετικός, άρτιος, ακέραιος αριθμός. 3. Την παράμετρο β, όπου 0 β 1 (στην πραγματικότητα πρόκειται για πιθανότητα). και εφόσον ισχύει η συνθήκη N K ln ( N ) 1 (αραιό αλλά πάντα συνεκτικό δίκτυο), δημιουργούμε έναν μη προσανατολισμένο γράφο με N κόμβους και NK 2 ακμές

111 94 πραγματοποιώντας τα παρακάτω βήματα: 1ο βήμα: Κατασκευάζουμε ένα κανονικό δακτυλιοειδές πλέγμα. Αυτό σημαίνει ότι κατασκευάζουμε έναν γράφο ο οποίος θα περιλαμβάνει N κόμβους, έτσι ώστε ο κάθε ένας από αυτούς να συνδέεται με K γειτονικούς κόμβους και συγκεκριμένα με K 2 γείτονες σε κάθε πλευρά του (δηλαδή με K 2 γειτονικούς κόμβους προς τα δεξιά του και K 2 γειτονικούς κόμβους προς τα αριστερά του). Επομένως, αν ονομάσουμε τους N κόμβους του γράφου ως n 0, n 1, n 2,, n N 1, τότε μια ακμή (n i, n j ) θα εμφανίζεται όταν και μόνο όταν ισχύει ότι 0 i j mod (N 1 K 2 ) K 2. 2ο βήμα: Για κάθε κόμβο n i ( όπου i=0,1,2,, N 1 ) λαμβάνουμε κάθε ακμή (n i, n j ) για την οποία είναι i< j και την επανασυνδέουμε (rewire) με πιθανότητα β. Η επανασύνδεση (rewiring) γίνεται αντικαθιστώντας μια ήδη υπάρχουσα ακμή (n i, n j ) με μια άλλη ακμή (n i, n k ), όπου ο κόμβος k επιλέγεται τυχαία και μάλιστα με ομοιόμορφο τρόπο μέσα από το σύνολο των υπολοίπων κόμβων του γράφου κατά τέτοιο τρόπο ώστε: (α) Να μην σχηματιστεί αυτοβρόχος, δηλαδή θα πρέπει να είναι k i. (β) Να μην σχηματιστεί ακμή η οποία ήδη υπάρχει (link duplication), δηλαδή να μην σχηματιστεί ακμή (n i, n k ' ) τέτοια ώστε k ' =k την τρέχουσα στιγμή που εξελίσσεται ο αλγόριθμος. Στο σχήμα 3.4, μπορούμε να δούμε έναν τυχαίο γράφο ο οποίος δημιουργήθηκε με τον αλγόριθμο Watts-Strogatz, μαζί με τις αντίστοιχες τιμές των παραμέτρων N, K και β.

112 95 Σχήμα 3.4 Σχηματισμός δικτύου σύμφωνα με το μοντέλο Watts-Strogatz Προκειμένου να γίνει ακόμα πιο κατανοητός ο συγκεκριμένος αλγόριθμος, παραθέτουμε την περιγραφή του έτσι όπως ακριβώς δόθηκε από τους ίδιους τους δημιουργούς του, στο σχήμα 3.5. Το μόνο που θα πρέπει να σημειώσουμε είναι ότι στο σχήμα 3.5 αντί για β χρησιμοποιείται το p ως σύμβολο της παραμέτρου του αλγορίθμου.

113 96 Σχήμα 3.5 Αλγόριθμος Watts-Strogatz Ιδιότητες του μοντέλου Watts-Strogatz Η δομή δακτυλιοειδούς πλέγματος μέσα στο μοντέλο συμβάλλει στην εμφάνιση του φαινομένου συσταδοποίησης σε τοπικό επίπεδο στον γράφο, ενώ οι σχηματιζόμενοι τυχαίοι σύνδεσμοι ελαττώνουν σημαντικά το μήκος των μονοπατιών. Ο αλγόριθμος μπορεί να εισάγει στον γράφο μέχρι β NK 2 τυχαίες ακμές οι οποίες δεν θα ανήκουν στο δακτυλιοειδές πλέγμα. Μεταβάλλοντας το β, μπορούμε να κάνουμε παρεμβολή μεταξύ ενός κανονικού δακτυλιοειδούς πλέγματος ( που αντιστοιχεί στην τιμή β = 0 ) και ενός τυχαίου γράφου ( που αντιστοιχεί στην τιμή β = 1 ), προσεγγίζοντας με αυτόν τον τρόπο το μοντέλο G n, p των Erdos και Renyi με n = N και p= NK 2 ( N 2 ). Οι τρεις ιδιότητες στις οποίες θα αναφερθούμε είναι: το μέσο μήκος μονοπατιού, ο συντελεστής συσταδοποίησης και η κατανομή των βαθμών των κόμβων (Albert & Barabasi, 2002).

114 Μέσο μήκος μονοπατιού Για ένα δακτυλιοειδές πλέγμα ( β = 0 ), το μέσο μήκος μονοπατιού είναι l (β =0)=l (0)= N 2 K μέγεθος N του δικτύου. 1 και όπως μπορούμε να δούμε μεταβάλλεται γραμμικά με το συνολικό Στο όριο όπου β 1, ο γράφος συγκλίνει προς τον κλασικό τυχαίο γράφο των Erdos και Renyi με l (β =1)= l (1)= ln (N ) ln (K ). Στην περιοχή 0< β<1 το μέσο μήκος μονοπατιού ελαττώνεται με πολύ γρήγορο ρυθμό καθώς το β αυξάνεται και σταδιακά προσεγγίζει την οριακή του τιμή Συντελεστής συσταδοποίησης Για το δακτυλιοειδές πλέγμα ( β = 0 ), ο συντελεστής συσταδοποίησης C δίνεται από την σχέση C (β =0)= C (0)= 3 (K 2) 4 (K 1) και τείνει προς τον αριθμό βλέπουμε είναι ανεξάρτητος από το μέγεθος N του δικτύου. 3 4 καθώς το K μεγαλώνει και όπως Πράγματι είναι Στο όριο όπου 3 (K 2) lim C (0)= lim K K 4 (K 1) = 3 4. β 1, ο συντελεστής συσταδοποίησης λαμβάνει την τιμή που έχει στους κλασικούς τυχαίους γράφους, δηλαδή γίνεται C (β =1)=C (1)= K N και όπως μπορούμε να δούμε είναι αντιστρόφως ανάλογος του μεγέθους N του δικτύου. Στην ενδιάμεση περιοχή 0< β<1, ο συντελεστής συσταδοποίησης παραμένει κοντά στην τιμή που αντιστοιχεί στην περίπτωση του κανονικού δακτυλιοειδούς πλέγματος και ελαττώνεται μόνο όταν η παράμετρος β λαμβάνει μεγάλες τιμές. Αυτό έχει ως αποτέλεσμα, να έχουμε μια περιοχή όπου το μέσο μήκος μονοπατιού ελαττώνεται πολύ γρήγορα ενώ ο συντελεστής συσταδοποίησης δεν ελαττώνεται με αντίστοιχο γρήγορο ρυθμό. Σε αυτό ακριβώς οφείλεται το φαινόμενο μικρού κόσμου.

115 Κατανομή των βαθμών των κόμβων Για την περίπτωση του δακτυλιοειδούς πλέγματος ( β = 0 ), η κατανομή των βαθμών των κόμβων είναι μια κρουστική συνάρτηση Dirac (γνωστή και ως συνάρτηση δέλτα ) η οποία είναι εντοπισμένη στην τιμή k = K. Δηλαδή είναι p k = δ (k K). Σε αυτό το σημείο θα υπενθυμίσουμε τον ορισμό της κρουστικής συνάρτησης Dirac, η οποία συμβολίζεται ως δ (x) και είναι μια γενικευμένη συνάρτηση: δ (x) = { +, x = 0 0, x 0} Η γραφική της παράσταση έχει την παρακάτω μορφή: Η συνάρτηση Dirac ορίζεται από το εξής ολοκλήρωμα: 0 ' +' δ (x) dx= 1 0 ' '

116 99 Στην πραγματικότητα, αυτό που μας λέει η τελευταία σχέση είναι ότι το γράφημα της συνάρτησης Dirac είναι ένας ορθογώνιος παλμός με πολύ μικρό εύρος και πολύ μεγάλο πλάτος, τέτοια ώστε το εμβαδό αυτού του ορθογώνιου παλμού να ισούται πάντοτε με την μονάδα. Μια μετατοπισμένη ( ως προς το όρισμα x ) μοναδιαία κρουστική συνάρτηση Dirac έχει την μορφή: δ (x K ) = { +, x = K 0, x K}, K >0 και γράφημα: Προφανώς αν στο τελευταίο σχήμα θεωρήσουμε ως ανεξάρτητη μεταβλητή τον βαθμό κόμβου ( δηλαδή x= k ) και ως εξαρτημένη μεταβλητή την κατανομή των βαθμών των κόμβων p k ( k δηλαδή p k =δ(k K ) ), τότε θα προκύψει το γράφημα της κατανομής των βαθμών των κόμβων για

117 100 την περίπτωση του δακτυλιοειδούς πλέγματος. Στο όριο όπου β 1, οι βαθμοί των κόμβων ακολουθούν κατανομή Poisson. Ακριβώς δηλαδή όπως και στο κλασικό μοντέλο τυχαίου γράφου των Erdos και Renyi. Στο διάστημα 0< β<1 οι βαθμοί των κόμβων ακολουθούν κατανομή της οποίας η συνάρτηση μάζας πιθανότητας δίνεται από την σχέση (A. Barrat & M. Weigt, 2000): f (k, K ) K p k = (β K K C n K (1 β) n 2 β n 2 )k 2 n β K 2 n = 0 2 (k K e 2 n)! όπου (1) k είναι ο αριθμός των ακμών που είναι συνδεδεμένες σε έναν κόμβο του δικτύου n =( (2) C K 2 n K 2 ) = n! ( K 2 )! (n K 2 )! (3) k K 2 (4) f (k, K )= min (k K 2, K 2 ) Η γραφική παράσταση αυτής της κατανομής μοιάζει με την γραφική παράσταση της κατανομής Poisson που εμφανίζουν οι κλασικοί τυχαίοι γράφοι και παρουσιάζει μια κορυφή στο σημείο k = K, ενώ φθίνει εκθετικά για μεγάλες τιμές της ποσότητας k K Περιορισμοί του μοντέλου Watts-Strogatz Ο σημαντικότερος περιορισμός του μοντέλου Watts-Strogatz είναι η μη ρεαλιστική κατανομή των βαθμών των κόμβων που παρουσιάζει σε σχέση με τα δίκτυα του πραγματικού κόσμου. Επίσης, το

118 101 συγκεκριμένο μοντέλο δουλεύει με έναν προκαθορισμένο (fixed) αριθμό κόμβων, με συνέπεια να μην μπορεί να χρησιμοποιηθεί ως μοντέλο για την μελέτη του τρόπου με τον οποίο μεγαλώνει το μέγεθος ενός δικτύου καθώς προστίθενται σε αυτό σταδιακά νέοι κόμβοι Κοινωνιολογικές προεκτάσεις του μοντέλου Watts-Strogatz Σε επίπεδο κοινωνικού δικτύου, αυτό που προσφέρει το μοντέλο Watts-Strogatz ως εργαλείο μελέτης συμπεριφορών είναι ότι έχει την δυνατότητα να περνάει από την απόλυτη τάξη ( β = 0 ) στο εντελώς τυχαίο γράφημα σχέσεων μεταξύ των συμμετεχόντων ( β = 1 ). Στο σχήμα 3.6 απεικονίζεται αυτό ακριβώς το γεγονός. Σημειώνουμε, ότι και πάλι έχει χρησιμοποιηθεί εναλλακτικά το σύμβολο p αντί του β για την αναπαράσταση της παραμέτρου του μοντέλου. Επίσης, το φαινόμενο μικρού κόσμου που παρουσιάζει το εν λόγω μοντέλο, σε επίπεδο κοινωνικού δικτύου σημαίνει ότι εντελώς άγνωστοι μεταξύ τους άνθρωποι, οι οποίοι είναι μέλη μιας κοινότητας, συνδέονται μεταξύ τους με έναν μικρό αριθμό άλλων ανθρώπων (στην καθομιλουμένη θα μπορούσαμε να πούμε μέσω τρίτων ) οι οποίοι σχετίζονται με κάποιο τρόπο. Όταν λοιπόν έχουμε εμφάνιση του φαινομένου μικρού κόσμου, αυτή η αλυσίδα γνωστών που συνδέει τα δύο άγνωστα μεταξύ τους μέλη της κοινότητας θα έχει πάντοτε μικρό μήκος. Σχήμα 3.6 Επίπτωση της μεταβολής της παραμέτρου p στην μορφή ενός δικτύου Watts-Strogatz

119 Το μοντέλο Barabasi-Albert Το μοντέλο Barabasi-Albert είναι ένας αλγόριθμος ο οποίος παράγει τυχαίους γράφους οι οποίοι είναι ελεύθεροι κλίμακας (scale-free) χρησιμοποιώντας έναν μηχανισμό προτιμησιακής σύνδεσης (preferential attachment). Τα ελεύθερα κλίμακας δίκτυα είναι και αυτά που συναντάμε στις περιπτώσεις των δικτύων του πραγματικού κόσμου. Ο αλγόριθμος έλαβε το όνομα του από τους A. L. Barabasi και R. Albert που τον επινόησαν και τον δημοσίευσαν το 1999 ( A.L. Barabasi & R. Albert, 1999) Λογική του μοντέλου Barabasi-Albert Όπως έχουμε δει και σε προηγούμενα κεφάλαια, τα δίκτυα του πραγματικού κόσμου είναι συνήθως ελεύθερα κλίμακας. Με τον όρο ελεύθερα κλίμακας εννοούμε ότι σε αυτά τα δίκτυα οι βαθμοί των κόμβων ακολουθούν κατανομή νόμου δυνάμεως (power law). Κάτι τέτοιο όμως, δεν το συναντάμε στους τυχαίους γράφους που παράγονται από τα μοντέλα Erdos-Renyi και Watts-Strogatz. Για αυτόν ακριβώς τον λόγο είχαμε χαρακτηρίσει αυτά τα μοντέλα ως μη ρεαλιστικά. Το μοντέλο Barabasi-Albert λαμβάνει υπόψη του δύο βασικές ιδέες που το καθιστούν ρεαλιστικό: 1. Την ανάπτυξη (growth). 2. Την προτιμησιακή σύνδεση (preferential attachment). Τόσο η ανάπτυξη, όσο και η προτιμησιακή σύνδεση είναι φαινόμενα που συναντάμε στα δίκτυα του πραγματικού κόσμου. Με τον όρο ανάπτυξη εννοούμε ότι ο αριθμός των κόμβων του δικτύου αυξάνεται με την πάροδο του χρόνου. Με τον όρο προτιμησιακή σύνδεση εννοούμε ότι όσο περισσότερες συνδέσεις έχει ήδη ένας κόμβος, τόσο πιθανότερο είναι να αποκτήσει και νέες συνδέσεις. Δηλαδή, οι κόμβοι που έχουν μεγαλύτερους βαθμούς έχουν μεγαλύτερη πιθανότητα να συνδεθούν με νέους συνδέσμους/ακμές οι οποίες προστίθενται στο δίκτυο. Η προτιμησιακή σύνδεση είναι ένα παράδειγμα θετικής ανάδρασης (positive feedback) κατά την οποία μια αρχική τυχαία απόκλιση (στην δική μας περίπτωση εννοούμε την διαφορά μεταξύ του πλήθους των

120 103 συνδέσεων που έχουν οι κόμβοι του δικτύου) ενισχύεται με αυτόματο τρόπο, με αποτέλεσμα να μεγαλώνει συνεχώς. Θα μπορούσαμε δηλαδή με απλά λόγια να πούμε ότι διαρκώς ο πλούσιος θα γίνεται πλουσιότερος Κοινωνιολογικές προεκτάσεις του μοντέλου Barabasi-Albert Σε επίπεδο κοινωνικού δικτύου, στο οποίο έχουμε την δημιουργία σχέσεων μεταξύ ανθρώπων, ένας δεσμός (μια ακμή) ο οποίος ξεκινάει από ένα άτομο Α και καταλήγει σε ένα άτομο Β σημαίνει ότι ο Α γνωρίζει τον Β. Οι κόμβοι με πολύ υψηλούς βαθμούς αντιπροσωπεύουν άτομα τα οποία είναι πολύ δημοφιλή και έχουν πολλούς γνωστούς. Συνεπώς, αν εισέλθει στην κοινότητα ένα καινούργιο άτομο (δηλαδή όταν πάει να συνδεθεί ένας νέος κόμβος στο μέχρι εκείνη την στιγμή σχηματισμένο δίκτυο) είναι πολύ πιθανότερο να γνωρίσει κάποιο από αυτά τα δημοφιλή άτομα και να αναπτύξει σχέσεις μαζί τους από ότι να γνωρίσει κάποιον ο οποίος έχει ελάχιστους γνωστούς Αλγόριθμος του μοντέλου Barabasi-Albert Αρχικά ξεκινάμε με m 0 κόμβους οι οποίοι είναι συνδεδεμένοι μεταξύ τους με εντελώς τυχαίο τρόπο. Το μόνο που πρέπει να προσέξουμε σε αυτό το αρχικό στάδιο, είναι να έχει ο κάθε κόμβος τουλάχιστον έναν σύνδεσμο. Το δίκτυο αναπτύσσεται πραγματοποιώντας τα επόμενα δύο βήματα: Βήμα 1 (ανάπτυξη): Κάθε φορά προσθέτουμε και από έναν νέο κόμβο ο οποίος θα έχει m ακμές ( όπου m m 0 ) οι οποίες θα συνδέσουν αυτόν τον νέο κόμβο με m κόμβους οι οποίοι υπάρχουν ήδη στο δίκτυο. Βήμα 2 (προτιμησιακή σύνδεση): Η πιθανότητα p i μια από τις ακμές του νέου κόμβου να συνδεθεί στον κόμβο i που ήδη υπάρχει στο δίκτυο εξαρτάται από τον βαθμό k i αυτού και δίνεται από την σχέση p i = k i k j j Όπου η άθροιση στον παρανομαστή γίνεται για όλους τους κόμβους j που υπάρχουν ήδη στο δίκτυο

121 104 την στιγμή που προστίθεται ο νέος κόμβος. Προκειμένου να γίνει πιο κατανοητός ο συγκεκριμένος αλγόριθμος, παραθέτουμε το επόμενο σχήμα στο οποίο αρχικά έχουμε m 0 = 2 συνδεδεμένους μεταξύ τους κόμβους και προσθέτουμε σε κάθε βήμα και από έναν νέο κόμβο. Ο κόμβος που προστίθεται σε κάθε βήμα είναι ο λευκός και για λόγους απλότητας έχουμε θεωρήσει ότι συνδέεται πάντοτε μέσω m= 2 ακμών με το ως εκείνη την στιγμή ήδη σχηματισμένο δίκτυο. Προφανώς το m στην γενική περίπτωση μπορεί να λάβει την οποιαδήποτε θετική ακέραιη τιμή, αρκεί να ικανοποιείται η σχέση m m 0. Οι μαύροι κόμβοι είναι οι συνδεδεμένοι μεταξύ τους κόμβοι οι οποίοι αποτελούν το ως εκείνη την χρονική στιγμή σχηματισμένο δίκτυο. Σχήμα 3.7 Σχηματισμός δικτύου σύμφωνα με το μοντέλο Barabasi-Albert

122 Ιδιότητες του μοντέλου Barabasi-Albert Κατανομή των βαθμών των κόμβων Στο μοντέλο Barabasi-Albert οι βαθμοί των κόμβων ακολουθούν νόμο δυνάμεως ο οποίος είναι της μορφής (Albert & Barabasi, 2002): p k k Μέσο μήκος μονοπατιού Στο μοντέλο Barabasi-Albert το μέσο μήκος μονοπατιού l αυξάνεται λογαριθμικά με το μέγεθος N του δικτύου και συγκεκριμένα είναι (A. Fronczak, P. Fronczak & J. Holyst, 2004): l ln (N ) ln (ln (N )) Το μέσο μήκος μονοπατιού στο μοντέλο Barabasi-Albert είναι πάντοτε μικρότερο σε σχέση με το αντίστοιχο μήκος στο κλασικό μοντέλο τυχαίου γράφου των Erdos-Renyi.

123 Συντελεστής συσταδοποίησης Στο μοντέλο Barabasi-Albert ο συντελεστής συσταδοποίησης C μεταβάλλεται με το μέγεθος N του δικτύου σύμφωνα με νόμο δυνάμεως (Albert & Barabasi, 2002): C N 0.75 Η πρακτική έχει δείξει ότι ο συντελεστής συσταδοποίησης του μοντέλου Barabasi-Albert είναι σημαντικά μεγαλύτερος σε σχέση με τον συντελεστή συσταδοποίησης του μοντέλου Erdos-Renyi.

124 107 4 ο Κεφάλαιο Μελέτη περίπτωσης : Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου Πανεπιστημίου

125 Πρόλογος κεφαλαίου Στα προηγούμενα κεφάλαια είδαμε τα μοντέλα που χρησιμοποιούνται συνηθέστερα για την αναπαράσταση δικτύων. Τα δίκτυα αυτά μπορεί είτε να αντιστοιχούν σε φαινόμενα του πραγματικού κόσμου, είτε να αποτελούν θεωρητικά μοντέλα τα οποία μπορούν να χρησιμοποιηθούν για την μελέτη συγκεκριμένων ιδιοτήτων που παρουσιάζουν αυξημένο ενδιαφέρον σε ερευνητικό επίπεδο. Σκοπός του παρόντος κεφαλαίου είναι να παρουσιαστεί μια μελέτη περίπτωσης (case study) η οποία θα βασίζεται σε δεδομένα του πραγματικού κόσμου. Συγκεκριμένα, θα κατασκευάσουμε το δίκτυο συνεργασιών (σε επίπεδο επιστημονικών δημοσιεύσεων - papers ) των καθηγητών και ερευνητών του τμήματος Πληροφορικής και Τηλεματικής, της Σχολής Ψηφιακής Τεχνολογίας του Χαροκοπείου Πανεπιστημίου Αθηνών και στην συνέχεια θα πραγματοποιήσουμε διάφορους υπολογισμούς επί αυτού, προκειμένου να μελετηθεί και να αναδειχθεί η δομή του. Τα δεδομένα για την κατασκευή του δικτύου συλλέχθηκαν με χρήση της μηχανής αναζήτησης Google Scholar και ως όροι αναζήτησης χρησιμοποιήθηκαν οι όροι harokopio informatics telematics. Αυτό είχε ως συνέπεια, η μηχανή αναζήτησης να μας επιστρέψει 22 σελίδες με αποτελέσματα. Κάθε αποτέλεσμα είναι και μια επιστημονική δημοσίευση για την συγγραφή της οποίας συνεργάστηκαν δύο ή περισσότεροι καθηγητές ή ερευνητές. Στο σημείο αυτό να σημειώσουμε ότι δεν λάβαμε υπόψη μας τις δημοσιεύσεις που έγιναν από έναν μεμονωμένο καθηγητή ή ερευνητή διότι τότε θα μιλούσαμε για συνεργασία κάποιου με τον εαυτό του. Προφανώς μια τέτοια δημοσίευση αφενός δεν συνεισφέρει στο δίκτυο συνεργασιών, αφετέρου θα εισήγαγε στο δίκτυο αυτοβρόχους και κάτι τέτοιο δεν το επιθυμούμε. Προκειμένου να γίνει αντιληπτό το πως προκύπτουν οι συνεργασίες μέσα από μια δημοσίευση θα αναφέρουμε ένα παράδειγμα. Ας υποθέσουμε ότι έχουμε στην διάθεση μας μια εργασία για την συγγραφή της οποίας συνεργάστηκαν οι καθηγητές Α, Β και Γ. Τότε, βλέπουμε ότι για κάθε καθηγητή προκύπτουν δύο διακριτές συνεργασίες.

126 109 Συγκεκριμένα: Για τον καθηγητή Α προκύπτουν οι συνεργασίες Α,Β και Α,Γ. Για τον καθηγητή Β προκύπτουν οι συνεργασίες Β,Α και Β,Γ. Για τον καθηγητή Γ προκύπτουν οι συνεργασίες Γ,Α και Γ,Β. Στην περίπτωση που αυτοί οι ίδιοι τρεις καθηγητές συνεργαστούν ξανά για την συγγραφή μιας άλλης (διαφορετικής) εργασίας, τότε θα προκύψουν άλλες έξι συνεργασίες (ακολουθώντας ακριβώς την ίδια λογική) οι οποίες προφανώς θα είναι διαφορετικές από αυτές που προέκυψαν από την προηγούμενη εργασία. Για την κατασκευή του δικτύου χρησιμοποιήθηκε η γλώσσα προγραμματισμού R και ειδικότερα το πακέτο igraph το οποίο παρέχει εξειδικευμένα εργαλεία για την ανάλυση δικτύων. 4.2 Συγκέντρωση και καταχώρηση των δεδομένων Σε πρώτη φάση πραγματοποιήθηκε η συγκέντρωση των απαραίτητων δεδομένων και η καταχώρηση τους σε ένα spreadsheet. Στην συγκεκριμένη περίπτωση έγινε χρήση του προγράμματος Calc της σουίτας LibreOffice. Κάθε γραμμή του spreadsheet αντιστοιχεί και σε μια δημοσίευση. Στα κελιά των γραμμών καταχωρούνται τα ονόματα των συνεργαζόμενων καθηγητών και ερευνητών. 4.3 Ανωνυμοποίηση και δημιουργία της λίστας των κλάδων (edge list) του δικτύου Κρίθηκε σκόπιμο να γίνει ανωνυμοποίηση των δεδομένων που έχουν συγκεντρωθεί. Προκειμένου να επιτευχθεί η ανωνυμοποίηση των δεδομένων, συγκεντρώθηκαν τα ονόματα όλων των συνεργαζόμενων καθηγητών και ερευνητών και αφού πρώτα έγινε η απαραίτητη επεξεργασία και καθαρισμός (data cleaning), στην συνέχεια αποδόθηκε σε κάθε έναν από αυτούς και από ένα μοναδικό id. Το id είναι δεν είναι τίποτα περισσότερο από ένας φυσικός αριθμός ο οποίος προσδιορίζει με μονοσήμαντο τρόπο τον κάθε συμμετέχοντα.

127 110 Στην συνέχεια, με χρήση της γλώσσας προγραμματισμού R βρίσκουμε όλους τους δυνατούς συνδυασμούς (συνεργασίες) και δημιουργούμε την λίστα που περιλαμβάνει όλους τους κλάδους του δικτύου. Στα Αγγλικά αυτή η λίστα ονομάζεται edge list. Επειδή ένας κλάδος ορίζεται από ένα ζεύγος κόμβων, στην πραγματικότητα η λίστα των κλάδων είναι ένα δίστηλο στην πρώτη στήλη του οποίου περιλαμβάνονται οι κόμβοι αναχώρησης των κλάδων, ενώ στην δεύτερη στήλη αυτού περιλαμβάνονται οι κόμβοι αφίξεως των κλάδων. Αυτό έχει ως συνέπεια το δίκτυο μας να είναι προσανατολισμένο. Σκοπός μας, μεταξύ άλλων, είναι να υπολογίσουμε για κάθε κόμβο του δικτύου τον έξω-βαθμό (outdegree) αυτού. Δεδομένου ότι κάθε κόμβος αναπαριστά και έναν καθηγητή ή ερευνητή, ο έξω-βαθμός αυτού θα αντιστοιχεί στις συνεργασίες που έχει πραγματοποιήσει σύμφωνα με τα δεδομένα που έχουμε συλλέξει. 4.4 Δημιουργία του δικτύου συνεργασιών Έχοντας πλέον στην διάθεση μας την λίστα των κλάδων ( την οποία ονομάσαμε znew ), μπορούμε να προχωρήσουμε στην δημιουργία του δικτύου/γράφου, τον οποίο θα ονομάσουμε g. Στην φάση αυτή δημιουργείται στο περιβάλλον της γλώσσας R ένα αντικείμενο (object) που φέρει το όνομα g και αποτελείται από ένα σύνολο κόμβων V (g) και ένα σύνολο προσανατολισμένων κλάδων E(g). Στην συνέχεια σχεδιάζουμε το δίκτυο. Η εκτέλεση αυτής της εντολής μας δίνει το δίκτυο του επόμενου σχήματος που δεν είναι άλλο από το ζητούμενο δίκτυο συνεργασιών.

128 111 Σχήμα 4.1 Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου πανεπιστημίου Όπως μπορούμε να δούμε, ο κάθε συμμετέχον αντιπροσωπεύεται από έναν αριθμημένο κόμβο και οι ακμές που συνδέουν τους κόμβους μεταξύ τους αντιπροσωπεύουν συνεργασίες. Σχεδιάζουμε ξανά το ίδιο δίκτυο αλλά αυτή την φορά παραλείπουμε τα ονόματα των κόμβων προκειμένου να έχουμε περισσότερη ευκρίνεια.

129 112 Σχήμα 4.2 Δίκτυο συνεργασιών του τμήματος Πληροφορικής και Τηλεματικής του Χαροκοπείου πανεπιστημίου 4.5 Ανάλυση του δικτύου συνεργασιών Υπολογισμός του πλήθους των κόμβων του δικτύου

130 113 Βλέπουμε δηλαδή ότι έχουμε 198 συμμετέχοντες στο δίκτυο. Αυτό σημαίνει ότι το μέγεθος του συνόλου V (g) είναι V (g) = Υπολογισμός του πλήθους των ακμών του δικτύου Βλέπουμε ότι έχουμε 2120 ακμές στο δίκτυο. Αυτό σημαίνει ότι το μέγεθος του συνόλου E(g) είναι E (g) = Υπολογισμός του έξω-βαθμού (out-degree) κάθε κόμβου του δικτύου Στον παραπάνω πίνακα, στις γραμμές 1, 3, 5, 7, 9, 11, 13, 15, 17 και 19 φαίνονται τα ονόματα (names) των κόμβων, που δεν είναι άλλα από τα id's που έχουμε αποδώσει στους συμμετέχοντες του δικτύου. Στις γραμμές 2, 4, 6, 8, 10, 12, 14, 16, 18 και 20 φαίνονται οι έξω-βαθμοί των κόμβων. Οι μονές και οι ζυγές γραμμές του πίνακα βρίσκονται σε πλήρη αντιστοιχία, οπότε βλέπουμε για

131 114 παράδειγμα ότι ο κόμβος 5 έχει έξω-βαθμό ίσο με 26, ο κόμβος 176 έχει έξω-βαθμό ίσο με 111 κοκ. Αν το επιθυμούμε, μπορούμε να απεικονίσουμε όλη την πληροφορία που περιέχει ο παραπάνω πίνακας σε ένα γράφημα: Παρατηρούμε ότι στον οριζόντιο άξονα φαίνεται ο δείκτης (index) του κάθε κόμβου. Συνεπώς, θα πρέπει να εξηγήσουμε τι ακριβώς σημαίνει δείκτης κόμβου. Όταν σε προηγούμενο βήμα σχηματίστηκε το αντικείμενο g, το περιβάλλον της γλώσσας R ανέθεσε σε κάθε κόμβο και από έναν δείκτη προκειμένου να μπορεί να αναφέρεται σε αυτόν. Συνεπώς, έχουμε την δυνατότητα να αναφερόμαστε σε έναν κόμβο με δύο διαφορετικούς τρόπους: είτε με το όνομα του, είτε με τον δείκτη του. Για παράδειγμα, βλέπουμε ότι τον μεγαλύτερο έξω-βαθμό τον έχει ο κόμβος που έχει δείκτη 50. Πρακτικά αυτό σημαίνει ότι ο συγκεκριμένος καθηγητής/ερευνητής έχει τις περισσότερες συνεργασίες. Αν θέλουμε να βρούμε ποιο είναι το όνομα αυτού του κόμβου τότε αρκεί να δώσουμε την παρακάτω εντολή:

132 115 Οπότε βλέπουμε ότι ο κόμβος που έχει δείκτη 50 είναι ο κόμβος Εύρεση του κόμβου με τον μεγαλύτερο έξω-βαθμό Αν θέλαμε να βρούμε ποιος είναι ο κόμβος με τον μεγαλύτερο έξω-βαθμό χωρίς να μπαίναμε στην διαδικασία να βρούμε τους έξω-βαθμούς όλων των κόμβων του δικτύου, τότε θα αρκούσε να δώσουμε τις παρακάτω εντολές: Δηλαδή, πρώτα βρίσκουμε ποιος είναι ο μεγαλύτερος έξω-βαθμός και μετά εντοπίζουμε τον κόμβο που έχει αυτόν τον έξω-βαθμό. Στην συγκεκριμένη περίπτωση επομένως βρήκαμε ότι ο μεγαλύτερος έξω-βαθμός είναι ίσος με 138 και ότι αυτόν τον έξω-βαθμό τον έχει ο κόμβος 6 που έχει δείκτη ίσο με Εύρεση του κόμβου με τον μικρότερο έξω-βαθμό Η λογική είναι παρόμοια με αυτήν που ακολουθήσαμε για την εύρεση του μεγαλύτερου έξω-βαθμού. Βρήκαμε επομένως ότι ο μικρότερος έξω-βαθμός είναι ίσος με 1 και ότι τον έχουν δύο συγκεκριμένοι κόμβοι: ο κόμβος 183 που έχει δείκτη 69 και ο κόμβος 39 που έχει δείκτη 85. Αυτά τα αποτελέσματα επαληθεύονται αν ανατρέξουμε στον αναλυτικό πίνακα που σχηματίσαμε σε προηγούμενο βήμα, στον οποίο φαίνονται οι έξω-βαθμοί όλων των κόμβων του δικτύου.

133 Εντοπισμός κόμβου/κόμβων με συγκεκριμένο έξω-βαθμό Ας υποθέσουμε ότι θέλουμε να βρούμε ποιος ή ποιοι κόμβοι έχουν συγκεκριμένο έξω-βαθμό, πχ. ίσο με 9. Ακολουθώντας παρόμοια λογική με τα προηγούμενα, αρκεί να δώσουμε την εντολή: Οπότε βρίσκουμε ότι έξω-βαθμό ίσο με 9 έχουν οι κόμβοι 33, 20, 140, 24, 147, 65, 100, 181 και 30. Ταυτόχρονα μπορούμε να δούμε και τους δείκτες τους Υπολογισμός του πλήθους των τριγώνων στα οποία συμμετέχει ο κάθε κόμβος του δικτύου Στον παραπάνω πίνακα, φαίνονται οι δείκτες των κόμβων και σε πόσα τρίγωνα συμμετέχει ο κάθε ένας από αυτούς. Για παράδειγμα, βλέπουμε ότι ο κόμβος με δείκτη 1 συμμετέχει σε 16 τρίγωνα, ο κόμβος με δείκτη 2 συμμετέχει σε 62 τρίγωνα κοκ Υπολογισμός των συντελεστών συσταδοποίησης του δικτύου Στο πακέτο igraph ο συντελεστής συσταδοποίησης (clustering coefficient) ονομάζεται συντελεστής μεταβατικότητας (transitivity coefficient). Πρώτα από όλα, υπενθυμίζουμε ότι ως γειτονιά (neighborhood) ενός κόμβου u ορίζουμε το

134 117 σύνολο των κόμβων που συνδέονται άμεσα με αυτόν. Δηλαδή εννοούμε εκείνους τους κόμβους που είναι πρώτοι γείτονες του u και απέχουν απόσταση μίας ακμής από αυτόν. Αν όλοι οι κόμβοι της γειτονιάς του u συνδέονται (επικοινωνούν) μεταξύ τους, τότε λέμε ότι η γειτονιά του u είναι πλήρης (complete) και ο συντελεστής συσταδοποίησης/μεταβατικότητας έχει τιμή ίση με 1. Αντιθέτως, αν όλοι οι κόμβοι της γειτονιάς του u είναι ασύνδετοι μεταξύ τους (δηλαδή δεν επικοινωνούν μεταξύ τους με κανέναν τρόπο), ο συντελεστής συσταδοποίησης/μεταβατικότητας έχει τιμή ίση με 0. Συνεπώς, όταν ο συντελεστής μεταβατικότητας υπολογίζεται για έναν συγκεκριμένο κόμβο, αποτελεί ένα μέτρο του πόσο πλήρης (complete) είναι η γειτονιά αυτού. Όταν ο συντελεστής μεταβατικότητας υπολογίζεται για ένα ολόκληρο δίκτυο, μας δίνει τον μέσο (average) συντελεστή μεταβατικότητας, λαμβάνοντας υπόψη όλους τους κόμβους του δικτύου. Δηλαδή, ο μέσος συντελεστής μεταβατικότητας είναι ο αριθμητικός μέσος των συντελεστών μεταβατικότητας όλων των κόμβων του δικτύου. Βλέπουμε επομένως, ότι όταν ο συντελεστής μεταβατικότητας υπολογίζεται για έναν συγκεκριμένο κόμβο μπορούμε να έχουμε μια εικόνα για την κατάσταση που επικρατεί σε μίκρο-επίπεδο, ενώ όταν υπολογίζεται για ολόκληρο το δίκτυο σχηματίζουμε μια εικόνα για την κατάσταση που επικρατεί σε μάκρο-επίπεδο. Πρώτα υπολογίζουμε τον μέσο (average) συντελεστή συσταδοποίησης του δικτύου: Στην συνέχεια υπολογίζουμε τον τοπικό (local) συντελεστή συσταδοποίησης για κάθε κόμβο του δικτύου, ο οποίος με απλά λόγια είναι ο λόγος του αριθμού των τριγώνων που συνδέονται σε αυτόν τον κόμβο προς τον αριθμό των τριάδων (triples) που έχουν κέντρο αυτόν τον κόμβο:

135 118 Σε αυτόν τον πίνακα βλέπουμε τους δείκτες (indices) των κόμβων και την αντίστοιχη τιμή του τοπικού συντελεστή συσταδοποίησης για κάθε κόμβο. Για παράδειγμα, βλέπουμε ότι ο κόμβος που έχει δείκτη (index) 2, έχει τοπικό συντελεστή συσταδοποίησης ίσο με Τέλος, υπολογίζουμε τον ονομαζόμενο οικουμενικό (global) συντελεστή συσταδοποίησης του δικτύου που είναι ο λόγος του αριθμού των τριγώνων προς τον αριθμό των συνδεδεμένων τριάδων (triples) μέσα σε όλο το δίκτυο:

136 Υπολογισμός της πυκνότητας του δικτύου Σαν πυκνότητα του δικτύου/γράφου (graph density) ορίζουμε τον λόγο του αριθμού των υπαρχόντων (δηλαδή των σχηματισμένων) ακμών του δικτύου προς τον αριθμό όλων των δυνατών ακμών που θα μπορούσαν να σχηματιστούν Υπολογισμός της διαμέτρου του δικτύου Σαν διάμετρο (diameter) του δικτύου/γράφου ορίζουμε το μήκος του μικρότερου μονοπατιού που ενώνει τους δύο πιο απομακρυσμένους κόμβους του δικτύου. Βλέπουμε δηλαδή ότι η διάμετρος του συγκεκριμένου δικτύου έχει μήκος ίσο με 7 ακμές Εύρεση των πιο απομακρυσμένων κόμβων του δικτύου Βρήκαμε ότι οι δύο πιο απομακρυσμένοι κόμβοι του δικτύου απέχουν μεταξύ τους απόσταση ίση με 7 ακμές, οπότε είναι απολύτως λογικό να θέλουμε να βρούμε και ποιοι ακριβώς είναι αυτοί οι δύο κόμβοι. Βλέπουμε επομένως ότι οι δύο ζητούμενοι κόμβοι είναι οι 102 και 71. Αυτά είναι τα ονόματα των κόμβων, όχι οι δείκτες τους.

137 120 Επιπλέον, κοιτάζοντας την τιμή $distance, επιβεβαιώνεται το αποτέλεσμα που είχαμε βρει στο προηγούμενο βήμα, ότι δηλαδή οι δύο πιο απομακρυσμένοι κόμβοι του δικτύου απέχουν μεταξύ τους απόσταση ίση με 7 ακμές Υπολογισμός της συνδεσιμότητας μέσω των ακμών Η συνδεσιμότητα μέσω ακμών (edge connectivity) για ένα ζεύγος κόμβων, εκ των οποίων ο πρώτος είναι ο κόμβος αναχώρησης και ο δεύτερος είναι ο κόμβος άφιξης, ορίζεται ως ο μικρότερος αριθμός ακμών που πρέπει να αφαιρεθούν προκειμένου να μην υπάρχει κανένα προσανατολισμένο μονοπάτι που να συνδέει την αναχώρηση με την άφιξη. Η συνδεσιμότητα μέσω ακμών για ένα δίκτυο/γράφο είναι το ελάχιστο (minimum) των συνδεσιμοτήτων μέσω ακμών που έχουν υπολογιστεί για κάθε διατεταγμένο ζεύγος κόμβων του δικτύου. Η συνδεσιμότητα μέσω ακμών ενός δικτύου/γράφου είναι μηδέν όταν το δίκτυο είναι μη συνεκτικό. Το αποτέλεσμα αυτό, προφανώς ήταν αναμενόμενο, αφού με την πρώτη ματιά μπορούμε να διαπιστώσουμε ότι το δίκτυο μας είναι μη συνεκτικό Υπολογισμός της αμοιβαιότητας του δικτύου Η αμοιβαιότητα (reciprocity) καθορίζει το ποσοστό των αμοιβαίων συνδέσεων (αμφίδρομες συνδέσεις μεταξύ ζευγών κόμβων) μέσα σε έναν προσανατολισμένο γράφο. Η αμοιβαιότητα λαμβάνει τιμές στο διάστημα [0,1]. Το αποτέλεσμα αυτό ήταν φυσικά αναμενόμενο αφού κατασκευάσαμε το δίκτυο των συνεργασιών θεωρώντας ότι όλες οι συνεργασίες είναι αμοιβαίες.

138 Εύρεση των συστάδων του δικτύου Οι συστάδες (clusters/components) του δικτύου είναι νησίδες που αποτελούνται από κόμβους που είναι συνδεδεμένοι μεταξύ τους. Οι νησίδες αυτές προφανώς δεν επικοινωνούν μεταξύ τους. Μια συστάδα, όπως είδαμε και στο δεύτερο κεφάλαιο, μπορεί να είναι είτε ισχυρώς, είτε ασθενώς συνδεδεμένη. Υπενθυμίζουμε ότι μια συστάδα θεωρείται ότι είναι ισχυρώς συνδεδεμένη (strongly connected) όταν όλοι οι κόμβοι που την αποτελούν επικοινωνούν μεταξύ τους, αν λάβουμε όμως υποχρεωτικά υπόψη μας τον προσανατολισμό των κλάδων που τους συνδέουν. Την αντιμετωπίζουμε δηλαδή σαν έναν προσανατολισμένο υπογράφο. Αντιθέτως, μια συστάδα θεωρείται ότι είναι ασθενώς συνδεδεμένη (weakly connected) όταν όλοι οι κόμβοι που την αποτελούν επικοινωνούν μεταξύ τους χωρίς να λάβουμε όμως υπόψη μας τον προσανατολισμό των κλάδων που τους συνδέουν. Με απλά λόγια, ελέγχουμε αν επικοινωνούν μεταξύ τους όλοι οι κόμβοι της συστάδας σαν οι κλάδοι να μην ήταν προσανατολισμένοι. Την αντιμετωπίζουμε δηλαδή σαν έναν μη προσανατολισμένο υπογράφο. Έστω ότι εμείς επιθυμούμε να αντιμετωπίσουμε τις συστάδες του δικτύου μας ως ασθενώς συνδεδεμένες. Ο μόνος λόγος που το κάνουμε αυτό είναι για να έχουμε πιο χαλαρές συνθήκες συσταδοποίησης. Αν θέλαμε, θα μπορούσαμε να αντιμετωπίσουμε τις συστάδες του δικτύου ως ισχυρώς συνδεδεμένες. Επειδή όμως κατά την κατασκευή του δικτύου θεωρήσαμε ότι οι δεσμοί μεταξύ όλων των ζευγών είναι αμοιβαίοι, στην πραγματικότητα το δίκτυο συμπεριφέρεται ως μη προσανατολισμένο οπότε θα λάβουμε ακριβώς τα ίδια αποτελέσματα και στις δύο περιπτώσεις.

139 122 Βλέπουμε επομένως ότι έχουμε 4 συστάδες. Η συστάδα 1 έχει μέγεθος 122, η συστάδα 2 έχει μέγεθος 56, η συστάδα 3 έχει μέγεθος 16 και η συστάδα 4 έχει μέγεθος 4. Επίσης στον πίνακα που σχηματίστηκε, βλέπουμε σε ποια συστάδα ανήκει ο κάθε κόμβος. Για παράδειγμα, ο κόμβος 5 ανήκει στην συστάδα 1 που έχει μέγεθος 122, ο κόμβος 176 ανήκει στην συστάδα 2 που έχει μέγεθος 56 κοκ. Το συμπέρασμα ότι έχουμε 4 συστάδες μπορεί να προκύψει και με απλή παρατήρηση του δικτύου. Μετά από αυτό, μπορούμε να προχωρήσουμε και στην γραφική απεικόνιση των μεγεθών των συστάδων του δικτύου.

140 Εύρεση των κόμβων στους οποίους έχει πρόσβαση κάποιος συγκεκριμένος κόμβος του δικτύου Καταρχάς, είναι προφανές ότι προκειμένου να επικοινωνούν δύο κόμβοι θα πρέπει να ανήκουν στην ίδια συστάδα/συνιστώσα. Κόμβοι οι οποίοι ανήκουν σε διαφορετικές συστάδες/συνιστώσες, δεν δύνανται να επικοινωνούν μεταξύ τους. Ας θεωρήσουμε ως παράδειγμα τον κόμβο 6, ο οποίος ανήκει στην συστάδα/συνιστώσα 1 που έχει μέγεθος 122. Η μέθοδος έχει ως εξής: Πρώτα βρίσκουμε τον δείκτη (index) του κόμβου 6 και μετά κάνουμε χρήση της κατάλληλης εντολής που θα επιστρέψει ως αποτέλεσμα εκείνους τους κόμβους στους οποίους έχει πρόσβαση ο κόμβος 6 και που είναι επίσης μέλη της συστάδας/συνιστώσας 1.

141 124 Επομένως, διαπιστώσαμε ότι ο κόμβος 6 έχει δείκτη 50 και ότι έχει πρόσβαση σε 122 κόμβους που ανήκουν στην ίδια συστάδα με αυτόν. Τα ονόματα αυτών των κόμβων φαίνονται αναλυτικά στον παραπάνω πίνακα Εύρεση των κόμβων που έχουν πρόσβαση σε κάποιον συγκεκριμένο κόμβο του δικτύου Η λογική είναι παρόμοια με αυτήν που ακολουθήσαμε και στον προηγούμενο υπολογισμό. Θεωρούμε και πάλι ως παράδειγμα τον κόμβο 6, προκειμένου να βρούμε ποιοι κόμβοι έχουν πρόσβαση σε αυτόν. Βρήκαμε επομένως ότι ο κόμβος 6 έχει δείκτη 50 και ότι έχουν πρόσβαση σε αυτόν 122 κόμβοι που ανήκουν στην ίδια συστάδα/συνιστώσα με αυτόν. Τα ονόματα αυτών των κόμβων φαίνονται αναλυτικά στον παραπάνω πίνακα.

142 Κατανομή των έξω-βαθμών των κόμβων του δικτύου Ας δούμε τώρα πως διαβάζεται αυτός ο πίνακας. Τα στοιχεία αυτού του πίνακα είναι σχετικές συχνότητες εμφάνισης έξω-βαθμών. Γενικά ισχύει ότι: σχετική συχνότητα εμφάνισης του βαθμού k 0 = πλήθος κόμβων που έχουν βαθμό k 0 συνολικό πλήθος κόμβων του δικτύου Το πρώτο στοιχείο του πίνακα μας δίνει την σχετική συχνότητα εμφάνισης του έξω-βαθμού 0. Επειδή όμως δεν υπάρχει κανένας κόμβος με μηδενικό έξω-βαθμό, η τιμή αυτού του στοιχείου είναι Το δεύτερο στοιχείο του πίνακα μας δίνει την σχετική συχνότητα εμφάνισης του έξω-βαθμού 1 και βλέπουμε ότι η τιμή του είναι Αυτό σημαίνει ότι υπάρχουν *198 = 2 κόμβοι που έχουν έξω-βαθμό ίσο με 1. Με αυτήν την λογική μπορούμε να διαβάσουμε όλο τον πίνακα, μέχρι να φτάσουμε στο τελευταίο

143 126 στοιχείο του που αντιστοιχεί στην σχετική συχνότητα εμφάνισης του έξω-βαθμού 138. Όπως θυμόμαστε και από προηγούμενο υπολογισμό, 138 είναι ο μέγιστος έξω-βαθμός που εμφανίζεται στο δίκτυο και τον διαθέτει μόνο ο κόμβος 6. Γνωρίζουμε δηλαδή εκ των προτέρων ότι υπάρχει μόνο ένας κόμβος με έξω-βαθμό 138, οπότε είναι ευκαιρία να το επαληθεύσουμε χρησιμοποιώντας τον πίνακα που έχουμε στην διάθεση μας. Το τελευταίο στοιχείο του πίνακα έχει τιμή Οπότε υπάρχουν *198 = 1 κόμβοι με έξω-βαθμό ίσο με 138. Μια παρατήρηση σχετικά με το πως κατασκευάζεται ο συγκεκριμένος πίνακας από τον αλγόριθμο του igraph : Όπως μπορούμε να δούμε, ο πίνακας ξεκινάει από την τιμή 0 και φτάνει μέχρι την τιμή 139. Δηλαδή όλοι οι πραγματικοί έξω-βαθμοί των κόμβων είναι αυξημένοι κατά 1. Αυτό είναι κάτι που πρέπει να το λάβουμε υπόψη μας (όπως ήδη είδαμε) όταν διαβάζουμε τον πίνακα. Δεν πρόκειται για κάποιο σφάλμα, αλλά για μια ιδιοτροπία του αλγόριθμου που οφείλεται στον τρόπο με τον οποίο τον υλοποίησε στο igraph ο δημιουργός του (Δρ. Gabor Csardi), που είναι και ο κύριος δημιουργός των εργαλείων αυτού του πακέτου. Φυσικά μπορούμε να απεικονίσουμε όλα τα παραπάνω σε ένα γράφημα.

144 127 Βλέπουμε ότι στον οριζόντιο άξονα υπάρχει η ένδειξη Index. Η σχέση που συνδέει την ποσότητα Index με τον πραγματικό έξω-βαθμό k ενός κόμβου είναι: Index= k +1 Πρόκειται για την ίδια ακριβώς παρατήρηση που δώσαμε και προηγουμένως. Στον κάθετο άξονα έχουμε προφανώς την σχετική συχνότητα εμφάνισης έξω-βαθμού. Παρατηρώντας το τελευταίο γράφημα, διαπιστώνουμε ότι έχουμε μικρό αριθμό κόμβων με μεγάλο έξω-βαθμό και μεγάλο αριθμό κόμβων με μικρό έξω-βαθμό. Αυτό επιβεβαιώνει το συμπέρασμα που είχαμε συναντήσει στα πρώτα δύο κεφάλαια της παρούσης εργασίας, σύμφωνα με το οποίο τα δίκτυα του πραγματικού κόσμου είναι ελεύθερα κλίμακας (scale free) και ακολουθούν νόμο δυνάμεως (power law). Αν θέλουμε τον πίνακα των απολύτων συχνοτήτων εμφάνισης των έξω-βαθμών, τότε αρκεί να πάρουμε τον πίνακα των σχετικών συχνοτήτων εμφάνισης των έξω-βαθμών και να πολλαπλασιάσουμε το κάθε στοιχείο αυτού με το συνολικό πλήθος κόμβων, που στην συγκεκριμένη περίπτωση είναι 198.

145 128 Μπορούμε φυσικά να αναδείξουμε όλη αυτήν την πληροφορία που περιέχει αυτός ο πίνακας και με ένα γράφημα Ταίριασμα ενός νόμου δυνάμεως στην κατανομή των έξω-βαθμών των κόμβων Αφού διαπιστώσαμε ότι το δίκτυο μας παρουσιάζει συμπεριφορά δικτύου το οποίο είναι ελεύθερο κλίμακας (scale free network), μπορούμε να δοκιμάσουμε να ταιριάξουμε ένα νόμο δυνάμεως στην κατανομή των έξω-βαθμών των κόμβων του δικτύου. Δηλαδή να κάνουμε power law fitting.

146 129 Ας ερμηνεύσουμε τα αποτελέσματα που μας επιστρέφονται. Το $alpha είναι η τιμή του εκθέτη του νόμου δυνάμεως που παρεμβάλει καλύτερα την πραγματική κατανομή που διαθέτουμε και βλέπουμε ότι ισούται με Σαν τάξη μεγέθους, αυτό το αποτέλεσμα είναι δεκτό καθότι όπως έχουμε δει και στα πρώτα κεφάλαια, ο εκθέτης του νόμου δυνάμεως πρέπει να βρίσκεται στο διάστημα [2,3]. Οπότε μπορούμε να γράψουμε ότι ο νόμος δυνάμεως που βρήκαμε, είναι της μορφής: p k k Σχεδιάζουμε τον παραπάνω νόμο, στην ιδανική του μορφή, με χρήση του προγράμματος wxmaxima.

147 130 Το $KS.p είναι το p-value του test καλής προσαρμογής (goodness of fit test) Kolmogorov-Smirnov και βλέπουμε ότι έχει τιμή ίση με Στην πραγματικότητα αυτό που γίνεται είναι ένας έλεγχος υπόθεσης. Κατά τα γνωστά, έχουμε την μηδενική υπόθεση Η 0 και την εναλλακτική αυτής Η 1. Η 0 Η 1 : Οι έξω-βαθμοί των κόμβων του δικτύου δύνανται να ακολουθούν νόμο δυνάμεως με εκθέτη : Οι έξω-βαθμοί των κόμβων του δικτύου δεν δύνανται να ακολουθούν νόμο δυνάμεως με εκθέτη Το επίπεδο σημαντικότητας είναι α = 0.05 Επειδή είναι p-value = > 0.05, συμπεραίνουμε ότι η μηδενική υπόθεση γίνεται δεκτή και ότι έχουμε καλή προσαρμογή του νόμου δυνάμεως στα δεδομένα μας.

148 Εντοπισμός κοινοτήτων εντός του δικτύου Αν θέλαμε να δώσουμε έναν ορισμό του τι είναι μια κοινότητα (community) μέσα σε ένα δίκτυο, θα μπορούσαμε να πούμε ότι: Μια κοινότητα είναι ένας πυκνά συνδεδεμένος (σε τοπικό επίπεδο) υπογράφος μέσα στο δίκτυο/γράφο. Ο σχηματισμός κοινοτήτων μέσα σε ένα δίκτυο, έχει να κάνει με το πως έχουν πραγματοποιηθεί οι συνδέσεις μεταξύ των κόμβων. Όπως είδαμε και στο πρώτο κεφάλαιο, το βασικό εργαλείο που μας δείχνει το ποιοι κόμβοι συνδέονται μεταξύ τους εντός του δικτύου είναι ο πίνακας γειτνίασης, που τον είχαμε συμβολίσει ως A και τα στοιχεία αυτού τα είχαμε συμβολίσει ως A ij, με i=1,2,,n και j=1,2,, n. Όπου με n είχαμε συμβολίσει το συνολικό πλήθος των κόμβων του δικτύου/γράφου. Επομένως, η πληροφορία για το ποιες κοινότητες σχηματίζονται μέσα σε ένα δίκτυο είναι κρυμμένη μέσα στον πίνακα γειτνίασης αυτού. Μέσα σε μια κοινότητα, θα πρέπει όλοι οι κόμβοι (που είναι μέλη αυτής) να επικοινωνούν μεταξύ τους. Επιπλέον, οι κόμβοι που ανήκουν σε μια συγκεκριμένη κοινότητα είναι πιθανότερο να επικοινωνούν μεταξύ τους (δηλαδή να συνδέονται μεταξύ τους) από ότι να επικοινωνούν με κόμβους οι οποίοι δεν είναι μέλη αυτής της κοινότητας. Μια κοινότητα μπορεί να είναι ισχυρή (strong community) ή ασθενής (weak community). Προκειμένου να εξηγήσουμε τι σημαίνει ισχυρή και ασθενής κοινότητα θα πρέπει πρώτα να ορίσουμε τι είναι ο εσωτερικός βαθμός (internal degree) και τι είναι ο εξωτερικός βαθμός (external degree) ενός κόμβου. Ας θεωρήσουμε έναν υπογράφο κάποιου γράφου/δικτύου και ας τον ονομάσουμε C. internal Ο εσωτερικός βαθμός k i ενός κόμβου i ο οποίος ανήκει στον υπογράφο C ισούται με τον αριθμό των ακμών που συνδέουν τον κόμβο αυτό με άλλους κόμβους οι οποίοι είναι επίσης μέλη του C. external Ο εξωτερικός βαθμός k i ενός κόμβου i ο οποίος ανήκει στον υπογράφο C ισούται με τον αριθμό των ακμών που συνδέουν τον κόμβο αυτό με άλλους κόμβους του δικτύου οι οποίοι όμως δεν

149 132 είναι μέλη του C. Ένας υπογράφος C αποτελεί μια ισχυρή κοινότητα όταν κάθε κόμβος που ανήκει σε αυτόν έχει περισσότερες ακμές που να τον συνδέουν με κόμβους που είναι επίσης μέλη του C από ότι ακμές που να τον συνδέουν με κόμβους που δεν είναι μέλη του C. Η συνθήκη επομένως προκειμένου ένας υπογράφος C να αποτελεί μια ισχυρή κοινότητα είναι: k internal i (C)>k external i (C ) Ένας υπογράφος C αποτελεί μια ασθενή κοινότητα όταν το άθροισμα όλων των εσωτερικών βαθμών των κόμβων που ανήκουν σε αυτόν είναι μεγαλύτερο από το άθροισμα των εξωτερικών βαθμών των ιδίων κόμβων. Η συνθήκη επομένως προκειμένου ένας υπογράφος C να αποτελεί μια ασθενή κοινότητα είναι: k internal i (C )> k external i (C) i C i C Η συνθήκη k internal i (C )> k external i (C) i C i C είναι πιο χαλαρή από την συνθήκη k i internal (C)>k i external (C ) διότι εφαρμόζεται ως ανισοτική σχέση πάνω σε ολόκληρη την κοινότητα και όχι σε κάθε έναν κόμβο της κοινότητας ξεχωριστά. Ας θυμηθούμε τώρα τους τυχαίους γράφους (δηλαδή το μοντέλο Erdos-Renyi) που παρουσιάσαμε στο δεύτερο κεφάλαιο. Σε έναν τυχαίο γράφο, όλες οι ακμές έχουν την ίδια πιθανότητα εμφάνισης p. Επίσης, σε έναν τυχαίο γράφο δεν υπάρχει κανένα αίτιο που να ευνοεί τον σχηματισμό κοινοτήτων εξαιτίας του τρόπου με τον οποίο αυτός σχηματίζεται. Μπορούμε να χρησιμοποιήσουμε αυτό το γεγονός προκειμένου να κρίνουμε αν ένας υπογράφος που έχουμε εντοπίσει μέσα σε ένα δίκτυο του πραγματικού κόσμου αποτελεί όντως μια κοινότητα. Για να το πετύχουμε αυτό, συγκρίνουμε την πυκνότητα των ακμών (με άλλα λόγια, την πυκνότητα των δεσμών) του υπογράφου που δύναται να αποτελέσει κοινότητα με την πυκνότητα των ακμών που συνδέουν τους ίδιους ακριβώς κόμβους σε έναν τυχαίο γράφο Erdos-Renyi, οπότε έτσι μπορούμε να

150 133 αποφανθούμε αν ο υπό εξέταση υπογράφος είναι αρκετά πυκνός ώστε να αποτελέσει μια κοινότητα ή όχι. Στην περίπτωση που ο υπό εξέταση υπογράφος δεν είναι αρκετά πυκνός, αυτό σημαίνει ότι οι ακμές μεταξύ των κόμβων σχηματίστηκαν τυχαία και ότι δεν είναι προϊόν κάποιας λανθάνουσας σχέσης μεταξύ των συμμετεχόντων του δικτύου και για αυτόν ακριβώς τον λόγο δεν μπορεί να θεωρηθεί ότι αποτελεί μια κοινότητα. Για τον εντοπισμό των κοινοτήτων μέσα σε ένα δίκτυο/γράφο εισήχθη η τεχνική του διαχωρισμού του δικτύου σε επιμέρους δομικά στοιχεία. Όλο αυτό, αποδίδεται από τον όρο modularity. Ας θεωρήσουμε ένα δίκτυο το οποίο περιλαμβάνει N κόμβους και L ακμές, και ότι είναι διαχωρισμένο (partition) σε n c κοινότητες. Θεωρούμε ότι κάθε κοινότητα περιλαμβάνει N c κόμβους οι οποίοι συνδέονται μεταξύ τους με L c ακμές, όπου c= 1,2,3,, n c. Δηλαδή για c= 1 μιλάμε για την κοινότητα 1 που θα περιλαμβάνει N 1 κόμβους οι οποίοι θα συνδέονται μεταξύ τους με L 1 ακμές, για c= 2 μιλάμε για την κοινότητα 2 που θα περιλαμβάνει N 2 κόμβους οι οποίοι θα συνδέονται μεταξύ τους με L 2 ακμές και ούτω καθ' εξής, μέχρι να φτάσουμε στην τιμή c= n c οπότε θα μιλάμε για την τελευταία κοινότητα n c που θα περιλαμβάνει N nc κόμβους οι οποίοι θα συνδέονται μεταξύ τους με L nc ακμές. Στόχος μας είναι να εξακριβώσουμε αν ο διαχωρισμός που έχει γίνει σε n c κοινότητες είναι σωστός, δηλαδή αν όντως αυτοί οι υπογράφοι C c διαθέτουν αρκετά μεγάλη πυκνότητα ακμών ώστε να μπορούν να αποτελούν κοινότητες. Για να το κάνουμε αυτό, μετράμε την διαφορά μεταξύ της πραγματικής δικτύωσης του γράφου που έχουμε στην διάθεση μας, η οποία παριστάνεται με τον πίνακα γειτνίασης A ( του οποίου τα στοιχεία είναι της μορφής A ij ) και της δικτύωσης που θα προέκυπτε αν ο ίδιος γράφος σχηματιζόταν τυχαία σύμφωνα με το μοντέλο Erdos-Renyi, όπου η κάθε ακμή μεταξύ δύο κόμβων i και j έχει πιθανότητα εμφάνισης p ij. Αυτό το γράφουμε ως εξής:

151 134 M c = 1 2 L (i, j) C C ( A ij p ij ) Η πιθανότητα p ij δίνεται από την σχέση p ij = k i k j 2 L κεφάλαιο., όπως ακριβώς είχαμε δει και στο δεύτερο Αν το M c είναι θετικό, τότε ο υπογράφος C c έχει μεγαλύτερη πυκνότητα ακμών από ότι αν είχε σχηματιστεί σύμφωνα με το μοντέλο Erdos-Renyi οπότε μπορεί πράγματι να αναπαριστά μια κοινότητα. Αν το M c είναι αρνητικό, τότε ο υπογράφος C c δεν μπορεί να αναπαριστά μια κοινότητα διότι δεν διαθέτει την απαραίτητη πυκνότητα ακμών. Αν το M c είναι μηδέν, τότε οι συνδέσεις μεταξύ των κόμβων του υπογράφου C c έχουν προκύψει με τυχαίο τρόπο, σαν να είχαν προκύψει από το μοντέλο Erdos-Renyi, οπότε δεν είμαστε σίγουροι αν αναπαριστά μια κοινότητα, αλλά αυτή την φορά για διαφορετικό λόγο από ότι στην ακριβώς προηγούμενη περίπτωση που ήταν M c <0. Αυτή την φορά μας λείπει κάποια χαρακτηριστική λανθάνουσα σχέση μεταξύ των συμμετεχόντων του δικτύου που θα μας οδηγούσε στο συμπέρασμα ότι αυτός ο υπογράφος αναπαριστά μια κοινότητα μέσα στο δίκτυο. Ως modularity M ορίζουμε το άθροισμα των διαφορών στην πυκνότητα των ακμών M c επί όλων των κοινοτήτων του δικτύου. Δηλαδή είναι n c M= M c c=1 Όσο υψηλότερη είναι η τιμή του M, τόσο καλύτερος είναι ο διαχωρισμός (partition) του δικτύου σε κοινότητες. Για M=0, θεωρείται ότι όλο το δίκτυο αποτελεί μια κοινότητα. Για M<0, θεωρείται ότι ο κάθε ένας από τους κόμβους του δικτύου ανήκει και σε μια διαφορετική ξεχωριστή κοινότητα.

152 135 Επιστρέφουμε τώρα στο δικό μας δίκτυο συνεργασιών. Προκειμένου να ανιχνεύσουμε και να απεικονίσουμε τις κοινότητες που υπάρχουν μέσα στο δίκτυο, θα ακολουθήσουμε μια μέθοδο η οποία περιλαμβάνει δύο βήματα. 1ο βήμα: Πρώτα από όλα θα χρειαστεί να δημιουργήσουμε στο περιβάλλον της R ένα αντικείμενο (community object) πάνω στο οποίο θα δράσουμε (στην συνέχεια) προκειμένου να αναδείξουμε τις κοινότητες και τα χαρακτηριστικά αυτών. Για την δημιουργία αυτού του αντικειμένου θα χρησιμοποιήσουμε έναν αλγόριθμο του πακέτου igraph που ονομάζεται leading eigenvector community και έχει επινοηθεί από τον καθηγητή M. Newman (M. Newman: Finding community structure using the eigenvectors of matrices, Physical Review E , 2006). Ο συγκεκριμένος αλγόριθμος εντοπίζει μέσα στο δίκτυο υπογράφους με μεγάλη πυκνότητα ακμών υπολογίζοντας το ιδιοδιάνυσμα που αντιστοιχεί στην μεγαλύτερη θετική ιδιοτιμή του πίνακα B= A P ο οποίος ονομάζεται modularity matrix. Οι πίνακες A και P είναι ο πίνακας γειτνίασης του δικτύου συνεργασιών που έχουμε στην διάθεση μας και ο πίνακας των πιθανοτήτων εμφάνισης των ακμών στο μοντέλο Erdos-Renyi αντίστοιχα. Βλέπουμε δηλαδή ότι αυτός ο αλγόριθμος χρησιμοποιεί τα μαθηματικά εργαλεία που περιγράψαμε στα ακριβώς προηγούμενα. Έστω ότι δίνουμε σε αυτό το αντικείμενο το όνομα lec. Τώρα μπορούμε να δούμε πόσες κοινότητες υπάρχουν στο δίκτυο μας, καθώς και το μέγεθος αυτών. Βλέπουμε επομένως ότι εντοπίστηκαν 9 κοινότητες.

153 136 Η πρώτη έχει μέγεθος 43, η δεύτερη έχει μέγεθος 56, η τρίτη έχει μέγεθος 16 κοκ. Ας βρούμε πόσο είναι το modularity του καταμερισμού (partition) σε αυτές τις 9 κοινότητες. Βλέπουμε ότι το modularity είναι κοντά στην μονάδα, που σημαίνει ότι έχουμε επιτύχει έναν καλό καταμερισμό. Τέλος, ας απεικονίσουμε τα μεγέθη αυτών των κοινοτήτων σε ένα γράφημα. 2ο βήμα: Τώρα είμαστε σε θέση να μπορούμε να εντοπίσουμε αυτές τις 9 κοινότητες μέσα στο δίκτυο δίνοντας σε κάθε μια από αυτές και από ένα ξεχωριστό χρώμα. Θα δείξουμε πως μπορούμε να το επιτύχουμε αυτό, δίνοντας δύο ισοδύναμους τρόπους αναπαράστασης των κοινοτήτων μέσα στο δίκτυο.

154 137 1ος τρόπος αναπαράστασης των κοινοτήτων εντός του δικτύου συνεργασιών: Σχήμα 4.3 Εντοπισμός κοινοτήτων εντός του δικτύου συνεργασιών (1ος τρόπος αναπαράστασης)

155 138 2ος τρόπος αναπαράστασης των κοινοτήτων εντός του δικτύου συνεργασιών: Σχήμα 4.4 Εντοπισμός κοινοτήτων εντός του δικτύου συνεργασιών (2ος τρόπος αναπαράστασης) Καταφέραμε επομένως να δείξουμε που ακριβώς βρίσκονται μέσα στο δίκτυο αυτές οι 9 κοινότητες. Το μόνο που αλλάζει ελαφρώς στους δύο τρόπους παρουσίασης είναι ο τρόπος αναπαράστασης, το αποτέλεσμα είναι ακριβώς το ίδιο.

156 Υπολογισμός της κεντρικότητας ιδιοδιανύσματος για κάθε κόμβο του δικτύου 139

157 140 Στον παραπάνω πίνακα φαίνονται οι κόμβοι με τα ονόματα τους, καθώς και οι κεντρικότητες ιδιοδιανύσματος (eigenvector centralities) αυτών. Επιπλέον, η τιμή $value μας δίνει την μεγαλύτερη θετική ιδιοτιμή του πίνακα γειτνίασης του δικτύου που χρησιμοποιήθηκε για τον υπολογισμό των κεντρικοτήτων ιδιοδιανύσματος των κόμβων αυτού. Βλέπουμε ότι η συγκεκριμένη ιδιοτιμή είναι η Ας βρούμε ποια είναι η μεγαλύτερη κεντρικότητα ιδιοδιανύσματος και ποιος κόμβος την διαθέτει.

158 141 Βλέπουμε επομένως ότι η μεγαλύτερη κεντρικότητα ιδιοδιανύσματος ισούται με 1 και την έχει ο κόμβος 6 που έχει δείκτη 50. Αυτό σημαίνει ότι ο κόμβος 6 είναι ο κόμβος με τις πιο ποιοτικές επαφές μέσα στο δίκτυο. Δηλαδή, είναι ο κόμβος που συνδέεται με εκείνους τους κόμβους του δικτύου που έχουν τις μεγαλύτερες κεντρικότητες. Τέλος, ας βρούμε ποια είναι η μικρότερη κεντρικότητα ιδιοδιανύσματος και ποιος κόμβος την διαθέτει. Βλέπουμε επομένως ότι η μικρότερη κεντρικότητα ιδιοδιανύσματος είναι ίση με 0 και την διαθέτουν όλοι οι κόμβοι του παραπάνω πίνακα. Οι κόμβοι που περιέχονται σε αυτόν τον πίνακα είναι οι κόμβοι του δικτύου με τις λιγότερο ποιοτικές επαφές. Αυτό σημαίνει ότι όλοι αυτοί οι κόμβοι συνδέονται με εκείνους τους κόμβους του δικτύου που έχουν τις μικρότερες κεντρικότητες.

159 Υπολογισμός της κεντρικότητας εγγύτητας για κάθε κόμβο του δικτύου 142

160 143 Στον παραπάνω πίνακα φαίνονται τα ονόματα των κόμβων του δικτύου καθώς οι αντίστοιχες κεντρικότητες εγγύτητας (closeness centralities) αυτών. Ας βρούμε ποια είναι η μεγαλύτερη κεντρικότητα εγγύτητας και ποιος κόμβος την διαθέτει. Βλέπουμε δηλαδή ότι η μεγαλύτερη κεντρικότητα εγγύτητας ισούται με *10-5 και την διαθέτει ο κόμβος 119 που έχει δείκτη 33. Αυτό σημαίνει ότι ο κόμβος 119 είναι αυτός που βρίσκεται πιο κοντά προς το κέντρο της συστάδας που τον περιέχει σε σχέση με τους υπόλοιπους κόμβους της ίδιας συστάδας.

161 144 Ας βρούμε τώρα ποια είναι η μικρότερη κεντρικότητα εγγύτητας και ποιος κόμβος την διαθέτει. Άρα, η μικρότερη κεντρικότητα εγγύτητας ισούται με *10-5 και την διαθέτουν οι κόμβοι 179, 131, 192 και 172. Αυτό σημαίνει ότι αυτοί οι κόμβοι είναι οι εξώτεροι κόμβοι της συστάδας στην οποία ανήκουν, καθότι είναι αυτοί που βρίσκονται πιο μακριά από τον κεντρικότερο κόμβο της συγκεκριμένης συστάδας.

162 Υπολογισμός της κεντρικότητας ενδιαμεσότητας για κάθε κόμβο του δικτύου 145

163 146 Στον παραπάνω πίνακα φαίνονται τα ονόματα των κόμβων του δικτύου καθώς οι αντίστοιχες κεντρικότητες ενδιαμεσότητας (betweenness centralities) αυτών. Ας βρούμε ποια είναι η μεγαλύτερη κεντρικότητα ενδιαμεσότητας και ποιος κόμβος την διαθέτει. Η μεγαλύτερη κεντρικότητα ενδιαμεσότητας ισούται με και την έχει ο κόμβος 119 που έχει δείκτη 33. Αυτό μας δείχνει ότι ο κόμβος 119 είναι ο κόμβος με την μεγαλύτερη επιρροή πάνω στους κόμβους της συστάδας στην οποία ανήκει.

164 Τέλος, ας βρούμε και ποια είναι η μικρότερη κεντρικότητα ενδιαμεσότητας και ποιος κόμβος την διαθέτει. 147 Βλέπουμε επομένως ότι η μικρότερη κεντρικότητα ενδιαμεσότητας ισούται με 0 και την διαθέτουν όλοι οι κόμβοι του παραπάνω πίνακα. Επομένως, αυτοί είναι οι κόμβοι του δικτύου που έχουν την μικρότερη επιρροή πάνω στους υπόλοιπους κόμβους της συστάδας στην οποία ανήκουν.

165 Εύρεση του συντομότερου μονοπατιού μεταξύ δύο κόμβων του δικτύου Με το igraph έχουμε την δυνατότητα να εντοπίσουμε το συντομότερο μονοπάτι μεταξύ δύο οποιωνδήποτε κόμβων του δικτύου. Ας υποθέσουμε ότι επιθυμούμε να βρούμε το συντομότερο μονοπάτι μεταξύ των κόμβων 36 και 89. Όπως γνωρίζουμε, αυτά είναι τα ονόματα των κόμβων (δηλαδή τα id's που τους έχουμε αποδώσει εμείς) και όχι οι δείκτες που τους έχουν αποδοθεί από το περιβάλλον της γλώσσας R. Προκειμένου να εντοπίσουμε το συντομότερο μονοπάτι μεταξύ αυτών των συγκεκριμένων κόμβων, θα πρέπει πρώτα να βρούμε ποιοι είναι οι δείκτες τους. Τώρα μπορούμε να δώσουμε την εντολή που θα εντοπίσει το ζητούμενο μονοπάτι. Βλέπουμε επομένως ότι το συντομότερο μονοπάτι μεταξύ των κόμβων 36 και 89 είναι το: Ας εντοπίσουμε το μονοπάτι πάνω στο δίκτυο, δίνοντας του χρώματα της επιλογής μας. Έστω ότι χρησιμοποιήσουμε κόκκινο χρώμα για τις ακμές και πράσινο χρώμα για τους κόμβους του μονοπατιού. Προκειμένου να δώσουμε κόκκινο χρώμα στις ακμές, θα πρέπει να βρούμε ποιοι είναι οι δείκτες τους. Επειδή όμως κάθε ακμή ορίζεται από ένα ζεύγος κόμβων, θα πρέπει πρώτα να βρούμε ποιοι είναι οι

166 δείκτες των κόμβων 36, 175 και 89, καθότι το ζητούμενο μονοπάτι ορίζεται από τους διαδοχικούς κλάδους (36,175) και (175,89). 149 Βρίσκουμε τους δείκτες των ακμών. Βλέπουμε επομένως ότι η ακμή (36,175) έχει δείκτη 1060, ενώ η ακμή (175,89) έχει δείκτη 669. Χρωματίζουμε αυτές τις ακμές κόκκινες χρησιμοποιώντας τους δείκτες τους. Σχεδιάζουμε πάλι το δίκτυο, προκειμένου να επιτευχθεί η αλλαγή χρώματος.

167 150 Βλέπουμε ότι πλέον είναι ορατό το μονοπάτι πάνω στο δίκτυο. Σχεδιάζουμε πάλι το δίκτυο, παραλείποντας αυτήν την φορά τα ονόματα των κόμβων προκειμένου να έχουμε μεγαλύτερη ευκρίνεια.

168 Αλλάζουμε το χρώμα των κόμβων του μονοπατιού σε πράσινο και σχεδιάζουμε πάλι το δίκτυο. 151

169 Αν θέλουμε μπορούμε να παραλείψουμε τα ονόματα των κόμβων 152

170 Εντοπισμός ενός ή περισσοτέρων κόμβων μέσα στο δίκτυο Ας υποθέσουμε, για αρχή, ότι θέλουμε να εντοπίσουμε έναν συγκεκριμένο κόμβο πάνω στο δίκτυο δίνοντας του ένα χρώμα της επιλογής μας. Έστω ότι θέλουμε να εντοπίσουμε τον κόμβο 158 δίνοντας του κόκκινο χρώμα. Θα πρέπει, πρώτα να βρούμε τον δείκτη αυτού του κόμβου, μετά να αλλάξουμε το χρώμα του και τέλος να σχεδιάσουμε το δίκτυο.

171 154 Βλέπουμε ότι ο δείκτης του κόμβου 158 είναι 74. Αλλάζουμε το χρώμα του κόμβου 158 σε κόκκινο. Σχεδιάζουμε το δίκτυο.

172 155 Όπως μπορούμε να δούμε, ο κόμβος 158 ξεχωρίζει πλέον μέσα στο δίκτυο. Φυσικά, μπορούμε να ακολουθήσουμε την ίδια διαδικασία και για μια ολόκληρη ομάδα κόμβων. Για παράδειγμα, ας υποθέσουμε ότι θέλουμε να εντοπίσουμε τους κόμβους 192, 179, 131 και 172 μέσα στο δίκτυο, δίνοντας τους πράσινο χρώμα.

173 Κατά τα γνωστά, πρώτα θα βρούμε τους δείκτες τους, μετά θα τους χρωματίσουμε και τέλος θα σχεδιάσουμε το δίκτυο. 156

174 157 Όπως μπορούμε να δούμε, η επιθυμητή ομάδα κόμβων πλέον ξεχωρίζει μέσα στο δίκτυο. Αφήσαμε εσκεμμένα και τον κόμβο 158 που είχαμε χρωματίσει με κόκκινο χρώμα στο προηγούμενο βήμα προκειμένου να αναδείξουμε τις δυνατότητες που μας δίνει το πακέτο igraph. Επίσης, όπως μπορεί να παρατηρήσει κάποιος, χρησιμοποιήσαμε την εντολή plot στην πιο απλή της μορφή. Δηλαδή χωρίς άλλα ορίσματα, πέραν του γράφου g. Με αυτόν τον τρόπο δείχνουμε τις δυνατότητες που έχουμε όταν θέλουμε να σχεδιάσουμε έναν γράφο στο igraph.

175 Εξαγωγή ενός συγκεκριμένου υπογράφου Έστω ότι θέλουμε να εξάγουμε έναν συγκεκριμένο υπογράφο μέσα από το δίκτυο συνεργασιών που έχουμε σχεδιάσει. Ένας υπογράφος ορίζεται από τους κόμβους που τον αποτελούν. Αυτό που θα κάνουμε είναι να απομονώσουμε τους κόμβους που επιθυμούμε, μαζί με τις ακμές που τους συνδέουν. Ας υποθέσουμε ότι μας ενδιαφέρει ο υπογράφος που ορίζεται από τους κόμβους 192, 179, 131 και 172. Πρώτα θα βρούμε τους δείκτες αυτών των κόμβων και μετά θα χρησιμοποιήσουμε την εντολή που θα απομονώσει και θα σχεδιάσει τον ζητούμενο υπογράφο. Τώρα προχωράμε στην σχεδίαση του υπογράφου.

176 Σύγκριση του δικτύου συνεργασιών με μοντέλα τυχαίων γράφων Θα ήταν χρήσιμο να κάνουμε μια σύγκριση μεταξύ του δικτύου συνεργασιών που σχεδιάσαμε (το οποίο είναι ένα δίκτυο του πραγματικού κόσμου) με τα τρία κυριότερα μοντέλα τυχαίων γράφων που είδαμε στα κεφάλαια 2 και 3. Δηλαδή με το μοντέλο Erdos-Renyi, το μοντέλο Barabasi-Albert και το μοντέλο Watts-Strogatz. Η βασική ιδέα είναι να κατασκευάσουμε τυχαίους γράφους χρησιμοποιώντας τους τρεις παραπάνω αλγόριθμους, φροντίζοντας να έχουν 198 κόμβους και 2120 ακμές. Δηλαδή να έχουν τόσους κόμβους και τόσες ακμές όσες και το δίκτυο συνεργασιών Σύγκριση του δικτύου συνεργασιών με το μοντέλο Erdos-Renyi Το μοντέλο Erdos-Renyi απαντάτε σε δύο ισοδύναμες μορφές. Η μια μορφή είναι η G(n, m) ( που πολλές φορές γράφεται και ως G n,m ) και η άλλη μορφή είναι η G(n, p) ( που πολλές φορές γράφεται και ως G n, p ). Στην μορφή G(n, m) έχουμε n κόμβους και συνδέουμε τυχαία κάποιους από αυτούς με ακμές. m Στην μορφή G(n, p) είναι p. έχουμε n κόμβους και η πιθανότητα εμφάνισης μιας ακμής μέσα στο δίκτυο Ας ξεκινήσουμε με το μοντέλο G(n, m). Θέτουμε n =198 και m= Στην συνέχεια σχεδιάζουμε το δίκτυο.

177 160 Υπολογίζουμε τον μέσο συντελεστή συσταδοποίησης/μεταβατικότητας του δικτύου. Υπολογίζουμε την πυκνότητα των ακμών του δικτύου.

178 161 Βρίσκουμε πόσες συστάδες υπάρχουν στο δίκτυο. Όπως μπορούμε να δούμε, με τις 2120 ακμές συνδέθηκαν μεταξύ τους και οι 198 κόμβοι του δικτύου σε μια γιγαντιαία συνιστώσα. Συνεχίζουμε με το μοντέλο G(n, p). Θέτουμε n =198 και p=0.5 Σχεδιάζουμε το δίκτυο.

179 162 Βρίσκουμε τον μέσο συντελεστή συσταδοποίησης. Βρίσκουμε την πυκνότητα των ακμών του δικτύου.

180 163 Εντοπίζουμε τις συστάδες που υπάρχουν στο δίκτυο. Όπως μπορούμε να δούμε, έχουν και πάλι συνδεθεί μεταξύ τους οι 198 κόμβοι του δικτύου σε μια γιγαντιαία συνιστώσα Σύγκριση του δικτύου συνεργασιών με το μοντέλο Barabasi-Albert Για την κατασκευή αυτού του δικτύου θέτουμε n =198 και θεωρούμε ότι σε κάθε βήμα του αλγορίθμου ο νέος κόμβος που προστίθεται στο δίκτυο συνδέεται με 2 ακμές με 2 ήδη υπάρχοντες κόμβους. Αυτή η τελευταία συνθήκη, δηλώνεται στο igraph με την παράμετρο m= 2. Σχεδιάζουμε το δίκτυο.

181 164 Βρίσκουμε τον μέσο συντελεστή συσταδοποίησης. Υπολογίζουμε την πυκνότητα των ακμών του δικτύου.

182 165 Εντοπίζουμε τις συστάδες του δικτύου. Βλέπουμε ότι έχουν συνδεθεί μεταξύ τους και οι 198 κόμβοι του δικτύου σε μια γιγαντιαία συνιστώσα Σύγκριση του δικτύου συνεργασιών με το μοντέλο Watts-Strogatz Για την κατασκευή αυτού του δικτύου θέτουμε n =198 και θεωρούμε ότι στο αρχικό δακτυλιοειδές πλέγμα, ο κάθε κόμβος συνδέεται με 2 κόμβους προς τα δεξιά του (συγκεκριμένα με τον πρώτο και τον δεύτερο γείτονα αυτού, οι οποίοι βρίσκονται σε απόσταση 1 και 2 ακμών αντίστοιχα) και 2 κόμβους προς τα αριστερά του. Επίσης θεωρούμε ότι η πιθανότητα επανασύνδεσης είναι β=0.5. Σχεδιάζουμε το δίκτυο.

183 166 Υπολογισμός του μέσου συντελεστή συσταδοποίησης. Υπολογισμός της πυκνότητας των ακμών του δικτύου.

184 167 Εντοπισμός των συστάδων του δικτύου. Όπως μπορούμε να δούμε, έχουν συνδεθεί και οι 198 κόμβοι σε μια γιγαντιαία συνιστώσα Δημιουργία συγκεντρωτικού πίνακα και σχολιασμός των αποτελεσμάτων Ας συγκεντρώσουμε όλα τα αποτελέσματα που βρήκαμε σε έναν πίνακα. Μέσος συντελεστής συσταδοποίησης Δίκτυο συνεργασιών Erdos-Renyi G(n,m) Erdos-Renyi G(n,p) Barabasi- Albert Watts-Strogatz Πυκνότητα Πλήθος συστάδων Προκειμένου να έχουμε καλύτερη εποπτεία, έχει γίνει στρογγυλοποίηση στο δεύτερο δεκαδικό ψηφίο. Όπως μπορούμε να δούμε, ο τυχαίος γράφος που έχει μέσο συντελεστή συσταδοποίησης πιο κοντά στον μέσο συντελεστή συσταδοποίησης του δικτύου συνεργασιών είναι αυτός που προκύπτει από το μοντέλο Erdos-Renyi G(n,p) ενώ την μεγαλύτερη απόκλιση παρουσιάζει ο τυχαίος γράφος που προκύπτει από το μοντέλο Watts-Strogatz. Όσον αφορά την πυκνότητα, ο τυχαίος γράφος που παρουσιάζει πυκνότητα ίση με αυτή του δικτύου συνεργασιών είναι αυτός που προκύπτει από το μοντέλο Erdos-Renyi G(n,m) ενώ την μεγαλύτερη απόκλιση παρουσιάζει ο τυχαίος γράφος που προκύπτει από το μοντέλο Erdos-Renyi G(n,p).

185 168 Τέλος, όπως είναι προφανές, κανένας τυχαίος γράφος δεν μπορεί να εμφανίζει τον ίδιο αριθμό διακεκριμένων συστάδων με αυτόν που εμφανίζει το δίκτυο συνεργασιών διότι το δίκτυο συνεργασιών είναι ένα δίκτυο του πραγματικού κόσμου και κανένα μοντέλο τυχαίου γράφου δεν μπορεί να προβλέψει τις όποιες λανθάνουσες σχέσεις μπορεί να υπάρχουν μεταξύ των συμμετεχόντων του δικτύου, οι οποίες με την σειρά τους μπορούν να οδηγήσουν στον σχηματισμό διακεκριμένων συστάδων. Όλα αυτά μπορούμε να τα απεικονίσουμε με την βοήθεια διαγραμμάτων.

186 169

Network Science. Θεωρεία Γραφηµάτων (2)

Network Science. Θεωρεία Γραφηµάτων (2) Network Science Θεωρεία Γραφηµάτων () Section.8 PATHOLOGY Διαδρομές Μια διαδρομή είναι μια σειρά κόμβων όπου κάθε κόμβος είναι δίπλα στην επόμενη P i0,in μήκους n μεταξύ των κόμβων i 0 και i n είναι μια

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα

Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα Κοινωνικά Δίκτυα Αναζήτηση Πληροφοριών σε Δίκτυα Ν. Μ. Σγούρος Τμήμα Ψηφιακών Συστημάτων, Παν. Πειραιώς sgouros@unipi.gr Δομή του WWW Ορισμός Προβλήματος Υποθέτουμε ότι οι πηγές πληροφοριών αναπριστώνται

Διαβάστε περισσότερα

Το πιο απλό δίκτυο είναι η δυάδα ή το ζευγάρι. Οι δυάδες συνδέονται μεταξύ τους για να δημιουργήσουν μεγαλύτερα δίκτυα

Το πιο απλό δίκτυο είναι η δυάδα ή το ζευγάρι. Οι δυάδες συνδέονται μεταξύ τους για να δημιουργήσουν μεγαλύτερα δίκτυα Κοινωνικά Δίκτυα Το πιο απλό δίκτυο είναι η δυάδα ή το ζευγάρι Οι δυάδες συνδέονται μεταξύ τους για να δημιουργήσουν μεγαλύτερα δίκτυα Δεσμός = η σχέση μεταξύ δύο ατόμων Κεντρικός κόμβος Περιφερειακός

Διαβάστε περισσότερα

1. Σε ένα τουρνουά με 8 παίκτες μπορεί οι παίκτες να συμμετείχαν σε: 6,5,4,4,4,3,1,1 αγώνες αντίστοιχα;

1. Σε ένα τουρνουά με 8 παίκτες μπορεί οι παίκτες να συμμετείχαν σε: 6,5,4,4,4,3,1,1 αγώνες αντίστοιχα; Ασκήσεις υποδειγματικές για το θεωρητικό μέρος του μαθήματος Α1. Εξετάστε αν είναι Σωστή ή Λάθος κάθε μία από τις επόμενες προτάσεις. Εξηγείστε την απάντησή σας. 1. Σε ένα τουρνουά με 8 παίκτες μπορεί

Διαβάστε περισσότερα

Network Science Θεωρεία Γραφηµάτων (1)

Network Science Θεωρεία Γραφηµάτων (1) Network Science Θεωρεία Γραφηµάτων (1) Network Theory: Graph Theory Section 1 Οι γέφυρες του Konigsberg THE BRIDGES OF KONIGSBERG Network Science: Graph Theory THE BRIDGES OF KONIGSBERG Network Science:

Διαβάστε περισσότερα

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΓΡΑΦΩΝ Οι γράφοι μας επιτρέπουν να αποτυπώσουμε τη δομή διαφόρων κοινωνικών δικτύων δεδομένου ότι μπορούν να αναπαραστήσουν σχέσεις ανάμεσα σε ένα σύνολο αντικειμένων. Ένας γράφος αποτελείται

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ EΠΙΚΟΙΝΩΝΙΩΝ, ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Μελέτη Επίδρασης Μεταβολής Δικτύου σε Μετρικές Ανάλυσης

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα 9 Απριλίου 2009 1 / 0 Παραδείγµατα γράφων

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς

Ν. Μ. Σγούρος Κοινωνικά Δίκτυα Τμ. Ψηφιακών Συστημάτων, Παν. Πειραιώς ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΥΝΔΕΣΜΩΝ ΣΕ ΚΟΙΝΩΝΙΚΑ ΔΙΚΤΥΑ Ενώ τα μοντέλα που εξετάσαμε στην προηγούμενη ενότητα είναι αρκετά γενικά και μπορούν να περιγράψουν πέρα από κοινωνικά και βιολογικά ή φυσικά συστήματα (π.χ.

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Αφηρημένες

Διαβάστε περισσότερα

Θεωρία Γραφημάτων 6η Διάλεξη

Θεωρία Γραφημάτων 6η Διάλεξη Θεωρία Γραφημάτων 6η Διάλεξη Α. Συμβώνης Εθνικο Μετσοβειο Πολυτεχνειο Σχολη Εφαρμοσμενων Μαθηματικων και Φυσικων Επιστημων Τομεασ Μαθηματικων Φεβρουάριος 2016 Α. Συμβώνης (ΕΜΠ) Θεωρία Γραφημάτων 6η Διάλεξη

Διαβάστε περισσότερα

3. Κατανομές πιθανότητας

3. Κατανομές πιθανότητας 3. Κατανομές πιθανότητας Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ.

Διαβάστε περισσότερα

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2) Κεφάλαιο 10 Συνεχείς τυχαίες μεταβλητές Σε αυτό το κεφάλαιο θα εξετάσουμε τις ιδιότητες που έχουν οι συνεχείς τυχαίες μεταβλητές. Εκείνες οι Τ.Μ. X, δηλαδή, των οποίων το σύνολο τιμών δεν είναι διακριτό,

Διαβάστε περισσότερα

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems Ημερομηνία Παράδοσης: 0/1/017 την ώρα του μαθήματος ή με email: mkarabin@csd.uoc.gr Γενικές Οδηγίες α) Επιτρέπεται η αναζήτηση στο Internet και στην βιβλιοθήκη

Διαβάστε περισσότερα

3. Προσομοίωση ενός Συστήματος Αναμονής.

3. Προσομοίωση ενός Συστήματος Αναμονής. 3. Προσομοίωση ενός Συστήματος Αναμονής. 3.1. Διατύπωση του Προβλήματος. Τα συστήματα αναμονής (queueing systems), βρίσκονται πίσω από τα περισσότερα μοντέλα μελέτης της απόδοσης υπολογιστικών συστημάτων,

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση) TETY Εφαρμοσμένα Μαθηματικά Ενότητα ΙΙ: Γραμμική Άλγεβρα Ύλη: Διανυσματικοί χώροι και διανύσματα, μετασχηματισμοί διανυσμάτων, τελεστές και πίνακες, ιδιοδιανύσματα και ιδιοτιμές πινάκων, επίλυση γραμμικών

Διαβάστε περισσότερα

Κεφάλαιο 3. Γραφήµατα v1.0 ( ) Χρησιµοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Κεφάλαιο 3. Γραφήµατα v1.0 ( ) Χρησιµοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne. Κεφάλαιο 3 Γραφήµατα v1.0 (2010-05-25) Χρησιµοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne. 1 3.1 Βασικοί Ορισµοί και Εφαρµογές γραφήµατα γράφηµα G: ένας τρόπος κωδικοποίησης των σχέσεων

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ 1 ΕΙΚΟΣΤΟ ΠΡΩΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

ΑΝΑΛΥΣΗ 1 ΕΙΚΟΣΤΟ ΠΡΩΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης. ΑΝΑΛΥΣΗ ΕΙΚΟΣΤΟ ΠΡΩΤΟ ΜΑΘΗΜΑ, --3 Μ. Παπαδημητράκης. Τώρα θα δούμε μια ακόμη εφαρμογή του Κριτηρίου του Ολοκληρώματος. Παράδειγμα. Γνωρίζουμε ότι η αρμονική σειρά αποκλίνει στο +, το οποίο φυσικά σημαίνει

Διαβάστε περισσότερα

Ηλεκτρονικός οδηγός για τους φοιτητές ενός Α.Ε.Ι.

Ηλεκτρονικός οδηγός για τους φοιτητές ενός Α.Ε.Ι. Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε. Ηλεκτρονικός οδηγός για τους φοιτητές ενός Α.Ε.Ι. Πτυχιιακή Εργασίία Φοιτητής: Δημήτριος Παπαοικονόμου ΑΜ: 36712

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

Γράφηµα (Graph) Εργαστήριο 10. Εισαγωγή

Γράφηµα (Graph) Εργαστήριο 10. Εισαγωγή Εργαστήριο 10 Γράφηµα (Graph) Εισαγωγή Στην πληροφορική γράφηµα ονοµάζεται µια δοµή δεδοµένων, που αποτελείται από ένα σύνολο κορυφών ( vertices) (ή κόµβων ( nodes» και ένα σύνολο ακµών ( edges). Ενας

Διαβάστε περισσότερα

u v 4 w G 2 G 1 u v w x y z 4

u v 4 w G 2 G 1 u v w x y z 4 Διάλεξη :.0.06 Θεωρία Γραφημάτων Γραφέας: Σ. Κ. Διδάσκων: Σταύρος Κολλιόπουλος. Εισαγωγικοί ορισμοί Ορισμός. Γράφημα G καλείται ένα ζεύγος G = (V, E) όπου V είναι το σύνολο των κορυφών (ή κόμβων) και E

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Προβλήματα Ελάχιστου Κόστους Ροής σε Δίκτυο. Δίκτυα Ροής Ελάχιστου Κόστους (Minimum Cost Flow Networks)

Προβλήματα Ελάχιστου Κόστους Ροής σε Δίκτυο. Δίκτυα Ροής Ελάχιστου Κόστους (Minimum Cost Flow Networks) Προβλήματα Ελάχιστου Κόστους Ροής σε Δίκτυο Ορισμοί Παραδείγματα Δικτυακή Simplex (προβλήματα με και χωρίς φραγμούς). Δίκτυα Ροής Ελάχιστου Κόστους (Minimum ost Flow Networks) Ένα δίκτυο μεταφόρτωσης αποτελείται

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος 3

Περιεχόμενα. Πρόλογος 3 Πρόλογος Η χρησιμότητα της Γραμμικής Άλγεβρας είναι σχεδόν αυταπόδεικτη. Αρκεί μια ματιά στο πρόγραμμα σπουδών, σχεδόν κάθε πανεπιστημιακού τμήματος θετικών επιστημών, για να διαπιστώσει κανείς την παρουσία

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Στα προηγούμενα (σελ. 7), δώσαμε μια πρώτη, γενική, διατύπωση του Κεντρικού Οριακού Θεωρήματος (Κ.Ο.Θ.) και τη γενική ιδέα για το πώς το Κ.Ο.Θ. εξηγεί το μεγάλο εύρος εφαρμογής

Διαβάστε περισσότερα

Συνδυαστική Απαρίθμηση Υπολογισμός αριθμού διαφορετικών αποτελεσμάτων πειράματος (με συνδυαστικά επιχειρήματα)

Συνδυαστική Απαρίθμηση Υπολογισμός αριθμού διαφορετικών αποτελεσμάτων πειράματος (με συνδυαστικά επιχειρήματα) Συνδυαστική Απαρίθμηση Υπολογισμός αριθμού διαφορετικών αποτελεσμάτων πειράματος (με συνδυαστικά επιχειρήματα) Πείραμα: διαδικασία που παράγει πεπερασμένο σύνολο αποτελεσμάτων Πληθικός αριθμός συνόλου

Διαβάστε περισσότερα

Σχέσεις, Ιδιότητες, Κλειστότητες

Σχέσεις, Ιδιότητες, Κλειστότητες Σχέσεις, Ιδιότητες, Κλειστότητες Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Ο. Τελέλης Πανεπιστήµιο Πειραιώς Σχέσεις 1 / 26 Εισαγωγή & Ορισµοί ιµελής Σχέση R από

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

Κεφάλαιο 4ο: Δικτυωτή Ανάλυση

Κεφάλαιο 4ο: Δικτυωτή Ανάλυση Κεφάλαιο ο: Δικτυωτή Ανάλυση. Εισαγωγή Η δικτυωτή ανάλυση έχει παίξει σημαντικό ρόλο στην Ηλεκτρολογία. Όμως, ορισμένες έννοιες και τεχνικές της δικτυωτής ανάλυσης είναι πολύ χρήσιμες και σε άλλες επιστήμες.

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα. ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα. Στα παραπάνω ιστογράμματα, παρατηρούμε, ότι αν και υπάρχει διαφορά στη διασπορά των τιμών

Διαβάστε περισσότερα

pdf: X U(a, b) 0, x < a 1 b a, a x b 0, x > b

pdf: X U(a, b) 0, x < a 1 b a, a x b 0, x > b Πιθανότητες και Αρχές Στατιστικής (8η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 41 Περιεχόμενα

Διαβάστε περισσότερα

2 ) d i = 2e 28, i=1. a b c

2 ) d i = 2e 28, i=1. a b c ΑΣΚΗΣΕΙΣ ΘΕΩΡΙΑΣ ΓΡΑΦΩΝ (1) Εστω G απλός γράφος, που έχει 9 κορυφές και άθροισμα βαθμών κορυφών μεγαλύτερο του 7. Αποδείξτε ότι υπάρχει μια κορυφή του G με βαθμό μεγαλύτερο ή ίσο του 4. () Αποδείξτε ότι

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός Κατευθυνόμενα γραφήματα Μαθηματικά Πληροφορικής 6ο Μάθημα Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Κατευθυνόμενο γράφημα G είναι ένα ζεύγος (V, E ) όπου V πεπερασμένο σύνολο του οποίου

Διαβάστε περισσότερα

n ίδια n διαφορετικά n n 0 n n n 1 n n n n 0 4

n ίδια n διαφορετικά n n 0 n n n 1 n n n n 0 4 Διακριτά Μαθηματικά Ι Επαναληπτικό Μάθημα 1 Συνδυαστική 2 Μεταξύ 2n αντικειμένων, τα n είναι ίδια. Βρείτε τον αριθμό των επιλογών n αντικειμένων από αυτά τα 2n αντικείμενα. Μεταξύ 3n + 1 αντικειμένων τα

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε. ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε Πτυχιακή Εργασία Φοιτητής: Γεμενής Κωνσταντίνος ΑΜ: 30931 Επιβλέπων Καθηγητής Κοκκόσης Απόστολος Λέκτορας

Διαβάστε περισσότερα

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας Διάλεξη 13: Παραλλαγές Μηχανών Turing και Περιγραφή Αλγορίθμων Τι θα κάνουμε σήμερα Εισαγωγή Πολυταινιακές Μηχανές Turing (3.2.1) Μη Ντετερμινιστικές Μηχανές

Διαβάστε περισσότερα

Τυχαία Γραφήματα. Τυχαία Δίκτυα. Τρία μοντέλα τυχαίων γραφημάτων Η συνάρτηση κατωφλίου και παραδείγματα με την R Μέσος βαθμός, μέσο μήκος μονοπατιών,

Τυχαία Γραφήματα. Τυχαία Δίκτυα. Τρία μοντέλα τυχαίων γραφημάτων Η συνάρτηση κατωφλίου και παραδείγματα με την R Μέσος βαθμός, μέσο μήκος μονοπατιών, Τυχαία Γραφήματα Τρία μοντέλα τυχαίων γραφημάτων Η συνάρτηση κατωφλίου και παραδείγματα με την R Μέσος βαθμός, μέσο μήκος μονοπατιών, Τυχαία Δίκτυα Ένα τυχαίο δίκτυο σχηματίζεται από ένα σύνολο V={v,v,,v

Διαβάστε περισσότερα

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος Περιγραφή μαθήματος Θεωρία Υπολογισμού Άρτιοι ΑΜ Σκοπός του μαθήματος είναι η εισαγωγή στη Θεωρία Υπολογισμού και στη Θεωρία Υπολογιστικής Πολυπλοκότητας (Θεωρία Αλγορίθμων). Διδάσκων: Σταύρος Κολλιόπουλος

Διαβάστε περισσότερα

Θεωρία Υπολογισμού Αρτιοι ΑΜ Διδάσκων: Σταύρος Κολλιόπουλος eclass.di.uoa.gr

Θεωρία Υπολογισμού Αρτιοι ΑΜ Διδάσκων: Σταύρος Κολλιόπουλος eclass.di.uoa.gr Θεωρία Υπολογισμού Άρτιοι ΑΜ Διδάσκων: Σταύρος Κολλιόπουλος eclass.di.uoa.gr Περιγραφή μαθήματος Σκοπός του μαθήματος είναι η εισαγωγή στη Θεωρία Υπολογισμού και στη Θεωρία Υπολογιστικής Πολυπλοκότητας

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@fme.aegean.gr Τηλ: 7035468 σ-άλγεβρα

Διαβάστε περισσότερα

ΗΥ-121: Ηλεκτρονικά Κυκλώματα Γιώργος Δημητρακόπουλος. Βασικές Αρχές Ηλεκτρικών Κυκλωμάτων

ΗΥ-121: Ηλεκτρονικά Κυκλώματα Γιώργος Δημητρακόπουλος. Βασικές Αρχές Ηλεκτρικών Κυκλωμάτων Πανεπιστήμιο Κρήτης Τμήμα Επιστήμης Υπολογιστών ΗΥ-121: Ηλεκτρονικά Κυκλώματα Γιώργος Δημητρακόπουλος Άνοιξη 2008 Βασικές Αρχές Ηλεκτρικών Κυκλωμάτων Ηλεκτρικό ρεύμα Το ρεύμα είναι αποτέλεσμα της κίνησης

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

d(v) = 3 S. q(g \ S) S

d(v) = 3 S. q(g \ S) S Διάλεξη 9: 9.11.2016 Θεωρία Γραφημάτων Διδάσκων: Σταύρος Κολλιόπουλος Γραφέας: Παναγιωτίδης Αλέξανδρος Θεώρημα 9.1 Εστω γράφημα G = (V, E), υπάρχει τέλειο ταίριασμα στο G αν και μόνο αν για κάθε S υποσύνολο

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ ΚΑΤΑΝΟΜΈΣ ΚΕΦΑΛΑΙΟ 8 81 Εισαγωγή Οι κατανομές διακρίνονται σε κατανομές συχνοτήτων, κατανομές πιθανοτήτων και σε δειγματοληπτικές κατανομές Στη συνέχεια θα γίνει αναλυτική περιγραφή αυτών 82 Κατανομές

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή

Διαβάστε περισσότερα

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός Κατευθυνόμενα γραφήματα Μαθηματικά Πληροφορικής 6ο Μάθημα Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Κατευθυνόμενο γράφημα G είναι ένα ζεύγος (V, E ) όπου V πεπερασμένο σύνολο του οποίου

Διαβάστε περισσότερα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας. Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς

Διαβάστε περισσότερα

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ Διάλεξη 9: Εισαγωγή στους Γράφους Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Γράφοι - ορισμοί και υλοποίηση Διάσχιση Γράφων Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Διαβάστε περισσότερα

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία

Διαβάστε περισσότερα

Στοιχεία Θεωρίας Γράφων (Graph Theory)

Στοιχεία Θεωρίας Γράφων (Graph Theory) Στοιχεία Θεωρίας Γράφων (Graph Theory) Ε Εξάμηνο, Τμήμα Πληροφορικής & Τεχνολογίας Υπολογιστών ΤΕΙ Λαμίας plam@inf.teilam.gr, Οι διαφάνειες βασίζονται στα βιβλία:. Αλγόριθμοι, Σχεδιασμός & Ανάλυση, η έκδοση,

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ. ΤΜΗΜΑ ΠΜΣ.. ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ο ΤΙΤΛΟΣ ΤΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΜΕ ΚΕΦΑΛΑΙΑ ΓΡΑΜΜΑΤΑ ΚΑΙ ΣΤΟΙΧΙΣΗ ΣΤΟ ΚΕΝΤΡΟ

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ. ΤΜΗΜΑ ΠΜΣ.. ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ο ΤΙΤΛΟΣ ΤΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΜΕ ΚΕΦΑΛΑΙΑ ΓΡΑΜΜΑΤΑ ΚΑΙ ΣΤΟΙΧΙΣΗ ΣΤΟ ΚΕΝΤΡΟ Εξώφυλλο ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ. ΤΜΗΜΑ ΠΜΣ.. ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ο ΤΙΤΛΟΣ ΤΗΣ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΜΕ ΚΕΦΑΛΑΙΑ ΓΡΑΜΜΑΤΑ ΚΑΙ ΣΤΟΙΧΙΣΗ ΣΤΟ ΚΕΝΤΡΟ Όνομα Επίθετο φοιτητή/τριας [Με πεζά στοιχεία και στοίχιση

Διαβάστε περισσότερα

Μιγαδικός λογισμός και ολοκληρωτικοί Μετασχηματισμοί

Μιγαδικός λογισμός και ολοκληρωτικοί Μετασχηματισμοί ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Μιγαδικός λογισμός και ολοκληρωτικοί Μετασχηματισμοί ΑΝΩΜΑΛΑ ΣΗΜΕΙΑ, ΠΟΛΟΙ ΚΑΙ ΤΟ ΘΕΩΡΗΜΑ ΤΩΝ ΟΛΟΚΛΗΡΩΤΙΚΩΝ ΥΠΟΛΟΙΠΩΝ Διδάσκων : Επίκ. Καθ. Κολάσης Χαράλαμπος

Διαβάστε περισσότερα

Οι βασικές λειτουργίες (ή πράξεις) που γίνονται σε μια δομή δεδομένων είναι:

Οι βασικές λειτουργίες (ή πράξεις) που γίνονται σε μια δομή δεδομένων είναι: ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ Μια δομή δεδομένων στην πληροφορική, συχνά αναπαριστά οντότητες του φυσικού κόσμου στον υπολογιστή. Για την αναπαράσταση αυτή, δημιουργούμε πρώτα ένα αφηρημένο μοντέλο στο οποίο προσδιορίζονται

Διαβάστε περισσότερα

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής

Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Κεφάλαιο 6: Προσομοίωση ενός συστήματος αναμονής Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Γιάννης Γαροφαλάκης Αν. Καθηγητής ιατύπωση του προβλήματος (1) Τα συστήματα αναμονής (queueing systems), βρίσκονται

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων

Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ Μοντελοποίηση, Ανάλυση και Σχεδιασμός Στοχαστικών Συστημάτων Ακαδ. Έτος 2017-2018 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής

Διαβάστε περισσότερα

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα. Η Διωνυμική Κατανομή Η Διωνυμική κατανομή συνδέεται με ένα πολύ απλό πείραμα τύχης. Ίσως το απλούστερο! Πρόκειται για τη δοκιμή Bernoulli, ένα πείραμα τύχης με μόνο δύο, αμοιβαίως αποκλειόμενα, δυνατά

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Θέμα 1. που. . Δηλαδή ο υπόχωρος V είναι το. Απάντηση 1α) ii)παρατηρούμε οτι

Θέμα 1. που. . Δηλαδή ο υπόχωρος V είναι το. Απάντηση 1α) ii)παρατηρούμε οτι Θέμα ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ι (ΘΕ ΠΛΗ ) ΕΝΔΕΙΚΤΙΚΕΣ ΛΥΣΕΙΣ ΤΕΛΙΚΗΣ ΕΞΕΤΑΣΗΣ Ιουνίου (οποιεσδήποτε άλλες ορθές απαντήσεις είναι αποδεκτές)

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

q(g \ S ) = q(g \ S) S + d = S.

q(g \ S ) = q(g \ S) S + d = S. Διάλεξη 9: 9.11.2016 Θεωρία Γραφημάτων Διδάσκων: Σταύρος Κολλιόπουλος Γραφέας: Παναγιωτίδης Αλέξανδρος & Σ. Κ. Θεώρημα 9.1 Εστω γράφημα G = (V, E), υπάρχει τέλειο ταίριασμα στο G αν και μόνο αν για κάθε

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ Μαθηματικά Σταύρος Παπαϊωάννου Ιούνιος Τίτλος Μαθήματος Περιεχόμενα Χρηματοδότηση. Σφάλμα! Δεν έχει οριστεί σελιδοδείκτης. Σκοποί Μαθήματος

Διαβάστε περισσότερα

Ορισμός και Ιδιότητες

Ορισμός και Ιδιότητες ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Ορισμός και Ιδιότητες H κανονική κατανομή norml distriution θεωρείται η σπουδαιότερη κατανομή της Θεωρίας Πιθανοτήτων και της Στατιστικής. Οι λόγοι που εξηγούν την εξέχουσα θέση της,

Διαβάστε περισσότερα

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα.

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα. i Π Ρ Ο Λ Ο Γ Ο Σ Το βιβλίο αυτό αποτελεί μια εισαγωγή στα βασικά προβλήματα των αριθμητικών μεθόδων της υπολογιστικής γραμμικής άλγεβρας (computational linear algebra) και της αριθμητικής ανάλυσης (numerical

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

Τυχαία μεταβλητή (τ.μ.)

Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) είναι μια συνάρτηση X ( ) με πεδίο ορισμού το δειγματικό χώρο Ω του πειράματος και πεδίο τιμών ένα υποσύνολο πραγματικών αριθμών που συμβολίζουμε συνήθως

Διαβάστε περισσότερα

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής Περιεχόμενα ενότητας Εισαγωγή Συλλογή

Διαβάστε περισσότερα

Στοχαστικές Στρατηγικές. διαδρομής (1)

Στοχαστικές Στρατηγικές. διαδρομής (1) Στοχαστικές Στρατηγικές η ενότητα: Το γενικό πρόβλημα ελάχιστης διαδρομής () Τμήμα Μαθηματικών, ΑΠΘ Ακαδημαϊκό έτος 08-09 Χειμερινό Εξάμηνο Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & Πανεπιστήμιο

Διαβάστε περισσότερα

8.1 Διαγωνοποίηση πίνακα

8.1 Διαγωνοποίηση πίνακα Κεφάλαιο 8 Κανονικές μορφές από 6 Κεφάλαιο 8 Κ Α Ν Ο Ν Ι Κ Ε Σ Μ Ο Ρ Φ Ε Σ 8. Διαγωνοποίηση πίνακα Ορισμός 8.α Ένας πίνακας M n ( ) oνομάζεται διαγωνοποιήσιμος στο αν υπάρχει αντιστρέψιμος πίνακας P M

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

ΜΑΘΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ ΚΕΦΑΛΑΙΟ 1 ο : ΔΙΑΝΥΣΜΑΤΑ 1 ΜΑΘΗΜΑ 1 ο +2 ο ΕΝΝΟΙΑ ΔΙΑΝΥΣΜΑΤΟΣ Διάνυσμα ορίζεται ένα προσανατολισμένο ευθύγραμμο τμήμα, δηλαδή ένα ευθύγραμμο τμήμα

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 1: Δικτυωτή Ανάλυση (Θεωρία Γράφων)

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 1: Δικτυωτή Ανάλυση (Θεωρία Γράφων) Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 1: Δικτυωτή Ανάλυση (Θεωρία Γράφων) Μπεληγιάννης Γρηγόριος Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διοίκησης Επιχειρήσεων Αγροτικών Προϊόντων & Τροφίμων

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

7. ΑΝΩΜΑΛΑ ΣΗΜΕΙΑ, ΠΟΛΟΙ ΚΑΙ ΤΟ ΘΕΩΡΗΜΑ ΤΩΝ ΟΛΟΚΛΗΡΩΤΙΚΩΝ ΥΠΟΛΟΙΠΩΝ. και σε κάθε γειτονιά του z

7. ΑΝΩΜΑΛΑ ΣΗΜΕΙΑ, ΠΟΛΟΙ ΚΑΙ ΤΟ ΘΕΩΡΗΜΑ ΤΩΝ ΟΛΟΚΛΗΡΩΤΙΚΩΝ ΥΠΟΛΟΙΠΩΝ. και σε κάθε γειτονιά του z 7. ΑΝΩΜΑΛΑ ΣΗΜΕΙΑ, ΠΟΛΟΙ ΚΑΙ ΤΟ ΘΕΩΡΗΜΑ ΤΩΝ ΟΛΟΚΛΗΡΩΤΙΚΩΝ ΥΠΟΛΟΙΠΩΝ Ένα σημείο λέγεται ανώμαλο σημείο της συνάρτησης f( ) αν η f( ) δεν είναι αναλυτική στο και σε κάθε γειτονιά του υπάρχει ένα τουλάχιστον

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ Μαθηματικά Σταύρος Παπαϊωάννου Ιούνιος 05 Τίτλος Μαθήματος Περιεχόμενα Χρηματοδότηση.. Σφάλμα! Δεν έχει οριστεί σελιδοδείκτης. Σκοποί Μαθήματος

Διαβάστε περισσότερα

Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android

Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Τμήμα Ηλεκτρονικών Μηχανικών Τ.Ε. Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android Πτυχιακή Εργασία Φοιτητής:

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόγχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόγχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός Κατευθυνόμενα γραφήματα Μαθηματικά Πληροφορικής 6ο Μάθημα Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Κατευθυνόμενο γράφημα G είναι ένα ζεύγος (V, E ) όπου V πεπερασμένο σύνολο του οποίου

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

1 ο ΦΥΛΛΑΔΙΟ ΑΣΚΗΣΕΩΝ - ΑΛΓΟΡΙΘΜΟΙ

1 ο ΦΥΛΛΑΔΙΟ ΑΣΚΗΣΕΩΝ - ΑΛΓΟΡΙΘΜΟΙ Δ.Π.Θ. - Πολυτεχνική Σχολή Τμήμα Μηχανικών Παραγωγής & Διοίκησης Ακαδ. έτος 2017-2018 Τομέας Συστημάτων Παραγωγής Εξάμηνο A Αναπληρωτής Καθηγητής Στέφανος Δ. Κατσαβούνης 03 ΟΚΤ 2017 ΜΑΘΗΜΑ : ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΚΕΦΑΛΑΙΟ 11 ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ Θα εισαγάγουμε την έννοια του τυχαίου αριθμού με ένα παράδειγμα. Παράδειγμα: Θεωρούμε μια τυχαία μεταβλητή με συνάρτηση πιθανότητας η οποία σε

Διαβάστε περισσότερα

1.2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας

1.2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας .2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας Θέμα της δραστηριότητας Αυτή η δραστηριότητα εισάγει στην έννοια του Ορίου Ακολουθίας. Δυο φύλλα εργασίας οδηγούν τους μαθητές στον ορισμό της σύγκλισης μηδενικής

Διαβάστε περισσότερα

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου . Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου Σ αυτή την παράγραφο θα εξεταστεί μια παραλλαγή του προβλήματος της συντομότερης διαδρομής, το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου. Σ αυτό το πρόβλημα

Διαβάστε περισσότερα