Network Science Θεωρεία Γραφηµάτων (1) Network Theory: Graph Theory
Section 1 Οι γέφυρες του Konigsberg
THE BRIDGES OF KONIGSBERG Network Science: Graph Theory
THE BRIDGES OF KONIGSBERG Network Science: Graph Theory
THE BRIDGES OF KONIGSBERG Μπορεί κανείς να περπατήσει κατά µήκος των επτά γεφυρών και ποτέ να µην διασχίσει την ίδια γέφυρα δύο φορές; Network Science: Graph Theory
THE BRIDGES OF KONIGSBERG 1735: θεώρηµα Euler: Μπορεί κανείς να περπατήσει κατά µήκος των επτά γεφυρών και ποτέ να µην διασχίσει την ίδια γέφυρα δύο φορές; (a) Εάν ένα γράφηµα έχει περισσότερους από δύο κόµβους ζυγού βαθµού, δεν υπάρχει µονοπάτι. (b) Εάν ένα γράφηµα είναι συνδεδεµένο και δεν έχει ζυγό αριθµό κόµβων, έχει τουλάχιστον ένα µονοπάτι. Network Science: Graph Theory
Section 2 Δίκτυα και Γραφήµατα
Συνιστώσες ενός πολύπλοκου συστήματος Συνιστώσες: κόμβοι, κορυφές N Διασυνδέσεις: συνδέσεις, ακμές L Σύστημα: δίκτυο, γράφημα (N,L) Network Science: Graph Theory
Δίκτυα ή Γραφήματα? Δίκτυο: αναφέρεται συχνά σε πραγματικά συστήματα www, social network metabolic network Σύστημα επικοινωνίας, Γλώσσα: (Δίκτυο, κόμβος, σύνδεση) Γράφημα: μαθηματική αναπαράσταση ενός Δικτύου γράφημα web, κοινωνικό γράφημα (π.χ. ένας όρος του Facebook) Σύστημα επικοινωνίας, Γλώσσα: (Γράφημα, κορυφή, ακμή) Εμείς θα προσπαθήσουμε να κάνουμε αυτή τη διάκριση, όποτε κρίνεται σκόπιμο, αλλά στις περισσότερες περιπτώσεις θα χρησιμοποιήσουμε τους δύο όρους εναλλακτικά. Network Science: Graph Theory
Μια κοινή Γλώσσα N=4 L=4 Network Science: Graph Theory
Επιλογή κατάλληλης αναπαράστασης Η επιλογή της σωστής αναπαράστασης του δικτύου καθορίζει την ικανότητά μας να χρησιμοποιούμε τη θεωρία του δικτύου με επιτυχία. Σε ορισμένες περιπτώσεις υπάρχει μια μοναδική, σαφής αναπαράσταση. Σε άλλες περιπτώσεις, η αναπαράσταση δεν είναι με κανένα τρόπο μοναδική. Για παράδειγμα, ο τρόπος που ανατίθενται οι δεσμοί μεταξύ μιας ομάδας ατόμων, θα καθορίσει τη φύση του προβλήματος που μπορούμε να μελετήσουμε. Network Science: Graph Theory
Επιλογή κατάλληλης αναπαράστασης Εάν συνδεθούν τα άτομα που εργάζονται (το ένα με το άλλο), μέσα σε ένα δίκτυο, θα μπορέσουμε να διερευνήσουμε το επαγγελματικό δίκτυο μιας εταιρείας. Network Science: Graph Theory
Επιλογή κατάλληλης αναπαράστασης Εάν συνδεθούν εκείνοι που έχουν μια ρομαντική και σεξουαλική σχέση, θα είμαστε σε διερεύνηση των σεξουαλικών δικτύων. Network Science: Graph Theory
Επιλογή κατάλληλης αναπαράστασης Εάν συνδέσουμε όλα τα άτομα με βάση το όνομά τους (για παράδειγμα όλοι με μικρό όνομα Παναγιώτης να συνδεθούν μεταξύ τους), τι θα διερευνήσουμε; Πρόκειται για ένα δίκτυο, παρ 'όλα αυτά. Network Science: Graph Theory
Μη κατευθυνόμενα VS. Κατευθυνόμενα Δίκτυα Μη κατευθυνόμενα Links: Μη κατευθυνόμενα (symmetrical) Κατευθυνόμενα Links: Κατευθυνόμενα (arcs). Graph: B A C D Undirected links : Δίκτυο συντακτικών ομάδων Δίκτυο Ηθοποιών Αλληλεπιδράσεις πρωτεϊνών L F G H M I A Digraph = Κατευθυνόμενο γράφημα: B G C Directed links : URLs στο World Wide Web Τηλεφωνικές κλίσεις Διεργασίες μεταβολισμού D F E Ένας μη κατευθυνόμενος σύνδεσμος είναι η επαλληλία των δύο απέναντι κατευθυνόμενων συνδέσεων. Network Science: Graph Theory
Section 2.2 Reference Networks NETWORK NODES LINKS DIRECTED N L UNDIRECTED Internet Routers Internet connections Undirected 192,244 609,066 WWW Power Grid Mobile Phone Calls Email Webpages Power plants, transformers Subscribers Email addresses Links Cables Calls Emails Directed Undirected Directed Directed 325,729 4,941 36,595 57,194 1,497,134 6,594 91,826 103,731 Science Collaboration Scientists Co-authorship Undirected 23,133 93,439 Actor Network Actors Co-acting Undirected 702,388 29,397,908 Citation Network Paper Citations Directed 449,673 4,689,479 E. Coli Metabolism Metabolites Chemical reactions Directed 1,039 5,802 Protein Interactions Proteins Binding interactions Undirected 2,018 2,930
Section 2.3 Βαθµός, Μέσος Βαθµός και Βαθµός Διανοµής Network Theory: Degree Distribution
Section 2.3 Εάν υποθέσουµε ότι ο βαθµός είναι k, τότε ισχύει: Μέσος βαθµός Ο βαθµός k ενός κόµβου είναι ο αριθµός των ακµών που συνδέονται µε αυτόν. Στενά συνδεδεµένη µε την πυκνότητα του δικτύου είναι ο µέσος βαθµός κ = 2Ε Ν Στο µοντέλο το τυχαίο γράφηµα ER, µπορούµε να υπολογίσουµε, Όπου p είναι η πιθανότητα δύο κόµβων να συνδέονται. κ = p(ν 1)
Section 2.3 Αν περιοριστούµε σε ένα µη κατευθυνόµενο δίκτυο για την ώρα, τότε ο βαθµός ενός κόµβου i είναι µόνο ο αριθµός των συνδέσεων που έχει. k i = j a ij όπου i ο αριθµός των κορυφών της γειτνίασης Α. όπου Σ είναι το άθροισµα των κόµβων του δικτύου. Στη συνέχεια µπορεί να αποκτήσει κάποια στοιχεία σχετικά µε τη δοµή του δικτύου µε την εξαγωγή από πληροφορίες σχετικά µε το δίκτυο εκτός από τους βαθµούς των κόµβων της. Με την καταµέτρηση που κάνουµε για το πόσοι κόµβοι έχουν κάθε βαθµό, αποτελούν τη διανοµή βαθµού P deg (k), που ορίζεται από P deg (k) = κλάσµα των κόµβων στο γράφηµα µε βαθµό k.
Βαθμοί Κόμβων Undirected A B Βαθμός κόμβων: ο αριθμός των συνδέσεων στον κόμβο. k A =1 k B = 4 Directed A B G C D F E Σε κατανεμημένα δίκτυα μπορούμε να ορίσουμε δύο έννοιες, την έσω-βαθμού και την έξω-βαθμού. Ο (συνολικός) βαθμός είναι το άθροισμα των εντός και εκτός βαθμού. k in = C 2 k out C = 1 k C = 3 Πηγή: ένας κόμβος με k in = 0; Βύθιση: ένας κόμβος με k out = 0. k j in = N i=1 A ij
Μερικά Στατιστικά Σύντομη επισκόπηση των στατιστικών Τέσσερις βασικές ιδιότητες χαρακτηρίζουν ένα δείγμα από Ν τιμές x 1,, x N : Τυπική απόκλιση Μέσος όρος (σημαίνει) Διανομή του x: η νιοστή στιγμή: Όταν το p x ακολουθεί τον κανόνα Network Science: Graph Theory
Μέσος Βαθμός Undirected j i k 1 N N i=1 k i k 2L N N = ο αριθμός των κόμβων στο γράφημα Directed A B C D F E k in 1 N N k in i, k out 1 N i=1 N k out i, k in = k out i=1 k L N Network Science: Graph Theory
Μέσος Βαθμός NETWORK NODES LINKS DIRECTED N L k UNDIRECTED Internet Routers Internet connections Undirected 192,244 609,066 6.33 WWW Power Grid Mobile Phone Calls Email Webpages Power plants, transformers Subscribers Email addresses Links Cables Calls Emails Directed Undirected Directed Directed 325,729 4,941 36,595 57,194 1,497,134 6,594 91,826 103,731 4.60 2.67 2.51 1.81 Science Collaboration Scientists Co-authorship Undirected 23,133 93,439 8.08 Actor Network Actors Co-acting Undirected 702,388 29,397,908 83.71 Citation Network Paper Citations Directed 449,673 4,689,479 10.43 E. Coli Metabolism Metabolites Chemical reactions Directed 1,039 5,802 5.58 Protein Interactions Proteins Binding interactions Undirected 2,018 2,930 2.90 Network Science: Graph Theory
Βαθμός Διανομής Βαθμός διανομής P(k): η πιθανότητα ένας τυχαία επιλεγμένος κόμβος έχει τιμή k Nk = # κόμβοι με βαθμό k P(k) = Nk / N κατανομή
Βαθμός Διανομής Image 2.4b
Βαθμός Διανομής Διακριτή αναπαράσταση: p k είναι η πιθανότητα ένας κόμβος να έχει βαθμό k. Continuum Description: p(k) είναι οι βαθμοί, όπου k 2 p(k)dk k 1 Παρουσιάζει την πιθανότητα ο βαθμός ενός κόμβου να είναι k 1 and k 2. Ομαλοποίηση κατάστασης: 0 p k =1 p(k)dk =1 K min Όπου K min είναι ο μικρότερος βαθμός στο δίκτυο. Network Science: Graph Theory
Section 2.4 Πίνακας Γειτνίασης
Πίνακας Γειτνίασης 4 4 1 2 3 1 2 3 A ij =1 A ij =0 A ij = 1 εάν υπάρχει σύνδεση μεταξύ του κόμβου i και j A ij = 0 εάν οι κόμβοι i και j δεν είναι συνδεδεμένοι μεταξύ τους. A ij = 0 B @ 0 1 0 1 1 0 0 1 0 0 0 1 1 1 1 0 1 C A A ij = Σημειώστε ότι για ένα κατευθυνόμενο γράφημα (δεξιά) ο πίνακας δεν είναι συμμετρικός. αν υπάρχει σύνδεσμος που σημειώνεται από τον κόμβο j στον i αν δεν υπάρχει σύνδεσμος που σημειώνεται από τον j στον i 0 B @ 0 0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 1 C A
Πίνακας Γειτνίασης και Βαθμοί Κόμβων Undirected 1 4 2 3 A ij = 0 1 0 1 1 0 0 1 0 0 0 1 1 1 1 0 A ij = A ji A ii = 0 k i = N j =1 A ij k j = A ij N N i =1 L = 1 k 2 i = 1 2 i =1 N ij A ij Directed 1 4 2 3 A ij = 0 0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 A ij A ji A ii = 0 L = k in i = k j out = NX j=1 N i=1 A ij A ij N N in out k i = k j i=1 j =1 N = A ij i, j
Πίνακας Γειτνίασης a e a b c d e f g h a 0 1 0 0 1 0 1 0 b 1 0 1 0 0 0 0 1 c 0 1 0 1 0 1 1 0 d 0 0 1 0 1 0 0 0 e 1 0 0 1 0 0 0 0 f 0 0 1 0 0 0 1 0 g 1 0 1 0 0 0 0 0 h 0 1 0 0 0 0 0 0 h b d f g c Network Science: Graph Theory
Πίνακας Γειτνίασης
Section 4 Τα πραγµατικά δίκτυα είναι σποραδικά
Ολοκληρωμένο Γράφημα Ο μέγιστος αριθμός των συνδέσμων όπου ένα δίκτυο από Ν κόμβους μπορεί να έχει είναι: L max = N = 2 N(N 1) 2 Ένα γράφημα με βαθμό L=L max καλείται ως ολοκληρωμένο γράφημα, και ο μέσος βαθμός του είναι < k > = N-1 Network Science: Graph Theory
Τα πραγματικά δίκτυα είναι σποραδικά Τα περισσότερα δίκτυα που παρατηρούνται στα πραγματικά συστήματα είναι ισχνά L << L max or <k> << N-1. WWW (ND Sample): N=325,729; L=1.4 10 6 L max =10 12 <k>=4.51 Protein (S. Cerevisiae): N= 1,870; L=4,470 L max =10 7 <k>=2.39 Coauthorship (Math): N= 70,975; L=2 10 5 L max =3 10 10 <k>=3.9 Movie Actors: N=212,250; L=6 10 6 L max =1.8 10 13 <k>=28.78 (Source: Albert, Barabasi, RMP2002) Network Science: Graph Theory
Τα πραγματικά δίκτυα είναι σποραδικά Network Science: Graph Theory
Ο Νόμος του METCALFE Ο μέγιστος αριθμός συνδέσμων τους οποίους ένα δίκτυο από N κόμβους μπορεί να έχει είναι: Lmax = N = 2 N(N 1) 2 Network Science: Graph Theory
Section 2.6 ΣΤΑΘΜΙΣΜΕΝΟ ΚΑΙ ΜΗ ΣΤΑΘΜΙΣΜΕΝΟ ΔΙΚΤΥΟ
ΣΤΑΘΜΙΣΜΕΝΟ ΚΑΙ ΜΗ ΣΤΑΘΜΙΣΜΕΝΟ ΔΙΚΤΥΟ
METCALFE S LAW Network Science: Graph Theory
Section 2.7 ΔΙΜΕΡΕΣ ΔΙΚΤΥΑ Ανεξάρτητο σύνολο: σύνολο κορυφών που δεν συνδέονται με ακμη. Υπάρχει διαμέριση κορυφών σε δύο ανεξάρτητα σύνολα. G(X, Y, E): X και Y ανεξάρτητα σύνολα, ακμές μόνο μεταξυ κορυφών Χ και Υ. G διμερές αν χ(g) 2. G διμερές αν δεν έχει κύκλους περιττου μήκους. Κύκλος n κορυφών C n : διμερές αν n άρτιος. Πλήρες διμερές γράφημα Κ n,m : Δύο ανεξάρτητα σύνολα με n και m κορυφές. Όλες οι n m ακμές μεταξυ τους. Π.χ. Κ 3,3 έχει 9 ακμές.
ΔΙΜΕΡΕΣ ΓΡΑΦΗΜΑΤΑ Διμερές γράφημα (ή διγράφημα) είναι ένα γράφημα, οι κόμβοι του οποίου μπορεί να διαιρεθούν σε δύο ξένα μεταξύ τους σύνολα U και V κατά τρόπο τέτοιο ώστε, κάθε σύνδεσμος να συνδέει ένα κόμβο σε U σε μία στις V. Δηλαδή, U και V είναι ανεξάρτητα σύνολα. Παραδείγματα: Δίκτυο ηθοποιών του Hollywood Δικτύων συνεργασίας Το δίκτυο μιας νόσου (diseasome) Network Science: Graph Theory
Γονιδιακό Δίκτυο Δίκτυο Νόσων DISEASOME PHENOME GENOME Γονιδιακό δίκτυο Δίκτυο Νόσων Goh, Cusick, Valle, Childs, Vidal & Barabási, PNAS (2007) Network Science: Graph Theory
Δίκτυο ανθρώπινων νόσων
Συστατικό-Γεύση: Διμερές Δίκτυο Y.-Y. Ahn, S. E. Ahnert, J. P. Bagrow, A.-L. Barabási Flavor network and the principles of food pairing, Scientific Reports 196, (2011). (http://www.nature.com/articles/srep00196)
Συστατικό-Γεύση: Διμερές Δίκτυο Y.-Y. Ahn, S. E. Ahnert, J. P. Bagrow, A.-L. Barabási Flavor network and the principles of food pairing, Scientific Reports 196, (2011). (http://www.nature.com/articles/srep00196)