Ανάλυση Βιολογικών Δικτύων Peripheral membrane proteins: visualization and analysis of interactions using graph theory Δρ. Μαργαρίτα Θεοδωροπούλου Πανεπιστήμιο Θεσσαλίας, Λαμία 2016
Εισαγωγή Πρωτεΐνες Πρωτεΐνες Μεμβρανικές Σφαιρικές Υδατοδιαλυτές Μικτές (Σφαιρικές Ινώδεις) Ινώδεις Pasquier, Claude, Vassilis J. Promponas, and Stavros J. Hamodrakas. "PRED CLASS: Cascading neural networks for generalized protein classification and genome wide applications." Proteins: Structure, Function, and Bioinformatics 44.3 (2001): 361-369.
Εισαγωγή Μεμβρανικές πρωτεΐνες (Λειτουργίες) Αποτελούν το 20-30% των πρωτεϊνών σε πλήρη προσδιορισμένα πρωτεώματα. Βασικές λειτουργίες μεμβρανικών πρωτεϊνών.
Εισαγωγή Μεμβρανικές πρωτεΐνες Κατηγορίες: 1. Διαμεμβρανικές 2. Περιφερειακές 3. Αγκυροβολημένες Σχηματική απεικόνιση της πλασματικής μεμβράνης ενός τυπικού ευκαρυωτικού κυττάρου.
Εισαγωγή Περιφερειακές μεμβρανικές πρωτεΐνες Σχηματική αναπαράσταση του τρόπου αλληλεπίδρασης των περιφερειακών μεμβρανικών πρωτεϊνών με την μεμβράνη.
Εισαγωγή Μεμβρανικές πρωτεΐνες Δομή και Λειτουργία Όλη η αναγκαία πληροφορία ώστε μια πρωτεΐνη να διπλωθεί στη φυσική της στερεοδομή, είναι κωδικοποιημένη στη γραμμική αμινοξική της ακολουθία σε δεδομένο περιβάλλον Sequence Structure Function Anfinsen CB (1973). "Principles that govern the folding of protein chains". Science 181 (4096): 223 230. All Proteins >40000 Membrane Proteins ~3000 http://bioinformatics.biol.uoa.gr/onlinetools.html
Εισαγωγή Μεμβρανικές πρωτεΐνες Δομή και Λειτουργία Sequence Structure Function Tools Experiments Databases
Σκοπός Peripherome Η συλλογή κι υπολογιστική ανάλυση των περιφερειακών μεμβρανικών πρωτεϊνών καθώς και η μελέτη των αλληλεπιδράσεων και της οργάνωσης τους στο επίπεδο της μεμβράνης. Το δίκτυο των αλληλεπιδράσεων των περιφερειακών μεμβρανικών πρωτεϊνών της πλασματικής μεμβράνης του ανθρώπου (Peripherome) Nastou K.C., Tsaousis G.N., Kremizas K.E., Litou Z.I., Hamodrakas S.J. The human plasma membrane peripherome: visualization and analysis. BioMed Research International, vol. 2014, Article ID 397145, 12 pages, 2014. doi:10.1155/2014/397145
Εισαγωγή Protein-protein interaction (PPI) biochemical transcriptional regulation Βιολογικά Δίκτυα Χαρακτηριστικά signal transduction Metabolic Regulatory networks (GRNs)
Θεωρεία Γράφων Ένας γράφος G μπορεί να οριστεί ως ένα ζεύγος (V,E) όπου το V είναι ένα σύνολο κορυφών που αντιπροσωπεύουν τους κόμβους (nodes) και το Ε είναι το σύνολο των ακμών (edges) που αντιπροσωπεύει τις συνδέσεις μεταξύ των κόμβων. Α. Απλός γράφος ( V = 4, E = 4) Β. Κατευθυνόμενος γράφος ( V = 4, E = 5) Γ. Γράφος με βάρη ( V = 4, E = 5) Δ. Διμερής γράφος ( V = 7, E = 6). Στους απλούς, μη κατευθυνόμενους γράφους, η σύνδεση μεταξύ δύο κόμβων i και j είναι απλή και τα i και j θεωρούνται γείτονες (neighbors). Pavlopoulos, Georgios A., et al. "Using graph theory to analyze biological networks." BioData mining 4.10 (2011): 1-27.
Θεωρεία Γράφων Protein-protein interaction (PPI) signal transduction biochemical Metabolic transcriptional regulation Regulatory networks (GRNs)
Θεωρεία Γράφων Ο βαθμός ενός κόμβου (node degree) σε έναν μη κατευθυνόμενο γράφο είναι ο αριθμός των συνδέσεων ή ακμών που έχει ο κόμβος αυτός με άλλους κόμβους και ορίζεται ως: deg i k i N i όπου N(i) ο αριθμός των γειτόνων του κόμβου i. Hubs (node degree>?, top%) Centrality-lethality rule static hubs (party hubs) dynamic hubs (date hubs) Αν ένας γράφος είναι κατευθυνόμενος τότε έχει δυο διαφορετικούς βαθμούς, τον εσωτερικό βαθμό (in-degree, αριθμός των εισερχόμενων ακμών) και τον εξωτερικό βαθμό (out-degree, αριθμός των εξερχόμενων ακμών) από τον κόμβο i. He, Xionglei, and Jianzhi Zhang. "Why do hubs tend to be essential in protein networks." PLoS Genet 2.6 (2006): e88. Ekman, Diana, et al. "What properties characterize the hub proteins of the protein-protein interaction network of Saccharomyces cerevisiae?." Genome biology 7.6 (2006): R45.
Η πυκνότητα ενός δικτύου (graph density) δείχνει πόσο αραιός ή πυκνός είναι ένας γράφος σύμφωνα με τον αριθμό των συνδέσεων μεταξύ των κόμβων και ορίζεται ως: ό 2E V V 1 Θεωρεία Γράφων όπου Ε ο αριθμός των ακμών. Αραιός γράφος (sparse graph) E k O V με 1<k<2 ή E V Πυκνός γράφος (dense graph) E V 2 Πλήρης γράφος (complete graph) E n n 1 2 Υποστηρίζεται ότι τα βιολογικά δίκτυα είναι γενικά αραιά συνδεδεμένα, καθώς αυτό προσδίδει ένα εξελικτικό πλεονέκτημα για τη διατήρηση της ευρωστίας τους. Barabasi, Albert-Laszlo, and Zoltan N. Oltvai. "Network biology: understanding the cell's functional organization." Nature reviews genetics 5.2 (2004): 101-113. Leclerc, Robert D. "Survival of the sparsest: robust gene networks are parsimonious." Molecular systems biology 4.1 (2008):
Θεωρεία Γράφων Σε ένα δίκτυο, ένα απλό μονοπάτι (simple path) είναι μία πορεία μεταξύ των κόμβων του δικτύου χωρίς να συναντάται ο ίδιος κόμβος δεύτερη φορά. Η απόσταση δ (i,j) από το i στο j είναι το μήκος του μικρότερου μονοπατιού από το i στο j σε ένα γράφο. Six degrees of separation Three degrees of influence Το μέσο μήκος μονοπατιού (average path length) και η διάμετρος ενός γράφου G ορίζονται αντίστοιχα ως η μέση και η μέγιστη τιμή δ (i,j) που λαμβάνεται από όλα τα ζεύγη των ξεχωριστών κόμβων. 2 N N 1 N N min i, j D max i, j min i 1 j 1 i,j Pavlopoulos, Georgios A., et al. "Using graph theory to analyze biological networks." BioData mining 4.10 (2011): 1-27.
Θεωρεία Γράφων Ο συντελεστής ομαδοποίησης (clustering coefficient) δείχνει την τάση ενός γράφου να χωρίζεται σε ομάδες (clusters). Μία ομάδα είναι ένα υποσύνολο κόμβων που περιέχουν πολλές ακμές που συνδέουν αυτούς τους κόμβους μεταξύ τους. C i k 2e k 1 όπου deg(i)=k και e οι ακμές μεταξύ των k γειτόνων του i στον G Α. O κόμβος V συμπεριφέρεται ως κεντρικός κόμβος (hub) άλλα έχει συντελεστή ομαδοποίησης 0, Β. Ο μέγιστος αριθμός των πιθανών συνδέσεων δίνεται από τον τύπο E max = V ( V -1)/2 όπου V =5 ο αριθμός των γειτόνων του κόμβου V, και άρα Ε max =10. Οι γείτονες του κόμβου V συνδέονται με 7 ακμές μεταξύ τους, E = {(V1, V2), (V2, V3), (V3, V4), (V4, V5), (V5, V1), (V1, V3), (V1, V4)}. Ο συντελεστής ομαδοποίησης του κόμβου V είναι C=E v /E max =7/10=0.7.
Χαρακτηριστικά Βιολογικών δικτύων Ανεξάρτητα από την κλίμακα (Scale free) degree distribution follows the power law few highly interconnected nodes Δίκτυα μικρού (ή πραγματικού) κόσμου (Small world) most nodes can be reached from every other by a small number of steps Οργανώνονται σε επιμέρους στοιχεία (Modular organization) group of physically or functionally linked molecules that work together to achieve a distinct function
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών Koh, Gavin CKW, et al. "Analyzing Protein Protein Interaction Networks."Journal of proteome research 11.4 (2012): 2014-2031.
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών TAP ( tandem affinity purification) Method used / text mining Number of supporting experiments http://www.ebi.ac.uk/training/online/screenshotpages/how-deal-complexes De Las Rivas, Javier, and Celia Fontanillo. "Protein-protein interactions essentials: key concepts to building and analyzing interactome networks."plos Comput Biol 6.6 (2010): e1000807.
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών De Las Rivas, Javier, and Celia Fontanillo. "Protein-protein interactions essentials: key concepts to building and analyzing interactome networks."plos Comput Biol 6.6 (2010): e1000807. Lehne, Benjamin, and Thomas Schlitt. "Protein-protein interaction databases: keeping up with growing interactomes." Human genomics 3.3 (2009): 291. Klingström, Tomas, and Dariusz Plewczynski. "Protein protein interaction and pathway databases, a graphical review." Briefings in bioinformatics 12.6 (2011): 702-713.
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών De Las Rivas, Javier, and Celia Fontanillo. "Protein-protein interactions essentials: key concepts to building and analyzing interactome networks."plos Comput Biol 6.6 (2010): e1000807. Lehne, Benjamin, and Thomas Schlitt. "Protein-protein interaction databases: keeping up with growing interactomes." Human genomics 3.3 (2009): 291. Klingström, Tomas, and Dariusz Plewczynski. "Protein protein interaction and pathway databases, a graphical review." Briefings in bioinformatics 12.6 (2011): 702-713.
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών International Molecular Exchange (IMEx) consortium http://www.imexconsortium.org/ A non-redundant set of protein-protein interaction data from a broad taxonomic range of organisms Expertly curated from direct submissions or peerreviewed journals to a consistent high standard. Available in standard formats MITAB or PSI-MI XML 2.5 Provided by a network of participating major public domain databases. Orchard, Sandra, et al. "Protein interaction data curation: the International Molecular Exchange (IMEx) consortium." Nature methods 9.4 (2012): 345-350.
Εισαγωγή Αλληλεπιδράσεις πρωτεϊνών - πρωτεϊνών IntAct MI-score Aranda, Bruno, et al. "PSICQUIC and PSISCORE: accessing and scoring molecular interactions." Nature methods 8.7 (2011): 528-529. Blankenburg, Hagen, and Mario Albrecht. "PSISCORE (Quality Scoring of Protein Interactions)." Encyclopedia of Systems Biology. Springer New York, 2013. 1801-1802. Mora, Antonio, and Ian M. Donaldson. "Effects of protein interaction data integration, representation and reliability on the use of network properties for drug target prediction." BMC bioinformatics 13.1 (2012): 294.
Εισαγωγή Human Interactome Human Interactome >100.000 protein-protein interactions Stumpf, Michael PH, et al. "Estimating the size of the human interactome." Proc Natl Acad Sci U S A 105.19 (2008): 6959-6964. Rolland, Thomas, et al. "A proteome-scale map of the human interactome network." Cell 159.5 (2014): 1212-1226.
Σκοπός Peripherome Το δίκτυο των αλληλεπιδράσεων των περιφερειακών μεμβρανικών πρωτεϊνών της πλασματικής μεμβράνης του ανθρώπου (Peripherome)
Μεθοδολογία Περιφερειακές μεμβρανικές πρωτεΐνες Dataset of 277 peripheral proteins of the human plasma membrane (UniProtKB) Collection of 4358 interactions for 238 peripheral membrane proteins (2136 first neighbors of peripheral proteins 2374 total) (IMEx) Collection of interactions amongst first neighbors Total 16961 interactions for 2374 proteins
Μεθοδολογία Περιφερειακές μεμβρανικές πρωτεΐνες Network Visualization and Analysis (Cytoscape) Graph-theory based analysis Functional analysis of network s proteins Clustering & Grouping based on subcellular location Analysis of peripheral membrane proteins interactions with drugs NetworkAnalyzer simple and complex topological parameters GO term slim classification and GO term enrichment analysis (WebGestalt) Markov Clustering (MCL algorithm) Drugbank Visualization with Arena3D
Αποτελέσματα Graph Theory simple parameters 238 περιφερειακές μεμβρανικές πρωτεΐνες 2374 Κόμβοι (πρωτεΐνες) 16691 Συνδέσεις (πρωτεϊνικές αλληλεπιδράσεις) Clustering Coefficient = 0.121 Characteristic Path Length = 3.260 Average number of Neighbors = 13.177 Network Density = 0.006
Αποτελέσματα Clustering coefficient (0.121) > clustering coefficient of a random network (4 10-4 ) Graph Theory simple parameters Average path length of our network (3.260) is small compared to that of a random network (7.550) Δίκτυο μικρού κόσμου (small world network) Στα δίκτυα αυτά είναι εφικτή η αποτελεσματική μετάδοση της πληροφορίας μεταξύ απομακρυσμένων κόμβων (μικρό μέσο μήκος μονοπατιού) ενώ ταυτόχρονα επεξεργάζονται αποτελεσματικά τοπικές πληροφορίες (υψηλός συντελεστής ομαδοποίησης) The subnetwork of AP2S1 ( ), a bottleneck connected with 3 other proteins ( ) connected with 510 other proteins in total.
Αποτελέσματα Graph Theory simple parameters Hubs (node degree>30) Bottlenecks (0.4<clustering coefficient<1.0 && 1.0<average shortest path length<3.5 ) Mouse Genome Database (MGD) gene knockout --> lethal phenotypes 52% of hubs 25% of bottlenecks Essential genes
Αποτελέσματα Graph Theory complex parameters Διαγράμματα των κατανομών σύνθετων παραμέτρων που χαρακτηρίζουν την τοπολογία του δικτύου που κατασκευάστηκε για τις περιφερειακές μεμβρανικές πρωτεΐνης της πλασματικής μεμβράνης.
Αποτελέσματα Graph Theory complex parameters P(k) ~k -γ 1.383 1015.8k P k Most cases 2<γ<3 γ<2 => the role of the hubs in the network becomes more important Ανεξάρτητο από την κλίμακα δίκτυο (scale free network) Οι πρωτεΐνες-κεντρικοί κόμβοι (hubs), αν και λίγες στον αριθμό, είναι υπεύθυνες για την συγκρότηση της ενότητας του δικτύου.
Αποτελέσματα Β Graph Theory complex parameters Hubs have low clustering coefficient Γ Hubs do not share neighbors, not clustered together Οι κατανομές Β και Γ υποδηλώνουν ότι το δίκτυο οργανώνεται σε επιμέρους στοιχεία (modular organization)
Αποτελέσματα Graph Theory
Αποτελέσματα Network Subcellular Locations 4 εκκρινόμενες πρωτεΐνες (1) μεμβρανικές πρωτεΐνες (2) περιφερειακές πρωτεΐνες (3) κυτταροπλασματικές πρωτεΐνες (4) πυρηνικές πρωτεΐνες (5) πρωτεΐνες του ενδομεμβρανώδες συστήματος (6) μιτοχονδριακές πρωτεΐνες (7) αγκυροβολημένες πρωτεΐνες (8)
Αποτελέσματα Molecular Function Biological process Functional Analysis 200 180 160 140 120 100 80 60 40 20 0 200 180 160 140 120 100 80 60 40 20 0 Molecular functions and biological processes in which the 238 peripheral proteins of the network take part in.
Αποτελέσματα Functional Analysis 6% 11% Transmembrane proteins' functions Receptors (e.g. GPCRs, Antigens) Transporters (e.g. Major Facilitators, ABC transporters) 5% 22% 46% Enzymes (e.g. kinases, ligases) Structural proteins Regulatory proteins 10% Other Peripheral membrane proteins of the human plasma membrane interact with 308 single-pass and multi-pass transmembrane proteins, which are grouped based on their functions in 6 different major categories.
Αποτελέσματα Network Failure and Attack The effect of the gradual removal of selected (attacks) and random (failure) nodes to the characteristic path length (CPL) of the network. The removal (attack) of peripheral proteins of the human plasma membrane and proteins located in lipid rafts based on their node degree causes a more rapid increase of the characteristic path length of the network compared to the removal of random nodes (failure).
Αποτελέσματα Network Clusterin MCL Τα 160 σύμπλοκα (ομάδες, clusters) τα οποία υπολογίστηκαν από τον αλγόριθμο MCL. Τα 45 από αυτά για τα οποία εντοπίστηκε συσχέτιση με ορισμένη λειτουργία ή ασθένεια αναπαρίστανται με χρωματισμένους κόμβους (GO term enrichment analysis)
Αποτελέσματα Network Clusterin MCL Mammalian Protein-Protein Interaction Database (MIPS) Comprehensive Resource of Mammalian protein complexes (CORUM) 25% of complexes Two complexes with novel components produced from the MCL clustering process are shown. The first complex is the endosomal sorting required for transport complex III (ESCRT-III complex). The second complex is the mammalian target of rapamycin complex 2 (mtorc2) which functions as an important regulator of the cytoskeleton. Proteins that represent previously reported components of the complex are shown in yellow, while novel subunits are shown in red.
Αποτελέσματα Drug Interaction / association analysis Layer 1: Diseases 31 ασθένειες (cancer, cardiovascular, and blood associated diseases, inflammation and skin associated diseases) Layer 2: Drugs 125 approved drugs (~10%) 28 κατηγορίες (anticoagulants, contraceptives) Layer 3: Peripheral proteins 31 πρωτεΐνες Ενδοκυττάριες, εξωκυττάριες Layer 4: Interactors 669 πρωτεΐνες Υποκυτταρικές θέσεις A four layered network created with Arena3D
Αποτελέσματα Drug Interaction / association analysis
Συμπεράσματα Oι περιφερειακές μεμβρανικές πρωτεΐνες είναι ένας κεντρικός κόμβος επικοινωνίας της μεμβράνης τόσο με το εσωτερικό όσο και με το εξωτερικό του κυττάρου. Επιπλέον, εμπλέκονται στη μεταφορά των πρωτεϊνών μέσα στο κύτταρο και συμμετέχουν στους μηχανισμούς συγκρότησης και ρύθμισης της κυστιδιακής μεταφοράς. Το δίκτυο αλληλεπιδράσεων που αυτές οι πρωτεΐνες σχηματίζουν έχει τα χαρακτηριστικά ενός κλασικού βιολογικού δικτύου με ανεξάρτητη από κλίμακα (scale free) τοπολογία και οι ιδιότητες δικτύου μικρού κόσμου (small world network). Το 10% των συνταγογραφούμενων φαρμάκων, βρέθηκαν να στοχεύουν σε περιφερειακές πρωτεΐνες της πλασματικής μεμβράνης του κυττάρου.
Δημοσίευση 1. Nastou K.C., Tsaousis G.N., Kremizas K.E., Litou Z.I., Hamodrakas S.J. The human plasma membrane peripherome: visualization and analysis. BioMed Research International, vol. 2014, Article ID 397145, 12 pages, 2014. doi:10.1155/2014/397145