Predictive and Experimental Approaches for Elucidating Protein Protein Interactions and Quaternary Structures John Oliver Nealon, Limcy Seby Philomina and Liam James McGuffin School of Biological Sciences, University of Reading, UK Received: 30 October 2017; Accepted: 30 November 2017; Published: 5 December 2017 Abstract: The elucidation of protein protein interactions is vital for determining the function and action of quaternary protein structures. Here, we discuss the difficulty and importance of establishing protein quaternary structure and review in vitro and in silico methods for doing so. Determining the interacting partner proteins of predicted protein structures is very time-consuming when using in vitro methods, this can be somewhat alleviated by use of predictive methods. However, developing reliably accurate predictive tools has proved to be difficult. We review the current state of the art in predictive protein interaction software and discuss the problem of scoring and therefore ranking predictions. Current community-based predictive exercises are discussed in relation to the growth of protein interaction prediction as an area within these exercises. We suggest a fusion of experimental and predictive methods that make use of sparse experimental data to determine higher resolution predicted protein interactions as being necessary to drive forward development. Εισαγωγή Στο συγκεκριμένο επιστημονικό άρθρο, οι συγγραφείς αναφέρονται στην αποσαφήνιση των αλληλεπιδράσεων μεταξύ πρωτεϊνών και στον καθορισμό της τεταρτοταγούς δομής τους. Συγκεκριμένα, οι αρθρογράφοι απαριθμούν τις σύγχρονες τεχνικές που χρησιμοποιούνται προκειμένου να δοθεί απάντηση στο παραπάνω βιολογικό ερώτημα, τεχνικές που στηρίζονται τόσο σε πειραματικά δεδομένα, όσο και σε υπολογιστικά, αναφέροντας παράλληλα τα πλεονεκτήματα και μειονεκτήματα κάθε τεχνικής. Ο προσδιορισμός της τεταρτοταγούς δομής πρωτεϊνών καθώς και των αλληλεπιδράσεων μεταξύ τους έχει ιδιαίτερα μεγάλη σημασία για την βιολογική έρευνα, καθώς απαντά σε ερωτήματα που σχετίζονται άμεσα με τη λειτουργία των πρωτεϊνών αυτών. Ο τρόπος λειτουργίας της κάθε πρωτεΐνης και η αλληλεπίδρασή της με άλλα μόρια επηρεάζει όλες τις κυτταρικές λειτουργίες. Συνεπώς, η αντιστοίχιση πρωτεϊνικών ανεπαρκειών ή μεταλλαγμένων μορφών με συγκεκριμένα συμπτώματα είναι δυνατή, αν διευκρινιστεί ο τρόπος με τον οποίων οι πρωτεΐνες αυτές αλληλεπιδρούν με τα υποστρώματά τους. Επίσης, ο τρόπος δράσης παθογόνων πρωτεϊνών είναι δυνατόν να χρησιμοποιηθεί για την αποτελεσματικότερη αντιμετώπιση πολλών ασθενειών. Επιπλέον, η αποσαφήνιση της ανταγωνιστικής, συμπληρωματικής ή παρεμποδιστικής δράσης ορισμένων πρωτεϊνών θα οδηγήσει στην καλύτερη κατανόησή πολλών βιολογικών διαδικασιών. Είναι επομένως εμφανές, πως οι πιθανές βιολογικές χρήσεις της συγκεκριμένης τεχνογνωσίας στην βιολογική έρευνα είναι άφθονες. Μεθοδολογίες Στο πρώτο τμήμα του άρθρου, απαριθμούνται οι πειραματικές τεχνικές που χρησιμοποιούνται για την αποσαφήνιση των αλληλεπιδράσεων μεταξύ των πρωτεϊνών. Οι τεχνικές αυτές μπορούν να ταξινομηθούν σε βιοχημικές, βιοφυσικές, γενετικής παρέμβασης, τεχνικές απεικόνισης, δοκιμασίες ανίχνευσης με βάση το φαινότυπο, μετά-μεταγραφικής παρέμβασης και δοκιμές συμπληρωματικότητας πρωτεϊνών. Μάλιστα, οι αρθρογράφοι εμβαθύνουν στις πιο διαδεδομένα χρησιμοποιούμενες μεθόδους. Η μέθοδος TAP (Tandem affinity purification) είναι μια πρωτεομική τεχνική υψηλής απόδοσης, που περιλαμβάνει την σύνδεση της πρωτεΐνης με τις TAP tag, έχει μεγάλη ευαισθησία και μπορεί να χρησιμοποιηθεί για την εύρεση πολλών αλληλεπιδράσεων ταυτόχρονα. Ωστόσο, κάποιες ασθενείς αλληλεπιδράσεις μπορεί να μην γίνουν αντιληπτές, ενώ για 1
τη διεξαγωγή της χρειάζεται μεγάλο δείγμα πρωτεϊνών. Οι πρωτεΐνες στην συνέχεια εντοπίζονται με φασματομετρία μάζας ή με SDS-PAGE. Η μέθοδος Co-IP (Co-immunoprecipitation) χρησιμοποιείται για τη εύρεση αλληλεπιδράσεων in vivo και χρησιμοποιεί ειδικά για την πρωτεΐνη αντισώματα, που όμως μειώνουν την ευαισθησία της τεχνικής. Η υπό μελέτη πρωτεΐνη σχηματίζει σύμπλοκα με άλλες πρωτεΐνες, τα οποία κατακρημνίζονται χρησιμοποιώντας ακινητοποιημένη πρωτεΐνη Α ή πρωτεΐνη G. Η μέθοδος της ζύμης δύο-υβριδίων (Yeast two-hybrid) χρησιμοποιεί τον εντοπισμό της έκφρασης ενός γονιδίου-αναφοράς, είναι απλή, οικονομική και χρήσιμη για την εύρεση ασθενών αλληλεπιδράσεων, αλλά έχει μεγάλα ποσοστά ψευδώς θετικών αποτελεσμάτων και περιορίζεται αποκλειστικά στις πυρηνικές πρωτεΐνες. Η τεχνική pull-down έχει ομοιότητες με την Co-IP, με τη διαφορά πως αντί για αντισώματα, χρησιμοποιεί εξειδικευμένες πρωτεΐνες, οι οποίες όμως αυξάνουν τα ποσοστά ψευδώς θετικών αποτελεσμάτων. Η τεχνολογία «protein chip» αποτελεί μια μέθοδο με υψηλή εξειδίκευση και ευαισθησία και απαιτεί μικρό πρωτεϊνικό δείγμα, όμως ο εξοπλισμός που χρησιμοποιείται μπορεί να διαταράξει τις αλληλεπιδράσεις μεταξύ των πρωτεϊνών. Η φασματοσκοπία NMR (Nuclear magnetic resonance) είναι ιδιαίτερα χρήσιμη για τον εντοπισμό ασθενών πρωτεϊνικών αλληλεπιδράσεων, καθώς δίνει πληροφορίες σε ατομικό επίπεδο και μπορεί να χρησιμοποιηθεί σε περιπτώσεις που είναι δύσκολο να απομονωθούν πρωτεϊνικοί κρύσταλλοι. Η μέθοδος αυτή αποτελεί την κυρίαρχη μέθοδο υπολογισμού της δομής πρωτεϊνών μαζί με την κρυσταλλογραφία ακτινών-x. Η τελευταία, δίνει μια πλήρη, υψηλής ακρίβειας ανάλυση της τρισδιάστατης δομής πρωτεϊνών, όμως απαιτεί την δημιουργία μεγάλων, καλά διατεταγμένων πρωτεϊνικών κρυστάλλων. Σποραδικά πειραματικά δεδομένα μπορούν να χρησιμοποιηθούν για την πρόβλεψη της συμπεριφοράς μεταξύ πρωτεϊνών. Η μέθοδος SAXS (Small-angle X-ray scattering) μπορεί να δώσει πληροφορίες για τη δομή βιομορίων σε ένα διάλυμα, όπως για παράδειγμα παροδικές αλληλεπιδράσεις μεταξύ πρωτεϊνών ενώ η τεχνική της διασταυρούμενης σύνδεσης (cross-linking) μπορεί να χρησιμοποιηθεί για την αποσαφήνιση ασθενών αλληλεπιδράσεων, σε συνδυασμό με άλλες μεθόδους. Επίσης, η cryo-em (Cryo-electron microscopy) είναι μια τεχνική που, αν και έχει μεγάλο κόστος, μπορεί να χρησιμοποιηθεί για την πρόβλεψη αλληλεπιδράσεων και τη δομή συμπλεγμάτων (ιδιαίτερα σε συνδυασμό με την κρυσταλλογραφία ακτινών-x). Η μέθοδος αυτή προτιμάται από πολλούς ερευνητές καθώς απαιτεί μικρό πρωτεϊνικό δείγμα και δεν έχει ανάγκη κρυστάλλωσης. Εκτός από τις πειραματικές μεθόδους, χρησιμοποιούνται και πολλές υπολογιστικές τεχνικές (In silico) προκειμένου να αποσαφηνιστεί ένα πρωτεϊνικό σύμπλεγμα. Αυτές, διακρίνονται σε μεθόδους μοντελοποίησης βάση προτύπου και σε μοντελοποίησης απουσία προτύπου. Για την πρόβλεψη των αλληλεπιδράσεων μεταξύ πρωτεϊνών, χρησιμοποιείται μια πλειάδα λογισμικών. Το RosettaDock είναι ένα πρόγραμμα πρόβλεψης πρωτεϊνικών συσσωματωμάτων, το οποίο αναγνωρίζει διαμορφώσεις χαμηλής ενέργειας μιας αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης κοντά σε μια δεδομένη αρχική διαμόρφωση. Ταυτόχρονα, βελτιστοποιεί τις μετατοπίσεις του άκαμπτου πρωτεϊνικού σώματος και τις διαμορφώσεις των πλευρικών αλυσίδων. Το ZDOCK προβλέπει την πρόσδεση πρωτεϊνών με βελτιστοποιημένη ενεργειακή λειτουργία, λαμβάνοντας υπόψη την συμπληρωματικότητα σχήματος, τις ηλεκτροστατικές αλληλεπιδράσεις και την ατομική ενέργεια επαφής. Ο αλγόριθμος FFT (fast Fourier transform) χρησιμοποιεί μια προσέγγιση συσχέτισης και διερευνά συστηματικά το χώρο των πιθανών διαμορφώσεων χρησιμοποιώντας κυρίως ηλεκτροστατικές αλληλεπιδράσεις. Στον αλγόριθμο FFT ανήκουν το HexServer και το GRAMM-X. Το MEGADOCK αναζητά πιθανές δομές σύνδεσης σε ένα τρισδιάστατο χώρο με τη βοήθεια του FFT και χρησιμοποιεί μια λειτουργία βαθμολόγησης στην οποία εξετάζεται μόνο η συμπληρωματικότητα του σχήματος και η ηλεκτροστατικότητα, αυξάνοντας σε μεγάλο βαθμό την ταχύτητα. Το λογισμικό FRODOCK υπολογίζει την ενέργεια δέσμευσης του σχηματιζόμενου συμπλόκου που προσεγγίζεται ως συνάρτηση των δεσμών van der Waals, της ηλεκτροστατικότητας και της ενέργειας αποδιαλυτοποίησης. Το M-ZDOCK αναπτύχθηκε για την πρόβλεψη της δομής των κυκλικά συμμετρικών πολυμερών με βάση την κατασκευή ενός μη συνδεδεμένου (ή μερικώς δεσμευμένου) μονομερούς. Το πρόγραμμα χρησιμοποιεί μια προσέγγιση FFT που βασίζεται σε πλέγμα, 2
παράγοντας καθαρά συμμετρικά πολυμερή και αναζητώντας στην συνέχεια τη δομή υψηλότερης ποιότητας. Ο αλγόριθμος ClusPro αξιολογεί πολλαπλά υποθετικά συμπλέγματα και στη συνέχεια εφαρμόζει μια μέθοδο φιλτραρίσματος σε αυτό το σύνολο δομών, επιλέγοντας εκείνες με καλή ηλεκτροστατικότητα και ελεύθερες ενέργειες για περαιτέρω ομαδοποίηση. Επίσης, χρησιμοποιεί δεδομένα SAXS ως περιορισμούς για την επιλογή των πιθανών προβλεπόμενων δομών, αυξάνοντας την ακρίβεια των προβλέψεων. Το PatchDock υπολογίζει την επιφάνεια των πρωτεϊνών, εφαρμόζει έναν αλγόριθμο κατακερματισμού για την ανίχνευση κοίλων, κυρτών ή επίπεδων επιφανειακών κομματιών και στη συνέχεια επιλέγει μόνο εκείνα με περιοχές που εμπλέκονται στη δέσμευση. Ακολουθεί μια διαδικασία αντιστοίχησης και δημιουργίας συμπλόκων, τα οποία κατατάσσονται σύμφωνα με ένα αποτέλεσμα συμπληρωματικότητας γεωμετρικού σχήματος. Τέλος, το LZerD είναι ένα λογισμικό που παρέχει συνδέσεις τόσο με ζεύγη, όσο και με ασύμμετρη πολυμερή. Το δεύτερο γίνεται με το Multi-LZerD, το οποίο παρέχει σύνθετες ασύμμετρες προβλέψεις, ξεχωρίζοντάς το από τα υπόλοιπα προγράμματα σύνδεσης που περιορίζονται σε συμμετρικά σύμπλοκα. Συνδυασμός μεθοδολογιών Σύμφωνα με όλα τα παραπάνω γίνεται κατανοητό ότι τόσο οι πειραματικές όσο και οι in silico μέθοδοι χαρακτηρίζονται από μειονεκτήματα και πλεονεκτήματα. Από την μία πλευρά, οι πειραματικές μέθοδοι είναι χρονοβόρες, δαπανηρές, απαιτούν ειδικό εργαστηριακό εξοπλισμό, υψηλή κατάρτιση για την ανάλυση των αποτελεσμάτων και πολλές φορές δεν μπορούν να εφαρμοστούν σε όλα τα υπό μελέτη βιομόρια. Για παράδειγμα, δεν μπορούν να ανακτηθούν κρύσταλλοι υψηλά υδρόφοβων πρωτεϊνών. Στον αντίποδα, τα εργαλεία πρόγνωσης τεταρτοταγούς δομής και πρωτεϊνικών αλληλεπιδράσεων που προσφέρει η βιοπληροφορική δεν θεωρούνται τόσο αξιόπιστα, λόγω των περιορισμών στην ακρίβεια των υπολογιστικών μεθόδων και επιπλέον δεν παρέχουν πληροφορίες σε ατομικό επίπεδο για το υπό μελέτη μόριο. Προκειμένου να κατανοηθεί η ανάγκη για τον καθορισμό των πρωτεϊνικών δομών και αλληλεπιδράσεων, και κατ επέκταση ανάπτυξης ανάλογης μεθοδολογίας, θα πρέπει να ληφθεί υπόψη το πλαίσιο της τρέχουσας γνώσης και των διαθέσιμων δεδομένων. Αφ ενός οι μέθοδοι ανασυνδυασμένου DNA επιτρέπουν την έκφραση μεγάλων ποσοτήτων βιομορίων στόχων προς ανάλυση, με αποτέλεσμα να αυξάνεται και το ποσοστό των διαθέσιμων πρωτεϊνικών αλληλουχιών που κατατίθενται σε βάσεις δεδομένων. Το γεγονός αυτό καθιστά τις μεθόδους πρόγνωσης απουσία προτύπου πιο εύχρηστες. Αφ ετέρου η ραγδαία πρόοδος των υπολογιστικών μεθόδων και των αλγορίθμων που χρησιμοποιούνται στην πρόγνωση έχει ως αποτέλεσμα την παραγωγή βάσεων δεδομένων για πρωτεϊνικές αλληλεπιδράσεις. Επομένως, λόγω της έκρηξης των γενετικών και πρωτεϊνικών δεδομένων που προκύπτουν, η ανάγκη για την ανάπτυξη αξιόπιστων προγνωστικών εργαλείων αλλά και εργαλείων για την διαχείριση των δεδομένων αυτών αυξάνεται συνεχώς. Η απάντηση σε ένα τόσο πολύπλευρο βιολογικό ζήτημα όπως αυτό, δηλαδή της πρόγνωσης της τεταρτοταγούς δομής πρωτεϊνών και των πρωτεϊνικών αλληλεπιδράσεων, απαιτεί τον συνδυασμό τόσο πειραματικών όσο και θεωρητικών προγνωστικών προσεγγίσεων. Για παράδειγμα, δεδομένα που προκύπτουν μέσω της πειραματικής μεθόδου SAXS μπορούν να συνδυαστούν με θεωρητικές μεθόδους προκειμένου να αντισταθμιστεί το μειονέκτημα της έλλειψης πληροφοριών σε ατομικό επίπεδο, που δεν παράγονται από αυτή τη μέθοδο. Προσπάθειες για την σύνδεση των διαφορετικών διαθέσιμων μεθοδολογιών έχουν ήδη πραγματοποιηθεί. Οι Tang et al. συνδύασαν δεδομένα από NMR με evolutionary couplings (Ο ECs server παρέχει λειτουργικές και δομικές πληροφορίες για πρωτεΐνες που προέρχονται από αρχείο με εξελικτικές αλληλουχίες και χρησιμοποιεί μεθόδους στατιστικής, φυσικής, πολλαπλής στοίχισης αλληλουχιών κ.ά.) και κατέληξαν σε πιο ακριβή δομικά αποτελέσματα από αυτά που προέκυπταν μόνο με NMR ή μόνο με ECs. Επιπλέον, το 2007 οι Latek, Ekonomiuk και Kolinski συνδύασαν την de novo μοντελοποίηση με πειραματικά δεδομένα, όπως δεδομένα χημικής μετατόπισης (συχνότητα συντονισμού ενός πυρήνα σε μαγνητικό πεδίο) και απέδειξαν ότι η καθοριζόμενη τρισδιάστατη δομή ήταν πιο ακριβής. 3
Οι προσπάθειες αυτές συνεχίζονται ακόμα και σήμερα με την αξιοποίηση καινοτόμων μεθοδολογιών. Ένα τέτοιο παράδειγμα είναι η προσπάθεια καθορισμού της τρισδιάστατης δομής του συμπλόκου του μεσολαβητή (συμβάλλει στην μεταγραφή στους ευκαρυωτικούς οργανισμούς), από τους Robinson et al., με τον συνδυασμό δεδομένων από κρυσταλλογραφία ακτίνων Χ, κρυο ηλεκτρονική μικροσκοπία, φασματομετρία μάζας, χημική διασταύρωση (chemical cross-linking χρήση ανιχνευτή για την σύνδεση πρωτεϊνών προκειμένου να διαπιστωθούν πρωτεϊνικές αλληλεπιδράσεις) και ομόλογης μοντελοποίησης. Όλες οι υπομονάδες του συμπλόκου, οι μεταξύ τους αλληλεπιδράσεις και μερικά δομικά στοιχεία αποκαλύφθηκαν. Όλο και περισσότερα προγράμματα και προγνωστικοί αλγόριθμοι ενσωματώνουν πειραματικά δεδομένα με στόχο την βελτίωση των προβλεπόμενων μοντέλων. Παραδείγματος χάριν, το software RosettaDock χρησιμοποιεί πλέον δεδομένα από πειράματα SAXS για να απορρίπτει σύμπλοκα τα οποία υπερβαίνουν κάποιον περιορισμό συμπληρωματικότητας σχημάτων των υπό μελέτη μορίων. Ως επακόλουθο αυξάνεται η ακρίβεια των τελικών προγνώσεων. Επίσης, η χρήση ως πρότυπο γνωστών συμπλόκων κατατεθειμένων στην PDB, αυξάνει την ακρίβεια και την ταχύτητα του λογισμικού M-ZDOCK. Αξιολόγηση αποτελεσμάτων και μεθόδων Η αξιολόγηση των προβλεπόμενων δομών ή συμπλόκων είναι πολύ σημαντική προκειμένου να δημιουργηθεί ένα μικρότερο υποσύνολο πιθανών δομών. Οι κυριότερες μέθοδοι αξιολόγησης των προβλεπόμενων δομών είναι αυτές που βασίζονται σε ενεργειακούς υπολογισμούς και αυτές που βασίζονται στην συναινετική ομαδοποίηση. Στην πρώτη περίπτωση λαμβάνονται υπόψη οι δυνάμεις van der Waals, η συμπληρωματικότητα των σχημάτων, η υδροφοβικότητα, οι ηλεκτροστατικές αλληλεπιδράσεις κ.ά. Η βασική αρχή είναι ότι όταν οι πρωτεΐνες αναδιπλώνονται και σχηματίζουν σύμπλοκα σταθεροποιούνται στην χαμηλότερη επιτρεπτή ενέργεια. Η αξιολόγηση βάσει ενέργειας χρησιμοποιείται κυρίως από τα προγράμματα πρόγνωσης απουσία προτύπου, αλλά πολλές φορές αξιολογήσεις από διαφορετικά προγράμματα δεν είναι άμεσα συγκρίσιμες. Για τον λόγο αυτό πιο ακριβής ποιοτικός έλεγχος των προγνωστικών μεθόδων γίνεται με την συναινετική ομαδοποίηση. Στην περίπτωση αυτή συγκρίνεται η ομοιότητα των προγνωστικών μοντέλων και αν δύο μοντέλα θεωρηθούν παρόμοια δημιουργούν ένα cluster. Τελικά από κάθε cluster διατηρείται το πιο αντιπροσωπευτικό μοντέλο, με το καλύτερο score σχήματος ή άλλης φυσικής παραμέτρου, και τα υπόλοιπα διαγράφονται. Η διαδικασία επαναλαμβάνεται μέχρι να προκύψει ένα μικρό σύνολο των πιο πιθανών μοντέλων. Τα τελευταία χρόνια, τρία μεγάλης κλίμακας πειράματα (CASP, CAMEO, CAPRI) στοχεύουν στην αξιολόγηση των μεθόδων πρόβλεψης πρωτεϊνικών δομών. Το πρώτο CASP (CASP1) πραγματοποιήθηκε το 1994 και περιελάμβανε την συλλογή στόχων για πρόβλεψη τεταρτοταγούς δομής, την πραγματοποίηση της πρόβλεψης και την αξιολόγηση των αποτελεσμάτων. Οι χρησιμοποιούμενες πληροφορίες προήλθαν από κρυσταλλογραφία ακτίνων x και από φασματομετρία NMR. Η αξιολόγηση προγνώσεων πρωτεϊνικών αλληλεπιδράσεων προστέθηκε στο πείραμα μόλις το 2014, στο CASP11. Η παρακάτω εικόνα προέκυψε από το CASP11 και αντικατοπτρίζει την δυσκολία των προβλέψεων να μεταβούν από την τριτοταγή στην τεταρτοταγή δομή. Η μελετώμενη πρωτεΐνη είναι ένα ομοδιμερές 198 αμινοξικών καταλοίπων, Rab11b (υπεροικογένεια Ras). Παρατηρήθηκε με φασματομετρία ακτίνων x, ενώ για την πρόβλεψη χρησιμοποιήθηκε η ομόλογη μοντελοποίηση. 4
Α: Αντιπαράθεση με στοίχιση ΤΜ 1 της προβλεπόμενης (πράσινο) και της παρατηρούμενης δομής (γαλάζιο) των μονομερών. Από την προβλεπόμενη δομή έχει αφαιρεθεί μια ασαφής περιοχή, ενώ αντίστοιχα από την παρατηρούμενη η α-έλικα. Το TM-score της πρόγνωσης είναι 0.93365, γεγονός που υποδηλώνει την υψηλή ποιότητα της αρχικής τριτοταγούς πρόβλεψης. Β: Αντιπαράθεση με στοίχιση ΜΜ 2 των αντίστοιχων διμερών. Το TM-score σε αυτή την περίπτωση είναι 0.42037, δηλαδή πολύ χαμηλότερο από το αντίστοιχο της τριτοταγούς πρόγνωσης, γεγονός που οφείλεται στο ότι αυτή τη φορά λήφθηκε υπόψη και η ασαφής περιοχή. C: Η παρατηρούμενη δομή αποκαλύπτει ότι η ασαφής περιοχή είναι α-έλικα και ότι τα μονομερή αλληλεπιδρούν α-έλικες κατά το σχηματισμό του διμερούς. D: Η προβλεπόμενη δομή του διμερούς με την ασαφή περιοχή. Στο CASP12 μία εκ των μελετώμενων πρωτεϊνών είναι ένα ετεροδιμερές (T0868/T0869). Η τριτοταγής δομή προβλέφθηκε με την βοήθεια των IntFOLD και ReFOLD, ενώ η τεταρτοταγής με το MultiFOLD. Στην παρακάτω εικόνα αποδεικνύεται ότι η επιτυχία του προγνωστικού μοντέλου ενός συμπλόκου εξαρτάται άμεσα από την ποιότητα του αρχικού τριτοταγούς μοντέλου. Α: Παρατηρούμενη δομή διμερούς Β: Προβλεπόμενη δομή διμερούς C: Αντιπαράθεση παρατηρούμενης (πράσινο) και προβλεπόμενης (γαλάζιο) τεταρτοταγούς δομής. TM-score 0.33088 φανερώνει μικρή ομοιότητα. Το CAMEO εφαρμόζει κριτήρια ποιοτικής αξιολόγησης που καθορίζονται από την κοινότητα πρόβλεψης δομών πρωτεϊνών, προσφέροντας μια ποικιλία βαθμολογιών και αξιολογώντας διαφορετικές πτυχές μιας πρόβλεψης (κάλυψη, ιστορική ακρίβεια και πληρότητα). Το CAMEO είναι αυτοματοποιημένο. Το CAPRI είναι ένα πείραμα πρόβλεψης και οι στόχοι του είναι οι μη δημοσιευμένες δομές κρυστάλλων ή NMR. Οι αξιολογητές του CAPRI συγκρίνουν τις προγνώσεις με τις πειρατικές δομές και κρίνουν τα μοντέλα με κριτήρια που σχετίζονται με την γεωμετρία των μορίων και την βιολογική σημασία των προβλεπόμενων αλληλεπιδράσεων. 1 Στοίχιση ΤΜ: γρήγορος αλγόριθμος για σύγκριση ανεξάρτητων πρωτεϊνών. Στοίχιση καταλοίπων ένα προς ένα. Παίρνει τιμές από 0,1 1 (υποδηλώνει απόλυτη ομοιότητα). 2 Στοίχιση ΜΜ: γρήγορος αλγόριθμος για στοίχιση πρωτεϊνών που αποτελούνται από πολλές πολυπεπτιδικές αλυσίδες. 5
Συμβολή και μελλοντικοί στόχοι Δεδομένου ότι η δομή μιας πρωτεΐνης καθορίζει και την λειτουργία της, η πρόγνωση της τεταρτοταγούς δομής μιας πρωτεΐνης οδηγεί και στην αποκάλυψη του πιθανού βιολογικού της ρόλου. Έτσι, ένα πρωτεϊνικό μόριο μπορεί να καταλύει αντιδράσεις, να έχει δομικό ρόλο, να συμμετέχει σε σηματοδοτικά μονοπάτια, να βοηθά στην μεταφορά ουσιών από και προς το κύτταρο κ.ά. Πολλές φορές για να καταστεί λειτουργική μια πρωτεΐνη απαιτείται η αλληλεπίδραση με άλλες πρωτεΐνες ή με μικρότερα μόρια, γι αυτό και είναι εξίσου σημαντική η μελέτη των αλληλεπιδράσεων. Η ανάπτυξη προγνωστικών μεθόδων με μεγάλη ακρίβεια αποτελεί άμεσο στόχο για την βιοπληροφορική, καθώς οι μέθοδοι in silico θα διαδραματίσουν κομβικό ρόλο στην κατανόηση των πρωτεϊνικών αλληλεπιδράσεων σε ατομικό επίπεδο. Παράλληλα όμως θα πρέπει οι μέθοδοι αυτοί να υποστηρίζονται από τα κατάλληλα προγράμματα αξιολόγησης, προκειμένου να είναι αξιόπιστες. Επιπλέον, καθίσταται σαφές ότι η ανάγκη τεχνικών που συνδυάζουν πειραματικά δεδομένα και προγνωστικά μοντέλα συνεχώς αυξάνεται. Σύνοψη Πειραματικά, υπολογιστικά μοντέλα, αλλά και ένας συνδυασμός αυτών, χρησιμοποιούνται για την πρόβλεψη της τεταρτοταγής δομής πρωτεϊνών καθώς και των αλληλεπιδράσεων μεταξύ τους. Τα κριτήρια της επιλογής της εκάστοτε μεθόδου διαφέρουν ανάλογα με τον ερευνητή και περιλαμβάνουν το κόστος, την ευαισθησία και ειδικότητα της μεθόδου, την ποσότητα και το είδος του υπό μελέτη δείγμα, την τεχνογνωσία του ερευνητή, την ταχύτητα της μεθόδου και πολλών άλλων. Ο συνδυασμός πειραματικών και in silico μεθόδων θα οδηγήσει μελλοντικά στην αποκρυπτογράφηση των περίπλοκων πρωτεϊνικών αλληλεπιδράσεων που συμβάλλουν σε κάθε κυτταρική διεργασία. Πειράματα, όπως τα CASP, CAPRI και CAMEO αξιολογούν τις μεθόδους με στόχο την συνεχή βελτίωσή τους. Ονοματεπώνυμο: Κωνσταντίνος Ντατσόπουλος Α.Μ.: 201400071 Χαρίκλεια Μακρή Α.Μ.: 201400056 6