ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II Σελίδα 1
Υπολογιστικός Προσδιορισμός Δομής πειραματικός προσδιορισμός δομών κρυσταλλογραφία ακτίνων X πυρηνικός μαγνητικός συντονισμός (NMR) χρόνος / κόστος / περιορισμοί sequence - structure gap Ο αριθμός των πειραματικά προσδιορισμένων δομών είναι πολύ μικρότερος του αριθμού των πρωτεϊνικών ακολουθιών. Σελίδα 2
Υπολογιστικός Προσδιορισμός Δομής Σελίδα 3
Υπολογιστικός Προσδιορισμός Δομής σχεδιασμός πειραμάτων για εύρεση λειτουργίας κατανόηση μηχανισμών λειτουργίας / επίδρασης μεταλλάξεων / γενετικών ασθενειών πρόβλεψη πρωτεϊνικών αλληλεπιδράσεων σχεδιασμός φαρμάκων μελέτη τρόπου αναδίπλωσης πρωτεϊνών / κατανόηση των αρχών της πρωτεϊνικής αρχιτεκτονικής σχεδιασμός πρωτεϊνών με προκαθορισμένες ιδιότητες / λειτουργία (protein design - protein engineering) Σελίδα 4
Υπολογιστικός Προσδιορισμός Δομής secondary structure (δευτεροταγής δομή) solvent accessibility (προσβασιμότητα του διαλύτη) disorder prediction transmembrane segments (διαμεμβρανικά τμήματα) inter-residue/strand contacts (επαφές μεταξύ καταλοίπων) homology or comparative modeling (προτυποποίηση πρωτεϊνών με ομολογία) fold recognition (αναγνώριση διπλώματος) ab initio prediction (απαρχής πρόγνωση) 3D Σελίδα 5
Homology modeling Σελίδα 6
πρωτεΐνη στόχος (target sequence) άγνωστης δομής πρωτεΐνη πρότυπο (template sequence) γνωστής δομής στόχος - πρότυπο: υψηλή ομοιότητα σε επίπεδο ακολουθίας δημιουργία μοντέλου της πρωτεΐνης στόχου βάσει του προτύπου Homology modeling Σελίδα 7
Homology modeling Σελίδα 8
Homology modeling Αναζήτηση της πρωτεΐνης-προτύπου Στοίχιση των ακολουθιών των πρωτεϊνών στόχου και προτύπου Κατασκευή του μοντέλου Κατασκευή κύριας αλυσίδας Προτυποποίηση στροφών Προτυποποίηση πλευρικών αλυσίδων Βελτιστοποίηση του μοντέλου Έλεγχος της ποιότητας της δομής Σελίδα 9
Αναζήτηση προτύπου Αναζήτηση ακολουθιών στην PDB με προγράμματα όπως BLAST, PSI-BLAST ή χρήση τεχνικών threading Σελίδα 10
Ένα ή περισσότερα πρότυπα Αναζήτηση προτύπου Ποσοστό ταυτόσημων καταλοίπων Εξελικτικές σχέσεις Ποιότητα λυμένης δομής διακριτική ικανότητα Ιδιαιτερότητες λυμένης δομής τεταρτοταγής δομή μικρά μόρια 4 Å 3 Å 2 Å 1 Å χαμηλή υψηλή διακριτική ικανότητα
Στοίχιση ακολουθιών προτύπου - στόχου Καθοριστικός παράγοντας της επιτυχίας της μεθόδου Βελτίωση στοίχισης Πολλαπλή στοίχιση ακολουθιών Στοίχιση ακολουθιών βάσει δομικής πληροφορίας Ενθέσεις / διαγραφές συνήθως στις στροφές Δομική στοίχιση προτύπων Πρόβλεψη δευτεροταγούς δομής στόχου Ευθυγράμμιση προτύπων - στόχου Σελίδα 12
Στοίχιση ακολουθιών προτύπου - στόχου PHE ASP ILE CYS ARG LEU PRO GLY SER ALA GLU ALA VAL CYS PHE ASN VAL CYS ARG THR PRO --- --- --- GLU ALA ILE CYS PHE ASN VAL CYS ARG --- --- --- THR PRO GLU ALA ILE CYS κενό 10Å Cα - Cα 3.8Å κενό 5Å
Κατασκευή κύριας αλυσίδας ένα πρότυπο αντιγραφή των συντεταγμένων των τμημάτων της ακολουθίας που έχουν ευθυγραμμιστεί πολλά πρότυπα ανάθεση στατιστικών βαρών βάσει της ομοιότητας κάθε ακολουθίας Σελίδα 14
Προτυποποίηση στροφών Σελίδα 15
Προτυποποίηση στροφών Knowledge based Αναζήτηση σε βάσεις δεδομένων στροφών Energy based Ab initio κατασκευή των στροφών και ελαχιστοποίηση ενέργειας με μεθόδους Μοριακής Δυναμικής ή Monte Carlo Σελίδα 16
Προτυποποίηση πλευρικών αλυσίδων αντιγραφή πλευρικών αλυσίδων από τη δομή πρότυπο βιβλιοθήκες στροφομερών κριτήρια ενέργειας και πακεταρίσματος Σελίδα 17
Προτυποποίηση πλευρικών αλυσίδων στροφομερή Ένα μικρό ποσοστό όλων των δυνατών διαμορφώσεων των πλευρικών αλυσίδων παρατηρούνται στις πειραματικά προσδιορισμένες δομές. Επιλογή στροφομερούς διαμόρφωση κύριας αλυσίδας γειτονικές πλευρικές αλυσίδες Σελίδα 18
Προτυποποίηση πλευρικών αλυσίδων Συνδυαστικό πρόβλημα Απόδοση Καλή στον υδρόφοβο πυρήνα Μειωμένη στα επιφανειακά κατάλοιπα Σελίδα 19
Βελτιστοποίηση του μοντέλου Ελαχιστοποίηση ενέργειας χρήση με φειδώ μεθόδων Μοριακής Δυναμικής Σελίδα 20
Έλεγχος της ποιότητας της δομής µήκος και γωνίες δεσµών Ramachandran plot κατανομή πολικών και µη πολικών αµινοξέων στο εσωτερικό και εξωτερικό της πρωτεΐνης κανόνες πακεταρίσµατος αµινοξέων και δοµικών στοιχείων κατάλοιπα στο ενεργό κέντρο Σελίδα 21
Σφάλματα και Εφαρμογές Σελίδα 22
Homology Modeling SWISS-MODEL http://swissmodel.expasy.org/ MODELLER http://salilab.org/modeller/ Protein Model Portal (PMP) http://www.proteinmodelportal.org/ CPHmodels http://www.cbs.dtu.dk/services/cphmodels/ PROCHECK http://www.ebi.ac.uk/thornton-srv/software/procheck/ ModFOLD http://www.reading.ac.uk/bioinf/modfold/modfold_form_4_0.html QMEAN http://swissmodel.expasy.org/qmean/cgi/index.cgi Σελίδα 23
Structural Genomics Σελίδα 24
Structural Genomics Μεγάλης κλίμακας προγράμματα πειραματικού προσδιορισμού δομών με στόχο τον πειραματικό ή υπολογιστικό προσδιορισμό της δομής όλων των πρωτεϊνών Οργάνωση πρωτεϊνικών ακολουθιών σε οικογένειες Επιλογή αντιπροσωπευτικών ακολουθιών ως στόχων Επιλογή πρωτεϊνών ειδικού ενδιαφέροντος Πειραματικός προσδιορισμός της δομής των πρωτεϊνώνστόχων Κατασκευή μοντέλων για τα υπόλοιπα μέλη κάθε οικογένειας Σελίδα 25
Aναγνώριση διπλώματος Σελίδα 26
Aναγνώριση διπλώματος Περιορισμένος αριθμός τρόπων αναδίπλωσης (folds) των πειραματικά λυμένων δομών Αναζήτηση του τρόπου αναδίπλωσης μιας ακολουθίας άγνωστης δομής, όταν δεν υπάρχει πρωτεΐνη γνωστής δομής με υψηλή ομοιότητα σε επίπεδο ακολουθίας. Εφαρμογές Αναγνώριση προτύπου για την προτυποποίηση πρωτεϊνών με ομολογία Αναζήτηση στοιχείων για την ανάθεση πρωτεϊνικής λειτουργίας Σελίδα 27
Aναγνώριση διπλώματος Fold recognition / Threading Προβολή της ακολουθίας μιας πρωτεΐνης άγνωστης δομής σε διαφορετικές πειραματικά λυμένες υποψήφιες δομές. Αξιολόγηση της ικανότητας της ακολουθίας να υιοθετήσει κάθε δίπλωμα βάσει κριτηρίων. Κατάταξη των πιθανών τρόπων αναδίπλωσης. 1D-3D profiles knowledge based (pair) potentials Σελίδα 28
1D-3D profiles Στοίχιση ακολουθίας (1D) δομής (3D) Μετατροπή της γνωστής δομής σε μία ακολουθία από δομικά περιβάλλοντα Στοίχιση της αμινοξικής ακολουθίας άγνωστης δομής με την ακολουθία από δομικά περιβάλλοντα με τη χρήση πίνακα βαθμολόγησης Εκτίμηση της στατιστικής σημαντικότητας της στοίχισης Σελίδα 29
1D-3D profiles Μετατροπή της δομής σε μία ακολουθία από δομικά περιβάλλοντα Σελίδα 30
1D-3D profiles Μετατροπή της δομής σε μία ακολουθία από δομικά περιβάλλοντα Κάθε αμινοξύ προτιμά να βρίσκεται σε διαφορετικό δομικό περιβάλλον Δευτεροταγής δομή Στον πυρήνα ή στην επιφάνεια Ποσοστό πολικών ατόμων Σελίδα 31
1D-3D profiles Στοίχιση της αμινοξικής ακολουθίας άγνωστης δομής με την ακολουθία από δομικά περιβάλλοντα με τη χρήση πίνακα βαθμολόγησης Σελίδα 32
knowledge based (pair) potentials Σελίδα 33
knowledge based (pair) potentials Η ακολουθία προβάλλεται απευθείας στις γνωστές δομές χρησιμοποιώντας πληροφορίες για την αλληλεπίδραση ζευγών αμινοξέων. π.χ. Χ = παρατήρηση (Ala Val σε απόσταση 20 καταλοίπων στην ακολουθία και 3Å στο χώρο) Y = παρατήρηση (δύο οποιαδήποτε αμινοξέα σε απόσταση 20 καταλοίπων στην ακολουθία και 3Å στο χώρο) Potential: log (X/Y) Σελίδα 34
Aναγνώριση διπλώματος Υβριδικές τεχνικές. Σύγκριση των αποτελεσμάτων από διαφορετικά προγράμματα αναγνώρισης διπλώματος. Phyre 2 http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index MUSTER http://zhanglab.ccmb.med.umich.edu/muster/ RaptorX http://raptorx.uchicago.edu/ Σελίδα 35
Ab initio prediction Πρoσδιορισμός της δομής μιας πρωτεΐνης βάσει της ακολουθίας της και των φυσικο-χημικών νόμων, χωρίς τη χρήση πρότυπων δομών. Στην πράξη, όλες οι μέθοδοι στηρίζονται σε εμπειρικά δεδομένα από λυμένες πρωτεΐνες. Πεδία δυνάμεων Εμπειρικές ενέργειες αλληλεπίδρασης Δεδομένα εκπαίδευσης Δομικά στοιχεία (fragment structures) Σελίδα 36
Ab initio prediction Προσομοίωση της αναδίπλωσης της πολυπεπτιδικής αλυσίδας Μοριακή Δυναμική με πλήρη αναπαράσταση της πρωτεΐνης και του διαλύτη διαμόρφωση ελάχιστης ενέργειας θεωρητικά ζητήματα υπολογιστική ισχύς / χρόνος αποτελέσματα Σελίδα 37
Ab initio prediction Απλοποιημένα μοντέλα κύρια αλυσίδα ή Cα τρισδιάστατο πλέγμα / περιορισμός βαθμών ελευθερίας εμπειρικές ενέργειες αλληλεπίδρασης περιορισμός του χώρου των πιθανών διαμορφώσεων και εν συνεχεία λεπτομερέστερα μοντέλα Σελίδα 38
Ab initio prediction ROSETTA http://www.rosettacommons.org/ Οι πιθανές διαμορφώσεις μικρών πεπτιδικών τμημάτων (3-9 κατάλοιπα) αντιπροσωπεύονται στις λυμένες δομές της PDB. Δημιουργία βιβλιοθήκης "δομικών στοιχείων": πιθανών διαμορφώσεων κάθε τμήματος ακολουθίας. Σελίδα 39
ROSETTA Συνδυασμός δομικών στοιχείων για τη δημιουργία της πρωτεϊνικής δομής. Μέθοδος Monte Carlo Δημιουργία πολλών μοντέλων Ομαδοποίηση των μοντέλων (RMSD) Επιλογή εκείνων που ανήκουν στις πολυπληθέστερες ομάδες Σελίδα 40
Method Knowledge Approach Difficulty Usefulness Identify related Homology Modeling proteins of known structure structure with sequence methods, copy 3D coordinates & relatively easy very, if sequence identity > 40% modify if required Same as above, Fold Recognition proteins of known structure but more sophisticated methods to find medium limited related structure Simulate folding, Ab initio Prediction energy functions, statistics or generate lots of structures and try to pick the very hard not really correct one
CASP Critical Assessment of protein Structure Prediction (CASP) http://predictioncenter.org/ Σελίδα 42
CASP Critical Assessment of protein Structure Prediction (CASP) Εκτίμηση ακρίβειας πρόγνωσης και περιορισμών των μεθόδων υπολογιστικού προσδιορισμού δομών πρωτεϊνών. Ακολουθίες πρωτεϊνών, η πειραματικά προσδιορισμένη δομή των οποίων πρόκειται να δημοσιευθεί μετά το διαγωνισμό. Πρόβλεψη της δομής των πρωτεϊνών από διάφορες ερευνητικές ομάδες. Σύγκριση των μοντέλων με τα πειραματικά δεδομένα και αξιολόγηση της ποιότητάς τους από έμπειρους κριτές με τη βοήθεια προγραμμάτων ανάλυσης δομών. Σελίδα 43
CASP Σελίδα 44