Εισαγωγή στις πρωτεΐνες Δομή πρωτεϊνών Ταξινόμηση βάσει δομής Βάσεις με δομές πρωτεϊνών Ευθυγράμμιση δομών Πρόβλεψη 2D δομής Πρόβλεψη 3D δομής
Τι είναι η πρωτεΐνη Τι εννοούμε με δομή πρωτεϊνών Οικογένειες δομών Προγράμματα Viewers Δομών Μέθοδοι Ευθυγράμμιση Δομών Πρόβλεψη δισδιάστατης δομής Πρόβλεψης τρισδιάστατης δομής Διαγωνισμοί CASP
Η λειτουργίες της πρωτεΐνης καθορίζονται από την τρισδιάστατη δομή της Μπορούμε να προβλέψουμε την τρισδιάστατη δομή της πρωτεΐνης δεδομένου μόνο της ακολουθίας αμινοξέων; Γενικά, ΌΧΙ Αλλά υπάρχουν βοηθητικές μέθοδοι που μας δίνουν μια χρήσιμη μερική περιγραφή της τρισδιάστατης
Δομικές πρωτεΐνες: περίβλημα ιών, το εξωτερικό στρώμα του δέρματος, Καταλύτες: χημικών αντιδράσεων (ένζυμα) Μεταφορά και αποθήκευση (haemoglobins) Ρυθμιστικές πρωτεΐνες (ορμόνες, reception signal transduction) Αναγνώριση (cell adhesion και αντισώματα)
Οι πρωτεΐνες είναι μεγάλα μόρια πολυπεπτίδια Active region = η ενεργός περιοχή της πρωτεΐνης= η περιοχή που προσδιορίζει τη λειτουργία της η υπόλοιπη πρωτεΐνη έχει δομικό ρόλο Γνωρίζουμε τη δομή 25000 πρωτεϊνών (βάση PDB, Μαρτ. 2004) Μέθοδοι: κρυσταλλογραφία (ακτίνες Χ)/Nuclear Magnetic Resonance
Τα πολυπεπτίδια αποτελούνται από τα αμινοξέα που συνδέονται με πεπτικούς δεσμούς Κάθε αμινοξύ αποτελείται από Ομάδα αζώτου NH2 Ομάδα υδροξυλίου COOH a side chain Οι διαφορές στις side chains ξεχωρίζουν τα διαφορετικά αμινοξέα
amino group side chain carboxyl group
Γωνία ω=180 ή σπάνια 0 Γωνία Ψ... NH R C j 1 a C b O NH R C a j C b O Ομάδα αζώτου γωνία Φ Side chain, διαφέρει σε κάθε πρωτεΐνη Mainchain, ίδια για όλες τις πρωτεΐνες Ομάδα άνθρακα υδροξυλίου Τα R j προσδιορίζουν την πρωτεΐνη, αναφέρονται και ως redisidues
side chains διαφέρουν σε μέγεθος,σχήμα
a-helix b-sheet Loops: μεταξύ α-helices, b-sheets Διαφορετικά μήκη Στην επιφάνεια της πρωτεΐνης Coils
Γενικά η ακολουθία των αμινοξέων καθορίζει την 3D δομή [Anfinsen et al., 1950s] Αλλά υπάρχον και εξαιρέσεις Κάποια μόρια έχουν πολλές διατάξεις Κάποιες πρωτεΐνες διπλώνονται με βοήθεια άλλων ουσιών
Ποια φυσικά χαρακτηριστικά της πρωτεΐνης καθορίζουν τη δομή της; Στερεότητα του backbone Επιδράσεις ανάμεσα στα αμινοξέα, συμπεριλαμβανομένων Ηλεκτροστατικών αλληλεπιδράσεων Δυνάμεις van der Waals Δεσμούς υδρογόνου Επιδράσεις των αμινοξέων με το νερό
Δομή πρωτεΐνης περιγράφεται σε τέσσερα στάδια primary structure- πρωτεύουσα δομή (ακολουθία) secondary structure- δευτερεύουσα δομή tertiary structure- τρισδιάστατη δομή quaternary structure
Υδρόφοβα I: Isoleucine A: Alanine L: Leucine P: Proline F: Phenylamine Πολωμένα S: Serine Q: Glutamine C: Cysteine H: Histidine T: Treonine Φορτισμένα D: Aspartic Acid E: Glumatic Acid K: Lusine R: Arginine V: Valine Y: Tyrosine M: Methionine N: Aspargine W: Tryptophan G: Glycine
Οι φυσικοχημικές ιδιότητες της side chain δημιουργούν τις δομές των πρωτεϊνών Τα αμινοξέα ταξινομούνται βάσει της ομάδας R
Περιγράφει δυνατές δομές της κύριας αλυσίδας Oι επιτρεπόμενες τιμές για τις γωνίες φ, ψ, ω Με στίγματα απεικονίζονται τα α/a Τα περισσότερα είναι στις περιοχές β-sheets (πάνω αριστερά) α-helices (κάτω αριστερά)
Tι δίνει στις πρωτεΐνες την ευστάθειά τους; Tι δίνει στις πρωτεΐνες τη μοναδική δομή τους; Απαντήσεις μέσω μελέτης του denaturation denuaturation: η πρωτεΐνη σε συνθήκες διαφορετικές από τις φυσιολογικές Π.χ. Θερμότητα/ περιβάλλον ουρίας Συμπεράσματα: Πρωτεΐνες οριακά σταθερές
Δομή πρωτεΐνης ικανοποίηση παρακάτω κριτηρίων Για main και sidechains στερεοχημικά δυνατές δομές Μεταξύ Εμφωλιασμένων πολωμένων ατόμων δεσμοί υδρογόνου Η υδρόφοβη επιφάνεια πρέπει να είναι εμφωλιασμένη
Σε κατάλληλες συνθήκες (διαλύτης/ θερμοκρασία) 3διάστατη δομή.
Η υδροφοβική ιδιότητα μπορεί να χρησιμοποιηθεί για πρόβλεψη θέσεων turns και άλλων τριδιάστατων δομών Κατασκευάζεται αρχικά το υδροφοβικό προφίλ (γράφημα) της πρωτεΐνης Τα ελάχιστα του γραφήματος δηλώνουν πιθανές θέσεις υδρόφιλων καταλοίπων. Είναι πιθανότατα στην επιφάνεια
Ελάχιστα στις θέσεις 17,44, 70, 93, 117
Primary structure: ακολουθία α/α Secondary structure: helices, sheets (ουσιαστικά αλληλεπιδράσεις μεταξύ C=0 και ΝΗ) Tertiary structure: σύνθεση από helices, sheets Quaternary structure: πρωτεΐνες που αποτελούνται από πολλές υπομονάδες, κάθε μία έχει μία tertiary structure
1. Βάσει Δομής 2. Βάσει Ομοιότητας ακολουθίας (ευθυγραμμίσεις κτλ.)
Δομική ομοιότητα ισχυρή ένδειξη ομολογίας Ταξινόμηση σε διάφορα επίπεδα Παρόμοια διπλώματα πρωτεϊνών (χωρίς οι δομές να σχετίζονται απαραίτητα) Ταξινόμηση μπορεί να χρησιμοποιηθεί για την εύρεση της εξελικτικής σχέσης και πιθανώς της λειτουργίας (ρόλου) Μπορεί να ψάξει τη βάση, βάσει δομής
SCOP (Structural Classification of Proteins) CATH (Class, Architecture, Topology, Homologous superfamily) FSSP/DDD (Fold classification based on Structure-Structure alignment of Proteins/Dali Domain Director CE (The combinatorial Extension Model)
Ιεραρχική Ταξινόμιση: Ταξινομεί βάσει 1. εξελικτικής προέλευσης 2. Δομικής ομοιότητας Κατηγορίες, από το ειδικό στο γενικό a. Domains b. Families c. Supefamilies d. Folds e. Class
Λειτουργικός ρόλος:ένα domain, είναι ένας ανεξάρτητος δομικός λίθος που απαντάται σε πολλές πρωτεΐνες. Φυσικοχημικός ρόλος: Κάθε domain έχει ένα υδρόφοβο πυρήνα. Τοπολογικός: οι αποστάσεις των ατόμων στο ίδιο domain είναι ελάχιστες. Οι αποστάσεις μεταξύ ατόμων διαφορετικών domains είναι μέγιστες Πρωτεΐνες: Mία πρωτεΐνη μπορεί να αποτελείται από πολλά domains. To ίδιο domain απαντάται σε πολλές πρωτεΐνες
Κοινή εξελικτική προέλευση=τουλάχιστον 50% ομοιότητα
Μικρή ομοιότητα στην primary structure Δομές και λειτουργία υποδεικνύουν κοινή εξελικτική προέλευση, Πιθανότητα να μην σχετίζονται ακολουθίες του ίδιου superfamily < 10-6
Ίδιες κύριες δευτερογενείς δομές Στην ίδια διάταξη E.g. rossman fold=εναλλασσόμενα α helices και β-sheets Τα folds υποδιαιρούνται σε classes α-helices β-sheets α/β α+β Multi domain proteins Membrane and cell surface proteins Small proteins
1. Root: SCOP 2. Class: Alpha and beta proteins (α/β) 3. Fold: Flavodoxin-like 1. 3 layers, α/β/α parallel β sheet of 5 strands, 4. Superfamily: Flavoproteins 5. Family: Flavodoxin-related binds FMN 6. Protein: Flavodoxin
Class 1.65 release 20619 PDB Entries (1 August 2003). 54745 Domains. Number of folds Number of superfamilies Number of families All alpha proteins 179 299 480 All beta proteins 126 248 462 Alpha and beta proteins (a/b) Alpha and beta proteins (a+b) 121 199 542 234 349 567 Multi-domain proteins 38 38 53 Membrane and cell surface proteins 36 66 73 Small proteins 66 95 150 Total 800 1294 2327
hepatitis C Virus Ns3 Proteinase 1a1q
ATOM 1 CA PRO A 2 2.822 89.823 16.221 1.00 20.67 C ATOM 2 CA ILE A 3 5.647 88.252 14.230 1.00 19.75 C ATOM 3 CA THR A 4 6.006 85.090 12.155 1.00 16.60 C ATOM 4 CA ALA A 5 8.960 82.976 11.105 1.00 13.13 C ATOM 5 CA TYR A 6 9.008 80.850 7.969 1.00 15.66 C ATOM 6 CA SER A 7 11.368 78.176 6.772 1.00 13.79 C ATOM 7 CA GLN A 8 11.158 75.727 3.912 1.00 17.66 C ATOM 8 CA GLN A 9 9.871 72.204 4.359 1.00 21.60 C. ATOM 532 CA GLU C 176 6.519 43.244-20.353 1.00 37.50 C ATOM 533 CA THR C 177 10.296 42.851-20.812 1.00 39.60 C ATOM 534 CA THR C 178 11.885 40.690-18.167 1.00 40.68 C