Σηµειώσεις Βιοπληροφορικής Στοιχεία Αρχιτεκτονικής της τρισδιάστατης δοµής πρωτεϊνών. Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δοµών ΒΑΣΙΛΗΣ ΠΡΟΜΠΟΝΑΣ ΑΘΗΝΑ 2004-2005, ΛΕΥΚΩΣΙΑ 2006
ΣΤΟΙΧΕΙΑ ΠΡΩΤΕΪΝΙΚΗΣ ΟΜΗΣ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑΣ Ο Βιολογικός ρόλος των πρωτεϊνών Με όποιον τρόπο κι αν αποφασίσει να εξετάσει κανείς τη λειτουργία των πρωτεϊνών, οφείλει να βασιστεί στη θεµελιώδη αρχή ότι η τρισδιάστατη δοµή που αποκτά στο χώρο είναι ο καθοριστικός παράγοντας για τη λειτουργία της. Οι διαφορετικοί τρόποι µε τους οποίους διευθετούνται οι πολυπεπτιδικές αλυσίδες τοποθετούν τις απαραίτητες χηµικές οµάδες σε κατάλληλες θέσεις στον τρισδιάστατο χώρο. Κατά αυτόν τον τρόπο η πρωτεΐνη λαµβάνει το απαιτούµενο για τη λειτουργία της σχήµα, κατανέµοντας κατάλληλα στο χώρο τις φυσικοχηµικές ιδιότητες των αµινοξικών καταλοίπων που τη συνθέτουν. Έτσι, το πρωτεϊνικό µόριο βρίσκεται σε θέση να αλληλεπιδράσει µε τον επιθυµητό τρόπο µε το περιβάλλον του, δηλαδή µε άλλες πρωτεΐνες, µακροµόρια ή µικρούς χηµικούς υποκαταστάτες. Για παράδειγµα, οι πρωτεΐνες µε δοµικό ρόλο (π.χ. κολλαγόνο) είναι επιµήκη µόρια, ενώ, αντίθετα, πρωτεϊνικά µόρια µε ενζυµική δράση είναι πιο συµπαγή σε σχήµα. Το µεγάλο λειτουργικό "ρεπερτόριο" που εµφανίζουν οι πρωτεΐνες αντικατοπτρίζεται ξεκάθαρα στα διάφορα "δοµικά θέµατα" που έχουν παρατηρηθεί µέχρι σήµερα στις προσδιορισµένες πρωτεϊνικές δοµές. Η ποικιλία των βιολογικών ρόλων των πρωτεϊνών γίνεται αντιληπτή από τον ακόλουθο συνοπτικό πίνακα (Πίνακας 1, από Hamodrakas, 1993). Πίνακας 1: Βιολογικοί ρόλοι πρωτεϊνών. Βιολογικοί Ρόλοι Πρωτεϊνών Ενζυµική κατάλυση Μεταφορά και αποθήκευση Κίνηση Μηχανική στήριξη Ανοσοπροστασία ηµιουργία και µετάδοση νευρικών παλµών Έλεγχος της ανάπτυξης και διαφοροποίησης 1
Αµινοξικές ακολουθίες Από βιοχηµική πλευρά, οι φυσικές πρωτεΐνες είναι γραµµικά πολυµερή συνήθως 20 φυσικών L-α-αµινοξέων (Εικόνα 1, Πίνακας 2). Εικόνα 1: Μοντέλο της χηµικής δοµής ενός α-αµινοξέος.η ραχοκοκαλία της δοµής (backbone) είναι κοινή για όλα τα αµινοξέα, ενώ αυτό που αλλάζει είναι ο υποκαταστάτης R του α-άνθρακα. Από Petsko and Ringe, 2004. Με εξαίρεση τη γλυκίνη, διαθέτουν ένα ασύµµετρο άτοµο άνθρακα (C α ) και µια πλευρική αλυσίδα (R), στην οποία οφείλονται και οι χαρακτηριστικές φυσικοχηµικές ιδιότητες κάθε αµινοξέος (). Εικόνα 2:Οµαδοποίηση των 20 τυπικών αµινοξέων σύµφωνα µε φυσικοχηµικά τους χαρακτηριστικά. 2
Τα µονοµερή στα πρωτεϊνικά µόρια αναφέρονται ως αµινοξικά κατάλοιπα (ή απλά, κατάλοιπα). Τα αµινοξέα συνδέονται µεταξύ τους µε οµοιοπολικούς δεσµούς (πεπτιδικοί δεσµοί) µεταξύ της καρβοξυλιοµάδας ενός καταλοίπου και της αµινοοµάδας του επόµενου στην ακολουθία καταλοίπου, δηµιουργώντας µακριές αλυσίδες χωρίς διακλαδώσεις. Ο πεπτιδικός δεσµός είναι επίπεδος και σχεδόν άκαµπτος, περιορίζοντας την περιστροφική ελευθερία µιας πολυπεπτιδικής αλυσίδας µόνο γύρω από τους δεσµούς που σχηµατίζονται από τα άτοµα Cα (δίεδρες γωνίες Φ, Ψ). Αυτή η ιδιότητα του πεπτιδικού δεσµού χαρακτηρίζει σε µεγάλο βαθµό τις ιδιότητες των πρωτεϊνών, περιορίζοντας σηµαντικά τις ενεργειακά ευνοϊκές στερεοδιατάξεις τις οποίες µπορούν να αποκτήσουν. Η ακολουθία των αµινοξικών καταλοίπων µιας πρωτεΐνης, συχνά, αναφέρεται και ως η πρωτοταγής δοµή της. Πίνακας 2: Τα 20 φυσικά L-α-αµινοξέα που συµµετέχουν στο σχηµατισµό των πρωτεϊνών. ΑΜΙΝΟΞΥ ΣΥΜΒΟΛΙΣΜΟΣ ΣΥΝΤΑΚΤΙΚΟΣ ΤΥΠΟΣ Γλυκίνη GLY G NH2-CH2-COOH Αλανίνη ALA A CH3-CH(NH2)-COOH Βαλίνη VAL V (CH3)2-CH-CH(NH2)-COOH Ισολευκίνη ILE I CH3-CH2-CH(CH3)-CH(NH2) -COOH Λευκίνη LEU L (CH3)2-CH-CH2-CH(NH2)-COOH Φαινυλαλανίνη PHE F Ph-CH2-CH(NH2)-COOH Προλίνη PRO P NH-(CH2)3-CH-COOH Μεθειονίνη MET M CH3-S-(CH2)2-CH(NH2)-COOH Τρυπτοφάνη TRP W Ph-NH-CH=C-CH2-CH(NH2)-COOH Κυστεΐνη CYS C HS-CH2-CH(NH2)-COOH Σερίνη SER S HO-CH2-CH(NH2)-COOH Θρεονίνη THR T CH3-CH(OH)-CH(NH2)-COOH Ασπαραγίνη Γλουταµίνη ASN GLN N Q H2N-CO-CH2-CH(NH2)-COOH H2N-CO-(CH2)2-CH(NH2)-COOH Τυροσίνη TYR Y HO-p-Ph-CH2-CH(NH2)-COOH Ιστιδίνη HIS H NH-CH=N-CH=C-CH2-CH(NH2)-COOH Ασπαρτικό οξύ Γλουταµικό οξύ Λυσίνη ASP GLU LYS D E K HOOC-CH2-CH(NH2)-COOH HOOC-(CH2)2-CH(NH2)-COOH H2N-(CH2)4-CH(NH2)-COOH Αργινίνη ARG R HN=C(NH2)-NH-(CH2)3-CH(NH2)-COOH 3
Παρατίθεται ο συµβολισµός µε τον κω δικό των τριών και του ενός γράµµ ατος. Με Ph συµβολίζεται ο φαινυλικός δακτύλιος. ευτεροταγής δοµή πρωτεϊνών Η δευτεροταγής δοµή µιας πρωτεΐνης µ πορούµε να θεωρήσουµε ότι προκύπτει από την στερεοδιάταξη των καταλοίπων της σε τοπική κλίµακα, η οποία συχνά αναδεικνύει κάποιες κανονικότητες. ύο είναι βασικοί τύποι δευτεροταγούς δοµής οι οποίοι παρατηρούνται συχνότερα στις προσδιορισµένες πρωτεϊνικές δοµές: η α-έλικα και οι β-κλώνοι ή εκτεταµένες δοµές. Εικόνα 3: ι άγραµµα Ramachandran επιτρεπτών στερεοδιατάξεων. Μετατροπή από Petsko and Ringe, 2004. ιακρίνονται οι περιοχές των τιµών γωνιών Φ, Ψ οι οποίες αντιστοιχούν σε χαρακτηριστικές δευτεροταγείς δοµές (π.χ. α-ελίκων, β-πτυχωτών επιφανειών). 4
Αυτές οι δευτεροταγείς δοµές χαρακτηρίζονται από τις περιορισµένες σε εύρος τιµές των γωνιών Φ, Ψ των αντίστοιχων αµινοξικών καταλοίπων, όπως χαρακτηριστικά φαίνεται στο διάγραµµα Ramachandran (Εικόνα 3). Η αφθονία αυτών των στοιχείων δευτεροταγούς δοµής ερµηνεύεται από τη σταθερότητα την οποία αποκτούν εξαιτίας της ευνοϊκής θέσης χηµικών οµάδων για το σχηµατισµό δεσµών υδρογόνου. Ελικοειδείς δευτεροταγείς δοµές α-έλικα Γειτονικά κατάλοιπα της πολυπεπτιδικής αλυσίδας είναι δυνατόν να δηµιουργήσουν δεσµού ς υδρογόνου µεταξύ τη ς ιµινο-οµάδας (δότ ης Η) και της καρβονυλικής οµάδας (δέκτης) της ραχοκοκαλιάς της πρωτεΐνης. Ο περιοδικός σχηµατισµός τέτοιων δεσµών υδρογόνου οδηγεί στο σχηµατισµό ελικοειδών δοµών, µε διαφορετικά γεωµετρικά χαρακτηριστικά και ενεργειακή σταθερότητα, όπως φαίνεται σ την Εικόνα 4. Εικόνα 4: Ο περιοδικός σχηµατισµός υδρογονικών δεσµών οδηγεί στο σχηµατισµό κανονικών ελικοειδών δευτεροταγών δοµών. Τροποποίηση από Finkelstein and Ptitsyn, 2002. Ο συµβολισµός των διαφόρων ελίκων γίνεται µε 2 αριθµούς: ο πρώτος υποδηλώνει τον αριθµό καταλοίπων της πολυπεπτιδικής αλυσίδας που παρεµβάλονται του δεσµού υδρογόνου, ενώ ο δεύτερος τον αριθµό των ατόµων τα οποία σχηµατίζουν κλειστό δακτύλιο µετά το σχηµατισµό του δεσµού. Για παράδειγµα, στην 4 13 έλικα (ή α-έλικα) δηµιουργούνται Η-δεσµοί µεταξύ του καρβονυλίου (C=O) του i καταλοίπο υ και της ιµινοµάδας (N-H) του καταλοίπου i+4, και ο κλειστός δακτύλιος αποτελείται από 13 άτοµα. 5
Από όλες τις δυνατές ελικοειδείς δοµές, αυτή που απαντάται πιο συχνά (τουλάχιστον στις µέχρι σήµερα διαθέσιµες πειραµατικά προσδιορισµένες δοµές) είναι αυτή της δεξιόστροφης α-έλικας (4 13 έλικα). Σε συµφωνία µε τα πειραµατικά δεδοµένα, ενεργειακοί υπολογισµοί έχουν δείξει ότι από τις ελικοειδείς δοµές η α-έλικα είναι η περισσότερο σταθερή. Γεωµετρικά χαρακτηριστικά αυτής της α-ελικοειδούς δοµής (Εικόνα 5) είναι (προσεγγιστικά): Φ=-57 ο,ψ=-47 ο, βήµα της έλικας p=5.4 Å, κατάλοιπα ανά στροφή n=3.6, οπότε η προβολή δύο διαδοχικών καταλοίπων της έλικας στον άξονά της έχει µήκος d=1.5 Å. Η ακτίνα µιας α-έλικας είναι περίπου 2.5 Å. Οι υδρογονικοί δεσµοί που τη σταθεροποιούν είναι προσεγγιστικά παράλληλοι προς τον άξονά της και δηµιουργούν δίπολα µε την ίδια διευθέτηση. Εικόνα 5: Γεωµετρικά χαρακτηριστικά της δοµής ιδανικών α-ελίκων. Από Petsko and Ringe, 2004. Αριστερά: (a) τα άτοµα του C a της κύριας αλυσίδας µιας α-έλικας, (b) η κύρια αλυσίδα και ο σχηµατισµός διπόλου, (c) η δοµή της α-έλικας µε γενικευµένες πλευρικές αλυσίδες και οι σχηµατιζόµενοι Η-δεσµοί. Και στις τρεις περιπτώσεις το αµινοτελικό άκρο βρίσκεται στην κορυφή του κυλίνδρου. εξιά: Όψη κατά µήκος του άξονα της α-έλικας. Παρατηρήστε ότι οι πλευρικές αλυσίδες των καταλοίπων i, i+4 τείνουν να οµαδοποιούνται στην ίδια πλευρά της επιφάνειας της α-έλικας. 6
Από τα παραπάνω είναι προφανές ότι το κατάλοιπο της προλίνης, εξαιτίας της ιδιόµορφης χηµείας του (δεν έχει Ν-Η άρα και τη δυνατότητα σχηµατισµού Η- δεσµών) δεν εµφανίζεται συχνά σε α-ελικοειδείς δοµές. Παρόλα αυτά, κατάλοιπα προλίνης βρίσκονται συχνά στην πρώτη στροφή α-ελίκων, γεγονός που δεν είναι παράδοξο, αφού τα κατάλοιπα προλίνης περιορίζονται να έχουν Φ=-60 ο, η οποία είναι στο εύρος των τιµών που εµφανίζουν τα κατάλοιπα των α-ελίκων. Αµινοξικά κατάλοιπα µε ογκώδη πλευρική αλυσίδα (για παράδειγµα Val, Ile) είναι δύσκολο να διευθετηθούν σε γειτονικές θέσεις στην επιφάνεια µιας α-έλικας. Γίνεται εµφανές, λοιπόν, ότι κατανοώντας τα χαρακτηριστικά της τρισδιάστατης δοµής των πρωτεϊνών, µπορούµε να αρχίζουµε να κατανοούµε και τις συσχετίσεις µεταξύ αµινοξικής ακολουθίας και δοµής. Από τις άλλες δυνατές ελικοειδείς δευτεροταγείς δοµές, η µόνη που απαντάται σε σηµαντικό ποσοστό στις σφαιρικές υδατοδιαλυτές πρωτεΐνες είναι αυτή της 3 10 έλικας (Φ=-49 ο, Ψ=-26 ο ). Τα δίπολα των Η-δεσµών στην περίπτωση αυτή δεν είναι παράλληλα µεταξύ τους, ενώ οι πλευρικές αλυσίδες είναι «ευθυγραµµισµένες» στην επιφάνεια τη ς έλικας, µε αποτέλεσµα να µην ευνοείται πολύ ενεργειακά. Συνήθως, παρατηρούµε µία στροφή 3 10 έλικας µετά το καρβοξυτελικό άκρο α-ελίκων, δηµιουργώντας έτσι µια στροφή της πολυπεπτιδικής αλυσίδας. Εκτεταµένες δοµές β-κλώνοι και β-πτυχωτές επιφάνειες Θεωρητικά, στην περίπτωση που οι γωνίες Φ, Ψ διαδοχικών καταλοίπων της πολυπεπτιδικής αλυσίδας έχουν τιµές από -120 ο έως -180 ο και 120 ο έως 180 ο αντίστοιχα η πολυπεπτιδική αλυσίδα βρίσκεται σε (προσεγγιστικά) εκτεταµένη διαµόρφωση (β-κλώνος, β-strand). Στην περίπτωση αυτή, οι ιµινο- και καρβόνυλο- οµάδες της κύριας αλυσίδας διατάσσονται περίπου κάθετα στον άξονα της αλυσίδας και διατίθενται για τη δηµιουργία Η-δεσµών µε άλλα τµήµατα της πολυπεπτιδικής αλυσίδας (πιθανότατα πολύ αποµακρυσµένα) ή και άλλων πολυπεπτιδικών αλυσίδων τα οποία έχουν την ίδια (εκτεταµένη) διαµόρφωση. Αποτέλεσµ α είναι η δηµιουργία µιας σχεδόν επίπεδης δευτεροταγούς δοµής που ονοµάζεται β-πτυχωτή επιφάνεια (ή β-πτυχωτό 7
φύλλο). Οι πλευρικές αλυσίδες τοποθετούνται κάθετα τόσο προς τον άξονα των β-κλώνων όσο και προς τη β-πτυχωτή επιφάνεια. Όταν σε µία β-πτυχωτή επιφάνεια οι αλυσίδες οποιωνδήποτε δύο διαδοχικών β- κλώνων έχουν την ίδια κατεύθυνση τη λέµε παράλληλη, ενώ στην περίπτωση που οποιοιδήποτε β-κλώνοι έχουν αντίθετη κατεύθυνση την ονοµάζουµε αντιπαράλληλη. ιαφορετικά µιλάµε για µικτές β-πτυχωτές επιφάνειες. Τα παραπάνω χαρακτηριστικά των β-πτυχωτών επιφανειών απεικονίζονται στην Εικόνα 6. Εικόνα 6: β-κλώνοι και β-πτυχωτές επιφάνειες. Από Petsko and Ringe, 2004. Η ανάγκη δηµιουργίας υδρογονικών δεσµών εµποδίζει την αλυσίδα από το να είναι εντελώς εκτεταµένη (Φ=Ψ=180 ο ). Συνεπώς, διαδοχικές πλευρικές αλυσίδες διευθετούνται εκατέρωθεν της β-πτυχωτής επιφάνειας. Η σχετική γεωµετρία των πλευρικών αλυσίδων διευκολύνει τη διευθέτηση αµινοξικών καταλοίπων µε ογκώδεις τέτοιες οµάδες σε β-πτυχωτές επιφάνειες. Οι ακριανοί β-κλώνοι µιας β-πτυχωτής επιφάνειας προς την εξωτερική τους πλευρά προφανώς δε σχηµατίζουν Η-δεσµούς. Εξαίρεση έχουµε στην περίπτωση των β-βαρελιών, τα οποία είναι αντιπαράλληλες β-πτυχωτές επιφάνειες, µε άρτιο αριθµό β-κλώνων, οι ο ποίες είναι στραµµένες κατά τέτοιο τρόπο ώστε ο πρώτος και ο τελευταίος κλώνος τους να σχηµατίζουν τους 8
επιθυµητούς υδρογονικούς δεσµούς, δηµιουργώντας µια κυλινδρική δοµή. Εικόνα 7: Χαρακτηριστική δοµή β-βαρελιού. Άλλες δευτεροταγείς δοµές Εκτός από τις δευτεροταγείς δοµές α-ελίκων και β-κλώνων, οι οποίες εµφανίζουν χαρακτηριστικές κανονικότητες, παρατηρούνται και µη-κανονικές δευτεροταγείς δοµές. Αρκετά συχνά, αυτές οι περιοχές είναι κρίσιµες για την τελική στερεοδιάταξη των πρωτεϊνών αλλά και για τη λειτουργία τους. Τριτοταγής δοµή και αυτοτελείς δοµικές περιοχές Τα στοιχεία δευτεροταγούς δοµής των πρωτεϊνών διευθετούνται στο χώρο σχηµατίζοντας, συχνά, δοµές ανώτερης τάξης (υπερδευτεροταγείς δοµές). Το τελικό αποτέλεσµα του διπλώµατος της πολυπεπτιδικής αλυσίδας στο χώρο είναι η χαρακτηριστική γεωµετρία της πρωτεΐνης στο χώρο, η τριτοταγής της δοµή. Η διαδικασία του διπλώµατος µιας πολυπεπτιδικής αλυσίδας είναι πολύπλοκη και 9
παρ όλη την έντονη ερευνητική δραστηριότητα δεκαετιών, ακόµη και στις µέρες µας, θεωρείται ότι δεν έχει γίνει πλήρως κατανοητή. Εξετάζοντας τις τρισδιάστατες δοµές πρωτεϊνών, παρατηρείται ότι σε αρκετές περιπτώσεις κάποια τµήµατα της δοµής ξεχωρίζουν µεταξύ τους. Αυτό το γεγονός υποδηλώνει δοµική και, συχνά, λειτουργική ανεξαρτησία και αυτοτέλεια. Αυτές οι περιοχές, οι οποίε ς είναι κατά κανόνα συµ παγείς και δοµικά ανεξάρτητες ονοµάζονται αυτοτελείς δοµικές περιοχές (structural domains). Η διάκριση αυτών των περιοχών βοηθά ιδιαίτερα στη µελέτη των διαθέσιµων πρωτεϊνικών δοµών, καθώς θεωρούνται δοµικά αυθύπαρκτες, δηλαδή αποκτούν το τελικό τους δίπλωµα ανεξάρτητα από το υπόλοιπο τµήµα της πολυπεπτιδικής αλυσίδας. Από τη µέχρι τώρα ανάλυση πρωτεϊνικών δοµών, το µεγαλύτερο πλήθος των αυτοτελών δοµικών περιοχών αποτελείται από συνεχόµενες περιοχές στην αµινοξική ακολουθία. Παρόλα αυτά, είναι δυνατόν αποµακρυσµένες περιοχές µιας πολυπεπτιδικής αλυσίδας ή ακόµη και τµήµατα διαφορετικών πολυπε πτιδικών αλυσίδων να συµ µ ετέχουν στ ο σχηµ ατισµό µιας αυτοτελούς δοµικής περιοχής. 10
Κατηγοριοποίηση των πρωτεϊνικών δοµών Η ιεραρχική οργάνωση που επιδεικνύουν οι πρωτεϊνικές δοµές οδηγεί µε φυσικό τρόπο στη συστηµατική ανίχνευση οµοιοτήτων σχετικά µε τον τρόπο µε τον οποίο διπλώνουν στο χώρο οι διαφορετικές αυτοτελείς δοµικές περιοχές. Με βάση αυτές τις οµοιότητες είναι δυνατή η κατηγοριοποίηση των δοµικών χαρακτηριστικών σε όλα τα επίπεδα (πρωτοταγούς, δευτεροταγούς, υπερδευτεροταγούς και τριτοταγούς δοµής). Μια τέτοια ιεραρχική κατηγοριοποίηση είναι προφανές ότι διευκολύνει τη µελέτη νέων δοµών και το συσχετισµό συγκεκριµένων δοµικών χαρακτηριστικών µε αντίστοιχες λειτουργίες. Παράλληλα, η µελέτη παρόµοιων δοµικών µοτίβων είναι δυνατόν να δώσει στοιχεία σχετικά µε την εξελικτική ιστορία των πρωτεϊνών, σε περιπτώσεις που οι πρωτεϊνικές ακολουθίες έχουν αποκλίνει σε σηµαντικό βαθµό µεταξύ τους ώστε να µην ανιχνεύεται στατιστικά σηµαντική οµοιότητα. Σε συγκεκριµένες περιπτώσεις είναι δυνατόν να αποκαλύψει περιπτώσεις συγκλίνουσας εξέλιξης, όπως συµβαίνει σε ορισµένες περιπτώσεις πρωτεϊνών που προσδένονται στο DNA. Πριν γίνει αναφορά σε τέτοια συστήµατα κατηγοριοποίησης θα εξετάσουµε µία εναλλακτική προσέγγιση στην κατηγοριοποίηση των δοµών, η οποία εύκολα µπορεί να ενταχθεί στο προηγούµενο σχήµα. "Βιοχηµική" κατηγοριοποίηση δοµών Εάν λάβουµε υπόψη τα χαρακτηριστικά του βιοχηµικού περιβάλλοντος µέσα στο οποίο λειτουργούν οι διάφορες πρωτεΐνες, αναµένουµε ότι ανάλογα µε το περιβάλλον οι δοµές τους θα πρέπει να έχουν συγκεκριµένα χαρακτηριστικά γνωρίσµατα. Με βάση το κριτήριο αυτό οι πρωτεΐνες είναι δυνατόν να τις καταταγούν σε τρεις γενικές κατηγορίες. 11
Σφαιρικές-υδατοδιαλυτές πρωτεΐνες Οι σφαιρικές-υδατοδιαλυτές πρωτεΐνες βρίσκονται και λειτουργούν σε ένα υδάτινο περιβάλλον. Κατά συνέπεια, οι δοµές τους είναι συµπαγείς και, για καθαρά ενεργειακούς λόγους, τα αµινοξικά κατάλοιπα µε υδρόφοβες πλευρικές αλυσίδες τείνουν να πακετάρονται στο εσωτερικό της δοµής. Αντίθετα, τα πολικά κατάλοιπα συνήθως λαµβάνουν θέσεις στην επιφάνεια του µορίου, ώστε να αλληλεπιδρούν ευνοϊκά µε τα πολικά µόρια του νερού. Εικόνα 8: Τυπική δοµή σφαιρικής υδατοδιαλυτής πρωτεΐνης. Η δοµή του διµερούς της θρυψίνης του αρουραίου (PDB-ID: 1AMH, Perona and Craik, 1995). Άποψη µε το λογισµικό µοριακής γράφησης PyMol (DeLano, 2003). Από τις µέχρι σήµερα προσδιορισµένες πρωτεϊνικές δοµές το µεγαλύτερο ποσοστό αντιστοιχεί σε σφαιρικές-υδατοδιαλυτές πρωτεΐνες, καθώς η αποµόνωση και η εύρεση κατάλληλων συνθηκών για την κρυστάλλωσή τους είναι εφικτή. Χαρακτηριστικές σφαιρικές-υδατοδιαλυτές πρωτεΐνες είναι 12
αιµοσφαιρίνη (µεταφέρει οξυγόνο στα ερυθροκύτταρα), η φερριτίνη (αποθηκεύει οξυγόνο στο συκώτι), η θρυψίνη (πρωτεολυτικό ένζυµο, Εικόνα 8). Μεµβρανικές πρωτεΐνες Οι µεµβρανικές πρωτεΐνες (Εικόνα 9), αποτελούν βασικό συστατικό των κυτταρικών µεµβρανών και των µεµβρανών των οργανιδίων και ευθύνονται για την ποικιλία λειτουργιών που επιτελούνται από τις βιολογικές µεµβράνες. Εικόνα 9: Μεµβρανικές Πρωτεΐνες. Απεικονίζονται διαφορετικές κατηγορίες µεµβρανικών πρωτεϊνών. Η εικόνα αποτελεί τροποποίηση εικόνας από (Alberts et al., 1994). Σε γενικές γραµµές, το περιβάλλον στο οποίο βρίσκονται παρουσιάζει µεγάλη ασυµµετρία σε σχέση µε τις σφαιρικές-υδατοδιαλυτές πρωτεΐνες, δεδοµένου ότι εκτίθενται µερικώς στο υδατικό περιβάλλον του χώρου εκτός της µεµβράνης, στην πολική περιοχή της µεµβρανικής επιφάνειας και στην υδρόφοβη περιοχή του εσωτερικού της µεµβράνης. Η πρωτεϊνική σύσταση των µεµβρανών µπορεί να διαφέρει µεταξύ διαφόρων κυττάρων αλλά και µεταξύ διαφορετικών 13
µεµβρανών του ίδιου κυττάρου ή ακόµη και στην ίδια µεµβράνη ανάλογα µε το αναπτυξιακό στάδιο ή τις συνθήκες του περιβάλλοντος. Το µοντέλο του ρευστού µωσαϊκού (fluid mosaic model) (Singer and Nicolson, 1972) αντιµετωπίζει τις µεµβράνες ως δυναµικά συστήµατα στα οποία οι πρωτεΐνες και τα λιπίδια έχουν τη δυνατότητα να κινούνται και να αλληλεπιδρούν. Νεότερα µοντέλα λαµβάνουν υπόψη την ανοµοιογένεια που εµφανίζεται στην κατανοµή των µεµβρανικών συστατικών (Israelachvili, 1977) και την επίδραση µε τον κυτταροσκελετό (Sackmann, 1995). Παρόλα αυτά, το µοντέλο του ρευστού µωσαϊκού εξακολουθεί να αποτελεί βασικό µέσο κατανόησης του περιβάλλοντος των µεµβρανικών πρωτεϊνών. Ανάλογα µε τη διευθέτηση και την τοπολογία τους σχετικά µε τη µεµβράνη, οι µεµβρανικές πρωτεΐνες διακρίνονται σε εσωτερικές και περιφερειακές. ιαµεµβρανικές πρωτεΐνες Οι εσωτερικές µεµβρανικές πρωτεΐνες που διαπερνούν µε ένα ή περισσότερα τµήµατα της δοµής τους τη λιπιδική διπλοστιβάδα ονοµάζονται διαµεµβρανικές πρωτεΐνες (Εικόνα 9). Το φυσικοχηµικό περιβάλλον που τους επιβάλλεται από τη λιπιδική διπλοστιβάδα, αποτελεί καθοριστικό παράγοντα για τις δυνατές στερεοδιατάξεις τις οποίες µπορούν να αποκτήσουν στις διαµεµβρανικές περιοχές, καθώς και στις φυσικοχηµικές ιδιότητες των αµινοξικών καταλοίπων τα οποία είναι βυθισµένα στη µεµβράνη. 14
Εικόνα 10: οµή διαµεµβρανικής πρωτεΐνης που διαπερνά τη µεµβράνη µε β-βαρέλι. Αναπαράσταση της δοµής της TOLC_ECOLI (PDB-ID: 1EK9, Koronakis et al., 2000) µε µορφή κορδέλλας (ribbon). ιακρίνεται η διαµεµβρανική περιοχή µε δοµή β-βαρελιού και η περιπλασµική υπερελικωµένη περιοχή. Η δοµή αυτή συγκροτείται από 3 όµοιες υποµονάδες και δηµιουργεί ένα κανάλι µήκους 140 περίπου Å, το οποίο διαπερνά την εξωτερική µεµβράνη και τον περιπλασµικό χώρο του βακτηρίου, επιτρέποντας την έκκριση µικρών (αντιβακτηριακών φαρµάκων) και µεγάλων µορίων (τοξίνες) από το βακτηριακό κύτταρο. Άποψη µε το λογισµικό µοριακής γράφησης PyMol (DeLano, 2003). Από τις γνωστές διαµεµβρανικές πρωτεΐνες, ένα µικρό ποσοστό διαπερνά τις µεµβράνες µε αντιπαράλληλα β-πτυχωτά φύλλα, σχηµατίζοντας υπερδευτεροταγείς δοµές β-βαρελιών, ενώ το µεγαλύτερο ποσοστό ανήκει στην κατηγορία που διαπερνούν τη µεµβράνη µε τµήµατα που αποκτούν δευτεροταγή δοµή α-έλικας. Πειράµατα ηλεκτρονικής µικροσκοπίας αποτέλεσαν το έναυσµα για την πρόταση ύπαρξης διαµεµβρανικών πρωτεϊνών µικτού τύπου, προτείνοντας για το νικοτινικό υποδοχέα της ακετυλοχολίνης δοµή ενός δεµατιού πέντε διαµεµβρανικών ελίκων οι οποίες περιβάλλονται από ένα µεγάλο εξωτερικό δακτύλιο µε δοµή β-βαρελιού (Unwin, 1993). Πρόσφατα 15
δεδοµένα από την ίδια ερευνητική οµάδα (Miyazawa et al., 2003) καταρρίπτουν αυτή τη θεώρηση. Έτσι, µέχρι σήµερα, δεν υπάρχει κάποια σαφής πειραµατική ένδειξη στην οποία να βασιστεί κάποια τέτοια υπόθεση. ιαµεµβρανικά β-βαρέλια έχουν εντοπισθεί σε πρωτεΐνες της εξωτερικής µεµβράνης των αρνητικών κατά Gram βακτηρίων (π.χ. η TOLC της E. coli, Εικόνα 10), ενώ γνωρίζουµε για την ύπαρξή τους και στις εξωτερικές µεµβράνες οργανιδίων ευκαρυωτικών κυττάρων. ιαµεµβρανικές πρωτεΐνες µε α-ελικοειδή διαµεµβρανικά τµήµατα βρίσκονται σε όλες τις κυτταρικές µεµβράνες. Οι περισσότερες µεµβρανικές διεργασίες επιτελούνται από πρωτεΐνες και, συνεπώς, η κατηγορία των α-ελικοειδών διαµεµβρανικών πρωτεϊνών εµπλέκεται σε µεγάλη ποικιλία λειτουργιών καθώς: σχηµατίζουν ειδικά κανάλια που επιτρέπουν την επιλεκτική µεταφορά µορίων διαφόρων µεγεθών δια µέσου των µεµβρανών [π.χ. αντλίες ιόντων (Εικόνα 11), µεταφορείς νουκλεϊκών οξέων, µεταφορείς πρωτεϊνών] δηµιουργούν µεµβρανικούς υποδοχείς, οι οποίοι συµµετέχουν στη µεταγωγή σηµάτων και στη κυτταρική αναγνώριση και επικοινωνία 16
Εικόνα 11: οµή διαµεµβρανικής πρωτεΐνης που διαπερνά τη µεµβράνη µε α-έλικες. Το εξαρτώµενο από δυναµικό κανάλι ιόντων Κ+ του A. pernix (Jiang et al., 2003a). Ο προσδιορισµός της δοµής του καναλιού οδηγεί σε υποθέσεις για τον πιθανό µηχανισµό λειτουργίας του (Jiang et al., 2003b). Στο κέντρο διακρίνεται ο πόρος µέσα από τον οποίο µεταφέρονται τα ιόντα Κ+ καθώς και οι διαµεµβρανικές α-έλικες. Η εικόνα είναι από τον ιστότοπο της PDB (PDB-ID: 1ORQ, URL: http://www.rcsb.org/pdb) και απεικονίζει το βιολογικά ενεργό µόριο. Βασικό χαρακτηριστικό των διαµεµβρανικών τµηµάτων τους είναι η υψηλή τους σύσταση σε υδρόφοβα κατάλοιπα για τη δηµιουργία ευνοϊκών υδρόφοβων αλληλεπιδράσεων µε τις υδρόφοβες ουρές των λιπιδίων στο εσωτερικό της διπλοστιβάδας. Το µήκος τους βρίσκεται κατά κύριο λόγο σε ένα εύρος 12-35 καταλοίπων. Τα µήκη των τµηµάτων που συνδέουν τα άκρα διαµεµβρανικών αελίκων είναι, συνήθως, µικρότερα από 60 κατάλοιπα (Wallin and von Heijne, 1998; Liu and Rost, 2001). 17
Επιπλέον, αξιοσηµείωτο χαρακτηριστικό αυτής της τόσο ανοµοιογενούς και ποικιλόµορφης κατηγορίας πρωτεϊνών είναι η παρατήρηση ότι τα θετικά φορτισµένα κατάλοιπα (αργινίνη και λυσίνη) τείνουν να βρίσκονται µε µεγαλύτερη συχνότητα στις περιοχές που δεν επιβάλουν µεταφορά τους δια µέσω της µεµβράνης. Ο κανόνας αυτός ( positive inside rule, von Heijne, 1992; von Heijne, 1994) παρατηρείται σε τελείως διαφορετικά συστήµατα που ποικίλουν: στην εσωτερική µεµβράνη των βακτηρίων, στην πλασµατική µεµβράνη των ευκαρυωτικών κυττάρων, στην εσωτερική µεµβράνη των µιτοχονδρίων, στη θυλακοειδή µεµβράνη των χλωροπλαστών. Στην πραγµατικότητα, δεν µετράει το απόλυτο πλήθος των θετικών φορτίων όσο η διαφορά αυτών που βρίσκονται στα διαφορετικά διαµερίσµατα που ορίζει η µεµβράνη. Ο κανόνας αυτός πιθανότατα έχει σχέση µε τους µηχανισµούς µεταφοράς πρωτεϊνών δια µέσου των µεµβρανών, χωρίς η σχέση αυτή να είναι γνωστή ακόµη. Ινώδεις δοµικές πρωτεΐνες Οι ινώδεις πρωτεΐνες διαφέρουν σηµαντικά τόσο από τις σφαιρικέςυδατοδιαλυτές όσο και από τις µεµβρανικές πρωτεΐνες. Γενικά, αποτελούν τα βασικά δοµικά υλικά κάθε κυττάρου και για αυτό το λόγο έχουν πραγµατοποιηθεί εντατικές προσπάθειες για τη µελέτη της δοµής τους, µε διαφορετικές συµπληρωµατικές πειραµατικές µεθόδους. Η δυσκολία στη διάλυση αυτών των πρωτεϊνών µε ήπια µέσα προφανώς δυσκολεύει τη δοµική τους µελέτη. Βασική ιδιότητά τους είναι η ύπαρξη επαναληπτικών (συχνά περιοδικών) µοτίβων στις αµινοξικές τους ακολουθίες. Ακριβώς σε αυτό το χαρακτηριστικό οφείλεται η δηµιουργία επιµηκυµένων ινών και πολύπλοκων υπερµοριακών δοµών. 18
Εικόνα 12: Τριπλή έλικα συνθετικού πεπτιδίου ανάλογου µε το κολλαγόνο. Απεικονίζεται η τριπλή έλικα που σχηµατίζει το συνθετικό πεπτίδιο (Pro-Hyp-Gly) 4 -Glu-Lys- Gly(Pro-Hyp-Gly) 5 (PDB-ID: 1QSU, Kramer et al., 2000). Άποψη µε το λογισµικό µοριακής γράφησης PyMol (DeLano, 2003). Ορισµένες ινώδεις πρωτεΐνες αποτελούνται κυρίως από ένα τύπο δευτεροταγούς δοµής σε όλο τους το µήκος. Αυτές που αποτελούνται κυρίως από α-έλικες (π.χ. α-κερατίνες), από β-πτυχωτές επιφάνειες (π.χ. µετάξια). Μια ξεχωριστή κατηγορία είναι οι πρωτεΐνες µε δοµή παρόµοια µε το κολλαγόνο (Εικόνα 12), ενώ αναφέρονται και άλλες ινώδεις πρωτεΐνες µε επαναλαµβανόµενα µηκανονικά στοιχεία δευτεροταγούς δοµής. Πρωτεΐνες µε σφαιρικές και ινώδεις δοµικές περιοχές (µικτές) Τα ενδιάµεσα ινίδια, µαζί µε τα ινίδια ακτίνης και τους µικροσωληνίσκους συµµετέχουν στο πολύπλοκο δίκτυο ινιδίων του κυτταροσκελετού, ο οποίος 19
απαντάται σε όλα τα ευκαρυωτικά κύτταρα. Βασικό δοµικό στοιχείο όλων των ενδιάµεσων ινιδίων αποτελεί ένα επιµήκες οµο- ή έτερο- διµερές δύο παράλληλων πολυπεπτιδικών αλυσίδων. Αυτά τα διµερή έχουν χαρακτηριστική δοµή, µε µια κεντρική ραβδοειδή περιοχή υπερέλικας (coiled-coil) µήκους περίπου 45 nm, καθώς και δύο σφαιρικές δοµικές περιοχές οι οποίες σχηµατίζονται από το αµινοτελικό και το καρβοξυτελικό άκρο των αντίστοιχων µονοµερών (κεφαλή-head και ουρά-tail, αντίστοιχα, Εικόνα 13). Εικόνα 13: Τυπική σχηµατική δοµή µικτής πρωτεΐνης. ιακρίνεται η κεντρική α-ελικοειδής περιοχή, η οποία έχει µήκος από 310-350 αµινοξικά κατάλοιπα. Η αµινοτελική κεφαλή καθώς και η καρβοξυτελική ουρά έχουν µήκη και σχήµα που ποικίλει. Η εικόνα αποτελεί τροποποίηση εικόνας από (Cooper, 2000). Η κεντρική περιοχή απαρτίζεται από περίπου 300 αµινοξικά κατάλοιπα και χαρακτηρίζεται από την παρουσία επαναλαµβανόµενων επταπεπτιδίων (heptad repeat, Burkhard et al., 2001), ενώ η κεφαλή και η ουρά διαφέρουν σηµαντικά τόσο στο µήκος όσο και στην ακολουθία τους ανάλογα µε τον τύπο της πρωτεΐνης. Πρωτεΐνες µε δοµή αυτού του τύπου µπορούµε να θεωρήσουµε ότι εµπίπτουν σε µια ξεχωριστή κατηγορία µικτών πρωτεϊνών. οµικά δεδοµένα σε ατοµική διακριτικότητα για πρωτεΐνες αυτής της κατηγορίας είναι λιγοστά, αφού σε φυσιολογικές συνθήκες αυτοσυγκρατούνται αυθόρµητα για το σχηµατισµό ινιδίων (Strelkov et al., 2001). οµική κατηγοριοποίηση Η γνώση των συσχετισµών των πρωτεϊνικών δοµών συνεισφέρει στην καλύτερη 20
κατανόηση των αρχών της διαδικασίας του πρωτεϊνικού διπλώµατος αλλά, παράλληλα, δίνει σηµαντικές πληροφορίες για το συσχετισµό της πρωτεϊνικής δοµής µε τη Βιολογική λειτουργία. Επιπλέον, ο συσχετισµός συγκεκριµένων δοµικών µοτίβων µε αντίστοιχα πρότυπα στο επίπεδο της ακολουθίας, είναι δυνατόν να αποτελέσει τη βάση για την ανάπτυξη προγνωστικών µεθόδων και το χαρακτηρισµό, µε δοµικούς όρους, των ακολουθιών που προκύπτουν από τον προσδιορισµό των ακολουθιών γωνιδιωµάτων. Παρόλο που ο αριθµός των πρωτεϊνικών δοµών, που είναι κατατεθειµένες στην βάση δεδοµένων Protein Data Bank (PDB) σε ατοµική ή περίπου ατοµική διακριτικότητα από µεθόδους κρυσταλλογραφίας ακτίνων-χ και φασµατοσκοπία NMR, είναι σχετικά µικρός (~20,000), οι πληροφορίες που εµπεριέχουν γίνονται όλο και πιο σηµαντικές µε την αποκάλυψη και νέων συνδυασµών στην τοπική διευθέτηση και γεωµετρία των στοιχείων δευτεροταγούς δοµής. Από αρκετά νωρίς υπήρχαν οι ενδείξεις για την ιεραρχική οργάνωση της δοµής των πρωτεϊνών. Παρόλα αυτά, χρειάστηκε να περάσουν αρκετά χρόνια από τον προσδιορισµό της πρώτης τρισδιάστατης πρωτεϊνικής δοµής (µυοσφαιρίνη από µυϊκό ιστό φάλαινας, Kendrew, 1958) ώστε το πλήθος των δοµικών δεδοµένων να είναι επαρκές για την οργάνωση των δοµών µε βάση αυτό το χαρακτηριστικό. Σήµερα πλέον, είναι όχι µόνο δυνατό αλλά και επιβεβληµένο να αντιπαραβάλλουµε, να σχολιάσουµε και να συγκρίνουµε τα χαρακτηριστικά των διαθέσιµων τρισδιάστατων πρωτεϊνικών δοµών. Οι δύο πρώτες προσπάθειες για την ιεραρχική κατηγοριοποίηση των πρωτεϊνικών δοµών ξεκίνησαν στην Αγγλία, στις αρχές της δεκαετίας του 1990 και κατέληξαν στα γνωστά συστήµατα SCOP (Murzin et al., 1995; Lo Conte et al., 2000) και CATH (Orengo et al., 1997; Pearl et al., 2003). Παρόλο που ακόµη και η ίδια η διαδικασία του καθορισµού των ορίων των αυτοτελών δοµικών περιοχών είναι δυνατόν να βασίζεται σε διαφορετικά κριτήρια (Wernisch and Wodak, 2003), και, επιπλέον, οι δύο αυτές προσεγγίσεις κατηγοριοποίησης είναι διαφορετικές, τα αποτελέσµατά τους είναι συγκρίσιµα στις περισσότερες των περιπτώσεων. 21
Το σύστηµα δοµικής κατηγοριοποίησης SCOP Η ύπαρξη δοµικά αυθύπαρκτων στοιχείων σε µεγάλο πλήθος των προσδιορισµένων πρωτεϊνικών δοµών, τοποθετεί τις αυτοτελείς δοµικές περιοχές (structural domains) στην καρδιά κάθε συστήµατος δοµικής κατηγοριοποίησης. Ο Alexei Murzin και οι συνεργάτες του Murzin et al., 1995 πρότειναν ένα σύστηµα κατηγοριοποίησης πρωτεϊνικών domains (Structural Classification Of Proteins-SCOP), δηµιουργώντας µια αντίστοιχη βάση δεδοµένων (URL: http://scop.mrc-lmb.cam.ac.uk/scop/). Η οργάνωση των δεδοµένων γίνεται µε τη χρήση κατάλληλου λογισµικού Βιοπληροφορικής. Σε σηµαντικό ποσοστό εµπλέκεται ο ανθρώπινος παράγοντας, µε τη γνώση και την εµπειρία ερευνητών σχετικά µε τις αρχές που διέπουν την τρισδιάστατη πρωτεϊνική δοµή καθώς και τις εξελικτικές σχέσεις µεταξύ των πρωτεϊνών, όπως αυτές µπορούν να εξαχθούν από οµοιότητες σε επίπεδο ακολουθίας σε συνδυασµό µε τη λειτουργία. Μετά από ένα αρχικό στάδιο αυτοµατοποιηµένης σύγκρισης δοµών, σηµαντικό ρόλο στη µεθοδολογία που χρησιµοποιείται για τη δηµιουργία του συστήµατος SCOP, κατέχει η εποπτική διερεύνηση και η σύγκριση δοµών µε λογισµικό τρισδιάστατης µοριακής απεικόνισης. Τα κυριότερα επίπεδα της ιεραρχικής ταξινόµησης SCOP είναι (εντός παρενθέσεως ο αντίστοιχος όρος, όπως εµφανίζεται στο σύστηµα SCOP): 1. Κατηγορία ή Τάξη ιπλώµατος (CLASS). Κατά κύριο λόγο, χαρακτηρίζεται από το περιεχόµενο της δοµής σε στοιχεία δευτεροταγούς δοµής. Τέσσερις κύριες δοµικές κατηγορίες πρωτεϊνών έχουν ταυτοποιηθεί µε βάση τον τρόπο που διπλώνουν τα στοιχεία δευτεροταγούς δοµής τους: Κυρίως-α (all-α), στις οποίες η δοµή αποτελείται κατά κύριο λόγο από α-έλικες. Στις δοµές αυτής της κατηγορίας (π.χ. σφαιρίνες) α- έλικες µικρού συνήθως µήκους συνδέονται µε θηλειές (loops) και 22
πακετάρονται για τη δηµιουργία ενός υδρόφοβου πυρήνα που σταθεροποιεί τη δοµή. Κυρίως-β (all-β), στις οποίες η δοµή αποτελείται κατά κύριο λόγο από β-κλώνους που σχηµατίζουν κυρίως αντιπαράλληλες β- πτυχωτές επιφάνειες. Από πλευράς λειτουργίας, αυτή η κατηγορία πρωτεϊνών παρουσιάζει τη µεγαλύτερη ποικιλοµορφία (Branden and Tooze, 1991). Εναλλασσόµενες α/β (α/β), στις οποίες α-έλικες και β-κλώνοι εναλλάσσονται στην δοµή (αλλά και την ακολουθία) της πρωτεΐνης. Οι β-κλώνοι, συνήθως, σχηµατίζουν παράλληλες β-πτυχωτές επιφάνειες και το καρβοξυτελικό άκρο του ενός συνδέεται µε το αµινοτελικό άκρο του επόµενου µε µια α-έλικα. Σε ορισµένες περιπτώσεις η γεωµετρία είναι τέτοια που οι β-κλώνοι διευθετούνται µε τέτοιο τρόπο που δηµιουργούνται β-βαρέλια, τα οποία περιστοιχίζονται από τις α-έλικες. Άλλοτε, η κεντρική β-πτυχωτή επιφάνεια είναι στραµµένη και οι έλικες πακετάρονται στις δύο επιφάνειές της. ιακριτές α+β (α+β), στις οποίες α-έλικες και β-πτυχωτές επιφάνειες βρίσκονται σε διακριτές περιοχές της δοµής. Στην κατηγορία αυτή, οι β-κλώνοι διατάσσονται, συνήθως, για το σχηµατισµό αντιπαράλληλων β-πτυχωτών επιφανειών, όπως και στις «Κυρίως-β» δοµές. Οι δοµές εκείνες οι οποίες δεν εµπίπτουν ξεκάθαρα σε κάποια από τις παραπάνω κύριες κατηγορίες ταξινοµούνται σε άλλες κατηγορίες µε µικρό, σχετικά, αριθµό µελών. 2. ίπλωµα (Fold). ύο δοµές που ανήκουν στην ίδια κύρια κατηγορία διπλώµατος, κατατάσσονται στο ίδιο δίπλωµα εάν εµφανίζουν τα ίδια 23
στοιχεία δευτεροταγούς δοµής, τοπολογίες διασύνδεσης µεταξύ τους. µε κοινή διευθέτηση και τις ίδιες 3. Υπεροικογένεια (Superfamily). Πρωτεΐνες µε το ίδιο δίπλωµα ταξινοµούνται στην ίδια υπεροικογένεια αν τα δοµικά και λειτουργικά χαρακτηριστικά τους µαρτυρούν εξελικτική µεταξύ τους σχέση. Συχνά, πρωτεΐνες που ανήκουν στην ίδια υπεροικογένεια έχουν µεταξύ τους µικρή οµοιότητα σε επίπεδο αµινοξικής ακολουθίας. 4. Οικογένεια (Family). Οι πρωτεΐνες οµαδοποιούνται στην ίδια οικογένεια µε βάση την εµφανή εξελικτική τους συγγένεια. Στο επίπεδο αυτό, η κατηγοριοποίηση πραγµατοποιείται µε βάση δύο κριτήρια: Την οµοιότητα σε επίπεδο ακολουθίας, µε κατώφλι 30% ταυτόσηµων καταλοίπων. Την κοινή λειτουργία σε συνδυασµό µε υψηλό ποσοστό δοµικής οµοιότητας. 24
Συµπληρωµατικό υλικό Χρήσιµες πηγές στο διαδίκτυο 1. Η βάση δεδοµένων PDB http://www.rcsb.org/pdb περιέχει δεδοµένα σχετικά µε πειραµατικά προσδιορισµένες τρισδιάστατες πρωτεϊνικές δοµές σε ατοµική διακριτικότητα. 2. Το σύστηµα δοµικής κατηγοριοποίησης SCOP http://scop.mrc-lmb.cam.ac.uk/scop κατηγοριοποιεί αυτοτελείς δοµικές περιοχές πρωτεϊνών. 3. Το σύστηµα δοµικής κατηγοριοποίησης CATH http://www.cathdb.info επίσης κατηγοριοποιεί αυτοτελείς δοµικές περιοχές πρωτεϊνών. 4. Οι εργαστηριακές ασκήσεις του µαθήµατος Βιοφυσικής από το Ερευνητικό Εργαστήριο Βιοφυσικής και Βιοπληροφορικής (Παν/µιο Αθηνών) http://biophysics.biol.uoa.gr/courses/biophysics Επιπλέον µελέτη 1. Το πρώτο κεφάλαιο από το βιβλίο των Petsko and Ringe, 2004. 2. Η παράγραφος 3.4 από το βιβλίο Hamodrakas, 1993. 25
Βιβλιογραφία Alberts, B., D. Bray, J. Lewis, M. Raff, K. Roberts and J. D. Watson (1994). Molecular Biology of the Cell. 3rd ed. New York, Garland Publishing. Branden, C.-I. and J. Tooze (1991). Introduction to protein structure. New York, Garland Pub. Burkhard, P., J. Stetefeld and S. V. Strelkov (2001). Coiled coils: a highly versatile protein folding motif. Trends Cell Biol, 11(2): 82-8. Cooper, G. (2000). The Cell: a molecular approach. Sunderland, MA, Sinauer Associates, Inc. DeLano, W. L. (2003). PyMol, DeLano Scientific. Finkelstein, A. V. and O. B. Ptitsyn (2002). Protein Physics: A course of lectures. London, Academic Press. Hamodrakas, J. S. (1993). Topics in Molecular Biophysics. Athens, Symmetria. Israelachvili, J. N. (1977). Refinement of the fluid-mosaic model of membrane structure. Biochim Biophys Acta, 469(2): 221-5. Jiang, Y., A. Lee, J. Chen, V. Ruta, M. Cadene, B. T. Chait and R. MacKinnon (2003a). X-ray structure of a voltage-dependent K+ channel. Nature, 423(6935): 33-41. Jiang, Y., V. Ruta, J. Chen, A. Lee and R. MacKinnon (2003b). The principle of gating charge movement in a voltage-dependent K+ channel. Nature, 423(6935): 42-8. Kendrew, J. C. (1958). The three-dimensional structure of a myoglobin. Nature, 181: 662-6. Koronakis, V., A. Sharff, E. Koronakis, B. Luisi and C. Hughes (2000). Crystal structure of the bacterial membrane protein TolC central to multidrug efflux and protein export. Nature, 405(6789): 914-9. Kramer, R. Z., M. G. Venugopal, J. Bella, P. Mayville, B. Brodsky and H. M. Berman (2000). Staggered molecular packing in crystals of a collagenlike peptide with a single charged pair. J Mol Biol, 301(5): 1191-205. Liu, J. and B. Rost (2001). Comparing function and structure between entire proteomes. Protein Sci, 10(10): 1970-9. 26
Lo Conte, L., B. Ailey, T. J. Hubbard, S. E. Brenner, A. G. Murzin and C. Chothia (2000). SCOP: a structural classification of proteins database. Nucleic Acids Res, 28(1): 257-9. Miyazawa, A., Y. Fujiyoshi and N. Unwin (2003). Structure and gating mechanism of the acetylcholine receptor pore. Nature, 424(6943): 949-55. Murzin, A. G., S. E. Brenner, T. Hubbard and C. Chothia (1995). SCOP: a structural classification of proteins database for the investigation of sequences and structures. J Mol Biol, 247(4): 536-40. Orengo, C. A., A. D. Michie, S. Jones, D. T. Jones, M. B. Swindells and J. M. Thornton (1997). CATH--a hierarchic classification of protein domain structures. Structure, 5(8): 1093-108. Pearl, F. M., C. F. Bennett, J. E. Bray, A. P. Harrison, N. Martin, A. Shepherd, I. Sillitoe, J. Thornton and C. A. Orengo (2003). The CATH database: an extended protein family resource for structural and functional genomics. Nucleic Acids Res, 31(1): 452-5. Perona, J. J. and C. S. Craik (1995). Structural basis of substrate specificity in the serine proteases. Protein Sci, 4(3): 337-60. Petsko, G. A. and D. Ringe (2004). Protein Structure and Function. London, New Science Press ltd. Sackmann, E., Ed. (1995). In Handbook of Biological Physics. Amsterdam, Elsevier. Singer, S. J. and G. L. Nicolson (1972). The fluid mosaic model of the structure of cell membranes. Science, 175(23): 720-31. Strelkov, S. V., H. Herrmann, N. Geisler, A. Lustig, S. Ivaninskii, R. Zimbelmann, P. Burkhard and U. Aebi (2001). Divide-and-conquer crystallographic approach towards an atomic structure of intermediate filaments. J Mol Biol, 306(4): 773-81. Unwin, N. (1993). Nicotinic acetylcholine receptor at 9 A resolution. J Mol Biol, 229(4): 1101-24. von Heijne, G. (1992). Membrane protein structure prediction. Hydrophobicity analysis and the positive-inside rule. J Mol Biol, 225(2): 487-94. 27
von Heijne, G. (1994). Membrane proteins: from sequence to structure. Annu Rev Biophys Biomol Struct, 23: 167-92. Wallin, E. and G. von Heijne (1998). Genome-wide analysis of integral membrane proteins from eubacterial, archaean, and eukaryotic organisms. Protein Sci, 7(4): 1029-38. Wernisch, L. and S. Wodak, Eds. (2003). In Identifying structural domains in proteins. Structural Bioinformatics. Hoboken, NJ, John Wiley & Sons. 28