Σεμινάριο στο πλαίσιο του μαθήματος Ειδικά Κεφάλαια Βιοχημείας Συναινετικός πρωτεϊνικός σχεδιασμός Ομάδα 8 Μαρία Κουφάκη 1113201300060 Χρήστος Μπινίσκος 1113201300087 Βαγγέλης Μπουρής 1113201300091 Εμμανουήλ Οικονόμου 1113201300096 Θερινό Εξάμηνο, Ακαδημαϊκό έτος 2016-2017 Περίληψη Μια δημοφιλής και επιτυχής στρατηγική στον ημι-ορθολογικό σχεδιασμό της πρωτεϊνικής σταθερότητας είναι η χρήση εξελικτικής πληροφορίας που περιέχεται σε ομόλογες αλληλουχίες πρωτεϊνών. Ουσιαστικά, εκμεταλλεύεται την συντήρηση των αμινοξέων σε ομάδες ομόλογων πρωτεϊνών για να ταυτοποιήσει πιθανές ευνοϊκές μεταλλάξεις. Ο συναινετικός σχεδιασμός βασίζεται στην υπόθεση ότι σε μια δεδομένη θέση, το αντίστοιχο συντηρημένο αμινοξύ προσδίδει περισσότερο στην σταθερότητα της πρωτεΐνης από τα μη συντηρημένα αμινοξέα. Στη συγκεκριμένη εργασία αναλύεται ο συναινετικός σχεδιασμός, οι θεωρητικές του βάσεις, περιορισμοί και προκλήσεις ενώ παρέχει έναν λεπτομερή οδηγό στις εφαρμογές του στον πρωτεϊνικό σχεδιασμό. 1
Εισαγωγή Η πρωτεϊνική μηχανική είναι η σύλληψη και η παραγωγή μη-φυσικών πολυπεπτιδίων μέσω τροποποίησης αμινοξικών αλληλουχιών που βρίσκονται στη φύση. Είναι ένας νέος σχετικά ερευνητικός κλάδος για την κατανόηση του πρωτεϊνικού διπλώματος και την αναγνώριση των βασικών αρχών του πρωτεϊνικού σχεδιασμού με τεράστιες δυνατότητες. Οι δυο βασικές μέθοδοι της πρωτεϊνικής μηχανικής είναι η κατευθυνόμενη εξέλιξη και ο ορθολογικός πρωτεϊνικός σχεδιασμός. Η κατευθυνόμενη εξέλιξη μιμείται τη διαδικασία της φυσικής επιλογής για να εξελίξει πρωτεΐνες ή νουκλεϊκά οξέα προς έναν προκαθορισμένο στόχο, μέσω 1) της δημιουργίας μοριακής ποικιλότητας από την επιβολή ενός γονιδίου σε επαναλαμβανόμενους κύκλους μεταλλαξογένεσης και in vitro ανασυνδυασμό, και 2) ταυτοποίησης των μελών των βιβλιοθηκών με βελτιώσεις στον επιθυμητό φαινότυπο μέσω διαλογής υψηλής παραγωγικότητας (high-throughput screening) (Lutz., 2010). Ο ορθολογικός πρωτεϊνικός σχεδιασμός πρόκειται για de novo σχεδιασμό μιας πρωτεΐνης η οποία θα επιτελεί μια επιθυμητή λειτουργία και χρησιμοποιεί προβλέψεις πρωτεϊνικών αλληλουχιών που θα διπλωθούν σε συγκεκριμένες δομές. Τα τελευταία χρόνια, ημι-ορθολογικές προσεγγίσεις που συνδυάζουν τον ορθολογικό συνδυασμό και τα σχήματα κατευθυνόμενης εξέλιξης για την δημιουργία μικρών αλλά περιεκτικών βιβλιοθηκών, έχουν γίνει αρκετά δημοφιλή. Οι πληροφορίες που έχουν αποκτηθεί από πρωτεϊνική δομή, λειτουργία, ομόλογες ακολουθίες και υπολογιστικούς αλγορίθμους πρόβλεψης συνδυάζονται για την προεπιλογή υποσχόμενων θέσεων-στόχων για στοχευμένη μεταλλαξογένεση, με μειωμένη ποικιλότητα αμινοξέων. Αυτή η στόχευση οδηγεί σε βιβλιοθήκες με μειωμένο μέγεθος με μεγάλη αύξηση στο λειτουργικό περιεχόμενο, επιτρέποντας την καλύτερη λήψη του αλληλουχικού χώρου. Ο αλληλουχικός χώρος είναι ένας τρόπος εκπροσώπησης του συνόλου όλων των πιθανών ακολουθιών που μπορεί να έχει μια πρωτεΐνη ή ένα γονίδιο. Μια δημοφιλής στρατηγική για τον ημι-ορθολογικό σχεδιασμό σταθερότητας είναι η χρήση της εξελικτικής πληροφορίας που βρίσκεται σε ομόλογες πρωτεϊνικές αλληλουχίες. Πολλαπλές στοιχίσεις ακολουθιών (Multiple sequence alignments ή MSA) και φυλογενετικές αναλύσεις είναι τα βασικά εργαλεία για την ανακάλυψη συντηρημένων αλληλουχιών και προγονικών σχέσεων ανάμεσα σε ομόλογες πρωτεΐνες. Τέτοιες αλληλουχίες και στοιχίσεις αποκτούνται από βάσεις δεδομένων ακολουθιών και πειραμάτων ουδέτερης παρέκκλισης (neutral drift). Ο συναινετικός σχεδιασμός, όπως και η αναδόμηση προγονικών ακολουθιών, χρησιμοποιεί την εξελικτική ιστορία, ωστόσο δεν εξάγει φυλογενετική ιεραρχία, αλλά στοιχίζει όλες τις ακολουθίες και το πιο συχνά παρατηρούμενο αμινοξύ ταυτοποιείται σε κάθε θέση στη στοίχιση (Εικ.1). Αυτή η προσέγγιση έχει επιτύχει στην βελτίωση της σταθερότητας λειτουργικών και μη-λειτουργικών πρωτεϊνών, πχ με την αύξηση της θερμοκρασίας τήξης κατά 10-32 o C. Ωστόσο μόνο το 50 % των συντηρημένων αμινοξέων συσχετίζεται με βελτιωμένη σταθερότητα, με το 10 % να μην επηρεάζουν την σταθερότητα και το 40% να αποσταθεροποιούν την πρωτεΐνη. 2
Εικόνα 1: Στοίχιση ακολουθιών μεταξύ 12 domain σε διάφορα είδη και πατρικές πρωτεΐνες. Η είναι κενό ενώ το + είναι αμφισβητούμενη θέση με καμία επικράτεια. Τα πιο συντηρημένα αμινοξέα είναι χρωματισμένα. [1] Ο συναινετικός πρωτεϊνικός σχεδιασμός αποτελείται από τα εξής 4 βήματα: 1) ταυτοποίηση domain (αυτοτελούς δομικού στοιχείου) που θέλουμε να στοχεύσουμε, 2) απόκτηση και προ-επεξεργασία ομόλογων ακολουθιών 3) επαναλαμβανόμενη αξιολόγηση διάφορων MSA και απομάκρυνση ακολουθιών που προκαλούν αποκλίσεις στα αποτελέσματα και 4) υπολογισμός της συντήρησης των ακολουθιών. Η εφαρμογή της συντήρησης ακολουθιών γίνεται με έναν από τους εξής 3 τρόπους. 1) Με μονή ή πολλαπλή σημειακή μετάλλαξη των πιο συντηρημένων αμινοξικών θέσεων στην πρωτεΐνη-στόχο και μετέπειτα αξιολόγηση των μεταλλαγών αυτών με άλλες στατιστικές ή υπολογιστικές μεθόδους. 2) Ακολουθίες μεγάλου μεγέθους μπορούν να δημιουργηθούν de novo, εξαλείφοντας το πρόβλημα της ανίχνευσης καταλοίπων που είναι πραγματικά σταθεροποιητικά 3) συντηρητικά κατάλοιπα και θέσεις μπορούν να στοχευθούν σε μελέτες κατευθυνόμενης εξέλιξης για την αύξηση του λειτουργικά σχετιζόμενου αλληλουχικού χώρου. Όλες αυτές οι στρατηγικές εξαρτώνται από τις απαιτήσεις και τους διαθέσιμους πόρους, όμως τα αποτελέσματα είναι θετικά με τον αριθμό των συναινετικά σχεδιασμένων πρωτεϊνών ολοένα και να αυξάνεται. Παράγοντες που εξετάζονται κατά τον συναινετικό σχεδιασμό Απόκτηση ομόλογων ακολουθιών Ο πιο αποδοτικός τρόπος για απόκτηση αλληλουχιών είναι μέσω βάσεων δεδομένων στοίχισης ακολουθιών όπως pfam, prosite, SMART. Αυτές οι βάσεις δεδομένων περιέχουν μικρές, σχολιασμένες στοιχίσεις αναφοράς (manually curated seed alignments) για την ανάπτυξη προφίλ κρυμμένων Μαρκοβιανών μοντέλων ή κανόνων για συγκεκριμένα μοτίβα, τα οποία εν συνεχεία μπορούν να εφαρμοστούν σε μεγάλες βάσεις δεδομένων αλληλουχιών όπως η UniProtKB/Swiss-Prot, η Protein Data Bank και NCBΙ. Εάν η πρωτεΐνη-στόχος δεν εκπροσωπείται επαρκώς σε κάποια ήδη υπάρχουσα βάση δεδομένων, η καλύτερη προσέγγιση είναι να γίνει αναζήτηση στις βάσεις ακολουθιών UniProtKB ή ΝCBI για ένα μικρό αριθμό (<20) των περισσότερο ομόλογων ακολουθιών. Η αναζήτηση αυτή μπορεί να χρησιμοποιηθεί για να αλιευσει (curate) μια αντιπροσωπευτική στοίχιση που μπορεί να υποβληθεί σε HMM profiling με χρήση HMEER, και στη συνέχεια να στοιχηθεί με πιο απομακρυσμένες ομόλογες ακολουθίες. Στην περίπτωση, που η πρωτεΐνη δεν εκπροσωπείται καθόλου στις βάσεις δεδομένων NCBI και UniProtKB, η επόμενη επιλογή είναι να δημιουργηθεί ποικιλότητα μέσω της χρήσης της ουδέτερης παρέκκλισης (neutral drift). Σε αυτά τα πειράματα, η πρωτεΐνη-στοχος υποβάλλεται σε κύκλου τυχαίας μεταλλαξογένεσης και επιλέγεται μόνο από τα αν είναι διπλωμένη ή/και λειτουργική και μετά αλληλουχείται. Αυτή η προσέγγιση χρησιμοποιήθηκε σαν μέσο για την δημιουργία αντικειμενικής (αμερόληπτης) ποικιλίας αλληλουχιών στον συναινετικό σχεδιασμό της χορισματικής μουτάσης (chorismate mutase), δείχνοντας πως η μέθοδος μπορεί να πετύχει με λιγότερο από 30 επιλεγμένες αλληλουχίες. Ομολογία Η επίδραση της ομολογίας των αλληλουχιών στον συναινετικό σχεδιασμό πρωτεϊνών δεν έχει κατανοηθεί πλήρως, ωστόσο φαίνεται πως πρόκειται για μια λειτουργία που σχετίζεται με τις βιοφυσικές ιδιότητες των πρωτεϊνών-στόχων, την εξελικτική τους ιστορία και την ταξινομική τους εκπροσώπηση στις βάσεις δεδομένων αλληλουχιών. Θεωρητικά, η ενσωμάτωση εξελικτικά απομακρυσμένων ή ποικίλων και διαφορετικών αλληλουχιών θα αυξάνει την πιθανότητα ταυτοποίησης περισσότερων συντηρημένων χαρακτηριστικών, καθώς η αυξημένη απόσταση ίσως συνεπάγεται αυξημένη δειγματοληψία του αλληλουχικού χώρου. Παρά το γεγονός ότι υπάρχουν αναφορές πως πολύ μικρή ή πολύ μεγάλη ποικιλότητα στην εισαγωγή ΜSA είναι προβληματική, αυτό το πεδίο δεν έχει εξερευνηθεί πλήρως. Η εκτίμηση του σωστού μεγέθους ποικιλότητας αποτελεί πρόκληση. Ο Sullivan et al. (2011) εντόπισαν το γεγονός αυτό στον συναινετικό σχεδιασμό μιας τριοζοφωσφορικής ισομεράσης (ΤΙΜ) κάνοντας συγκρίσεις δύο στοιχίσεων Pfam από τις εκδοχές 18 και 22 της βάσης δεδομένων. Οι καταχωρημένες 3
αλληλουχίες της εκδοχής 18 ήταν μία πρόχειρη μίξη βακτηριακών και ευκαρυωτικών αλληλουχιών, οδηγώντας σε μια ασθενώς ενεργή και μη-ορθά πτυχωμένη συναινετική πρωτεΐνη. Ωστόσο, η στοίχιση της εκδοχής 22 συντέθηκε κυρίως από βακτηριακές αλληλουχίες και οδήγησε σε μία ορθώς πτυχωμένη και πλήρως ενεργή πρωτεΐνη. Για να περιπλακούν περισσότερο τα πράγματα, οι αλληλουχίες της εκδοχής 22 επεξεργάστηκαν έτσι ώστε να έχουν κατά προσέγγιση το ίδιο μήκος και οι διπλές καταχωρήσεις απομακρύνθηκαν, γεγονός που μπορεί να έδινε διαφορετικά αποτελέσματα και τελικά να περιόριζε τη γενική εφαρμογή αυτής της προσέγγισης. Υψηλά επιτυχημένοι σχεδιασμοί όπως οι FN3con και clrr2 χρησιμοποίησαν αλληλουχίες που προέρχονταν κυρίως ή αποκλειστικά από ευκαρυώτες ανώτερης τάξης χωρίς την ανάγκη για επεξεργασία με βάση το μήκος της αλληλουχίας, υποθέτοντας ότι η σύνδεση των πολλαπλών στοιχίσεων αλληλουχίας (MSA) μεταξύ ταξινομικών επικρατειών ή βασιλείων ίσως επηρεάσει αρνητικά τα αποτελέσματα. Ένα παρόμοιο πρόβλημα παρατηρήθηκε στην ευρεία επιλογή της οικογένειας των πρωτεϊνών που φέρουν την επανάληψη armadillo. Ωστόσο, παρά να τροποποιήσουν ή να απομακρύνουν αλληλουχίες, υποκατηγοριοποίησαν την στοίχιση πολλαπλών αλληλουχιών τους (MSA) σε πιο συγγενικές ταξινομικές ομάδες και συνέδεσαν τα συντηρημένα κατάλοιπα της κάθε υποταξινόμησης, γεγονός που οδήγησε σε μία καλά εκφρασμένη και σταθερή πρωτεΐνη. Η εκτενής επέκταση της ομολογίας των αλληλουχιών ίσως οδηγήσει σε ανεπαρκή διατήρηση, η οποία είναι ικανή να αποτρέψει την ακριβή στοίχιση και να οδηγήσει σε αποτυχία σχεδιασμού. Για παράδειγμα, η διατήρηση της αλληλουχίας στην οικογένεια της β-αμυντίνης είναι <33%, παρά το γεγονός ότι η δομική ομοιότητα είναι πολύ υψηλή. Εδώ, η στοίχιση μέσα σε ένα συγκεκριμένο είδος αποτελεί πρόκληση και ο συναινετικός σχεδιασμός θα ήταν πιθανότατα αδύνατος χρησιμοποιώντας φυσικές αλληλουχίες αφήνοντας την υπόλοιπη σωρεία ερευνών ως την μόνη λύση για τη δημιουργία ομολογίας και επιτυχούς στοίχισης. Για την επίτευξη ομολογίας πρέπει να υπάρχει ισορροπία μεταξύ της ομοιότητας αλληλουχιών, η οποία είναι βοηθητική για τον υπολογισμό μιας πολλαπλής στοίχισης αλληλουχιών (MSA), και της ποικιλότητας αλληλουχιών, η οποία παρέχει μια καλύτερη κάλυψη του αλληλουχικού χώρου που μπορεί να ληφθεί κατά τη διάρκεια του σχεδιασμού. Συστηματικό σφάλμα Σε αντίθεση με την ποικιλότητα, η αξιολόγηση των πολλαπλών στοιχίσεων αλληλουχιών (MSA) ίσως προδιαθέτει τον συναινετικό σχεδιασμό προς έναν κυρίαρχο κλάδο, όπως ένα ταξόν, ένα είδος ή μια πρωτεϊνική κατηγοριοποίηση. Αυτό είναι τυπικά το αποτέλεσμα προτιμήσεων από τα προγράμματα αλληλούχισης γονιδιώματος, που τείνουν να υπερ-εκπροσωπούν συγκεκριμένα είδη ή πρωτεΐνες σε αλληλουχίες βάσης δεδομένων. Το συστηματικό σφάλμα φαίνεται να αποτελεί πρόβλημα των αυτοτελών δομικών περιοχών(domain), των μοτίβων ή των πρωτεϊνικών επαναλήψεων που συναντώνται μέσα σε μεγαλύτερες πρωτεΐνες. Σε μερικές περιπτώσεις, το σφάλμα μπορεί να είναι σκόπιμο, προκειμένου να διατηρηθούν λειτουργικά δίκτυα μιας οικογένειας πρωτεϊνών από ένα συγκεκριμένο είδος ή κατηγορία. Λόγω του ενδιαφέροντος για ταυτοποίηση της καθαρής ευρωστίας και σταθερότητας, είναι λογικό να υποθέσει κάποιος ότι το συστηματικό σφάλμα και η υπερ-εκπροσώπηση πρέπει γενικά να αποφεύγονται: αυτά τα χαρακτηριστικά ίσως να καλύπτουν συντηρημένα και πιθανώς σταθεροποιητικά χαρακτηριστικά από λιγότερο εκπροσωπημένες εξελικτικές γενεαλογίες. Η μείωση του συστηματικού σφάλματος των φυσικών αλληλουχιών μπορεί να επιτευχθεί με σχετική ευκολία χρησιμοποιώντας το λογισμικό ομαδοποίησης αλληλουχιών CD-HIT ή χρησιμοποιώντας μεθόδους που βασίζονται στις πιθανότητες για να εκτιμηθεί η φυλετική ιστορία. Καταμέτρηση αλληλουχιών Ένα από τα κύρια πλεονεκτήματα του συναινετικού σχεδιασμού έναντι άλλων μεθόδων που βασίζονται στην αλληλουχία είναι η ικανότητά του να ταχτοποιεί μεταλλαγές που βελτιώνουν την σταθερότητα από μια πολλαπλή στοίχιση αλληλουχίας (MSA) ακόμα και με μικρό αριθμό μελών. Παράδειγμα αποτελούν τα domain FN3 της φιμπρονεκτινης (15 μέλη). Στην έρευνα των Jacobs et al (2012), οι κορυφαίες 10 σταθερές αλληλουχίες ήταν λιγότερο επιτυχείς στην προώθηση θερμοδυναμικής σταθερότητας σε σχέση με όλα τα 15 μέλη, απεικονίζοντας ότι ακόμη και οι λιγότερο σταθερές αλληλουχίες συμβάλλουν στην πλήρη σταθερότητα του τελικού συναινετικού σχεδιασμού. Σε αυτή την περίπτωση, περισσότερες αλληλουχίες προσδίδουν μεγαλύτερη ποικιλότητα, αυξάνοντας με τον τρόπο αυτό την αναλογία 4
σήματος-θορύβου, και βελτιώνοντας επομένως την ανίχνευση συντηρημένων καταλοίπων σε αμυδρά συντηρημένες περιοχές. Ποιότητα της στοίχισης αλληλουχιών Δυσκολίες συναντώνται σε περιπτώσεις πολλαπλών στοιχίσεων αλληλουχιών που περιέχουν αλληλουχίες που ποικίλουν στο μήκος, ή όταν υπάρχουν ομαδοποιήσεις αλληλουχιών που είναι τοπικά αλλά όχι εξ ολοκλήρου ομόλογες. Μεγάλες ενσωματώσεις και απαλοιφές μεταξύ των μελών μπορούν να επηρεάσουν την ταυτοποίηση των ελάχιστα συντηρημένων θέσεων, για παράδειγμα να οδηγήσουν στο σχεδιασμό μίας χαμηλά ενεργής και μη ορθά πτυχωμένης πρωτεΐνης. Σε αυτή τη συγκεκριμένη περίπτωση, με την επεξεργασία των ομόλογων αλληλουχιών έτσι ώστε να έχουν κατά προσέγγιση το ίδιο μήκος και με την απομάκρυνση των διπλών καταχωρήσεων, ο σχεδιασμός βελτιώθηκε σημαντικά, οδηγώντας σε μια ορθά πτυχωμένη και πλήρως ενεργή πρωτεϊνη. Ενδιαφέρον προκαλεί το γεγονός ότι οι διαφορές στην αλληλουχία μεταξύ του επεξεργασμένου και μη σχεδιασμού εντοπίστηκαν κυρίως σε μη συντηρημένα τμήματα της πρωτεΐνης. Αποκλειστικά από την εκτίμηση αλληλουχιών, δεν εντοπίστηκε η προφανής αιτία γιατί οι διαφορές αυτές οδηγούν σε εντυπωσιακά διαφορετικές βιοφυσικές ιδιότητες. Είναι επομένως πιθανό ότι η επεξεργασία των αλληλουχιών προς αυτές που είναι περισσότερο ομόλογες βελτίωσε τη στοίχιση, γεγονός που επιτρέπει μια καλύτερη αναγνώριση των ελάχιστα συντηρημένων καταλοίπων. Η δημιουργία μιας καλής στοίχισης πολλαπλών αλληλουχιών (MSA) μπορεί να είναι δύσκολη ενώ παράλληλα μπορεί να θεωρηθεί περισσότερο ένα αντικείμενο τέχνης παρά επιστήμης. Δυστυχώς, οι μέθοδοι πολλαπλών στοιχίσεων αλληλουχιών (MSA) ποικίλλουν σημαντικά και δεν υπάρχει προς το παρόν ένα ποσοτικό μέτρο για την εκτίμηση της ποιότητας της στοίχισης. Το γεγονός αυτό επαυξάνεται από την ομολογία, το συστηματικό σφάλμα και την καταμέτρηση αλληλουχιών καθώς και την περίπλοκη αλληλεπίδρασή της με την ιδιαίτερη εξελικτική ιστορία μιας πρωτεΐνης στόχου και της οικογένειας στην οποία ανήκει. Επομένως, προτείνεται να εξετάζονται προσεκτικά οι τελικές στοιχίσεις πριν τον τελικό σχεδιασμό, πιθανότατα με μια επικάλυψη των δευτεροταγών δομών προκειμένου να μετρηθούν τα συντηρημένα όρια και κενά. Οι επαναλήψεις φυλογενετικής εκτίμησης και οι περικοπές των αλληλουχιών μπορούν να βελτιώσουν την ποιότητα της στοίχισης, η οποία πρέπει να ελεγχθεί για την ύπαρξη ευθυγραμμισμένων στηλών που ταιριάζουν με δομικά μοτίβα ή στοιχεία δευτεροταγούς δομής που φέρουν λίγες ενσωματώσεις, απαλοιφές και κενά. Στατιστικές ενισχύσεις στον συναινετικό σχεδιασμό Είναι ενδιαφέρον το γεγονός ότι ο συναινετικός σχεδιασμός είναι επιτυχής παρά την υπόθεση του για την ανεξαρτησία των αμινοξέων, αγνοώντας την αναγνωρισμένη σημασία της συνεργασιμότητας (cooperativity) και της σύνδεσης (coupling) τους. Επιπρόσθετα, τα επιτυχή αποτελέσματα του ανταγωνίζονται και συχνά ξεπερνούν τα αντίστοιχα του ορθόλογου σχεδιασμού και της κατευθυνόμενης εξέλιξης. Η τελευταία παρατήρηση είναι εντυπωσιακή, δεδομένης της σχετικής ευκολίας με την οποία μπορεί να πραγματοποιηθεί ο συναινετικός σχεδιασμός. Η σύνδεση εκδηλώνεται ως μια απλή αλληλεπίδραση ζευγών αμινοξέων, μέσω έντονων και πολύπλοκων δια-ατομικών δικτύων. Για να λειτουργήσει ο συναινετικός σχεδιασμός, η σύνδεση πρέπει να είναι κωδικοποιημένη στην εξελικτική ιστορία και να εκπροσωπείται σε κάποιο βαθμό από την συντηρητικότητα των αμινοξέων, καθώς μπορεί να εξηγεί γιατί περίπου το 40% των αναφερθέντων συναινετικών μεταλλαγών είναι αποσταθεροποιητικές. Προσπάθειες βελτίωσης του συναινετικού σχεδιασμού έχουν χρησιμοποιήσει επιπρόσθετη στατιστική ανάλυση που αναγνωρίζει σύνδεση ή συμμεταβολή (covaration) και έχουν συμβάλλει με μεγάλη επιτυχία στην μηχανική της σταθερότητας. Η ένταξη τόσο των συντηρημένων όσο και των συνδεδεμένων μεταλλαγών ήταν απαραίτητη για την στατιστική ανάλυση σύνδεσης (statistical couple analysis, SCA) στον σχεδιασμό μιας WW επικράτειας (domain), καθώς ο συναινετικός σχεδιασμός από μόνος του είναι ανεπαρκής για την δημιουργία μιας σωστά αναδιπλωμένης πρωτεΐνης. Ωστόσο, σε δύο προηγούμενες μελέτες δεν παρουσιάστηκε δυσκολία στην δημιουργία αναδιπλωμένων και σταθερών WW επικρατειών, προτείνοντας πως η αποτυχία του συναινετικού σχεδιασμού πιθανότατα είναι αποτέλεσμα της σύνθεσης της MSA κι όχι κάποιου περιορισμού της WW επικράτειας αυτής καθ αυτής. Μια άλλη προσέγγιση αξιοποίησε την μέθοδο αμοιβαίας ενημέρωσης (mutual information method) με σκοπό τον υπολογισμό των στατιστικών αλληλεπιδράσεων ζευγών μεταξύ των θέσεων στην MSA και 5
επέλεξε να αποφύγει την πρόκληση μεταλλάξεων σε αυτά τα σημεία, βελτιώνοντας με αυτό τον τρόπο την ακρίβεια ταυτοποίησης σταθεροποιητικών μεταλλαγών από ~50 σε 90%. Παρόλα αυτά, αυτή η προσέγγιση δεν είναι πάντοτε απαραίτητη εφόσον η συμμεταβολή ζευγών εντός και μεταξύ επαναλαμβανόμενων μοτίβων αγκυρίνης βρέθηκε να εκπροσωπείται ικανοποιητικά από τον απλό συναινετικό σχεδιασμό. Ο ρόλος των καταλοίπων που συμμεταβάλλονται είναι λιγότερο κατανοητός από τον ρόλο των συναινετικών μεταλλαγών, παρόλο που σε ορισμένες περιπτώσεις τα συντηρημένα κατάλοιπα κωδικοποιούν περισσότερη, αν όχι ολική συνεργατικότητα. Ως εκ τούτου, ο συναινετικός σχεδιασμός και οι ενισχύσεις του μέσω ανίχνευσης συσχετιζόμενων καταλοίπων εξαρτώνται από (1) το πόσο καλά κωδικοποιείται η συνεργατικότητα στα συντηρημένα κατάλοιπα και από (2) το αν άλλες παρόμοιες συσχετίσεις είναι στατιστικά διακριτές στην στοίχιση. Επίσης παρουσιάζονται προβλήματα στον συναινετικό σχεδιασμό όταν υπάρχουν ασύμβατα συντηρημένα κατάλοιπα και συνδέσεις ως αποτέλεσμα αποκλίνουσας εξέλιξης, τα οποία διορθώνονται μέσω μεθόδων συμμεταβολής (covariation methods). Ωστόσο, οι μέθοδοι συμμεταβολής μπορεί να μην λειτουργήσουν σε όλα τα πιθανά σενάρια; τυπικά απαιτούν μεγάλου μεγέθους πολλαπλές στοιχίσεις αλληλουχιών για να διακρίνουν αμοιβαίες εξαρτήσεις αμινοξέων και δεν εφαρμόζονται σε περιπτώσεις που απαιτούνται μελέτες ουδέτερης παρέκκλισης, λόγω του σπάνιου φαινομένου της συνεξέλιξης. Είναι ενδιαφέρον το γεγονός ότι σε πολλές περιπτώσεις κατάλοιπα που συμμεταβάλλονται δεν έχουν στην πραγματικότητα φυσιο-χωρικές (physiospatial) αλληλεπιδράσεις μεταξύ τους, προκαλώντας συζήτηση για το τι προσδιορίζουν εν τέλει αυτές οι ενισχυτικές μέθοδοι. Οι συμμεταβαλλόμενες αντικαταστάσεις συχνά βρίσκονται σε διαφορετικούς κλάδους του φυλογενετικού δέντρου και είναι πιθανώς ανεξάρτητα γεγονότα τα οποία μπορεί να οφείλονται (είτε όχι) σε μοριακή συνεξέλιξη. Στην περίπτωση του συναινετικού σχεδιασμού, εντόνως διατηρημένα κατάλοιπα τείνουν να τοποθετούνται στον πυρήνα της πρωτεΐνης, εξελίσσονται αργά και ως εκ τούτου δεν εντοπίζονται μέσω ανάλυσης συμμεταβολής ακόμα με στοιχίσεις πολύ μεγάλου μεγέθους. Όμως, ανεξαρτήτως των περιπτώσεων, οι μέθοδοι συμμεταβολής φαίνεται να έχουν χρησιμότητα και να συμβάλλουν στην ανίχνευση ευνοϊκών ζευγών καταλοίπων που μπορούν να αξιοποιηθούν σε συνδυασμό με τον συναινετικό σχεδιασμό. Σχεδιάζοντας την θερμοδυναμική σταθερότητα Η προέλευση της σταθεροποίησης συναινετικών μεταλλαγών περιγράφει πως σε μια δεδομένη θέση στην MSA ομόλογων πρωτεϊνών, το αντίστοιχο συναινετικό αμινοξύ συμβάλει περισσότερο από τον μέσο όρο στην σταθερότητα της πρωτεΐνης σε σχέση με τα μη συναινετικά αμινοξέα (Εικόνα 1). Δηλαδή, ένα συντηρημένο κατάλοιπο είναι περισσότερο πιθανό να είναι σταθεροποιητικό από μια τυχαία μεταλλαγή στην ίδια θέση. Ωστόσο, αυτό δεν εξηγεί τον λόγο που τα συντηρημένα κατάλοιπα είναι περισσότερο σταθεροποιητικά. Μία πιθανή εξήγηση είναι πως η εξελικτική παρέκκλιση επέτρεψε την συλλογή διαφορετικών σταθεροποιητικών μεταλλαγών που απαιτούνται για την επαρκή σταθερότητα, καθώς οι πρωτεΐνες εξελίσσονταν από έναν μη εξειδικευμένο αλλά σταθερό κοινό πρόγονο. Μέσα από την πορεία της εξέλιξης των εξειδικευμένων λειτουργιών, πολλές πρωτεΐνες τώρα υφίστανται και ακροβατούν στο όριο μεταξύ της σταθερότητας και της λειτουργίας; γι αυτό το λόγο, σταθεροποιητικά κατάλοιπα τείνουν να διατηρούνται. Ως εκ τούτου, ο συναινετικός σχεδιασμός είναι ικανός να αξιοποιεί στο μέγιστο όφελος τα εκατομμύρια χρόνια της εξέλιξης και να ανιχνεύει σταθεροποιητικά χαρακτηριστικά από πολυάριθμα ομόλογα πρωτεϊνών συγχωνεύοντας ως επί το πλείστων επιπρόσθετες μεταλλαγές που καμία πρωτεΐνη δεν χρειάστηκε να συσσωρεύσει. Μεγάλο μέρος της συζήτησης για τον συναινετικό σχεδιασμό επικεντρώνεται πρωταρχικά στη γενική τάση για την βελτίωση της θερμοσταθερότητας. Πράγματι, ο συναινετικός σχεδιασμός αναφέρει ένα ευρύ φάσμα βελτιώσεων στο σημείο τήξης από την μέτρια αύξηση της οριακά σταθερής V H επικράτειας αντισώματος (T m = 36 ο C) των 6.1 ο C, την αύξηση της υψηλά σταθερής πράσινης φθορίζουσας πρωτεΐνης Azami (T m = ~90 ο C) των 5.5 ο C, έως την μεγάλη αύξηση των 32 ο C της μετρίως σταθερής νευρωνικής διαμεμβρανικής πρωτεΐνης πλούσιας σε επαναλήψεις λευκίνης στο ποντίκι (LRRTM2) (T m = ~50 ο C). Ωστόσο, η βελτίωση της θερμοδυναμικής σταθερότητας δεν είναι απαραίτητα το μοναδικό παρατηρούμενο αποτέλεσμα του συναινετικού σχεδιασμού. 6
Πρωτεϊνική εξελιξιμότητα Οι πρωτεΐνες είναι συχνά ανθεκτικές στις μεταλλαγές. Συγκεκριμένα, περισσότερες από τις μισές τυχαίες μεταλλαγές μίας θέσης επανακτούν την εγγενή λειτουργία της πρωτεΐνης. Ωστόσο, είναι γνωστό πως επιπρόσθετη θερμοδυναμική σταθερότητα ενισχύει την ανθεκτικότητα της φυσικής δομής στις τυχαίες μεταλλάξεις, μέσω αύξησης του κλάσματος των παραλλαγών που συνεχίζουν να κατέχουν την ελάχιστη σταθερότητα η οποία απαιτείται για την αναδίπλωση. Ο μηχανισμός με τον οποίο προκύπτει αυτό το φαινόμενο δεν είναι γνωστός, όμως πιστεύεται πως εμπλέκει έναν συνδυασμό ισχυρής σταθερότητας και καταλοίπων «γενικής καταστολής» (global suppressor) που αντισταθμίζουν την επίδραση των επιβλαβών μεταλλαγών. Στο πλαίσιο του συναινετικού σχεδιασμού, παρατηρείται με βεβαιότητα η ισχυρή σταθερότητα ωστόσο, χωρίς εκτεταμένες μελέτες μεταλλαξογένεσης, δεν είναι ξεκάθαρο αν τα συντηρημένα κατάλοιπα εκδηλώνουν ιδιότητες γενικής καταστολής. Δεδομένου ότι τα κατάλοιπα γενικής καταστολής φαίνεται να μεταβιβάζονται μεταξύ των ομόλογων πρωτεϊνών, όπως στην περίπτωση της ΤΕΜ β-λακταμάσης, είναι λογικό να προτείνει κανείς πως τα συντηρημένα κατάλοιπα με ιδιότητες γενικής καταστολής θα επάγουν παρόμοιες επιδράσεις όταν προκύπτουν από συναινετικό σχεδιασμό. Ο συναινετικός σχεδιασμός έχει αξιοποιηθεί για να ενισχύσει την εξελιξιμότητα της υπολογιστικά σχεδιασμένης Kemp ελιμινάσης (Kemp eliminase, KE59). Αρχικό σκοπό αποτελούσε η βελτίωση της δραστικότητας της με κατευθυνόμενη εξέλιξη. Η σταθερότητα όμως της ΚΕ59 ήταν ανεπαρκής για να ανεχθεί μεταλλαγές, παράγοντας μη αναδιπλωμένες πρωτεΐνες με γρήγορο ρυθμό και κατ επέκταση παγιδεύοντας την εξελικτική τροχιά σε ένα τοπικό ελάχιστο. Για την ενίσχυση της εξελιξιμότητας της ΚΕ59, τα συντηρημένα κατάλοιπα εμπλούτισαν την βιβλιοθήκη της κατευθυνόμενης εξέλιξης, οδηγώντας στην βελτίωση της πρωτεϊνικής σταθερότητας και στην νέα εξέλιξη της λειτουργίας. Ένα παρόμοιο αποτέλεσμα έχει αναφερθεί για την κατευθυνόμενη εξέλιξη μιας πρωτεΐνης με επαναλήψεις αγκυρίνης (DARPin) για τη δέσμευση στην HER2, η οποία προέκυψε με συναινετικό σχεδιασμό. Συνεπώς, αυτές οι μελέτες αποδεικνύουν την ικανότητα του συναινετικού σχεδιασμού να παρέχει σταθεροποιητικά χαρακτηριστικά για μετέπειτα μελέτες μηχανικής. Διαμορφώνοντας το ενεργειακό τοπίο Η ενεργειακή σταθερότητα των πρωτεϊνών συχνά δεν εξετάζεται στον πρωτεϊνικό σχεδιασμό τους, λόγω της μεγάλης τάσης τους προς μετουσίωση, καθώς επίσης και των δυσκολιών που υπάρχουν κατά τη μελέτη των πολύπλοκων μονοπατιών διπλώματος. Παρόλα αυτά, η θερμοδυναμική σταθερότητα από μόνη της δεν εγγυάται ότι η πρωτεΐνη θα αναδιπλωθεί σωστά ή θα παραμείνει αναδιπλωμένη σε φυσική κατάσταση για εκτεταμένη χρονική περίοδο κάτω από βιολογικές ή βιομηχανικές συνθήκες. Για να διπλωθεί και κατ επέκταση να λειτουργήσει σωστά μία πρωτεΐνη in vivo απαιτείται αδρό ενεργειακό τοπίο, το οποίο ωστόσο μπορεί να οδηγήσει σε συσσώρευση και μη σωστή αναδίπλωση. Η λεπτή ισορροπία μεταξύ λειτουργίας και μη ορθού διπλώματος διευκρινίζεται από μέλη της υπεροικογένειας των σερπινών ή αναστολέων πρωτεασών σερίνης. Οι πρωτεΐνες αυτές διπλώνονται σε μια ενδιάμεση φυσική κατάσταση που υποβάλλονται σε μία μεγάλη δομική αλλαγή έτσι ώστε να αναστείλουν τις πρωτεάσες-στόχους. Οι σερπίνες έχουν αναπτύξει έναν σχετικά πολύπλοκο μηχανισμό διπλώματος απαραίτητο για την λειτουργία τους, με ποικιλία στην αλληλουχία και στην δομή εντός της υπεροικογένειας που αντανακλά τις λειτουργικές και ρυθμιστικές απαιτήσεις. Για την εξακρίβωση αυτού του μηχανισμού, πραγματοποιήθηκε ένα πείραμα όπου κατασκευάστηκε μία συνθετική σερπίνη. Αυτή η συνθετική σερπίνη επέδειξε ένα αναστρέψιμο δίπλωμα δυο-καταστάσεων διατηρώντας όμως τη θερμοδυναμική της σταθερότητα, τη λειτουργικότητα της καθώς και την αντίσταση στον πολυμερισμό. Aκόμα, βιοφυσικές και δομικές αναλύσεις υποδήλωσαν ότι ο συναινετικός σχεδιασμός άλλαξε το ενεργειακό τοπίο της, μειώνοντας τη διάρκεια ζωής των ενδιάμεσων συσσωματωμάτων. Μία παρόμοια, αλλά λιγότερο έντονη επίδραση του συναινετικού σχεδιασμού παρατηρήθηκε και σε μία άλλη πρωτεΐνη, την FN3con, όπου οδήγησε σε μεγάλη αύξηση στον ρυθμό διπλώματος και μείωση στο ρυθμό ξεδιπλώματος (υψηλή κινητική σταθερότητα), υποδεικνύοντας ένα πιο ομαλό και σταθερό ενεργειακό τοπίο, δηλαδή με λιγότερες «ενεργειακές παγίδες». Παρόλο όμως που ο συναινετικός σχεδιασμός αλλάζει το ενεργειακό τοπίο των πρωτεϊνών, σπάνια βλέπουμε βελτιώσεις όσον αφορά το δίπλωμα και τη θερμοδυναμική σταθερότητα τους. Η επιτυχία του εγχειρήματος αυτού εξαρτάται πιθανότατα από τις λειτουργικές απαιτήσεις και την εξελικτική ιστορία 7
των πολλαπλών στοιχισμένων ακολουθιών. Στη περίπτωση των σερπινών όμως, το δίπλωμα που δεν ακολουθεί το κανονικό μονοπάτι (off-pathway folding) κι ο πολυμερισμός είναι αποτέλεσμα ανεξάρτητων εξελικτικά προσαρμογών του ενεργειακού τοπιού σαν μέσο δομικού ελέγχου της λειτουργίας. Καθώς αυτά τα ανεξάρτητα μονοπάτια δεν είναι συντηρημένα στη πολλαπλή στοίχιση, αφαιρούνται από τον συναινετικό σχεδιασμό με αποτέλεσμα ένα ομαλότερο και ενεργειακά σταθερότερο ενεργειακό τοπίο. Παράλληλα διατηρούν τις συντηρητικές δομικές ιδιότητες που είναι απαραίτητες για την λειτουργία (Εικόνα 2). Είναι δελεαστική η υπόθεση ότι ο συναινετικός σχεδιασμός μπορεί να οδηγήσει σε ενδιαφέρουσες μελέτες κι αλλαγές του ενεργειακού τοπίο των πρωτεϊνών. Λειτουργία Η λειτουργία των συναινετικά σχεδιασμένων πρωτεϊνών μπορεί να διατηρηθεί αν κι αυτό εξαρτάται από το σκοπό του σχεδιασμού. Γενικά, οι συναινετικές μεταλλάξεις, κι ειδικά εκείνες που είναι μακριά από το ενεργό κέντρο, καθιστούν τη λειτουργία των πρωτεϊνών ανέγγιχτη. Αντίθετα, ο σχεδιασμός ολοκληρωμένων αλληλουχιών de novo, είναι πολύ πιθανόν να μειώσει τον ρυθμό κατάλυσης και την εξειδίκευση, ωστόσο τείνουν να διατηρούν την λειτουργία σε υψηλές θερμοκρασίες και μεγάλες τιμές ph. Ο σχεδιασμός ολοκληρωμένων αλληλουχιών de novo υποκύπτει πιθανώς σε αυτά τα αποτελέσματα, όπως κι η εξομάλυνση του ενεργειακού τοπίου λόγω του ότι τα σημαντικά καταλυτικά χαρακτηριστικά όλων των ομολόγων δεν είναι συντηρημένα κι έτσι αφαιρούνται κατά την διάρκεια του σχεδιασμού. Ουσιαστικά πρέπει να ορίζεται ένας στόχος κατά τα αρχικά στάδια της έρευνας και να λαμβάνεται υπόψη αν χρειάζεται να πραγματοποιηθεί οποιαδήποτε πρόσθετη κατευθυνόμενη εξέλιξη και βελτιστοποίηση της λειτουργίας. Ανοσογονικότητα Η εφαρμογή του συναινετικού σχεδιασμού στη μείωση της ανοσογονικότητας, που αποτελεί ένα σημαντικό παράγοντα για το σχεδιασμό θεραπευτικών πρωτεϊνών, παραμένει σημαντικά ανεξερεύνητη. Ενδιαφέρον προκαλεί ότι η πρώτη σχεδιασμένη πρωτεΐνη, η alfacon- 1 είναι λιγότερο ανοσογονική και περισσότερο ενεργή από την ανασυνδυασμένη ιντερφερόνη-α (IFN-a). Η πρωτεΐνη αυτή έχει δημιουργηθεί μέσω πολλαπλής στοίχισης 25 τύπων της IFN-a, κι είναι η μόνη που προωθήθηκε ως θεραπευτικό φάρμακο. Παρόλο που η alfacon-1 είναι η μόνη πρωτεΐνη που έχει σχεδιαστεί συναινετικά για τη μείωση της ανοσογονικότητας, υπολογιστικές εκτιμήσεις όπου χρησιμοποιήθηκαν FN3 domains δείχνουν, πως η πρωτεΐνη Tencon μπορεί επίσης να παρουσιάσει χαμηλή ανοσογονικότητα. Φυσικά είναι πιθανό πως η απουσία τέτοιων αναφορών, ίσως να φανερώνουν μια γενική αποτυχία του συναινετικού σχεδιασμού στην μείωση της ανοσογονικότητας. Το μονό που είναι σίγουρο είναι ότι η πιθανότητα της μείωσης της ανοσογονικότητας μιας πρωτεΐνης μέσω του συναινετικού σχεδιασμού επιζητά περαιτέρω έρευνα. 8
Εικόνα 2: Εξομάλυνση πέντε υποθετικών ενεργειακών τοπίων μέσω συναινετικού σχεδιασμού. Πέντε πρωτεϊνικά ομόλογα παρουσιάζουν διαφορές στα ενεργειακά τους τοπία, με τρία από αυτά να περιέχουν κινητικές παγίδες με τάση προς λανθασμένη αναδίπλωση. Εφόσον οι κινητικές παγίδες δεν είναι συντηρημένες και στα πέντε ομόλογα, ο συναινετικός σχεδιασμός είναι σε θέση να εξομαλύνει το ενεργειακό τοπίο ώστε να εξαλειφθούν τα μη συντηρημένα χαρακτηριστικά. [1] Συμπεράσματα Ο συναινετικός σχεδιασμός είναι αποδεδειγμένα μία μέθοδος υψηλής αποδοτικότητας η οποία όμως παραβλέπεται στην πρωτεϊνική μηχανική λόγω της διαδεδομένης χρήσης της κατευθυνόμενης εξέλιξης και του ορθολογικού σχεδιασμού. Δεδομένων των δυσκολιών της υπολογιστικής ανάλυσης της εντροπίας και των καταστάσεων μη σωστού διπλώματος των πρωτεϊνών, ο συναινετικός σχεδιασμός παρέχει ένα επιπλέον εργαλείο όχι μόνο στη θερμοδυναμική σταθεροποίηση της πρωτεΐνης αλλά και στη διαμόρφωσης του ενεργειακού τοπίου της. 9
Βιβλιογραφία 1) Porebski B.T., Buckle A.M. (2016) Consensus Protein Design. Protein Engineering, Design and Selection, 29.7, 245 251. 2) Branden C., Tooze J. (1999) Πρόβλεψη, μηχανική και σχεδιασμός πρωτεϊνικών δομών. Εισαγωγή στη δομή πρωτεϊνών. New York: Garland Pub. 3) Jäckel C., Bloom J.D., Kast P., Arnold F.H., Hilvert D. (2010) Consensus Protein Design without Phylogenetic Bias. Journal of Molecular Biology, 399, 541 546 4) Lutz S. (2010) Beyond directed evolution - semi-rational protein engineering and design. Current Opinion in Biotechnology, 21(6), 734 743. 5) Sullivan B.J., Durani V, Magliery T.J. (2011) Triosephosphate isomerase by consensus design: dramatic differences in physical properties and activity of related variants. Journal of Molecular Biology, 413(1):195-208. 6) Kajander T., Cortajarena A.L., Regan L. (2007) Consensus Design as a Tool for Engineering Repeat Proteins. Methods in Molecular Biology, 340, 151-170 Εικόνες [1], [2] : Porebski B.T., Buckle A.M. (2016) Consensus Protein Design. Protein Engineering, Design and Selection, 29.7, 245 251. 10