Getting Momentum: From Biocatalysis to Advanced Synthetic Biology Christoffel P.S., Badenhorst 1,2 and UweT.Bornscheuer 1 1 Institute of Biochemistry, Department of Biotechnology and Enzyme Catalysis, Greifswald University, Felix-Hausdorff-Strasse 4, 17487 Greifswald, Germany 2 Correspondence: chris.badenhorst@uni-greifswald.de (C.P.S. Badenhorst). Abstract Applied biocatalysis is driven by environmental and economic incentives for using enzymes in the synthesis of various pharmaceutical and industrially important chemicals. Protein engineering is used to tailor the properties of enzymes to catalyze desired chemical transformations, and some engineered enzymes now outperform the best chemocatalytic alternatives by orders of magnitude. Unfortunately, custom engineering of a robust biocatalyst is still a time-consuming process, but an understanding of how enzyme function depends on amino acid sequence will speed up the process. This review demonstrates how recent advances in ultrahigh-throughput screening, mutational scanning, DNA synthesis, metagenomics, and machine learning will soon make it possible to model, predict, and manipulate the relationship between protein sequence and function, accelerating the tailor design of novel biocatalysts. Πρωτεϊνική μηχανική: βασική δύναμη της εφαρμοσμένης βιοκατάλυσης Στόχος της εφαρμοσμένης χημείας είναι η κατά παραγγελία παραγωγή πολύτιμων χημικών, φαρμακευτικών και άλλων ενώσεων μέσω ενζύμων. Τα ένζυμα θεωρούνται ελκυστικοί καταλύτες για ποικίλους λόγους. Μερικοί από αυτούς είναι η αύξηση του ρυθμού μίας χημικής αντίδρασης έως και 17 τάξεις μεγέθους, η εμφάνιση χήμειο-, στέρεο- και τοποεκλεκτικότητας σε υδάτινα περιβάλλοντα αλλά και σε κανονικές συνθήκες, η αντοχή σε οργανικούς διαλύτες, η ικανότητα καταστολής κάποιων αντιδράσεων και προώθηση άλλων, καθώς και η οικονομική παραγωγή των ίδιων των ενζύμων από ανανεώσιμες πηγές ενέργειας. Εντούτοις, δεν έχουν ακόμα ανακαλυφθεί ένζυμα κατάλληλα για κάποιες σημαντικές χημικές αντιδράσεις: Κάποια φυσικά ένζυμα βρέθηκαν να καταλύουν μερικές από αυτές, έχουν όμως χαμηλή αποδοτικότητα και συγγένεια με τα υποστρώματα ή είναι ευάλωτα στις επικρατούσες ακραίες συνθήκες. Συνεπώς, μια θεμελιώδης πρόκληση είναι η αύξηση της καταλυτικής αποδοτικότητας των φυσικών ενζύμων κατά πολλές τάξεις μεγέθους. Η πρωτεϊνική μηχανική αντιμετωπίζει αυτή την πρόκληση μέσω της τροποποίησης της δομής των ενζύμων βελτιώνοντας έτσι την αντοχή τους σε ακραίες συνθήκες, αυξάνοντας την ειδική ενεργότητα, το εύρος των υποστρωμάτων και τη χήμειο-, στέρεο- και εναντιοεκλεκτικότητα τους. Επιπροσθέτως, έχει συμβάλει στην δημιουργία βιοκαταλυτών ικανών για σχηματισμό δεσμών ανύπαρκτων στη φύση, όπως δεσμοί μεταξύ άνθρακα-πυριτίου (C-Si) και άνθρακα-βορίου (C-B). Δυστυχώς, η πρόβλεψη των απαιτούμενων μεταλλαγών για τον σχεδιασμό των καινοτόμων βιοκαταλυτών είναι δύσκολη. Εξαιτίας της ανάγκης για δημιουργία φαρμάκων, κρίνεται σημαντική η επιτάχυνση της διαδικασίας δημιουργίας των βιοκαταλυτών. Παρακάτω γίνεται μια προσπάθεια αποσαφήνισης του πώς η πρόοδος στις τεχνολογίες, όπως η μικρορευστομηχανική (microfluidics), η σάρωση μεταλλαγών DMS (deep mutational scanning) και η [1]
μεταγονιδιωματική (metagenomics), αυξάνει την ταχύτητα κατασκευής καινοτόμων πρωτεϊνών και αποκαλύπτει νέες χημικές προσεγγίσεις με τη χρήση των τροποποιημένων βιοκαταλυτών. Πρόσφατες εξελίξεις στην μηχανική των μεταλλοενζύμων Τελευταία γίνεται μεγάλη προσπάθεια ανάπτυξης τεχνητών μεταλλοενζύμων από καταλυτικά, αλλά και μη-καταλυτικά ένζυμα. Οι δεσμοί C-Si και C-B δεν έχουν παρατηρηθεί στη φύση και επιτεύχθηκαν μέσω χημικών μεθόδων. Υπάρχουν όμως και αρκετοί περιορισμοί όπως απαίτηση αλογονικών διαλυτών, λειτουργία σε χαμηλές θερμοκρασίες και χαμηλή TTN. Χάρη στην ιδιότητα μερικών ενζύμων να μπορούν να καταλύουν περισσότερες αντιδράσεις από αυτές για τις οποίες εξελίχθηκαν, μπορούμε να τα βελτιστοποιήσουμε μέσω κατευθυνόμενης εξέλιξης. Βρέθηκε πως η ελεύθερη αίμη μπορούσε να δημιουργήσει δεσμό C-Si και μόνο το θερμοανθεκτικό κυτόχρωμα c του Rhodothermus marinus έχει ΤΤΝ>30, είναι εναντιοεκλεκτικό και με μεταλλαξογένεση 3 περιφερειακών καταλοίπων δίνει το ενεργό ένζυμο Rma cyt c με ΤΤΝ>1500, εναντιοεκλεκτικότητα >99% και χημειοεκλεκτικότητα για εισαγωγή καρβενίων σε δεσμούς Si-H. Συνεπώς, το Rma cyt c έδωσε την ευκαιρία παραγωγής πυριτιοοργανικών ενώσεων in vivo. Έπειτα, βελτιστοποιήθηκε το Rma cyt c σε μορφή ικανή να καταλύει εναντιοεκλεκτικά την δημιουργία βοριοοργανικών ενώσεων μέσω σχηματισμού του δεσμού C-B με ΤΤΝ μέχρι και 15.300 και 100% χημειοεκλεκτικότητα. Έκτοτε, το εύρος των αντιδράσεων που καταλύουν οι αιμο-πρωτεΐνες έχει επεκταθεί, εμπεριέχοντας πια και αντιδράσεις μεταφοράς νιτρενίων, όπως είναι η αζιριδινίωση, ιμιδίωση σουλφιδίων και αμίνωση των C-H. Η αντικατάσταση των συμπαραγόντων αίμης-σιδήρου με συνθετικές ιριδιο-πορφυρίνες δημιουργεί ένζυμα μεταφοράς καρβενίων και νιτρενίων, τα οποία καταλύουν αντιδράσεις μη βιολογικές σε ρυθμούς που αγγίζουν των φυσικών ενζύμων. Έτσι έχει επιτευχθεί και παραγωγή του φαρμάκου levomilnacipran. Όμως η in vivo κατευθυνόμενη εξέλιξη των τεχνητών μεταλλοενζύμων είναι δύσκολη εξαιτίας της καταστολής τους από κυτταρικά συστατικά όπως είναι η γλουταθειόνη. Κατευθυνόμενη εξέλιξη και πλατώ βελτιστοποίησης Η ταυτοποίηση των βέλτιστων ενζυμικών αλληλουχιών είναι δύσκολη υπόθεση, εφόσον ο αριθμός των πιθανών αλληλουχιών είναι ασύλληπτα μεγάλος και δεν μπορεί να ερευνηθεί εξαντλητικά, ακόμη και με υπολογιστικά μέσα, ώστε εντοπιστεί μια λειτουργική αλληλουχία. Ουσιαστικά, υπάρχει ανάγκη περιορισμού του μεγέθους τους σε ένα πιο διαχειρίσιμο. Ανάλογα την πρωτεΐνη, για την βελτίωση της καταλυτικής αποδοτικότητας κατά 3 τάξεις μεγέθους, τυπικά, απαιτούνται τουλάχιστον 10 μεταλλαγές. Μεγάλη επιτυχία υπήρξε η τροποποίηση μιας τρανσαμινάσης με την προσθήκη δύο ογκωδών υποκαταστατών με σκοπό την παραγωγή του αντιβιοτικού Sitagliptin. Τελικά, με την πρόκληση 27 μεταλλαγών, γεγονός που θα συνέβαινε με εξαιρετικά μικρή πιθανότητα στη φύση, παρασκευάστηκε μια εκδοχή της 30.000 φορές πιο αποδοτική. Η πιθανότητα αυτή μπορεί να βρεθεί με την διαδικασία γνωστή ως κατευθυνόμενη εξέλιξη, της οποίας η βασική αρχή είναι η σταδιακή συγκέντρωση ωφέλιμων μεταλλαγών κατά τους επαναλαμβανόμενους κύκλους διαφοροποίησης. Τελευταία, θεωρείται μία από τις σημαντικότερες στρατηγικές πρωτεϊνικής μηχανικής, καθώς η βελτίωση κατά μία ή δύο τάξεις μεγέθους απαιτεί μονάχα λίγους κύκλους κατευθυνόμενης εξέλιξης, ειδικά όταν η αρχική ενεργότητα είναι πολύ χαμηλή. Ωστόσο, οι τελευταίες μεταλλάξεις συμβάλλουν ελάχιστα στην συνολική βελτίωση, αφού οι αποδόσεις ελαττώνονται και η φθάνει στο πλατώ βελτιστοποίησης. Στους πρώτους γύρους της κατευθυνόμενης εξέλιξης της τρανσαμινάσης στο Sitagliptin η ενεργότητα αυξήθηκε κατά 75, τέσσερις και εννιά φορές αντίστοιχα, ενώ οι επόμενοι γύροι δεν προσέφεραν αύξηση πάνω από δύο φορές, εξηγώντας έτσι την ανάγκη για εκτέλεση πολλαπλών κύκλων κατευθυνόμενης εξέλιξης, ώστε να προκύψουν υψηλές ενεργότητες, και [2]
τον λόγο που δεν παρατηρείται στην βιβλιογραφία βελτίωση περισσότερο από 10 4 φορές. Συνήθως είναι απίθανο να γνωρίζουμε εάν έχει κατορθωθεί η μέγιστη δυνατή ενεργότητα ή ποιος συνδυασμός μεταλλαγών θα τη βελτιώσει περαιτέρω. Ultrahigh-Throughput Screening για να αποφευχθεί το πλατώ βελτιστοποίησης Σε ακραίες περιπτώσεις, μπορεί να απαιτείται ενσωμάτωση αρκετών μεταλλαγών ταυτόχρονα, ώστε να ξεπεραστεί το πλατώ βελτιστοποίησης, να καταλήξει σε υψηλότερη ενεργότητα, να αποφευχθούν τα εξελικτικά αδιέξοδα και να διατηρηθούν οι συνεργατικές επιδράσεις, πράγμα απρόσιτο για την κατευθυνόμενη εξέλιξη που βασίζεται στην σταδιακή συσσώρευση των μεταλλαγών, αν και μπορεί να οδηγήσει σε τεράστιες βιβλιοθήκες ισομορφών. Εδώ κρίνονται κατάλληλες οι τεχνολογίες ultrahigh-throughput screening/selection. Στην πιο απλή περίπτωση, η in vivo επιλογή μιας επιθυμητής ενεργότητας μπορεί να χρησιμοποιηθεί για τον διεξοδικό έλεγχο βιβλιοθηκών αν και είναι εφαρμόσιμη μόνο σε ελάχιστα ένζυμα. Έτσι, βρίσκεται υπό ανάπτυξη το σύστημα του βιοαισθητήρα, που επιτρέπει την ανάπτυξη μόνο εκείνων των κυττάρων που παράγουν το επιθυμητό προϊόν, η Droplet microfluidics, που αναγνωρίζει και επιλέγει μια ενζυμική ενεργότητα σε κυττάρα παγιδευμένα σε pl σταγόνες, και η μscale που καταμετρά και διαλέγει πρωτεϊνικές ιδιότητες με κάμερα φθορισμού. Όμως, η δυνατότητα εφρμογής των παραπάνω συστημάτων διαφέρει ανάλογα τη φύση της πρωτεινικής ιδιότητας που πρόκειται να βελτιστοποιηθεί. Για παράδειγμα, είναι συχνά δύσκολο να αναπτυχθεί υψηλής παραγωγικότητας μέθοδος για τον έλεγχο εναντιοεκλεκτικών ενζύμων. Σε τέτοιες περιπτώσεις, μονό σχετικά λίγες εκδοχές μπορούν να εξεταστούν καθημερινά με τη χρήση χρωματογραφικών μεθοδών και έτσι, η δημιουργία των «μικρών αλλά έξυπνων» βιβλιοθηκών παραμένει κρίσιμη. Σκανάρισμα μεταλλαγών για την κατανόηση της σχέσης αλληλουχίας - ενεργότητας Οι μηχανισμοί της εξέλιξης που οδηγούν σε μια καινοτόμο ενζυμική ενεργότητα δεν έχουν κατανοηθεί εξ ολοκλήρου και η απουσία της γνώσης σχέσης πρωτεϊνικής δομής και λειτουργίας εμποδίζει την παραγωγή ενός καινοτόμου βιοκαταλύτη μέσω στοχευμένων μεταλλαγών. Συνεπώς, γίνεται προσπάθεια δημιουργίας μιας μεγάλης κλίμακας δεδομένων μεταλλάξεων για την εξερεύνηση των πιο καθοριστικών καταλοίπων μιας πρωτεΐνης. Στην απλούστερη περίπτωση, η σάρωση μεταλλαγών υψηλής κλίμακας (deep mutational scanning) θα αποκαλύψει τις λειτουργικές συνέπειες όλων των δυνατών απλών μεταλλάξεων. Η συνήθης προσέγγιση είναι το σκανάρισμα των πρωτεϊνικών παραλλαγών για μια ιδιότητα και έπειτα η αλληλούχιση των βιβλιοθηκών πριν και μετά το σκανάρισμα, επιτρέποντας έτσι τον υπολογισμό της αρμοστικότητας κάθε εκδοχής. Μέσω της deep mutation scanning μπορούμε να προβλέψουμε το πιο καθοριστικό αμινοξικό κατάλοιπο, καθώς ταυτοποιεί τα hotspots μεταλλαγών που διαφοροποιούνται κατά την κατευθυνόμενη εξέλιξη. Παρατηρήθηκε ότι οι μεταλλαγές που επηρεάζουν την πρωτεϊνική ενεργότητα και την εξειδίκευση του ενζύμου στο υπόστρωμα είναι διασκορπισμένες και όχι απαραίτητα κοντά στο ενεργό κέντρο, αν και εκεί υπάρχει μεγαλύτερη επίδραση. Επίσης, τα hotspots που βρέθηκαν για ένα υπόστρωμα μπορεί να διαφέρουν σε άλλα υποστρώματα, άρα οι ωφέλιμες μεταλλαγές είναι ειδικές ως προς το υπόστρωμα και μη προβλέψιμες. Συνεπώς, για την παρουσίαση των περιοχών μεταλλαξιμότητας με σκοπό την ταυτοποίηση των λειτουργικών hotspots θα πρέπει να χρησιμοποιηθούν πολλαπλά υποστρώματα. [3]
Προχωρημένο υπολογιστικό σχέδιο και μέθοδος σύνθεσης DNA για τροποποίηση βιοκαταλυτών Η υπολογιστική πρωτεϊνική μηχανική μεγιστοποιεί το κλάσμα των λειτουργικών εκδοχών μιας βιβλιοθήκης μέσω αυτοματοποιημένης αξιολόγησης και κατάταξης εκδοχών από μεγάλες εικονικές βιβλιοθήκες κατασκευασμένες in silico. Οι ημιορθολογικές προσεγγίσεις εκμεταλλεύονται πληροφορίες συλλεγμένες από βάσεις δεδομένων πρωτεϊνικών αλληλουχιών και δομών, δεδομένα από πειράματα σάρωσης μεταλλαγών και προβλέψεις των αλγορίθμων μηχανικής μάθησης, με σκοπό τον σχεδιασμό «μικρών αλλά έξυπνων» βιβλιοθηκών. Έχουν γίνει δύο σημαντικά βήματα στην ικανότητα γρήγορης τροποποίησης μικρών πρωτεϊνών με επιθυμητές ιδιότητες: Αρχικά, η ικανότητα in silico σχεδιασμού και μοντελοποίησης της δομής μιας μικροπρωτεΐνης με ατομική ακρίβεια και δεύτερον, η ικανότητα οικονομικής σύνθεσης πάνω από 50.000 μοναδικών 200αμερών ολιγονουκλεοτιδίων, αρκετά μεγάλα για την κωδικοποίηση των παραπάνω μικροπρωτεϊνών. Η υψηλής παραγωγικότητας DNA σύνθεση, σάρωση και αλληλούχιση μπορούν να χρησιμοποιηθούν για επαναλαμβανόμενη περιγραφή χιλιάδων σχεδιασμένων μικροπρωτεϊνών ως προς την αναδίπλωση, τη σταθερότητα ή τη σύνδεση σε μια στοχευμένη πρωτεΐνη. Τα προκύπτοντα πειραματικά δεδομένα μπορούν να χρησιμοποιηθούν για την βελτίωση των αυθεντικών υπολογιστικών σχεδιασμών ή των αλγορίθμων μηχανικής μάθησης, ώστε οι επόμενες βιβλιοθήκες να είναι περιεκτικότερες σε λειτουργικές εκδοχές. Δυστυχώς, τα χαμηλού κόστους ολιγονουκλεοτίδια που χρησιμοποιούνται είναι αρκετά μικρού μήκους για την κωδικοποίηση ενός τυπικού ενζύμου. Βέβαια, υπάρχει δυνατότητα σύνθεσης γονιδίων μεγαλύτερου μήκους, όμως το κόστος τους εμποδίζει τον σχεδιασμό και την κατασκευή χιλιάδων αλληλουχιών. Το μέσο κόστος μιας ολιγονουκλεοτιδικής σύνθεσης δεν έχει μειωθεί τα τελευταία 10 χρόνια (100$ ανά 1000 bp γονίδιο), όμως βάσει το Genome Project-Wirite προβλέπεται δραματική μείωση των εξόδων κατά τρεις τάξεις μεγέθους την επόμενη δεκαετία. Τελευταία, αναπτύσσεται η τεχνολογία ονόματι DropSynth, ικανή να συναρμολογεί ταυτόχρονα χιλιάδες γονίδια από φθηνά και εύκολα διαθέσιμα ολιγονουκλεοτίδια, με κόστος από 2$ και κάτω ανά γονίδιο. Η DropSynth επιτρέπει τον καθορισμό αλληλουχιών μεμονωμένων εκδοχών σε μια βιβλιοθήκη, μεγιστοποιώντας το κλάσμα των λειτουργικών εκδοχών της και για πρώτη φορά, παρέχεται η δυνατότητα για μεγάλης κλίμακας εφαρμογή υπολογιστικών σχεδιασμών και αλγορίθμων μηχανικής μάθησης σε μεγαλύτερες πρωτεΐνες. Η υπολογιστική μεθοδολογία έχει εξελιχθεί τόσο που μπορεί να σχεδιαστεί μια θερμοσταθερή πρωτεΐνη ΤΙΜ-βαρέλι 184 καταλοίπων από την αρχή με ακρίβεια σε επίπεδο ατόμου, οπότε ανοίγει ο δρόμος για την τροποποίηση μιας νέας γενιάς ενζύμων που δεν ήταν προηγουμένως προσιτή είτε μέσω φυσικής είτε μέσω κατευθυνόμενης εξέλιξης. Ωστόσο, η πρόσφατη τεχνολογία de novo σχεδίασης δεν σχετίζεται με την βιοκατάλυση, διότι σχεδόν όλα τα ένζυμα είναι μεγαλύτερα από αυτά που μπορούν να σχεδιαστούν υπολογιστικά. Εντούτοις, η απασχόληση με μικροπρωτεΐνες προσφέρει διάφορα σημαντικά πλεονεκτήματα στον σχεδιασμό καινοτόμων βιοκαταλυτών. Καταρχάς, μπορεί να σχεδιαστεί εύκολα η de novo δομή τους. Δεύτερον, υπάρχει δυνατότητα σχεδιασμού μικροπρωτεϊνών που διπλώνουν αποτελεσματικά και με υψηλή σταθερότητα. Τρίτον, ο μικρός αριθμός καταλοίπων είναι ευνοϊκός για πειράματα deep mutational scanning, αλλά και για αλγορίθμους μηχανικής μάθησης που είναι απαραίτητο για τη μοντελοποίηση της σχέσης αλληλουχίας-ενεργότητας. Τέλος, στις μικρές πρωτεΐνες οι επιστατικές αλληλεπιδράσεις δεν χάνονται όταν αλληλουχείται ένα γονίδιο που κωδικοποιεί πρωτεΐνη με λιγότερα από 100 αμινοξικά κατάλοιπα. Μηχανική μάθηση Οι αλγόριθμοι μηχανικής μάθησης έχουν την ικανότητα μοντελοποίησης των πολύπλοκων σχέσεων μεταξύ των πρωτεϊνικών αλληλουχιών και της λειτουργίας τους, εντοπίζοντας τα αμινοξικά [4]
πρότυπα που προσδίδουν αυτή τη λειτουργικότητα, από δεδομένα άλλων πρωτεϊνικών αλληλουχιών με ήδη γνωστές λειτουργίες. Το γεγονός αυτό σε συνδυασμό με την παραγωγή πληθώρας δεδομένων για τις σχέσεις αλληλουχίας-λειτουργίας που προέρχονται από μεθόδους όπως η σάρωση μεταλλαγών υψηλής απόδοσης (deep mutational scanning) δημιουργούν τις συνθήκες για την εφαρμογή των αλγορίθμων αυτών. Οι παράγοντες που καθιστούν την ισομορφή ενός ενζύμου αποτελεσματικότερη από μία άλλη είναι ελάχιστα κατανοητοί γι αυτό και ένα εμπόδιο στην ανάπτυξη νέων βιοκαταλυτών, που λύνεται με την μηχανική μάθηση, είναι ότι πολλά πειράματα εισάγουν ταυτόχρονα πολλαπλές μεταλλάξεις, δυσκολεύοντας τον προσδιορισμό των χρήσιμων μεταλλαγών που βελτιστοποιούν τελικά την λειτουργία του ενζύμου.ένα πρώιμο παράδειγμα επανασχεδιασμού βιοκαταλυτών με μηχανική μάθηση μέσω της μεθόδου ProSAR, ήταν η σύνθεση του φαρμάκου ατορβαστατίνη (Lipitor). Η στατιστική σύγκριση διάφορων ισομορφών με την ίδια υποκατάσταση που δημιουργήθηκαν με πολλαπλές μεταλλάξεις, αποκάλυπτε εάν μία υποκατάσταση ήταν ευεργετική ή όχι. Αυτό είχε ως αποτέλεσμα τη σάρωση πάνω από 35 ισομορφών και βελτίωσε κατά 4000 φορές την ογκομετρική παραγωγικότητα. Με την εφαρμογή Μπαγεσιανής στατιστικής προσέγγισης, μπορούμε να προβλέψουμε, την ενζυμική δραστικότητα, τη θερμοσταθερότητα ακόμα και την εξειδίκευση μιας πρωτείνης για το υπόστρωμά της. Το μοντέλο βασίζεται στην αρχή ότι δύο πρωτείνες είναι τόσο πιθανό είναι να έχουν παρόμοιες ιδιότητες, όσο περισσότερο μοιάζουν οι αλληλουχίες τους. Επομένως, τέτοια μοντέλα είναι δυνατό να εφαρμοστούν σε οποιοδήποτε σύνολο αμινοξικών ακολουθιών με τη χρήση συνόλων δεδομένων τα οποία προκύπτουν είτε από συνδυαστική μεταλλαξογένεση, είτε από υπολογιστικά σχεδιασμένες βιβλιοθήκες. Ο Romero και οι συνεργάτες του χρησιμοποίησαν αυτή την προσέγγιση για να σχεδιάσουν μια χιμαιρική P450 που είναι κατά 5 C πιο θερμοσταθερή από οποιαδήποτε ισομορφή που είχε προηγουμένως κατασκευαστεί χιμαιρικά, με λογικό σχεδιασμό ή κατευθυνόμενη εξέλιξη. Ο μικρός αριθμός ισομορφών που απαιτούνται για αυτού του είδους τις μελέτες, αποδεικνύει ότι η προηγμένη σύνθεση DNA σε συνδυασμό με τις μεθόδους μηχανικής μάθησης είναι ισχυρά εργαλεία για τον σχεδιασμό πρωτεϊνών και προσφέρουν μια εναλλακτική λύση στις δοκιμασίες υψηλής κλίμακας. Τα μοντέλα μηχανικής μάθησης αναπαριστούν δομικά μία πρωτεΐνη, με πρόκληση το σχεδιασμό μοντέλων που περιγράφουν ακριβέστερα τη λειτουργία μίας πρωτεΐνης ήδη από τη νουκλεοτιδική αλληλουχία. Έτσι θα μπορούμε να εντοπίσουμε πως αλληλεπιδρούν οι επικράτειες μιας πρωτεΐνης πράγμα που δεν γίνεται αντιληπτό από την κρυσταλογραφία, αφού μπορεί να έρχονται σε επαφή μετά από αλλαγή της στερεοδιάταξής της. Οι συσχετισμένες μεταλλαγές μπορούν να αξιοποιηθούν για την ανάπτυξη μοντέλων, αν δεν υπάρχουν πειραματικά δεδομένα για τη δομή μίας πρωτεΐνης, και ο σχεδιασμός τέτοιων δικτύων μπορεί να χρησιμοποιηθεί για την κατασκευή μοντέλων που αντιπροσωπεύουν επιστάσεις. Μεταγονιδιωματική Η μεταγονιδιωματική αλληλούχιση είναι ικανή να αποκαλύψει εκατοντάδες νέες γενετικές αλληλουχίες μόνο από ένα περιβαλλοντικό δείγμα για αυτό και οι βάσεις δεδομένων μεταγονιδιωματικών αλληλουχιών αποτελούν ένα χρυσορυχείο με τους περισσότερο ανεξερεύνητους βιοκαταλύτες. Μια νέα τάση είναι η αξιοποίηση των μεταγονιδιωματικών αλληλουχιών για την επίλυση πρωτεϊνικών δομών. [5]
Οι παράλληλες εξελικτικές σχέσεις μεταξύ των καταλοίπων μίας πρωτεΐνης, οι οποίες μπορούν να υπολογιστούν από πολλαπλές ευθυγραμμίσεις αλληλουχιών, εξάγουν συμπεράσματα για σύνολα χωροταξικών περιορισμών που με τη σειρά τους μπορούν να χρησιμοποιηθούν για την δημιουργία μοντέλων πρωτεϊνικών δομών από υπολογιστικές μεθόδους. Η βασική αρχή είναι ότι η πλειονότητα των ζευγών καταλοίπων που έχουν συνεξελιχθεί, εντοπίζονται σε άμεση επαφή στη δομή της πρωτεΐνης. Μια εφαρμογή των συσχετισμένων μεταλλάξεων είναι η αναγνώριση των αλληλεπιδράσεων που δεν είναι ορατές στις κρυσταλλικές δομές. Σκοπός είναι να αξιοποιηθούν οι συνεξελικτικές σχέσεις για να προσδιοριστούν επιστάσεις και να προβλεφθεί ποιες θα είναι οι συνέπειες των μεταλλαγών στη βιοκαταλυτική μηχανική. Ενώ τα περισσότερο συσχετισμενα ζεύγη αμινοξικων καταλοίπων βρίσκονται σε επαφή στη δομή της πρωτεΐνης, τα αμινοξικά κατάλοιπα δεν έχουν εξελιχθεί σε ζεύγη, αλλά ως λειτουργικά δίκτυα αλληλεξαρτώμενων καταλοίπων, που παρουσιάζουν κοινές λειτουργίες όπως δραστηριότητα, εξειδίκευση, σύνδεση σε συμπαράγοντα ή εναντιοεκλεκτικότητα. Επειδή η γνώση για αυτά δίκτυα είναι περιορισμένη, η βιβλιογραφική πληροφορία για τους κόμβους σε ένα συσχετισμένο δίκτυο μπορεί να χρησιμοποιηθεί για να προβλέψουν τι αποτέλεσμα θα έχει η μεταλλαγή των καταλοίπων στους μη σχολιασμένους κόμβους, αποκαλύπτοντας λειτουργικά σημεία ενδιαφέροντος που δεν είχαν περιγραφεί προηγουμένως στη βιβλιογραφία. Αντιστρόφως, ο αλγόριθμος σταθεροποίησης πρωτεϊνών FireProt αποφεύγει σκόπιμα την αλλαγή των καταλοίπων σε συσχετισμένα δίκτυα για να μην επηρεάσει αρνητικά την ενζυμική δραστηριότητα ή την εξειδίκευση της πρωτείνης. Συμπεράσματα Η χρήση βιοκαταλυτών για τη σύνθεση φαρμακευτικών και βιομηχανικά σημαντικών χημικών ουσιών κατευθύνεται κυρίως από περιβαλλοντικούς και οικονομικούς παράγοντες. Πρόσφατα κατασκευασμένα ένζυμα υπερέχουν των καλύτερων χημειοκαταλυτών, ακόμη και για αντιδράσεις που δεν έχουν παρατηρηθεί ποτέ στη βιολογία, ενώ αντιδράσεις που περιλαμβάνουν διαδοχικά βιοκαταλυτικά στάδια επιτρέπουν συνθέσεις μόνο σε έναν αντιδραστήρα χωρίς την ανάγκη καθαρισμού των ενδιαμέσων. Οι πρακτικές εφαρμογές της βιοκατάλυσης ωστόσο, παρεμποδίζονται καθώς υπάρχει ανάγκη για ταχύτητα στη βιοκαταλυτική μηχανική. Η κατευθυνόμενη εξέλιξη ήταν εξαιρετικά επιτυχημένη στην ανίχνευση νέων ενζύμων. Στη πραγματικότητα, παρόλο που οι προσπάθειες κατευθυνόμενης εξέλιξης έχουν βελτιώσει τις δραστικότητες κάποιων ενζύμων, αυτό συμβαίνει κυρίως επειδή οι αρχικές δραστικότητες είναι εξαιρετικά χαμηλές. Για να προσπεράσουμε το πρόβλημα αυτό και τα πλατώ βελτιστοποίησης που κατευθύνουν την εξέλιξη, απαιτούνται τεχνολογίες για την ταυτόχρονη εισαγωγή πολλαπλών μεταλλάξεων. Έτσι οι επιστήμονες στοχεύουν στο σχεδιασμό εξυπνότερων βιβλιοθηκών μέσω προηγμένων τεχνολογιών σύνθεσης DNA, οι οποίες θα μας επιτρέψουν να ανακαλύψουμε περισσότερες πληροφορίες από την αναπαράσταση των πιθανών αλληλουχιών για μία πρωτείνη(space sequence), που μπορεί να επιτευχθεί με απλούς χειρισμούς ενός αρχικού ικριώματος.η εφαρμογή της προηγμένης σύνθεσης DNA, θα επιτρέψει την πιο εξεζητημένη χρήση τεχνολογιών βαθιάς σάρωσης μεταλλαγών, οι οποίες με τη σειρά τους θα είναι σε θέση να παράξουν τα δεδομένα που απαιτούνται για την «εκπαίδευση» προηγμένων αλγορίθμων μηχανικής μάθησης για τη μοντελοποίηση της σχέσης μεταξύ αλληλουχίας και λειτουργίας. Με αυτό τον τρόπο θα βελτιωθεί η ικανότητά μας να ενσωματώνουμε ορθολογικά μη-κανονικά αμινοξέα με ειδικές χημικές ιδιότητες σε πρωτεΐνες. [6]
Κατά τον σχεδιασμό πειραμάτων που βασίζονται στη σε βαθός σάρωση μεταλλαγών(dms), ένα από τα σημαντικότερα προβλήματα που πρέπει να ξεπεραστούν είναι η απώλεια πληροφοριών σχετικά με τις επιστατικές αλληλεπιδράσεις, που προκύπτουν κυρίως από την ανάγκη κατακερματισμού του DNA για την εφαρμογή αλληλούχισης επόμενης γενεάς. Η βελτίωση του μήκους ανάγνωσης αλληλουχιών κρίνεται σημαντική για το μέλλον της μηχανικής των βιοκαταλυτών επειδή μια επίσταση δεν μπορεί να ανιχνευθεί αν οι δύο μεταλλάξεις βρίσκονται σε μεγαλύτερη απόσταση από το μήκος ανάγνωσης (read-length), το οποίο κυμαίνεται συνήθως από 150-300 bp. Μία πιθανή λύση είναι η αξιοποίηση της αλληλούχισης με νανοπόρους (nanopore sequencing) έτσι ώστε να μη απαιτείται σύνδεση γονότυπου -φαινοτύπου. Ελπίζουμε, ωστόσο, ότι μέσα στην επόμενη δεκαετία οι τεχνολογίες σύνθεσης DNA θα είναι επαρκώς εξελιγμένες για να λύσουν συνολικά το πρόβλημα της αλληλούχισης. Βλάχο-Ευσταθίου Παρασκευή-Μαρία Γκοτζαμάνη Σοφία-Ναάτσουκο ΑΜ:11132014002 ΑΜ:1113201400145 [7]