Πανεπιστήμιο Πατρών Τμήμα Ιατρικής Διατμηματικό Μεταπτυχιακό Πρόγραμμα Πληροφορική Επιστημών Ζωής ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: Παρουσίαση και Συγκριτική Αξιολόγηση Αλγορίθμων και Εργαλείων Αναζήτησης Μοριακών Προσδεμάτων με εφαρμογή στο Σχεδιασμό Φαρμάκων με τη βοήθεια Η/Υ Αθηνά Σπηλίου Α.Μ. 524 Επιβλέπων Καθηγητής: Αθανάσιος Τσακαλίδης Τριμελής Εξεταστική Επιτροπή: Α. Τσακαλίδης, καθηγητής, Τμήμα Μηχ. Η/Υ & Πληροφορικής Α. Παπαβασιλείου, καθηγητής, Τμήμα Ιατρικής Ι. Χατζηλυγερούδης, λέκτορας, Τμήμα Μηχ. Η/Υ & Πληροφορικής Πάτρα, Φεβρουάριος 2006
Ευχαριστίες Θα ήθελα να ευχαριστήσω κατ αρχήν τον κ. Αθανάσιο Τσακαλίδη καθηγητή του τμήματος Μηχανικών Η/Υ και Πληροφορικής του Πανεπιστημίου Πατρών και επιβλέποντα της διπλωματικής μου εργασίας, για την εμπιστοσύνη που μου έδειξε με την ανάθεση του συγκεκριμένου θέματος και την συμβολή του στην ολοκλήρωσή του. Ευχαριστώ ιδιαίτερα τα υπόλοιπα μέλη της τριμελούς επιτροπής: τον κ. Αθανάσιο Παπαβασιλείου, καθηγητή του τμήματος Ιατρικής του Πανεπιστημίου Πατρών και τον κ. Ιωάννη Χατζηλυγερούδη, λέκτορα του τμήματος Μηχανικών Η/Υ και Πληροφορικής του Πανεπιστημίου Πατρών, για τη συνεισφορά και τις πολύτιμες συμβουλές τους. Στη διάρκεια της διπλωματικής εργασίας συνεργάστηκα στενά με την υποψήφια διδάκτωρα του τμήματος Μηχανικών Η/Υ και Πληροφορικής κ. Κατερίνα Περδικούρη. Την ευχαριστώ θερμά για τη βοήθειά της. Θα ήθελα επίσης να ευχαριστήσω τον συνεργάτη και προϊστάμενό μου στο Τμήμα Πληροφορικής & Οργάνωσης του Πανεπιστημιακού Νοσοκομείου Πατρών, ο οποίος συνέβαλε, καθοριστικά, στην απόκτηση εκπαιδευτικής άδειας από την εργασία μου και συνετέλεσε με τον τρόπο αυτό στην επιτυχή ολοκλήρωση της προσπάθειάς μου στα πλαίσια του μεταπτυχιακού προγράμματος. Τέλος, ευχαριστώ θερμά τους γονείς μου, Χρήστο και Αγγελική και τον σύζυγό μου Μανώλη για την αμέριστη συμπαράσταση που έδειξαν, καθώς και το γιο μου Μαρίνο που παραμέλησα κατά την εκπόνησης της διπλωματικής μου εργασία και καθ όλη τη διάρκεια του μεταπτυχιακού προγράμματος. Αθηνά Σπηλίου Πάτρα, Φεβρουάριος 2006
1. Εισαγωγή...1 2. Σχεδίαση φαρμάκων με βάση τη δομή...3 2.1 Καθορισμός στόχου...3 2.2 Προσδιορισμός της δομής του στόχου...4 2.3 Προσδιορισμός της θέσης-στόχου...4 2.4 Επιλογή της μεθόδου σχεδίασης...4 2.4.1 Εκ νέου σχεδίαση φαρμάκων...5 2.4.2 Αναζήτηση σε βάσεις δεδομένων με χρήση μοριακής αναγνώρισης...5 2.4.3 Αναζήτηση σε βάσεις δεδομένων βάσει ομοιότητας...5 2.4.4 Κριτήρια επιλογής...6 2.5 Εκτίμηση των προτεινόμενων οδηγών...7 3. Μοριακή αναγνώριση...8 3.1 Αλληλεπιδράσεις προσδέτη -υποδοχέα...9 3.2 Ελαστικότητα μορίων...10 3.2.1 Ανελαστικός προσδέτης/ανελαστικός υποδοχέας...11 3.2.2 Ελαστικός προσδέτης/ανελαστικός υποδοχέας...11 3.2.3 Ελαστικός προσδέτης/ελαστικός υποδοχέας...13 3.3 Στοιχεία αλγορίθμου μοριακής αναγνώρισης...16 3.3.1 Αναπαράσταση μορίων (προσδέτη, υποδοχέα)...16 3.3.2 Στρατηγικές Αναζήτησης...17 3.3.2 Συναρτήσεις Αξιολόγησης...20 4. Αλγόριθμοι Μοριακής Αναγνώρισης...26 4.1 Εξομοιώσεις μοριακής δυναμικής...26 4.1.1 Magnoni et all [86]...28 4.1.2 Pak and Wang [109]...29 4.1.3 MCSA-PCR [107]...30 4.2 Εξομοιώσεις Monte Carlo...32 4.2.1 ICM [3]...35 4.2.2 Prodoc [145]...38 4.2.3 MCDOCK [85]...40 4.2.4 QXP [89]...42 4.2.5 Apostolakis et all [7]...44 4.2.6 Glide [45][127]...46 4.3 Μέθοδοι βασισμένες στην τμηματοποίηση...48 -
4.3.1 Hammerhead [157]...49 4.3.2 FlexX [118]...52 4.3.3 FlexE [24]...56 4.3.4 DOCK [43][41][40]...58 4.3.5 SLIDE [125]...62 4.4 Γενετικοί Αλγόριθμοι...65 4.4.1 GOLD [66]...68 4.4.2 AUTODOCK [97]...71 4.4.3 Osterberg et all [106]...74 4.4.4 DIVALI [23]...75 4.4.5 DARWIN [140]...76 4.5 Αναζητήσεις tabu...79 4.5.1 PRO_LEADS [10] [101]...79 4.6 Συστηματικές αναζητήσεις...82 4.6.1 SYSDOCK [110]...82 4.6.2 EUDOCK [113]...83 4.7 Μέθοδοι βασισμένες στην συμπληρωματικότητα σημείων...84 4.7.1 Soft Docking [63]...84 4.7.2 FLOG [93]...87 4.8 Μέθοδοι βασισμένες στη γεωμετρία αποστάσεων...90 4.8.1 DockIt [91]...90 4.9 Υβριδικές μέθοδοι...91 4.9.1 FDS [142]...91 4.9.2 Leach [78]...94 4.9.3 Mining Minima Optimizer [29]...99 4.9.4 Price and Jorgensen [116]...101 4.9.5 Wang et all [154]...103 4.9.6 Hoffman et all [57]...105 4.9.7 FRED [47]...106 5. Εφαρμογές σε διερεύνηση βάσεων δεδομένων (virtual screening)...110 6. Συγκριτική Αξιολόγηση...112 6.1 Πλεονεκτήματα και μειονεκτήματα τεχνικών αναζήτησης...113 6.2 Χαρακτηριστικά αλγορίθμων μοριακής αναγνώρισης...115 6.3 Απόδοση των αλγορίθμων μοριακής αναγνώρισης...118 7. Ανακεφαλαίωση-Συμπεράσματα...123
Βιβλιογραφία Αναφορές...125 Παράρτημα I: Βασικές Έννοιες...135 I.1 Κλασική μοριακή δυναμική...135 I.2 Η συνάρτηση δυναμικής ενέργειας...136 Ι.3 Simulated Annealing...139 Ι.4 Ελαχιστοποίηση ενέργειας (energy minimization)...140 Ι.5 Προσάραξη βασισμένη σε αναζήτηση κλικών (clique-search based docking)...140 Ι.6 Προσάραξη βασισμένη σε ομαδοποίηση τοποθετήσεων (pose clustering)...141 Ι.7 Προσάραξη με τη μέθοδο γεωμετρικού κατακερματισμού (geometric hashing).142 Παράρτημα II: Λεξικό όρων...144 -
1. Εισαγωγή Στις αρχές της δεκαετίας του 80 η ικανότητα να σχεδιάζονται φάρμακα με ορθολογικό τρόπο, αξιοποιώντας τα διαθέσιμα συστατικά και τις ταυτοποιημένες πρωτεϊνικές δομές, έμοιαζε μη-ρεαλιστικός στόχος. Τα πρώτα προγράμματα βρίσκονταν σε εξέλιξη στα μέσα της δεκαετίας του 80 και μόνο στις αρχές της δεκαετίας του 90 εμφανίστηκαν τα πρώτα επιτυχή αποτελέσματα [121][39][35]. Σήμερα, παρόλο που απαιτείται αρκετή προσπάθεια ακόμα για την τελειοποίηση των διαδικασιών, η σχεδίαση φαρμάκων με δομημένο και ορθολογικό τρόπο (structure-based drug design) αποτελεί αναπόσπαστο κομμάτι των περισσότερων προγραμμάτων ανακάλυψης φαρμάκων και είναι το κύριο αντικείμενο έρευνας πολλών ακαδημαϊκών εργαστηρίων. Στην επιτυχία της δομημένης σχεδίασης σαν μέρος της συνολικής διαδικασίας ανακάλυψης νέων φαρμάκων συνέβαλαν, η ολοκλήρωση της αλληλούχισης του ανθρώπινου γονιδιώματος, οι επαναστατικές ανακαλύψεις που συντελέστηκαν στο χώρο της πρωτεομικής (proteomics) και της γενομικής (genomics), καθώς και οι διαρκείς εξελίξεις στην τεχνολογία της πληροφορικής και των ηλεκτρονικών υπολογιστών. Εξαιρετικοί φαρμακευτικοί στόχοι μπορούν πλέον να προσδιορίζονται με αυξανόμενους ρυθμούς χρησιμοποιώντας τις εξελίξεις στη βιοπληροφορική: τα γονίδια αυτών των στόχων μπορούν γρήγορα να κλωνοποιηθούν και η αντίστοιχη πρωτεΐνη να εκφραστεί και να καθαριστεί από ξένες ουσίες. Εξάλλου, οι εξελίξεις στην κρυσταλλογραφία υψηλής απόδοσης και την μαγνητική τομογραφία (NMR) έχουν ελαττώσει δραστικά το χρόνο που απαιτείται για τον προσδιορισμό νέων δομών. Τέλος, οι γρηγορότεροι και φθηνότεροι ηλεκτρονικοί υπολογιστές καθώς και δυνατότητα παράλληλης εκτέλεσης των απαιτούμενων υπολογισμών, αυξάνουν σημαντικά την ταχύτητα με την οποία προσδιορίζονται και αξιολογούνται νέοι οδηγοί φαρμάκων, in silico. Θα πρέπει να τονιστεί ότι η δομημένη σχεδίαση φαρμάκων αποτελεί ισχυρό εργαλείο μόνο αν αποτελεί μέρος μιας συνολικότερης διαδικασίας ανακάλυψης φαρμάκων. Σχετικές μελέτες [6][130], υποδεικνύουν ότι ο συνδυασμός της δομημένης σχεδίασης φαρμάκων με τη συνδυαστική χημεία (combinatorial chemistry) μπορεί να οδηγήσει στην παράλληλη σύνθεση κατάλληλων βιβλιοθηκών από συστατικά. Είναι επίσης σημαντικό να αντιληφθούμε ότι η δομημένη σχεδίαση φαρμάκων οδηγεί στον εντοπισμό οδηγών φαρμάκων, που δεν είναι φάρμακα οι ίδιοι, αλλά συστατικά με μεγάλη συγγένεια (τουλάχιστον σε επίπεδο micromolar) με τον στόχο που μας ενδιαφέρει. Επίσης, ο χρόνος που αφιερώνεται στη δομημένη σχεδίαση φαρμάκων αντιστοιχεί μόνο σε ένα κλάσμα του συνολικού χρόνου που απαιτείται για την ανάπτυξη ενός εμπορεύσιμου φαρμάκου. Πολλά χρόνια έρευνας απαιτούνται για τη μετατροπή ενός οδηγού φαρμάκου, σε ένα φάρμακο που θα είναι ταυτόχρονα αποδοτικό και ανεκτό από τον ανθρώπινο οργανισμό. Επιπλέον, πολλά χρόνια έρευνας και ανάπτυξης -
απαιτούνται για να περάσει το φάρμακο από φάση των κλινικών δοκιμών και να φτάσει τελικά στην αγορά. Η συγκεκριμένη διπλωματική εργασία επικεντρώνεται στην αναζήτηση, παρουσίαση και συγκριτική αξιολόγηση αλγορίθμων και εργαλείων που υπάρχουν στη διεθνή βιβλιογραφία, σχετικά με τον πιο διαδεδομένο τρόπο δομημένης σχεδίασης φαρμάκων και συγκεκριμένα, σχετικά με τη διαδικασία της μοριακής αναγνώρισης ή προσάραξης ενός μικρού μορίου, του προσδέτη, σε έναν πρωτεϊνικό υποδοχέα-στόχο (protein-ligand docking). Η οργάνωση του κειμένου της διπλωματικής εργασίας περιγράφεται στη συνέχεια. Το επόμενο κεφάλαιο (κεφάλαιο 2) περιλαμβάνει μια γενική ανασκόπηση της διαδικασίας δομημένης σχεδίασης φαρμάκων και των σταδίων από τα οποία αποτελείται. Στο κεφάλαιο 3, περιγράφεται διαδικασία προσάραξης, οι προκλήσεις που καλείται να αντιμετωπίσει και τα τμήματα από τα οποία αποτελείται και στο κεφάλαιο 4, αναλύονται οι επιμέρους αλγόριθμοι/εργαλεία προσάραξης, οργανωμένοι σε κατηγορίες. Στο κεφάλαιο 5 παρουσιάζονται οι εφαρμογές των αλγορίθμων προσάραξης για την αναζήτηση πιθανών (οδηγών) φαρμάκων σε βάσεις δεδομένων (virtual screening), ενώ στο κεφάλαιο 6 γίνεται η συγκριτική αξιολόγηση των αλγορίθμων/εργαλείων που διερευνήθηκαν στα πλαίσια της διπλωματικής εργασίας. Ακολουθεί (κεφάλαιο 7) μία σύντομη ανακεφαλαίωση και παρουσίαση των συμπερασμάτων που προέκυψαν, καθώς και η βιβλιογραφία που χρησιμοποιήθηκε. Στο τέλος του κειμένου υπάρχουν δύο παραρτήματα: στο παράρτημα Ι, περιλαμβάνεται μια γενική περιγραφή διαφόρων εννοιών/τεχνολογιών που αναφέρονται σε κάποια σημεία της διπλωματικής αυτής εργασίας και στο παράρτημα ΙΙ, γίνεται επεξήγηση ενός συνόλου όρων που απαντώνται σε διάφορα σημεία του κειμένου. -
2. Σχεδίαση φαρμάκων με βάση τη δομή Η διαδικασία σχεδίασης φαρμάκων με βάση τη δομή [5] είναι μια επαναληπτική διαδικασία που συχνά διανύει πολλαπλούς κύκλους, έως ότου ένας βελτιστοποιημένος οδηγός φαρμάκων οδηγηθεί στη φάση Ι των κλινικών δοκιμών. Αποτελείται από τα ακόλουθα στάδια: Καθορισμό του στόχου (drug target). Προσδιορισμό της δομής του στόχου (target structure). Προσδιορισμό της θέσης-στόχου (target site ή binding site). Επιλογή της μεθόδου σχεδίασης (drug design method). Εκτίμηση των προτεινόμενων συστατικών-οδηγών (drug lead evaluation). 2.1 Καθορισμός στόχου Η επιλογή του στόχου στον οποίο θέλουμε να δράσει το φάρμακο πραγματοποιείται σε βιολογική και βιοχημική βάση. Το ιδανικό μακρομόριο-στόχος είναι αυτό που συνδέεται στενά με κάποια ανθρώπινη ασθένεια και στο οποίο προσδένεται κάποιο μικρό μόριο προκειμένου να ασκήσει τη δράση του. Για το σκοπό αυτό, το μόριο-στόχος διαθέτει συνήθως μια καλά καθορισμένη θέση πρόσδεσης. Άλλα μικρά μόρια μπορεί να ανταγωνίζονται με το φυσικό μικρό μόριο, ώστε να διαμορφώσουν τη δράση του μορίου-στόχου. Ο στόχος στην χρησιμοποίηση ενός μικρού μορίου ως φαρμάκου, είναι να ρυθμίσει τη λειτουργία του μορίου-στόχου, με επιθυμητό τρόπο, κατά την πρόσδεσή του σε αυτό. Πολλοί καλοί φαρμακευτικοί στόχοι είναι πρωτεΐνες (υποδοχείς, ένζυμα, ιοντικοί δίαυλοι, κλπ.). Συγκεκριμένα, σε ασθένειες που προκαλούνται από δυσλειτουργίες ανθρώπινων πρωτεϊνών, φάρμακα ενάντια σε υποδοχείς συζευγμένους με G πρωτεΐνες (G protein coupled receptors - GPCRS) αντιπροσωπεύουν τουλάχιστον το 25% των εμπορεύσιμων φαρμάκων. Επιπλέον, μικρά μόρια που ρυθμίζουν τη λειτουργία ιοντικών διαύλων, προτεασών, κινασών και πυρηνικών υποδοχέων ορμονών συνιστούν το 22% της αγοράς. Όμως και η σχεδίαση φαρμάκων ενάντια σε στόχους RNA με καλά καθορισμένη δευτεροταγή δομή, όπως το βακτηριακό ριβόσωμα και τμήματα του γονιδιώματος του HIV, έχουν αποδειχτεί αρκετά αποτελεσματικά. -
2.2 Προσδιορισμός της δομής του στόχου Από τη στιγμή που ο στόχος έχει εντοπιστεί, απαραίτητη είναι η απόκτηση ακριβούς δομικής πληροφορίας γι αυτόν. Στο σχεδιασμό φαρμάκων χρησιμοποιούνται τρεις μέθοδοι για τον καθορισμό της δομής ενός μορίου, η κρυσταλλογραφία με ακτίνες Χ (X-ray crystallography), η μέθοδος πυρηνικού μαγνητικού συντονισμού (nuclear magnetic resonance NMR) και η μοντελοποίηση με βάση την ομολογία του μορίου με άλλα μόρια (homology modeling). Υπάρχουν περιπτώσεις βέβαια όπου η δομή του στόχου δεν είναι δυνατό να προσδιοριστεί με ικανοποιητική ακρίβεια, με καμία από τις παραπάνω τεχνικές. Και στις περιπτώσεις αυτές, είναι δυνατόν να γίνει αναζήτηση φαρμακοφόρου μορίου, όταν είναι ήδη γνωστό κάποιο μόριο το οποίο προσδένεται στο στόχο και επάγει τη δράση του. 2.3 Προσδιορισμός της θέσης-στόχου Στην περίπτωση που η δομή του στόχου γίνει γνωστή με κάποια από τις προαναφερθείσες μεθόδους το επόμενο βήμα στη διαδικασία δομημένης σχεδίασης φαρμάκων είναι η αναγνώριση μιας πιθανής θέσης πρόσδεσης στο μακρομόριο στόχο. Ιδανικά, η θέση πρόσδεσης είναι μια εσοχή ή προεξοχή στο μόριο-στόχο που διαθέτει ποικιλία πιθανών δοτών και δεκτών δεσμών υδρογόνου, υδροφοβικά χαρακτηριστικά και μεγέθη μοριακών επιφανειών. Η θέση πρόσδεσης μπορεί να είναι η ενεργός θέση σε ένα ένζυμο, μια θέση συναρμολόγησης με ένα άλλο μακρομόριο ή μια θέση επικοινωνίας απαραίτητη στο μηχανισμό του μορίου. Επιπλέον των πρωτεϊνικών θέσεων δράσης, δευτεροταγή δομικά χαρακτηριστικά του RNA μπορεί να αποτελέσουν εξαιρετικές θέσεις-στόχους δεδομένου ότι είναι εξειδικευμένες για κάθε είδος, μπορούν να προσδεθούν μόρια σε αυτές και μπορεί να είναι ειδικές για μια κατάσταση ασθένειας. Θέσεις-στόχοι για αλληλεπιδράσεις μεταξύ πρωτεϊνών, είναι δύσκολο να προσδιοριστούν δεδομένου ότι οι θέσεις αυτές είναι επίπεδες, μεγάλες και υδροφοβικές, αλλά ακόμα και αυτές οι δυσκολίες μπορούν να ξεπεραστούν. Μελέτες συγκρυσταλλοποίησης με ένα αρχικό μικρό μόριο που δρα ως αναστολέας, μπορεί να είναι ανεκτίμητες για τον καθορισμό μιας καλής θέσης-στόχου. 2.4 Επιλογή της μεθόδου σχεδίασης Τρεις είναι οι βασικές υπολογιστικές μέθοδοι που χρησιμοποιούνται στο σχεδιασμό φαρμάκων: (α) εκ νέου σχεδίαση φαρμάκων (de novo generation), (β) αναζήτηση σε βάσεις δεδομένων με χρήση μοριακής αναγνώρισης (virtual screening by docking) και (γ) αναζήτηση σε βάσεις δεδομένων βάσει ομοιότητας (similarity-based virtual screening). -
2.4.1 Εκ νέου σχεδίαση φαρμάκων Βασίζεται στη χρήση μικρών τμημάτων από μόρια συνήθως μικρών λειτουργικών μονάδων όπως δακτύλιοι βενζολίου, καρβονυλομάδες ή αμινομάδες τα οποία ελέγχονται ως προς την ικανότητα προσάραξής τους (docking) στη θέση πρόσδεσης του μορίου-στόχου και βαθμολογούνται (scored) σύμφωνα με αυτό, χρησιμοποιώντας κατάλληλους αλγορίθμους αξιολόγησης. Σε κάθε κύκλο, το τμήμα με την καλύτερη βαθμολογία συνδέεται (in silico) με τα προηγούμενα, έως ότου γίνει εκμετάλλευση με τον καλύτερο δυνατό τρόπο ολόκληρης της κοιλότητας πρόσδεσης (binding pocket). Η δημιουργία οδηγών (φαρμάκων) από την αρχή, πλεονεκτεί στην περίπτωση που τα υπάρχοντα συστατικά δεν ταιριάζουν ικανοποιητικά στην κοιλότητα πρόσδεσης και οδηγεί στη δημιουργία νέων συστατικών, αλλά προϋποθέτει ότι υπάρχουν τα μέσα (προσωπικό, τεχνικά μέσα) για την (χημική) σύνθεση του επιδιωκόμενου προϊόντος. 2.4.2 Αναζήτηση σε βάσεις δεδομένων με χρήση μοριακής αναγνώρισης Η λογική της αναζήτησης πιθανών οδηγών φαρμάκων στηρίζεται στην ύπαρξη βιβλιοθηκών ή βάσεων δεδομένων που περιλαμβάνουν μεγάλη ποικιλία υποψήφιων φαρμακοφόρων μορίων, μαζί με ένα σύνολο από ιδιότητες απαραίτητες για τη διαδικασία της αναζήτησης. Στη συγκεκριμένη κατηγορία μεθόδων τα διάφορα συστατικά της βάσης δεδομένων ελέγχονται (in silico) ως προς την ικανότητά τους να προσδένονται στην θέση του μορίου στόχου που μας ενδιαφέρει (target site) και αξιολογούνται με βάση τις προβλεπόμενες αλληλεπιδράσεις τους με τη θέση πρόσδεσης. Για κάθε υποψήφιο μόριο, στόχος της διαδικασίας προσάραξης είναι να εντοπίσει μία διαμόρφωση και μία τοποθέτησή του, που να μεγιστοποιεί την τιμή μιας συνάρτησης αξιολόγησης, η οποία έχει ως στόχο να προβλέψει με όσο το δυνατό μεγαλύτερη ακρίβεια, τη σχετική ή την απόλυτη συγγένεια δέσμευσης. Η μέθοδος αυτή θα περιγραφεί με μεγαλύτερη λεπτομέρεια στα επόμενα κεφάλαια δεδομένου ότι αποτελεί αντικείμενο της παρούσας διπλωματικής εργασίας. 2.4.3 Αναζήτηση σε βάσεις δεδομένων βάσει ομοιότητας Στην περίπτωση αυτή δεν είναι απαραίτητη η γνώση της δομής του μορίου-στόχου. Ένα ή περισσότερα συστατικά που είναι γνωστό ότι προσδένονται στη θέση του στόχου που μας ενδιαφέρει χρησιμοποιούνται σαν δομικό ερώτημα, για την αναζήτηση κατάλληλων οδηγών (φαρμάκων). Η διαδικασία αναζήτησης επιλέγει συστατικά από βάσεις δεδομένων, σύμφωνα με το κατάλληλο κριτήριο ομοιότητας. -
Αντί να γίνεται προσπάθεια τοποθέτησης των συστατικών που υπάρχουν στις βάσεις δεδομένων στην κοιλότητα πρόσδεσης της πρωτεΐνης που μας ενδιαφέρει (η οποία δεν είναι πάντα γνωστή), ορίζεται ως μόριο-αναφορά ένα συστατικό που είναι γνωστό ότι προσδένεται στην πρωτεΐνη και το ζητούμενο είναι να εντοπιστούν μόρια-στόχοι που να παρουσιάζουν ομοιότητα με το συγκεκριμένο μόριο-αναφορά. Διακρίνονται δύο γενικές κατηγορίες: Στην πρώτη κατηγορία γίνεται προσπάθεια ώστε το μόριο-στόχος (κατά κανόνα συστατικό της βάσης δεδομένων) να τοποθετηθεί πάνω (superimposed) στο μόριοαναφορά με χρήση του κατάλληλου αλγορίθμου και στη συνέχεια αξιολογείται ως προς την ομοιότητά του με αυτό. Ο τρόπος αυτός είναι αξιόπιστος αλλά αρκετά χρονοβόρος. Με στόχο τη μείωση του απαιτούμενου χρόνου, στη δεύτερη κατηγορία δεν χρησιμοποιούνται ολόκληρα τα μόρια στη σύγκριση. Ορίζεται ενιαία αναπαράσταση των εμπλεκόμενων μορίων, που ονομάζεται περιγραφέας (descriptor) και στη συνέχεια συγκρίνεται ο περιγραφέας του μορίου-στόχου με τον περιγραφέα του μορίου αναφορά. Ανάλογα με τον τύπο τους οι περιγραφείς μπορούν να χρησιμοποιηθούν και για τη δεικτοδότηση των βάσεων δεδομένων, ώστε να επιταχυνθεί ακόμα περισσότερο η διαδικασία αναζήτησης. Οι μοριακοί περιγραφείς χωρίζονται σε κατηγορίες ανάλογα με τον τύπο της μοριακής πληροφορίας που χρησιμοποιείται (μακροσκοπικοί, τοπολογικοί ή δισδιάστατοι, τρισδιάστατοι) ή ανάλογα με τη δομή του τελικού περιγραφέα (βαθμωτοί, γραμμικοί, μη-γραμμικοί). 2.4.4 Κριτήρια επιλογής Το βασικό ερώτημα για την επιλογή της μεθόδου σχεδίασης φαρμάκου είναι αν ο στόχος είναι γνωστός, δηλαδή αν η δομή του στόχου και η θέση πρόσδεσης του φαρμακοφόρου μορίου έχουν προσδιοριστεί. Για τις δύο πρώτες κατηγορίες η γνώση της δομής του στόχου και ο προσδιορισμός της θέσης πρόσδεσης είναι απαραίτητα, ενώ για την τρίτη όχι. Η επιλογή μεταξύ της εκ νέου σχεδίασης φαρμάκων και της αναζήτησης φαρμάκων ανάμεσα σε γνωστά μόρια με χρήση μοριακής αναγνώρισης, βασίζεται στο αν τα υπάρχοντα συστατικά παρουσιάζουν την απαιτούμενη συγγένεια πρόσδεσης με το μόριο-στόχο, καθώς και στο αν υπάρχουν τα κατάλληλα τεχνικά μέσα για τη (χημική) σύνθεση των μορίων που πιθανόν να προκύψουν από την εκ νέου σχεδίαση. -
2.5 Εκτίμηση των προτεινόμενων οδηγών Μετά τον in silico χαρακτηρισμό ενός μικρού μορίου σαν ικανό για την πρόσδεσή του στον στόχο που μας ενδιαφέρει, ακολουθεί ένα επιπλέον στάδιο αξιολόγησης. Στην πραγματικότητα το αποτέλεσμα του προηγούμενου βήματος είναι ένας αριθμός από μόρια, χαρακτηρισμένα με κάποια βαθμολογία τα οποία υπόκεινται στη διαδικασία εκτίμησης. Η διαδικασία αυτή περιλαμβάνει αρχικά οπτική εκτίμηση με χρήση γραφικών, η οποία μπορεί να οδηγήσει σε τροποποιήσεις για βελτίωση της χημικής συγγένειας, ενώ στη συνέχεια γίνεται εκτίμηση της δυνατότητας ενός μορίου να είναι βιοδιαθέσιμο από το στόμα βάσει της χημικής δομής του. Σε μερικές περιπτώσεις η μετατροπή του μορίου σε ανελαστικό -ολικά ή μερικάείναι απαραίτητη, γιατί με τον τρόπο αυτό μειώνεται η εντροπία του μορίου λόγω διαμόρφωσης, πλησιάζοντας έτσι τη χαμηλή τιμή εντροπίας του μορίου στη δεσμευμένη του κατάσταση. Το τελευταίο στάδιο είναι ο εργαστηριακός έλεγχος όπου το μόριο υπόκεινται σε βιοχημική αξιολόγηση. Οι υποσχόμενοι οδηγοί φαρμάκων υπόκεινται, εκ νέου, σε διαδικασία καθορισμού της δομής τους, ώστε να εντοπιστεί ο ακριβής τρόπος σύνδεσης και να υποστούν περαιτέρω βελτιστοποιήσεις. -
3. Μοριακή αναγνώριση Παρά την μακρόχρονη και επιτυχημένη ιστορία της στη σχεδίαση φαρμάκων, η μέθοδος αναζήτησης φαρμάκων με βάση την ομοιότητά τους με άλλα φάρμακα (similarity-based virtual screening) έχει έναν αριθμό από περιορισμούς. Η μέθοδος δεν μπορεί να χρησιμοποιηθεί σε στόχους για τους οποίους δεν είναι γνωστό κανένα συστατικό που προσδένεται σε αυτούς και επιπλέον, ανάλογα με τον τύπο του περιγραφέα που χρησιμοποιείται (π.χ. δισδιάστατοι περιγραφείς), υπάρχει η τάση να ανακαλύπτονται μόρια τα οποία τα οποία μοιάζουν πολύ με τα αντίστοιχα μόρια-αναφορά, περιορίζοντας έτσι τις δυνατότητες ανακάλυψης πρωτότυπων φαρμάκων. Από την άλλη, η εκ νέου σχεδίαση φαρμάκων περιορίζεται από τις διαθέσιμες δυνατότητες για την (χημική) σύνθεση των (νεο)σχεδιαζόμενων μορίων και επιπλέον, αφήνει ανεκμετάλλευτο το μεγάλο όγκο συστατικών που είναι διαθέσιμα για διερεύνηση ως προς την ικανότητά τους να αποτελέσουν πιθανά φάρμακα. Ως εναλλακτική των παραπάνω, η μέθοδος μοριακής αναγνώρισης διερευνά υπολογιστικά- την ικανότητα ενός μικρού μορίου, που αποκαλείται προσδέτης ή πρόσδεμα (ligand), να προσδένεται σε κατάλληλη θέση πρόσδεσης (binding site) ή κοιλότητα πρόσδεσης (binding cavity, binding pocket) ενός μακρομοριακού στόχου, ο οποίος συνήθως είναι πρωτεΐνη και αποκαλείται υποδοχέας (receptor). Μέσω της διερεύνησης αυτής, στόχος μιας διαδικασίας μοριακής αναγνώρισης είναι να εντοπίσει δομές-οδηγούς, που ενδέχεται να οδηγήσουν στην ανάπτυξη κάποιου νέου φαρμάκου, μετά την ολοκλήρωση και των υπολοίπων βημάτων της διαδικασίας δομημένης σχεδίασης φαρμάκων. Σε γενικές γραμμές, η διερεύνηση της πρόσδεσης ενός μορίου-προσδέτη στον υποδοχέα που μας ενδιαφέρει, πραγματοποιείται αναπαράγοντας όλα τα δυνατά σύμπλοκα μεταξύ της πρωτεΐνης και του συγκεκριμένου προσδέτη, προβλέποντας τις ενεργειακές αλληλεπιδράσεις μεταξύ προσδέτη και υποδοχέα στο αντίστοιχο σύμπλοκο και εντοπίζοντας ένα μικρό αριθμό ενεργειακά ευνοϊκών συμπλόκων, που θα δοκιμαστούν στη συνέχεια (με βιοχημικές διαδικασίες) σχετικά με τη δυνατότητά τους να αποτελέσουν φάρμακα. Παρατήρηση: Στην αγγλική γλώσσα, για την περιγραφή της συγκεκριμένης μεθόδου χρησιμοποιείται ο όρος docking (small molecule docking ή ligand-receptor docking). Στην ελληνική γλώσσα εκτός από τον όρο μοριακή αναγνώριση, χρησιμοποιούνται επίσης οι όροι δομική αναγνώριση, προσάραξη, αγκυροβόληση ή προσκόλληση του προσδέτη στον υποδοχέα. Όλοι οι παραπάνω όροι θεωρούνται έγκυροι και χρησιμοποιούνται, κατά περίπτωση, στο κείμενο που ακολουθεί. -
3.1 Αλληλεπιδράσεις προσδέτη -υποδοχέα Για να είναι σε θέση ο προσδέτης να προσδεθεί στη θέση πρόσδεσης του υποδοχέα θα πρέπει να διαθέτει την κατάλληλη γεωμετρία ώστε να ταιριάζει στη θέση πρόσδεσης, αλλά και να αναπτύσσει τις απαιτούμενες αλληλεπιδράσεις (χημική συγγένεια) με τα άτομα του υποδοχέα στη θέση πρόσδεσης, ώστε να παραμείνει σταθερά συνδεδεμένος όσο χρειάζεται για να ασκήσει τη δράση του. Οι αλληλεπιδράσεις μεταξύ προσδέτη και υποδοχέα που ενδέχεται να λάβουν χώρα κατά την πρόσδεση μπορεί να είναι τριών τύπων: ηλεκτροστατικές αλληλεπιδράσεις, δεσμοί υδρογόνου, αλληλεπιδράσεις van der Waals και υδρόφοβες αλληλεπιδράσεις. Ηλεκτροστατικές αλληλεπιδράσεις Πρόκειται για αλληλεπιδράσεις μεταξύ ατόμων σαν αποτέλεσμα του φορτίου τους. Η ηλεκτροστατική αλληλεπίδραση μεταξύ ζευγών ατόμων αναπαρίσταται από το δυναμικό q Coulomb: iqk E = electrostatic, όπου D είναι η δραστική διηλεκτρική συνάρτηση nonbonded Dri k pairs που εξαρτάται από το μέσο και r, είναι η απόσταση μεταξύ δύο ατόμων με φορτία q i και q k. Αλληλεπιδράσεις van der Waals Οι δυνάμεις van der Waals είναι από τις πιο σημαντικές στη σταθερότητα των βιολογικών μακρομορίων. Αλληλεπίδραση van der Waals μεταξύ δύο ατόμων προκύπτει από την ισορροπία μεταξύ απωθητικών και ελκτικών δυνάμεων. Η ελκτική δύναμη, που αναφέρεται επίσης και ως δύναμη σκέδασης (dispersion force) προέρχεται από διακυμάνσεις στην κατανομή του φορτίου στο ηλεκτρονιακό νέφος. Η διακύμανση στην ηλεκτρονιακή κατανομή ενός ατόμου ή μορίου προκαλεί τη δημιουργία ενός στιγμιαίου δίπολου, το οποίο με τη σειρά μου επάγει ένα νέο δίπολο σε ένα δεύτερο άτομο ή μόριο, προκαλώντας μία ελκτική αλληλεπίδραση. Κάθε μία από τις δύο αυτές αλληλεπιδράσεις είναι μηδέν σε απεριόριστο ατομικό διαχωρισμό, αλλά γίνεται σημαντική καθώς η απόσταση μικραίνει. Η απωθητική δύναμη (repulsion force) εμφανίζεται σε κοντινές αποστάσεις όπου η αλληλεπίδραση ηλεκτρονίου-ηλεκτρονίου είναι πολύ ισχυρή. Δεσμοί Υδρογόνου Πρόκειται για ηλεκτροστατικού τύπου αλληλεπιδράσεις μεταξύ ομάδων οι οποίες δεν φέρουν τυπικό ηλεκτρικό φορτίο, αλλά διαθέτουν μία εγγενή πόλωση οι τροχιές γύρω από το μόριο κατανέμονται με τέτοιο τρόπο έτσι ώστε μέρη του μορίου να έχουν προς το μέρος τους λιγότερα ηλεκτρόνια και έτσι να εμφανίζονται θετικά φορτισμένα, ενώ άλλα μέρη να έχουν προς το μέρος τους περίσσεια ηλεκτρονίων, με αποτέλεσμα να εμφανίζονται ως αρνητικά -
φορτισμένα. Για παράδειγμα όταν ένα ισχυρά ηλεκτραρνητικό στοιχείο όπως π.χ. το F ή το O, συνδέεται με ένα υδρογόνο, έχει την τάση να έλκει ηλεκτρόνια (για να συμπληρώσει τη στοιβάδα σθένους του) με αποτέλεσμα τη δημιουργία πολωμένου μορίου, που είναι σε θέση να σχηματίζει ισχυρές ηλεκτροστατικές αλληλεπιδράσεις οι οποίες είναι γνωστές ως δεσμοί υδρογόνου. Ένα από τα πιο χαρακτηριστικά μόρια που σχηματίζει δεσμούς υδρογόνου είναι το μόριο του νερού. Το είδος αυτό του δεσμού είναι ισχυρά κατευθυνόμενο, με την έννοια ότι τα εμπλεκόμενα μέρη (δότες και δέκτες) πρέπει να έχουν τον κατάλληλο προσανατολισμό, αλλά όταν αυτό συμβεί η ένταση της αλληλεπίδρασης είναι αρκετά ισχυρότερη του δεσμού van der Waals. Υδρόφοβες αλληλεπιδράσεις Προκύπτουν από την τάση των υδατανθράκων (ή λιπόφιλων ομάδων) να σχηματίζουν ως μη πολικά σώματα διαμοριακά συσσωματώματα σε υδατικό μέσο και ανάλογες διαμοριακές αλληλεπιδράσεις. Το φαινόμενο προκύπτει από την προφανή απώθηση μεταξύ του νερού και των υδατανθράκων. 3.2 Ελαστικότητα μορίων Καθώς η πρωτεΐνη αλληλεπιδρά με τον προσδέτη κατά την πρόσδεσή του σε αυτή και τα δύο μόρια υπόκεινται σε αλλαγές της διαμόρφωσής τους, ώστε να ταιριάσουν όσο το δυνατόν καλύτερα. Το φαινόμενο αυτό αποκαλείται επαγόμενο ταίριασμα (induced fit). Η ελαστικότητα στη διαμόρφωση ενός μορίου οφείλεται σε τριών ειδών αλλαγές που μπορεί να λάβουν χώρα κατά την αλληλεπίδραση των ατόμων του μορίου με άτομα άλλου μορίου, όπως συμβαίνει μεταξύ προσδέτη και υποδοχέα. Οι αλλαγές αυτές μπορεί να είναι: (α) αλλαγή στο μήκος ενός δεσμού (β) αλλαγή στη γωνία ενός δεσμού και (γ) περιστροφή γύρω από έναν δεσμό, εφόσον αυτός είναι περιστρεφόμενος. Για την περιγραφή των διαμορφώσεων γύρω από τους περιστρεφόμενους δεσμούς, χρησιμοποιούνται οι δίεδρες γωνίες συστροφής (dihedral torsion angles). Σχήμα 3.2.1.α: Γωνία δεσμού b και γωνία συστροφής t, ως βαθμοί ελευθερίας ενός μορίου.
Συνήθως τα μήκη και οι γωνίες των δεσμών δεν επηρεάζουν ιδιαίτερα το σχήμα ενός μορίου και αποτελεί κοινή πρακτική να θεωρούνται αμετάβλητα. Έτσι, οι βαθμοί ελευθερίας ενός μορίου προκύπτουν, κατά κανόνα, από τους περιστρεφόμενους δεσμούς του. Θεωρητικά η πλήρης ελευθερία στη διαμόρφωση των μορίων θα έπρεπε να συμπεριληφθεί στην μοντελοποίηση των αλληλεπιδράσεων μεταξύ προσδέτη και υποδοχέα, αλλά κάτι τέτοιο είναι πολύ δαπανηρό υπολογιστικά. Κατά συνέπεια, εισάγονται διάφορα επίπεδα απλοποιήσεων ώστε να μειώσουν την πολυπλοκότητα του προβλήματος, τα οποία διαφέρουν στο τμήμα του συμπλόκου προσδέτη-υποδοχέα που θεωρείται ελαστικό, καθώς και στον τρόπο με τον οποίο αντιμετωπίζεται η ελαστικότητα των μορίων. 3.2.1 Ανελαστικός προσδέτης/ανελαστικός υποδοχέας Αποτελεί, ιστορικά, την πρώτη προσέγγιση για τη διερεύνηση ενός συνόλου από προσδέτες ως προς την ικανότητά τους να ταιριάζουν στην κοιλότητα πρόσδεσης μιας πρωτεΐνης. Είναι γνωστό και ως μοντέλο κλειδιού-κλειδαριάς, σύμφωνα με το οποίο η τρισδιάστατη δομή του προσδέτη και του υποδοχέα είναι συμπληρωματικές η μία της άλλης, με τον ίδιο τρόπο που ένα κλειδί είναι συμπληρωματικό σε μια κλειδαριά. Παρόλο που πρόκειται για μια υπεραπλούστευση, χρησιμοποιείται σε εφαρμογές προσάραξης τμημάτων από μόρια ή συνόλων από διαμορφώσεις του ίδιου μορίου. Τρεις είναι οι πιο γνωστές προσεγγίσεις που εμπίπτουν στη συγκεκριμένη κατηγορία: προσεγγίσεις βασισμένες σε αναζήτηση κλικών (clique search based approaches) ομαδοποίηση τοποθετήσεων (pose clustering) και γεωμετρικός κατακερματισμός (geometric hashing). Οι προσεγγίσεις αυτές περιγράφονται στο Παράρτημα Ι, στις Ι.5, Ι.6 και Ι.7 αντίστοιχα. 3.2.2 Ελαστικός προσδέτης/ανελαστικός υποδοχέας Η προσέγγιση στην μοντελοποίηση μοριακής ελαστικότητας που χρησιμοποιείται από την συντριπτική πλειοψηφία των αλγορίθμων λαμβάνει υπόψη μόνο την ελαστικότητα του προσδέτη και θεωρηθεί άκαμπτο τον υποδοχέα κατά την υλοποίηση του πρωτοκόλλου δομικής αναγνώρισης. Σε ένα μικρό μόριο υποψήφιο φάρμακο όπως ο προσδέτης, οι βαθμοί ελευθερίας μιας διαμόρφωσης προκύπτουν κυρίως από τους περιστρεφόμενους δεσμούς και από τα ευέλικτα συστήματα δακτυλίων (flexible ring systems). Ένα τέτοιο μόριο διαθέτει από δύο έως οκτώ περιστρεφόμενους δεσμούς. Δεδομένου ότι η ενεργειακή διαφορά μεταξύ διαφορετικών διαμορφώσεων του προσδέτη είναι αμελητέα σε σύγκριση με τη διαφορά στην ενέργεια πρόσδεσης διαφορετικών τρόπων πρόσδεσης, ο χειρισμός των βαθμών ελευθερίας και των
διαμορφώσεων του προσδέτη είναι ουσιαστικός για τον υπολογισμό μιας σωστής γεωμετρίας πρόσδεσης. Η προσέγγιση αυτή μπορεί να υλοποιηθεί με τέσσερις βασικούς τρόπους: (α) σύνολα από διαφορετικές διαμορφώσεις του ίδιου προσδέτη (β) τμηματοποίηση του προσδέτη (γ) γενετικοί αλγόριθμοι και (δ) εξομοιώσεις 3.2.2.1 Σύνολα διαμορφώσεων (conformational ensembles) Ο πιο προφανής τρόπος για την εισαγωγή της ελαστικότητας του προσδέτη σε αλγορίθμους μοριακής αναγνώρισης είναι η ξεχωριστή (ανελαστική) προσάραξη στον υποδοχέα κάθε εφικτής διαμόρφωσης του προσδέτη. Σύμφωνα με αυτό το πρότυπο αναγνωρίζονται όλες οι διαμορφώσεις χαμηλής ενέργειας του προσδέτη και αποθηκεύονται (προσωρινά ή μόνιμα) σε μια βάση δεδομένων, ενώ στη συνέχεια εφαρμόζεται ένα πρόγραμμα ανελαστικής προσάραξης για την τοποθέτηση κάθε διαμόρφωσης στη θέση πρόσδεσης του υποδοχέα. Παράδειγμα αλγορίθμου που χρησιμοποιεί τη συγκεκριμένη προσέγγιση για την υλοποίηση της ελαστικότητας του προσδέτη είναι ο αλγόριθμος FLOG [93]. 3.2.2.2 Τμηματοποίηση (fragmentation) Μια άλλη προσέγγιση στην ελαστικότητα του υποδοχέα είναι το κόψιμο του προσδέτη στους περιστρεφόμενους δεσμούς του και έτσι η διαίρεσή του σε ανελαστικά τμήματα τα οποία προσαράσσονται ξεχωριστά, χρησιμοποιώντας μεθόδους που αναπτύχθηκαν για ανελαστική προσάραξη. Στην προσέγγιση τοποθέτηση και ένωση ( place-and-join ), τα τμήματα προσαράσσονται ανεξάρτητα στον υποδοχέα και στη συνέχεια ενώνονται όλα μαζί επανασυνδέοντας τους περιστρεφόμενους δεσμούς που διασπάστηκαν αρχικά. Στην προσέγγιση σταδιακής ή αυξητικής κατασκευής ( incremental construction ), αρχικά προσαράσσεται ένα κεντρικό τμήμα του προσδέτη και τα υπόλοιπα τμήματα αναπτύσσονται ξεκινώντας από το κεντρικό, σε ενεργειακά επιθυμητούς προσανατολισμούς. Αλγόριθμοι που χρησιμοποιούν τη συγκεκριμένη προσέγγιση για την υλοποίηση της ελαστικότητας του προσδέτη είναι οι FlexX [118] και DOCK 4.0 [40]. 3.2.2.3 Γενετικοί αλγόριθμοι (genetic algorithms) Πρόκειται για μια ευρέως χρησιμοποιούμενη τεχνική βελτιστοποίησης που επιλύει σύνθετα προβλήματα μιμούμενη την διαδικασία εξέλιξης της φύσης, πραγματοποιώντας δηλαδή βελτιστοποίηση με διαφοροποίηση (variation) και επιλογή. Οι γενετικοί αλγόριθμοι δουλεύουν με πληθυσμούς από λύσεις για προβλήματα βελτιστοποίησης. Κάθε λύση (κατάσταση του συστήματος) κωδικοποιείται σε μια μορφή συμβολοσειράς (string) που αποκαλείται χρωμόσωμα. Τα χρωμοσώματα διαφοροποιούνται/αναπαράγονται με μετάλλαξη (τυχαία αλλαγή σε κάποιο στοιχείο του χρωμοσώματος) ή/και διασταύρωση (ανταλλαγή πληροφορίας μεταξύ χρωμοσωμάτων). Μετά από κάθε κύκλο αναπαραγωγής, τα
χρωμοσώματα μεταφράζονται και πάλι σε καταστάσεις του συστήματος και εφαρμόζεται μια διαδικασία επιλογής που καθορίζει τις καταστάσεις που θα επιβιώσουν (τις καλύτερες ) και θα δώσουν απογόνους στην επόμενη γενιά. Στην νέα γενιά εφαρμόζονται οι ίδιες λειτουργίες και η διαδικασία επαναλαμβάνεται για έναν αριθμό από γενιές, οπότε επιβιώνουν οι πιο κατάλληλες καταστάσεις. Παραδείγματα γενετικών αλγορίθμων που χρησιμοποιούνται σε προβλήματα προσάραξης είναι οι GOLD [66], AUTODOCK [97], DARWIN [140]. 3.2.2.4 Εξομοιώσεις (simulations) Οι εξομοιώσεις της διαδικασίας πρόσδεσης ξεκινάνε από κάποια αρχική διαμόρφωση των εμπλεκόμενων μορίων και ακολουθώντας ένα μονοπάτι διαμορφωτικών αλλαγών καταλήγουν σε ένα τοπικό ενεργειακό ελάχιστο. Συχνά χρειάζεται να χρησιμοποιηθούν αρκετές διαφορετικές αρχικές διαμορφώσεις για να εξασφαλιστεί επαρκής δειγματοληψία του χώρου διαμορφώσεων και να προκύψει με ασφάλεια το ενεργειακό ελάχιστο. Οι μοριακές εξομοιώσεις είναι δύο τύπων: οι εξομοιώσεις μοριακής δυναμικής (molecular dynamics) και οι εξομοιώσεις Monte Carlo. Οι εξομοιώσεις μοριακής δυναμικής χρησιμοποιούν τους νόμους της κλασικής (Νεύτωνας) μηχανικής για να υπολογίσουν την κίνηση των σωματιδίων σε ένα μοριακό σύστημα. Οι εξομοιώσεις Monte Carlo αποτελούν στοχαστική διαδικασία που βασίζεται στην πραγματοποίηση τυχαίων διαμορφωτικών αλλαγών και αξιολόγησή τους, ώστε να προκύψει τελικά το ενεργειακό ελάχιστο. Εξομοιώσεις μοριακής δυναμικής πραγματοποιούνται από τα προγράμματα AMBER[75], CHARMM [17], κλπ., ενώ παραδείγματα αλγορίθμων προσάραξης που χρησιμοποιούν εξομοιώσεις Monte Carlo είναι οι ICM [3] και Prodock [145]. 3.2.3 Ελαστικός προσδέτης/ελαστικός υποδοχέας Για πολλά σύμπλοκα προσδέτη-υποδοχέα, η διαμόρφωση της πρωτεΐνης δεν διαφέρει σημαντικά από την μη δεσμευμένη της κατάσταση. Σε τέτοιες περιπτώσεις η διατήρηση της πρωτεΐνης άκαμπτης κατά τη διάρκεια της προσάραξης αποτελεί έγκυρη προσέγγιση. Όμως οι αλλαγές στη διαμόρφωση της πρωτεΐνης που επάγονται από την πρόσδεση του προσδέτη δεν είναι σπάνιο φαινόμενο. Για παράδειγμα, όταν σχηματίζει υδρόφοβες αλληλεπιδράσεις, ο υποδοχέας συνήθως υπόκειται σε κάποιες διαμορφωτικές αλλαγές που επιτρέπουν μια πιο στενή υδρόφοβη αλληλεπίδραση με τον προσδέτη. Τα μοντέλα που χρησιμοποιούνται χωρίζονται σε πέντε κατηγορίες: (α) χρήση εύκαμπτων υποδοχέων (soft receptors) οι οποίοι μετριάζουν τις ενεργειακές επιβαρύνσεις λόγω χωρικών (steric) συγκρούσεων, (β) η επιλογή λίγων κρίσιμων βαθμών ελευθερίας στην θέση πρόσδεσης του υποδοχέα, (γ) η χρήση πολλαπλών δομών του υποδοχέα είτε ατομικά είτε χρησιμοποιώντας ένα σχήμα μέσου όρου, (δ) η χρήση τροποποιημένων μεθόδων μοριακής εξομοίωσης και (ε) η χρήση συλλογικών
(collective) βαθμών ελευθερίας, που αποτελεί αρκετά πρόσφατη προσέγγιση στην αναπαράσταση της ελαστικότητας των πρωτεϊνών. 3.2.3.1 Εύκαμπτοι υποδοχείς (soft receptors) Αποτελεί μία από τις απλούστερες λύσεις για την έμμεση αναπαράσταση της ελαστικότητας του υποδοχέα. Οι εύκαμπτοι υποδοχείς δημιουργούνται εύκολα μετριάζοντας τις υψηλές ενεργειακές επιβαρύνσεις που προκαλούνται σε ένα σύστημα όταν ένα άτομο του προσδέτη επικαλύπτεται με ένα άτομο της πρωτεΐνης. Μειώνοντας τις συνεισφορές van der Waals στην συνολική ενέργεια ο υποδοχέας στην πράξη γίνεται πιο εύκαμπτος, επιτρέποντας έτσι σε έναν μεγαλύτερο προσδέτη να ταιριάσει στην ίδια θέση πρόσδεσης που προσδιορίστηκε πειραματικά για ένα μικρότερο μόριο. Η λογική πίσω από αυτή την προσέγγιση είναι ότι η δομή του υποδοχέα έχει κάποια εγγενή ελαστικότητα η οποία της επιτρέπει να προσαρμόζεται σε προσδέτες με ελαφρά διαφορετικό σχήμα, καταφεύγοντας σε μικρές διακυμάνσεις στον προσανατολισμό των πλευρικών αλυσίδων και των θέσεων του σκελετού της πρωτεΐνης. Υποτίθεται ότι αυτές οι αλλαγές δεν επιφέρουν σημαντική ενεργειακή επιβάρυνση και η οποία ισοσταθμίζεται από την βελτιωμένη ενέργεια αλληλεπίδρασης μεταξύ προσδέτη και υποδοχέα. Η προσέγγιση αυτή ακολουθήθηκε από τους Jiang et al [63]. 3.2.3.2 Επιλεγμένοι βαθμοί ελευθερίας (selective degrees of freedom) Για να μειωθεί η πολυπλοκότητα της μοντελοποίησης ενός πολύ μεγάλου χώρου διαστάσεων που αναπαριστά την πλήρη ελαστικότητα της πρωτεΐνης, μπορεί να ακολουθηθεί μία προσεγγιστική λύση από στην επιλογή μερικών μόνο κρίσιμων βαθμών ελευθερίας που θα μοντελοποιηθούν στα πλαίσια του αλγορίθμου προσάραξης. Η επιλογή των πιο αντιπροσωπευτικών βαθμών ελευθερίας είναι το πιο δύσκολο κομμάτι της διαδικασίας. Η προσέγγιση που ακολουθείται, συνήθως, είναι η υλοποίηση της ελαστικότητας σε επιλεγμένες πλευρικές αλυσίδες του υποδοχέα και ο πιο αποδοτικός τρόπος να χειριστεί κανείς την ελαστικότητα των πλευρικών αλυσίδων του υποδοχέα είναι με τη χρήση rotamers (βλ. παράρτημα ΙΙ), οι οποίες αντιπροσωπεύουν τις πιο ευνοϊκές διαμορφώσεις όπως αυτές καθορίζονται από στατιστική ανάλυση των αντίστοιχων βάσεων δεδομένων που περιέχουν δομές πρωτεϊνών. Τέτοιες προσεγγίσεις έχουν χρησιμοποιηθεί στον αλγόριθμο ICM [3], στον αλγόριθμο Dead End Elimination που αναπτύχθηκε από τον Leach[78], κλπ.. 3.2.3.3 Πολλαπλές διαμορφώσεις του υποδοχέα (conformational ensembles) Ένας από τους τρόπους για την αντιμετώπιση της ελαστικότητας του υποδοχέα είναι η χρήση πολλαπλών στατικών δομών του υποδοχέα. Αυτή η έννοια υποστηρίζεται από το πρόσφατα υιοθετημένο μοντέλο σύμφωνα με το οποίο οι πρωτεΐνες σε διάλυμα δεν υπάρχουν σε μία μόνο διαμόρφωση χαμηλότερης ενέργειας, αλλά στην πραγματικότητα υπερπηδούν μεταξύ
ενός αριθμού υποκαταστάσεων (substates) χαμηλής ενέργειας. Με αυτό τον τρόπο, η καλύτερη περιγραφή για μια πρωτεϊνική δομή, είναι αυτή του συνόλου διαμορφώσεων από ελαφρά διαφορετικές δομές που υπάρχουν ταυτόχρονα σε μια περιοχή χαμηλής ενέργειας, στην επιφάνεια δυναμικής ενέργειας. Επιπλέον, η διαδικασία πρόσδεσης μπορεί να θεωρηθεί ότι δεν ακολουθεί ακριβώς το μοντέλο επαγόμενου ταιριάσματος, αλλά είναι περισσότερο επιλογή μιας συγκεκριμένης υπο-κατάστασης, από ένα σύνολο διαμορφώσεων, που συμπληρώνει καλύτερα το σχήμα του συγκεκριμένου προσδέτη. Οι πολλαπλές διαμορφώσεις μπορεί να προέρχονται είτε από πειραματικές μεθόδους (κρυσταλλογραφία ακτίνων Χ ή μαγνητική τομογραφία) είτε από κάποια μέθοδο εξομοίωσης (μοριακή δυναμική ή Monte Carlo). Παραδείγματα τέτοιων προσεγγίσεων της ελαστικότητας του υποδοχέα έχει ακολουθηθεί από τον αλγόριθμο SYSYDOC [110], καθώς και από αυτόν που αναπτύχθηκε από τους Osterberg et al [106]. 3.2.3.4 Εξομοιώσεις (simulations) Οι εξομοιώσεις (μοριακής δυναμικής ή Monte Carlo) αποτελούν τον πιο άμεσο τρόπο για την αντιμετώπιση της ελαστικότητας τόσο του προσδέτη όσο και του υποδοχέα. Και για την ελαστικότητα του υποδοχέα ισχύουν όσα περιγράφηκαν στην παράγραφο για την ελαστικότητα του προσδέτη, 3.2.2.4. 3.2.3.5 Συλλογικοί βαθμοί ελευθερίας (collective degrees of freedom) Μια εναλλακτική αναπαράσταση της πρωτεϊνικής ελαστικότητας είναι η χρήση συλλογικών βαθμών ελευθερίας (collective degrees of freedom).οι συλλογικοί βαθμοί ελευθερίας δεν αντιστοιχούν σε φυσικούς βαθμούς ελευθερίας των μορίων. Αντίθετα πρόκειται για συνολικές πρωτεϊνικές κινήσεις που προέρχονται από ταυτόχρονες αλλαγές όλων ή ενός μέρους των φυσικών βαθμών ελευθερίας του υποδοχέα. Με τον τρόπο αυτό επιτυγχάνεται έξυπνη δειγματοληψία του χώρου διαμορφώσεων του υποδοχέα, δεδομένου ότι προσδιορίζονται και πραγματοποιούνται διαμορφωτικές αλλαγές που συμβαίνουν ταυτόχρονα και όχι ανεξάρτητα η μία από την άλλη, οπότε μειώνεται ο χρόνος που δαπανάται για την διερεύνηση και την αξιολόγησή τους. Έχουν περιγραφεί διάφορα μοντέλα σχετικά με τη χρήση των συλλογικών βαθμών ελευθερίας για την αναπαράσταση της ελαστικότητας του προσδέτη τα οποία ανακεφαλαιώνονται από τους Teodoro and Kavraki [143], όμως η συγκεκριμένη προσέγγιση, όντας σχετικά πρόσφατη, δεν έχει ενσωματωθεί ακόμα σε αλγορίθμους προσάραξης.
3.3 Στοιχεία αλγορίθμου μοριακής αναγνώρισης Μια μέθοδος μοριακής αναγνώρισης που πραγματοποιείται με υπολογιστικά μέσα (in silico) μπορεί να θεωρηθεί σαν συνδυασμός δύο συστατικών: Μιας στρατηγικής αναζήτησης (search strategy) που ο ρόλος της είναι να διερευνά με αποδοτικό τρόπο το χώρο διαμορφώσεων του προσδέτη και του υποδοχέα. Στόχος της είναι να εντοπίσει τον προσανατολισμό και τη διαμόρφωση των μορίων που αλληλεπιδρούν, που αντιστοιχεί στην ελάχιστη τιμή της ελεύθερης ενέργεια πρόσδεσης. Μιας συνάρτησης αξιολόγησης (scoring function) η οποία αποτελεί προσέγγιση της ελεύθερης ενέργειας πρόσδεσης και χρησιμοποιείται για την εκτίμηση και διαβάθμιση των διαμορφώσεων προσδέτη-υποδοχέα που προκύπτουν από το στάδιο της αναζήτησης. Απαραίτητη βέβαια προϋπόθεση για την υλοποίηση της μεθόδου είναι η υπολογιστική αναπαράσταση των εμπλεκόμενων μορίων (προσδέτη και υποδοχέα), ώστε να μπορούν να συμμετέχουν στην τεχνική αναζήτησης και να συμβάλουν στον υπολογισμό της συνάρτησης αξιολόγησης. 3.3.1 Αναπαράσταση μορίων (προσδέτη, υποδοχέα) Η άμεση προσέγγιση στην αναπαράσταση των εμπλεκόμενων μορίων είναι η χρήση συντεταγμένων για κάθε άτομό τους. Αυτό είναι συνηθισμένο για τον προσδέτη που είναι μόριο μικρού μεγέθους αλλά όχι για τον υποδοχέα που είναι ένα πολύ μεγαλύτερο μόριο και μια αναπαράσταση με τις συντεταγμένες όλων των ατόμων δεν θα ήταν εύκολα διαχειρίσιμη. Δεδομένου ότι αυτό που μας ενδιαφέρει κατά τη διαδικασία της μοριακής αναγνώρισης, είναι η πρόσδεση του υποψηφίου φαρμάκου σε μία καλά προσδιορισμένη περιοχή του υποδοχέα, η αναπαράσταση του υποδοχέα περιορίζεται συνήθως σε μια περιοχή γύρω από τη θέση πρόσδεσης. Ακόμα και όταν ο υποδοχέας περιοριστεί στην περιοχή γύρω από τη θέση πρόσδεσης, μια αναπαράσταση με χρήση των συντεταγμένων όλων των ατόμων που εμπίπτουν στην συγκεκριμένη περιοχή δεν είναι πάντα αποδοτική. Εναλλακτικά, μπορεί να χρησιμοποιηθούν περιγραφείς (descriptors) γεωμετρικών σχημάτων (συνήθως σφαίρες ή κύβοι), μέσω των οποίων προσεγγίζεται η μοριακή επιφάνεια του υποδοχέα στην περιοχή πρόσδεσης. Κατά κανόνα οι περιγραφείς αυτοί σχετίζονται με κάποια φυσικοχημική ιδιότητα και είναι ιδιαίτερα αποδοτικοί στην διεξαγωγή αναζητήσεων. Μια ακόμα προσέγγιση είναι η χρησιμοποίηση πλέγματος για την αναπαράσταση της θέσης πρόσδεσης, από μόνη της ή σε συνδυασμό με συντεταγμένες ατόμων ή γεωμετρικούς περιγραφείς. Εδώ, εκτείνεται ένας χάρτης πάνω στην περιοχή αναζήτησης, στον οποίο
καταχωρούνται σημεία συγγένειας, βασισμένα σε τιμές ενεργειών αλληλεπίδρασης. Τα πλέγματα δημιουργούνται, συνήθως, πριν την εκτέλεση του αλγορίθμου προσάραξης και επιταχύνουν σημαντικά τον υπολογισμό της ενέργειας των διαμορφώσεων 3.3.2 Στρατηγικές Αναζήτησης Η στρατηγική αναζήτησης είναι η διαδικασία που δημιουργεί όλες τις πιθανές διαμορφώσεις του προσδέματος μέσα στην κοιλότητα πρόσδεσης του υποδοχέα. Μεταξύ των διαμορφώσεων αυτών θα πρέπει να περιλαμβάνεται και η κατάλληλη διαμόρφωση για το πρόβλημα που διερευνάται. Το πρώτο ζήτημα που έχει να αντιμετωπίσει μια τεχνική αναζήτησης, είναι ο τρόπος με τον οποίο θα αναπαραστήσει την ελαστικότητα των μορίων. Ένας αυστηρός αλγόριθμος αναζήτησης θα πρέπει να εξετάζει εξονυχιστικά όλους τους πιθανούς τρόπους σύνδεσης του υποδοχέα με το μόριο-προσδέτη. Και οι έξι βαθμοί ελευθερίας από μετατόπιση ή περιστροφή του μορίου-προσδέτη θα πρέπει να διερευνηθούν ταυτόχρονα με τους εσωτερικούς βαθμούς ελευθερίας λόγω αλλαγής διαμόρφωσης (conformational degrees of freedom) τόσο για τον προσδέτη όσο και την πρωτεΐνη. Βέβαια, κάτι τέτοιο δεν είναι δυνατό λόγω του τεράστιου μεγέθους του χώρου αναζήτησης ακόμα και σε απλές περιπτώσεις. Κατά συνέπεια ένα μικρό μέρος του χώρου διαμορφώσεων δειγματοληπτείται, ικανό να διατηρήσει την ισορροπία μεταξύ της υπολογιστικής δαπάνης και των διαφορετικών διαμορφώσεων που εξετάζονται. Οι δυνατοί τρόποι αντιμετώπισης της ελαστικότητας τόσο του προσδέτη όσο και του υποδοχέα έχουν αναλυθεί προηγουμένως ( 3.2). Το δεύτερο σημαντικό ζήτημα μιας στρατηγικής αναζήτησης είναι ο τρόπος με τον οποίο κινείται μέσα στα πλαίσια του χώρου διαμορφώσεων, ώστε να επιτύχει την αποδοτικότερη δειγματοληψία του. Διάφορες μέθοδοι έχουν χρησιμοποιηθεί για την διερεύνηση του χώρου διαμορφώσεων κατά τη διάρκεια της μοριακής αναγνώρισης, οι περισσότερες από τις οποίες είναι δανεισμένες από άλλα (επιστημονικά και τεχνολογικά) πεδία. Οι σημαντικότερες είναι: Εξομοιώσεις μοριακής δυναμικής (Molecular Dynamics simulations). Εξομοιώσεις Monte Carlo (Monte Carlo simulations). Γενετικοί αλγόριθμοι (Genetic Algorithms). Μέθοδοι βασισμένες στην τμηματοποίηση (Fragment-based methods). Μέθοδοι βασισμένες στην συμπληρωματικότητα σημείων (Point complementarity methods). Μέθοδοι βασισμένες στην γεωμετρία αποστάσεων (Distance geometry methods). Αναζητήσεις tabu (Tabu Searches).
Συστηματικές αναζητήσεις (Systematic Searches). Υβριδικές μέθοδοι (Hybrid Methods) Ο αριθμός των αλγορίθμων που είναι διαθέσιμοι για την διερεύνηση των αλληλεπιδράσεων μεταξύ πρωτεϊνών και προσδεμάτων είναι μεγάλος και διαρκώς αυξανόμενος. Επιπλέον, πολλοί αλγόριθμοι προσαρμόζουν διαφορετικές επεκτάσεις πάνω σε κοινές μεθοδολογίες με συνέπεια η προκύπτουσα ποικιλομορφία τόσο στην πολυπλοκότητα όσο και στην ταχύτητα να οδηγεί σε πληθώρα τεχνικών για την αντιμετώπιση των σύγχρονων προβλημάτων δομημένου σχεδιασμού φαρμάκων. Λόγω του μεγάλου αριθμού αλγορίθμων που έχουν αναπτυχθεί στο πεδίο αυτό, υπάρχει ανάγκη κατηγοριοποίησής τους. Διάφορες κατηγοριοποιήσεις εμφανίζονται στη διεθνή βιβλιογραφία. Οι πιο συνηθισμένες είναι: Βάσει του τρόπου που αντιμετωπίζεται η ελαστικότητα των μορίων. Βάσει της τεχνικής αναζήτησης που χρησιμοποιείται για τη διερεύνηση του χώρου διαμορφώσεων. Στην συγκεκριμένη διπλωματική εργασία οι αλγόριθμοι παρουσιάζονται (στο επόμενο κεφάλαιο) κατηγοριοποιημένοι ανά τεχνική αναζήτησης, δεδομένου ότι με τον τρόπο αυτό έχουμε λιγότερες επικαλύψεις, η λογική του αλγορίθμου γίνεται ευκολότερα κατανοητή από τον αναγνώστη και, επιπλέον, διευκολύνεται η συγκριτική αξιολόγηση των αλγορίθμων. Σε κάθε κατηγορία αναφέρονται τα κοινά χαρακτηριστικά της κατηγορίας και στη συνέχεια παρουσιάζονται οι ιδιαιτερότητες των επιμέρους αλγορίθμων. Οι αλγόριθμοι που παρουσιάζονται στη συγκεκριμένη διπλωματική εργασία περιλαμβάνονται στον πίνακα Ι.
Πίνακας Ι: Κατηγορίες τεχνικών αναζήτησης και αντίστοιχοι αλγόριθμοι Α/Α Τεχνική Αναζήτησης α/α Αλγόριθμος Αναφορά 1 Molecular Dynamics simulations 2 Monte Carlo simulations 1.1 Magnoni et all [86] 1.2 Pak and Wang [109] 1.3 MCSA-PCR [107] 2.1 ICM [3] 2.2 Prodoc [145] 2.3 MCDOCK [85] 2.4 QXP [89] 2.5 Apostolakis et all [7] 2.6 GLIDE [45][127] 3.1 Hammerhead [157] 3 Fragment-based methods 3.2 FlexX [118] 3.3 FlexE [24] 3.4 DOCK [43][41] 3.5 SLIDE [125] 4.1 GOLD [66] 4.2 AUTODOCK [97] 4 Genetic Algorithms 4.3 Osterberg et all [106] 4.4 DIVALI [23] 4.5 DARWIN [140] 5 Tabu search 5.1 PRO_LEADS [10] [101] 6 Systematic Searches 7 Point Complementarity methods 6.1 SYSDOCK [110] 6.2 EUDOCK [113] 7.1 Soft Docking [63] 7.2 FLOG [93] 8 Distance Geometry methods 8.1 DockIt [91] 9.1 FDS [142] 9.2 Leach [78] 9 Hybrid methods 9.3 Mining Minima Optimizer [29] 9.4 Price and Jorgensen [116] 9.5 Wang et all [154] 9.6 Hoffman et all [57] 9.7 FRED [47]
3.3.2 Συναρτήσεις Αξιολόγησης Για την διάκριση μεταξύ των καλών και κακών διαμορφώσεων πρόσδεσης και την επιλογή των προσδεμάτων με την καλύτερη συγγένεια πρόσδεσης μέσα από μια δεξαμενή υποψηφίων μορίων, είναι απολύτως απαραίτητη η χρησιμοποίηση αξιόπιστης αλλά και αποδοτικής συνάρτησης αξιολόγησης ώστε να είναι δυνατή η εκτίμηση οποιουδήποτε συμπλόκου προσδέτη-υποδοχέα σε συγκεκριμένη διαμόρφωση. Πραγματικά, χωρίς μια καλή συνάρτηση αξιολόγησης ακόμα και ο αποτελεσματικότερος αλγόριθμος αναζήτησης θα ήταν άχρηστος. Οι μέθοδοι μοριακής αναγνώρισης χρησιμοποιούν τις συναρτήσεις αξιολόγησης με δύο τρόπους. Η πρώτη προσέγγιση χρησιμοποιεί την πλήρη συνάρτηση αξιολόγησης, για να βαθμολογήσει τους διάφορους σχηματισμούς υποδοχέα-προσδέματος που προκύπτουν από τον αλγόριθμο αναζήτησης. Με βάση την αξιολόγηση, είναι δυνατόν να γίνει τροποποίηση του συστήματος από τον αλγόριθμο αναζήτησης και να εφαρμοστεί και πάλι η ίδια συνάρτηση αξιολόγησης για να βαθμολογήσει τους νέους σχηματισμούς. Η εναλλακτική προσέγγιση χρησιμοποιεί τη συνάρτηση αξιολόγησης σε δύο στάδια. Στο πρώτο στάδιο, μια απλοποιημένη μορφή της συνάρτησης χρησιμοποιείται για να κατευθύνει τη στρατηγική αναζήτησης και μια πιο ακριβής μορφή της, χρησιμοποιείται για να αξιολογήσει τους σχηματισμούς που προκύπτουν. Αυτές οι κατευθυνόμενες μέθοδοι κάνουν υποθέσεις σχετικά με τον υπερχώρο ενεργειών, παραλείποντας συχνά υπολογιστικά ακριβούς όρους όπως ηλεκτροστατικές δυνάμεις, και λαμβάνουν υπόψη μόνο μερικούς όρους, όπως δεσμούς υδρογόνου. Αυτοί οι αλγόριθμοι κατευθύνονται, συνεπώς, σε περιοχές μεγαλύτερης σπουδαιότητας όπως αυτές καθορίζονται από την απλοποιημένη συνάρτηση αξιολόγησης. Παραδείγματα τέτοιων αλγορίθμων δομικής αναγνώρισης είναι ο DOCK [42] και ο GOLD [66], που θα παρουσιαστούν στη συνέχεια. Ένας σημαντικός περιορισμός σε πολλές συναρτήσεις αξιολόγησης είναι η τάση τους να αγνοούν τις επιδράσεις του διαλύτη (διαλυτικού μέσου) ή να χρησιμοποιούν μοντέλα διαλύτη σε μορφή στιγμιότυπου (snap-shot fashion). Μία μέθοδος στιγμιότυπου περιλαμβάνει τη δημιουργία των δομών (σχηματισμών) πρωτεΐνης-προσδέματος σε κενό, οι οποίες βαθμολογούνται στην συνέχεια από μία συνάρτηση αξιολόγησης που λαμβάνει υπόψη τις επιδράσεις του διαλύτη. Με τον τρόπο αυτό η συνάρτηση αναζήτησης κατευθύνεται σε ένα χώρο που ευνοεί τους σχηματισμούς σε κενό. Επιπλέον, ο δομικός ρόλος των δεσμευμένων μορίων του διαλύτη αγνοείται. Στο υπόλοιπο του τρέχοντος κεφαλαίου γίνεται μία κατάταξη των συναρτήσεων αξιολόγησης σε κατηγορίες και δίνεται μια γενική περιγραφή της κάθε κατηγορίας [163]. Στο επόμενο κεφάλαιο που περιλαμβάνει τους αλγόριθμους μοριακής αναγνώρισης, η συνάρτηση
αξιολόγησης περιγράφεται στα πλαίσια του αλγορίθμου, ώστε να γίνει περισσότερο κατανοητός ο τρόπος που χρησιμοποιείται. 3.2.1 Η ελεύθερη ενέργεια ως συνάρτηση αξιολόγησης Από πλευράς αξιοπιστίας η ιδανικότερη συνάρτηση αξιολόγησης θα ήταν, σίγουρα, η ελεύθερη ενέργεια πρόσδεσης μεταξύ προσδέτη και υποδοχέα. Αυτή είναι η διαφορά ελεύθερης ενέργειας μεταξύ του συμπλόκου πρωτεΐνης-υποδοχέα σε διάλυμα και των μη-δεσμευμένων μορφών της πρωτεΐνης και του προσδέτη σε διάλυμα. Θεωρητικά, η ελεύθερη ενέργεια πρόσδεσης μπορεί να υπολογιστεί θεωρώντας τον ακόλουθο θερμοδυναμικό κύκλο [163]: A aqu + B aqu Δ G binding AB aqu A ΔG solv B ΔG solv AB ΔG solv A gas + B gasu Δ G gas AB gas Η ελεύθερη ενέργεια πρόσδεσης μπορεί να υπολογιστεί από τη σχέση: Δ G = ΔG ΔG ΔG + ΔG, όπου Δ = ΔH TΔS binding gas A solv B solv AB solv G gas είναι η ελεύθερη ενέργεια πρόσδεσης στην αέρια φάση. Η ενθαλπία πρόσδεσης ΔH μπορεί να υπολογιστεί από εξομοιώσεις μοριακής δυναμικής. Πολλές προσεγγίσεις έχουν αναπτυχθεί για την εκτίμηση της εντροπίας ΔS, όπως normal-mode analysis [160], quasi-harmonic analysis [52][98][71], προσέγγιση Gaussian[122]. Υπάρχουν αρκετά αξιόλογες προσπάθειες για τον υπολογισμό της απόλυτης ελεύθερης ενέργειας πρόσδεσης [92][82], καθώς και μια σχετικά ώριμη τεχνική, η θερμοδυναμική ολοκλήρωση[116], που εφαρμόζεται συχνά στον υπολογισμό της διαφοράς της ελεύθερης ενέργειας μεταξύ δύο διαφορετικών προσδεμάτων. Αυτές οι μέθοδοι παρέχουν έναν τρόπο για την επιλογή του καλύτερου υποψηφίου μεταξύ ενός μικρού συνόλου υποψηφίων με ικανοποιητική βεβαιότητα. Όμως απαιτούν υπολογιστικά ακριβές εξομοιώσεις Monte Carlo ή μοριακής δυναμικής και έτσι δεν είναι κατάλληλες για εφαρμογές διερεύνησης βάσεων δεδομένων (virtual screening). Σε τέτοιες εφαρμογές, όπου απαιτείται ο καθορισμός της προτεραιότητας μεταξύ μεγάλου αριθμού υποψηφίων, πρέπει να χρησιμοποιηθούν απλές και γρήγορες συναρτήσεις αξιολόγησης. Ο σχεδιασμός τέτοιων συναρτήσεων αξιολόγησης, αποτελεί τον απώτερο στόχο του των αλγορίθμων προσάραξης, όμως η διαδικασία πρόσδεσης πρωτεΐνης-προσδέτη περιλαμβάνει πολύπλοκες αλληλεπιδράσεις που είναι δύσκολο να περιγραφούν με απλούς όρους. Παρόλο που έχουν γίνει τεράστιες προσπάθειες και