ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΒΙΟΧΗΜΕΙΑΣ & ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΧΑΡΑΚΤΗΡΙΣΜΟΣ & ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΒΛΕΨΗ ΤΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΤΩΝ ΔΕΣΜΕΥΜΕΝΩΝ ΜΟΡΙΩΝ ΝΕΡΟΥ ΣΕ ΔΙΕΠΙΦΑΝΕΙΕΣ ΠΡΩΤΕΪΝΙΚΩΝ ΣΥΜΠΛΟΚΩΝ ΜΕ ΒΑΣΗ ΤΗ ΛΙΣΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΩΝ DOCKING ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΠΑΠΑΘΑΝΑΣΙΟΥ ΔΗΜΗΤΡΑ ΛΑΡΙΣΑ 2012
1 ΧΑΡΑΚΤΗΡΙΣΜΟΣ & ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΒΛΕΨΗ ΤΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΤΩΝ ΔΕΣΜΕΥΜΕΝΩΝ ΜΟΡΙΩΝ ΝΕΡΟΥ ΣΕ ΔΙΕΠΙΦΑΝΕΙΕΣ ΠΡΩΤΕΙΝΙΚΩΝ ΣΥΜΠΛΟΚΩΝ ΜΕ ΒΑΣΗ ΤΗ ΛΙΣΤΑ ΑΞΙΟΛΟΓΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΩΝ DOCKING Επιβλέπων: Παπαδόπουλος Γεώργιος, Λέκτoρας Βιοφυσικής, Τμήματος Βιοχημείας και Βιοτεχνολογίας Λάρισας, Πανεπιστήμιο Θεσσαλίας Τριμελής επιτροπή: Παπαδόπουλος Γεώργιος, Λέκτωρας Βιοφυσικής, Τμήματος Βιοχημείας και Βιοτεχνολογίας Λάρισας, Πανεπιστήμιο Θεσσαλίας Κοντού Μαρία, Επίκουρος Καθηγήτρια Πρωτεϊνικής Χημείας, Τμήματος Βιοχημείας και Βιοτεχνολογίας Λάρισας, Πανεπιστήμιο Θεσσαλίας Λεωνίδας Δημήτριος, Αναπληρωτής Καθηγητής Βιοχημείας, Τμήματος Βιοχημείας και Βιοτεχνολογίας Λάρισας, Πανεπιστήμιο Θεσσαλίας ΛΑΡΙΣΑ 2012
2
3 ΕΥΧΑΡΙΣΤΙΕΣ Η παρούσα διπλωματική εργασία εκπονήθηκε στο τμήμα Βιοχημείας και Βιοτεχνολογίας του Πανεπιστημίου Θεσσαλίας. Θα ήθελα να ευχαριστήσω τον επιβλέπων καθηγητή της παρούσας διπλωματικής εργασίας, κύριο Γεώργιο Παπαδόπουλο Λέκτορα Βιοφυσικής, Τμήματος Βιοχημείας και Βιοτεχνολογίας Λάρισας, Πανεπιστήμιο Θεσσαλίας, για την πολύτιμη βοήθεια του, την διαρκεί υποστήριξη και την εμπιστοσύνη που έδειξε στο πρόσωπο μου. Ακόμη θα ήθελα να εκφράσω τις ευχαριστίες μου στον υποψήφιο διδάκτωρ Απόστολο Αξενόπουλο για την πολύτιμη συμβολή του στην υλοποίηση αυτής της εργασίας. Τέλος θα ήθελα να ευχαριστήσω τον υποψήφιο διδάκτωρ Στυλιανό Φλώρο για την επίσης πολύτιμη συμβολή και βοήθεια του καθ όλη την διάρκεια εκπόνησης της διπλωματικής εργασίας καθώς και στην διεξαγωγή των αποτελεσμάτων.
4 Περιεχόμενα ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ... 6 ΕΥΡΕΤΗΡΙΟ ΕΙΚΟΝΩΝ... 6 ΕΥΡΕΤΗΡΙΟ ΔΙΑΓΡΑΜΜΑΤΩΝ... 7 ΕΙΣΑΓΩΓΗ... 8 Το νερό στις πρωτεϊνικές αλληλεπιδράσεις... 8 Πρωτεϊνικές αλληλεπιδράσεις... 8 Κατηγορίες πρωτεϊνικών αλληλεπιδράσεων... 9 Ομό-ολιγομερισμός (4)... 9 Αντιδράσεις μεταξύ ετερόλογων πρωτεϊνών (4)... 10 Χαρακτηρισμός των πρωτεϊνικών αλληλεπιδράσεων (4)... 11 Βιοφυσικές τεχνικές που χρησιμοποιούνται για την μελέτη των πρωτεϊνικών αλληλεπιδράσεων (5).... 11 Πρόβλεψη των πρωτεϊνικών αλληλεπιδράσεων με μεθόδους πρόσδεσης (docking)... 16 Γενικά για τα προγράμματα docking... 16 Βήματα docking... 17 Διάφορες προσεγγίσεις... 18
5 Protein Protein Docking Benchmark... 19 Ο ρόλος των νερών στα προγράμματα docking... 20 Προγράμματα που χρησιμοποιήθηκαν... 22 VMD - Visual Molecular Dynamics Version 1.8.7... 22 RASWIN (RASMOL) Version 2.7.1... 22 Swiss-PdbViewer (aka DeepView) Version 3.7 (SP5)... 23 Τί είναι τα scripts;... 24 ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ... 25 Πρόβλεψη θέσεων νερού στην διεπιφάνεια αλληλεπίδρασης... 31 Σχολιασμός και Συμπεράσματα... Σφάλμα! Δεν έχει οριστεί σελιδοδείκτης.34 ΣΥΖΗΤΗΣΗ ΜΕΛΛΟΝΤΙΚΕΣ ΠΡΟΟΠΤΙΚΕΣ... 37 ΠΑΡΑΡΤΗΜΑ - SCRIPTS... 39
6 ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ Πινακας 1 Λίστα αξιολόγησης προγραμμάτων docking (Benchmark 2.0)... 20 Πίνακας 2 Πλήθος αμινοξέων στη γειτονιά μορίων νερού της διεπιφάνειας συμπλόκων, πλήθος επιφανειακών αμινοξέων και ο λόγος αυτών (υδρογειτονικότητα)... 27 Πίνακας 3 Συνολικό πλήθος αμινοξέων και αμινοξέων στην διεπιφάνεια αλληλεπίδρασης 29 ΕΥΡΕΤΗΡΙΟ ΕΙΚΟΝΩΝ Εικόνα 1 Σχηματική απεικόνιση του τετραμερούς της αιμοσφαιρίνης. Παρατηρούμε τον χαρακτήρα α-έλικας των υπομονάδων της αιμοσφαιρίνης ενώ οι μονάδες αίμης φαίνονται με μωβ χρώμα.... 9 Εικόνα 2 Απεικόνιση της SH2 επικράτειας (domain) της p561ck (πράσινο τμήμα) συνδεδεμένης με έναν συνθετικό αναστολέα (γαλάζιο τμήμα).... 10 Εικόνα 3 In vivo ανίχνευση πρωτεϊνικών αλληλεπιδράσεων με χρήση FRET... 14 Εικόνα 4 Παρουσίαση λειτουργίας SPR.... 14 Εικόνα 5 Σχηματική αναπαράσταση της λειτουργίας του SPR... 15 Εικόνα 6 Στάδια πρωτεϊνικού docking... 18 Εικόνα 7 Τριδιάστατη δομή του συμπλόκου χυμοθριψινογόνου Α βοοειδούς και αναστολέα της ανθρώπινης πανγκρεατικής τρυψίνης χρωματισμένο ανά αλυσίδα ενώ τα δύο σφαιρίδια είναι τα μόρια νερού στην επιφάνεια αλληλεπίδρασης.... 21 Εικόνα 8 Οθόνη του προγράμματος VMD... 22 Εικόνα 9 Οθόνη του προγράμματος RASMOL... 23 Εικόνα 10 Οθόνη του προγράμματος Swiss PdbViewer... 24 Εικόνα 11 Πυρηνικός μεταφορικός παράγοντας (NTF2) συνδεδεμένος με GDP από την οικογένεια Ras GTPASE RAN. Χρωματισμός ανά αλυσίδα, ενώ παρατηρούνται τα κρυσταλλικά μόρια νερού στις περιοχές αλληλεπίδρασης.... 25 Εικόνα 12 Κρυσταλλική δομή του συμπλόκου GAP υπομονάδας της pseudomonas aeruginosa εξωτοξίνης και ανθρώπινης RAC. Στο παραπάνω σύμπλοκο παρατηρούμε με ροζ χρώμα τα μόρια νερού ενώ με έντονο πράσινο τα ιόντα που βρέθηκαν σε αυτό.... 26 Εικόνα 13 Δομή του RAC/P67PHOX. Παρατηρούμε μόνο τα επιφανειακά αμινοξέα όπως απομονώθηκαν.... 28 Εικόνα 14 Μεταφορική πρωτεΐνη του πυρήνα GDPRAN NTF2. Εμφανίζονται μόνο τα αμινοξέα που βρίσκονται στην διεπιφάνεια αλληλεπίδρασης.... 30
7 Εικόνα 15 Με κόκκινο χρώμα εμφανίζονται μόρια νερού στις περιοχές αλληλεπίδρασης του συμπλόκου ενώ με πράσινο παρατηρούμε τον συνδυασμό αμινοξέων που έδωσε την μεγαλύτερη πιθανότητα. Ανθρώπινη Cyclophilin A συνδεδεμένη στο άμινο- τελικό άκρο του καψιδίου του HIV-1... 32 Εικόνα 16 Με πράσινο και κίτρινο χρώμα εμφανίζονται τα κρυσταλλικά νερά ενώ με κόκκινο χρώμα βλέπουμε τις πιθανές θέσεις νερού με την μεγαλύτερη υδρογειτονικότητα. Σύμπλοκο πρωτεϊνασών σερίνης με τους πρωτεϊνικούς αναστολείς τους.... 33 ΕΥΡΕΤΗΡΙΟ ΔΙΑΓΡΑΜΜΑΤΩΝ Διάγραμμα 1 Κατανομή αμινοξέων επιφάνειας αλληλεπίδρασης ανάλογα με το ποσοστό εμφάνισης τους... 34 Διάγραμμα 2 Κατανομή αμινοξέων στην επιφάνεια των μορίων ανάλογα με το ποσοστό εμφάνισης τους... 35 Διάγραμμα 3 Γραφική παράσταση απεικόνισης της υδρογειτονικότητας αμινοξέων στην επιφάνεια αλληλεπίδρασης όλων των συμπλόκων. Πάνω δεξιά παρατηρούμε την συμπεριφορά της τρυπτοφάνης.... 36
8 ΕΙΣΑΓΩΓΗ Το νερό στις πρωτεϊνικές αλληλεπιδράσεις Είναι ευρέως αποδεκτό πως τα μόρια νερού παίζουν έναν αξιοσημείωτο ρόλο στην δομή, την σταθερότητα, την δυναμική και λειτουργικότητα των βιολογικών μορίων (1). Συγκεκριμένα τα μόρια νερού συμμετέχουν σε δεσμούς υδρογόνου που αναπτύσονται καθώς και σε ηλεκτροστατικές αλληλεπιδράσεις. Συγκεκριμένα μπορεί και συμμετέχει σε αλληλεπιδράσεις σύμφωνα με τον νόμο του Coulomb, μεταφορές πρωτονίων ακόμα και στην δημιουργία της δευτεροταγούς δομής της πρωτεΐνης (2). Έτσι ένα μόριο νερού μπορεί να προσφέρει μεγάλη προσαρμοστικότητα σε μια επιφάνεια επιτρέποντας αλληλεπιδράσεις με μεγάλη ετερογένεια καθώς και αλληλεπιδράσεις με μεγάλη συγγένεια (3). Η μελέτη των Papoian et al. (4) έδειξε πως τα μόρια νερού παίζουν ρόλο όχι μόνο στην αναδίπλωση και την αλληλεπίδραση των πρωτεϊνών αλλά και σε μεγαλύτερης κλίμακας αλληλεπιδράσεις. Υδροφοβικές αλλά και υδροφιλικές αλληλεπιδράσεις επιρεάζουν πολλές βιοχημκές διαδικασίες. Η προσθήκη νερού μπορεί να βελτιώσει το πρωτεϊνικό docking καθώς και τον σχεδιασμό πρωτεϊνών και φαρμάκων έχοντας ως αποτέλεσμα μεγαλύτερη συγγένεια σύνδεσης και άρα μεγαλύτερη αποτελεσματικότητα (1). Πρωτεϊνικές αλληλεπιδράσεις Οι πρωτεϊνικές αλληλεπιδράσεις εμφανίζονται όταν δύο ή περισσότερες πρωτεΐνες έρχονται σε επαφή και συχνά εμφανίζουν λειτουργικό ρόλο σε κάθε επίπεδο της κυτταρικής λειτουργίας, σε επίπεδο υποκυτταρικής λειτουργίας, στην μεταφορά μορίων μέσα στις μεβράνες, στην σύσπαση του μυός, στην διακυτταρική επικοινωνία, για να αναφέρουμε μερικές. Ανωμαλίες στις πρωτεϊνικές αλληλεπιδράσεις έχουν συσχετιστεί με σωρεία νευρολογικών διαταραχών όπως είναι το Alzheimer. Εξαιτίας της σημασίας τους στην ανάπτυξη και στις ασθένειες αυτά τα συστήματα έχουν αποτελέσει αντικείμενα πολυπληθών μελετών. Έχει προκύψει από αυτές τις έρευνες πως η φύση έχει στρατολογήσει μεγάλο αριθμό μηχανισμών για την διμιουργία
9 πολυάριθμων πρωτεϊνικών αλληλεπιδράσεων ώστε να εξυπηρετούνται οι διάφορες εργασίες των κυττάρων (4). Κατηγορίες πρωτεϊνικών αλληλεπιδράσεων Ομό-ολιγομερισμός (4) Ένας μεγάλος αριθμός ενζύμων, μεταφορικών πρωτεϊνών, μεταγραφικών παραγόντων και άλλων λειτουργούν ως ομο-ολιγομερή. Τα ομο-σύμπλοκα είναι συνήθως μόνιμα και η διάταξη των μονομερών εξασφαλίζει την βέλτιστη λειτουργικότητα. Η συμβολή των μη ομοιοπολικών αλληλεπιδράσεων σε επίπεδο τεταρτοταγούς δομής των πρωτεϊνών παρέχει έναν μεγάλο αριθμό προτερημάτων σε σχέση με την λειτουργία πρωτεϊνικών μονάδων μιας πολυπεπτιδικής αλυσήδας. Πρώτον, η ενέργεια που αποθηκεύεται στην επιφάνεια αλληλεπίδρασης της υπομονάδας μπορεί να εξυπηρετήσει την σύνδεση ενός προσδέτη, ή να τροποποιήσει την δομή της πρωτεΐνης ως ανταπόκριση σε ρυθμιστικούς προσδέτες. Ένα άλλο πλεονέκτημα που συνδέει τις ρυθμιστικές ιδιότητες ενός συμπλόκου με τις αλληλεπιδράσεις των υπομονάδων υπόκειτε στο γεγονός πως η ενεργότητα της πρωτεΐνης εξαρτάται από την συγκέντρωσή της. Τέτοιος έλεγχος μπορεί να λειτουργήσει είτε θετικά ή αρνητικά με το ολιγομερές ή το πολυμερές να παρουσιάζει την μέγιστη δραστικότητα. Έτσι η λειτουργικότητα των ολιγομερών μπορεί να υπόκειτε σε έλεγχο από την συγκέντρωση του προσδέτη ή της ίδιας της πρωτεΐνης. Εικόνα 1 Σχηματική απεικόνιση του τετραμερούς της αιμοσφαιρίνης. Παρατηρούμε τον χαρακτήρα α-έλικας των υπομονάδων της αιμοσφαιρίνης ενώ οι μονάδες αίμης φαίνονται με μωβ χρώμα.
10 Στην εικόνα 1 παρατηρούμε το τετραμερές της αιμοσφαιρίνης. Αν και δεν είναι ένα πραγματικό ολιγομερές έχει χρησιμοποιηθεί σε πολλές έρευνες ως μοντέλο συνεργατικότητας και αλλοστερικής σύνδεσης. Είναι ένα καλό παράδειγμα που διαφένεται η σχέση δομής λειτουργικότητας. Αντιδράσεις μεταξύ ετερόλογων πρωτεϊνών (4) Η επικοινωνία σε επίπεδο οργανισμού ή κυττάρου απαιτεί την μεταφορά ενός χημικού σήματος από το ένα διαμέρισμα στο άλλο. Σε μεγάλη κλίμακα αυτή η επικοινωνία βασίζεται σε συγκεκριμένες αλληλεπιδράσεις μεταξύ ετερόλογων πρωτεϊνών ως ανταπόκριση σε συγκεκριμένα μηχανικά ή χημικά σήματα. Έχει βρεθεί πως παίζουν σημαντικό ρόλο στην κυτταρική αύξηση και διαφοροποίηση και δίνεται μεγάλη βάση στην μελέτη πρωτεϊνικών αλληλεπιδράσεων ανάμεσα σε μεταγραφικούς παράγοντες που είναι οι τελικοί αποδέκτες κατά την μεταγωγή σύμματος. Τα ετερο-σύμπλοκα μπορούν επίσης να είναι μόνιμα αλλά μπορούν επίσης να σχηματίζονται και να διασπώνται σύμφωνα με το περιβάλλον ή εξωτερικούς παράγοντες. Εικόνα 2 Απεικόνιση της SH2 επικράτειας (domain) της p561ck (πράσινο τμήμα) συνδεδεμένης με έναν συνθετικό αναστολέα (γαλάζιο τμήμα).
11 Χαρακτηρισμός των πρωτεϊνικών αλληλεπιδράσεων (4) Πολλές βιολογικές διεργασίες περιλαμβάνουν τον σχηματισμό πρωτεϊνικών συμπλόκων. Αν και κάθε οικογένεια ομόλογων πρωτεϊνικών αλληλεπιδράσεων φέρει πολλές ομοιότητες, υπάρχουν αρκετές διαφορές σε κάθε ακολουθία και δομή για να αποκλειστεί ο σχηματισμός λανθασμένων συμπλόκων. Αυτό σημαίνει πως αυτές οι συγγενικές σχέσεις μεταξύ των πρωτεϊνικών συμπλόκων έχουν συγχρονιστεί μέσω της εξέλιξης έτσι ώστε το ταίριασμα των πρωτεϊνών να προκύπτει μεταξύ συγκεκριμένων μορίων και μόνο υπό τις κατάλληλες συνθήκες. Κατ αυτόν τον τρόπο σε ομο-ολιγομερικές πρωτεΐνες, οι δυνάμεις των αλληλεπιδράσεων των υπομονάδων έχουν εξελιχτεί έτσι ώστε η σύνδεση του υποστρώματος να γίνεται στο κατάλληλο τρόπο, τέτοιο ώστε η ενζυμική δραστικότητα να προάγεται στον απαραίτητο βαθμό. Προκειμένου να κατανοηθούν οι υποκείμενες λειτουργίες των πρωτεϊνών πρέπει να γίνει και χαρακτηρισμός των ενεργειακών και δυναμικών ιδιοτήτων τους. Ως γενικός κανόνας στον χαρακτηρισμό των πρωτεϊνικών αλληλεπιδράσεων είναι η χρήση πολλών συμπληρωματικών τεχνικών. Ο χαρακτηρισμός των πρωτεϊνικών αλληλεπιδράσεων των ομο-ολιγομερών απαιτεί λίγο διαφορετική πειραματική προσέγγιση από αυτόν των ετερο-ολιγομερών. Είναι σπάνιο μόνο μια πειραματική προσέγγιση να δώσει επαρκείς πληροφορίες. Βιοφυσικές τεχνικές που χρησιμοποιούνται για την μελέτη των πρωτεϊνικών αλληλεπιδράσεων (5). Αναλυτική υπερφυγοκέντρηση (Analytical ultracentrifugation, AUC) Αν και η αναλυτική υπερφυγοκέντρηση έπαιξε θεμελιώδη ρόλο στην ιστορία για τον χαρακτηρισμό των πρωτεϊνικών συμπλόκων αυτήν η μεθοδολογία εγκαταλείφθηκε με την πάροδο του χρόνου λόγο έλλειψης τεχνολογιών που να μπορούν να ψηφιοποιούν τα δεδομένα (15). Η AUC επανεμφανίζεται σήμερα ως ένα ευπροσάρμοστο εργαλείο για τη μελέτη των πρωτεϊνικών συμπλόκων. Παρατηρώντας την καθίζηση των μακρομορίων στον χώρο της φυγοκέντρησης, μας επιτρέπεται ο υδροδυναμικός και θερμοδυναμικός
12 χαρακτηρισμός του διαλύματος, χωρίς καμία αλληλεπίδραση με κανένα υλικό ή επιφάνεια. Ο συνδυασμός νέας τεχνολογίας και ισχυρού υπολογιστικού λογισμικού για την ανάλυση στοιχείων έχει οδηγήσει σε σημαντικές προόδους για τον χαρακτηρισμό των πρωτεϊνών και των πρωτεϊνικών συμπλόκων (6). Σκέδαση φωτός (Light Scattering) Η στατική και δυναμική σκέδαση φωτός (light scattering) αντιπροσωπεύει μια άλλη προσέγγιση στην μελέτη των πρωτεϊνικών συμπλόκων. Κατά την στατική σκέδαση φωτός, η ένταση της σκέδασης συσχετίζεται με το μοριακό βάρος της πρωτεΐνης, την συγκέντρωσής της, την γωνία σκέδασης καθώς και το μήκος κύματος, τα οποία είναι συνήθως γνωστά. Η δυναμική σκέδαση φωτός βασίζεται σε μια αυτοσυσχέτιση των χρονο-εξαρτώμενων διακυμάνσεων της έντασης του σκεδασμένου φωτός που σχετίζονται με στην σταθερά διάχυσης. Αυτή η αυτοσυσχέτιση αποσυντίθεται πιο αργά για τα μόρια αργής διάχυσης και έτσι, η σταθερά διάχυσης εξάγεται από την τιμή του χρόνου αποκατάστασης αυτής της λειτουργίας. Στην περίπτωση των ιδανικών σφαιρικών μορίων, αυτό παρέχει ένα μέτρο του μοριακού βάρους. Τα καλύτερα αποτελέσματα επιτυγχάνονται με συγκέντρωση περίπου 1 mg/ml, ανάλογα με το μέγεθος της πρωτεΐνης ή του συμπλόκου. Ενώ τα όρια ευαισθησίας αποκλείουν τον προσδιορισμό των συγγενειών και των σταθερών ποσοστού ένωσης ή διαχωρισμού στις περισσότερες περιπτώσεις, η σκέδαση του φωτός είναι αρκετά χρήσιμη στο χαρακτηρισμό της στοιχειομετρίας των συμπλόκων σε υψηλή συγκέντρωση. Αυτές είναι πολύ σημαντικές πληροφορίες για την ανάλυση των στοιχείων που λαμβάνονται από τις πιο ευαίσθητες τεχνικές. Στην πραγματικότητα, πρέπει να επισημανθεί πως σε πολλές περιπτώσεις, οι βιοχημικές μέθοδοι παρέχουν την πληροφορία ότι η πρωτεΐνη Α αλληλεπιδρά με την πρωτεΐνη Β, αλλά η στοιχειομετρία αυτής της αλληλεπίδρασης είναι συχνά απροσδιόριστη. Ακόμα και όταν είναι διαθέσιμες οι κρυσταλλικές δομές, η στοιχειομετρία του συμπλόκου στον κρύσταλλο μπορεί να μην αντιστοιχεί σε αυτό που παρατηρείται σε διάλυμα υπό διάφορες συνθήκες. Έτσι, ο καθορισμός της τελικής στοιχειομετρίας, που απορρέει από τον καθορισμό του μοριακού βάρους μέσω σκέδασης φωτός είναι μια καλή ιδέα. Φασματοσκοπία φθορισμού (Fluorescence Spectroscopy) Υπάρχουν διαφορετικές προσεγγίσεις βασισμένες στον φθορισμό που μπορούν να χρησιμοποιηθούν για την μελέτη των πρωτεϊνικών αλληλεπιδράσεων. Η πιο ευρέως
13 διαδεδομένη τεχνική για την μελέτη των πρωτεϊνικών αλληλεπιδράσεων βασίζεται στην πόλωση ή ανισοτροπία φθορισμού. Αυτό το φυσικό μέγεθος αντιπροσωπεύει τον βαθμό στον οποίο ένα διεγερμένο φθορισμοφόρο διατηρεί τον προσανατολισμό του διεγείροντος φωτός στην εκπομπή του. Τα μικρά μόρια περιστρέφονται γρήγορα και διατηρούν έτσι λίγο αυτόν τον προσανατολισμό ή πόλωση, ενώ τα μεγάλα μόρια περιστρέφονται πιο αργά σε διαλύματα, και διατηρούν έτσι μια υψηλότερη πόλωση. Το πείραμα φθορισμού μπορεί να διεξαχθεί με στατικό ή με χρονοεξαρτώμενο τρόπο. Στο στατικό τρόπο, η πόλωση που μετριέται απεικονίζει την απώλεια προσανατολισμού από την περιστροφή του πρωτεϊνικού μορίου με το οποίο συνδέεται το φθορισμοφόρο, εκτός από την απώλεια προσανατολισμού από τις τοπικές κινήσεις του φθορισμοφόρου. Κατά συνέπεια, η απόλυτη τιμή της πόλωσης που μετριέται στο στατικό τρόπο δεν είναι ιδιαίτερα πληροφοριακή. Εντούτοις, στην περίπτωση μιας ισορροπίας μεταξύ συνδεδεμένων πρωτεϊνικών υπομονάδων, η τιμή της πόλωσης μειώνεται σε ένα διάλυμα ομο-ολιγομερούς ή αυξάνεται κατά τη στοιχειομετρική ανάλυση μιας πρωτεΐνης Α με μια πρωτεΐνη Β, αν αυτό οδηγεί σε σχηματισμός ετερο-ολιγομερών. Κατ αυτόν τον τρόπο η σταθερά ισορροπίας σύνδεσης και η κινητική των αλληλεπιδράσεων μπορούν να μελετηθούν. Η ευαισθησία της μεθόδου είναι αρκετά υψηλή. Ένα πρόσθετο πλεονέκτημα των τεχνικών φθορισμού είναι ότι προσαρμόζονται εύκολα στα πειράματα κινητικής (σταματημένη ροή ή απλή μίξη). Μια από τις πιο ευαίσθητες και πιο ευρέως διαδεδομένες τεχνικές φθορισμού είναι η FRET (Fluorescence resonance energy transfer) και η FCS (fluorescence correlation spectroscopy). Η δεύτερη βασίζεται περισσότερο στις αρχές της τεχνικής σκέδασης φωτός.
14 Εικόνα 3 In vivo ανίχνευση πρωτεϊνικών αλληλεπιδράσεων με χρήση FRET Συντονισμός επιφανειακών πλασμονίων (Surface Plasmon Resonance) Η SPR είναι μια τεχνική που παρουσιάζει ιδιαίτερο ενδιαφέρον για την μελέτη μοριακών αλληλεπιδράσεων. Αυτή η τεχνική βασίζεται στην διέγερση συλλογικών ταλαντώσεων των επιφανειακών ηλεκτρονίων ενός στρώματος χρυσού από κύματα φωτός μιας ακτίνας laser που προσπίπτει στην πλάκα χρυσού. Έχει αποδειχτεί πολύ χρήσιμη τεχνική ως προς την μελέτη αλληλεπιδράσεων μεταξύ συγκεκριμένων πρωτεϊνών. Εικόνα 4 Παρουσίαση λειτουργίας SPR.
15 Η SPR προκαλεί μείωση της έντασης του επικείμενου φωτός σε μία συγκεκριμένη «γωνία συντονισμού». Αυτή η γωνία εξαρτάται από τον δείκτη διάθλασης (n 2 ). Ο δείκτης διάθλασης εξαρτάται από τον μαζικό αριθμό της επιφάνειας του δείγματος (Εικόνα 5). Στην επιφάνεια τοποθετείτε το δείγμα που θέλουμε να εξετάσουμε, ενώ η επιφάνεια του ανιχνευτή είναι καλυμμένη με ένα λεπτό στρώμα χρυσού. Το φως προσπίπτει στην επιφάνεια του δείγματος και διαθλάται (Εικόνα 4). Εικόνα 5 Σχηματική αναπαράσταση της λειτουργίας του SPR Θερμιδομετρία (Calorimetry) Θερμιδομετρία ισοθερμικής τιτλοδότησης (ITC: Iso-thermal titration calorimetry) είναι ένα πολύ ισχυρό εργαλείο για τον χαρακτηρισμό των πρωτεϊνικών αλληλεπιδράσεων. Αυτή η τεχνική βασίζεται σε σχετικά άμεση μέτρηση της θερμότητας που απορροφάται ή απελευθερώνεται κατά την τιτλοδότηση ενός διαλύματος ενός μορίου Α με ένα μόριο Β. Αν οι αλληλεπιδράσεις για τον σχηματισμό συμπλόκων είναι επαρκείς (δηλαδή σχηματίζεται επαρκείς αριθμός συμπλόκων), τότε τα πειράματα της ITC αποδίδουν την ενθαλπία αλλά και τις μεταβολές της ελεύθερης ενέργειας της αντίδρασης. Το μοναδικό μειονέκτημα αυτής της μεθόδου είναι η σχετικά μικρή ευαισθησία της.
16 Αν και οι παραπάνω βιοφυσικές τεχνικές μπορούν να μελετήσουν βιολογικά συστήματα και να μας δώσουν πληροφορίες σε μοριακό και ατομικό επίπεδο, ωστόσο σχεδόν ποτέ μία μέθοδος δεν είναι επαρκής. Έτσι είναι απαραίτητο κανείς να κατανοήσει και να έχει ένα υπόβαθρο στις διαφορετικές πειραματικές μεθόδους που περιγράφηκαν. Με την βοήθεια των παραπάνω τεχνικών μπορεί κανείς να μελετήσει την δομή, τις ιδιότητες και την βιολογική λειτουργία των μορίων ή να καταγράψει πώς η δομή και η δυναμική των μορίων επιτρέπει συγκεκριμένες βιολογικές λειτουργίες. Όλες οι παραπάνω τεχνικές που περιγράφθηκαν μας δίνουν την δυνατότητα να προβλέψουμε την ύπαρξη αλληλεπίδρασης ακόμα και την κινητική αυτής της αλληλεπίδρασης μεταξύ των πρωτεϊνών, παρόλα αυτά δεν μπορούν να μας δώσουν το που ακριβώς δίνεται αυτήν η αλληλεπίδραση, ποια αμινοξέα συμμετέχουν. Πρόβλεψη των πρωτεϊνικών αλληλεπιδράσεων με μεθόδους πρόσδεσης (docking) Γενικά για τα προγράμματα docking Τα προγράμματα dοcking χρησιμοποιούνται για να προβλέψουν την δομή των διαμοριακών συμπλόκων που δημιουργούνται μεταξύ δύο ή περισσοτέρων μορίων. Μεγάλο ενδιαφέρον παρουσιάζεται για αλληλεπιδράσεις μεταξύ πρωτεϊνικών υποδοχέων (receptors) και προσδετών (ligands). Η μελέτη συμπλόκων πρωτεϊνών είναι βασική στην βιοχημεία καθώς τέτοια σύμπλοκα έχουν συνήθως λειτουργικό ρόλο. Ακριβείς μέθοδοι πρόβλεψης docking θα μπορούσαν να δώσουν βασική γνώση για την δομή και την λειτουργία τέτοιων συμπλόκων και κατ επέκταση τον ρόλο τους στους μηχανισμούς που συμμετέχουν. Ο πιο απλός και αποτελεσματικός τρόπος πρόβλεψης που χρησιμοποιείται και σήμερα βασίζεται στην συμπληρωματικότητα των προσδετών με τα μόρια που αλληλεπιδρούν. Γενικά όταν μελετάται ο τρόπος αλληλεπίδρασης ο πιο ορθός τρόπος θα ήταν η εφαρμογή της κβαντομηχανικής. Μια τέτοια προσέγγιση όμως δεν είναι καθόλου αποτελεσματική καθώς η χρήση της κβαντομηχανικής περιορίζεται σε συστήματα λίγων μόνο ατόμων. Αν και μπορεί κανείς να βρει μια μαθηματική προσέγγιση παρ όλα αυτά γρήγορα καταλήγει στο συμπέρασμα πως είναι δύσκολο μια τέτοια
17 προσέγγιση να δώσει σαφή αποτελέσματα. Παρόλα αυτά η κβαντομηχανική προσέγγιση πρέπει να λαμβάνεται υπόψη στην κλασική αξιολόγηση της μελέτης της δομής των συμπλόκων. Έτσι λοιπόν πρέπει να λαμβάνονται υπόψη οι δυνάμεις που δημιουργούνται κατά την αλληλεπίδραση καθώς και το μέγεθος των μορίων που αλληλεπιδρούν. Είναι σημαντικό να αναφέρουμε πως η αλληλεπίδραση μιας πρωτεΐνης με έναν προσδέτη (ligand) διαφέρει σε σχέση με αυτήν μεταξύ δύο πρωτεϊνών και αυτό γιατί ένας προσδέτης είναι πολύ μικρό μόριο σε σχέση με μία πρωτεΐνη. Έτσι οι πρωτεΐνες λόγο μεγέθους αντιμετωπίζονται ως άκαμπτα μόρια. Ωστόσο πολλές φορές δομικές αλλαγές στις πρωτεΐνες ή στους προσδέτες είναι απαραίτητες για να έχουμε ένα αποτελεσματικό docking. Ένας στόχος τα τελευταία χρόνια είναι να μπορέσουν να χρησιμοποιηθούν εύκαμπτα μόρια πρωτεϊνών (12). Βήματα docking Στην διαδικασία του docking παρατηρούνται τέσσερα βήματα όπως φαίνεται και στο σχήμα (Εικόνα 6). Ξεκινώντας κανείς αντιμετωπίζει τις πρωτεΐνες ως άκαμπτα μόρια, ίσως επιτρέποντας έναν μικρό βαθμό ευκαμψίας. Αναζητά έτσι στο πλήθος των δυνατών συνδυασμών των σχετικών πρωτεϊνικών προσανατολισμών, εκείνους με την καλύτερη βαθμολόγηση, κυρίως ως προς την συμπληρωματικότητα του σχήματος. Στην συνέχεια γίνεται επανέλεγχος αυτών των δομών με μια ακριβότερη ενεργειακά λειτουργία που διακρίνει καλύτερα τους πιο στενούς προσανατολισμούς. Σε ένα τρίτο στάδιο, ασχολούμαστε περισσότερο με ένα πρότυπο συμπλόκου που διαθέτει όλες τις ατομικές λεπτομέρειες και επιτρέπουμε την μετακίνηση των πλευρικών αλυσίδων και ενδεχομένως και του σκελετού του μορίου. Εάν είναι διαθέσιμες επιπλέον βιολογικές πληροφορίες για την θέση της διεπιφάνειας χρησιμοποιούνται και αυτές για να απλοποιήσουν την αναζήτηση. Έτσι καταλήγουμε σε μια λίστα πιθανών συμπλόκων (7).
18 Εικόνα 6 Στάδια πρωτεϊνικού docking Διάφορες προσεγγίσεις Έχει συντελεστεί μεγάλη πρόοδος όσον αφορά τις διάφορες μεθόδους docking. Πλέον παρουσιάζεται μια ευρύ φάσμα αλγορίθμων docking που μπορούν να αξιοποιηθούν για την αξιολόγηση των πρωτεϊνικών αλληλεπιδράσεων. Μία προσέγγιση είναι αυτήν της μοριακής δυναμικής. Αυτή η προσέγγιση περιλαμβάνει υπολογισμούς και λύσεις των εξισώσεων κινητικής του Νεύτωνα. Μία δεύτερη προσέγγιση είναι αυτή με τις μεθόδους Monte Carlo (8), οι οποίες είναι μέθοδοι προσομοίωσης που έχουν χρησιμοποιηθεί για την μελέτη των πρωτεϊνικών συμπλόκων. Η έκφραση Monte Carlo χρησιμοποιείται για να περιγράψει αλγορίθμους οι οποίοι προσεγγίζουν στοχαστικά ή μέσω τυχαίας δειγματοληψίας τα σύμπλοκα πρωτεϊνών. Μία ακόμη προσέγγιση είναι αυτήν που χρησιμοποιεί γενετικούς αλγορίθμους. Η κεντρική ιδέα αυτού είναι η προσέγγιση μιας λύσεις στα προβλήματα που παρουσιάζονται στο docking μέσω γενετικών προσεγγίσεων (μεταλλάξεις,
19 αποσιωπήσεις κλπ). Άλλη μέθοδος που έχει χρησιμοποιηθεί είναι αυτήν του Fragment-based methods. Με αυτόν τον τρόπο τα μόρια αντιμετωπίζονται τμηματικά ως κομμάτια και κάθε μέλος μελετάτε ξεχωριστά καταλήγοντας σε συνδυασμό των αποτελεσμάτων. Ακόμη μια προσεγγιστική μέθοδος είναι η Point complementary που βασίζεται στην αξιολόγηση της μορφής ή/και της χημικής συμπληρωματικότητας μεταξύ των αλληλεπιδρώντας μορίων. Άλλες μέθοδοι έχουν χρησιμοποιήσει την γεωμετρική απόσταση για την μελέτη τέτοιων συμπλόκων. Τέλος δύο ακόμα μέθοδοι που έχουν χρησιμοποιηθεί είναι οι Tabu και Systematic researches με την πρώτη να είναι μια στοχαστική προσέγγιση ενώ η δεύτερη ελέγχει όλους τους πιθανούς συνδυασμούς (12). Protein Protein Docking Benchmark Για την διευκόλυνση της δημιουργίας αλγορίθμων docking έχει αναπτυχθεί μία λίστα αξιολόγησης docking στην οποία η τριδιάστατη δομή καθώς και μία ή δύο ελεύθερες (μη δεσμευμένες) υπομονάδες του συμπλόκου είναι διαθέσιμες (13). Αρχικά ήταν μια μικρή λίστα που με νέες μελέτες έχει διευρυνθεί και επεκταθεί σε αρκετά μόρια είτε σύμπλοκα είτε μη συμπλοκοποιημένες δομές πρωτεϊνών. Η λίστα αυτή καλύπτει περιπτώσεις αλληλεπίδρασης ενζύμου αναστολέα, αντιγόνου αντισώματος και ομοπολυμερικών συμπλόκων. Αυτή η συγκριτική μέτρηση επιδόσεων χρησιμοποιήθηκε για να αξιολογήσει τον βαθμό στον οποίο οι συναρτήσεις βαθμολόγησης θα μπορούσαν επίσης να προβλέψουν τις συγγένειες των μακρομοριακών συμπλόκων. Ένα δείγμα της λίστας αξιολόγησης προγραμμάτων docking που χρησιμοποιήθηκε περιλαμβάνει ο πίνακας 1 (14).
20 Πινακας 1 Λίστα αξιολόγησης προγραμμάτων docking (Benchmark 2.0) Ο ρόλος των νερών στα προγράμματα docking Λόγω πρακτικών προβλημάτων που παρουσιάζονται στην πειραματική μελέτη των πρωτεϊνικών αλληλεπιδράσεων φαίνεται πως η μέθοδος docking θα εξελιχθεί σε ένα πολύ σημαντικό εργαλείο για την μελέτη της μοριακής μηχανικής των βιολογικών συστημάτων. Αν και τα προγράμματα docking έχουν εξελιχθεί αρκετά και έχουν σημειώσει αξιόλογη πρόοδο στην πρόβλεψη και μελέτη πρωτεϊνικών συμπλόκων παρ όλα αυτά το μόρια νερού μέχρι στιγμής δεν έχουν παίξει σημαντικό ρόλο και έχουν κατά κάποιο τρόπο αγνοηθεί. Αν και ο ρόλος και η σημασία της παρουσίας των μορίων νερού στην επιφάνεια πρωτεϊνών έχει συζητηθεί (18,19,20,21,22,23) και έχει γίνει μια προσπάθεια πρόβλεψεις της θέσης των μορίων νερού σε μόρια με γνωστή δομή μέσω προγραμμάτων (19,20,24,25) αυτές οι προσεγγίσεις δεν έχουν προσαρμοστεί σε προγράμματα docking ώστε να λαμβάνονται υπόψη τα μόρια νερού ανάμεσα στα μόρια που αλληλεπιδρούν. Αυτό μέχρι στιγμής έχει γίνει μόνο για μόρια πρωτεϊνών που αλληλεπιδρούν με προσδέτες ligands (26,27,28,29,30) Το μόνο πρωτόκολλο docking που είναι διαθέσιμο και λαμβάνει υπόψη την παρουσία των μορίων νερού έχει περιγραφεί από τους van Dijk et al (8). Η μέθοδος φαίνεται να είναι εφικτή και ιδιαίτερα υποσχόμενη καθώς φάνηκε να δίνει πολύ καλύτερα scores
21 και για τα 10 μόρια που μελετήθηκαν σε σχέση με τις μεθόδους που δεν λάμβαναν υπόψη το υδατικό περιβάλλον. Η σημασία και ο ρόλος των μορίων νερού είναι εμφανής στα πρωτεϊνικά σύμπλοκα καθώς παρατηρείται πως καταλαμβάνουν θέσεις σε κοιλότητες και είναι γνωστό πως παίζουν ρόλο στην δημιουργία δεσμών υδρογόνου και στην θερμοδυναμική της αλληλεπίδρασης των μορίων προς σχηματισμό συμπλόκων. Στην δική μας περίπτωση προσπαθήσαμε μέσω υπολογιστικών μεθόδων να εντοπίσουμε τα μόρια νερού σε μια λίστα μορίων από το Protein Protein Docking Benchmark 2.0. Ακολούθως ταυτοποιήσαμε το άμεσο περιβάλλον αυτών των μορίων νερού και το χαρακτηρίσαμε ως προς την υδροφοβικότητά του. Μελετώντας αυτά τα μόρια προσπαθήσουμε να δημιουργήσουμε μία μέθοδο που θα μπορεί να μας προβλέπει τις πιθανές θέσεις νερού για κάποιο σύμπλοκο πρωτεϊνών γνωστής δομής, στο σημείο αλληλεπίδρασης. Εικόνα 7 Τριδιάστατη δομή του συμπλόκου χυμοθριψινογόνου Α βοοειδούς και αναστολέα της ανθρώπινης πανγκρεατικής τρυψίνης χρωματισμένο ανά αλυσίδα ενώ τα δύο σφαιρίδια είναι τα μόρια νερού στην επιφάνεια αλληλεπίδρασης.
22 Προγράμματα που χρησιμοποιήθηκαν VMD - Visual Molecular Dynamics Version 1.8.7 Το VMD (16) είναι ένα πρόγραμμα με το οποίο μπορεί να κανείς να προβάλει και να αναλύσει δομές μεγάλων βιολογικών συστημάτων όπως πρωτεΐνες, νουκλεϊκά οξέα, λιπίδια κλπ. χρησιμοποιώντας αρχεία από την πρωτεϊνική βάση δεδομένων ( Protein Data Bank PDB). Η ανάλυση γίνεται με την βοήθεια script που γράφτηκαν στην γλώσσα προγραμματισμού Tcl. Εικόνα 8 Οθόνη του προγράμματος VMD RASWIN (RASMOL) Version 2.7.1 Το RasMol είναι ένα σημαντικό πρόγραμμα για την οπτικοποίηση των μοριακών δομών που δημιουργήθηκε από τον Roger Sayle το 1992. Χρησιμοποιείται από χιλιάδες χρήστες για την προβολή μορίων και για την δημιουργία εικόνων για τις διάφορες δημοσιεύσεις.
23 Εικόνα 9 Οθόνη του προγράμματος RASMOL Swiss-PdbViewer (aka DeepView) Version 3.7 (SP5) Το Swiss PdbViewer (17) είναι μια εφαρμογή που παρέχει μια φιλική προς το χρήστη πλατφόρμα επιτρέποντας να αναλύσει διάφορα μακρομόρια συγχρόνως. Το πρόγραμμα αυτό μπορεί να χρησιμοποιηθεί για δομική επαλληλία πρωτεϊνών προκειμένου να συγκριθούν οι ενεργές περιοχές τους ή οποιαδήποτε άλλα μέρη που αλληλεπιδρούν. Μεταλλάξεις, δεσμοί υδρογόνου, γωνίες και αποστάσεις μεταξύ των ατόμων είναι εύκολο να ληφθούν. Με την χρήση του συγκεκριμένου προγράμματος καταφέραμε να απομονώσουμε τις επιφάνειες αλληλεπίδρασης μεταξύ των συμπλόκων.
24 Εικόνα 10 Οθόνη του προγράμματος Swiss PdbViewer Τί είναι τα scripts; Τέλος καλό είναι να αναφέρουμε στο θεωρητικό μας μέρος κάποια πράγματα για τα script που δημιουργήθηκαν. Τι είναι λοιπόν ένα script. To script είναι ένα αρχείο με οδηγίες για εκτέλεση εντολών που διαβάζεται από τον υπολογιστή στην περίπτωση μας μέσα από το πρόγραμμα VMD, το οποίο διαθέτει interpreter για την γλώσσα προγραμματισμού tcl. Στην ουσία αναγκάζει το πρόγραμμα να εκτελέσει επαναλαμβανόμενες εντολές που ο χρήστης θα μπορούσε να κάνει με το χέρι. Έτσι αυτοματοποιούμε μια διαδικασία που θα μπορούσε να είναι χρονοβόρα. Τα script που χρησιμοποιήσαμε παρατίθενται στο Παράρτημα - Scripts.
25 ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ Για να απαντήσουμε στο δικό μας ερώτημα χρησιμοποιήσαμε μία λίστα μορίων από το Benchmarking. Τα μόρια είναι όλα πρωτεΐνες που αλληλεπιδρούν είτε μεταξύ τους είτε με κάποιον ligand. Προβάλλοντας λοιπόν αυτά τα πρωτεϊνικά σύμπλοκα στο VMD καταφέραμε να απομονώσουμε τα μόρια νερού που εντοπίζονται ανάμεσα στις περιοχές αλληλεπίδρασης (binding site) (Εικόνα 11). Η εντολή που χρησιμοποιήθηκε έλαβε υπόψη τα μόρια νερού που απείχαν μέχρι 3,4 Á από κάθε αλυσίδα των μορίων που αλληλεπιδρούσαν 1. Επίσης μελετήθηκε η παρουσία ή όχι ιόντων στην περιοχή αλληλεπίδρασης. Η εντολή που χρησιμοποιήθηκε στο VMD είναι η ακόλουθη: ~water and within 3.4 of chain A and within 3.4 of chain B~ αναπροσαρμοσμένη για κάθε αλυσίδα χωριστά. Στην συνέχεια έγινε επιλογή των μορίων νερού με χειροκίνητο τρόπο καθώς η επιλογή των μορίων δεν ήταν ακριβής. Οπτικά μας δόθηκε η ευκαιρία να απομονώσουμε τα μόρια νερού που βρίσκονταν κυρίως σε κοιλότητες και σε περιοχές μέσα στην διεπιφάνεια αλληλεπίδρασης (binding site) και όχι μόρια νερού που μπορεί να πληρούσαν την προϋπόθεση της απόστασης αλλά δεν φαινόταν να συμμετέχουν στην αλληλεπίδραση των μορίων. Εικόνα 11 Πυρηνικός μεταφορικός παράγοντας (NTF2) συνδεδεμένος με GDP από την οικογένεια Ras GTPASE RAN. Χρωματισμός ανά αλυσίδα, ενώ παρατηρούνται τα κρυσταλλικά μόρια νερού στις περιοχές αλληλεπίδρασης.
26 Από την παραπάνω διαδικασία εντοπίσαμε μόρια νερού σε κοιλότητες που σχηματίζονται από τα δύο μόρια που αλληλεπιδρούν αλλά και σε όλη την περιοχή αλληλεπίδρασης. Ιόντα δεν εντοπίστηκαν στην περιοχή της επιφάνειας αλληλεπίδρασης εκτός ορισμένων εξαιρέσεων (εικόνα 12). Πιθανώς αυτά τα ιόντα να παίζουν ρόλο στην σταθεροποίηση της διαμόρφωση των μορίων στο χώρο. Εικόνα 12 Κρυσταλλική δομή του συμπλόκου GAP υπομονάδας της pseudomonas aeruginosa εξωτοξίνης και ανθρώπινης RAC. Στο παραπάνω σύμπλοκο παρατηρούμε με ροζ χρώμα τα μόρια νερού ενώ με έντονο πράσινο τα ιόντα που βρέθηκαν σε αυτό. Από αυτά τα μόρια νερού καταφέραμε και εντοπίσαμε μέσω ενός script 1 τα αμινοξέα που τα περιβάλλουν. Έτσι πήραμε έναν ενδεικτικό αριθμό για το πόσες φορές κάθε αμινοξύ εμφανίζεται δίπλα σε μόρια νερού. Παρατηρήσαμε πως νερά εντοπίζονται τόσο δίπλα σε υδρόφιλα αμινοξέα όσο και δίπλα σε υδρόφοβα. (πίνακας 2)
27 Πίνακας 2 Πλήθος αμινοξέων στη γειτονιά μορίων νερού της διεπιφάνειας συμπλόκων, πλήθος επιφανειακών αμινοξέων και ο λόγος αυτών (υδρογειτονικότητα) Αμινοξέα δίπλα σε νερά Αμινοξέα επιφάνειας μορίων Λόγος αμινοξέων δίπλα σε νερά προς αμινοξέα επιφάνειας TRP* 28 26 1,076923077 TYR 78 128 0,609375 ARG 86 154 0,558441558 HIS 37 67 0,552238806 GLN 90 187 0,481283422 ASN 75 226 0,331858407 GLU 81 302 0,268211921 ASP 81 305 0,26557377 PHE* 30 137 0,218978102 MET* 16 85 0,188235294 THR 79 420 0,188095238 LYS 53 308 0,172077922 PRO 42 299 0,140468227 SER 76 587 0,129471891 VAL* 46 461 0,09978308 GLY* 75 853 0,087924971 LEU* 39 469 0,08315565 ILE* 21 266 0,078947368 ALA* 38 615 0,061788618 CYS 6 148 0,040540541 Στήλη 1 αμινοξέα που βρέθηκαν δίπλα σε νερά. Με αστερίσκο χαρακτηρίζονται τα υδρόφοβα αμινοξέα. Στήλη 2 αμινοξέα που βρέθηκαν στην επιφάνεια όλων των μορίων Στήλη 3 Ο λόγος των αμινοξέων δίπλα σε νερά προς τα επιφανειακά αμινοξέα
28 Προκειμένου να χρησιμοποιηθούν οι αριθμοί αυτοί ως μέτρο της προτίμησης των διαφόρων αμινοξέων να βρίσκονται κοντά σε μόρια νερού, θα πρέπει να διαιρεθούν με την συχνότητα εμφάνισης κάθε αμινοξέος στην επιφάνεια των πρωτεϊνών ή με την συχνότητα εμφάνισης στην διεπιφάνεια. Γι αυτό χρειάστηκε να εντοπίσουμε όλα τα επιφανειακά αμινοξέα (Εικόνα 13) όλων των μορίων που υπήρχαν στην λίστα αξιολόγησης. Αυτό έγινε με την βοήθεια ενός προγράμματος που μπορεί και απομονώνει τα επιφανειακά αμινοξέα από κάθε αλυσίδα ξεχωριστά για κάθε μόριο - πρωτεΐνη που λαμβάνει χώρα στην αλληλεπίδραση. Απαραίτητη προϋπόθεση είναι να διαθέτουμε όλες τις αλυσίδες των μορίων που αλληλεπιδρούν σε ξεχωριστά αρχεία ώστε να μπορεί το πρόγραμμα να υπολογίσει τα επιφανειακά αμινοξέα. Ο διαχωρισμός των αλυσίδων έγινε με ένα νέο script 2. Το πρόγραμμα όμως αυτό απομονώνει άτομα των αμινοξέων που βρίσκονται σε συγκεκριμένη απόσταση και ανήκουν στα επιφανειακά αμινοξέα. Χρειάστηκε να δημιουργήσουμε ένα νέο script 3 το οποίο συλλέγει την ταυτότητα αυτών των ατόμων και ελέγχει το πλήρες pdb του μορίου καταγράφοντας ολόκληρο το αμινοξύ. Έτσι λοιπόν ξεχωρίσαμε της διάφορες υπομονάδες κάθε πρωτεΐνης από κάθε σύμπλοκο και υπολογίσαμε τα επιφανειακά αμινοξέα που εμφανίζονται. Στον πίνακα 2 παρατηρούμε τον αριθμό εμφάνισης κάθε αμινοξέος στο σύνολο τους από όλα τα σύμπλοκα που μελετήθηκαν. Οι μετρήσεις έγιναν για κάθε σύμπλοκο ξεχωριστά και το αποτέλεσμα συγκεντρώθηκε σε ένα πίνακα (Πίνακας 2). Εικόνα 13 Δομή του RAC/P67PHOX. Παρατηρούμε μόνο τα επιφανειακά αμινοξέα όπως απομονώθηκαν.
29 Κατόπιν υπολογίσαμε πόσες φορές εμφανίζεται κάθε αμινοξύ σε όλη την δομή του κάθε μορίου που συμμετείχε στις αλληλεπιδράσεις. Αυτό έγινε με την βοήθεια ενός άλλου script 4 το οποίο σάρωνε όλο το αρχείο pdb και κατέγραφε το κάθε αμινοξύ χωριστά. Έτσι πήραμε έναν αριθμό αμινοξέων που εμφανίστηκαν σε όλα τα σύμπλοκα που μελετήθηκαν. Στον πίνακα 3 παρουσιάζονται τα αποτελέσματα. Τέλος υπολογίσαμε και τον αριθμό των αμινοξέων της διεπιφάνειας αλληλεπίδρασης (Εικόνα 14) με την βοήθεια του Swiss-PdbViewer και ενός ακόμη script 5. Μέσω του Swiss-PdbViewer καταφέραμε να απομονώσουμε τα αμινοξέα μόνο του της διεπιφάνειας αλληλεπίδρασης ενώ με την βοήθεια του script 4 καταφέραμε και υπολογίσαμε τον αριθμό αυτό των αμινοξέων. Στον πίνακα 3 παρουσιάζεται αυτός ο αριθμός. Πίνακας 3 Συνολικό πλήθος αμινοξέων και αμινοξέων στην διεπιφάνεια αλληλεπίδρασης αμινοξέα όλων των μορίων αμινοξέα της διεπιφάνειας αλληλεπίδρασης TRP* 1179 3 TYR 2565 43 ARG 2943 95 HIS 1423 32 GLN 2730 116 ASN 2860 150 GLU 4104 231 ASP 3710 257 PHE* 2559 36 MET* 1297 26 THR 4364 254 LYS 4119 218 PRO 3229 213 SER 5123 458 VAL* 4763 165 GLY* 4867 865 LEU* 5753 158 ILE* 3317 87 ALA* 4558 417 CYS 1401 40 Στήλη 1 - Αριθμός αμινοξέων που εμφανίστηκαν σε όλα τα σύμπλοκα Στήλη 2 - Αριθμός των αμινοξέων της διεπιφάνειας αλληλεπίδρασης Η σειρά κατάταξης ακολουθεί τον πίνακα 1
30 Εικόνα 14 Μεταφορική πρωτεΐνη του πυρήνα GDPRAN NTF2. Εμφανίζονται μόνο τα αμινοξέα που βρίσκονται στην διεπιφάνεια αλληλεπίδρασης. Με τα παραπάνω δεδομένα υπολογίσαμε τον λόγο των αμινοξέων δίπλα σε νερά προς τα συνολικά επιφανειακά αμινοξέα και πήραμε ένα ποσοστό εμφάνισης αμινοξέων δίπλα σε νερά σε σχέση με την συνολική πιθανότητα εμφάνισης τους στην επιφάνεια του μορίου (πίνακας 2). Επίσης υπολογίσαμε τον λόγο των αμινοξέων δίπλα σε νερά προς τον αριθμό των αμινοξέων κάθε αλυσίδας που συμμετέχουν στην επιφάνεια αλληλεπίδρασης. Οι προκύπτοντες αριθμοί πιθανόν να συνδέονται με τον δείκτη υδροφοβικότητας καθώς και με την ικανότητα των αμινοξέων να σχηματίζουν δεσμούς υδρογόνου με τα μόρια νερού. Στο εξής θα αναφερόμαστε σ αυτούς τους λόγους με το όρο υδρογειτονικότητα.
31 Πρόβλεψη θέσεων νερού στην διεπιφάνεια αλληλεπίδρασης Με την βοήθεια της υδρογειτονικότητας και των αμινοξέων που εμφανίστηκαν δίπλα στα νερά, δημιουργήθηκε ένα νέο script 6 το οποίο μπορεί να εξετάζει όλες τις πιθανές τριάδες γειτονικών αμινοξέων και να υπολογίζει την «πιθανότητα» εμφάνισης νερού στο κέντρο κάθε τριάδα ως άθροισμα των υδρογειτονικοτήτων των αμινοξέων που την απαρτίζουν. Έτσι δεδομένης της δομής μιας πρωτεΐνης μπορούμε να κατατάξουμε όλους τους πιθανούς συνδυασμούς τριάδων γειτονικών αμινοξέων με βάση την συνολική τους υδρογειτονικότητα και να εντοπίσουμε τις πιθανότερες θέσεις μορίων νερού Με αυτόν τον τρόπο, εφόσον μας δίνεται ένα πρωτεϊνικό σύμπλοκο το οποίο θέλουμε να μελετήσουμε ως προς τους πιθανούς τρόπους αλληλεπίδρασης θα μπορούμε να προβλέψουμε τις θέσεις των μορίων νερού που παίζουν ρόλο σε αυτήν την αλληλεπίδραση. Αυτό είναι δυνατόν εάν και εφόσον έχουμε τα επιφανειακά αμινοξέα των μορίων που αλληλεπιδρούν και την πιθανότητα εμφάνισης νερού ανάμεσα στους πιθανούς συνδυασμούς. Με σκοπό τον έλεγχο της προαναφερθείσης υπόθεσης, μελετήθηκαν ορισμένα σύμπλοκα πρωτεϊνών πάνω στα οποία έγινε εφαρμογή του script 6 ώστε να ελέγξουμε κατά πόσο επαληθεύονται οι θέσεις των προβλεπόμενων μορίων νερού. Από κάθε σύμπλοκο χρησιμοποιήσαμε τα επιφανειακά αμινοξέα των μορίων και διαχωρίσαμε επίσης κάθε αλυσίδα. Η εφαρμογή του script 6 μας έδωσε ενδιαφέροντα αποτελέσματα καθώς παρατηρήθηκαν κρυσταλλικά μόρια νερού κοντά στον συνδυασμό αμινοξέων που έδινε την μεγαλύτερη πιθανότητα.
32 Εικόνα 15 Με κόκκινο χρώμα εμφανίζονται μόρια νερού στις περιοχές αλληλεπίδρασης του συμπλόκου ενώ με πράσινο παρατηρούμε τον συνδυασμό αμινοξέων που έδωσε την μεγαλύτερη πιθανότητα. Ανθρώπινη Cyclophilin A συνδεδεμένη στο άμινο- τελικό άκρο του καψιδίου του HIV-1 Ωστόσο αν και η μεγαλύτερη πιθανότητα μας έδινε έναν συνδυασμό αμινοξέων τα οποία εμφανίζονταν κοντά σε νερό μελετώντας τις μικρότερες πιθανότητες παρατηρούσαμε συνδυασμούς που απομακρύνονταν αρκετά από το binding site. Αυτό ίσως να συνέβαινε διότι η παράμετρος που χρησιμοποιήσαμε ήταν ως προς τα ολικά επιφανειακά αμινοξέα και μας εμφάνιζε πιθανότητες στο γενικευμένο σύνολο του κάθε συμπλόκου.
33 Εικόνα 16 Με πράσινο και κίτρινο χρώμα εμφανίζονται τα κρυσταλλικά νερά ενώ με κόκκινο χρώμα βλέπουμε τις πιθανές θέσεις νερού με την μεγαλύτερη υδρογειτονικότητα. Σύμπλοκο πρωτεϊνασών σερίνης με τους πρωτεϊνικούς αναστολείς τους. Στο πλαίσιο της παρούσης εργασίας κατεβλήθη προσπάθεια να προβλεφθούν οι πιθανές θέσεις των μορίων νερού με βάση την γνωστή κρυσταλλική δομή πρωτεϊνικών συμπλόκων που περιλαμβάνει και μόρια νερού. Έτσι μπορέσαμε να δούμε την προτίμηση αυτών των μορίων νερού ως προς το περιβάλλον τους, δηλαδή τα αμινοξέα που τα περιβάλλουν. Όσον αφορά τα αμινοξέα που βρίσκονται στην επιφάνεια αλληλεπίδρασης τα αποτελέσματα ήταν λίγο πολύ αναμενόμενα (Διάγραμμα 1). Παρατηρούμε πως τα περισσότερα νερά βρίσκονται κοντά σε υδρόφιλα αμινοξέα, ενώ υδρόφοβα αμινοξέα, αν και φαίνεται να συμμετέχουν αρκετά στην επιφάνεια αλληλεπίδρασης, παρ όλα αυτά εντοπίζονται με μικρότερη συχνότητα δίπλα σε μόρια νερού.
34 Διάγραμμα 1 Κατανομή αμινοξέων επιφάνειας αλληλεπίδρασης ανάλογα με το ποσοστό εμφάνισης τους Αντιθέτως αν μελετήσουμε την συχνότητα εμφάνισης των αμινοξέων στις επιφάνειες των μορίων, παρατηρούμε πως υπάρχει μια σχετική κατανομή των αμινοξέων καθώς και υδρόφιλα αλλά και υδρόφοβα αμινοξέα έχουν αυξημένες πιθανότητες να βρεθούν στην επιφάνεια μιας πρωτεΐνης (Διάγραμμα 2).
35 Διάγραμμα 2 Κατανομή αμινοξέων στην επιφάνεια των μορίων ανάλογα με το ποσοστό εμφάνισης τους Σύμφωνα με τα αποτελέσματα από το script 6 μας δίνεται σαφώς η δυνατότητα να βρούμε τις πιθανές θέσεις των μορίων νερού στην περιοχή δέσμευσης. Πιθανώς με την χρήση περισσοτέρων συνδυασμών αμινοξέων καθώς ο αριθμός τρία μπορεί να θεωρηθεί μικρός. Είναι αναγκαίο να τροποποιήσουμε το script 6 έτσι ώστε να περιορίζει την μελέτη του στα επιφανειακά αμινοξέα της περιοχής δέσμευσης καθώς εκεί μας ενδιαφέρει περισσότερο όταν κάνουμε docking. Με αυτόν τον τρόπο προβλέπουμε μια θέση για κάθε μόριο νερού η οποία όμως θέση μπορεί να είναι ήδη κατειλημμένη από κάποια πλευρική αλυσίδα κάποιου αμινοξέως. Έτσι λοιπόν βελτιώσεις είναι απαραίτητες για την πιο ακριβή πρόβλεψη της θέσης κάθε μορίου νερού έτσι ώστε να μην συγκρούετε με κάποια πλευρική αλυσίδα αμινοξέος. Οι θέσεις των πιθανών μορίων νερού υπολογίσθηκαν με βάση το κέντρο μάζας των αμινοξέων που σχηματίζουν ένα τρίγωνο. Αυτές οι θέσεις θα μπορούσαν να βελτιωθούν λαμβάνοντας υπόψη τις ακτίνες Van der Waals των ατόμων των αμινοξέων αλλά και των ίδιων των μορίων νερού. Ο λόγος που δεν χρησιμοποιήθηκαν τα αμινοξέα της διεπιφάνειας αλληλεπίδρασης είναι η αποκλίνουσα συμπεριφορά της υδρογειτονικότητας (διάγραμμα 3) της TRP,
36 που οφείλεται στην πολύ μικρή συχνότητα εμφάνισης (3) στο δείγμα μας της TRP στην διεπιφάνεια. 10 8 6 4 2 0-2 0 5 10 15 20 25 Αμινοξέα Διάγραμμα 3 Γραφική παράσταση απεικόνισης της υδρογειτονικότητας αμινοξέων στην επιφάνεια αλληλεπίδρασης όλων των συμπλόκων. Πάνω δεξιά παρατηρούμε την συμπεριφορά της τρυπτοφάνης.
37 ΣΥΖΗΤΗΣΗ ΜΕΛΛΟΝΤΙΚΕΣ ΠΡΟΟΠΤΙΚΕΣ Όπως σχολιάσθηκε και προηγουμένως τα μόρια νερού έχουν αγνοηθεί από τους αλγορίθμους που έχουν σχεδιαστεί για docking. Παρ όλα αυτά έχει προταθεί πως τα μόρια νερού μπορούν να επηρεάσουν την δημιουργία συμπλόκων μεταξύ πρωτεϊνών κι έτσι να θεωρηθούν σημαντικά στην διαδικασία docking. Μια ανάλυση βασισμένη στον όγκο Voronoi έδειξε πως μόνο όταν λαμβάνονται υπόψη τα μόρια του διαλύτη στις επιφάνειες αλληλεπίδρασης οι πρωτεΐνες που αλληλεπιδρούν είναι τόσο καλά πακεταρισμένες όσο και στο εσωτερικό τους (11). Ιδανικά λοιπόν τα μόρια νερού θα έπρεπε να υπολογίζονται αυτόματα κατά την διαδικασία του docking καθώς μπορούν να επηρεάσουν τα αποτελέσματά του. Ωστόσο αυτό έχει καταστεί δυνατόν μέχρι στιγμής μόνο για πρωτεΐνες που αλληλεπιδρούν με προσδέτες ligands (26,27,28,29,30) και νουκλεϊκά οξέα που αλληλεπιδρούν με προσδέτες ligands (31). Τα τελευταία χρόνια έχουν προταθεί πρωτόκολλα docking που δείχνουν πως αναμφίβολα τα μόρια νερού μπορούν να υπολογιστούν κατά την διαδικασία του docking. Ένα τέτοιο πρωτόκολλο έχει παρουσιαστεί από τους Dominguez et al.,2003 (9) οι οποίοι χρησιμοποιώντας ενυδατωμένες πρωτεϊνικές αλυσίδες σε συνδυασμό με μεθόδους Monte Carlo για την αφαίρεση νερού και με αποτελέσματα από κρυσταλλογραφικές μελέτες κατάφεραν να εντοπίσουν με μεγάλη ακρίβεια κρυσταλλικά μόρια νερού στις διεπιφάνειες και να βελτιώσουν τα αποτελέσματα του docking τόσο σε δεσμευμένη όσο και σε αδέσμευτη μορφή. Τα μόρια νερού λοιπόν συχνά παίζουν έναν ρόλο κλειδί στις αλληλεπιδράσεις των πρωτεϊνών. Εάν κανείς αγνοήσει τα νερά που συσχετίζονται με αυτές τις αλληλεπιδράσεις κατά την διαδικασία του docking τότε η υπολογιζόμενη ενέργεια αλληλεπίδρασης υποδοχέα-προσδέτη ίσως να είναι υψηλότερη από την σωστή. Εάν από την άλλη κάποιος κρατήσει τις κρυσταλλογραφικές θέσεις όπου παρατηρούνται τα μόρια του νερού τότε η θέση δέσμευσης του προσδέτη που μπορεί στην πραγματικότητα να εκτοπίζει αυτά τα νερά να μην είναι σωστή. Οι ερευνητές του Astex & Cambridge Crystallographic Data Centre (10) πρόσφατα ανέπτυξαν μία λεπτή διαδικασία στην τελευταία έκδοση του προγράμματος docking GOLD για να μπορέσουν να λύσουν αυτό το πρόβλημα. Αν και το ποσοστό πρόβλεψης τις σωστής
38 θέσης αλληλεπίδρασης παρουσία νερών αυξήθηκε κατά 10-12 ποσοστιαίες μονάδες, η σωστή θέση πρόβλεψης για σύμπλοκα που δεν μεσολαβούν μόρια νερού μειώθηκε κατά 6-7 ποσοστιαίες μονάδες. Αναμένεται πως ο συσχετισμός και η μέτρηση των υπολογιζόμενων συγγενειών θα βελτιωθεί με την εισαγωγή των μορίων νερού στις μεθόδους docking, πράγμα που εκκρεμεί να διερευνηθεί.
39 ΠΑΡΑΡΤΗΜΑ - SCRIPTS Παρακάτω παρατίθενται τα scripts που χρησιμοποιήθηκαν script 1 : water_env_script set outfile [open waterenv.txt w] set sel [atomselect top "protein and within 3.6 of water"] set id1 [$sel get resid] set id2 [$sel get resname] puts $outfile $id1 puts $outfile $id2 close $outfile script 2 : s_ch set protein [atomselect top protein] set chains [lsort -unique [$protein get pfrag]] foreach chain $chains { set sel [atomselect top "pfrag $chain"] $sel writepdb myfile_frag${chain}.pdb } script 3 : get_surf_aa Όπου "filename" το όνομα του αρχείου και "chain" το γράμμα τις κάθε αλυσίδας. Το script αυτό τροποποιήθηκε για κάθε σύμπλοκο και κάθε αλυσίδα χωριστά. set outfile [open surf_aa.pdb w] for {set i 1 } {$i < 100 } {incr i} { set aa0 [atomselect 0 "resid $i"] set residaa0 [$aa0 get resid] set lisres0 [lindex $residaa0 0] set infile [open "filename"_"chain".pdb r] foreach pdbline [split [read $infile] \n] { set r23_25 [string range $pdbline 23 25] if {$lisres0 == $r23_25} { puts $outfile $pdbline
40 } else {continue} } close $infile set infile [open "filename"_"chain".pdb r] foreach pdbline [split [read $infile] \n] { set r23_25 [string range $pdbline 23 25] if {$lisres0 == $r23_25} { puts $outfile $pdbline } else {continue} } close $infile } close $outfile script 4 : count_aa set outfile [open count_aa.txt w] set sela [atomselect top "resname ALA"] set numba [$sela num] set nala [expr $numba/5] puts $outfile "ALA $nala" set selb [atomselect top "resname ARG"] set numbb [$selb num] set narg [expr $numbb/11] puts $outfile "ARG $narg" set selc [atomselect top "resname ASN"] set numbc [$selc num] set nasn [expr $numbc/8] puts $outfile "ASN $nasn" set seld [atomselect top "resname ASP"] set numbd [$seld num] set nasp [expr $numbd/8] puts $outfile "ASP $nasp"
41 set sele [atomselect top "resname CYS"] set numbe [$sele num] set ncys [expr $numbe/6] puts $outfile "CYS $ncys" set self [atomselect top "resname GLN"] set numbf [$self num] set ngln [expr $numbf/9] puts $outfile "GLN $ngln" set selg [atomselect top "resname GLU"] set numbg [$selg num] set nglu [expr $numbg/9] puts $outfile "GLU $nglu" set selh [atomselect top "resname GLY"] set numbh [$selh num] set ngly [expr $numbh/4] puts $outfile "GLY $ngly" set seli [atomselect top "resname HIS"] set numbi [$seli num] set nhis [expr $numbi/10] puts $outfile "HIS $nhis" set selj [atomselect top "resname ILE"] set numbj [$selj num] set nile [expr $numbj/8] puts $outfile "ILE $nile" set selk [atomselect top "resname LEU"] set numbk [$selk num] set nleu [expr $numbk/8] puts $outfile "LEU $nleu" set sell [atomselect top "resname LYS"] set numbl [$sell num]
42 set nlys [expr $numbl/9] puts $outfile "LYS $nlys" set selm [atomselect top "resname MET"] set numbm [$selm num] set nmet [expr $numbm/8] puts $outfile "MET $nmet" set seln [atomselect top "resname PHE"] set numbn [$seln num] set nphe [expr $numbn/11] puts $outfile "PHE $nphe" set selo [atomselect top "resname PRO"] set numbo [$selo num] set npro [expr $numbo/7] puts $outfile "PRO $npro" set selp [atomselect top "resname SER"] set numbp [$selp num] set nser [expr $numbp/6] puts $outfile "SER $nser" set selq [atomselect top "resname THR"] set numbq [$selq num] set nthr [expr $numbq/7] puts $outfile "THR $nthr" set selr [atomselect top "resname TRP"] set numbr [$selr num] set ntrp [expr $numbr/14] puts $outfile "TRP $ntrp" set sels [atomselect top "resname TYR"] set numbs [$sels num] set ntyr [expr $numbs/12] puts $outfile "TYR $ntyr"
43 set selt [atomselect top "resname VAL"] set numbt [$selt num] set nval [expr $numbt/7] puts $outfile "VAL $nval" close $outfile script 5 : atomo_select set selca [atomselect top "type CA"] $selca writepdb C:/Users/little-elf/Desktop/1a2k_interf_CA.pdb script 6 : water_prop set outfile [open propp.txt w]; set prop(trp) 1,076923077 set prop(tyr) 0,609375 set prop(arg) 0,558441558 set prop(his) 0,552238806 set prop(gln) 0,481283422 set prop(asn) 0,331858407 set prop(glu) 0,268211921 set prop(asp) 0,26557377 set prop(phe) 0,218978102 set prop(met) 0,188235294 set prop(thr) 0,188095238 set prop(lys) 0,172077922 set prop(pro) 0,140468227 set prop(ser) 0,129471891 set prop(val) 0,09978308 set prop(gly) 0,087924971 set prop(leu) 0,08315565 set prop(ile) 0,078947368 set prop(ala) 0,061788618 set prop(cys) 0,040540541
44 for {set i 4 } {$i < 30} {incr i } { set k [expr ($i + 1)] for {set j $k} {$j < 30} {incr j } { set m [expr ($j + 1)] for { set l $m} {$l < 30} {incr l } { set system1 [atomselect top "resid $i"] set resname1 [$system1 get resname] set lin1 [lindex $resname1] set lin1lin1 [lindex [lindex $lin1 0]] set system2 [atomselect top "resid $j"] set resname2 [$system2 get resname] set lin2 [lindex $resname2] set lin2lin2 [lindex [lindex $lin2 0]] set system3 [atomselect top "resid $l"] set resname3 [$system3 get resname] set lin3 [lindex $resname3] set lin3lin3 [lindex [lindex $lin3 0]] set system4 [atomselect top "resid $i $j $l"] if {$lin1lin1 == "" $lin2lin2 == "" $lin3lin3 == "" } { } else { set MC($i) [ measure center $system1] set MC($j) [ measure center $system2] set MC($l) [ measure center $system3] set MC($i$j$l) [measure center $system4] set distance($i$j) [veclength [vecsub $MC($i) $MC($j)]] set distance($i$l) [veclength [vecsub $MC($i) $MC($l)]] set distance($j$l) [veclength [vecsub $MC($l) $MC($j)]]
45 if {$distance($i$j) <= 7 && $distance($j$l) <= 7 && $distance($i$l) <= 7} { set pro [expr $prop($lin1lin1) + $prop($lin2lin2) + $prop($lin3lin3)] puts $outfile "$i $j $l $pro $MC($i$j$l)" $system1 delete $system2 delete $system3 delete } #endif } #endelse } #endl $lin1lin1 $lin2lin2 $lin3lin3 set system1 [atomselect top "resid $i"] set resname1 [$system1 get resname] set lin1 [lindex $resname1] set lin1lin1 [lindex [lindex $lin1 0]] set system2 [atomselect top "resid $j"] set resname2 [$system2 get resname] set lin2 [lindex $resname2] set lin2lin2 [lindex [lindex $lin2 0]] set system3 [atomselect top "resid $l"] set resname3 [$system3 get resname] set lin3 [lindex $resname3] set lin3lin3 [lindex [lindex $lin3 0]] if {$lin1lin1 == "" $lin2lin2 == "" $lin3lin3 == "" } { } else {
46 set MC($i) [ measure center $system1] set MC($j) [ measure center $system2] set MC($l) [ measure center $system3] set MC($i$j$l) [measure center $system4] set distance($i$j) [veclength [vecsub $MC($i) $MC($j)]] set distance($i$l) [veclength [vecsub $MC($i) $MC($l)]] set distance($j$l) [veclength [vecsub $MC($l) $MC($j)]] if {$distance($i$j) <= 7 && $distance($j$l) <= 7 && $distance($i$l) <= 7} { set pro [expr $prop($lin1lin1) + $prop($lin2lin2) + $prop($lin3lin3)] puts $outfile "$i $j $l $lin1lin1 $lin2lin2 $lin3lin3 $pro $MC($i$j$l) " $system1 delete $system2 delete $system3 delete } #endif } #endelse } #endj } #endi close $outfile