Επίλυση γεωµετρικών περιορισµών σε µικρά µόρια µε αλγεβρικές µεθόδους Επαµεινώνδας. Φριτζίλας Μ Ε Βιοπληροφορικής Τµήµα Βιολογίας ΕΚΠΑ 17 Φεβρουαρίου 2005
Τί σηµαίνει ο τίτλος ; γεωµετρικός περιορισµός: το σχήµα του µορίου πρέπει να ικανοποιεί ορισµένα ποσοτικά κριτήρια (π.χ. προδιαγεγραµµένες αποστάσεις µεταξύ ατόµων) επίλυση περιορισµών: υπολογισµός των µοριακών στερεοδιατάξεων που ικανοποιούν τους περιορισµούς αλγεβρικές µέθοδοι: διατύπωση των περιορισµών υπό µορφή εξισώσεων, ντετερµινιστικός χαρακτήρας, πληρότητα στην κάλυψη των λύσεων µικρά µόρια: η υπολογιστική πολυπλοκότητα δεν µας επιτρέπει να χειριστούµε συστήµατα µε πολλούς βαθµούς ελευθερίας (π.χ. >10)
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
Ηπηγή των προβληµάτων µας Τα µόρια είναι εύκαµπτα φυσικά αντικείµενα. Μπορούµε να χειριστούµε την ευκαµψία τους µε υπολογιστικές µεθόδους ;
Στροφή γύρω από τους απλούς δεσµούς
Ορισµός του προβλήµατος εδοµένα: η 3D δοµή ενός µικρού µορίου και ένα σύνολο προδιαγεγραµµένων ενδοµοριακών αποστάσεων Ζητούµενα: οι στερεοδιατάξεις που ικανοποιούν τους περιορισµούς των αποστάσεων Παραδοχή: η ευελιξία του µορίου οφείλεται µόνο στη δυνατότητα περιστροφής γύρω από τους άξονες των απλών δεσµών
Ένα παράδειγµα Οι αποστάσεις d 1,d 2,d 3 µεταβάλλονται συναρτήσει των δίεδρων γωνιών θ 1, θ 2, θ 3. Πρόβληµα: Για ποιες τιµές των θ 1, θ 2, θ 3 οι αποστάσεις λαµβάνουν κάποιες επιθυµητές αριθµητικές τιµές ;
Σε ποιες εφαρµογές εµφανίζεται το πρόβληµα ; Aναζήτηση βάσει φαρµακοφόρου σε βάσεις µικρών µορίων click Μείωση της διάστασης του χώρου αναζήτησης για τους αλγορίθµους µοριακού docking click Υπολογισµός 3D δοµής από δεδοµένα NMR
Πώς έχει αντιµετωπιστεί το πρόβληµα ; Κοινός παρονοµαστής: αναγωγή στην ελαχιστοποίηση µιας συνάρτησης γεωµετρικού σφάλµατος στον χώρο των δίεδρων γωνιών k 2 1,..., n ) = ( d i d oi ) i= 1 F ( θ θ Πληθώρα µεθόδων ελαχιστοποίησης: γενετικοί αλγόριθµοι, gradient descent, µοριακή δυναµική κ.α. Πλεονέκτηµα: «ανοιχτή επικοινωνία» µε τη θεωρία και τις τεχνικές των αλγορίθµων βελτιστοποίησης Μειονεκτήµατα: στοχαστικός χαρακτήρας, εγκλωβισµός σε τοπικά ελάχιστα, µη πληρότητα
Το δικό µας κίνητρο Στοχεύουµε κατευθείαν στα µικρά µόρια. Αφού µπορούµε να χειριστούµε τη γεωµετρία τους αναλυτικά και να έχουµε πληρότηταστην κάλυψη του χώρου των λύσεων, γιατί να αρκεστούµε σε προσεγγιστικές µεθόδους ;
Πόσα µόρια είναι όντως «µικρά» ; πλήθος µορίων (επί συνόλου 728.000) πλήθος περιστρεφόµενων δεσµών Irwin and Shoichet, J. Chem. Inf. Model., 2004
Σχηµατική αναπαράσταση λογισµικού
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
Θεµελιώδης απόφαση µοντελοποίησης Ο ίδιος ο ορισµός του προβλήµατος µάς καλεί να χρησιµοποιήσουµε τις γωνίες θ i σαν άγνωστες µεταβλητές των εξισώσεων. Μπορούµε να εκφράσουµε αναλυτικά τις αποστάσεις συναρτήσει των γωνιών θ i ;
Τοπικά καρτεσιανά συστήµατα και µετασχηµατισµοί των συντεταγµένων F y F y R y r r ),, ( 3 2 1 θ θ θ = y F F F F F y R y XY Y X d r r r r = = = ),, ( ), ( 3 2 1 θ θ θ 2 2 3 2 1 ),, ( ), ( o F F o d y R d Y X d y = = r r θ θ θ
Πίνακας της γραµµικής απεικόνισης
Ένα παράδειγµα
sin Αναγωγή σε αλγεβρικό σύστηµα 2 2yi i θi = cos 2 i = 2 1+ y 1+ y i i 1 y θ θ, όπου y tan( i i = ) 2
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
Πίνακας Sylvester 0 C : p1( 0 ) = p2 ( 0 ) = 0 det( S ) = 0
Επίλυση συστήµατος 22
Αναγωγή σε πρόβληµα ιδιοτιµών
Σχηµατοποίηση της διαδικασίας επίλυσης το τίµηµα της γραµµικοποίησης: το µέγεθος του πίνακα Sylvester αυξάνει εκθετικά συναρτήσει του πλήθους και των βαθµών των αλγεβρικών εξισώσεων
Γενίκευση του πίνακα Sylvester
Αραιά πολυώνυµα και συνδυαστική γεωµετρία Κεντρική ιδέα: Ηθεωρίαλαµβάνει εξαρχής υπόψη της την αραιότητα των πολυωνύµων Μοντελοποίηση πολυωνύµων σαν κυρτά πολύεδρα Αλγεβρικές πράξεις µεταξύ πολυωνύµων = γεωµετρικές πράξεις µεταξύ πολυέδρων (π.χ. άθροισµα Minkowski) Φράγµα τωνbernstein, Khovanskii, Kushnirenko (1975) Αλγόριθµος των Εµίρη & Canny (1995)
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
Βάσεις δοµών µικρών µορίων Cambridge Structural Database (320.000 δοµές) http://www.ccdc.cam.ac.uk SuperLigands (5.038 δοµές) http://bioinf.charite.de/superligands ChemBank (900.000 δοµές) http://chembank.med.harvard.edu ZINC (2.700.000 δοµές) http://blaster.docking.org/zinc
ανταγωνιστής ντοπαµίνης Ένα εύκολο παράδειγµα
Ένα εύκολο παράδειγµα (ΙΙ)
Ένα πιο δύσκολο παράδειγµα thrombin ligand PDB code: 1TOM πίνακας Sylvester p1 ( 1, 2, 3, 4) = p2 ( 1, 2, 3, 4) = 0 0 p3 ( 1, 2) = p, ) 4 ( 3 4 = 0 0
Ένα πιο δύσκολο παράδειγµα (ΙΙ)
Ένα πιο δύσκολο παράδειγµα (ΙΙI)
Ένα φαινοµενικά δύσκολο παράδειγµα 0 ), ( 2 1 4 = p 0 ), ( 2 1 5 = p 0 ),,, ( 5 4 3 1 1 = p 0 ),,, ( 5 4 3 1 2 = p thrombin ligand PDB code: 1DWD 0 ),,, ( 5 4 3 2 3 = p
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
Επεκτάσεις σε αλγοριθµικό επίπεδο
Βραχυπρόθεσµο σενάριο χρήσης: γεωµετρικό φίλτρο 1) Με την αλγεβρική µέθοδο σκιαγραφούµε τον γεωµετρικό τόπο των σηµείων που ικανοποιούν τους περιορισµούς 2) Με clustering βρίσκουµε µερικές διακριτές οµάδες λύσεων 3) Χρησιµοποιούµε έναν αντιπρόσωπο από κάθε οµάδα σαν σηµείο εκκίνησης για µια ρουτίνα ελαχιστοποίησης ενέργειας 4) Ταξινόµηση των λύσεων βάσει της ενέργειας
Μακροπρόθεσµο σενάριο χρήσης: µείωση διάστασης Οι γεωµετρικοί περιορισµοί «χαµηλώνουν» τη διάσταση του χώρου στον οποίο επιδιώκουµε ελαχιστοποίηση της ενέργειας. Μπορούµε να κάνουµε αναζήτηση σε χώρο µικρότερης διάστασης και να χρησιµοποιούµε τη µέθοδο επίλυσης των γεωµετρικών περιορισµών για να «σκαρφαλώνουµε» στη διάσταση του αρχικού προβλήµατος, όπου και αποτιµούµε την ενέργεια του συστήµατος.
Αναλυτικός υπολογισµός ακραίων αποστάσεων i d : = τοπικό ακρότατο θ i Hessian θετικά (αρνητικά) ορισµένος ελάχιστο (µέγιστο) 0
Σύνοψη Αναλυτική µοντελοποίηση των γεωµετρικών περιορισµών µε τη µορφή πολυωνυµικών εξισώσεων Επιστράτευση µεθόδων από την υπολογιστική άλγεβρα και την αριθµητική ανάλυση Πληρότητα στην κάλυψη του χώρου των λύσεων Μακροπρόθεσµο όφελος: η απεµπλοκή της γεωµετρίας από την ενέργεια στους µοριακούς υπολογισµούς Περιορισµός: η υπολογιστική πολυπλοκότητα
Εργαλεία λογισµικού Μοντελοποίηση: MAPLE (version 9) Επίλυση: C standalone solver + MAPLE Γραµµική Άλγεβρα: LAPACK library (Fortran + C) Οπτικοποίηση: Rasmol, Pymol
Περιεχόµενα Εισαγωγή Αλγόριθµος µοντελοποίησης Αλγόριθµος επίλυσης Παραδείγµατα εφαρµογής Θέµατα προς διερεύνηση
back Αναζήτηση βάσει φαρµακοφόρου
Μείωση διάστασης στο docking back Έστω µόριο µε 3 βαθµούς ελευθερίας. Αν έχω 2 γεωµετρικούς περιορισµούς, ο γεωµετρικός τόπος των λύσεων είναι τµήµατα καµπυλών. Έστω αλγόριθµος docking που θεωρεί σηµαντική την ικανοποίηση των περιορισµών. Αν ο αλγόριθµος ξέρει εκ των προτέρων τον τόπο των λύσεων του γεωµετρικού προβλήµατος, µπορεί να «ψάχνει» το ενεργειακό ελάχιστο πάνω σε µια 1D καµπύλη, αντί σε ολόκληρο των 3D χώρο.