ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΦΑΡΜΑΚΕΥΤΙΚΗΣ ΤΟΜΕΑΣ ΦΑΡΜΑΚΕΥΤΙΚΗΣ ΧΗΜΕΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ «ΦΑΡΜΑΚΕΥΤΙΚΗ ΑΝΑΛΥΣΗ- ΕΛΕΓΧΟΣ ΠΟΙΟΤΗΤΑΣ» ΒΙΟΜΙΜΗΤΙΚΗ ΧΡΩΜΑΤΟΓΡΑΦΙΑ ΕΦΑΡΜΟΓΗ ΧΗΜΕΙΟΜΕΤΡΙΚΩΝ ΜΕΘΟΔΩΝ ΣΤΗΝ ΑΝΑΛΥΣΗ ΧΡΩΜΑΤΟΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΘΕΟΔΟΣΙΑ ΒΑΛΛΙΑΝΑΤΟΥ ΦΑΡΜΑΚΟΠΟΙΟΣ ΑΘΗΝΑ 2013
NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF PHARMACY DEPARTMENT OF PHARMACEUTICAL CHEMISTRY MASTER OF SPECIALIZATION PROGRAM «PHARMACEUTICAL ANALYSIS- QUALITY CONTROL» BIOMIMETIC CHROMATOGRAPHY APPLICATION OF CHEMOMETRICS ON ANALYSIS OF CHROMATOGRAPHIC DATA THEODOSIA VALLIANATOU PHARMACIST ATHENS 2013 ii
Η έγκριση διατριβής ειδίκευσης από το Φαρμακευτικό Τμήμα του Πανεπιστημίου Αθηνών, δεν υποδηλώνει αποδοχή των γνωμών του συγγραφέα (Ν.5343/1932, αρθρ.202) iii
ΤΡΙΜΕΛΗΣ ΕΠΙΤΡΟΠΗ ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ ΕΙΔΙΚΕΥΣΗΣ: ΑΝΝΑ ΤΣΑΝΤΙΛΗ-ΚΑΚΟΥΛΙΔΟΥ, ΚΑΘΗΓΗΤΡΙΑ Ε.Κ.Π.Α. (ΕΠΙΒΛΕΠΟΥΣΑ) ΕΜΜΑΝΟΥΗΛ ΜΙΚΡΟΣ, ΚΑΘΗΓΗΤΗΣ Ε.Κ.Π.Α ΕΥΑΓΓΕΛΟΣ ΓΚΙΚΑΣ, ΕΠΙΚΟΥΡΟΣ ΚΑΘΗΓΗΤΗΣ Ε.Κ.Π.Α. iv
ΑΡΙΘΜΟΣ ΜΗΤΡΩΟΥ ΣΥΓΓΡΑΦΕΑ: 110106 v
ΠΡΟΛΟΓΟΣ Η παρούσα διατριβή πραγματοποιήθηκε στο εργαστήριο Φαρμακευτικής Ανάλυσης του Τομέα Φαρμακευτικής Χημείας του Τμήματος Φαρμακευτικής, ΕΚΠΑ. Θα ήθελα να ευχαριστήσω θερμά την επιβλέπουσα Καθηγήτρια κα Άννα Τσαντίλη- Κακουλίδου για την ανάθεση του θέματος, την καθοδήγηση και την εμπιστοσύνη την οποία μου έδειξε. Η κα Τσαντίλη- Κακουλίδου αποτελεί για μένα πρότυπο τόσο για το ήθος της όσο και για την επιστημονική της κατάρτιση. Ευχαριστώ θερμά τον Καθηγητή κ Εμμανουήλ Μικρό και τον Επίκουρο Καθηγητή κ Ευάγγελο Γκίκα για τις πολύτιμες παρατηρήσεις τους τόσο σχετικά με την εκπόνηση της παρούσας εργασίας όσο και καθόλη τη διάρκεια των μεταπτυχιακών μου σπουδών. Θα ήθελα, επίσης, να ευχαριστήσω όλα τα μέλη ΔΕΠ του μεταπτυχιακού προγράμματος «Φαρμακευτική Ανάλυση- Έλεγχος Ποιότητας» και ιδιαίτερα τον Καθηγητή κ Μιχαήλ Κουππάρη, καθώς και τα μέλη του εργαστηρίου Φαρμακευτικής Ανάλυσης, και ιδιαίτερα την Αναπληρώτρια Καθηγήτρια κ Ειρήνη Παντερή και την κ Αλεξάνδρα Φωτιάδου. Τέλος, ευχαριστώ την υποψήφια διδάκτωρα Νατάσσα Πίππα για τις πολύτιμες συμβουλές της και τη συμπαράσταση. vi
ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ 1 SUMMARY 2 ΚΕΦΑΛΑΙΟ Ι ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ: ΕΦΑΡΜΟΓΗ ΧΗΜΕΙΟΜΕΤΡΙΚΩΝ ΜΕΘΟΔΩΝ ΣΤΙΣ ΦΑΡΜΑΚΕΥΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ 1. ΕΙΣΑΓΩΓΗ 3 1.1. Η έννοια του μοντέλου 4 2. ΠΟΣΟΤΙΚΕΣ ΣΧΕΣΕΙΣ ΔΟΜΗΣ- ΔΡΑΣΗΣ 5 2.1. Εισαγωγή 5 2.2. Ιστορική Αναδρομή 7 2.3. Διαδικασία ανάπτυξης μοντέλων QSAR 8 2.4. Περιγραφικές μεταβλητές 9 Φυσικοχημικές και μοριακές παράμετροι Συντακτικές /Τοπολογικές και Ηλεκτροτοπολογικές παράμετροι 3 D παράμετροι 2.5. Στατιστικές Μέθοδοι ανάλυσης δεδομένων 16 2.6. Επιλογή μεταβλητών 25 2.7. Επικύρωση των μοντέλων 27 2.8. Πεδίο Εφαρμογής (Applicability Domain) των μοντέλων QSAR 32 3. ΠΟΣΟΤΙΚΕΣ ΣΧΕΣΕΙΣ ΔΟΜΗΣ-ΣΥΓΚΡΑΤΗΣΗΣ 37 3.1. Εισαγωγή 37 3.2. Μεταβλητές απόκρισης στις μελέτες QSRR 39 3.3. Περιγραφικές μεταβλητές 40 3.4. Στατιστικά εργαλεία 41 3.5. Μελέτες QSRR για την εκτίμηση της λιποφιλίας 42 vii
3.6. QSRR και Βιομιμητική Χρωματογραφία 43 Χρωματογραφία Ακινητοποιημένων Τεχνητών Μεμβρανών Χρωματογραφία Συγγένειας Υψηλής Απόδοσης ΣΚΟΠΟΣ ΤΗΣ ΕΡΓΑΣΙΑΣ 56 ΚΕΦΑΛΑΙΟ ΙΙ ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ Α :ΧΡΩΜΑΤΟΓΡΑΦΙΚΗ ΑΝΑΛΥΣΗ ΑΝΤΑΓΩΝΙΣΤΩΝ ΥΠΟΔΟΧΕΩΝ ΑΓΓΕΙΟΤΑΣΙΝΗΣ ΙΙ ΥΠΟΤΥΠΟΥ 1 1. ΕΙΣΑΓΩΓΗ 57 1.1. Υπό μελέτη ενώσεις 57 1.2. Βιβλιογραφικά δεδομένα 58 2. ΑΝΤΙΔΡΑΣΤΗΡΙΑ, ΟΡΓΑΝΟΛΟΓΙΑ, ΧΡΩΜΑΤΟΓΡΑΦΙΚΕΣ ΣΥΝΘΗΚΕΣ 65 3. ΑΠΟΤΕΛΕΣΜΑΤΑ- ΣΥΖΗΤΗΣΗ 70 3.1. Χρωματογραφική στήλη ΙΑΜ 70 Α) Συγκράτηση σε ph=7.4 70 Β) Συγκράτηση σε ph=5.5 73 Γ) Συγκράτηση σε ph=3. 76 Δ) Συγκράτηση σε ph = 2.5 79 Ε) Διερεύνηση logk w /logd-ph προφίλ. Σύγκριση συγκράτησης στη στήλη IAM με την κατανομή στο σύστημα οκτανόλη-νερό. 81 3.2. Χρωματογραφική στήλη HSA 84 3.3. Χρωματογραφική στήλη AGP 88 3.4. Σύγκριση της συγκράτησης στις τρεις χρωματογραφικές στήλες σε ph=7.4 93 Συμπεράσματα 95 ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΕΙΡΑΜΑΤΙΚΟ ΜΈΡΟΣ Β : ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΧΡΩΜΑΤΟΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 1. ΥΛΙΚΑ ΚΑΙ ΜΕΘΟΔΟΙ 96 viii
1.1. Ομάδα υπό μελέτη ενώσεων 96 1.2. Πειραματικά δεδομένα 100 1.3. Περιγραφικές μεταβλητές 101 1.4. Στατιστικές μέθοδοι 101 2. ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΥΦΙΣΤΑΜΕΝΩΝ ΜΟΝΤΕΛΩΝ 102 2.1. Αποτελέσματα Στατιστικής Επεξεργασίας με τη Χρήση Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης 102 Ι. Χρωματογραφία τεχνητών Ακινητοποιημένων Μεμβρανών 102 ΙΙ. Χρωματογραφία Ανθρώπινης Αλβουμίνης του Ορού 125 ΙΙΙ. Χρωματογραφία α1-όξινης Γλυκοπρωτεΐνης 132 2.2. Αποτελέσματα Στατιστικής Επεξεργασίας με τη Χρήση Πολυμεταβλητής Ανάλυσης Δεδομένων 138 Ι. Συγκράτηση στη Χρωματογραφική Στήλη Ακινητοποιημένων Τεχνητών Μεμβρανών 138 Α) Εφαρμογή Ανάλυσης Κυρίων Συνιστωσών (PCA) 138 Β) Εφαρμογή της Μεθόδου Μερικών Ελαχίστων Τετραγώνων (PLS) για την ανάπτυξη μοντέλων πρόβλεψης χρωματογραφικής συγκράτησης. 141 ΙΙ. Συγκράτηση στη Χρωματογραφική Στήλη Ανθρώπινης Αλβουμίνης του Ορού 165 ΙΙΙ. Συγκράτηση στη Χρωματογραφική Στήλη α1 Όξινης Γλυκοπρωτεΐνης 170 IV. Ανάλυση Κυρίων Συνιστωσών για το σύνολο των χρωματογραφικών δεδομένων 178 Συμπεράσματα 179 ix
Βιβλιογραφία 182 ΠΑΡΑΡΤΗΜΑ 203 x
ΠΕΡΙΛΗΨΗ Η παρούσα εργασία διακρίνεται σε δύο μέρη. Στο πρώτο μέρος μελετάται η χρωματογραφική συγκράτηση πέντε ενώσεων, οι οποίες ανήκουν στη φαρμακολογική κατηγορία των Ανταγωνιστών Υποδοχέων Αγγειοτασίνης ΙΙ Υποτύπου 1, σε τρεις βιομιμητικές στήλες (ΙΑΜ.PC.DD2, HSA, AGP). Οι ενώσεις αποτελούνται από δύο αμφολύτες, δύο ενώσεις οι οποίες φέρουν δύο όξινα και ένα βασικό κέντρο και μία ένωση που φέρει δύο όξινες ομάδες. Η ανάλυση των ενώσεων στη στήλη ΙΑΜ πραγματοποιείται σε τιμές ph 7.4, 5.5, 3.0 και 2.5, ενώ στις στήλες HSA και AGP σε ph 7.4. Προσδιορίζονται ισοκρατικές τιμές του παράγοντα χωρητικότητας logk σε διαφορετικά ποσοστά οργανικού τροποποιητή στην κινητή φάση και ανάγονται σε τιμές logk w που αντιστοιχούν σε 100% υδατική φάση. Όσον αφορά στη στήλη ΙΑΜ, κατασκευάζεται το προφίλ logk w / ph για κάθε ένωση και συγκρίνεται με το αντίστοιχο προφιλ της κατανομής στο σύστημα οκτανόλη-νερό. Επιπλέον, συγκρίνεται η χρωματογραφική συμπεριφορά των ενώσεων μεταξύ των τριών στηλών και ερμηνεύεται βάσει των φυσικοχημικών τους χαρακτηριστικών. Το δεύτερο μέρος αφορά στη χημειομετρική ανάλυση χρωματογραφικών δεδομένων και την επικαιροποίηση και αξιολόγηση μοντέλων QSRR, χρησιμοποιώντας δεδομένα τα οποία έχουν προσδιοριστεί σε διαφορετικό χρόνο και τα πειραματικά δεδομένα της παρούσας εργασίας. Με τη χημειομετρική ανάλυση των χρωματογραφικών δεδομένων επιχειρείται η διερεύνηση των παραγόντων οι οποίοι επηρεάζουν τη χρωματογραφική συγκράτηση των ενώσεων σε κάθε στήλη (ΙΑΜ, HSA, AGP). Διαπιστώνεται ότι η λιποφιλία, οι ηλεκτροστατικές αλληλεπιδράσεις η πολικότητα των ενώσεων και η δυνατότητα συμμετοχής σε δεσμούς υδρογόνου διαδραματίζουν πολύ σημαντικό ρόλο στη συγκράτηση των αναλυτών. Επιπροσθέτως, εντοπίζονται οι διαφοροποιήσεις στην επίδραση των παραγόντων αυτών στη συγκράτηση μεταξύ των τριών στηλών. Η επικαιροποίηση και αξιολόγηση των μοντέλων στοχεύει στη διερεύνηση του πεδίου εφαρμογής τους και στην εκτίμηση της αξιοπιστίας τους. Η καταλληλότητα των διαγνωστικών κριτηρίων τα οποία εφαρμόζονται στην επικύρωση των μοντέλων αποδεικνύεται ότι δεν είναι δεδομένη σε κάθε περίπτωση και προτείνεται η συνδυαστική χρήση τους για την επιτυχέστερη αξιολόγηση των μοντέλων. 1
SUMMARY The present study is divided in two parts. The first part concerns the investigation of the chromatographic retention of five AT1 antagonists in three biomimetic columns (ΙΑΜ.PC.DD2, HSA, AGP). The compound set includes two ampholytes, two compounds containing two acidic and one basic centers and a compound containing two acidic groups. The chromatographic investigation of the compounds in the IAM column is accomplished in ph values 7.4, 5.5, 3.0 and 2.5, while in HSA and AGP columns only ph 7.4 is used. Isocratic retention factors, measured at different organic modifier concentrations, were used to generate extrapolated logk w values, corresponding to 100% aqueous mobile phase. Regarding the IAM column, logk w / ph profile is established for each compound and compared to the corresponding octanol/ water distribution profile. More to the point, the chromatographic behavior of the compounds is compared btween the three columns and interpreted according to their physicochemical features. The second part concerns the chemometric analysis of chromatographic data and the updating and validation of previously established QSRR models with data determined at different time, as well as, with the data obtained in the present study. The investigation of the parameters influencing the chromatographic retention in each column shows that lipophilicity, electrostatic interactions and polarity/ participation in hydrogen bonding play a crucial role. Moreover, differentiations regarding the impact of these parameters in retention among the three columns are also highlighted. The updating and validation of the models aims at the investigation of their applicability domain and the assessment of their robustness. The efficacy of the statistical measures taken into account is not always guaranteed and their combined use is postulated to be a more effective approach for model evaluation. 2
ΚΕΦΑΛΑΙΟ Ι ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ ΕΦΑΡΜΟΓΗ ΧΗΜΕΙΟΜΕΤΡΙΚΩΝ ΜΕΘΟΔΩΝ ΣΤΙΣ ΦΑΡΜΑΚΕΥΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ 1. ΕΙΣΑΓΩΓΗ Η σύγχρονη φαρμακευτική έρευνα παράγει τεράστιες ποσότητες δεδομένων με ταχείς ρυθμούς στοχεύοντας στην ανάπτυξη αποτελεσματικών και ασφαλών προϊόντων. Ωστόσο, η συλλογή μεγάλου όγκου δεδομένων δε συνεπάγεται οπωσδήποτε την απόκτηση αντίστοιχης πληροφορίας ή γνώσης. Στο σημείο αυτό σημαντικό ρόλο διαδραματίζει η ανάλυση δεδομένων (data analysis), η οποία αποτελεί τη διαδικασία μετατροπής των δεδομένων σε χρήσιμη πληροφορία. Η ανάλυση δεδομένων χρησιμοποιεί στατιστικές μεθόδους για την εξαγωγή συμπερασμάτων και τη λήψη αποφάσεων (decision making), καθώς και την πρόβλεψη της συμπεριφοράς νέων παρατηρήσεων πριν ακόμη την πειραματική αξιολόγησή τους. Με την εφαρμογή μαθηματικών/ στατιστικών μεθόδων στην επεξεργασία χημικών δεδομένων ασχολείται η Χημειομετρία, η οποία αποτελεί ιδιαίτερο επιστημονικό κλάδο. Σύμφωνα με τον S. Wold, η Χημειομετρία είναι η τέχνη του να εξάγεις χημικά σχετική πληροφορία από δεδομένα τα οποία παράγονται σε χημικά πειράματα ( the art of extracting chemically relevant information from data produced in chemical experiments ) [1]. Κατά τον D.L. Massart η Χημειομετρία είναι ο επιστημονικός κλάδος ο οποίος χρησιμοποιεί μαθηματικές, στατιστικές και άλλες μεθόδους i) για να σχεδιάσει ή να επιλέξει τις βέλτιστες πορείες (διαδικασίες) μετρήσεων και πειραμάτων, και ii) να παρέχει τη μέγιστη σχετική χημική πληροφορία αναλύοντας τα χημικά δεδομένα ( disciple that uses mathematical, statistical and other methods i) to design or select optimal measurements procedures and experiments, and ii) to provide 3
maximum relevant chemical information by analyzing chemical data ) [2]. Η Χημειομετρία παρέχει εργαλεία για πολυμεταβλητή ανάλυση δεδομένων, χρησιμοποιούμενα κυρίως σε: Ποσοτικές Σχέσεις Δομής-Δράσης (Quantitative Structure-Activity Relationships), οι οποίες θα περιγραφούν διεξοδικά στο παρόν Κεφάλαιο Πολυμεταβλητή βαθμονόμηση (Multivariate Calibration) [3] Βελτιστοποίηση συνθετικών διαδικασιών Πειραματικό Σχεδιασμό (Experimental Design) και σχεδιασμό βιβλιοθηκών ενώσεων [4] Μεταβονομική [5] Πρωτεοχημειομετρία (Proteochemometrics) [6] Βιοπληροφορική 1.1. Η έννοια του μοντέλου Ένα μοντέλο επιδιώκει να απεικονίσει τις σχετικές ιδιότητες ενός αντικειμένου ή ενός συστήματος, χωρίς να αντιγράψει κάθε λεπτομέρεια. Τα μοντέλα μπορούν να θεωρηθούν ως απλοποιημένη προσομοίωση της πραγματικότητας και σχεδιάζονται με σκοπό να βοηθήσουν την περαιτέρω μελέτη. Σε αυτό το σημείο θα πρέπει να επισημανθεί ότι τα μοντέλα διαθέτουν προσεγγιστικό χαρακτήρα (σε μικρότερο ή μεγαλύτερο βαθμό). Εντούτοις, εξακολουθούν να είναι ιδιαίτερα χρήσιμα, κυρίως δε τα μαθηματικά μοντέλα [7]. Τα μαθηματικά μοντέλα μπορούν να ταξινομηθούν σε διάφορες κατηγορίες. Ανάλογα με το κατά πόσο στην τελική έκβαση του αποτελέσματος υπεισέρχεται ο παράγοντας της τυχαιότητας διακρίνονται σε ντετερμινιστικά (όταν το αποτέλεσμα καθορίζεται ακριβώς από γνωστές σχέσεις μεταξύ αντικειμένων και γεγονότων και δεν υπάρχει τυχαία διακύμανση) και στοχαστικά (όταν υπάρχει τυχαιότητα και οι μεταβλητές δεν 4
περιγράφονται από μοναδικές (unique) τιμές, αλλά από κατανομές πιθανότητας). Μία ακόμη σημαντική διάκριση των μοντέλων είναι σε γραμμικά και μη γραμμικά. Τέλος, μπορούν να διακριθούν σε δυναμικά και στατικά, ανάλογα με το αν λαμβάνουν υπόψη τις αλλαγές τις οποίες υφίσταται το υπό μελέτη σύστημα με το χρόνο ή όχι, αντίστοιχα. Σχήμα Ι.1. Το έργο του καλλιτέχη René Magritte (1928) αποδίδει την έννοια του μοντέλου. Με τη φράση Ceci n est pas une pipe (Αυτό δεν είναι μία πίπα) διασαφηνίζεται ότι δεν πρόκειται για το ίδιο το αντικείμενο αλλά για τη δισδιάστατη απεικόνισή του. 2. ΠΟΣΟΤΙΚΕΣ ΣΧΕΣΕΙΣ ΔΟΜΗΣ ΔΡΑΣΗΣ QUANTITATIVE STRUCTURE ACTIVITY RELATIONSHIPS (QSAR) 2.1. Εισαγωγή Ο σχεδιασμός μορίων τα οποία αλληλεπιδρούν εκλεκτικά με ένα μακρομόριο του οργανισμού, η πρόβλεψη της ικανότητας σύνδεσής τους με τους υποδοχείς, της ικανότητάς τους να διαπερνούν τους βιολογικούς φραγμούς και άλλων φαρμακοκινητικών παραμέτρων καθώς και ο καθορισμός της ενδεχόμενης τοξικότητάς τους είναι κύρια ζητήματα στο πεδίο ανάπτυξης φαρμάκων. Οι Ποσοτικές Σχέσεις Δομής-Δράσης (QSAR) χρησιμοποιούνται για την επίτευξη των παραπάνω επιδιώξεων [8-10]. Στις μελέτες QSAR η βιολογική απόκριση μίας σειράς 5
ενώσεων εκφράζεται με τα συνήθη βιολογικά μεγέθη (IC 50, ED 50, LD 50 ) τα οποία αφορούν σε μοριακές συγκεντρώσεις και έχουν μετατραπεί στον αρνητικό δεκαδικό λογάριθμο (pic 50, ped 50, pld 50 ), ώστε να βρίσκονται σε γραμμική σχέση με την ελεύθερη ενέργεια. Βασική προϋπόθεση είναι οι ενώσεις να δρουν στον ίδιο υποδοχέα με τον ίδιο μηχανισμό. Ο περιορισμός αυτός οδηγεί σε και σε περιορισμό της χημειοποικιλότητας και συνήθως οι μελέτες αφορούν σε ενώσεις οι οποίες διαθέτουν ανάλογα δομικά χαρακτηριστικά [11-13]. Παράλληλα, οι ενώσεις περιγράφονται μέσω φυσικοχημικών, μοριακών ή συντακτικών παραμέτρων οι οποίες αποτελούν τη δεξαμενή των περιγραφικών μεταβλητών. Οι περιγραφικές μεταβλητές συνδέονται με τη βιολογική δράση εφαρμόζοντας κατάλληλες στατιστικές μεθόδους ανάλυσης δεδομένων. Μέθοδοι παλινδρόμησης, όπως η Πολλαπλή Γραμμική Ανάλυση Παλινδρόμησης (Multiple Linear Regression Analysis) και η Μέθοδος Μερικών Ελαχίστων Τετραγώνων (Partial Least Squares Analysis) μπορούν να εφαρμοστούν για το σκοπό αυτό. Μη γραμμικές μέθοδοι εφαρμόζονται, επίσης, όπως τα Νευρωνικά Δίκτυα (Neural Networks) και οι Μηχανές Διανυσμάτων Στήριξης (Support Vector Machines) (βλ. παρακάτω). Αν η διαδικασία είναι επιτυχής, οδηγεί στην εξαγωγή ενός μοντέλου το οποίο στη συνέχεια πρέπει να αξιολογηθεί και να επικυρωθεί ώστε να χρησιμοποιηθεί για τη διερεύνηση του μηχανισμού της βιολογικής απόκρισης και για την πρόβλεψη νέων δομών με βελτιωμένες ιδιότητες. Υποσύνολο των Ποσοτικών Σχέσεων Δομής-Δράσης αποτελούν οι Ποσοτικές Σχέσεις Δομής-Ιδιοτήτων (Quantitative Structure- Property Relationships, QSPR). Στις μελέτες QSPR η απόκριση μπορεί να είναι σχεδόν οποιαδήποτε ιδιότητα αφορά στη συμπεριφορά των μορίων (λιποφιλία, χρωματογραφική συγκράτηση, απορρόφηση κλπ) και συνήθως δεν είναι απαραίτητη η δομική συγγένεια των ενώσεων, ενώ η διαδικασία ανάπτυξης μοντέλων και στις δύο περιπτώσεις παραμένει 6
η ίδια. Πολύ σημαντική θέση στη φαρμακευτική έρευνα κατέχουν οι μελέτες QSPR οι οποίες αφορούν στη φαρμακοκινητική συμπεριφορά των βιοδραστικών ενώσεων. Στις μελέτες αυτές διερευνάται κυρίως η επίδραση της δομής των ενώσεων στις ιδιότητες ADME (Absorption, Distribution, Metabolism, Elimination), οι οποίες καθορίζουν την «τύχη» του φαρμάκου μέσα στον οργανισμό [14-18]. Υποσύνολο των Ποσοτικών Σχέσεων Δομής- Δράσης αποτελούν, επίσης, οι Ποσοτικές Σχέσεις Δομής- Συγκράτησης (Quantitative Structure- Retention Relationships, QSRR), οι οποίες θα αναλυθούν εκτενέστερα σε επόμενη ενότητα. 2.2. Ιστορική αναδρομή Στις αρχές του εικοστού αιώνα, οι Meyer και Overton παρατήρησαν ότι οι κατασταλτικές ιδιότητες των αναισθητικών αερίων και των οργανικών διαλυτών σχετίζονταν με τη διαλυτότητα των παραγόντων αυτών στο ελαιόλαδο. Στη συνέχεια, αποκαλύφθηκε ότι τα αναισθητικά δρουν αφού διαλυθούν στην κυτταρική μεμβράνη των νευρικών κυττάρων και διαταράξουν τη σηματοδοτική δραστηριότητα των κυττάρων [19, 20]. Μελέτες έδειξαν επίσης, ότι οι κατασταλτικές ιδιότητες των αναισθητικών σχετίζονταν καλύτερα με τη διαλυτότητά τους στην οκτανόλη συγκριτικά με το ελαιόλαδο. Οι μελέτες αυτές αποτέλεσαν την πρώτη προσπάθεια συσχέτισης της δράσης με τη δομή. Το επόμενο σημαντικό βήμα ήταν η εισαγωγή των ηλεκτρονιακών σταθερών Hammet κατά το 1930, οι οποίες εκφράζουν ποσοτικά την επίδραση η οποία ασκείται από τους υποκαταστάτες στο ρυθμό των χημικών αντιδράσεων των οργανικών μορίων [21-23], οδηγώντας στις πρώτες Γραμμικές Σχέσεις Ελεύθερης Ενέργειας (Linear Free Energy Relationships, LFER) και ανοίγοντας το δρόμο για τις Ποσοτικές σχέσεις Δομής- Δράσης οι οποίες αναπτύχθηκαν αργότερα από τους Hansch και Fujita. Η πρώτη μελέτη η οποία εγκαινίασε το νέο αυτό ερευνητικό πεδίο 7
δημοσιεύτηκε το 1964 [24]. Σύμφωνα με τους Hansch και Fujita η βιολογική δράση είναι συνάρτηση τριών κατηγοριών ιδιοτήτων: της λιποφιλίας, ηλεκτρονιακών και στερικών ιδιοτήτων (Εξίσωση Ι.1): logbr= -aπ 2 +bπ +ρσ + δεs +c (Ι.1) (BR: Βιολογική απόκριση, π: υδρόφοβος σταθερά, σ: ηλεκτρονιακή σταθερά, Εs: στερική παράμετρος, a, b, ρ, δ, c: συντελεστές που προκύπτουν με γραμμική ανάλυση παλινδρόμησης). Στη διάρκεια των 50 χρόνων που μεσολάβησαν, ο τομέας του QSAR έχει γνωρίσει εκρηκτική ανάπτυξη τόσο όσον αφορά στον υπολογισμό τεράστιου αριθμού περιγραφικών μεταβλητών, όσο και στις στατιστικές μεθόδους. Η επιτυχής πρόβλεψη της δράσης από τα εξαγόμενα μοντέλα, η οποία αποτελεί την τελική επιδίωξη, παραμένει ωστόσο αβέβαιη και οι προσπάθειες σήμερα εστιάζονται στον τρόπο επικύρωσης των μοντέλων και καθορισμού του πεδίου εφαρμογής τους. 2.3. Διαδικασία ανάπτυξης μοντέλων QSAR Εφόσον καθοριστεί ο στόχος μίας ανάλυσης QSAR τα βασικά βήματα τα οποία ακολουθούνται είναι τα εξής: 1. Συλλογή βιολογικών δεδομένων ως προς το συγκεκριμένο στόχο. 2. Έλεγχος αξιοπιστίας των βιολογικών δεδομένων και, ενδεχομένως, μετατροπή ή κανονικοποίησή τους. Γενικά, τα δεδομένα εκφράζονται με λογαριθμική μορφή και όσον αφορά στη βιολογική δράση με τον αρνητικό δεκαδικό λογάριθμο. Στον Πίνακα Ι.1 αναφέρονται μερικά χαρακτηριστικά μεγέθη τα οποία χρησιμοποιούνται σε QSAR και QSPR. 3. Επιλογή περιγραφικών μεταβλητών οι οποίες εκφράζουν πληροφορία σχετική με το υπό μελέτη βιολογικό φαινόμενο. Ανάλογα με το υπό μελέτη ζήτημα, οι 8
ιδιότητες αυτές μπορούν να χρησιμοποιηθούν ανεξάρτητα ή σε συνδυασμό μεταξύ τους. 4. Επιλογή της μεθόδου συσχέτισης. Οι μέθοδοι ανάλυσης δεδομένων διαφέρουν όχι μόνο στην ικανότητά τους να εξάγουν σταθερά μοντέλα με προβλεπτική ικανότητα, αλλά και ως προς τη «διαφάνειά» τους και τη δυνατότητα ερμηνείας τους. Μία μέθοδος η οποία επιτρέπει την ερμηνεία των μηχανισμών μοριακών αλληλεπιδράσεων προτιμάται από μία μέθοδο black box, εάν χαρακτηρίζονται και οι δύο από συγκρίσιμη προβλεπτική ικανότητα. 5. Ερμηνεία και επικύρωση των μοντέλων. Πίνακας Ι.1. Βιολογικές δράσεις και ιδιότητες που εξετάζονται στις μελέτες QSAR και QSPR, αντίστοιχα. QSAR K d, K i, Inh (logit) τιμές για φαρμακευτικούς στόχους, προσδιορισμένες με μεθόδους όπως, π.χ., πρόσδεση ραδιο-επισημασμένου μορίου K m, K i τιμές προσδιορισμένες με κινητικές μελέτες ενζυμικής ενεργότητας ED 50, IC 50 τιμές προσδιορισμένες σε κυτταρικές σειρές και in vivo πειράματα LD 50 τιμές προσδιορισμένες σε πειράματα οξείας τοξικότητας σε τρωκτικά και υδρόβιους οργανισμούς Δυαδικές απεικονίσεις (binary representations), π.χ. «δραστικό»/ «μη δραστικό», «μεταλλαξιογόνο»/ «μη μεταλλαξιογόνο», «τοξικό»/ «μη τοξικό» QSPR Διαλυτότητα στο νερό (logs) Συντελεστής μερισμού στο σύστημα οκτανόλης/ νερού (logp, logd) Χρωματογραφική συγκράτηση (logk, logk w ) Κλάσμα Απορρόφησης (%HOA), Όγκος Κατανομής (Vd) Διαπέραση από κυτταρικές σειρές Caco-2, MDCK (cm/min, logk) 2.4. Περιγραφικές μεταβλητές Για την εξαγωγή μοντέλων QSAR σημαντικό ρόλο διαδραματίζει η χημική περιγραφή των μορίων με τη χρήση περιγραφικών μεταβλητών. Το περιεχόμενο της πληροφορίας που κωδικοποιείται σε μία περιγραφική μεταβλητή εξαρτάται από δύο βασικούς παράγοντες: α) τον τρόπο αναπαράστασης του μορίου και β) τον αλγόριθμο ο οποίος χρησιμοποιείται για τον υπολογισμό της περιγραφικής μεταβλητής. Οι 9
μοριακές περιγραφικές μεταβλητές μπορούν να ταξινομηθούν σε ιδιότητες οι οποίες αφορούν ολόκληρο το μόριο (global properties) (π.χ. logp), καθώς και σε ιδιότητες οι οποίες αφορούν συγκεκριμένους υποκαταστάτες ή τμήματα του μορίου. Τα τελευταία χρόνια ένας μεγάλος αριθμός περιγραφικών μεταβλητών έχει εισαχθεί, ενώ νέες μεταβλητές προτείνονται κάθε χρόνο [25]. Ο στόχος αυτού του «πληθωρισμού» είναι η εύρεση μεταβλητών οι οποίες θα διαθέτουν όσο το δυνατό περισσότερη πληροφορία και θα είναι οι πιο κατάλληλες για την ανάλυση συγκεκριμένων χημικών, βιολογικών και φυσικών ιδιοτήτων. Οι περιγραφικές μεταβλητές μπορούν να ταξινομηθούν με διάφορους τρόπους. Ένας τρόπος είναι βάσει του τύπου των δεδομένων και μπορούν να διακριθούν σε δυαδικές (Boolean), ακέραιους ή πραγματικούς αριθμούς, διανύσματα κλπ. Μία άλλη διάκριση μπορεί να πραγματοποιηθεί βάσει της διάστασης οπότε και προκύπτουν μεταβλητές μηδενικής διάστασης (όπως μοριακό βάρος, αριθμός ατόμων), μίας διάστασης (όπως αριθμός θραυσμάτων/fragment counts, μοριακά αποτυπώματα/fingerprints), δισδιάστατες μεταβλητές (όπως τοπολογικοί δείκτες) και τρισδιάστατες (γεωμετρικές μεταβλητές) Επίσης, υπάρχει και μία πέμπτη κατηγορία, οι μεταβλητές τεσσάρων διαστάσεων, για τις οποίες έχουν δοθεί διάφοροι ορισμοί. Σύμφωνα με τον Todeschini, η τέταρτη διάσταση προκύπτει από τα πεδία αλληλεπίδρασης με ιχνηθέτη (βλ. Παράμετροι Περισσότερων Διαστάσεων- Τεχνικές Πλέγματος) ή μπορεί να αφορά στο χρόνο [25], ενώ άλλοι συγγραφείς θεωρούν ότι περιγράφει τις διαμορφώσεις των μορίων [26]. Τέλος, μπορούν να διακριθούν βάσει του περιεχομένου τους σε φυσικοχημικές, μοριακές, δομικές/συντακτικές, γεωμετρικές, ηλεκτρονιακές. Πολλές φυσικοχημικές μεταβλητές, όπως η λιποφιλία, η σταθερά ιονισμού (pka) και η διαλυτότητα, συχνά είναι αναγκαίο να προσδιοριστούν πειραματικά, ενώ διατίθενται περισσότερα λογισμικά για τον υπολογισμό τους. Αν και ο πειραματικός 10
προσδιορισμός προτιμάται στη μελέτη μικρών σειρών δομικά συγγενών ενώσεων, όταν πρόκειται για μεγάλο αριθμό δεδομένων ο υπολογισμός αποτελεί τη μόνη λύση, επιτρέποντας μία αρχική εκτίμηση της τάσης η οποία παρατηρείται στα δεδομένα. Ένας μεγάλος αριθμός υπολογιστικών μεθόδων και λογισμικών είναι διαθέσιμος για τον υπολογισμό πληθώρας περιγραφικών μεταβλητών, π.χ. Dragon, CODESSA, Volsurf [25, 27, 28, 29]. Φυσικοχημικές και μοριακές παράμετροι Λιποφιλία: Εκφράζεται κατά κανόνα με το συντελεστή μερισμού (logp) στο σύστημα οκτανόλης-νερού [30]. Η λιποφιλία διαδραματίζει καθοριστικό ρόλο τόσο σε φαινόμενα σύνδεσης με μεγαλομόρια, όσο και σε φαινόμενα διαπερατότητας [31, 32] (Παραβολικό μοντέλο του Hansch [33], Διγραμμικό μοντέλο του Kubinyi [34]). Έχουν προταθεί πολλά συστήματα υπολογισμού του συντελεστή μερισμού (logp), τα οποία διακρίνονται σε συστήματα άμεσου υπολογισμού (βασισμένα στον προσθετικό και συντακτικό χαρακτήρα της λιποφιλίας) και σε συστήματα έμμεσου υπολογισμού. Στην πρώτη κατηγορία ανήκουν το Σύστημα Υποκαταστατών (Substitution System), το Σύστημα Θραυσμάτων (Fragment System) και το Σύστημα ατομικών συνεισφορών (Atomic Contribution System). Τα συστήματα υπολογισμού της λιποφιλίας χρησιμοποιούνται ευρέως, παρά τους περιορισμούς τους ως προς την εκτίμηση των ισομερών θέσης, των αμφολυτών/ φορτισμένων μορίων, μορίων με πολύπλοκες δομές και την αδυναμία αποτίμησης της επίδραση διαμορφωτικών φαινομένων [35-39]. Ο υπολογισμός της λιποφιλίας, στη δεύτερη κατηγορία, είναι εφικτός με εξισώσεις Γραμμικών Σχέσεων Ελεύθερης Ενέργειας που βασίζονται σε κβαντομηχανικές και συντακτικές παραμέτρους [40] ή σε σολβατοχρωμική ανάλυση (βλ. επόμενη παράγραφο). Οι εξισώσεις αυτές με τις παραμέτρους που περιλαμβάνουν 11
υποστηρίζουν τη σύνθετη φύση της λιποφιλίας, η οποία αποτελεί τη συνισταμένη περισσότερων φαινομένων: Λιποφιλία= Υδροφοβία Πολικότητα ±Διαμορφωτικά φαινόμενα Άλλες φυσικοχημικές/μοριακές ιδιότητες οι οποίες περιλαμβάνονται σε μελέτες QSAR είναι: Μοριακό βάρος, αριθμός των περιστρεφόμενων δεσμών (παράμετρος η οποία εκφράζει την ευκαμψία του μορίου), αριθμός των θέσεων δοτών και δεκτών υδρογόνου, αριθμός ιοντιζόμενων ομάδων, σταθερά ιονισμού pka, κλάσματα θετικώς και αρνητικώς φορτισμένων μοριακών μορφών σε ph 7.4, Εμβαδόν Τοπολογικής Πολικής Επιφάνειας, παράμετροι όγκου και επιφάνειας. Οι τελευταίες προκύπτουν από την τρισδιάστατη δομή του μορίου (βλ. 3D Παράμετροι). Σολβατοχρωμικές παράμετροι: Σύμφωνα με την προσέγγιση του Abraham [41, 42], ένα φαινόμενο που λαμβάνει χώρα ανάμεσα σε δύο φάσεις μπορεί να περιγραφεί στη βάση 5 θεμελιωδών παραμέτρων σύμφωνα με την εξίσωση Ι.2 όπου ο όρος logsp εκφράζει το υπό μελέτη φαινόμενο: logsp = aa + bb + ss + ee + vv + c (Ι.2) Οι παράμετροι αυτές είναι οι εξής: Α, εκφράζει την οξύτητα σε δεσμούς υδρογόνου, Β, εκφράζει τη βασικότητα σε δεσμούς υδρογόνου, S, εκφράζει την πολικότητα/πολωσιμότητα, Ε, εκφράζει την πλεονάζουσα διαθλασιμότητα, συγκριτικά με αυτή του αντίστοιχου υδρογονάνθρακα και V είναι ο χαρακτηριστικός όγκος McGoyan, διαιρεμένος δια 100 ώστε να είναι στην ίδια τάξη μεγέθους με τις υπόλοιπες παραμέτρους. Οι σταθερές a, b, s, e, c, v, προκύπτουν με γραμμική ανάλυση παλινδρόμησης, και εξαρτώνται από το υπό μελέτη φαινόμενο. Οι κυριότερες εκ των παραμέτρων αυτών είναι οι Α, Β και V. Η ονομασία σολβατοχρωμικές προέκυψε από τη μέθοδο με την οποία αρχικά υπολογίστηκαν οι 12
τιμές Α και Β. Η μέθοδος αυτή στηρίχτηκε σε μετρήσεις που αφορούσαν το μέγεθος των υψιχρωμικών και βαθυχρωμικών (σολβατοχρωμικών) μετατοπίσεων στα φάσματα υπεριώδους-ορατού, ως αποτέλεσμα του σχηματισμού δεσμών-υδρογόνου έναντι πρότυπης ένωσης. Οι παράμετροι αυτές ονομάζονται, επίσης, παράμετροι γραμμικής ενέργειας επιδιαλύτωσης και οι αντίστοιχες εξισώσεις αποτελούν Γραμμικές Σχέσης Ενέργειας Επιδιαλύτωσης (Linear Solvation Energy Relationships). Οι σολβατοχρωμικές παράμετροι συνδέονται απευθείας με τις αλληλεπιδράσεις μεταξύ των αναλυτών και των δύο φάσεων. Συνεπώς, οι συντελεστές a, b, e και s είναι συμπληρωματικοί ως προς την ιδιότητα των αναλυτών, π.χ. ο συντελεστής b της βασικότητας του αναλύτη σε δεσμούς υδρογόνου αντανακλά διαφορές ως προς την οξύτητα σε δεσμούς υδρογόνου μεταξύ των δύο φάσεων, ενώ το αντίστροφο ισχύει για το συντελεστή a. Ο συντελεστής s εκφράζει διαφορές ως προς την πολικότητα/ πολωσιμότητα μεταξύ των δύο φάσεων, ενώ ο συντελεστής e περιγράφει την τάση των δύο φάσεων να αλληλεπιδρούν με τα n- και p- ηλεκτρόνια του αναλύτη. Οι παράμετροι A, B, S και Ε έχουν ενθαλπικό περιεχόμενο, ενώ η παράμετρος V είναι ενδοεργικός όρος και εκφράζει την τάση των μορίων του αναλύτη να σχηματίζουν κοιλότητες, η οποία είναι εντονότερη για τις οργανικές φάσεις. Στο σημείο αυτό θα πρέπει να αναφερθεί ότι οι σολβατοχρωμικές παράμετροι έχουν προκύψει από τη μελέτη ουδέτερων ενώσεων. Έχει προταθεί, συνεπώς, η επέκταση της μεθοδολογίας LSER με εισαγωγή διορθωτικών παραγόντων για τον ιονισμό των ενώσεων, π.χ. παράμετρος δ [43], κλάσμα κατιονικής μορφής (F+), κλάσμα ανιονικής μορφής (F-). Η σολβατοχρωμική προσέγγιση βρίσκει εφαρμογή στη διάλυση, την κατανομή, τη χρωματογραφική συγκράτηση, αλλά και σε περιγραφή φαινομένων μεταφοράς και 13
αλλαγής φάσεως, στα οποία μπορεί να θεωρηθεί ότι ανήκει η διαδικασία πρόσδεσης στον υποδοχέα. Συντακτικές /Τοπολογικές και Ηλεκτροτοπολογικές παράμετροι Με τον όρο συντακτικές παράμετροι εννοείται η παρουσία δομικών χαρακτηριστικών όπως στην περίπτωση των υπό μελέτη ενώσεων ο αριθμός ατόμων άνθρακα, ο αριθμός συγκεκριμένων ετεροατόμων (S, N, O) καθώς και βαρέων ατόμων, ο αριθμός δακτυλίων και η παρουσία διπλού δεσμού άνθρακα-άνθρακα, σε ετεροκυκλικούς δακτυλίους κλπ. Τοπολογικές και Ηλεκτροτοπολογικές παράμετροι: Έχουν προταθεί αρχικά από τον Randic και αναπτύχθηκαν περαιτέρω από τους Kier και Hall και τον Balaban [44-46] και περιλαμβάνουν : Δείκτες συνδετικότητας χ, (connectivity index) και σχήματος κ (shape index) που αφορούν σε ολόκληρο το μόριο και δείκτες ηλεκτροτοπολογικής καταστάσεως δείκτες (E-state) που εστιάζουν σε συγκεκριμένα άτομα στο μόριο, λαμβάνοντας παράλληλα υπ όψη το δομικό περιβάλλον. Για τον υπολογισμό των δεικτών λαμβάνεται υπ όψη ο σκελετός του μορίου χωρίς τα υδρογόνα. Κάθε άτομο χαρακτηρίζεται με ένα αριθμό που προκύπτει ανάλογα με τα άτομα (υδρογόνα και βαριά άτομα) με τα οποία είναι συνδεδεμένο. Ακολούθως καθορίζονται τα μονοπάτια από τα οποία αποτελείται το μόριο και λαμβάνοντας υπόψη διαφορετικό αριθμό ατόμων που καθορίζει την τάξη του δείκτη. Π.χ Μονοπάτι δυο ατόμων τη φορά οδηγεί σε δείκτη πρώτης τάξης σύμφωνα με το τύπο: 1χ = Σ( δi +δj) -1/2. Μονοπάτι τριών ατόμων οδηγεί σε δείκτη δεύτερης τάξης σύμφωνα με το τύπο: 2χ = Σ( δi +δj+δk) -1/2, όπου δ είναι οι αριθμοί που καθορίζουν κάθε άτομο και οι δείκτες i, j, k ορίζουν τα άτομα των μονοπατιών. 14
Επίσης λαμβάνονται υπόψη διακλαδώσεις στο μόριο ή συνδυασμός μονοπατιών και διακλαδώσεων. Η τάξη του δείκτη εμφανίζεται ως εκθέτης αριστερά στο σύμβολο χ και δεξιά ως δείκτης εμφανίζονται τα ιδιαίτερα χαρακτηριστικά Εάν τα άτομα διακρίνονται σε άνθρακες και ετεροάτομα λαμβάνοντας υπόψη τα ηλεκτρόνια σθένους προκύπτουν οι αντίστοιχοι δείκτες σθένους που διακρίνονται με τον εκθέτη v (valence) δεξιά του χ, π.χ 1 χ v p είναι δείκτης σθένους, μονοπατιού, πρώτης τάξης. Θεωρούνται επίσης δείκτες μηδενικής τάξης όπου αντί για το άθροισμα των μονοπατιών αθροίζονται οι αριθμοί που αντιστοιχούν στα μεμονωμένα άτομα. Οι ηλεκτροτοπολογικοί δείκτες S εστιάζονται στο κάθε άτομο και λαμβάνουν υπ όψη τα ηλεκτρόνια σθένους και το γεωμετρικό δομικό περιβάλλον γύρω από το άτομο [47]. Για την εξαγωγή των δεικτών ηλεκτροτοπολογικής κατάστασης λαμβάνεται, επίσης, υπ όψη ο σκελετός του μορίου χωρίς τα υδρογόνα και σε κάθε άτομο αντιστοιχεί μία ενδογενής τιμή Ι= (δ ν +1)/δ, όπου δ ν και δ ο αριθμός των ηλεκτρονίων σθένους και των σ- ηλεκτρονίων, αφαιρώντας αυτά τα οποία συνδέονται με υδρογόνα, αντίστοιχα. Κάθε ζεύγος ατόμων i j ορίζει ένα διαμέρισμα της διάστασης r το οποίο αντιστοιχεί στον αριθμό των ατόμων σε ένα συνεχόμενο μονοπάτι που αρχίζει με το άτομο i και ολοκληρώνεται με το άτομο j. Η επίδραση του δομικού περιβάλλοντος στην ενδογενή τιμή Ι ενός ατόμου i μπορεί να θεωρηθεί ως το άθροισμα των αλληλεπιδράσεων όλων των ζευγών ατόμων i j. Η αλληλεπίδραση αυτή θεωρείται μία συνάρτηση της διαφοράς των ενδογενών τιμών I i και I j και η επιρροή της είναι μικρότερη για άτομα τα οποία απέχουν πολύ μεταξύ τους καθώς μειώνεται με την αύξηση του διαχωρισμού στο γράφο (r 2 ij). Η συνολική επίδραση δίνεται από τον τύπο: ΔΙ= Σ(Ι i Ι j )/ r 2 ij. Η ηλεκτροτοπολογική κατάσταση S ενός ατόμου αποτελεί εκτιμήτρια αυτής της επίδρασης στην τιμή Ι και δίνεται από τη σχέση: S= Ι + ΔΙ. 15
3 D παράμετροι Παράμετροι οι οποίες υπολογίζονται βάσει της τρισδιάστατης δομής των μορίων και προϋποθέτουν την εύρεση της δομής ελάχιστης ενέργειας είναι η διπολική ροπή, ενεργειακές παράμετροι (ενέργεια του ανώτερου κατειλημμένου τροχιακού (E HOMO ), η ενέργεια του κατώτερου μη κατειλημμένου τροχιακού (E LUMO ) καθώς η διαφορά τους (Ε GAP ), παράμετροι μοριακής επιφάνειας και μοριακού όγκου (επιφάνεια και όγκος van der Waals (WASA, WAVol), επιφάνεια και όγκος στο διαλύτη προσιτός στο διαλύτη (SASA, SAVol), Εμβαδό πολικής και μη πολικής επιφάνειας (PSA, npsa), μερικά φορτία, γωνίες, δίεδρες γωνίες και αποστάσεις δεσμών. Παράμετροι Περισσότερων Διαστάσεων- Τεχνική Πλέγματος Η τεχνική GRID βασίζεται στην υπέρθεση των τρισδιάστατων δομών των μορίων μίας σειράς ενώσεων και την τοποθέτησή τους σε ένα τρισδιάστατο πλέγμα (grid) σημείων με σκοπό τον εντοπισμό των περιοχών οι οποίες ενδείκνυνται για αλληλεπιδράσεις μεταξύ των μορίων και των βιολογικών τους στόχων [48]. Για κάθε σημείο του πλέγματος υπολογίζεται η ενέργεια αλληλεπίδρασης μεταξύ του μορίου και του περιβάλλοντός του. Ως υποθετικοί ιχνηθέτες (probes) χρησιμοποιούνται διάφορες ομάδες, π.χ. sp3 υβριδικός άνθρακας με φορτίο +1, υδρόφοβος ιχνηθέτης, καρβονυλικό οξυγόνο, αμιδικό άζωτο, νερό κλπ. Η τεχνική GRID χρησιμοποιείται στη μεθοδολογία CoMFA [49, 50] και CoMSIA [51, 52], καθώς και στον υπολογισμό ενός αριθμού περιγραφικών μεταβλητών σε διάφορα ενεργειακά επίπεδα (Volsurf [29]). 2.5. Στατιστικές Μέθοδοι ανάλυσης δεδομένων Ο στόχος ο οποίος επιδιώκεται να επιτευχθεί με την ανάλυση των δεδομένων είναι η κατανόηση της υπό μελέτης διαδικασίας με τελικό σκοπό την: 1) Πρόβλεψη της απόκρισης νέων δεδομένων, 16
2) Εξαγωγή πληροφοριών σχετικά με τον τρόπο κατά τον οποίο η διαδικασία συσχετίζει τις περιγραφικές μεταβλητές με τη μεταβλητή απόκρισης ή σχετικά με τη φύση των περιγραφικών μεταβλητών. Οι στατιστικές μέθοδοι κατηγοριοποιούνται σε μεθόδους ταξινόμησης και μεθόδους παλινδρόμησης (regression), οι οποίες στοχεύουν στην πρόβλεψη μίας ιδιότητας. Οι μέθοδοι ταξινόμησης διακρίνονται σε μη επιβλεπόμενες (unsupervised) και επιβλεπόμενες (supervised). Στην πρώτη περίπτωση, σκοπός της ανάλυσης είναι η απεικόνιση (ή και οπτικοποίηση) των δεδομένων με σκοπό την ανίχνευση προτύπων ή την πληρέστερη κατανόησή τους. Οι μη επιβλεπόμενες μέθοδοι είναι μέθοδοι ομαδοποίησης (clustering) των δεδομένων και οι πλέον διαδομένες εξ αυτών είναι η Ανάλυση Κυρίων Συνιστωσών (Principal Component Analysis), η Ανάλυση Σμηνών (Cluster Analysis) και τα Δίκτυα Kohonen. Στη δεύτερη περίπτωση, ενδιαφέρει η εκτίμηση της συσχέτισης ανάμεσα στις περιγραφικές μεταβλητές και την (τις) μεταβλητή (μεταβλητές) απόκρισης και ο τελικός στόχος είναι η εξαγωγή ενός μοντέλου το οποίο θα μπορεί να προβλέπει την ταξινόμηση (classification) νέων παρατηρήσεων (Discriminate Analysis, PLS-DA, Decision Trees). Για την πρόβλεψη μίας ιδιότητας συχνά χρησιμοποιούμενες μέθοδοι είναι οι εξής: Πολλαπλή Γραμμική Ανάλυση Παλινδρόμησης (Multiple Linear Regression), Παλινδρόμηση Μερικών Ελαχίστων Τετραγώνων (Partial Least Squares Regression), Τεχνητά Νευρωνικά Δίκτυα (Artificial Neural Networks), Γενετικοί Αλγόριθμοι (Genetic Algorithms), Μηχανές διανυσμάτων Στήριξης (Support Vector Machines). Η βασική διαδικασία η οποία ακολουθείται κατά την εφαρμογή (ή ανάπτυξη) μίας στατιστικής μεθόδου αποτελείται κυρίως από δύο βήματα: 1) Την επιλογή των υπό μελέτη δεδομένων (data set) 17
2) Τη διαίρεση των δεδομένων σε δύο υπό-ομάδες, την ομάδα εκμάθησης (training set) και την ομάδα ελέγχου (test set). Η πρώτη ομάδα χρησιμοποιείται για την εκπαίδευση του μοντέλου, ενώ η δεύτερη για τον έλεγχο της αξιοπιστίας του. Παρακάτω παρατίθενται οι πιο διαδεδομένες μέθοδοι ανάλυσης δεδομένων στο πεδίο των φαρμακευτικών επιστημών. Πολλαπλή Γραμμική Ανάλυση Παλινδρόμησης: Η γραμμική ανάλυση παλινδρόμησης προσπαθεί να εξάγει μία γραμμική σχέση ανάμεσα στις μεταβλητές x και y. Στο χώρο δύο διαστάσεων, η σχέση αυτή μπορεί να περιγραφεί από μία ευθεία η οποία δίνεται από την εξίσωση y = ax + b, όπου a είναι η κλίση της ευθείας και b η τομή της στον y-άξονα. Οι τιμές των παραμέτρων a και b προκύπτουν έτσι ώστε η ευθεία να δίνει τη βέλτιστη πρόβλεψη του y από το x. Αυτό επιτυγχάνεται ελαχιστοποιώντας το άθροισμα των τετραγώνων των κάθετων αποστάσεων όλων των σημείων από την ευθεία και, συνεπώς, η προσέγγιση αυτή ονομάζεται μέθοδος ελαχίστων τετραγώνων (Εξ. Ι.3). Στην περίπτωση της Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης οι ανεξάρτητες μεταβλητές x είναι περισσότερες της μίας, ωστόσο η μεταβλητή y προκύπτει επίσης με τη μέθοδο ελαχίστων τετραγώνων, και η σχέση μεταξύ εξαρτημένης και ανεξάρτητων μεταβλητών δίνεται από την εξίσωση y = b + a 1 x 1 + a 2 x 2 +.+ a n x n. (Ι.3) Όπου n είναι ο αριθμός των ενώσεων, y i η πειραματική τιμή της μεταβλητής απόκρισης για την ένωση i και y pred, i η αντίστοιχη προβλεπόμενη από το μοντέλο τιμή [53]. Ένα μέτρο για την εκτίμηση του πόσο καλά τα δεδομένα προσαρμόζονται στο μοντέλο είναι ο συντελεστής R 2, ο οποίος δίνεται από την Εξίσωση Ι.4 σχέση: 18
(Ι.4) Η τιμή του R 2 κυμαίνεται από 0 μέχρι 1. Για την εφαρμογή, ωστόσο, της Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης πρέπει υποχρεωτικά να τηρούνται οι εξής συνθήκες: ο αριθμός των περιγραφικών μεταβλητών πρέπει να είναι σαφώς μικρότερος από τον αριθμό των αντικειμένων (ενώσεων) και οι περιγραφικές μεταβλητές πρέπει να μη σχετίζονται μεταξύ τους, να είναι δηλαδή ορθογώνιες- ανεξάρτητες. Αν η MLR εφαρμοστεί σε δεδομένα τα οποία εμφανίζουν συσχετιζόμενες Χ μεταβλητές (collinearity) οι υπολογισμένοι συντελεστές παλινδρόμησης καθίστανται ασταθείς και η ερμηνείας τους μπορεί να είναι παραπλανητική. Για παράδειγμα, συγκεκριμένοι συντελεστές μπορεί να λαμβάνουν σημαντικά υψηλότερες από τις αναμενόμενες τιμές ή να έχουν λάθος πρόσημο. Άλλοι περιορισμοί είναι ότι η MLR επεξεργάζεται μία μόνο απόκριση (εξαρτημένη μεταβλητή). Στην περίπτωση πολλών περιγραφικών μεταβλητών απαιτείται επιλογή των μεταβλητών χρησιμοποιώντας επιπρόσθετη στατιστική μέθοδο, όπως οι Γενετικοί Αλγόριθμοι (βλ. παρακάτω). Τα διαγνωστικά στοιχεία τα οποία συνήθως λαμβάνονται υπ όψη σε μία ανάλυση MLR συνοψίζονται στον Πίνακα Ι.2. Πίνακας Ι.2. Διαγνωστικά στοιχεία σε μία ανάλυση MLR. Διαγνωστικό στοιχείο R Περιγραφή/Σχόλια Πολλαπλός συντελεστής συσχέτισης(multiple correlation coefficient). Η γραμμική συσχέτιση μεταξύ των πειραματικών (observed) και των προβλεπόμενων από το μοντέλο τιμών της μεταβλητής απόκρισης. R 2 Το τετράγωνο της τιμής του πολλαπλού συντελεστή συσχέτισης R. Δείχνει το ποσοστό της διακύμανσης της μεταβλητής απόκρισης το 19
s R 2 adj Συντελεστής κάθε μεταβλητής Β (Unstandardized coefficient) Τυπική απόκλιση του συντελεστή Β t-test κάθε μεταβλητής F-test Υπόλοιπο (Residual) Συντελεστής συσχέτισης μεταξύ των (ανεξάρτητων) περιγραφικών μεταβλητών οποίο ερμηνεύεται από το μοντέλο. Προσαρμοσμένος συντελεστής συσχέτισης. Η «διορθωμένη» έκφραση του συντελεστή προσδιορισμού R 2, η οποία προσαρμόζεται σε μοντέλα πολλών μεταβλητών. Τυπική απόκλιση (Standard error of estimate). Μαζί με τα παραπάνω στατιστικά μεγέθη αποτελούν χρήσιμα κριτήρια για την επιλογή μεταξύ δύο ή περισσότερων μοντέλων. Ως 2s ορίζεται το όριο ανοχής σφάλματος. Θετικές τιμές υποδηλώνουν ότι η τιμή της μεταβλητής απόκρισης αυξάνει με την αύξηση της τιμής της περιγραφικής μεταβλητής, ενώ αρνητικές τιμές υποδηλώνουν, αντίστοιχα μείωση στην τιμή της μεταβλητής απόκρισης με την αύξηση της περιγραφικής μεταβλητής. Η τιμή του καθορίζεται από το t-test. Δείχνει τη σχετική σημασία κάθε μεταβλητής στο μοντέλο. Οι τιμές του πρέπει να είναι t 2 για να θεωρηθεί μια μεταβλητή σημαντική. Συνοδεύεται από την τιμή σημαντικότητας (significance value) η οποία όταν είναι μικρότερη από 0.05 υποδεικνύει ότι η διακύμανση η οποία ερμηνεύεται από το μοντέλο δεν οφείλεται σε τυχαιότητα. Καθορίζει το επίπεδο σημαντικότητας της εξίσωσης. Συνοδεύεται από την τιμή σημαντικότητας (significance value) η οποία όταν είναι μικρότερη από 0.05 υποδεικνύει ότι η διακύμανση η οποία ερμηνεύεται από το μοντέλο δεν οφείλεται σε τυχαιότητα. Η διαφορά μεταξύ της πειραματικής τιμής της μεταβλητής απόκρισης και της αντίστοιχης τιμής η οποία προβλέπεται από το μοντέλο. Όταν για μία ένωση η τιμή της διαφοράς αυτής είναι μεγαλύτερη ή ίση του διπλασίου της τιμής της τυπικής απόκλισης (2s) του μοντέλου τότε αυτή θεωρείται έκροπη τιμή. Καταρτίζεται ο σχετικός πίνακας και ορίζεται η μέγιστη αποδεκτή τιμή, συνήθως <0.8. Τα συνηθέστερα λογισμικά μέσω των οποίων πραγματοποιείται ανάλυση MLR και παρέχονται τα παραπάνω μεγέθη είναι τα SPSS, Statistica, StatMost, StatGraphics. Ανάλυση Κυρίων Συνιστωσών: Η PCA στηρίζεται στη μέθοδο των προβολών για να μειώσει ένα πολυδιάστατο χώρο σε χώρο λιγότερων διαστάσεων - λανθανουσών μεταβλητών, που καλούνται κύριες συνιστώσες [54, 55]. Με τη μέθοδο των προβολών προσαρμόζεται μια ευθεία, ένα επίπεδο, ή υπερ-επίπεδο με άξονες τις κύριες συνιστώσες. Η πρώτη κύρια συνιστώσα περιέχει τη μέγιστη διακύμανση των 20
δεδομένων. Η δεύτερη κύρια συνιστώσα είναι ορθογώνια ως προς την πρώτη και περιέχει την αμέσως επόμενη περιγραφή των δεδομένων. Οι επόμενες κύριες συνιστώσες περιγράφουν διαδοχικά όλο και μικρότερο ποσοστό των δεδομένων μέχρι τελικά οι τελευταίες κύριες συνιστώσες να περιγράφουν θόρυβο. Οι ενώσεις, συνεπώς, αποκτούν νέες συντεταγμένες t (scores) στις λανθάνουσες Κύριες Συνιστώσες και δημιουργούν ένα νέο πίνακα Τ. Επί πλέον δημιουργείται ένας πίνακας Ρ από τα φορτία p (loadings), που ορίζουν τη γωνία των Κυρών Συνιστωσών ως προς τις αρχικές μεταβλητές. Με βάση τους ανωτέρω ορισμούς το διάγραμμα των συντεταγμένων των δύο πρώτων Κυρίων Συνιστωσών που συνήθως εκφράζουν το μέγιστο της διακύμανσης (score plot) παρέχει πληροφορίες για τη σχέση των αντικειμένων (ενώσεων) μεταξύ τους, και αποτελεί χρήσιμο εργαλείο για την ταξινόμησή τους. Οι ενώσεις που σχετίζονται μεταξύ τους καταλαμβάνουν παραπλήσιες θέσεις στα διαγράμματα. Αντίστοιχα, η σχέση των μεταβλητών αντικατοπτρίζεται στα διαγράμματα των loadings. Η επιλογή των δύο πρώτων κύριων συνιστωσών, και όχι περισσότερων, για τη γραφική απεικόνιση των συντεταγμένων και των φορτίων, διευκολύνει την εποπτεία και την ερμηνεία των αποτελεσμάτων διότι τα περιορίζει στο δισδιάστατο χώρο. Υπάρχει ωστόσο και η δυνατότητα επιλογής τριών συνιστωσών ταυτόχρονα με τρισδιάστατη απεικόνιση. Ο αριθμός των απαραίτητων για το μοντέλο κύριων συνιστωσών συνήθως είναι μικρός και καθορίζεται από κριτήρια σημαντικότητας, κυρίως το συντελεστή συσχετίσεως R 2 και το διασταυρούμενο συντελεστή συσχετίσεως Q 2. Για την εξαγωγή του διασταυρούμενου Q 2 συντελεστή συσχέτισης αφαιρείται κάθε φορά ένα αντικείμενο (leave-one-out) ή μία ομάδα αντικειμένων. Η ομάδα αντικειμένων καθορίζεται διαιρώντας την αρχική σειρά δεδομένων (συνήθως δια 7) σε υπο-ομάδες. Το μοντέλο που προκύπτει προβλέπει τις αφαιρεθείσες ενώσεις και η διαδικασία 21
επαναλαμβάνεται μέχρις ότου όλες οι ενώσεις αφαιρεθούν μια φορά από την επεξεργασία. Προκύπτει το μέγεθος PRESS (prediction error sum of squares) σύμφωνα με τον τύπο: PRESS= Σ(Υ υπολ -Υ πειρ ) 2 Ακολούθως ορίζεται ο διασταυρούμενος συντελεστής συσχέτισης Q 2 σύμφωνα με τον τύπο Q 2 =(1.0- PRESS/SS), όπου SS το άθροισμα των τετραγώνων των υπολοίπων. Ενώ ωστόσο ο συνολικός συντελεστής συσχετίσεως R 2 αυξάνει συνεχώς με την αύξηση των διαστάσεων (συνιστωσών) του μοντέλου τείνοντας στην τιμή 1, ο διασταυρούμενος συντελεστής συσχετίσεως Q 2 εμφανίζει μέγιστο, πέρα από το οποίο η εισαγωγή νέων συνιστωσών αν και φαίνεται ότι αυξάνει την περιγραφική ικανότητα του μοντέλου μειώνει την προβλεπτική του ικανότητα. Παλινδρόμηση Κυρίων Συνιστωσών (Principal Component Regression, PCR): Η Παλινδρόμηση Κυρίων Συνιστωσών είναι ο συνδυασμός των μεθόδων PCA και MLR. Όπως αναφέρθηκε, σε μία ανάλυση PCA ο αριθμός κυρίων συνιστωσών είναι μικρότερος από τον αριθμό των αντικειμένων και οι κύριες συνιστώσες δεν σχετίζονται μεταξύ τους. Συνεπώς, τηρούνται οι δύο απαιτούμενες προϋποθέσεις για την εφαρμογή MLR. Με τη μέθοδο PCR αρχικά εξάγονται από τον πίνακα Χ οι κύριες συνιστώσες και ο νέος πίνακας Τ χρησιμοποιείται στη συσχέτιση με τη μεταβλητή απόκρισης (μέθοδος δύο σταδίων). Χρησιμοποιώντας τις λίγες πρώτες κύριες συνιστώσες, δηλαδή τις πιο σημαντικές, μπορεί να επιτευχθεί μείωση του θορύβου. Ωστόσο, η επιλογή του αριθμού των κύριων μεταβλητών αποτελεί το βασικότερο ζητούμενο στη μέθοδο PCR [56]. Παλινδρόμηση Μερικών Ελαχίστων Τετραγώνων (Partial Least Squares Regression, PLS): Μία αποτελεσματικότερη μέθοδος ενός σταδίου για την πραγματοποίηση πολλαπλής παλινδρόμησης είναι η μέθοδος PLS [57]. Η μέθοδος PLS μπορεί να θεωρηθεί ως η επέκταση της μεθόδου PCA η οποία στοχεύει στην 22
εγκαθίδρυση μίας σχέσης μεταξύ των πινάκων Χ και Υ. Οι μεταβλητές Χ και Υ προβάλλονται ταυτόχρονα στις νέες λανθάνουσες μεταβλητές με επιπλέον τον περιορισμό να συσχετίζονται κατά το δυνατόν οι προβολές των Χ και Υ. Συνεπώς, συγκριτικά με τη μέθοδο PCA, η μέθοδος PLS εξάγει συνιστώσες οι οποίες προβλέπεται να μεγιστοποιούν τη συνδιακύμανση (επίτευξη της καλύτερης δυνατής συσχέτισης) μεταξύ των προβολών των Χ και Υ. Συγκεκριμένα, δημιουργείται εκτός του πίνακα Τ των νέων συνταγμένων στις Κύριες Συνιστώσες του πίνακα Χ και ο πίνακας U των συντεταγμένων u στις Κύριες Συνιστώσες του πίνακα Υ. Στην περίπτωση που υπάρχει μια μόνο μεταβλητή απόκρισης Υ προφανώς οι τιμές u αντιστοιχούν στις κανονικοποιημένες τιμές της μεταβλητής απόκριση. Ισχύει Τ= 1* U + Ε όπου Ε είναι ο πίνακας των υπολοίπων Στην ανάλυση PLS υπεισέρχονται και τα βάρη w* που εκφράζουν τη συσχέτιση μεταξύ U(Y) και των αρχικών μεταβλητών Χ ώστε να προκύψουν οι συντεταγμένες t. Ως διαγνωστικά κριτήρια χρησιμοποιούνται, επίσης, τα μεγέθη R2 και Q2, καθώς και η τυπική απόκλιση RMSEE (root mean square error of estimation). Το μέγεθος αυτό εκφράζει την τετραγωνική ρίζα της μέσης τιμής των τετραγώνων των σφαλμάτων, δηλαδή των διαφορών της επιθυμητής από την εκτιμώμενη τιμή. Από την ίδια τη στατιστική μεθοδολογία προκύπτει ότι οι μεταβλητές Χ δεν είναι απαραίτητο να είναι ανεξάρτητες, περιορισμός που ισχύει στη MLR. Μία ακόμη σημαντική παράμετρος η οποία πρέπει να λαμβάνεται υπ όψη είναι η επίδραση του μεγέθους των μεταβλητών στην ανάλυση. Η κανονικοποίηση της κλίμακας των δεδομένων πραγματοποιείται έτσι ώστε να διασφαλιστεί ότι όλες οι μεταβλητές έχουν την ίδια πιθανότητα να επηρεάσουν το μοντέλο. Η πιο συνήθης μέθοδος κανονικοποίησης κλίμακας είναι αυτή κατά την οποία η διακύμανση κάθε 23
μεταβλητής τίθεται ίση με 1 (unit-variance scaling) [11]. Αυτός ο τρόπος προκατεργασίας είναι ιδιαίτερα χρήσιμος όταν οι μεταβλητές οι οποίες χρησιμοποιούνται για την εξαγωγή του μοντέλου προέρχονται από διαφορετική πηγή και εμφανίζουν σημαντικά διαφορετικό αριθμητικό εύρος. Χωρίς κανονικοποίηση κλίμακας, μεταβλητές με μεγάλο αριθμητικό εύρος θα επικρατούσαν έναντι των μεταβλητών με μικρό αριθμητικό εύρος. Το ευρύτερα χρησιμοποιούμενο πρόγραμμα για την εφαρμογή των μεθόδων PCA και PLS είναι το SIMCA. Οι μέθοδοι MLR, PCA, PLS είναι γραμμικές. Ωστόσο, είναι δυνατό να εισαχθεί μη γραμμικότητα με κατάλληλη τροποποίηση των δεδομένων πριν τη στατιστική επεξεργασία, π.χ. ανύψωση σε δύναμη, μετατροπή σε κλασματική μορφή κλπ. Τεχνητά Νευρωνικά δίκτυα (Artificial Neural Networks, ΑΝΝ): Τα Τεχνητά Νευρωνικά Δίκτυα είναι μη γραμμικές μέθοδοι εκμάθησης μηχανών και εφαρμόζονται τόσο στην παλινδρόμηση όσο και στην ταξινόμηση. Η λειτουργία των Τεχνητών Νευρωνικών Δικτύων μιμείται αυτή των βιολογικών νευρώνων. Αποτελούνται από μία ομάδα διασυνδεδεμένων νευρώνων. Τα σήματα εισόδου στο νευρώνα (input) αποκτούν βάρος β ij και το σήμα εξόδου (output) z k του νευρώνα k αποτελεί μία μη γραμμική συνάρτηση του αθροίσματος των σημάτων εισόδου, σύμφωνα με τη συνάρτηση: Όπου p είναι ο αριθμός των μεταβλητών εισόδου στο νευρώνα k και αk είνα ένα κατώφλι του νευρώνα k. k = 1,., r όπου r ο αριθμός των νευρώνων. Ως συνάρτηση g επιλέγεται συνήθως η σιγμοειδής συνάρτηση. Η επιλογή της συνάρτησης g 24
καθορίζεται από το γεγονός ότι το σήμα εξόδου του νευρώνα προσεγγίζει τυπικά την τιμή μηδέν όταν δεν υπάρχει σήμα εισόδου. Η τυπική αρχιτεκτονική ενός νευρωνικού δικτύου περιλαμβάνει τις μονάδες εισόδου, έναν αριθμό κρυμμένων στιβάδων (hidden layers) και τη στιβάδα εξόδου (output layer). Ένα δίκτυο, για παράδειγμα, δύο στιβάδων αποτελείται από τις μονάδες εισόδου, μία κρυμμένη στιβάδα και τη στιβάδα εξόδου. Όπως και οι βιολογικοί νευρώνες, τα τεχνητά νευρωνικά δίκτυα μαθαίνουν μέσω παραδειγμάτων και η διαδικασία αυτή καλείται εκπαίδευση (training). Η διαδικασία εκπαίδευσης μπορεί να είναι μη επιβλεπόμενη, οπότε και παρόμοια σημεία των δεδομένων επιδιώκεται να κατανεμηθούν στον ίδιο ή σε γειτονικούς νευρώνες (π.χ. δίκτυα Kohonen). Όταν η διαδικασία εκπαίδευσης είναι επιβλεπόμενη, το σήμα εξόδου από το δίκτυο συγκρίνεται με την πραγματική τιμή απόκρισης και προκύπτει μία τιμή σφάλματος δ. Κατόπιν, τα βάρη των νευρώνων προσαρμόζονται έτσι ώστε να μειωθεί η τιμή του σφάλματος αυτού (π.χ. counterpropagation, back -propagation) [58]. 2.6. Επιλογή μεταβλητών Η επιλογή των μεταβλητών για την εξαγωγή επιτυχών μοντέλων αποτελεί πολύ σημαντικό βήμα στην εξαγωγή επιτυχών μοντέλων. Η διαδικασία αυτή αποτελεί συχνά πρόβλημα, κυρίως στην ανάλυση MLR, ενώ έχουν προταθεί πολλές προσεγγίσεις για το σκοπό αυτό [59]. Οι αλγόριθμοι οι οποίοι συνήθως εφαρμόζονται κατά την εξαγωγή μοντέλων MLR, αν το πλήθος των μεταβλητών δεν είναι μεγάλο σύμφωνα με το λογισμικό SPSS, είναι οι εξής: Enter, Remove, Stepwise, Backward και Forward. Με τη μέθοδο Enter εισάγεται με ένα βήμα το σύνολο των περιγραφικών μεταβλητών, οι οποίες έχουν προηγουμένως υποδειχθεί, για την εξαγωγή του μοντέλου. Αντίστοιχα, με τον αλγόριθμο Remove γίνεται αφαίρεση των μεταβλητών με ένα βήμα. Με τις υπόλοιπες μεθόδους πραγματοποιείται σταδιακή 25
προσθήκη ή αφαίρεση μεταβλητών στο μοντέλο. Με τη μέθοδο Stepwise εισάγεται στην εξίσωση παλινδρόμησης η ανεξάρτητη μεταβλητή με τη χαμηλότερη πιθανότητα της F, αν αυτή είναι επαρκώς χαμηλή, ενώ μεταβλητές οι οποίες περιλαμβάνονται ήδη στο μοντέλο αφαιρούνται αν η τιμή της πιθανότητας της F γίνει αρκετά υψηλή. Η διαδικασία επαναλαμβάνεται μέχρι να μην υπάρχουν πλέον μεταβλητές κατάλληλες για εισαγωγή ή αφαίρεση από το μοντέλο. Με τον αλγόριθμο Backward εισάγεται το σύνολο των μεταβλητών στην εξίσωση και αφαιρούνται σταδιακά μεταβλητές, ανάλογα με το βαθμό μερικής συσχέτισης (partial correlation) με τη μεταβλητή απόκρισης. Τέλος, ο αλγόριθμος Forward αποτελεί Stepwise μέθοδο κατά την οποία εισάγονται σταδιακά μεταβλητές στην εξίσωση, ανάλογα με το βαθμό θετικής ή αρνητικής συσχέτισης με τη μεταβλητή απόκρισης, με τη μεταβλητή η οποία παρουσιάζει την ισχυρότερη συσχέτιση να εισάγεται πρώτη. Όταν υπάρχει μεγάλος αριθμός μεταβλητών η επιλογή γίνεται με Γενετικούς Αλγόριθμους [60, 61]. Οι Γενετικοί Αλγόριθμοι μιμούνται τις εξελικτικές στρατηγικές οι οποίες εφαρμόζονται στη φύση, βάσει της αρχής ότι ένας πληθυσμός θα αναπτυχθεί με την επικράτηση (επιβίωση) του περισσότερο κατάλληλου χαρακτηριστικού (survival of the fittest). Οι ΓΑ ανήκουν στις επιβλεπόμενες μεθόδους ανάλυσης δεδομένων και η κύρια εφαρμογή τους είναι η επιλογή των σημαντικότερων μεταβλητών x, δηλαδή αυτών οι οποίες βελτιώνουν την πρόβλεψη του y, και η απομάκρυνση των μη σημαντικών, δηλαδή αυτών οι οποίες δυσχεραίνουν την πρόβλεψη. Για την ανάπτυξη των ΓΑ δημιουργείται ο αρχικός πληθυσμός ο οποίος περιλαμβάνει έναν αριθμό τεχνητών χρωμοσωμάτων, καθένα εκ των οποίων φέρει μονάδες και μηδενικά, διατεταγμένα με τυχαίο τρόπο. Μόνο τα καλύτερα χρωμοσώματα θα διαβιβάσουν τα χαρακτηριστικά τους στην επόμενη γενιά κατά τη διάρκεια της εξελικτικής πορείας. Στην περίπτωση κατά την οποία ο ΓΑ 26
χρησιμοποιείται για την επιλογή μεταβλητών, αυτό συνεπάγεται ότι θα επιλεγούν μόνο οι μεταβλητές οι οποίες αντιστοιχούν στην τιμή 1, ενώ οι μεταβλητές οι οποίες αντιστοιχούν στην τιμή 0 θα απορριφθούν. Οι συνηθέστεροι τρόποι με τους οποίους εισάγεται ποικιλία μεταξύ των πληθυσμών προκειμένου να επιλεγεί ο βέλτιστος είναι η διασταύρωση (crossover) και η μετάλλαξη (mutation). Στη διασταύρωση, τα δύο μητρικά χρωμοσώματα κόβονται στη θέση διασταύρωσης και το αρχικό τμήμα του ενός χρωμοσώματος συνδέεται με το τελικό τμήμα του άλλου και αντιστρόφως. Κατά τη μετάλλαξη, πραγματοποιείται αλλαγή ενός ψηφίου του χρωμοσώματος. Με τις μεθόδους οι οποίες βασίζονται στις προβολές (PCA και PLS) η επιλογή των κατάλληλων παραμέτρων κατά την ανάπτυξη του μοντέλου γίνεται βάσει του παράγοντα VIP (variable influence to projection), δηλαδή την επίδραση κάθε παραμέτρου στις προβολές (Εξ. Ι.5). Τιμές VIP 1 θεωρείται γενικά ότι αντιστοιχούν σε πολύ σημαντικές περιγραφικές μεταβλητές. Οι απόλυτες τιμές των συντελεστών συνεισφοράς της κάθε παραμέτρου στο μοντέλο αποτελούν επίσης κριτήριο επιλογής. VIP= [Σ α (VIN) k / SS] 1/2 (Ι.5) Όπου α μία δεδομένη διάσταση, k η μεταβλητή, VIN η συνεισφορά της μεταβλητής (Variable Influence) και SS το άθροισμα των τετραγώνων των υπολοίπων. 2.7. Επικύρωση των μοντέλων Είναι δυνατό να κατασκευαστεί ένα μοντέλο στο οποίο μπορούν να προσαρμοστούν όλα τα αντικείμενα των δεδομένων (ε 2 =0 και R 2 =1). Ωστόσο, η εξαγωγή ενός τέτοιου «τέλειου» μοντέλου δεν είναι ο πραγματικός στόχος της στατιστικής επεξεργασίας των δεδομένων, καθώς το μοντέλο αυτό έχει εξειδικεύσει στην ομάδα εκμάθησης και πιθανότατα αδυνατεί να γενικεύσει σε νέα δεδομένα. Σε αυτή την περίπτωση, το μοντέλο είναι δυνατό να περιλαμβάνει τυχαιότητα, όπως θόρυβο και 27
σφάλματα μετρήσεων, και να μην αποδίδει τις βασικές αρχές οι οποίες διέπουν το υπό μελέτη φαινόμενο [62-66]. Το φαινόμενο αυτό καλείται υπερπροσαρμογή (overfitting). Ένα μοντέλο μπορεί, επίσης, να πάσχει από το πρόβλημα της υποπροσαρμογής (underfitting), όταν δηλαδή αδυνατεί να ερμηνεύσει το ποσοστό της διακύμανσης που θα έπρεπε. Δεδομένου ότι οι περισσότερες χημειομετρικές αναλύσεις περιλαμβάνουν μεγαλύτερο αριθμό μεταβλητών σε σύγκριση με τον αριθμό των ενώσεων, η υπερπροσαρμογή συνιστά συνήθως μεγαλύτερο πρόβλημα από την υποπροσαρμογή. Τίθεται, συνεπώς, το ζήτημα της εξισορρόπησης μεταξύ της περιγραφικής ικανότητας ενός μοντέλου και της ικανότητάς του να γενικεύει σε νέα δεδομένα, της προβλεπτικής του, δηλαδή, ικανότητας. Όπως φαίνεται στο Σχήμα Ι.2, όσο αυξάνεται η πολυπλοκότητα του μοντέλου, δηλαδή εντείνεται το φαινόμενο της υπερπροσαρμογής, το σφάλμα πρόβλεψης των ενώσεων της ομάδας εκμάθησης (συνεχής καμπύλη) μειώνεται. Αντιθέτως, το σφάλμα πρόβλεψης μίας ανεξάρτητης ομάδας ελέγχου μειώνεται μέχρι ένα σημείο και κατόπιν αυξάνεται δραματικά. Σχήμα Ι.2. Το σφάλμα πρόβλεψης της ομάδας εκμάθησης (συνεχής καμπύλη) και το σφάλμα πρόβλεψης ομάδας ελέγχου (διακεκομμένη καμπύλη) ως συνάρτηση της πολυπλοκότητας του μοντέλου. 28
Αντίστοιχη εικόνα παρουσιάζεται ανάμεσα στα μεγέθη R 2 και Q 2 : η αύξηση της πολυπλοκότητας του μοντέλου, δηλαδή η εισαγωγή μεγάλου αριθμού μεταβλητών, οδηγεί σε αύξηση της τιμής R 2, ενώ η τιμή Q 2 από ένα σημείο και έπειτα αρχίζει να μειώνεται (Σχήμα Ι.3). Σχήμα Ι.3. Η επίδραση της αύξησης των μεταβλητών/ κυρίων συνιστωσών (Α) στα μεγέθη R 2 και Q 2. Εκτός από το Q 2, το οποίο αποτελεί διαγνωστικό στοιχείο εσωτερικής επικύρωσης, επιπρόσθετες προσεγγίσεις για την αξιολόγηση των μοντέλων είναι η εξωτερική επικύρωση και η δοκιμασία τυχαιοποίησης των δεδομένων (permutation test) [62, 67]. Με την μέθοδο της εξωτερικής αξιολόγησης οι ενώσεις χωρίζονται σε διαφορετικές ομάδες εργασίας και ελέγχου και επαναλαμβάνεται η στατιστική επεξεργασία από την αρχή. Αρχικά, εξάγεται ένα μοντέλο με βάση το σύνολο των ενώσεων το οποίο στη συνέχεια συγκρίνεται ως προς τα στατιστικά στοιχεία και τις περιεχόμενες περιγραφικές μεταβλητές με τα μοντέλα τα οποία προκύπτουν με την παραπάνω διαδικασία, η οποία μπορεί να επαναληφθεί περισσότερες φορές [62, 65]. Ένας περιορισμός της εξωτερικής επικύρωσης είναι ότι εκτιμά την προβλεπτική ικανότητα του μοντέλου χωρίς να παρέχει πληροφορίες για τη στατιστική σημαντικότητα της προβλεπτικής ικανότητας. Αυτή η αδυναμία μπορεί να 29
αντιμετωπιστεί με τη διαδικασία της τυχαιοποίησης (permutation test) [11, 62, 67, 68]. Κατά τη διαδικασία αυτή πραγματοποιείται την εξαγωγή παράλληλων μοντέλων τα οποία βασίζονται σε τυχαιοποίηση των δεδομένων και κατόπιν σύγκριση των τιμών R 2 και Q 2 του αρχικού μοντέλου με τα τυχαία μοντέλα. Το μοντέλο θεωρείται ανθεκτικό και αξιόπιστο εάν τα νέα μοντέλα που προκύπτουν με τυχαία αλλαγή των αποκρίσεων έχουν μικρότερους συντελεστές R 2 και Q 2 από το αρχικό μοντέλο, οι ευθείες δε που συσχετίζουν το βαθμό τυχαιοποίησης με τους συντελεστές R 2 και Q 2 πρέπει να περνούν από την τομή των αξόνων η να έχουν αρνητική τομή. Σημαντικό κριτήριο για την αξιοπιστία των μοντέλων αποτελεί η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών απόκρισης, η οποία πρέπει να είναι ένα προς ένα (1:1), τόσο για την ομάδα εκμάθησης, όσο και για την ομάδα ελέγχου. Σε αυτή την περίπτωση, η τιμή της κλίσης και του σταθερού όρου της καμπύλης συσχέτισης, πρέπει να τείνει στη μονάδα και στο μηδέν, αντίστοιχα [66]. Επιπλέον αξιολογούνται: Η απόλυτη τιμή του σχετικού σφάλματος για κάθε ένωση. Το διαγνωστικό κριτήριο αυτό, ωστόσο, επηρεάζεται από το μέγεθος της πειραματικής τιμής της εκάστοτε ένωσης. Χρησιμοποιείται κυρίως για την αξιολόγηση βιολογικών δεδομένων και συγκεκριμένα τιμών pec 50, οι οποίες είναι σχετικά μεγάλες. Το τυπικό σφάλμα των προβλεπόμενων τιμών, RMSEP (Root Mean Square Error of Prediction). Ο γεωμετρικός μέσος (geometric mean) [69]. Πιο απαιτητικά διαγνωστικά στοιχεία είναι τα μεγέθη R 2 pred (Εξ. Ι.6), r 2 m, r /2 m και Δr 2 m, τα οποία έχουν προταθεί πρόσφατα. Μοντέλων [70-73]. R 2 pred = 1- Σ(Y pred(test) -Y (test) ) 2 Σ(Y (test) -Ŷ (training) ) 2 (Ι.6) 30
όπου Y pred(test) και Y (test) είναι οι προβλεπόμενες από το μοντέλο και οι πειραματικές τιμές της μεταβλητής απόκρισης για την τυφλή ομάδα ελέγχου, αντίστοιχα, και Ŷ training η μέση τιμή της μεταβλητής απόκρισης για την ομάδα εκμάθησης. Η προβλεπτική ικανότητα ενός μοντέλου θεωρείται ικανοποιητική όταν R 2 pred > 0.5. Από την Εξίσωση Ι.6 φαίνεται ότι η τιμή του R 2 pred εξαρτάται από την απόσταση μεταξύ της μέσης τιμή της μεταβλητής απόκρισης για την ομάδα εκμάθησης και της αντίστοιχης τιμής έκαστης ένωσης. Συνεπώς, όσο η απόσταση αυτή αυξάνει, δηλαδή το εύρος των τιμών της μεταβλητής απόκρισης είναι μεγάλο, αυξάνει και η τιμή R 2 pred. Η αύξηση αυτή είναι πιθανό να είναι πλασματική και να οδηγήσει σε υπερεκτίμηση της προβλεπτικής ικανότητας του μοντέλου, σε περιπτώσεις στις οποίες το εύρος των τιμών απόκρισης είναι μεγάλο, εντούτοις οι προβλεπόμενες τιμές απόκρισης διαφέρουν σημαντικά από τις πειραματικές. Το μέγεθος r 2 m υπολογίζεται βάσει της συσχέτισης μεταξύ πειραματικών (y άξονας) και προβλεπόμενων από το μοντέλο (x άξονας) τιμών της μεταβλητής απόκρισης, λαμβάνοντας υπ όψη εκτός από το συντελεστή συσχέτισης r 2 και το συντελεστή r 2 0 (Εξ. Ι.7). Ο συντελεστής r 2 0 εξάγεται όταν η ευθεία συσχέτισης υποχρεωθεί να διέλθει από την αρχή των αξόνων. r 2 m=r 2 *[1-(r 2 -r 2 0) 1/2 ] (Ι.7) Στην περίπτωση 1:1 συσχέτισης, το r 2 0 πρακτικά ταυτίζεται με το r 2 και, συνεπώς, r 2 m=r 2. Σε αντίθετη περίπτωση είναι πάντοτε μικρότερο. Σε αντίθεση με το μέγεθος R 2 pred, το r 2 m δεν εξαρτάται από την απόσταση μεταξύ των μεμονωμένων τιμών απόκρισης των ενώσεων και της αντίστοιχης μέσης τιμής και, συνεπώς, αποφεύγεται η υπερεκτίμηση της προβλεπτικής ικανότητας μοντέλων σε περιπτώσεις ευρείας κατανομής των τιμών της μεταβλητής απόκρισης. Ένα μοντέλο 31
θεωρείται αξιόπιστο όταν r 2 m >0.5. Το μέγεθος r 2 m μπορεί να χρησιμοποιηθεί και για τον εσωτερικό έλεγχο αξιοπιστίας των μοντέλων, με τη μέθοδο της αφαίρεσης μίας ένωσης (leave-one-out, LOO) (r 2 m(loo)). Αντιστρέφοντας τους άξονες κατά τη συσχέτιση μεταξύ προβλεπόμενων από το μοντέλο (y άξονας) και πειραματικών (x άξονας) τιμών της μεταβλητής απόκρισης, εξάγεται βάσει της Εξίσωσης Ι.7 το μέγεθος r /2 m. Η διαφορά μεταξύ των μεγεθών r 2 m και r /2 m (Δr 2 m) μπορεί επίσης να χρησιμοποιηθεί ως μέτρο της προβλεπτικής ικανότητας των μοντέλων, υποδεικνύοντας αξιόπιστα μοντέλα όταν η τιμή της είναι μικρότερη από 0.2. Τελευταία, τα κριτήρια επικύρωσης των μοντέλων έχουν αυστηροποιηθεί περαιτέρω και απαιτείται τυφλή σειρά ελέγχου (blind test set),δηλαδή αντικείμενα (ενώσεις, δείγματα) για τα οποία δεν υπάρχει καμία προηγούμενη γνώση. Ωστόσο, η επικύρωση με τυφλή ομάδα ελέγχου ενδέχεται να μην είναι πάντα εφαρμόσιμη λόγω των πηγών οι οποίες απαιτούνται για τη συλλογή των νέων ενώσεων [62]. Επιπλέον, η χρήση τυφλής ομάδας ελέγχου προϋποθέτει ότι οι νέες ενώσεις εμπίπτουν στο πεδίο εφαρμογής του μοντέλου (βλ. επόμενη παράγραφο). 2.8. Πεδίο Εφαρμογής (Applicability Domain) των μοντέλων QSAR Κάθε μέθοδος ανάλυσης δεδομένων, συμπεριλαμβανομένων και των Ποσοτικών Σχέσεων Δομής-Δράσης, βασίζεται στην υπόθεση της ομοιογένειας (homogeneity) και της απουσίας σημαντικών έκροπων τιμών (influential outliers) [62, 74]. Αυτό σημαίνει ότι το υπό μελέτη σύστημα, δηλαδή η σειρά των ενώσεων, πρέπει να επιδεικνύει παρόμοιες ιδιότητες και ο μηχανισμός μέσω του ο οποίου το Χ επιδρά στο Υ να είναι ο ίδιος. Συνεπώς, δεν θα πρέπει να εμφανίζονται σημαντικές έκροπες τιμές ή έντονη ομαδοποίηση [75, 76]. Αν υπάρχει έντονη ομαδοποίηση στα δεδομένα, η εξαγωγή ενός μόνο μοντέλου καθίσταται ανεπαρκής στην ανάλυση, καθώς ένα τέτοιο 32
μοντέλο είναι ικανό να περιγράψει μόνο τη συστηματική διακύμανση μεταξύ των ομάδων αλλά αδυνατεί να διασαφηνίσει τι συμβαίνει μέσα σε κάθε ομάδα. Επιπροσθέτως, η σαφής παρουσία ομάδων στα δεδομένα παραβιάζει την υπόθεση της ομοιογένειας, καθώς αν το σύνολο των δεδομένων ομαδοποιείται με υψηλό βαθμό διαχωρισμού μεταξύ των ομάδων, δεν εμφανίζει πλέον ομοιογενή κατανομή. Στις περιπτώσεις αυτές, ενδείκνυται η επεξεργασία κάθε ομάδας ανεξάρτητα και η εξαγωγή μοντέλων QSAR για κάθε ομοιογενή ομάδα. Αυτή η συνθήκη σε μελέτες QSAR εξασφαλίζεται ως ένα βαθμό θεωρώντας ενώσεις οι οποίες δρουν στον ίδιο υποδοχέα με τον ίδιο μηχανισμό πρόσδεσης στο ενεργό κέντρο. Συχνά πρόκειται για χημικά συγγενείς ενώσεις. Αντίθετα, σε φαινόμενα λιγότερο εκλεκτικά (πρωτεϊνική σύνδεση) ή παθητικά φαινόμενα (απορρόφηση, κατανομή) η ομοιότητα των ενώσεων δεν είναι τόσο αναγκαία. Ένα διαγνωστικό εργαλείο το οποίο χρησιμοποιείται για τον εντοπισμό των έκροπων τιμών είναι το διάγραμμα των κανονικοποιημένων πιθανοτήτων (normal probability plot) των υπολοίπων [77]. Τα σημεία (αντικείμενα) τα οποία ανήκουν σε μία νοητή ευθεία η οποία διέρχεται από κάθε σημείο (μηδενικό υπόλοιπο, 0.5 πιθανότητα) έχουν προσεγγιστικά κανονικά κατανεμημένα υπόλοιπα. Κάθε σημείο το οποίο δεν προσαρμόζεται σε αυτή τη νοητή ευθεία έχει υπόλοιπα του οποίου η τιμή είναι σημαντικά μεγαλύτερη (πάνω και αριστερά από την ευθεία) ή μικρότερη (κάτω και δεξιά από την ευθεία) από την αναμενόμενη βάσει της υπόθεσης της κανονικής κατανομής των υπολοίπων και αποτελεί έκροπη τιμή (Σχήμα Ι.4). 33
Σχήμα Ι.4. Διάγραμμα κανονικοποιημένων πιθανοτήτων των υπολοίπων για μία ομάδα εκμάθησης. Από τα παραπάνω καθίσταται σαφές ότι κάθε μοντέλο QSAR μπορεί να οδηγεί σε αξιόπιστες προβλέψεις εντός των πλαισίων του πεδίου εφαρμογής του (Applicability Domain). Υπάρχουν περισσότεροι ορισμοί του πεδίου εφαρμογής και του τρόπου προσδιορισμού αντικειμένων (ενώσεις, δείγματα) τα οποία εμπίπτουν ή όχι σε αυτό [62, 78, 79]. Στην πραγματικότητα, το πεδίο εφαρμογής ενός μοντέλου πρέπει να θεωρείται ως ένα μοντέλο αυτό καθ αυτό ανεξάρτητα από την εξαγωγή του ίδιου του μοντέλου [80]. Βασικό κριτήριο ένταξης στο πεδίο εφαρμογής αποτελεί η απόσταση του αντικειμένου από τον πολυδιάστατο χώρο των μεταβλητών οι οποίες καθορίζουν το μοντέλο. Η απόσταση, από την άλλη, μπορεί να θεωρηθεί με διάφορες προσεγγίσεις, π.χ. Ευκλείδεια απόσταση, απόσταση Mahalanobis, απόσταση Manhattan, δείκτης Tanimoto. Την απόσταση Mahalanobis χρησιμοποιεί το λογισμικό SIMCA για τον καθορισμό των ισχυρά έκροπων τιμών [81]. Οι έκροπες τιμές τοποθετούνται εκτός της έλλειψης Hotelling T 2, που ορίζει την περιοχή του μοντέλου με βάση την απόσταση Mahalanobis σε επίπεδο εμπιστοσύνης 95% (Σχήμα Ι.5Α). Συνεπώς, η έλλειψη Hotelling T 2 μπορεί να χρησιμοποιηθεί ως διαγνωστικό εργαλείο για τον έλεγχο του 34
πεδίου εφαρμογής του μοντέλου και θεωρείται ως η πολυμεταβλητή γενίκευση του t- test του Student [82]. Το ίδιο πρόγραμμα χρησιμοποιεί ως επιπρόσθετο διαγνωστικό στοιχείο του πεδίου εφαρμογής του μοντέλου την απόσταση από το μοντέλο (Distance to Model on X Block, DModX) και ορίζεται η κρίσιμη απόσταση (critical distance) (σε επίπεδο εμπιστοσύνης 0.05) [11, 62]. Με το μέγεθος αυτό ελέγχεται κατά πόσο μία νέα ένωση της ομάδας ελέγχου απέχει από το σύνολο των ενώσεων της ομάδας εκμάθησης όσον αφορά στο χώρο ο οποίος ορίζεται από τις περιγραφικές μεταβλητές. Όταν η απόσταση αυτή υπερβεί την κρίσιμη τιμή, η πρόβλεψη για την ένωση αυτή καθίσταται επισφαλής (Σχήμα Ι.5Β). Η κρίσιμη απόσταση εκφράζει τον «όγκο ανοχής» (tolerance volume) του μοντέλου, δηλαδή το εύρος του μοντέλου για τα Χ-δεδομένα. Το μέγεθος DModX προκύπτει από το ποσοστό της μη ερμηνευόμενης από το μοντέλο διακύμανσης των Χ μεταβλητών (X-residuals). Η τιμή DModX για μία ένωση της ομάδας εργασίας δίνεται από την Εξίσωση Ι.8: s i = [Σe 2 ik/ (K-A)] 1/2 *v (Ι.8) όπου e ik είναι τα Χ- υπόλοιπα για τη συγκεκριμένη παρατήρηση, Α ο αριθμός των κυρίων συνιστωσών και Κ ο αριθμός των μεταβλητών. Ο όρος v αποτελεί διορθωτικό παράγοντα ο οποίος λαμβάνει τιμές λίγο μεγαλύτερες της μονάδας και εισάγεται στην εξίσωση δεδομένου ότι για μία παρατήρηση της ομάδας εκμάθησης η τιμή DModX αναμένεται να είναι λίγο μικρότερη καθώς η παρατήρηση αυτή έχει επηρεάσει το μοντέλο. Όσον αφορά σε αντικείμενο της ομάδας ελέγχου, το μέγεθος DModX αποτελεί συνδυασμό του μεγέθους s i (Εξ.Ι.8), χωρίς, βεβαίως, το διορθωτικό παράγοντα v, και της απόστασης της συντεταγμένης του (score) από το κανονικό εύρος συντεταγμένων του μοντέλου (όταν η προβλεπόμενη συντεταγμένη βρίσκεται εκτός του εύρους συντεταγμένων του μοντέλου). 35
Η διαφορά μεταξύ των δύο διαγνωστικών κριτηρίων, Hotelling T 2 και DModX, είναι ότι, ενώ το μέγεθος DModX προκύπτει από τη μη ερμηνευόμενη διακύμανση Χ (Χresiduals), η έλλειψη Hotelling T 2 ορίζεται μέσω της ερμηνευόμενης διακύμανσης. Συνεπώς, τα δύο αυτά εργαλεία μπορούν να εφαρμοστούν συμπληρωματικά [62]. Σχήμα Ι.5. Α) Διάγραμμα συντεταγμένων για μία σειρά δεδομένων. Σε κύκλο επισημαίνονται οι ενώσεις οι οποίες βρίσκονται εκτός της έλλειψης Hotelling T 2 και αποτελούν έκροπες τιμές. Β) Ιστόγραμμα των τιμών DModX για μία σειρά εκμάθησης. Με αστερίσκο επισημαίνονται οι ιστοί οι οποίοι αντιστοιχούν σε ενώσεις με τιμές DModX που ξεπερνούν την κρίσιμη απόσταση (μαύρη ευθεία). Τα τελευταία χρόνια έχει προταθεί ένας σημαντικός αριθμός μεθόδων και προσεγγίσεων για τη διερεύνηση του πεδίου εφαρμογής των μοντέλων QSAR και, κατ επέκταση, της αξιοπιστίας των προβλέψεων [78, 83-85]. Μία τεχνική για την εκτίμηση της σταθερότητας των προβλέψεων ενός μοντέλου σε μικρές μεταβολές στα δεδομένα είναι είτε διαταράσσοντας τον πίνακα των περιγραφικών μεταβλητών είτε μέσω μίας διαδικασίας η οποία καλείται bootstrap [86], κατά την οποία επιλέγονται τυχαία δεδομένα και αφαιρούνται από τη σειρά δεδομένων. Επίσης, είναι δυνατό να οριστούν διαφορετικά επίπεδα αξιοπιστίας για δεδομένες περιοχές του χώρου των περιγραφικών μεταβλητών. Η μέθοδος των k- πλησιέστερων γειτόνων (k- Nearest Neighbors) εφαρμόζεται, επίσης, για τον έλεγχο του πεδίου εφαρμογής των 36
μοντέλων, χρησιμοποιώντας συχνά δείκτες ομοιότητας, όπως ο δείκτης Tanimoto [79, 87]. Ένα επιπλέον διαγνωστικό στοιχείο για τον έλεγχο της σταθερότητας ενός μοντέλου QSAR αποτελεί το ποσοστό εκμόχλευσης (leverage) μίας ένωσης, μέσω του οποίου αποτιμάται η επιρροή την οποία ασκεί η ένωση στο μοντέλο [88]. Οι τιμές εκμόχλευσης μπορούν να υπολογιστούν για τις ενώσεις της ομάδας εκμάθησης καθώς και για νέες ενώσεις. Στην πρώτη περίπτωση, αποτελεί χρήσιμο μέγεθος για τον εντοπισμό ενώσεων οι οποίες επιδρούν σε σημαντικό βαθμό στις παραμέτρους του μοντέλου και οδηγούν σε ασταθές μοντέλο (δηλαδή, αφαίρεσή τους συνεπάγεται την κατάρρευση του μοντέλου). Στη δεύτερη περίπτωση, χρησιμεύουν για τον έλεγχο του πεδίου εφαρμογής του μοντέλου. Μόνο προβλέψεις οι οποίες αφορούν σε χημικές ενώσεις οι οποίες ανήκουν στο χημικό χώρο της ομάδας εκμάθησης μπορούν να θεωρηθούν αξιόπιστες. Μία ακόμα προσέγγιση για τον έλεγχο του πεδίου εφαρμογής και της αξιοπιστίας των μοντέλων είναι μέσω της επικαιροποίησης τους (updating) κατά τακτικά χρονικά διαστήματα μέσα σε μία συγκεκριμένη περίοδο. Η διαδικασία η οποία ακολουθείται αφορά στην εφαρμογή υπαρχόντων μοντέλων στην πρόβλεψη νέων ενώσεων (τυφλή ομάδα ελέγχου) και ένταξής τους σε αυτά συγκρίνοντας τα τελικά μοντέλα με τα αρχικά. Με τη μεθοδολογία αυτή επιδιώκεται η επέκταση του πεδίου εφαρμογής των μοντέλων και κατ επέκταση η ενίσχυση της προβλεπτικής τους ικανότητας [89-91]. 3. ΠΟΣΟΤΙΚΕΣ ΣΧΕΣΕΙΣ ΔΟΜΗΣ-ΣΥΓΚΡΑΤΗΣΗΣ (QUANTITATIVE STRUCTURE-RETENTION RELATIONSHIPS, QSRR) 3.1. Εισαγωγή 37
Στον τομέα του QSAR εντάσσονται και αποτελούν ιδιαίτερο αντικείμενο οι Ποσοτικές Σχέσεις Δομής- Συγκράτησης (Quantitative Structure-Retention Relationships, QSRR. Οι μελέτες αυτές αρχικά αναπτύχθηκαν από τον R. Kaliszan, σύμφωνα με τον οποίο, η συμπεριφορά των χημικών ενώσεων κατά την παρουσία τους τόσο σε ένα βιολογικό όσο και σε ένα χρωματογραφικό περιβάλλον καθορίζεται από τις ίδιες βασικές διαμοριακές αλληλεπιδράσεις [92-94]. Ουσιαστικά, οι διαδικασίες απορρόφησης, κατανομής, απέκκρισης και αλληλεπίδρασης με το βιολογικό στόχο φέρουν σημαντικές ομοιότητες με τη διαδικασία χρωματογραφικού διαχωρισμού. Επιπροσθέτως, η χρωματογραφία είναι μια μοναδική τεχνική η οποία μπορεί να αποφέρει γρήγορα μια πληθώρα ακριβών και επαναλήψιμων δεδομένων τα οποία συχνά απεικονίζουν τις μοριακές/ φυσικοχημικές ιδιότητες των αναλυτών. Κατά συνέπεια, η χημειομετρική επεξεργασία κατάλληλα σχεδιασμένων και επιλεγμένων χρωματογραφικών δεδομένων μπορεί να αποκαλύψει συστηματικές πληροφορίες σχετικά με τις υπό μελέτη ενώσεις- πληροφορίες φυσικοχημικού ή/και βιολογικού περιεχομένου οι οποίες θα ήταν δύσκολο και χρονοβόρο να αποκτηθούν με συμβατικές τεχνικές [95]. Δεδομένου ότι η χρωματογραφική συγκράτηση αποτελεί μία ισορροπία μεταξύ στατικής/ κινητής φάσης, η χημειομετρική μεθοδολογία βασίζεται σε γραμμικές σχέσεις ελεύθερης ενέργειας οι οποίες καθορίζουν τις Ποσοτικές Σχέσεις Δομής-Συγκράτησης [96]. Ο κύριος στόχος των μελετών QSRR είναι η πρόβλεψη χρωματογραφικών δεδομένων βάσει της μοριακής δομής. Αυτού του είδους οι προβλέψεις είναι χρήσιμες σε πολλά πεδία εφαρμογών, όπως η περιβαλλοντική χημεία, ο έλεγχος doping, η χημική/ φαρμακευτική ανάλυση (διερεύνηση χρωματογραφικών χαρακτηριστικών) και η μεταβονομική. Στην παρούσα εργασία διεξοδικότερη αναφορά θα γίνει στην εφαρμογή των Ποσοτικών Σχέσεων Δομής- Συγκράτησης σε πεδία τα οποία αφορούν 38
στο Σχεδιασμό και Ανάπτυξη νέων φαρμακομορίων και σχετίζονται κυρίως με τον καθορισμό του φυσικοχημικού προφίλ, τη διαπερατότητα και την πρωτεϊνική σύνδεση των ενώσεων. Η διαδικασία ανάπτυξης και αξιολόγησης των Ποσοτικών Σχέσεων Δομής- Συγκράτησης συμπίπτει με αυτή που ήδη περιγράφηκε για το QSAR. Η βασική διαφορά έγκειται στη φύση της μεταβλητής απόκρισης, η οποία αφορά σε χρωματογραφικά δεδομένα που καθορίζονται από παθητικά ή λιγότερο εξειδικευμένα φαινόμενα και, ως εκ τούτου, επιτρέπει την επεξεργασία χημικώς διαφορετικών ενώσεων. 3.2. Μεταβλητές απόκρισης στις μελέτες QSRR Στις μελέτες QSRR τη μεταβλητή απόκρισης συνιστούν δεδομένα σχετικά με τη χρωματογραφική συγκράτηση και διαφοροποιούνται ανάλογα με την εφαρμοζόμενη τεχνική. Ο χρόνος συγκράτησης (retention time, t r, RT), ο σχετικός χρόνος συγκράτησης (relative retention time, RRT) και ο χρωματογραφικός δείκτης Kovats (I) σχετίζονται κυρίως με την Αεριοχρωματογραφία [97, 98]. Όσον αφορά στην Υγροχρωματογραφία Υψηλής Απόδοσης (High Performance Liquid Chromatography, HPLC) και την Χρωματογραφία Λεπτής Στιβάδας (Thin Layer Chromatography, TLC) ως μεταβλητές απόκρισης χρησιμοποιούνται ισοκρατικές ή ανηγμένες τιμές του παράγοντα χωρητικότητας (retention factor), συνήθως υπό τη λογαριθμική μορφή, logk (Εξ. Ι.9) ή logk w και R M (Εξ. Ι.10) ή R Mw, αντίστοιχα. logk= log[(t r - t 0 )/t 0 ] (Ι.9) Όπου t r ο χρόνος συγκράτησης της ουσίας και t 0 ο νεκρός χρόνος του χρωματογραφικού συστήματος. R M = log(1/rf -1) (Ι.10) 39
Όπου Rf η απόσταση που διανύει ο αναλύτης ως προς το μέτωπο του διαλύτη. Όσον αφορά στα μεγέθη logk w και R Mw, ο δείκτης w υποδηλώνει αναγωγή σε 100% υδατική κινητή φάση, σύμφωνα με τις Εξισώσεις Ι.11 και Ι.12, αντίστοιχα: logk= -Sφ + logk w R M = -Sφ + R Mw (Ι.11) (Ι.12) Όπου φ είναι το ποσοστό του οργανικού τροποποιητή στην κινητή φάση. Η κλίση S στις Εξισώσεις Ι.11 και Ι.12 αντανακλά τις αλληλεπιδράσεις αναλύτη/ διαλύτη και σχετίζεται με την ειδική υδρόφοβη επιφάνεια των αναλυτών. Το μέγεθος αυτό μπορεί επίσης να χρησιμοποιηθεί ως μεταβλητή απόκρισης σε μελέτες QSRR. Ένα άλλο μέγεθος το οποίο μπορεί να επεξεργαστεί μία μελέτη QSRR είναι ο χρωματογραφικός δείκτης υδροφοβίας (Chromatographic Hydrophobicity Index, CHI ή φ 0 ), ο οποίος αντιστοιχεί στο ποσοστό του οργανικού τροποποιητή με το οποίο επιτυγχάνεται ίση κατανομή μεταξύ στατικής και κινητής φάσης (logk= 0) και, συνεπώς, ισούται με logk w /S [99, 100]. 3.3. Περιγραφικές μεταβλητές Για την απεικόνιση των δομών χρησιμοποιείται το ίδιο οπλοστάσιο που αναπτύχθηκε στην ενότητα για τις Ποσοτικές σχέσεις Δομής- Δράσης. Ανάλογα με το πληροφοριακό περιεχόμενο των χρωματογραφικών δεδομένων, το οποίο καθορίζεται από τις χρωματογραφικές συνθήκες και κυρίως τη στατική φάση, η λιποφιλία συχνά αποτελεί τη σημαντικότερη παράμετρο. Ευρεία εφαρμογή βρίσκουν, επίσης, οι σολβατοχρωμικές παράμετροι, οι οποίες μέσω των αντίστοιχων εξισώσεων παρέχουν πληροφορίες για τη σύγκριση των χρωματογραφικών συστημάτων μεταξύ τους και με τα προς προσομοίωση συστήματα (κατανομή, διαπερατότητα, πρωτεϊνική σύνδεση). 40
Κατ επέκταση των σολβατοχρωμικών παραμέτρων οι οποίες καθορίζουν τους αναλύτες, έχουν αναπτυχθεί, επίσης, παράμετροι οι οποίες σχετίζονται με τα εξειδικευμένα χαρακτηριστικά των στηλών και αφορούν: στην υδροφοβία (Η), η οποία εξαρτάται από το εμβαδό επιφάνειας και την πυκνότητα της στήλης, τη στερική εκλεκτικότητα (S), η οποία εξαρτάται από την πυκνότητα της στήλης και τον παράγοντα σιλανοποίησης, την οξύτητα (Α) και τη βασικότητα (Β) σε δεσμούς υδρογόνου και τις ηλεκτροστατικές αλληλεπιδράσεις (C) (Εξ. Ι.13) [101-103]: logk= logk ref + ηh +σs +αa +βb +κc (Ι.13) Οι συντελεστές η, σ, α, β και κ αφορούν στους αναλύτες και προσδιορίζονται με πρότυπες ενώσεις. 3.4. Στατιστικά εργαλεία Η εξαγωγή των μοντέλων QSRR, καθώς και η επικύρωσή τους πραγματοποιείται με τα στατιστικά και διαγνωστικά εργαλεία τα οποία αναπτύχθηκαν στην ενότητα των Ποσοτικών Σχέσεων Δομής- Δράσης. Δεδομένου ότι συχνά η μεθοδολογία QSRR χρησιμοποιείται για τη σύγκριση διαφορετικών συστημάτων, π.χ. χρωματογραφικών/ βιολογικών ή χρωματογραφικών/ φυσικοχημικών, έχει προταθεί παράμετρος απόστασης d ως μέτρο της ομοιότητας. Η παράμετρος d εξάγεται με κανονικοποίηση των συντελεστών LSER θεωρώντας τους σε ένα χώρο πέντε διαστάσεων ο οποίος ορίζεται από τις σολβατοχρωμικές παραμέτρους. Μικρή τιμή d υποδεικνύει μαθηματική ομοιότητα μεταξύ δύο συστημάτων [104]. Η ακρίβεια της εκτίμησης της βιολογικής/ φυσικοχημικής ιδιότητας (σ 2 corr) εξαρτάται από την ακρίβεια των βιολογικών/ φυσικοχημικών δεδομένων (σ 2 bio), την ακρίβεια των χρωματογραφικών δεδομένων (σ 2 chrom)και το σφάλμα το οποίο προέρχεται από την ανομοιότητα των δύο συστημάτων (σ 2 d) (Εξ. Ι. 14): 41
σ 2 corr = σ 2 bio + σ 2 chrom + σ 2 d (I.14) 3.5. Μελέτες QSRR για την εκτίμηση της λιποφιλίας Η χρήση της αντιστρόφου φάσεως υγροχρωματογραφίας έχει προταθεί και εφαρμοστεί ως εναλλακτική προσέγγιση εκτίμησης της λιποφιλίας ο προσδιρισμός της οποίας με απευθείας πειράματα κατανομής είναι επίπονος, χρονοβόρος και υπόκεινται σε σημαντικούς περιορισμούς [105, 106]. Τα χρωματογραφικά μεγέθη σχετίζονται με την κατανομή στο σύστημα οκτανόλη/ νερό μέσω εξισώσεων τύπου Colander (Εξισώσεις Ι.15 και Ι.16), η ποιότητα των οποίων εξαρτάται από τις χρωματογραφικές συνθήκες και τη φύση των ενώσεων: logk(logk w )= alogp + b R M (R Mw )= alogp + b (Ι.15) (Ι.16) Ο τελικός στόχος των εξισώσεων αυτών είναι, στην περίπτωση των ανηγμένων παραγόντων συγκράτησης, η εξαγωγή μίας 1:1 συσχέτισης με την τιμή της κλίσης πλησίον της μονάδας και μη στατιστικά σημαντικό σταθερό όρο. Ο στόχος αυτός έχει καταστεί εφικτός με την προτυποποίηση των χρωματογραφικών συνθηκών στην περίπτωση βασικών και ουδέτερων ενώσεων [107, 108]. Στην περίπτωση των όξινων ενώσεων οι κατάλληλες χρωματογραφικές συνθήκες εξακολουθούν να είναι υπό διερεύνηση. Η παραγοντοποίηση των μεγεθών logp και logk w σε περισσότερο θεμελιώδεις παραμέτρους έχει αναδείξει την ομοιότητα μεταξύ των παραγόντων οι οποίοι καθορίζουν την κατανομή στο σύστημα οκτανόλη/ νερό και την αντιστρόφου φάσεως χρωματογραφική συγκράτηση. Ωστόσο, παρά τις προσπάθειες προτυποποίησης, η επιτυχής συσχέτιση μεταξύ των δύο συστημάτων δεν είναι πάντα δεδομένη, εξαρτώμενη επίσης, από τα ειδικότερα χαρακτηριστικά των ενώσεων [99]. 42
Δεδομένου ότι οι χρησιμοποιούμενες στατικές φάσεις αποτελούνται από σιλανοποιημένη πυριτία, το πρόβλημα που έπρεπε από την αρχή να αντιμετωπιστεί ήταν η δραστικότητα των ελεύθερων ομάδων σιλανόλης. Για το λόγο αυτό, αφενός έχουν κατασκευαστεί ειδικές στήλες (base deactivated, polar embedded, polar end capped C18) [109-111], αφετέρου χρησιμοποιούνται αντιδραστήρια κάλυψης (υδρόφοβες αμίνες, π.χ. n-δεκυλαμίνη) ως προσθετικά στην κινητή φάση [107, 108]. Επιπλέον, η προσθήκη μικρής ποσότητας οκτανόλης στην κινητή φάση έχει προταθεί από πολλούς ερευνητές ως τρόπος απόδοσης χαρακτηριστικών οκτανόλης στη στατική φάση [107, 108]. 3.6. QSRR και Βιομιμητική Χρωματογραφία Η σύγχρονη τεχνολογία παρασκευής στατικών φάσεων για την HPLC έχει επιτρέψει την ακινητοποίηση βιολογικά σχετικών παραγόντων σε σκελετό πυριτίας. Έχουν προκύψει στήλες ακινητοποιημένων τεχνητών μεμβρανών και στήλες με ακινητοποιημένες πρωτεΐνες, πολλές από τις οποίες κυκλοφορούν στο εμπόριο. Η εφαρμογή των στηλών αυτών στη χρωματογραφία έχει οδηγήσει στη βιοχρωματογραφία ή βιομιμητική χρωματογραφία [95, 112]. Η βιομιμητική χρωματογραφία στοχεύει στη γρήγορη εκτίμηση φαρμακοκινητικών παραμέτρων, όπως διαπερατότητα και πρωτεϊνική σύνδεση. Η τεχνολογία αυτή έχει αρχίσει να χρησιμοποιείται, επίσης, για την κατασκευή στατικών φάσεων με ακινητοποιημένα ένζυμα ή πρωτεΐνες- φαρμακευτικούς στόχους, επεκτείνοντας τις εφαρμογές της βιομιμητικής χρωματογραφίας σε προσομοίωση πειραμάτων πρόσδεσης [113, 114]. Οι συνηθέστερα χρησιμοποιούμενες βιομιμητικές στήλες περιγράφονται κατωτέρω. Χρωματογραφία Ακινητοποιημένων Τεχνητών Μεμβρανών (Immobilized Artificial Membranes, ΙΑΜ, Chromatography) 43
Η χρήση του συστήματος οκτανόλη/ νερό σε μελέτες QSPR και QSAR έχει δεχθεί κριτική ως προς την ικανότητά του να προσομοιώσει την κατανομή των μορίων στις βιολογικές μεμβράνες, καθώς αποτελεί ισότροπο σύστημα [115]. Τα λιποσώματα, από την άλλη πλευρά, αν και αποτελούν πιο αντιπροσωπευτικά συστήματα για το σκοπό αυτό, παρουσιάζουν δυσκολίες όσον αφορά στην παρασκευή τους και την επαναληψιμότητα των αποτελεσμάτων [116]. Μία εναλλακτική προσέγγιση είναι η χρήση της χρωματογραφίας ΙΑΜ, η οποία αναπτύχθηκε στα τέλη της δεκαετίας 1980 [117-120]. Οι στατικές φάσεις IAM αποτελούνται από μονοστιβάδες ακινητοποιημένων φωσφολιπιδίων (π.χ. φωσφατιδυλοχολίνη), όπου κάθε λιπιδικό μόριο είναι ομοιοπολικά συνδεδεμένο με τη χημικά τροποποιημένη με προπυλαμίνη πυριτία. Στο Σχήμα Ι.6 απεικονίζονται η δομή ενός λιποσώματος (διπλοστιβάδα) και η δομή των ακινητοποιημένων στην πυριτία φωσφολιπιδικών μονοστιβάδων. Σχήμα Ι.6. Α) Δομή λιποσώματος, Β) Δομή μονοστιβάδας φωσφολιπιδίων ακινητοποιημένα στη σίλικα. Τρεις διαφορετικοί τύποι στηλών οι οποίες περιέχουν φωσφατιδυλοχολίνη έχουν εισαχθεί στην αγορά: η μονής αλυσίδας IAMPC-DD, οι διπλής αλυσίδας IAMPC-MG και IAMPC-DD2, οι οποίες διαφέρουν μεταξύ τους ως προς τον τρόπο επεξεργασίας των υπολειμμάτων προπυλαμίνης (Σχήμα Ι.7). Στις στήλες IAMPC-MG, οι ομάδες προπυλαμίνης οι οποίες δεν έχουν συνδεθεί με τα λιπίδια καλύπτονται επιπλέον με 44
μεθυλογλυκολική ομάδα (methylglycolate), ενώ στις στήλες IAMPC-DD και IAMPC-DD2 με δεκανοϊκή και προπιονική ομάδα. Η κάλυψη των ομάδων προπυλαμίνης είναι απαραίτητη, διότι η παρουσία τους μειώνει τη χημική σταθερότητα της στήλης και οδηγεί σε αύξηση της συγκράτησης των όξινων ομάδων και, αντίστοιχα, μείωση της συγκράτησης των βασικών [121]. Όσον αφορά στις δυνατότητες των τριών στηλών, έχει αναφερθεί ότι αυτές οι οποίες διαθέτουν διπλή αλυσίδα παρέχουν καλύτερες συσχετίσεις με τα βιολογικά δεδομένα [121, 122]. Σχήμα Ι.7.Εμπορικά διαθέσιμες στήλες ΙΑΜ. Ένα σημαντικό πλεονέκτημα των στηλών IAM είναι ότι παρέχουν τη δυνατότητα χρήσης εξολοκλήρου υδατικής κινητής φάσης. Συνεπώς, ο παράγοντας χωρητικότητας logk w μπορεί να προσδιοριστεί με άμεσα πειράματα. Επιπλέον, ο χρόνος ανάλυσης μειώνεται σημαντικά και η μέθοδος καθίσταται φιλικότερη προς το περιβάλλον. Το συνηθέστερο ρυθμιστικό διάλυμα το οποίο χρησιμοποιείται είναι το ισότονο διάλυμα φωσφορικών (Phosphate Buffer Saline, PBS), το οποίο προσομοιώνει τις φυσιολογικές συνθήκες. Το εύρος τιμών ph το οποίο μπορεί να 45
ανεχθεί η στήλη είναι 2.5-7.4, ενώ κάποιοι συγγραφείς προτείνουν ως ανώτατη τιμή ph= 7.0, καθώς είναι κοντά στη φυσιολογική και αποτελεί ασφαλέστερη επιλογή για τη στήλη. Συνήθως χρησιμοποιείται ph κοντά στο φυσιολογικό (7.0-7.4) και ph 5.5 της αρχής του εντέρου. Ωστόσο, ενώσεις οι οποίες συγκρατούνται σε μεγάλο βαθμό από τη στήλη απαιτούν την παρουσία οργανικού τροποποιητή στην κινητή φάση για την ανάλυσή τους. Στις περιπτώσεις αυτές προτιμάται η χρήση ακετονοτριλίου (ACN) σε συγκέντρωση μέχρι 30% και ο υπολογισμός της τιμής logk w γίνεται με αναγωγή (Εξ. Ι.11). Η χρήση μεθανόλης αποφεύγεται καθώς μπορεί να προκαλέσει μεθανόλυση των φωσφολιπιδίων [105, 121]. Όσον αφορά στο μηχανισμό συγκράτησης των αναλυτών από τις στήλες IAM θεωρείται ότι διέπεται κυρίως από κατανομή (partitioning), εάν πρόκειται για ουδέτερες ενώσεις [118]. Έχει αναφερθεί ότι για λιπόφιλες ουδέτερες ενώσεις, η συσχέτιση ανάμεσα στα μεγέθη logp oct/wat και logk είναι καλή. Για δομικά ποικίλες ενώσεις, η κλίση της καμπύλης συσχέτισης είναι μικρότερη της μονάδας, υποδεικνύοντας ότι τα υδρόφιλα μόρια πιθανώς συγκρατούνται ισχυρότερα από ότι θα αναμενόταν βάσει της κατανομής τους στο σύστημα οκντανόλη/ νερό [123]. Για σειρές δομικά συγγενών μορίων, από την άλλη, έχουν αναφερθεί τιμές κλίσης πλησίον της μονάδας, επισημαίνοντας την ομοιότητα των διαμοριακών αλληλεπιδράσεων μεταξύ δομικά συγγενών μορίων [124]. Σχετικά με τις ιονιζόμενες ενώσεις, έχει παρατηρηθεί ότι οι πρωτονιωμένες βάσεις και γενικά ενώσεις θετικά φορτισμένες συγκρατούνται ισχυρότερα από τις ουδέτερες ενώσεις ίσης λιποφιλίας λόγω των ηλεκτροστατικών αλληλεπιδράσεων με τα φωσφορικά ανιόντα των ΙΑΜ στηλών [122, 124, 125]. Ανάλογες αλληλεπιδράσεις μεταξύ των ιονισμένων όξινων ενώσεων και του αζώτου της χολίνης είναι λιγότερο πιθανές εξαιτίας της θέσης του, μακριά από τον υδρόφοβο πυρήνα και της 46
επιδιαλύτωσής του από την κινητή φάση [119]. Ως εκ τούτου συχνά οι τιμές logk ΙΑΜ βασικών ενώσεων συσχετίζονται καλύτερα με τιμές logp αντί logd λόγω αντιστάθμισης του ιονισμού από τις ηλεκτροστατικές αλληλεπιδράσεις. Αντίθετα, η συσχέτιση με τιμές logd απαιτεί την εισαγωγή των όρων F + (κλάσμα κατιονικής μορφής) και F - (κλάσμα ανιονικής μορφής) [126]. Η ανάπτυξη των ηλεκτροστατικών αλληλεπιδράσεων μελετήθηκε χρησιμοποιώντας ρυθμιστικό διάλυμα MOPS (Μορφολινο-προπανο-σουλφονιμό οξύ) το οποίο ως αμφολύτης δεν αλληλεπιδρά με τη στατική φάση και τους αναλύτες και, κατ επέκταση, δεν επικαλύπτει τις φορτισμένες θέσεις της στατικής φάσης. Αντίθετα, με τη χρήση PBS παρατηρήθηκε ενίσχυση των ηλεκτροστατικών αλληλεπιδράσεων των βασικών ενώσεων με τη στήλη. Το γεγονός αυτό αντανακλάται στη στατιστικά σημαντική βελτίωση της συσχέτισης μεταξύ των μεγεθών logk wpbs και logk wmops με την εισαγωγή του όρου F +. Εντούτοις, το φαινόμενο αυτό δεν παρατηρήθηκε για τις αρνητικά φορτισμένες ενώσεις. Στην ίδια εργασία, η συσχέτιση των τιμών logk wpbs με τις τιμές logd βελτιώθηκε, επίσης, με την εισαγωγή και των δύο όρων F + και F - [126]. Μέσω ανάλυσης LSER, διαπιστώθηκε ότι ο υδρόφοβος όρος εμφάνισε θετική συνεισφορά για τα δεδομένα ΙΑΜ αλλά μικρότερη σε σχέση με την κατανομή στο σύστημα οκτανόλη/ νερό [123]. Η βασικότερη διαφορά, ωστόσο, αφορά στην αυξημένη βασικότητα σε δεσμούς υδρογόνου της στήλης ΙΑΜ, γεγονός το οποίο αντανακλάται στη θετική τιμή του συντελεστή της παραμέτρου Α και υποδεικνύει εντονότερη συγγένεια για ενώσεις δότες σε δεσμούς υδρογόνου. Ωστόσο, στις περισσότερες περιπτώσεις η απόλυτη τιμή της παραμέτρου Α είναι σημαντικά μικρότερη από αυτή της παραμέτρου Β (βασικότητα σε δεσμούς υδρογόνου). Συνεπώς, όσον αφορά στη σημαντικότητα της παραμέτρου Α, πιθανώς να εξαρτάται 47
από τη φύση των αναλυτών και/ ή την κινητή φάση, καθώς έχουν αναφερθεί εξισώσεις LSER στις οποίες ο όρος αυτός δεν περιλαμβάνεται [126]. Επέκταση της ανάλυσης LSER με εισαγωγή των όρων F + και F - [126] σε μία σειρά 62 δομικά διαφορετικών ενώσεων οδήγησε στην εξαγωγή μοντέλου στο οποίο οι δύο αυτές παράμετροι φέρουν τιμή συντελεστή -0.40 και -1.61, αντίστοιχα. Η χαμηλότερη αρνητική τιμή της παραμέτρου F +, συγκριτικά με την παράμετρο F -, συνηγορεί στην εξισορρόπηση του ιονισμού των βασικών ενώσεων από τις ηλεκτροστατικές αλληλεπιδράσεις, φαινόμενο λιγότερο εμφανές για τις όξινες ενώσεις. Δεδομένα χρωματογραφικής συγκράτησης από τη στήλη ΙΑΜ έχουν χρησιμοποιηθεί στην εκτίμηση φαρμακοκινητικών ιδιοτήτων [127-130]. Ειδικότερα, θεωρούνται οι διαδικασίες διαπερατότητας μεμβρανών, απορρόφησης (% από του στόματος απορρόφηση), διαπερατότητας αιματοεγκεφαλικού φραγμού σε μελέτες QSPR και έχουν προταθεί αντίστοιχα μοντέλα με τα μεγέθη logk IAM ως μόνες παράμετροι ή σε συνδυασμό με άλλες παραμέτρους. Αναφέρονται συσχετίσεις δεικτών ΙΑΜ με διαπερατότητα στις κυτταρικές σειρές Caco-2, οι οποίες χρησιμοποιούνται ως in vitro μοντέλα της διαπερατότητας των μεμβρανών. Ενώ η συσχέτιση αυτή υπήρξε ικανοποιητική για μία σειρά δομικά συγγενών ενώσεων, για διαφορετικής δομής μόρια η εισαγωγή του μοριακού βάρους ή του μοριακού όγκου αποδείχτηκε αναγκαία για την εξαγωγή ικανοποιητικών μοντέλων [119, 131-133]. Για την ανάλυση της γαστρεντερικής απορρόφησης (εκφρασμένης ως %ΗΟΑ, Human Oral Absorption) μίας σειράς 28 δομικά διαφορετικών φαρμάκων, οι Kotecha και συν. πρότειναν ένα σιγμοειδές μοντέλο βασισμένο στον παράγοντα χωρητικότητας logk wiam, με θετική συνεισφορά, και την πολική επιφάνεια PSA, με αρνητική συνεισφορά. Δεδομένου ότι το ph κατά μήκος του γαστρεντερικού σωλήνα διαφέρει επηρεάζοντας τις θέσεις 48
απορρόφησης βασικών ή όξινων ενώσεων, χρησιμοποιήθηκε η μέγιστη τιμή logk wiam των ενώσεων, η οποία λήφθηκε μετά από μετρήσεις σε εύρος ph 4.5-7.4 [134]. Σε μελέτες προσομοίωσης διαπερατότητας του αιματοεγκεφαλικού φραγμού (ΑΕΦ) διαπιστώθηκε ότι τα χρωματογραφικά δεδομένα ΙΑΜ υπερείχαν από το συντελεστή logp και τους παράγοντες συγκράτησης σε χρωματογραφία αντιστρόφου φάσεως [129]. Επιπλέον, έχει προταθεί ένα σύστημα ταξινόμησης των ενώσεων βάσει της ικανότητάς τους να διέρχονται τον ΑΕΦ λαμβάνοντας υπ όψη τον παράγοντα χωρητικότητας logk IAM και το μοριακό βάρος (MW). Η εξαγωγή του συστήματος βασίστηκε σε ομάδα εκμάθησης αποτελούμενη από 23 ενώσεις και αξιολογήθηκε με ομάδα ελέγχου (επτά ενώσεις) [135]. Η ταξινόμηση αυτή αφορά σε δύο τιμές ph, 5.5 και 7.4, καθώς θεωρείται ότι και η διαδικασία πρόσληψης των ενώσεων στην αρχή του εντέρου (ph= 5.5) αποτελεί καθοριστικό βήμα για την περαιτέρω πορεία τους, επηρεάζοντας, συνεπώς, και τη διαπερατότητα του ΑΕΦ. Η διάκριση αυτή παρουσιάζεται στον Πίνακα Ι.3. Πίνακας Ι.3. Ταξινόμηση των ενώσεων ανάλογα με τη διαπερατότητα του ΑΕΦ βάση του μεγέθους (logk IAM /MW 4 )*10. Διαπερατότητα ΑΕΦ Υψηλή (logk IAM /MW 4 )*10 ph=5.5 ph=7.4 > 1.01 > 0.85 Αβέβαιη 0.65-1.0 - Χαμηλή < 0.64 < 0.84 Καθίσταται, συνεπώς, σαφές ότι η χρωματογραφία ΙΑΜ μπορεί να χρησιμοποιηθεί στην εκτίμηση πολλών φαρμακοκινητικών διαδικασιών, συχνά με αποτελεσματικότητα εφάμιλλη ή και υψηλότερη συγκριτικά με την κατανομή στο σύστημα οκτανόλη/ νερό και τη συγκράτηση στην αντιστρόφου φάσεως HPLC. 49
Επιπλέον, παρέχει τη δυνατότητα επαναλήψιμου προσδιορισμού δεδομένων με μεγαλύτερη ευκολία συγκριτικά με τις μεθόδους της ανακινούμενης φιάλης αλλά και της αντιστρόφου φάσεως HPLC, όπου συνήθως απαιτούνται προσθετικοί παράγοντες στην κινητή φάση (δεκυλαμίνη, οκτανόλη). Η χρωματογραφία IAM, ωστόσο, μπορεί να θεωρηθεί ως μία πρώτη προσέγγιση, δεδομένου ότι η διαδικασία απορρόφησης των φαρμάκων είναι ιδιαίτερα πολύπλοκη επηρεαζόμενη από περισσότερους παράγοντες, όπως η αδυναμία διάλυσης του φαρμάκου στα ΓΕΣ υγρά, η πιθανότητα καθίζησης του φαρμάκου στην περιοχή απορρόφησης καθώς και η χημικά και βακτηριακή αποσύνθεσή του. Επιπλέον, ορισμένες ενώσεις απορροφώνται μέσω ενεργούς μεταφοράς ή μέσω ενός παρακυττάριου μηχανισμού πρόσληψης. Για τη μελέτη τέτοιων περιπτώσεων επιδιώκεται η ακινητοποίηση μεμβρανικών πρωτεϊνών, υπεύθυνων για τη μεταφορά φαρμάκων, στην επιφάνεια των στηλών IAM [117]. Επιπλέον, η ισχυρή αλληλεπίδραση των βασικών ενώσεων με τη στήλη ΙΑΜ ως ένα βαθμό αντικρούει την υπόθεση ph- μερισμού, αν και έχει δειχτεί ότι ο ιονισμός επίσης επηρεάζει τη συγκράτηση. Τίθεται συνεπώς ένα ερώτημα, αν η χρωματογραφία ΙΑΜ προσομοιώνει τη διαπερατότητα ή την αλληλεπίδραση με τις μεμβράνες. Η δεύτερη περίπτωση μπορεί να αφορά σε μόρια με υψηλή συγκράτηση τα οποία κατακρατούνται στις μεμβράνες, ενώ επίσης μπορεί να σχετίζεται με το φαινόμενο της φωσφολιπίδωσης [136]. Χρωματογραφία Συγγένειας Υψηλής Απόδοσης (High Performance Affinity Chromatography, HPAC) Οι στατικές φάσεις με ακινητοποιημένες πρωτεΐνες όπως Ανθρώπινη Αλβουμίνη του Ορού (Human Serum Albumin, HSA), Αλβουμίνη του Ορού Μυών (Rat Serum Albumin, RSA) και α1-όξινη Γλυκοπρωτεΐνη (α1- Acid Glycoprotein, AGP), αρχικά 50
αναπτύχθηκαν με σκοπό την πραγματοποίηση χειρόμορφων διαχωρισμών [137-140]. Ωστόσο, μελέτες QSRR, κυρίως όσον αφορά στην HSA, έδειξαν ότι οι στήλες αυτές μπορούν να χρησιμοποιηθούν για την εκτίμηση της πρωτεϊνικής σύνδεσης, η οποία αποτελεί φαρμακοκινητική παράμετρο ιδιαίτερης σημασίας, επηρεάζοντας την αποτελεσματικότητα, το χρόνο παραμονής και τη δοσολογία, ενώ εμπλέκονται σε αλληλεπιδράσεις φαρμάκων και στη διαπερατότητα του αιματοεγκεφαλικού φραγμού [141-144]. Οι κλασικές μέθοδοι προσδιορισμού της πρωτεϊνικής σύνδεσης (διαπίδυση, υπερδιήθηση) είναι χρονοβόρες και η χρωματογραφία θα μπορούσε να αποτελέσει χρήσιμη εναλλακτική προσέγγιση για το σκοπό αυτό. Στην περίπτωση της HSA υπάρχουν πολλές επιτυχείς αναφορές προσομοίωσης της σύνδεσης, ενώ μελέτες με τη χρωματογραφική τεχνική έκλουσης ζωνών (zone elution), έχουν αποδείξει ότι τα χαρακτηριστικά σύνδεσης στη στατική φάση HSA δε διαφέρουν από αυτά της πρωτεΐνης εν διαλύσει. Λιγότερες μελέτες αυτού του είδους έχουν γίνει για τη στήλη AGP. Ωστόσο, η εκλεκτική συγγένεια των βασικών ενώσεων για την AGP έχει διαπιστωθεί και στη χρωματογραφική συγκράτηση. Στο Σχήμα Ι.8 απεικονίζεται η τρισδιάστατη δομή των πρωτεϊνών HSA και AGP, οι οποίες είναι και οι ευρύτερα χρησιμοποιούμενες σε αυτό το πεδίο. Η HSA είναι θετικά φορτισμένη και εμφανίζει μεγαλύτερη συγγένεια για τις όξινες ενώσεις, ενώ στην AGP, λόγω του χαμηλότερου ισοηλεκτρικού της σημείου, συνδέονται κυρίως βασικές ενώσεις. 51
Σχήμα Ι.8. Κρυσταλλογραφική δομή των πρωτεϊνών: Α) Ανθρώπινη Αλβουμίνη του Ορού (PDB καταχώρηση 3LU6) και Β) α1- Όξινη Γλυκοπρωτεΐνη (PDB καταχώρηση 3APU) Η χρωματογραφία HSA και AGP επιτρέπει, όπως και στην περίπτωση των στηλών ΙΑΜ, τη χρήση 100% υδατικής κινητής φάσης, ενώ συνήθως επιλέγεται η τιμή ph 7.0 (ή 7.4). Οι οργανικοί τροποποιητές οι οποίοι χρησιμοποιούνται είναι το ακετονιτρίλιο και η 2-προπανόλη (ισοπροπανόλη). Στο σημείο αυτό, εντούτοις, αξίζει να σημειωθεί ότι στην περίπτωση της στήλης AGP έχει παρατηρηθεί σημαντική επίδραση του είδους και του ποσοστού του οργανικού τροποποιητή στη συγκράτηση. Σημαντικές διαφορές έχουν προκύψει τόσο μεταξύ ισοκρατικών τιμών logk σε ίδια ποσοστά διαφορετικού τροποποιητή, όσο και μεταξύ των ανηγμένων τιμών logk w και των αντίστοιχων ισοκρατικών [145]. Η λιποφιλία επηρεάζει σε μεγάλο βαθμό την πρωτεϊνική σύνδεση και, συνεπώς, έχει μελετηθεί με ανάλυση QSRR η συσχέτιση ανάμεσα στο συντελεστή μερισμού logp και τα χρωματογραφικά μεγέθη logk HSA και logk AGP. Η συσχέτιση αυτή είναι ως επί το πλείστον γραμμική. Ωστόσο, έχει διαπιστωθεί ότι το μέγεθος της λιποφιλίας μπορεί να επηρεάζει την επίδρασή της στη συγκράτηση [146]. Για παράδειγμα, για μία σειρά παραγώγων κινολόνης οι τιμές logd οδήγησαν σε καμπύλη ψευδο- 52
κορεσμού (quasi- saturation) ως προς τη συγκράτηση και στις δύο στήλες HSA και AGP, με το γραμμικό τμήμα να ορίζεται από τα λιγότερο λιπόφιλα ανάλογα. Τα ευρήματα αυτά πιθανώς συνδέονται με το βαθμό μη ειδικών αλληλεπιδράσεων των αναλυτών με τις στατικές φάσεις. Για την ίδια σειρά ενώσεων, εντούτοις, παρατηρήθηκε πολύ καλή συσχέτιση μεταξύ της συγκράτησης HSA και AGP, παρά τη διαφορά στο ακινητοποιημένο στη στήλη βιολογικό υλικό [146]. Αντίστοιχα, καλή συσχέτιση μεταξύ της συγκράτησης HSA και AGP έχει παρατηρηθεί για μία σειρά πολικών παραγώγων σεληνίου, υποδεικνύοντας σημαντικό βαθμό ομοιότητας στη συγκράτηση των μορίων από τις δύο στήλες, ενώ δεν παρατηρήθηκε καλή συσχέτιση με τη λιποφιλία και στις δύο περιπτώσεις [147, 148]. Η επίδραση των ηλεκτροστατικών δυνάμεων στη συγκράτηση από τη στήλη HSA έχει, επίσης, μελετηθεί με ανάλυση QSRR. Σε μία μελέτη 59 φαρμακευτικών μορίων ποικίλης δομής, η εισαγωγή των όρων F + και F - οδήγησε σε στατιστικά σημαντική βελτίωση της αρχικής μέτριας συσχέτισης ανάμεσα στον παράγοντα χωρητικότητας και τη λιποφιλία [149]. Ο συντελεστής της παραμέτρου F - είχε θετικό πρόσημο, όπως ήταν αναμενόμενο δεδομένου ότι η πρωτεΐνη συνδέεται ισχυρότερα με όξινα μόρια. Αντιθέτως, ο χαμηλότερος βαθμός συγκράτησης των πρωτονιωμένων βάσεων από τη στήλη αντικατοπτρίστηκε στο αρνητικό πρόσημο του συντελεστή της παραμέτρου F +. Όπως αναφέρθηκε προηγουμένως, η δυνατότητα προσομοίωσης της πρωτεϊνικής σύνδεσης με τη χρωματογραφία ΗSA έχει μελετηθεί διεξοδικά τα τελευταία είκοσι χρόνια. Από την αρχή αυτής της προσπάθειας, διαπιστώθηκε ότι είναι δυνατό να εξαχθεί επιτυχής συσχέτιση μεταξύ του ποσοστού πρωτεϊνικής σύνδεσης (% PPB, Protein Plasma Binding) και του βαθμού συγκράτησης από τη στήλη HSA εκφρασμένου ως k /(k + 1) για σειρές δομικά συγγενών ενώσεων [150-152]. Διευρύνοντας τη χημειοποικιλότητα της σειράς δεδομένων, οι Beaudry και συν. 53
εισήγαγαν ως επιπλέον χρωματογραφικό όρο το κανονικοποιημένο εύρος κορυφής προκειμένου η συσχέτιση ανάμεσα στη συγκράτηση και το %PPB να καταστεί ικανοποιητική (R 2 = 0.824) [152]. Πρόσφατα, θεωρήθηκε περισσότερο δόκιμος ο σχετιζόμενος με την ελεύθερη ενέργεια όρος logκ, ο οποίος υπολογίζεται βάσει της Εξίσωσης Ι.17 και αποτελεί το φαινόμενο συντελεστή πρωτεϊνικής σύνδεσης: logk= log[%ppb/ (101-%PPB)] (Ι.17) Στην Εξίσωση Ι.15, ο αριθμός 101 χρησιμοποιείται αντί του 100 προκειμένου για ενώσεις με σχεδόν 100% πρωτεϊνική σύνδεση. Οι Valko και συν. κατασκεύασαν καμπύλη αναφοράς (Εξ. Ι.17) με βαθμιδωτούς χρόνους συγκράτησης χρησιμοποιώντας εννέα πρότυπες ενώσεις οι οποίες είναι γνωστό ότι προσδένονται στις κύριες θέσεις σύνδεσης της HSA [153]: logk= slope *logk(tr) + intercept (Ι.18) Η Εξίσωση Ι.18 επικυρώθηκε χρησιμοποιώντας μία μεγάλη σειρά δομικώς διαφορετικών ενώσεων και οι υπολογιστικές τιμές %HSA έδειξαν αποδεκτή συσχέτιση με τις τιμές %HSA οι οποίες είχαν ληφθεί από συμβατικές πειραματικές μεθόδους. Σε μία πρόσφατη μελέτη, διαπιστώθηκε ότι για σειρά δεδομένων αποτελούμενη από 43 φαρμακευτικές ενώσεις ποικίλης δομής, το μέγεθος logk έδειξε καλύτερη συσχέτιση με τον ισοκρατικό παράγοντα χωρητικότητας προσδιορισμένο παρουσία 10% ακετονιτριλίου logk 10 [149]. Λαμβάνοντας υπ όψη τη σημασία της εφαρμογής των βιομιμητικών χρωματογραφικών μεθόδων (ΙΑΜ, HSA, AGP) στη μελέτη διαφόρων φαρμακοκινητικών διαδικασιών, έχει προταθεί η από κοινού χρήση δεδομένων ΙΑΜ και HSA για την πρόβλεψη του όγκου κατανομής (Vd) [154], οπότε και εξήχθη το παρακάτω μοντέλο (Εξ. Ι.19): logvd= 1.36-0.33logK HSA +0.56logK IAM -0.033CMR -0.37negative charge (Ι.19) 54
n= 42, r=0.902, s= 0.20 Οι παράμετροι logk IAM και logk HSA, οι οποίες έχουν προσδιοριστεί χρωματογραφικά, εκφράζουν πρόσδεση σε ιστούς και πρωτεϊνική σύνδεση, αντίστοιχα, δηλαδή τις δύο βασικές διαδικασίες οι οποίες επηρεάζουν τον όγκο κατανομής, ενώ CMR είναι η υπολογισμένη μοριακή διαθλασιμότητα. Η προσέγγιση αυτή εφαρμόστηκε και σε σειρές περισσότερων δεδομένων, με επίσης καλά στατιστικά στοιχεία. Αξίζει να σημειωθεί, επίσης, ότι αντικατάσταση των χρωματογραφικών δεικτών logk HSA και logk IAM από τον υπολογισμένο συντελεστή μερισμού clogp οδήγησε σε σημαντική μείωση των στατιστικών στοιχείων, όπως φαίνεται στην Εξίσωση Ι.20. logvd= 1.95 +0.052clogP -0.03CMR -0.62negative charge +0.45 positive charge (Ι.20) n= 42, r=0.75, s= 0.34 55
ΣΚΟΠΟΣ ΤΗΣ ΕΡΓΑΣΙΑΣ Σκοπός της παρούσας εργασίας είναι η διερεύνηση του χρωματογραφικού προφίλ πέντε ενώσεων, οι οποίες ανήκουν στη φαρμακολογική κατηγορία των Ανταγωνιστών Υποδοχέων Αγγειοτασίνης ΙΙ Υποτύπου 1 (Σαρτάνες), και η εφαρμογή χημειομετρικών μεθόδων για την επικαιροποίηση μοντέλων QSRR. Για την επίτευξη των παραπάνω, το πειραματικό μέρος διαιρείται σε δύο τμήματα. Το πρώτο τμήμα αφορά στον πειραματικό προσδιορισμό της χρωματογραφικής συγκράτησης σε τρεις βιομιμητικές χρωματογραφικές στήλες (ΙΑΜ, HSA, AGP) των πέντε σαρτανών και διεξοδική ανάλυση των αποτελεσμάτων. Το δεύτερο τμήμα αφορά στην επικαιροποίηση και αξιολόγηση μοντέλων QSRR, χρησιμοποιώντας δεδομένα τα οποία έχουν προσδιοριστεί σε διαφορετικό χρόνο και πειραματικά δεδομένα της παρούσας εργασίας. Τα μοντέλα αξιολογούνται ως προς την προβλεπτική τους ικανότητα και το πεδίο εφαρμογής τους, ενώ παράλληλα κρίνεται η καταλληλότητα των χρησιμοποιούμενων στατιστικών και διαγνωστικών εργαλείων για το σκοπό αυτό. 56
ΚΕΦΑΛΑΙΟ ΙΙ ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ Α ΧΡΩΜΑΤΟΓΡΑΦΙΚΗ ΑΝΑΛΥΣΗ ΑΝΤΑΓΩΝΙΣΤΩΝ ΥΠΟΔΟΧΕΩΝ ΑΓΓΕΙΟΤΑΣΙΝΗΣ ΙΙ ΥΠΟΤΥΠΟΥ 1 1. ΕΙΣΑΓΩΓΗ 1.1. Υπό μελέτη ενώσεις Στην παρούσα εργασία μελετήθηκαν πειραματικά πέντε ενώσεις, εκπρόσωποι της φαρμακολογικής κατηγορίας των Ανταγωνιστών Υποδοχέων Αγγειοτασίνης ΙΙ Υποτύπου 1 (Angiotensin II receptor blockers, ARBs, ΑΤ 1 - blockers, Sartans) σε τρεις διαφορετικές χρωματογραφικές στήλες (Τεχνητών Ακινητοποιημένων Μεμβρανών, Ανθρώπινης Αλβουμίνης του Ορού και α1-όξινης Γλυκοπρωτεΐνης). Οι χημικές δομές των υπό μελέτη ενώσεων απεικονίζονται στο Σχήμα ΙI.1. Όπως φαίνεται και στο Σχήμα ΙΙ.1, όλες οι ενώσεις φέρουν το δακτύλιο του τετραζολίου, ο οποίος αποτελεί όξινο κέντρο και θεωρείται ισοστερής της ομάδας του καρβοξυλικού οξέος. Οι ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη φέρουν επιπλέον όξινο κέντρο (καρβοξυλική ομάδα). Επιπροσθέτως, οι ενώσεις Καντεσαρτάνη, Καντεσαρτάνη σιλεξετίλ, EXP3174 και Λοσαρτάνη φέρουν και μία ετεροκυκλική βασική ομάδα, η οποία είναι το 1Η-βενζοϊμιδαζόλιο στις δύο πρώτες περιπτώσεις και το 1Η-ιμιδαζόλιο στις δύο τελευταίες. Συνεπώς, ως προς την οξεοβασική συμπεριφορά, οι ενώσεις Καντεσαρτάνη σιλεξετίλ και Λοσαρτάν αποτελούν αμφολύτες, οι ενώσεις Καντεσαρτάνη και EXP3174 φέρουν ένα βασικό και δύο όξινα κέντρα, ενώ η Βαλσαρτάνη φέρει δύο όξινα κέντρα και στερείται βασικού. Η ένωση Καντεσαρτάνη σιλεξετίλ προέρχεται από εστεροποίηση της καρβοξυλικής ομάδας της ένωσης Καντεσαρτάνη με την κυκλοεξυλοκαρβονυλοξυαιθυλική ομάδα 57
και αποτελεί προφάρμακο της Καντεσαρτάνης. Η ένωση EXP3174 αποτελεί ενεργό μεταβολίτη της ένωσης Λοσαρτάνη και προέρχεται από οξείδωση της αλκοολικής ομάδας προς καρβοξυλικό οξύ. Καντεσαρτάνη Καντεσαρτάνη σιλεξετίλ Λοσαρτάνη Βαλσαρτάνη Σχήμα ΙI.1. Οι χημικές δομές των υπό μελέτη ενώσεων. Με κυανό χρώμα επισημαίνονται τα βασικά κέντρα και με ρόδινο τα όξινα. 1.2. Βιβλιογραφικά δεδομένα Το γεγονός ότι εξεταζόμενες ενώσεις φέρουν περισσότερα του ενός ιονιζόμενα κέντρα έχει ως συνέπεια να απαντώνται σε διάφορες ιοντικές καταστάσεις, ανάλογα με την τιμή του ph. Είναι συνεπώς απαραίτητη η γνώση των σταθερών ιονισμού των ενώσεων αυτών, καθώς φυσικοχημικές και φαρμακοκινητικές παράμετροι (λιποφιλία, διαλυτότητα, διαπερατότητα, απορρόφηση κλπ) επηρεάζονται σημαντικά από την παρουσία των διαφόρων ιοντικών μορφών. Επιπλέον, η γνώση της οξεο-βασικής 58
ισορροπίας των υπό μελέτη ενώσεων αποτελεί σημαντικό αρωγό κατά την χρωματογραφική ανάλυση, καθώς συνεισφέρει στην πρόβλεψη της επίδρασης των χρωματογραφικών συνθηκών (ph και σύσταση κινητής φάσης) στη συγκράτηση των ενώσεων από τη στατική φάση. Στη βιβλιογραφία είναι διαθέσιμος ένας περιορισμένος αριθμός μελετών σχετικά με τον προσδιορισμό των σταθερών ιονισμού των μορίων αυτών, ενώ υπάρχει δυσκολία στην ερμηνεία των πειραματικών αποτελεσμάτων λόγω της παρουσίας περισσότερων του ενός ιονιζόμενων κέντρων. Οι Cagigal και συν., σε μία από τις πρώτες μελέτες στο πεδίο αυτό, επέλεξαν την τεχνική της φθορισμομετρίας για τον προσδιορισμό των σταθερών οξύτητας των ενώσεων Καντεσαρτάνη, Καντεσαρτάνη σιλεξετίλ, Λοσαρτάνη και Βαλσαρτάνη [155]. Η εφαρμογή της φθορισμομετρίας καθίσταται εφικτή εξαιτίας της παρουσίας φθορισμοφόρων ομάδων, όπως διφαινύλιο, ιμιδαζόλιο και βενζιμιδαζόλιο. Η επιλογή της τεχνικής αυτής έναντι της φασματοφωτομετρίας υπεριώδους - ορατού (UV-Vis), η οποία εφαρμόζεται εκτενέστερα στον προσδιορισμό σταθερών ιονισμού, οφείλεται στην ανεπαρκή μεταβολή του φάσματος συναρτήσει του ph που εμφανίζουν οι ενώσεις αυτές, με εξαίρεση το Καντεσαρτάνη σιλεξετίλ. Οι τιμές pka οι οποίες προσδιορίστηκαν με τη μέθοδο αυτή αποδόθηκαν σε κάθε περίπτωση στον ιονισμό της ομάδας του τετραζολίου (pka = 3.8 για τη Καντεσαρτάνη, pka = 5.9 για τη Καντεσαρτάνη σιλεξετίλ, pka = 3.1 για τη Λοσαρτάνη και pka = 4.6 για τη Βαλσαρτάνη), ενώ δεν δίδεται τιμή για τη βασική ομάδα. Σε μία μεταγενέστερη μελέτη, οι Tosco και συν., επισημαίνουν την πολυπλοκότητα του προφίλ ιονισμού των συγκεκριμένων ενώσεων λόγω της πολύ μικρής διαφοράς μεταξύ των τιμών των σταθερών ισορροπίας των διαφόρων ιονιζόμενων κέντρων [156]. Οι συγγραφείς εφάρμοσαν την τεχνική της ποτενσιομετρίας για τον προσδιορισμό των σταθερών ιονισμού των Λοσαρτάνη και Βαλσαρτάνη, ενώ για την ένωση Καντεσαρτάνη 59
εκτός από την ποτενσιομετρία χρησιμοποιήθηκε και η τεχνική της τριχοειδούς ηλεκτροφόρησης. Λόγω της δυσδιαλυτότητας των ενώσεων η ποτενσιομετρική μέθοδος πραγματοποιήθηκε παρουσία οργανικού διαλύτη και στη συνέχεια έγινε αναγωγή σε 0% τροποποιητή. Με τον τρόπο αυτό κατέστη δυνατή η σωστή απόδοση των τιμών pka στις αντίστοιχες ιονιζόμενες ομάδες. Οι τιμές pka οι οποίες προσδιορίστηκαν συνοψίζονται στον Πίνακα ΙI.1. Για την ένωση Καντεσαρτάνη σιλεξετίλ εφαρμόστηκαν και οι δύο προαναφερθείσες τεχνικές. Ωστόσο, οι δύο τιμές pka οι οποίες προσδιορίστηκαν αποδόθηκαν στην ένωση Καντεσαρτάνη η οποία προέκυψε με υδρόλυση. Τέλος, σε μία πιο πρόσφατη εργασία, επιχειρήθηκε ο προσδιορισμός των (φαινόμενων) τιμών pka για τέσσερις ΑΤ1 ανταγωνιστές, μεταξύ των οποίων και οι ενώσεις Λοσαρτάνη και Βαλσαρτάνη, με τη μέθοδο της χρωματογραφίας αντιστρόφου φάσεως σε εύρος τιμών ph 2.5-8.0, παρουσία ακετονιτριλίου σε αναλογίες 50, 55 και 60%. Σε αναλογία ακετονιτριλίου 50% η ένωση Λοσαρτάνη εμφάνισε κωδωνοειδή καμπύλη συσχέτισης παράγοντα χωρητικότητας ως προς τιμή ph, ενώ στην ίδια αναλογία ακετονιτριλίου η αντίστοιχη καμπύλη για την ένωση Βαλσαρτάνη ήταν σιγμοειδής. Και για τις δύο ενώσεις προσδιορίστηκαν δύο τιμές pka εφαρμόζοντας μη γραμμική ανάλυση παλινδρόμησης σε δεδομένα παράγοντα χωρητικότητας/ ph. Στην περίπτωση της Λοσαρτάνης, η pka, η οποία παρουσίασε μείωση με την αύξηση του ποσοστού του οργανικού τροποποιητή, αποδόθηκε στον ιονισμό του ιμιδαζολίου (3.37 για 50% ACN, 3.34 για 55% ACN και 3.33 για 60% ACN), ενώ η pka η οποία παρουσίασε αύξηση με την αύξηση του ποσοστού του οργανικού τροποποιητή αποδόθηκε στον ιονισμό του τετραζολίου (6.00 για 50% ACN, 6.00 για 55% ACN και 6.12 για 60% ACN). Για την ένωση Βαλσαρτάνη η pka με τη χαμηλότερη τιμή αποδόθηκε στον ιονισμό του καρβοξυλικού οξέος (4.98 για 50% ACN, 5.14 για 55% ACN και 5.32 για 60% ACN) 60
και η δεύτερη στον ιονισμό του τετραζολίου (6.13 για 50% ACN, 6.16 για 55% ACN και 6.19 για 60% ACN). [157] Βάσει, συνεπώς, των σταθερών ιονισμού οι οποίες έχουν προκύψει από τη βιβλιογραφία, οι ενώσεις Καντεσαρτάνη και Λοσαρτάνη, δεν απαντώνται υπό την αδιάστατη μορφή, καθώς υπάρχει αλληλοεπικάλυψη των τιμών pka (διαφορά< 2). Αντιθέτως, η ένωση Βαλσαρτάνη σε χαμηλές τιμές ph απαντάται κυρίως υπό την αδιάστατη μορφή, καθώς είναι πρωτονιωμένες και οι δύο όξινες ομάδες τις οποίες φέρει. Στο φυσιολογικό ph (7.4), η Λοσαρτάνη αναμένεται να βρίσκεται κυρίως υπό την ανιονική μορφή, ενώ οι Βαλσαρτάνη και Καντεσαρτάνη κυρίως υπό τη διανιονική μορφή. Στον Πίνακα ΙΙ.2 περιλαμβάνονται οι τιμές των σταθερών ιονισμού των υπό μελέτη ενώσεων οι οποίες υπολογίστηκαν με τη χρήση των λογισμικών ACD και ADMEBoxes(PharmaAlgorithms). Συγκρίνοντας τα δεδομένα των δύο πινάκων για τις ενώσεις Καντεσαρτάνη, Λοσαρτάνη και Βαλσαρτάνη παρατηρείται ότι όσον αφορά στα όξινα κέντρα (τετραζόλιο και καρβοξυλικό οξύ) οι πειραματικές τιμές είναι αρκετά κοντά με τις υπολογιστικές. Εξαίρεση αποτελεί η τιμή pka καρβ.οξεος βάσει του λογισμικού ACD για την Καντεσαρτάνη, η οποία είναι σημαντικά μεγαλύτερη από την αντίστοιχη πειραματική (pka πειρ = 3.34/3.67, pka υπολ = 6.44). Εντούτοις, όσον αφορά στη βασικότητα του ιμιδαζολίου (Λοσαρτάνη) και του βενζιμιδαζολίου (Καντεσαρτάνη) φαίνεται ότι υπερτιμάται σημαντικά από το πρόγραμμα ADMEBoxes. Αντιθέτως, οι αντίστοιχες τιμές οι οποίες υπολογίστηκαν με το λογισμικό ACD βρίσκονται αρκετά κοντά στις πειραματικές. Συνεπώς, το λογισμικό ADMEBoxes δεν μπορεί να θεωρηθεί αξιόπιστο όσον αφορά τον υπολογισμό του συντελεστή κατανομής των συγκεκριμένων ενώσεων στις διάφορες τιμές ph. Στο σημείο αυτό θα πρέπει, επίσης, να σημειωθεί ότι η βασικότητα του ιμιδαζολίου 61
μειώνεται σημαντικά με υποκατάσταση της 4 θέσης (Η) από χλώριο ( pka= 7.05 και 3.55, αντίστοιχα) και του βενζιμιδαζολίου από την υποκατάσταση των θέσεων 2 και 1 από την αιθόξυ- και βενζυλ- ομάδα, αντίστοιχα, στοιχεία τα οποία δε φαίνεται να λαμβάνει υπ όψη το πρόγραμμα ADMEBoxes. Επιπλέον, η υποκατάσταση της θέσης 7 του βενζιμιδαζολίου από καρβοξυλικό οξύ ή καρβοξυλικό μεθύλιο προκαλεί περαιτέρω μείωση της βασικότητας (pka= 2.12 και 2.38, αντίστοιχα) [156]. Κατά συνέπεια, η τιμή pka η οποία δίνεται και από τα δύο προγράμματα για την ένωση Καντεσαρτάνη σιλεξετίλ, δεδομένου ότι η θέση 7 του βενζιμιδαζολίου φέρει εστερική ομάδα, δεν μπορεί να θεωρηθεί αξιόπιστη. Πίνακας II.1. Πειραματικά προσδιορισμένες τιμές των σταθερών ιονισμού των ενώσεων Λοσαρτάνη, Βαλσαρτάνη και Καντεσαρτάνη [156]. Ένωση pka βάσης pka τετραζολίου pka καρβοξ.οξέος Μέθοδος Λοσαρτάνη 2.95±0.05 4.25±0.04 Ποτενσιομετρία Βαλσαρτάνη 4.70±0.01 3.60 ±0.05 Ποτενσιομετρία Καντεσαρτάνη 2.12±0.19 4.50±0.24 3.34±0.36 Τριχοειδής ηλεκτροφόρηση 4.66±0.04 3.67±0.04 Ποτενσιομετρία Πινάκας ΙΙ.2. Υπολογισμένες τιμές των σταθερών ιονισμού των υπό μελέτη ενώσεων. Ένωση pka βάσης pka τετραζολίου pka καρβοξ.οξέος Λογισμικό Καντεσαρτάνη 2.48(±0.30) 4.23(±0.29) 6.44(±0.32) ACD 5.00(±1.90) 3.80(±0.80) ADMEBoxes Σιλεξετίλ 4.24(±0.32) 4.22(±0.29) ACD 5.00(±1.90) 4.50(±0.50) ADMEBoxes EXP3174* 0.78(±0.50) 4.23(±0.29) 3.17(±0.49) ACD 5.00(±1.90) 3.20(±1.10) ADMEBoxes Λοσαρτάνη 3.09(±0.39) 4.24(±0.29) ACD 6.20(±0.50) 4.50(±0.50) ADMEBoxes Βαλσαρτάνη 4.23(±0.29) 3.69(±0.10) ACD 2.90(±0.50) ADMEBoxes *Η χημική δομή σχεδιάστηκε με το πρόγραμμα ChemDraw διότι δεν ήταν διαθέσιμη στη βάση δεδομένων. 62
Μια πολύ σημαντική φυσικοχημική παράμετρος η οποία επηρεάζεται σε μεγάλο βαθμό από την πολύπλοκη οξεοβασική ισορροπία των ενώσεων αυτών είναι η λιποφιλία. Ο προσδιορισμός του συντελεστή μερισμού των ενώσεων Καντεσαρτάνη, Καντεσαρτάνη σιλεξετίλ, Λοσαρτάνη και Βαλσαρτάνη επιχειρήθηκε από τους Tosco και συν. [156]. Η ένωση Βαλσαρτάνη επιδεικνύει την τυπική σιγμοειδή καμπύλη (logd-ph) των ενώσεων οι οποίες φέρουν δύο όξινα κέντρα με κοντινές τιμές pka. Εφόσον η ένωση απαντάται υπό την αδιάστατη μορφή σε τιμές ph<1.6, ήταν δυνατός ο προσδιορισμός του συντελεστή μερισμού ποτενσιομετρικά (logp=3.78) ο οποίος συμπίπτει με το συντελεστή κατανομής σε ph=1.0. Αντιθέτως, για τις ενώσεις Καντεσαρτάνη και Λοσαρτάνη, υπήρξε δυνατός ο υπολογισμός της μέγιστης τιμής του συντελεστή κατανομής logd max μέσω των τιμών logd σε διάφορα ph με τη μέθοδο της ανακινούμενης φιάλης (logd max =3.36 και 3.09, αντίστοιχα), καθώς οι ενώσεις αυτές δεν απαντώνται υπό την αδιάστατη μορφή. Οι ενώσεις αυτές παρουσιάζουν κωδωνοειδή καμπύλη logd-ph. Η μελέτη της λιποφιλίας της ένωσης Καντεσαρτάνη σιλεξετίλ δεν κατέστη δυνατή λόγω της υδρόλυσης της ένωσης και της χαμηλής της διαλυτότητας. Μία εναλλακτική προσέγγιση εκτίμησης της λιποφιλίας ορισμένων ΑΤ1 ανταγωνιστών αποτέλεσε η εφαρμογή υγρής χρωματογραφίας αντιστρόφου φάσεως (RP-LC) και χρωματογραφίας λεπτής στιβάδας αντιστρόφου φάσεως (RP-TLC) [158]. Σε αυτήν την περίπτωση τα μεγέθη logk w και R Mw, αντίστοιχα, τα οποία εξήχθησαν με αναγωγή σε 0% οργανικού τροποποιητή σε ph=5.0, χρησιμοποιήθηκαν για την πρόβλεψη του συντελεστή μερισμού μέσω κατασκευής πρότυπης εξίσωσης με γραμμική παλινδρόμηση. Οι τιμές logp παρουσίασαν σχετικά μεγάλη διακύμανση, ανάλογα με τον οργανικό τροποποιητή ο οποίος χρησιμοποιήθηκε (ακετονιτρίλιο ή μεθανόλη) και τη μέθοδο (ισοκρατική RP-LC, βαθμιδωτή RP-LC, RP-TLC) και διέφεραν από τις τιμές οι 63
οποίες είχαν προσδιοριστεί από τους Tosco και συν., οι οποίες συνοψίζονται στον Πίνακα ΙΙ.3 [ ]. Επιπλέον παρουσιάζονται και οι υπολογιστικές τιμές με βάση τα λογισμικά ClogP/BioByte (ClogP) και ADME Boxes (logpadme). Πίνακας ΙΙ.3. Πειραματικές [156] και υπολογιστικές τιμές του συντελεστή μερισμού των υπό μελέτη ενώσεων. Ένωση logp/logd max ClogP logpadme (πειραματικό) Καντεσαρτάνη 3.36 5.18 4.26 Καντεσαρτάνη 7.28 6.21 σιλεξετίλ EXP3174 4.59 3.54 Λοσαρτάνη 3.09 3.85 2.86 Βαλσαρτάνη 3.78 4.86 2.81 Ένας σημαντικός αριθμός μελετών αφορά, επίσης, στην αλληλεπίδραση ορισμένων ΑΤ1 ανταγωνιστών με τις λιπιδικές διπλοστιβάδες των κυτταρικών μεμβρανών. Μέσω εφαρμογής βιοφυσικών τεχνικών (φασματοσκοπία πυρηνικού μαγνητικού συντονισμού, διαφορική θερμιδομετρία σάρωσης, φασματοσκοπία Raman, σκέδαση ακτίνων-χ) και υπολογιστικών μεθόδων (μοριακή προσομοίωση) παρατηρήθηκε ότι τα μόρια αυτά τοποθετούνται στην πολική/άπολη διεπιφάνεια της λιπιδικής διπλοστιβάδας [159]. Επίσης, ασκούν ηλεκτροστατική άπωση στις γειτονικές μεμβράνες η ένταση της οποίας εξαρτάται από την οξύτητα (pka) της ομάδας του τετραζολίου. Η διαπίστωση ότι τα μόρια αυτά χαρακτηρίζονται από ένα είδος «δακτυλικού αποτυπώματος» κατά την αλληλεπίδρασή τους με τις κυτταρικές μεμβράνες, οδήγησε στην υπόθεση ότι το χαρακτηριστικό αυτό εμπλέκεται στην εκδήλωση της φαρμακολογικής τους δράσης. Συνεπώς, καθίσταται αναγκαία η μελέτη των αλληλεπιδράσεων των μορίων αυτών με τις λιπιδικές στιβάδες. 64
Συμπερασματικά, όσον αφορά στο φυσικοχημικό προφίλ των υπό μελέτη ΑΤ1 ανταγωνιστών, τα βιβλιογραφικά δεδομένα είναι σχετικά περιορισμένα και συχνά αντικρουόμενα. Καθίσταται, ωστόσο, σαφής η πολυπλοκότητα των φυσικοχημικών ιδιοτήτων των ενώσεων αυτών. Επιπροσθέτως, επισημαίνεται η σημασία της αλληλεπίδρασης των μορίων αυτών με τις κυτταρικές μεμβράνες. Για το λόγο αυτό, στο πειραματικό μέρος της παρούσας εργασίας επιχειρείται διερεύνηση της χρωματογραφικής τους συμπεριφοράς σε βιομιμητικές στήλες. 2. ΑΝΤΙΔΡΑΣΤΗΡΙΑ, ΟΡΓΑΝΟΛΟΓΙΑ, ΧΡΩΜΑΤΟΓΡΑΦΙΚΕΣ ΣΥΝΘΗΚΕΣ Αντιδραστήρια Ως οργανικοί τροποποιητές χρησιμοποιήθηκαν ακετονιτρίλιο και 2-προπανόλη (ισοπροπανόλη) υψηλής καθαρότητας (HPLC-grade), της εταιρίας Lab-Scan. Για την παρασκευή των ρυθμιστικών διαλυμάτων χρησιμοποιήθηκαν όξινο φωσφορικό νάτριο, δισόξινοφωσφορικό κάλι, χλωριούχο νάτριο, χλωριούχο κάλι (υδροχλωρικό και φωσφορικό οξύ) της εταιρείας Merck, Darmstadt, Germany. Το νερό ήταν απιονισμένο και καθαρισμένο μέσω του συστήματος παραγωγής νερού Milli-Q Plus (Millipore). Οργανολογία Χρησιμοποιήθηκε σύστημα Υγρης Χρωματογραφίας Υψηλής Απόδοσης (High Performance Liquid Chromatography, HPLC) αποτελούμενο από αντλία GBC Model 1126, σύστημα ένεσης δείγματος Rheodyne Model 7725i GBC με βρόχο 20 μl και ανιχνευτή GBC Model LC1210 UV-Vis ρυθμισμένο στα 210 nm. Η καταγραφή των 65
χρωματογραφημάτων πραγματοποιήθηκε με το λογισμικό Empower Built 1154, Waters Corporation 2002. Στατικές φάσεις Χρησιμοποιήθηκαν τρεις διαφορετικές βιομιμητικές στήλες: 1. Στήλη Ακινητοποιημένων Τεχνητών Μεμβρανών (Immobilized Artificial Membranes) IAM.PC.DD2 10μm (30 x 4,6 mm i.d.), Regis Technology, USA. Το υλικό πληρώσεως της στήλης είναι πήγμα οξειδίου του πυριτίουπροπυλαμίνης σιλανοποιημένο με μόρια φωσφατιδυλο-χολίνης. 2. Στήλη Ανθρώπινης Αλβουμίνης του Ορού (Human Serum Albumin) ChromTech CHIRAL-HSA (50 mm x 4 mm i.d.), Supelco, USA. 3. Στήλη α1-όξινης Γλυκοπρωτεΐνης (α1-acidic Glycoprotein, AGP) ChromTech CHIRAL-AGP column (50 mm 4.0 mm i.d.), Supelco, USA. Μέτρηση του ph Το σύστημα μέτρησης των τιμών ph το οποίο χρησιμοποιήθηκε ήταν της εταιρείας Metrohm. Ρυθμιστικά διαλύματα Ι. Ισότονο ρυθμιστικό διάλυμα φωσφορικών 0.01Μ (Phosphate Buffer Saline, PBS) με ρύθμιση της οξύτητας του διαλύματος σε pη 7.4. Για την παρασκευή του διαλύματος χρησιμοποιήθηκαν 1.5 mm δισόξινου φωσφορικού καλίου και 8.1 mm όξινου φωσφορικού νατρίου και η ρύθμιση του pη σε 7.4 έγινε με τη βοήθεια διαλύματος καυστικού νατρίου. Η ιονική ισχύς του διαλύματος ρυθμίζεται με την προσθήκη 27 mm χλωριούχου καλίου και 137 mm χλωριούχου νατρίου. ΙΙ. Ισότονο ρυθμιστικό διάλυμα φωσφορικών (PBS) με ρύθμιση της οξύτητας σε pη 5.5. 66
Για την παρασκευή του διαλύματος αναμείχθηκαν 96.4 ml διαλύματος δισόξινου φωσφορικού καλίου 0.1 M και 3.6 ml διαλύματος όξινου φωσφορικού νατρίου 0.25 Μ. Η ρύθμιση του pη σε 5.5 έγινε με τη βοήθεια διαλύματος καυστικού νατρίου. Η ιονική ισχύς του διαλύματος ρυθμίζεται με την προσθήκη 27 mm χλωριούχου καλίου και 137 mm χλωριούχου νατρίου. III. Ισότονο ρυθμιστικό διάλυμα φωσφορικών (PBS) με ρύθμιση της οξύτητας σε pη 3.0. Για την παρασκευή του διαλύματος χρησιμοποιήθηκαν 0.025 M δισόξινου φωσφορικού καλίου και η ρύθμιση του pη σε 3.0 έγινε με τη βοήθεια διαλύματος φωσφορικού οξέος. Η ιονική ισχύς του διαλύματος ρυθμίζεται με την προσθήκη 27 mm χλωριούχου καλίου και 137 mm χλωριούχου νατρίου. IV. Ρυθμιστικό διάλυμα φωσφορικών με ρύθμιση της οξύτητας σε pη 2.5. Για την παρασκευή του διαλύματος χρησιμοποιήθηκαν 0.73 M δισόξινου φωσφορικού καλίου και η ρύθμιση του pη σε 2.5 έγινε με τη βοήθεια διαλύματος υδροχλωρικού οξέος. Κινητές φάσεις Ως κινητές φάσεις χρησιμοποιήθηκαν τα ακόλουθα ρυθμιστικά διαλύματα ή μείγματα αυτών με ακετονιτρίλιο ή 2- προπανόλη (ισοπροπανόλη). Στη στήλη ΙΑΜ χρησιμοποιήθηκαν: PBS (ph=7.4) ή μείγματα ακετονιτριλίου-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-30% και βήμα 5%. PBS (ph=5.5) ή μείγματα ακετονιτριλίου-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-35% και βήμα 5%*. PBS (ph=3.0) ή μείγματα ακετονιτριλίου-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-35% και βήμα 5%*. 67
Ρυθμιστικό διάλυμα φωσφορικών (ph=2.5) ή μείγματα ακετονιτριλίουρυθμιστικού διαλύματος σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-30% και βήμα 5%*. Στη στήλη HSA χρησιμοποιήθηκε PBS (ph=7.4) ή μείγματα ακετονιτριλίου-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-30% και βήμα 5%. Στη στήλη AGP χρησιμοποιήθηκαν: PBS (ph=7.4) μείγματα ακετονιτριλίου-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-20% και βήμα 5%*. μείγματα ισοπροπανόλης-pbs σε διάφορες αναλογίες με περιεκτικότητα σε ακετονιτρίλιο από 5-20% και βήμα 5%. Προετοιμασία διαλυμάτων παρακαταθήκης Για τον μελέτη της συγκράτησης των εξεταζόμενων ενώσεων παρασκευάστηκαν διαλύματα παρακαταθήκης σε μείγμα ακετονιτριλίου-ρυθμιστικού διαλύματος PBS της τάξεως των 10-5 Μ. Η τιμή του ph του ρυθμιστικού διαλύματος το οποίο χρησιμοποιήθηκε σε κάθε περίπτωση ήταν αυτή της κινητής φάσης, εκτός από την περίπτωση της ανάλυσης σε ph = 2.5, κατά την οποία χρησιμοποιήθηκε PBS ph=3.0 για τη διάλυση των ενώσεων. Στην περίπτωση της δυσδιάλυτης ένωσης Καντεσαρτάνη σιλεξετίλ, προστέθηκε αρχικά όγκος διμεθυλοσουλφοξειδίου (DMSO) ίσος με 1% ως προς τον τελικό όγκο του διαλύματος. Τα διαλύματα διατηρήθηκαν εντός ψυκτικού θαλάμου σε θερμοκρασία 4 ο C προς αποφυγή πιθανών διασπάσεων. Σε περιπτώσεις πολύ ισχυρής ή πολύ ασθενούς συγκράτησης, το βήμα δεν ήταν πάντα 5% και επισημαίνεται σε κάθε περίπτωση. 68
Χρωματογραφική διαδικασία Κατά την ανάλυση, και στις τρεις στατικές φάσεις η ροή της κινητής φάσης ρυθμίστηκε σε 1.00 ml/min. Ειδικά στην περίπτωση της στήλης ΙΑΜ υπήρξε η δυνατότητα ρύθμισης της ροής επιπλέον στα 2.00 και 3.00 ml/min, αναλόγως των αναμενομένων χρόνων συγκράτησης, δεδομένου ότι σε αυτή τη στήλη αναπτύσσονται χαμηλότερες πιέσεις. Η πίεση που αναπτυσσόταν στη στήλη ΙΑΜ αναλογούσε σε περίπου 250 psi για κάθε ml/min ροής, ενώ στις στήλες HSA και AGP η τιμή της πίεσης ήταν 900 και 1000 psi, αντίστοιχα. Ο νεκρός χρόνος t o προσδιορίστηκε και στις τρεις περιπτώσεις με εισαγωγή δείγματος διχρωμικού καλίου. Για τον έλεγχο του συστήματος πραγματοποιήθηκε μέτρηση του νεκρού χρόνου κατά την έναρξη, στο ήμισυ και κατά τη λήξη της πειραματικής ημέρας. Ο νεκρός χρόνος t o στη στήλη IAM ήταν 0.45 min για ροή 1ml/min, 0.25 min για ροή 2 ml/min και 0.18 min για ροή 3ml/min ενώ στις στήλες HSA και AGP 0.60 και 0.55 min, αντίστοιχα. Οι αναλύσεις πραγματοποιήθηκαν σε θερμοκρασία δωματίου. Κάθε πείραμα επαναλήφθηκε τουλάχιστον εις τριπλούν. Λήφθηκε ο μέσος όρος των χρόνων και υπολογίστηκε ο παράγοντας χωρητικότητας σύμφωνα με την Εξίσωση Ι.9 (βλ. Κεφάλαιο Ι) logk= log[(t r - t 0 )/t 0 ] (Ι.9) Στην περίπτωση χρήσης οργανικού τροποποιητή προσδιορίστηκαν τουλάχιστον τέσσερις διαφορετικές ισοκρατικές τιμές logk για κάθε ένωση με σκοπό την εξαγωγή της ανηγμένης τιμής του παράγοντα χωρητικότητας logk w. Η τιμή logk w υπολογίστηκε μέσω της Εξίσωσης Ι.11 (βλ. Κεφάλαιο Ι): logk = -Sφ% +logk w (Ι.11) όπου φ% είναι το ποσοστό του οργανικού τροποποιητή ο οποίος προστίθεται στην κινητή φάση και S η κλίση της ευθείας. 69
Εκτός από την ανηγμένη τιμή logk w, προσδιορίστηκε και η αντίστοιχη ισοκρατική με τη χρήση 100% υδατικής κινητής φάσης σε περιπτώσεις ενώσεων των οποίων η συγκράτηση από τη στήλη επέτρεψε χρονικά την επίτευξη του συγκεκριμένου προσδιορισμού. Στατιστική μέθοδος Για την εξαγωγή της ανηγμένης τιμής του παράγοντα χωρητικότητας, καθώς και για την εξαγωγή γραμμικών συσχετίσεων μεταξύ των διαφόρων χρωματογραφικών μεγεθών εφαρμόστηκε Απλή Γραμμική Ανάλυση Παλινδρόμησης. Χρησιμοποιήθηκε το λογισμικό SPSS v.20.0 και ως στατιστικά μεγέθη λήφθηκαν υπόψη ο συντελεστής συσχέτισης R 2 και η τυπική απόκλιση s. 3. ΑΠΟΤΕΛΕΣΜΑΤΑ-ΣΥΖΗΤΗΣΗ 3.1. Χρωματογραφική Στήλη ΙΑΜ Α) Συγκράτηση σε ph=7.4 Επαναληψιμότητα μετρήσεων νεκρού χρόνου Όπως προαναφέρθηκε, ο νεκρός χρόνος προσδιορίστηκε κατά την έναρξη, στο ενδιάμεσο και στη λήξη κάθε ανάλυσης. Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.440±0.011 min (ή 0.440 min (±2.6%)) για το σύνολο των αναλύσεων. Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση Για όλες τις υπό μελέτη ενώσεις ελέγχθηκε η επίδραση του ποσοστού του ακετονιτριλίου στη συγκράτησή τους από τη στήλη. Για τις ενώσεις EXP3174, Λοσαρτάνη και Βαλσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 5-20% με βήμα 5%, ενώ για την ένωση Καντεσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 5-30%, επίσης με βήμα 5%. Για την ένωση Καντεσαρτάνη σιλεξετίλ 70
χρησιμοποιήθηκε 15-30%, με βήμα 5%, καθώς εμφάνισε αυξημένη συγκράτηση. Στο Σχήμα ΙΙ.2 παρουσιάζεται η συσχέτιση μεταξύ συγκράτησης από τη στήλη, εκφρασμένη με τη μορφή του δεκαδικού λογαρίθμου του παράγοντα χωρητικότητας (logk), και του ποσοστού του ακετονιτριλίου στην κινητή φάση (% φ). Για την ένωση Καντεσαρτάνη δεν ελήφθησαν υπ όψη οι τιμές logk σε 15 και 25% ακετονιτρίλιο καθώς απέκλιναν από τη γραμμικότητα. Εφαρμόζοντας την Εξίσωση Ι.11 για τουλάχιστον τέσσερις ισοκρατικές τιμές, εξήχθησαν οι ανηγμένες τιμές του παράγοντα χωρητικότητας, οι οποίες παρουσιάζονται στον Πίνακα ΙΙ.4. Επιπλέον, καταγράφονται οι τιμές της κλίσης S για κάθε ένωση, καθώς και τα βασικά στατιστικά στοιχεία της καμπύλης παλινδρόμησης (R, R 2, s). Η συσχέτιση σε όλες τις περιπτώσεις είναι πολύ καλή (R 2 0.996), και ιδιαίτερα για τις ενώσεις Καντεσαρτάνη σιλεξετίλ και Βαλσαρτάνη (R 2 = 0.999 και 1.000, αντίστοιχα). Η ένωση Καντεσαρτάνη σιλεξετίλ, η οποία σε αυτή την τιμή ph βρίσκεται υπό τη μορφή Α - και παράλληλα είναι η πλέον λιπόφιλη, παρουσιάζει την ισχυρότερη συγκράτηση, ενώ η ένωση Καντεσαρτάνη, η οποία βρίσκεται υπό τη μορφή Α 2-, την ασθενέστερη. Σημαντικό βαθμό συγκράτησης, αν και αρκετά μικρότερο από αυτό της Καντεσαρτάνης σιλεξετίλ, εμφανίζει, επίσης, η Λοσαρτάνη, η οποία απαντάται υπό τη μορφή Α -. Όπως φαίνεται και από το Σχήμα IΙ.2, οι ενώσεις EXP3174 και Βαλσαρτάνη, οι οποίες σε αυτό το ph απαντώνται και οι δύο υπό τη μορφή Α 2-, παρουσιάζουν παρόμοια συγκράτηση, λίγο μεγαλύτερη από αυτή της Καντεσαρτάνης. 71
Σχήμα ΙΙ.2. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη ΙΑΜ σε συνθήκες ph= 7.4. Πίνακας ΙΙ.4. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση. Ένωση Κλίση S Τομή logk w R R 2 s Καντεσαρτάνη -0.096(±0.004) 0.995(±0.070) 0.999 0.997 0.071 Καντεσαρτάνη -0.123(±0.002) 4.507(±0.052) 1.000 0.999 0.025 σιλεξετίλ EXP3174-0.093(±0.004) 1.469(±0.055) 0.998 0.996 0.045 Λοσαρτάνη -0.108(±0.004) 2.473(±0.060) 0.998 0.997 0.049 Βαλσαρτάνη -0.087(±0.001) 1.337(±0.014) 1.000 1.000 0.012 Συσχέτιση μεταξύ ισοκρατικών και ανηγμένων τιμών logk w Για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη υπήρξε δυνατός ο άμεσος προσδιορισμός της τιμής logk w, λόγω του μέτριου βαθμού συγκράτησής τους από τη στήλη. Στον Πίνακα ΙΙ.5 παρουσιάζονται οι ισοκρατικές και οι ανηγμένες τιμές logk w, καθώς και η σχετική επί τοις εκατό διαφορά τους. Διαπιστώθηκε ότι οι τιμές πρακτικά δεν διαφοροποιούνται, γεγονός το οποίο αντανακλάται και στην Εξίσωση ΙΙ.1: 72
logk w(isocratic) =1.059(±0.123)logk w(extrapolated) - 0.086(±0.157) (ΙΙ.1) n=3, R=0.993, R 2 =0.987, s=0.042 όπου logk w(isocratic) η ισοκρατική τιμή και logk w(extrapolated) η ανηγμένη. Η κλίση της ευθείας είναι πλησίον της μονάδας και η τομή θεωρείται ότι δε διαφέρει στατιστικά σημαντικά από το μηδέν. Πίνακας ΙΙ.5. Ανηγμένες και ισοκρατικές τιμές logk w. Ένωση Ανηγμένη τιμή Ισοκρατική τιμή %Διαφορά logkw logkw Καντεσαρτάνη 0.995 0.958-4% EXP3174 1.469 1.445-2% Βαλσαρτάνη 1.337 1.363 2% Συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S Ένας τρόπος διερεύνησης της ομοιομορφίας του μηχανισμού συγκράτησης από τη στήλη ΙΑΜ αποτελεί η συσχέτιση των ανηγμένων τιμών logk w με την κλίση S. Για τις υπό μελέτη ενώσεις ελήφθη η Εξίσωση ΙΙ.2: logk w = 0.93(±0.18)S -7.22 (±1.83) (ΙΙ.2) n=5, R=0.948, R 2 =0.899, s=0.52 Ο συντελεστής συσχέτισης είναι αρκετά καλός υποδεικνύοντας την ομοιομορφία του μηχανισμού συγκράτησης. Η ένωση η οποία εμφανίζει τη μέγιστη απόκλιση από τη γραμμικότητα είναι η Καντεσαρτάνη (σχετικό σφάλμα Er = -61%). Β) Συγκράτηση σε ph=5.5 Επαναληψιμότητα μετρήσεων νεκρού χρόνου Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.468±0.007 min (ή 0.468 min (±1.5%)) για ροή 1.00 ml/min, 0.254 ±9.3*10-5 min (ή 0.254 min (±0.036%)) για ροή 2.00 ml/min και 0.183 ±0.001 min (ή 0.183 min (±0.71%)) για ροή 3.00 ml/min. 73
Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση Για τις ενώσεις Καντεσαρτάνη, EXP3174, Λοσαρτάνη και Βαλσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 15-30% με βήμα 5%, ενώ για την ένωση Καντεσαρτάνη σιλεξετίλ χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 25-35%, επίσης με βήμα 5% καθώς και η αναλογία 22%, λόγω της αυξημένης συγκράτησης. Στο Σχήμα ΙΙ.3 παρουσιάζεται η συσχέτιση μεταξύ των τιμών logk και του ποσοστού του ακετονιτριλίου στην κινητή φάση (% φ). Οι ανηγμένες τιμές του παράγοντα χωρητικότητας παρουσιάζονται στον Πίνακα ΙΙ.6. Η καλύτερη συσχέτιση παρατηρείται στην ένωση Καντεσαρτάνη σιλεξετίλ (R 2 = 1.000), ενώ η λιγότερο ικανοποιητική αφορά στην ένωση EXP3174 (R 2 = 0.986). Όπως φαίνεται και από το Σχήμα ΙΙ.3, το προφίλ της συγκράτησης των ενώσεων δεν αλλάζει σημαντικά συγκριτικά με το ph 7.4, με την ένωση Καντεσαρτάνη σιλεξετίλ να παρουσιάζει και σε αυτή την τιμή ph την ισχυρότερη συγκράτηση και την ένωση Καντεσαρτάνη την ασθενέστερη. Οι ενώσεις EXP3174 και Βαλσαρτάνη παρουσιάζουν και σε αυτές τις συνθήκες παρόμοια συγκράτηση, λίγο υψηλότερη από την Καντεσαρτάνη. Στο σημείο αυτό θα πρέπει να αναφερθεί ότι, στην τιμή ph 5.5 έχει μειωθεί ο ιονισμός του τετραζολίου, συγκριτικά με το ph 7.4, ενώ για τις ενώσεις Λοσαρτάνη και Καντεσαρτάνη σιλεξετίλ αρχίζει η πρωτονίωση της ομάδας του ιμαδαζολίου. Επομένως, οι ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη απαντώνται στις μορφές Α 2- / ΗΑ -, και κατά συνέπεια οι αντίστοιχες τιμές logk w δε διαφοροποιούνται σημαντικά (0.37 λογαριθμικές μονάδες η μέγιστη διαφορά). Από την άλλη πλευρά, οι ενώσεις Καντεσαρτάνη σιλεξετίλ και Λοσαρτάνη βρίσκονται υπό τις μορφές Α - / ΗΑ/ ΗΑ +- παρουσιάζοντας μεγαλύτερο βαθμό συγκράτησης, συγκριτικά με τις 74
προηγούμενες ενώσεις, λόγω μεγαλύτερης δυνατότητας αλληλεπίδρασης με τα φωσφορικά ανιόντα. Σχήμα ΙΙ.3. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη ΙΑΜ σε συνθήκες ph=5.5. Πίνακας ΙΙ.6. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση. Κλίση Τομή Ένωση R R 2 s S logk w Καντεσαρτάνη -0.065(±0.002) 1.545(±0.058) 0.999 0.997 0.028 Καντεσαρτάνη -0.106(±0.002) 4.647(±0.045) 1.000 1.000 0.016 σιλεξετίλ EXP3174-0.072(±0.006) 1.915(±0.140) 0.993 0.986 0.068 Λοσαρτάνη -0.083(±0.004) 2.576(±0.092) 0.998 0.995 0.044 Βαλσαρτάνη -0.070(±0.004) 1.898(±0.086) 0.997 0.994 0.041 Συσχέτιση μεταξύ ισοκρατικών και ανηγμένων τιμών logk w Και σε αυτή την περίπτωση, για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη υπήρξε δυνατός ο προσδιορισμός της ισοκρατικής τιμής logk w. Στον Πίνακα ΙΙ.7 παρουσιάζονται οι ισοκρατικές και οι ανηγμένες τιμές logk w, καθώς και η σχετική επί τοις εκατό διαφορά τους. Οι τιμές αυτές, όπως φαίνεται και από τον πίνακα, πρακτικά δεν διαφέρουν και, συνεπώς, η συσχέτισή τους είναι ικανοποιητική όπως φαίνεται από την Εξίσωση ΙΙ.3: 75
logk w(isocratic) =0.962(±0.162)logk w(extrapolated) +0.079(±0.290) (ΙΙ.3) n=3, R=0.986, R 2 =0.973, s=0.048 Πίνακας ΙΙ.7. Ανηγμένες και ισοκρατικές τιμές logk w. Ένωση Ανηγμένη τιμή Ισοκρατική τιμή %Διαφορά logkw logkw Καντεσαρτάνη 1.545 1.566 1% EXP3174 1.915 1.954 2% Βαλσαρτάνη 1.898 1.869-2% Συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S Η συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S για συνθήκες ph=5.5 δίνεται από την Εξίσωση ΙΙ.4: logk w = 0.750(±0.055)S -3.410(±0.439) (ΙΙ.4) n=5, R=0.992, R 2 =0.984, s=0.180 Ο συντελεστής συσχέτισης της σχέσης αυτής είναι πολύ καλός, γεγονός το οποίο αντικατοπτρίζει μεγαλύτερη ομοιομορφία στο μηχανισμό συγκράτησης συγκριτικά με το ph 7.4. Η συμπεριφορά αυτή θα πρέπει να αποδοθεί σε χαμηλότερο ιονισμό των όξινων κέντρων. Γ) Συγκράτηση σε ph=3.0 Επαναληψιμότητα μετρήσεων νεκρού χρόνου Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.468±0.004 min (ή 0.468 min (±0.83%)) για ροή 1.00 ml/min και 0.183 ±0.001 min (ή 0.183 min (±0.71%)) για ροή 3.00 ml/min. Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση 76
Για τις ενώσεις Καντεσαρτάνη, EXP3174, Λοσαρτάνη και Βαλσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 20-35% με βήμα 5%, ενώ για την ένωση Καντεσαρτάνη σιλεξετίλ χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 25, 30, 32 και 35% (Σχήμα ΙΙ.4). Στον Πίνακα ΙΙ.8 περιλαμβάνονται οι ανηγμένες τιμές του παράγοντα χωρητικότητας. Η συσχέτιση σε όλες τις περιπτώσεις είναι αρκετά καλή (R 2 0.997), και ιδιαίτερα για τις ενώσεις Καντεσαρτάνη σιλεξετίλ και Λοσαρτάνη (R 2 =1.000). Συγκριτικά με τις δύο προηγούμενες χρωματογραφικές συνθήκες, το προφίλ συγκράτησης των ενώσεων διαφοροποιείται σε αυτήν την περίπτωση. Η ένωση Καντεσαρτάνη σιλεξετίλ παρουσιάζει και σε αυτή την τιμή ph την ισχυρότερη συγκράτηση, ενώ η ένωση Λοσαρτάνη την ασθενέστερη. Οι τιμές logk w για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη διαφοροποιούνται σε πολύ μικρό βαθμό, γεγονός το οποίο φαίνεται και στο Σχήμα ΙΙ.4. Οι παραπάνω παρατηρήσεις σχετίζονται με το βαθμό ιονισμού των ενώσεων σε αυτό το ph σε συνδυασμό με τη λιποφιλία. Όσον αφορά στον ιονισμό, το τετραζόλιο είναι σχεδόν αδιάστατο, ενώ ο ιονισμός του καρβοξυλικού οξέος είναι πολύ χαμηλός. Από την άλλη πλευρά, ανάλογα με το μέγεθος της βασικότητας, είναι εμφανής η πρωτονίωση των βασικών ομάδων. Κατά συνέπεια, οι ενώσεις EXP3174 και Βαλσαρτάνη απαντώνται υπό τις μορφές Η 2 Α/ ΗΑ -, παρουσιάζοντας παρόμοιο προφίλ συγκράτησης. Η Καντεσαρτάνη εμφανίζεται υπό πολλές ιοντικές μορφές (Η 2 Α/ Η 2 Α +- και σε μικρότερο βαθμό ΗΑ +2- / ΗΑ - / Η 3 Α + ). Οι ενώσεις Καντεσαρτάνη σιλεξετίλ και Λοσαρτάνη βρίσκονται υπό τις μορφές Η 2 Α + / ΗΑ/ ΗΑ +-, ωστόσο η δεύτερη εκλούεται αρκετά ταχύτερα λόγω μεγάλης διαφοράς στη λιποφιλία. Λόγω της αυξημένης συγκράτησης όλων των ενώσεων δεν ήταν δυνατός ο προσδιορισμός των ισοκρατικών τιμών logk w σε αυτό το ph. 77
Σχήμα ΙΙ.4. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη ΙΑΜ σε συνθήκες ph = 3.0. Πίνακας ΙΙ.8. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση. Κλίση Τομή Ένωση R R 2 s S logk w Καντεσαρτάνη -0.080(±0.003) 3.099(±0.094) 0.998 0.997 0.037 Καντεσαρτάνη -0.108(±0.001) 5.124(±0.045) 1.000 1.000 0.011 σιλεξετίλ EXP3174-0.080(±0.003) 3.161(±0.081) 0.999 0.997 0.032 Λοσαρτάνη -0.068(±0.001) 2.499(±0.023) 1.000 1.000 0.009 Βαλσαρτάνη -0.079(±0.002) 3.183(±0.062) 0.999 0.998 0.025 Συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S Η συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S για συνθήκες ph=3.0 δίνεται από την Εξίσωση ΙΙ.5: logk w = 0.654(±0.035)S -1.991(±0.297) (ΙΙ.5) n=5, R=0.996, R 2 =0.991, s=0.108 78
Η υψηλή τιμή του συντελεστή συσχέτισης και σε αυτή την περίπτωση αντικατοπτρίζει την αυξημένη ομοιομορφία στο μηχανισμό συγκράτησης λόγω μειωμένου ιονισμού των όξινων κέντρων. Δ) Συγκράτηση σε ph = 2.5 Κατά την ανάλυση σε συνθήκες ph=2.5 χρησιμοποιήθηκε ρυθμιστικό διάλυμα φωσφορικών και όχι PBS δεδομένου ότι σε υψηλά ποσοστά ακετονιτριλίου (>30%), παρατηρήθηκε διαχωρισμός από την υδατική φάση, πιθανώς ως αποτέλεσμα της υψηλής ιονικής ισχύος. Ωστόσο, ελέγχθηκε αν η αντικατάσταση της υδατικής συνιστώσας της κινητής φάσης οδηγεί σε αλλαγή στο χρόνο συγκράτησης των ενώσεων. Διαπιστώθηκε (σε αναλογία 30% ακετονιτριλίου) ότι για όλες τις ενώσεις η διαφορά δεν ήταν στατιστικά σημαντική και υπήρχε 1:1 συσχέτιση (Εξ. ΙΙ.6): logk PBS =1.028(±0.017)logk Phosphate 0.013(±0.014) (ΙΙ.6) n=5, R=1.000, R2=0.999, s=0.017 Επαναληψιμότητα μετρήσεων νεκρού χρόνου Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.477±0.004 min (ή 0.477 min (±0.91%)) για ροή 1.00 ml/min, 0.327±0.002 min για ροή 1.50 ml/min και 0.252 ±0.001 min (ή 0.252 min (±0.40%)) για ροή 3.00 ml/min. Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση Εξαιτίας της πολύ χαμηλής τιμής του ph, παρατηρήθηκε αυξημένη συγκράτηση για το σύνολο των ενώσεων και δεν ήταν δυνατό να διατηρηθεί το βήμα στην αναλογία του ακετονιτριλίου 5% σε όλες τις περιπτώσεις. Στην περίπτωση μάλιστα της ένωσης Καντεσαρτάνη σιλεξετίλ μελετήθηκαν οι χρόνοι συγκράτησης σε τρεις διαφορετικές συγκεντρώσεις ακετονιτριλίου (25, 27 και 30%). Για τις ενώσεις Καντεσαρτάνη, και EXP3174 χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 20, 25, 27 και 30%, για την 79
ένωση Λοσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 15-30% με βήμα 5%, ενώ για την ένωση Βαλσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 20, 21, 25, 27 και 30% (Σχήμα ΙΙ.5). Όπως φαίνεται στον Πίνακα ΙΙ.9, η συσχέτιση σε όλες τις περιπτώσεις, πλην της ένωσης Καντεσαρτάνη σιλεξετίλ (R 2 =0.954), είναι ικανοποιητική (R 2 0.993). Η συγκράτηση των ενώσεων είναι παρόμοια με αυτή σε ph 3.0, καθώς ο βαθμός ιονισμού των ενώσεων δεν διαφοροποιείται σημαντικά. Λόγω της αυξημένης συγκράτησης όλων των ενώσεων δεν ήταν δυνατός ο άμεσος προσδιορισμός των τιμών logk w σε αυτό το ph. Σχήμα ΙΙ.5. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη ΙΑΜ σε συνθήκες ph = 2.5. Πίνακας ΙΙ.9. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση. Κλίση Τομή Ένωση R R 2 s S logk w Καντεσαρτάνη -0.097(±0.005) 3.383(±0.116) 0.998 0.996 0.033 Καντεσαρτάνη -0.143(±0.031) 5.910(±0.861) 0.977 0.954 0.112 σιλεξετίλ 80
EXP3174-0.097(±0.003) 3.508(±0.075) 0.999 0.998 0.021 Λοσαρτάνη -0.082(±0.005) 2.744(±0.115) 0.996 0.993 0.055 Βαλσαρτάνη -0.096(±0.004) 3.529(±0.102) 0.997 0.995 0.034 Συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S Η συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S για συνθήκες ph=2.5 δίνεται από την Εξίσωση ΙΙ.7: logk w = 0.434(±0.057)S -0.515(±0.587) (ΙΙ.7) n=5, R=0.975, R 2 =0.951, s=0.312 Η τιμή του συντελεστή συσχέτισης είναι λιγότερο καλή συγκριτικά με τις αντίστοιχες συσχετίσεις στις άλλες τιμές ph. Η ένωση η οποία παρουσιάζει τη μέγιστη απόκλιση από τη γραμμή τάσης είναι η Λοσαρτάνη (Εr= 13%). Θα πρέπει να σημειωθεί ότι στο ph=2.5 ο ιονισμός του βασικού κέντρου είναι αρκετά σημαντικός (>50%). Ε) Διερεύνηση logk w /logd-ph προφίλ. Σύγκριση συγκράτησης στη στήλη IAM με την κατανομή στο σύστημα οκτανόλη-νερό. Στον Πίνακα ΙΙ.10 συνοψίζονται οι ανηγμένες τιμές logk w σε κάθε εξεταζόμενο ph για όλες τις υπό μελέτη ενώσεις, ενώ στον Πίνακα ΙΙ.11 οι αντίστοιχες τιμές logd. Για τις ενώσεις Καντεσαρτάνη, Λοσαρτάνη και Βαλσαρτάνη παρατίθενται οι πειραματικές τιμές logd [156].Για την Καντεσαρτάνη σιλεξετίλ η τιμή logp υπολογίστηκε με βάση την πειραματική τιμή logdmax της Καντεσαρτάνης και προστέθηκε η διαφορά ΔlogP μεταξύ των δύο ενώσεων όπως προέκυψε από τα δύο υπολογιστικά προγράμματα και η οποία ήταν η ίδια και στις δύο περιπτώσεις (ΔlogP= 2). Για τον υπολογισμό του logp της ένωσης EXP3174 προστέθηκε η διαφορά ΔlogP μεταξύ των ενώσεων EXP3174 και Λοσαρτάνη βάσει των δύο υπολογιστικών προγραμμάτων (ΔlogP= 0.7) στην πειραματική τιμή logdmax της Λοσαρτάνης. Στη συνέχεια, για τον υπολογισμό των τιμών logd εφαρμόστηκαν οι Εξισώσεις α (για αμφολύτες με pka 1(βασ) <pka 2(οξ) ) και β(για διπρωτικά οξέα με pka 1 <pka 2 ), αντίστοιχα, χρησιμοποιώντας τις τιμές pka του προγράμματος ACD για το EXP3174, ενώ για την Καντεσαρτάνη σιλεξετίλ χρησιμοποιήθηκε η υπολογιστική τιμή pka (ACD) για το όξινο κέντρο και η πειραματική τιμή της ένωσης 1-βενζυλο-2-αιθοξυ-1Η-βενζιμιδαζολιο-7- καρβοξυλικό μεθύλιο [156]. Το πρόγραμμα ADMEBoxes δε θεωρήθηκε σε αυτή την περίπτωση αξιόπιστο λόγω μη σωστής πρόβλεψης του βασικού pka. 81
Στο Σχήμα ΙΙ.6 παρουσιάζονται οι αντίστοιχες γραφικές απεικονίσεις (logk w /logd-ph προφίλ). Οι ενώσεις Λοσαρτάνη και Καντεσαρτάνη σιλεξετίλ, οι οποίες είναι αμφολύτες, εμφανίζουν κωδωνοειδή καμπύλη. Για τις υπόλοιπες τρεις ενώσεις υπερτερεί η επίδραση των δύο όξινων κέντρων, καθώς εμφανίζεται απότομη μείωση του logd με αύξηση του ph. Η συγκράτηση για τους δύο αμφολύτες, Λοσαρτάνη και Καντεσαρτάνη σιλεξετίλ, διαφοροποιείται μόνο μεταξύ των τιμών ph 2.5 και 3.0 όπου παρατηρείται μείωση και ακολούθως παραμένει σταθερή. Η αντιστροφή της καμπύλης logkw/ ph πιθανώς να οφείλεται σε διάσπαση του εσωτερικού άλατος το οποίο σε κάποιο βαθμό συμμετέχει στη διαμόρφωση των τιμών logd. Για τις υπόλοιπες ενώσεις, οι καμπύλες logk w / ph είναι αβαθείς και κοίλες, δεδομένου ότι η συγκράτηση παρουσιάζει μικρότερη μετάβαση συναρτήσει του ph. Η συμπεριφορά αυτή μπορεί να οφείλεται αφενός σε μειωμένο ιονισμό στο περιβάλλον της στήλης, αφετέρου σε ηλεκτροστατικές αλληλεπιδράσεις με το θετικά φορτισμένο άζωτο της χολίνης. Πίνακας ΙΙ.10. Ανηγμένες τιμές logk w για κάθε τιμή ph. logk w ph Καντεσαρτάνη Καντεσαρτάνη σιλεξετίλ EXP3174 Λοσαρτάνη Βαλσαρτάνη 2.50 3.38 5.91 3.51 2.74 3.53 3.00 3.10 5.12 3.16 2.50 3.18 5.50 1.55 4.65 1.92 2.58 1.90 7.40 1.00 4.51 1.47 2.47 1.34 Πίνακας ΙΙ.11. Τιμές logd σε κάθε τιμή εξεταζόμενου ph. logp= logd + log(1 + 10 pka1- ph + 10 ph- pka2 ) logp= logd + log(1 + 10 ph-pka1 + 10 2pH-pKa1-pKa2 ) Εξίσωση α Εξίσωση β 82
logd ph Καντεσαρτάνη Καντεσαρτάνη σιλεξετίλ EXP3174 Λοσαρτάνη Βαλσαρτάνη 2.50 3.25 5.14 3.71 2.51 3.75 3.00 3.36 5.28 3.56 2.80 3.68 5.50 1.00 4.10 0.18 1.82 1.02 7.40-1.35 3.40-1.40 1.16-1.35 Σχήμα ΙΙ.6. logd/logk w -ph προφίλ για τις ενώσεις: Α) Καντεσαρτάνη, Β) Καντεσαρτάνη σιλεξετίλ, Γ) EXP3174, Δ) Λοσαρτάνη και Ε) Βαλσαρτάνη. Στο Σχήμα ΙΙ.7 απεικονίζεται γραφικά η συσχέτιση logk w /logd για κάθε τιμή ph και, επίσης, δίνονται οι αντίστοιχες μαθηματικές σχέσεις. Η καλύτερη συσχέτιση 83
παρατηρείται στην τιμή ph 3.0 (R 2 = 0.987). Στην περίπτωση αυτή, η τιμή της κλίσης της καμπύλης προσεγγίζει τη μονάδα, ενώ η τιμή του σταθερού όρου είναι χαμηλότερη από κάθε άλλη περίπτωση. Αυτό πιθανώς να οφείλεται στον πολύ χαμηλό ιονισμό των όξινων κέντρων, ενώ παράλληλα η πρωτονίωση των βασικών δεν έχει γίνει ακόμη σημαντική. Σχήμα ΙΙ.7. Γραφική απεικόνιση της συσχέτισης μεταξύ logd και logk w σε ph: Α) 7.4, Β) 5.5, Γ)3.0 και Δ) 2.5. 3.2. Χρωματογραφική στήλη HSA Επαναληψιμότητα μετρήσεων νεκρού χρόνου Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.579±0.12 min (ή 0.579 min (±2.12%)) για το σύνολο των αναλύσεων. 84
Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση Για τις ενώσεις Καντεσαρτάνη, EXP3174, Λοσαρτάνη και Βαλσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 5-20% με βήμα 5%, ενώ για την ένωση Καντεσαρτάνη σιλεξετίλ χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 15-30%, επίσης με βήμα 5%. Στο Σχήμα ΙΙ.8 παρουσιάζεται η συσχέτιση μεταξύ των τιμών logk και του ποσοστού του ακετονιτριλίου στην κινητή φάση (%φ), ενώ στον Πίνακα ΙΙ.11 παρουσιάζονται οι ανηγμένες τιμές του παράγοντα χωρητικότητας. Η συσχέτιση σε όλες τις περιπτώσεις είναι αρκετά καλή (R 2 0.995), και ιδιαίτερα για την ένωση Βαλσαρτάνη (R 2 = 0.999). Η ένωση Καντεσαρτάνη σιλεξετίλ παρουσιάζει την ισχυρότερη συγκράτηση, ενώ η ένωση Καντεσαρτάνη την ασθενέστερη. Όπως φαίνεται και από το Σχήμα ΙΙ.8, οι ενώσεις Καντεσαρτάνη και Βαλσαρτάνη παρουσιάζουν παρόμοιο προφίλ συγκράτησης. Σχήμα ΙΙ.8. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη HSA σε συνθήκες ph= 7.4. Πίνακας ΙΙ.11. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση. Ένωση Κλίση S Τομή logk w R R 2 s 85
Καντεσαρτάνη -0.072(±0.003) 1.142(±0.116) 0.999 0.997 0.030 Καντεσαρτάνη σιλεξετίλ -0.114(±0.006) 3.172(±0.136) 0.997 0.995 0.066 EXP3174-0.079(±0.003) 1.539(±0.036) 0.999 0.998 0.030 Λοσαρτάνη -0.088(±0.003) 1.574(±0.040) 0.999 0.998 0.033 Βαλσαρτάνη -0.073(±0.002) 1.257(±0.026) 0.999 0.999 0.021 Συσχέτιση μεταξύ ισοκρατικών και ανηγμένων τιμών logk w Για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη υπήρξε δυνατός ο προσδιορισμός της ισοκρατικής τιμής logk w. Στον Πίνακα ΙΙ.12 παρουσιάζονται οι ισοκρατικές και οι ανηγμένες τιμές logk w, καθώς και η σχετική επί τοις εκατό διαφορά τους. Όπως φαίνεται, οι τιμές πρακτικά δε διαφέρουν και συνεπώς η μεταξύ τους συσχέτιση είναι πολύ καλή και της μορφής 1:1 (Εξ. ΙΙ.8): logk w(isocratic) =0.998(±0.029)logk w(extrapolated) +0.088(±0.038) (ΙΙ.8) n=3, R=1.000, R 2 =0.999, s=0.008 όπου logk w(isocratic) η ισοκρατική τιμή και logk w(extrapolated) η ανηγμένη. Πίνακας ΙΙ.12. Ανηγμένες και ισοκρατικές τιμές logk w. Ένωση Ανηγμένη τιμή Ισοκρατική τιμή %Διαφορά logk w logk w Καντεσαρτάνη 1.142 1.223 7% EXP3174 1.538 1.621 5% Βαλσαρτάνη 1.256 1.348 7% Συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S Η συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S για συνθήκες ph=7.4 δίνεται από την Εξίσωση ΙΙ.9: logk w = 0.466(±0.056)S -2.230(±0.482) (ΙΙ.9) 86
n=5, R=0.979, R 2 =0.959, s=0.192 Αν και συνήθως δεν αναμένεται καλή συσχέτιση logkw/ S, σε αυτήν την περίπτωση η τιμή του συντελεστή συσχέτισης είναι καλή υποδεικνύοντας την ομοιομορφία στο μηχανισμό συγκράτησης των ενώσεων από τη στήλη, δεδομένου ότι σε ph 7.4 τα οξειοβασικά χαρακτηριστικά των ενώσεων δε διαφέρουν. Η ένωση η οποία παρουσιάζει τη μέγιστη απόκλιση από τη γραμμή τάσης είναι η Λοσαρτάνη (Er= - 19%). Σύγκριση συγκράτησης στη στήλη HSA με την κατανομή στο σύστημα οκτανόλη-νερό. Στον Πίνακα ΙΙ.13 καταγράφονται οι τιμές logd 7.4 και logk w για τις υπό μελέτη ενώσεις. Όπως φαίνεται στην Εξίσωση ΙΙ.10, η συσχέτιση μεταξύ των δύο αυτών μεγεθών, αν και αρκετά καλή (R 2 = 0.920), δεν αποτελεί 1:1, γεγονός το οποίο αντικατοπτρίζεται στην τιμή της κλίσης, η οποία είναι σημαντικά μικρότερη της μονάδας, και στην υψηλή θετική τιμή του σταθερού όρου. Κατά συνέπεια, και σε αυτήν την περίπτωση, συμπεραίνεται ότι η κατανομή στο σύστημα οκτανόλη- νερό δεν επαρκεί για να περιγράψει τη συγκράτηση στη στήλη, η οποία φαίνεται να διέπεται σε σημαντικό βαθμό και από άλλα φαινόμενα. Πίνακας ΙΙ.13. Τιμές logd 7.4 και logk w για τις υπό μελέτη ενώσεις. Ένωση logd 7.4 logk w Καντεσαρτάνη -1.35 1.14 Καντεσαρτάνη σιλεξετίλ 4.10 3.17 EXP3174-0.03 1.54 Λοσαρτάνη 1.16 1.57 Βαλσαρτάνη -1.36 1.26 87
logk w =0.35(±0.06)logD 7.4 +1.56(±0.12) (ΙΙ.10) n=5, R= 0.958, R² = 0.920, s= 0.272 Η συσχέτιση, αν και χαρακτηρίζεται από υψηλό συντελεστή (R 2 = 0.920), δεν είναι της μορφής 1:1, ενώ αξίζει να σημειωθεί ότι η τιμή της κλίσης είναι μικρότερη από την αντίστοιχη στη συσχέτιση logk wiam / logd. Σχήμα ΙΙ. 9. Γραφική απεικόνιση της συσχέτισης logk w = f(logd)για τη στήλη HSA σε ph 7.4 3.3. Χρωματογραφική στήλη AGP Επαναληψιμότητα μετρήσεων νεκρού χρόνου Η μέση τιμή του νεκρού χρόνου προσδιορίστηκε 0.556±0.011 min (ή 0.556 min (±1.94%)) για το σύνολο των αναλύσεων. Διερεύνηση της επίδρασης του οργανικού τροποποιητή στη συγκράτηση Στη στήλη AGP μελετήθηκε η επίδραση δύο διαφορετικών οργανικών τροποποιητών, του ακετονιτριλίου (ACN) και της 2-προπανόλης (iproh), στη συγκράτηση των εξεταζόμενων ενώσεων, δεδομένου ότι σε προηγούμενες μελέτες παρατηρήθηκε σημαντική επίδραση του οργανικού τροποποιητή [145]. Για τις ενώσεις 88
Καντεσαρτάνη, EXP3174 και Λοσαρτάνη χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 5-20% με βήμα 5%, ενώ για την ένωση Καντεσαρτάνη σιλεξετίλ χρησιμοποιήθηκε ακετονιτρίλιο σε αναλογίες 10-20%, επίσης με βήμα 5% (Σχήμα ΙΙ.10Α). Αναφορικά με την επίδραση της 2-προπανόλης στη συγκράτηση, για την ένωση Καντεσαρτάνη χρησιμοποιήθηκαν αναλογίες 5, 8, 10 και 20%, για την ένωση EXP3174 5, 8, 10 και 15%, για την ένωση Λοσαρτάνη 5-20% με βήμα 5%, για την ένωση Καντεσαρτάνη σιλεξετίλ 10-20& με βήμα 5% και, τέλος, για την ένωση Βαλσαρτάνη 5, 8 και 10% (Σχήμα ΙΙ.10Β). Στον Πίνακα ΙΙ. 14 περιλαμβάνονται οι ισοκρατικές τιμές logk για κάθε ποσοστό και των δύο οργανικών τροποποιητών, ενώ στους Πίνακες ΙΙ.15 και ΙΙ.16παρουσιάζονται οι τιμές logk w οι οποίες εξήχθησαν με τη χρήση ακετονιτριλίου και 2-προπανόλης, αντίστοιχα. Σχήμα ΙΙ.10. Απεικόνιση της σχέσης logk = f(φ) για τις υπό μελέτη ενώσεις στη στήλη AGP σε συνθήκες ph= 7.4, A) χρησιμοποιώντας ακετονιτρίλιο ως οργανικό τροποποιητή και Β) χρησιμοποιώντας 2-προπανόλη ως οργανικό τροποποιητή. Πινάκας II. 14. Ισοκρατικές τιμές logk για τις υπό μελέτη ενώσεις. logk 89
%φ Καντεσαρτάνη Σιλεξετίλ EXP3174 Λοσαρτάνη Βαλσαρτάνη 0 0.09 0.84 0.98 ACN iproh ACN iproh ACN iproh ACN iproh ACN iproh 5 0.44 0.04 0.45 0.10 1.51 0.88-0.17-0.48 8-0.20-0.13-0.71 10-0.30-0.60 1.49 1.15-0.24-0.42 0.61 0.16-0.85-0.85 15-0.81 0.63 0.47-0.73-0.86 0.04-0.27 20-1.51-1.59-0.37-0.35-1.29-0.58-0.83 Πίνακας ΙΙ.15. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση (με χρήση ακετονιτριλίου). Ένωση Κλίση Τομή S logk w R R 2 s Καντεσαρτάνη -0.127(±0.006) 1.043(±0.086) 0.998 0.996 0.066 Καντεσαρτάνη σιλεξετίλ -0.186(±0.008) 3.381(±0.122) 0.999 0.999 0.056 EXP3174-0.114(±0.006) 0.969(±0.036) 0.998 0.995 0.063 Λοσαρτάνη -0.137(±0.010) 2.104(±0.138) 0.995 0.989 0.112 Βαλσαρτάνη* *Δεν ήταν δυνατή η εξαγωγή της εξίσωσης λόγω περιορισμένου αριθμού ισοκρατικών τιμών. Πίνακας ΙΙ.16. Τα στατιστικά στοιχεία της σχέσης logk = f(φ) για κάθε ένωση (με χρήση 2- προπανόλης). Κλίση Τομή Ένωση R R 2 s S logk w Καντεσαρτάνη -0.110(±0.008) 0.601(±0.097) 0.995 0.990 0.090 Καντεσαρτάνη -0.150(±0.008) 2.671(±0.117) 0.999 0.997 0.053 σιλεξετίλ EXP3174-0.098(±0.006) 0.604(±0.066) 0.996 0.991 0.047 Λοσαρτάνη -0.111(±0.008) 1.376(±0.107) 0.995 0.990 0.088 Βαλσαρτάνη -0.073(±0.002) -0.120(±0.015) 1.000 0.999 0.007 Συγκρίνοντας τις ισοκρατικές τιμές logk καθώς και τις τιμές logk w, διαπιστώνεται ότι ο οργανικός τροποποιητής επηρεάζει σημαντικά τη συγκράτηση. Σε κάθε περίπτωση παρατηρείται ότι η συγκράτηση παρουσία ακετονιτριλίου είναι γενικά ισχυρότερη, ενώ οι διαφορές είναι εντονότερες σε χαμηλά ποσοστά οργανικού τροποποιητή. Επιπροσθέτως, οι υψηλές τιμές της κλίσης S (Πίνακες ΙΙ.15 και ΙΙ.16) υποδεικνύουν 90
ότι κάθε βήμα του οργανικού τροποποιητή ασκεί μεγάλη επίδραση στη συγκράτηση. Η συσχέτιση μεταξύ των ανηγμένων τιμών logk w οι οποίες προκύπτουν με τη χρήση ακετονιτριλίου και των αντίστοιχων τιμών οι οποίες εξάγονται με τη χρήση 2- προπανόλης είναι καλή, ωστόσο παρατηρείται σημαντικός σταθερός όρος και κλίση λίγο μεγαλύτερη της μονάδας (Εξ. ΙΙ.11) logk w(acn) = 1.153(±0.079)logk w(iproh) + 0.361(±0.124) (ΙΙ.11) n=4, R=0.995, R 2 =0.991, s=0.134 Συσχέτιση μεταξύ ισοκρατικών και ανηγμένων τιμών logk w Για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη υπήρξε δυνατός ο προσδιορισμός της ισοκρατικής τιμής logk w. Στον Πίνακα ΙΙ.17 παρουσιάζονται οι ισοκρατικές και οι ανηγμένες τιμές logk w οι οποίες εξήχθησαν με τη χρήση των δύο οργανικών τροποποιητών. Πίνακας ΙΙ.17. Ισοκρατικές και ανηγμένες τιμές logk w. Ένωση Ανηγμένη τιμή logk w(acn) Ανηγμένη τιμή logk w(iproh) Ισοκρατική τιμή logk w Καντεσαρτάνη 1.043 0.601 0.087 EXP3174 0.969 0.604 0.842 Βαλσαρτάνη -0.120 0.983 Παρατηρείται ότι υπάρχει σημαντική απόκλιση μεταξύ των ανηγμένων τιμών logk w και των αντίστοιχων ισοκρατικών τιμών, ιδιαίτερα για την ένωση Βαλσαρτάνη, η οποία παρουσίασε πολύ χαμηλή συγκράτηση παρουσία οργανικού τροποποιητή. Μία πιθανή εξήγηση των αποκλίσεων αυτών μπορεί να σχετίζεται με διαφορετικό βαθμό προστασίας των δραστικών θέσεων της ακινητοποιημένης πρωτεΐνης. Τα μόρια του νερού απουσία οργανικού τροποποιητή οδηγούν σε μεγαλύτερη προστασία με αποτέλεσμα μικρότερη ανάπτυξη ελκτικών και απωστικών ηλεκτροστατικών 91
αλληλεπιδράσεων. Η μειωμένη προστασία των όξινων ομάδων παρουσία οργανικού τροποποιητή οδηγεί σε αυξημένες απωστικές δυνάμεις στην περίπτωση της Βαλσαρτάνης, η οποία φέρει δύο όξινα κέντρα, με δραματική μείωση της συγκράτησης. Συσχέτιση μεταξύ ανηγμένων τιμών logk w (με χρήση 2-προπανόλης) και κλίσης S Η συσχέτιση μεταξύ ανηγμένων τιμών logk w και κλίσης S για συνθήκες ph=7.4 δίνεται από την Εξίσωση ΙΙ.12: logk w = 0.366(±0.060)S -2.945(±0.670) (ΙΙ.12) n=5, R=0.962, R 2 =0.925, s=0.336 Η τιμή του συντελεστή συσχέτισης είναι καλή υποδεικνύοντας την ομοιομορφία στο μηχανισμό συγκράτησης των ενώσεων από τη στήλη. Η ένωση η οποία παρουσιάζει τη μέγιστη απόκλιση από τη γραμμή τάσης είναι η Καντεσαρτάνη (Er= -82%). Σύγκριση της συγκράτησης στη στήλη AGP με την κατανομή στο σύστημα οκτανόλη- νερό. Για τη σύγκριση μεταξύ των δύο συστημάτων, επιλέχθηκαν οι ανηγμένες τιμές logk w οι οποίες προκύπτουν με τη χρήση 2- προπανόλης και συνοψίζονται μαζί με τις αντίστοιχες τιμές logd 7.4 στον Πίνακα II.18. Η συσχέτιση μεταξύ των δύο μεγεθών είναι καλή (R 2 = 0.933), ωστόσο ούτε σε αυτήν την περίπτωση είναι 1:1 (Εξ. ΙΙ.13). Πίνακας ΙΙ.18. Τιμές logd 7.4 και logk w για τις υπό μελέτη ενώσεις. Ένωση logd 7.4 logk w Καντεσαρτάνη -1.35 0.60 Καντεσαρτάνη 4.10 2.67 σιλεξετίλ EXP3174-0.03 0.60 Λοσαρτάνη 1.16 1.38 Βαλσαρτάνη -1.36-0.12 92
logk w = 0.45(±0.07)logD +0.80(±0.15) (II.13) n= 5, R=0.966, R 2 = 0.933, s= 0.316 3.4. Σύγκριση της συγκράτησης στις τρεις χρωματογραφικές στήλες σε ph=7.4 Στο Σχήμα ΙΙ.9 απεικονίζεται το ιστόγραμμα των χρωματογραφικών δεικτών και του συντελεστή κατανομής σε ph 7.4 για κάθε ένωση. Σχήμα ΙΙ.11. Ιστόγραμμα των χρωματογραφικών δεικτών και του συντελεστή κατανομής σε ph 7.4 για τις υπό μελέτη ενώσεις. Η μεγαλύτερη διακύμανση μεταξύ των μεγεθών του ιστογράμματος παρατηρείται για την ένωση Βαλσαρτάνη, ενώ η μικρότερη για τη Λοσαρτάνη. Η κατανομή στο σύστημα οκτανόλη νερό διαφοροποιείται σημαντικά από τη χρωματογραφική συγκράτηση και στις τρεις στήλες για τις ενώσεις Καντεσαρτάνη, EXP3174 και Βαλσαρτάνη, οι οποίες φέρουν δύο όξινα κέντρα. Και στις τρεις περιπτώσεις παρατηρείται ότι οι τιμές logd είναι μικρότερες από τις τιμές logk w σε κάθε στήλη. Για την ένωση Λοσαρτάνη παρατηρείται, επίσης, ότι η χρωματογραφική συγκράτηση 93
είναι υψηλότερη από την κατανομή, ωστόσο η διαφοροποίηση αυτή είναι μικρότερη. Όσον αφορά στην ένωση Καντεσαρτάνη σιλεξετίλ, η τιμή logd 7.4 είναι μικρότερη από την τιμή logk wιαμ, αλλά μεγαλύτερη από τους υπόλοιπους χρωματογραφικούς δείκτες. Συγκρίνοντας τη συγκράτηση μεταξύ των τριών χρωματογραφικών στηλών παρατηρείται ότι οι ενώσεις οι οποίες φέρουν ένα όξινο και ένα βασικό κέντρο, Καντεσαρτάνη σιλεξετίλ και Λοσαρτάνη, συγκρατούνται ισχυρότερα στη στήλη ΙΑΜ συγκριτικά με τις στήλες ακινητοποιημένων πρωτεϊνών, πιθανώς λόγω αλληλεπιδράσεων με τα φωσφορικά ανιόντα των φωσφολιπιδίων. Επιπροσθέτως, για τις ενώσεις αυτές, η συγκράτηση στη στήλη AGP (logk w(acn)agp ) είναι ελαφρώς ισχυρότερη από τη συγκράτηση στη στήλη HSA (logk whsa ), λόγω της παρουσίας της βασικής ομάδας, αν και δε βρίσκεται πρωτονιωμένη στο ph 7.4. Στο σημείο αυτό, ωστόσο, πρέπει να σημειωθεί ότι η παραπάνω παρατήρηση δεν ισχύει για τη συγκράτηση AGP παρουσία 2- προπανόλης, όπου η συγκράτηση μειώνεται. Όσον αφορά στις ενώσεις με δύο όξινα κέντρα, η μικρότερη διαφοροποίηση παρατηρείται για την Καντεσαρτάνη. Και για τις τρεις ενώσεις η συγκράτηση στη στήλη HSA είναι μεγαλύτερη από τη συγκράτηση στη στήλη AGP, πιθανόν λόγω ανάπτυξης απωστικών δυνάμεων από την παρουσία δύο όξινων κέντρων. Η μείωση της συγκράτησης είναι εντονότερη για τη Βαλσαρτάνη, η οποία στερείται βασικού κέντρου. Η συγκράτηση ανάμεσα στις στήλες ΙΑΜ και HSA δε διαφοροποιείται σημαντικά με εξαίρεση τους δύο αμφολύτες Λοσαρτάνη και Καντεσαρτάνη σιλεξετίλ όπου παρατηρείται ισχυρότερη συγκράτηση στην ΙΑΜ. 94
Συμπεράσματα Οι πέντε υπό μελέτη ενώσεις παρουσιάζουν πολύπλοκο φυσικοχημικό προφίλ τόσο λόγω της παρουσίας παραπάνω του ενός ιοντιζόμενων κέντρων, όσο και λόγω των αλληλεπικαλυπτόμενων τιμών των σταθερών ιοντισμού. Το γεγονός αυτό αντικατοπτρίζεται και στη χρωματογραφική τους συμπεριφορά. Οι ενώσεις οι οποίες φέρουν δύο όξινα κέντρα, Καντεσαρτάνη, Βαλσαρτάνη και EXP3174, εμφανίζουν παρόμοια συγκράτηση στις στήλες ΙΑΜ και HSA στο ph 7.4 και μικρότερη στη στήλη AGP. Η συμπεριφορά αυτή πιθανώς οφείλεται στην παρουσία των δύο όξινων κέντρων και, κατά συνέπεια, στο γεγονός ότι στο φυσιολογικό ph βρίσκονται υπό τη μορφή Α 2-. Οι αμφολύτες Λοσαρτάνη και Καντεσαρτάνη σιλεξετίλ παρουσιάζουν την υψηλότερη συγκράτηση στη στήλη ΙΑΜ, ενώ όσον αφορά στις στήλες ακινητοποιημένων πρωτεϊνών, η συγκράτηση είναι μεγαλύτερη στη στήλη AGP συγκριτικά με τη στήλη HSA. H συμπεριφορά αυτή θα μπορούσε να αποδοθεί στην παρουσία του βασικού κέντρου, το οποίο ωστόσο σε ph 7.4 δεν είναι πρωτονιωμένο. Σε κάθε περίπτωση φαίνεται ότι ο συντελεστής κατανομής στο σύστημα οκτανόληνερό δεν επαρκεί για την περιγραφή της συμπεριφοράς των ενώσεων στην εκάστοτε χρωματογραφική στήλη, παρά τον υδρόφοβο σκελετό της στήλης ΙΑΜ και την επίδραση των υδρόφοβων αλληλεπιδράσεων στης στήλες πρωτεϊνών. Καθίσταται σαφής η σημασία των ηλεκτροστατικών αλληλεπιδράσεων στη συγκράτηση. Πρέπει, τέλος, να σημειωθεί η ιδιαιτερότητα της στήλης AGP, όσον αφορά την ευαισθησία της στην επίδραση του ποσοστού και της φύσης του οργανικού τροποποιητή στη συγκράτηση των αναλυτών. 95
ΚΕΦΑΛΑΙΟ IΙΙ ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ B ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΧΡΩΜΑΤΟΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ 1. ΥΛΙΚΑ ΚΑΙ ΜΕΘΟΔΟΙ 1.1. Ομάδα υπό μελέτη ενώσεων Ι. Χρωματογραφία Τεχνητών Ακινητοποιημένων Μεμβρανών (IAM Chromatography) Τα υπό επεξεργασία δεδομένα αποτελούνται από 107 γνωστές φαρμακευτικές ενώσεις, οι οποίες διακρίνονται σε τρεις ομάδες με βάση τη χρονική στιγμή κατά την οποία μελετήθηκαν πειραματικά. Όπως φαίνεται και στον Πίνακα III.1, οι ενώσεις 1-63, ανήκουν στην πρώτη ομάδα, δηλαδή είναι οι ενώσεις για τις οποίες ελήφθησαν πειραματικά δεδομένα το 2002 [126], ακολουθούν οι ενώσεις 64-102 (2009) και τέλος οι ενώσεις 103-107 (2013). Οι ομάδες αποτελούνται από φαρμακευτικές ενώσεις διαφόρων φαρμακολογικών κατηγοριών. Η τελευταία ομάδα συνιστά μια ξεχωριστή φαρμακολογική κατηγορία, εκπρόσωποι της οποίας δεν απαντώνται στις άλλες ομάδες. Πρόκειται για ανταγωνιστές υποδοχέων Αγγειοτασίνης ΙΙ υποτύπου 1 (ΑΤ1 ανταγωνιστές) όπως αναφέρεται εκτενέστερα σε προηγούμενο κεφάλαιο. Στον Πίνακα III.1 αναφέρονται τα οξεοβασικά χαρακτηριστικά των ενώσεων. Οι χημικές δομές των ενώσεων παρατίθενται στο Παράρτημα I. Πίνακας III.1. Το σύνολο των ενώσεων οι οποίες μελετήθηκαν με χρωματογραφία ΙΑΜ ταξινομημένες σε τρεις ομάδες. Αριθμός Κοινόχρηστη ονομασία Ομάδα Οξύ/Βάση ένωσης ένωσης 1 Ακυκλοβίρη 1 Ουδέτερο 2 Αλοπεριδόλη 1 Βάση 3 Αμιτριπτυλίνη 1 Βάση 96
4 Αμλοδιπίνη 1 Βάση 5 Ατενολόλη 1 Βάση 6 Βεναζεπρίλη 1 Αμφολύτης 2 7 Βεραπαμίλη 1 Βάση 8 Βρωμαζεπάμη 1 Ασθενής Βάση 9 Διαζεπάμη 1 Ασθενής Βάση 10 Δικουμαρόλη 1 Οξύ 11 Διλτιαζέμη 1 Βάση 12 Διμεθινδένη 1 Βάση 13 Διπυριδαμόλη 1 Βάση 14 Δοξεπίνη 1 Βάση 15 Εναλαπρίλη 1 Αμφολύτης 2 16 Θεοφυλλίνη 1 Ασθενές Οξύ 17 Ιμιπραμίνη 1 Βάση 18 Καπτοπρίλη 1 Οξύ 19 Κετοπροφένη 1 Οξύ 20 Κεφαδροξίλη 1 Αμφολύτης 2 21 Κεφεπίμη 1 Αμφολύτης 2 22 Κεφπιρόμη 1 Αμφολύτης 2 23 Κεφταζιδίμη 1 Αμφολύτης 2 24 Κλομιπραμίνη 1 Βάση 25 Κλοπαμίδη 1 Αμφολύτης 1 26 Σιπροφλοξασίνη 1 Αμφολύτης 2 27 Λιδοκαϊνη 1 Βάση 28 Λοραζεπάμη 1 Ασθενής Βάση 29 Μαπροτιλίνη 1 Βάση 30 Μετφορμίνη 1 Βάση 31 Μεφαιναμικό οξύ 1 Οξύ 32 Μιδαζολάμη 1 Βάση 33 Ναπροξένιο 1 Οξύ 34 Νεοστιγμίνη 1 Τεταρτοταγές άλας αμμωνίου 35 Νιμεσουλίδιο 1 Οξύ 36 Νιφεδιπίνη 1 Ασθενής Βάση 37 Νορτριπτυλίνη 1 Βάση 38 Νορφλοξασίνη 1 Αμφολύτης 2 39 Νορφλουοξετίνη 1 Βάση 40 Οξπρενολόλη 1 Βάση 41 Οφλοξασίνη 1 Αμφολύτης 2 42 Ακεταμινοφαίνη 1 Οξύ 43 Πινδολόλη 1 Βάση 44 Πιρακετάμη 1 Ουδέτερο 45 Πιροξικάμη 1 Αμφολύτης 1 46 Πραζεπάμη 1 Ασθενής Βάση 47 Προμεθαζίνη 1 Βάση 48 Προπρανολόλη 1 Βάση 49 Προτριπτυλίνη 1 Βάση 97
50 Πυριμεθαμίνη 1 Βάση 51 Σκοπολαμίνη 1 Βάση 52 Σουλφαφουραζόλιο 1 Αμφολύτης 1 53 Τεμαζεπάμη 1 Ασθενής Βάση 54 Τενοξικάμη 1 Αμφολύτης 1 55 Θειοκοναζόλη 1 Βάση 56 Τολφαιναμικό οξύ 1 Οξύ 57 Τριμεθοπρίμη 1 Βάση 58 Υδροξυζίνη 1 Βάση 59 Φαινοβαρβιτάλη 1 Ασθενές Οξύ 60 Φλουοξετίνη 1 Βάση 61 Χλωροδιαζεποξείδιο 1 Βάση 62 Χλωροθαλιδόνη 1 Ασθενές Οξύ 63 Χλωροπρομαζίνη 1 Βάση 64 Ακετυλοσαλικυλικό οξύ 2 Οξύ 65 Αλβενδαζόλη 2 Αμφολύτης 1 66 Σουλφοξείδιο της 2 Αμφολύτης 1 Αλβενδαζόλης 67 Αμινοπυρίνη 2 Ασθενής βάση 68 Ανδροστενδιόνη 2 Ουδέτερο 69 Αμοξυκιλίνη 2 Αμφολύτης 2 70 Αντιπυρίνη 2 Ασθενής βάση 71 Ατροπίνη 2 Βάση 72 Διγιτονίνη 2 Ουδέτερο 73 Δεϋδροϊσοανδροστερόνη 2 Ουδέτερο 74 5α-διϋδροτεστοστερόνη 2 Ουδέτερο 75 Εφεδρίνη 2 Βάση 76 Θειοριδαζίνη 2 Βάση 77 Ινδομεθακίνη 2 Οξύ 78 Καφεΐνη 2 Ουδετερο 79 Κινιδίνη 2 Βαση 80 Κοκαΐνη 2 Βαση 81 Μεβενδαζόλη 2 Αμφολυτης1 82 Μεπροβαμάτη 2 Ουδετερο 83 Θειική μορφίνη 2 Αμφολυτης1 84 Οιστραδιόλη 2 Ουδετερο 85 Παπαβερίνη 2 Βαση 86 Πενταζοκίνη 2 Αμφολυτης1 87 Πεντοβαρβιτάλη 2 Ασθενες Οξυ 88 Περφαιναζίνη 2 Βαση 89 Πρεγνενολόνη 2 Ουδετερο 90 Προγεστερόνη 2 Ουδετερο 91 Ρανιτιδίνη 2 Βάση 92 Ρισπεριδόνη 2 Βάση 93 Σαλικυλικό οξύ 2 Οξύ 94 Σουλφαμεθοξαζόλιο 2 Αμφολύτης 1 95 Τερβουταλίνη 2 Αμφολύτης 98
96 Τραζοδόνη 2 Βάση 97 Υδροκινόνη 2 Ασθενές οξύ 98 Υδροχλωροθειαζίδιο 2 Ασθενές οξύ 99 Φαιναζίνη 2 Ουδέτερο 100 Φαινακετίνη 2 Βάση 101 Φαινυτοϊνη 2 Ασθενές οξύ 102 Χρωρφαινυραμίνη 2 Βάση 103 Καντεσαρτάνη 3 104 Καντεσαρτάνη σιλεξετίλ 3 Αμφολύτης 105 EXP3174 3 106 Λοσαρτάνη 3 Αμφολύτης 107 Βαλσαρτάνη 3 Οξύ Ασθενής βάση: pka < 6 Ασθενές οξύ: pka > 6 1 Κλασικός αμφολύτης 2 zwiterion ΙΙ. Χρωματογραφία Ανθρώπινης Αλβουμίνης του Ορού (HSA Chromatography) και α1-όξινης Γλυκοπρωτεΐνης (AGP Chromatography) Στον Πίνακα III.2 περιέχονται οι ενώσεις οι οποίες μελετήθηκαν στις στήλες HSA και AGP. Οι ενώσεις 1-69 προσδιορίστηκαν στη στήλη HSA, ενώ οι ενώσεις 1-36 προσδιορίστηκαν στη στήλη AGP. Οι δομές των ενώσεων είναι διαθέσιμες, επίσης, στο Παράρτημα I. Πίνακας III.2. Το σύνολο των ενώσεων οι οποίες μελετήθηκαν στις στήλες HSA και AGP. Αριθμός Ένωσης Κοινόχρηστη ονομασία ένωσης Αριθμός Ένωσης Κοινόχρηστη ονομασία ένωσης 1 Ακεταμινοφαίνη 36 Λιδοκαϊνη 2 Ατενολόλη 37 Αντιπυρίνη 3 Καπτοπρίλη 38 Καρβαμαζεπίνη 4 Κεφταζιδίμη 39 Κεφαμανδόλη 5 Χλωροπρομαζίνη 40 Κεφορανίδη 6 Διαζεπάμη 41 Κεφοξιτίνη 7 Διλτιαζέμη 42 Χρωρφαινυραμίνη 8 Διπυριδαμόλη 43 Διφαινυδραμίνη 99
9 Δοξεπίνη 44 Επαλρεστάτη 10 Φλουοξετίνη 45 Φλουνιτραζεπάμη 11 Ιμιπραμίνη 46 Ινδομεθακίνη 12 Κετοπροφένη 47 Μεβενδαζόλη 13 Λοραζεπάμη 48 Πεντοβαρβιτάλη 14 Ναπροξένιο 49 Περφαιναζίνη 15 Νιφεδιπίνη 50 Φαινακετίνη 16 Φαινοβαρβιτάλη 51 Φαινυτοϊνη 17 Πιροξικάμη 52 Propafenone 18 Προπρανολόλη 53 Κινιδίνη 19 Τριμεθοπρίμη 54 Τερβουταλίνη 20 Αμιτριπτυλίνη 55 Τολβουταμίδιο 21 Κλομιπραμίνη 56 Τραζοδόνη 22 Αλοπεριδόλη 57 Αλπραζολάμη 23 Μιδαζολάμη 58 Ακετυλοσαλικυλικό οξύ 24 Νιμεσουλίδιο 59 Ατροπίνη 25 Νορτριπτυλίνη 60 Βηταμεθαζόνη 26 Οξπρενολόλη 61 Καφεΐνη 27 Πινδολόλη 62 Δικλοφενάκη 28 Προμεθαζίνη 63 Μεφαιναμικό οξύ 29 Προτριπτυλίνη 64 Σαλικυλικό οξύ 30 Πυριμεθαμίνη 65 Σουλφαμεθοξαζόλιο 31 Καντεσαρτάνη 66 Τενοξικάμη 32 Καντεσαρτάνη 67 σιλεξετίλ Τεστοστερόνη 33 EXP3174 68 Θειοριδαζίνη 34 Λοσαρτάνη 69 Τριαζολάμη 35 Βαλσαρτάνη Σημείωση: Οι Πίνακες III.1 και III.2 περιέχουν 54 κοινές ενώσεις εκ των οποίων 36 έχουν μελετηθεί και στις τρεις χρωματογραφικές στήλες. 1.2. Πειραματικά δεδομένα Τα πειραματικά δεδομένα τα οποία ελήφθησαν για τις ενώσεις αυτές είναι οι ανηγμένες τιμές logk w σε τρεις διαφορετικές βιομιμητικές στήλες. Για τη στήλη ΙΑΜ.PC.DD2, οι τιμές logk w προσδιορίστηκαν σε τιμές ph της υδατικής συνιστώσας της κινητής φάσης 7.4 και 5.0* ( logk w(iam)7.4, logk w(iam)5.0, αντίστοιχα), ενώ στην περίπτωση των στηλών HSA και AGP η τιμή του ph ήταν 7.4. Επίσης, για τις στήλες 100
HSA και AGP επεξεργάστηκαν στατιστικά ισοκρατικές τιμές logk σε διαφορετικά ποσοστά οργανικού τροποποιητή (5-20% ακετονιτρίλιο και ισοπροπανόλη). Στο Παράρτημα II, III και III παρατίθενται οι τιμές αυτές για κάθε ένωση. Επιπλέον, χρησιμοποιήθηκαν πειραματικά προσδιορισμένες τιμές logp, logd 7.4, logd 5.0 και pka διαθέσιμες στη βιβλιογραφία [108, 160, 161]. Στην περίπτωση βασικών ενώσεων, δεδομένου ότι τιμές logd5.0 δεν υπάρχουν στη βιβλιογραφία ή δεν κρίθηκαν αξιόπιστες λόγω του ισχυρού ιονισμού των ενώσεων σε ph 5.0, χρησιμοποιήθηκαν υπολογιστικές τιμές logd με βάση το λογισμικό ADME Boxes. *Για τις ενώσεις 64-107 του Πίνακα III.1, η τιμή logk w προσδιορίστηκε σε ph 5.5 αντί για 5.0, διαφορά η οποία ωστόσο δεν αναμένεται να επηρεάσει την ανάλυση. 1.3. Περιγραφικές Μεταβλητές Οι περιγραφικές μεταβλητές οι οποίες χρησιμοποιήθηκαν περιγράφονται στο Κεφάλαιο ΙΙ. 1.4. Στατιστικές μέθοδοι 1) Πολλαπλή Γραμμική Ανάλυση Παλινδρόμησης (Multiple Linear Regression, MLR) Για την εφαρμογή της Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης χρησιμοποιήθηκε το λογισμικό SPSS v.20.0. Τα δεδομένα εισάγονται υπό μορφή πίνακα, στον οποίο οι γραμμές αντιστοιχούν στις υπό μελέτη ενώσεις και οι στήλες στις μεταβλητές, περιγραφικές και μεταβλητές απόκρισης (χρωματογραφικοί δείκτες από κάθε στήλη). Αφότου εισαχθεί στο πρόγραμμα το σύνολο των δεδομένων, επιλέγεται η στατιστική μέθοδος η οποία πρόκειται να πραγματοποιηθεί, στην εν λόγω περίπτωση Πολλαπλή Γραμμική Ανάλυση Παλινδρόμησης. Στη συνέχεια, υποδεικνύεται η μεταβλητή απόκρισης 101
καθώς και οι ανεξάρτητες μεταβλητές. Στο σημείο αυτό θα πρέπει να οριστεί ο τρόπος με τον οποίο θα πραγματοποιηθεί η επιλογή των περιγραφικών μεταβλητών για την εξαγωγή του βέλτιστου δυνατού μοντέλου, καθώς και η δυνατότητα ελέγχου της αλληλοσυσχέτισης μεταξύ των περιγραφικών μεταβλητών (collinearity), η οποία θα πρέπει να είναι όσο το δυνατό πιο περιορισμένη. Όσον αφορά στην επιλογή των περιγραφικών μεταβλητών, υπάρχουν τέσσερις αλγόριθμοι: Enter, Remove, Stepwise, Backward και Forward. Στην παρούσα εργασία, η επιλογή Enter χρησιμοποιήθηκε στην περίπτωση εισαγωγής νέων ενώσεων σε ήδη υπάρχον μοντέλο και η επιλογή Stepwise για την εξαγωγή νέων μοντέλων. Στη δεύτερη περίπτωση ελήφθησαν επίσης υπόψη οι επιμέρους συσχετίσεις μεταξύ των μεταβλητών, καθώς και η φυσικοχημική τους σημαντικότητα. 2) Πολυμεταβλητή Ανάλυση Δεδομένων (Multivariate Data Analysis, MVDA) Για την εφαρμογή της Πολυμεταβλητής Ανάλυσης Δεδομένων χρησιμοποιήθηκε το λογισμικό Simca P-10.5. 3) Άλλα μετρικά συστήματα για τον έλεγχο αξιοπιστίας των μοντέλων Για την περαιτέρω αξιολόγηση των μοντέλων χρησιμοποιήθηκαν τα μεγέθη R 2 pred, r 2 m, r /2 m και Δr 2 m. 2. ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΥΦΙΣΤΑΜΕΝΩΝ ΜΟΝΤΕΛΩΝ. 2.1. Αποτελέσματα Στατιστικής Επεξεργασίας με τη Χρήση Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης. Ι. Χρωματογραφία Τεχνητών Ακινητοποιημένων Μεμβρανών Προηγούμενες μελέτες οι οποίες πραγματοποιήθηκαν στο εργαστήριο Φαρμακευτικής Ανάλυσης του Τομέα Φαρμακευτικής Χημείας σχετικά με τη 102
συγκράτηση μιας σειράς 56 δομικά διαφορετικών ενώσεων από τη στατική φάση ΙΑΜ οδήγησαν στην εξαγωγή μοντέλων (σε τιμές ph 7.4 και 5.0) με παραμέτρους λιποφιλίας (Εξισώσεις III.1 και 2) και σολβατοχρωμικές παραμέτρους (Εξίσωση ΙΙΙ.3) [126]. Στην παρούσα εργασία, αξιολογείται η ανθεκτικότητα και η προβλεπτική ικανότητα των μοντέλων αυτών χρησιμοποιώντας ως εξωτερικές ομάδες ελέγχου τις ομάδες ενώσεων 2 και 3 του Πίνακα III.1, στη βάση της λογικής της αξιολόγησης και επικαιροποίησης των μοντέλων. Στη συνέχεια επιχειρήθηκε η ενσωμάτωση όλων των ενώσεων του Πίνακα III.1 σε ενιαίο επικαιροποιημένο μοντέλο. Η αξιολόγηση- επικαιροποίηση κάθε Εξίσωσης ΙΙΙ. έγινε ως εξής: Αρχικά υπολογίζονται οι τιμές logk w των ομάδων ελέγχου 2 και 3 βάσει του μοντέλου και καταγράφονται οι τιμές των υπολοίπων (διαφορά μεταξύ πειραματικής και υπολογιστικής τιμής) (Πίνακες III.3, III.7, III.11). Στη συνέχεια αξιολογείται η σχέση μεταξύ πειραματικών και υπολογιστικών τιμών logk w λαμβάνοντας υπόψη το συντελεστή συσχέτισης R 2, καθώς και τα μεγέθη R 2 pred, r 2 m, r /2 m και Δr 2 m (Πίνακες III.5, III.9, III.13). Επιπλέον, η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w πρέπει να είναι 1:1, δηλαδή να έχει κλίση πλησίον της μονάδας και τομή κοντά στο μηδέν. Τέλος, οι ομάδες ελέγχου ενσωματώνονται στην ομάδα εργασίας προς εξαγωγή νέας Εξίσωσης ΙΙΙ. η οποία αξιολογείται με τα ίδια μετρικά συστήματα και συγκρίνεται με την αρχική εξίσωση (Εξισώσεις III.1α, III.1β, III.2α, III.2β, III.3α, III.3β). Στο σημείο αυτό παρατίθενται οι υπάρχουσες εξισώσεις, καθώς και τα στατιστικά στοιχεία τα οποία τις συνοδεύουν [126]: logk w(iam)7.4 = 0.31(±0.12) + 0.62(±0.04) logd7.4+1.14(±0.13)f + + 0.48(±0.16)F n=56, R=0.938, s=0.413, F=126.7 (ΙΙΙ.1) 103
logk w(iam)5.0 = 0.278(±0.12) + 0.59(±0.04) logd5.0 + 1.09(±0.13)F + ph5.0 + 0.70(±0.26)I FQ n = 54, R = 0.892, s = 0.410, F = 65.0 (ΙΙΙ.2) logk w(iam)7.4 = 0.43(±0.29) 1.43(±0.15)B + 1.82(±0.14)V 0.52(±0.15)S + 0.67(±0.15)E 0.74 (±0.18)F + 0.66(±0.29)I FQ n = 56, R = 0.935, s = 0.433, F = 55.7 (ΙΙΙ.3) όπου logk w(iam)7.4 ο δεκαδικός λογάριθμος του παράγοντα χωρητικότητας σε συνθήκες ph 7.4 και logk w(iam)5.0 το αντίστοιχο μέγεθος σε συνθήκες ph 5.0, logd 7.4 και logd 5.0 οι συντελεστές κατανομής σε τιμές ph 7.4 και 5.0, αντίστοιχα, F + και F - τα κλάσματα των θετικά και αρνητικά φορτισμένων μορφών, αντίστοιχα, σε ph 7.4, F + ph5.0 το κλάσμα της θετικά φορτισμένης μορφής σε ph 5.0, I FQ : δείκτης ο οποίος δηλώνει αν το μόριο ανήκει στην κατηγορία των φθοροκινολονών (τιμή 1) ή όχι (τιμή 0) B, V, S, E οι σολβατοχρωμικές παράμετροι (βλ. Κεφάλαιο I) Αξιολόγηση Εξίσωσης ΙΙΙ. 1 με τυφλή ομάδα ελέγχου Με βάση την Εξίσωση ΙΙΙ.1 υπολογίστηκαν οι τιμές των υπολοίπων των ενώσεων των ομάδων ελέγχου 2 και 3 οι οποίες παρατίθενται στον Πίνακα III.3. Μέσω των τιμών αυτών υπολογίστηκε η απόλυτη τιμή του σχετικού σφάλματος για κάθε ένωση, καθώς και η μέση τιμή κάθε ομάδας και ο γεωμετρικός μέσος και καταγράφονται στον ίδιο 104
πίνακα. Επίσης, στον Πίνακα III.4 γίνεται ταξινόμηση των ενώσεων των δύο ομάδων ελέγχου βάσει της απόλυτης τιμής του υπολοίπου (Δ). Πίνακας III.3. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου βάσει της Εξίσωσης ΙΙΙ. 1. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Αλβενδαζόλη -0.15 0.07 Αλβενδαζόλη σουλφοξείδιο 0.21 0.16 Αμινοπυρίνη 0.00 0.01 Ανδροστενδιόνη 0.28 0.12 Αμοξυκιλίνη 0.77 3.09 Αντιπυρίνη -0.21 0.46 Ατροπίνη 0.01 0.01 Δεϋδροϊσοανδροστερόνη 0.25 0.10 5α-διϋδροτεστοστερόνη 0.30 0.11 Εφεδρίνη -0.43 0.80 Θειοριδαζίνη 0.47 0.12 Ινδομεθακίνη 0.98 0.41 Καφεΐνη -0.01 0.03 Κινιδίνη -0.54 0.23 Κοκαΐνη -0.15 0.08 Μεβενδαζόλη 0.37 0.15 Μεπροβαμάτη -0.02 0.03 2 Θειική μορφίνη -0.60 0.96 Οιστραδιόλη -0.21 0.08 Παπαβερίνη 0.55 0.20 Πενταζοκίνη -1.63 0.79 Πεντοβαρβιτάλη -0.34 0.26 Περφαιναζίνη 0.13 0.04 Πρεγνενολόνη 0.80 0.22 Προγεστερόνη 0.59 0.19 Ρανιτιδίνη -0.44 0.71 Ρισπεριδόνη 0.17 0.07 Σαλικυλικό οξύ 0.17 2.15 Σουλφαμεθοξαζόλιο -0.35 8.71 Τερβουταλίνη 0.19 0.24 Τραζοδόνη -0.51 0.22 Υδροκινόνη -0.27 1.82 Υδροχλωροθειαζίδιο 0.56 0.72 Φαιναζίνη 0.04 0.02 Φαινακετίνη -0.26 0.25 Φαινυτοϊνη 0.05 0.03 Χρωρφαινυραμίνη -0.28 0.14 105
Μέσο απόλυτο σφάλμα 0.64 Γεωμετρικός μέσος 0.19 Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη 1.07 1.08 Καντεσαρτάνη σιλεξετίλ 1.63 0.36 EXP3174 1.58 1.07 3 Λοσαρτάνη 0.87 0.37 Βαλσαρτάνη 1.42 1.06 Μέσο απόλυτο σφάλμα 0.79 Γεωμετρικός μέσος 0.63 Εύρος πειραματικών τιμών logk w για την ομάδα 2: logk wμεγ (3.98) - logk wελαχ (-0.25)= 4.23 (λογαριθμικές μονάδες) Εύρος πειραματικών τιμών logk w για την ομάδα 3: logk wμεγ (4.51) - logk wελαχ (1.00)= 3.51 (λογαριθμικές μονάδες) Πίνακας III.4. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Αλβενδαζόλη Αμοξυκιλίνη Πενταζοκίνη Αλβενδαζόλη Ινδομεθακίνη σουλφοξείδιο Καντεσαρτάνη Κινιδίνη Καντεσαρτάνη Αμινοπυρίνη σιλεξετίλ Ανδροστενδιόνη Θειική μορφίνη EXP3174 Αντιπυρίνη Παπαβερίνη Βαλσαρτάνη Ατροπίνη Πρεγνενολόνη Δεϋδροϊσοανδροστερόνη Προγεστερόνη 5α-διϋδροτεστοστερόνη Τραζοδόνη Εφεδρίνη Υδροχλωροθειαζίδιο Θειοριδαζίνη Λοσαρτάνη Καφεΐνη Κοκαΐνη Μεβενδαζόλη Μεπροβαμάτη Οιστραδιόλη Πεντοβαρβιτάλη Περφαιναζίνη Ρανιτιδίνη Ρισπεριδόνη Σαλικυλικό οξύ Σουλφαμεθοξαζόλιο 106
Τερβουταλίνη Υδροκινόνη Φαιναζίνη Φαινακετίνη Φαινυτοϊνη Χρωρφαινυραμίνη Το μεγαλύτερο ποσοστό των ενώσεων προβλέπεται ικανοποιητικά, όπως φαίνεται και στον Πίνακα III.4. Αξίζει να σημειωθεί, ωστόσο, ότι το σύνολο των αξιόπιστων προβλέψεων αφορά στις ενώσεις της ομάδας 2. Από τις ενώσεις της τρίτης ομάδας, μία μόνο προβλέπεται εντός των αποδεκτών ορίων (Λοσαρτάνη), ενώ για τις υπόλοιπες η πρόβλεψη είναι ανεπιτυχής. Παρατηρείται, τέλος, ότι όλες οι ενώσεις της ομάδας 3 υποτιμώνται από το μοντέλο, καθώς οι τιμές των υπολοίπων φέρουν θετικό πρόσημο. Στον Πίνακα III.5 παρουσιάζονται τα μεγέθη με τα οποία αξιολογείται η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w τόσο για την ομάδα εργασίας όσο και για την ομάδα ελέγχου. Όπως διαπιστώθηκε και μέσω των Πινάκων III.3 και III.4, η ομάδα 2 προβλέπεται αρκετά ικανοποιητικά, κάτι το οποίο διαφαίνεται τόσο από τις τιμές των στατιστικών μεγεθών (R 2 pred, r 2 m, r /2 m, >0.5, Δr 2 m<0.2), όσο και από την κλίση και το σταθερό όρο της καμπύλης συσχέτισης. Όσον αφορά στην ομάδα 3, ωστόσο, η υψηλή τιμή του συντελεστή συσχέτισης (R 2 =0.958) δε συνηγορεί με αξιόπιστη πρόβλεψη, όπως προκύπτει και από τον Πίνακα III.3, αλλά και την κλίση και την τομή της καμπύλης. Επιπλέον, η τιμή R 2 pred είναι πολύ χαμηλή υποδεικνύοντας την αδυναμία των προβλέψεων. Το μέτρο αυτό αποδεικνύεται στην περίπτωση αυτή περισσότερο ρεαλιστικό ως προς την αξιοπιστία των προβλέψεων. Στο Σχήμα III.1 απεικονίζεται γραφικά η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w για την ομάδα ελέγχου. 107
Πίνακας III.5. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για την Εξίσωση ΙΙΙ.1. Εξίσωση ΙΙΙ.1 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (56 ενώσεις) 0.880 0.784 0.096 Ομάδα ελέγχου 2 (37 ενώσεις) 0.825 0.929 0.132 0.821 0.773 0.754 0.019 Ομάδα ελέγχου 3 (5 ενώσεις) 0.958 1.118 1.081 0.138 0.336 0.568 0.232 Ομάδα ελέγχου 2&3 (42 ενώσεις) 0.745 0.885 0.334 0.716 0.621 0.704 0.083 Σχήμα III.1 Γραφική απεικόνιση της σχέσης logk w(πειρ) =f(logk w(υπολ) ) (Eξ. ΙΙΙ.1). Η ενσωμάτωση της δεύτερης ομάδας ενώσεων στην ομάδα εργασίας οδήγησε στην εξαγωγή του μοντέλου 1α, το οποίο εφαρμόστηκε στην πρόβλεψη της ομάδας 3, και στη συνέχεια η προσθήκη των ενώσεων της ομάδας 3 οδήγησε στην Εξίσωση ΙΙΙ.1β. logk w(iam)7.4 = 0.38(±0.09) + 0.62(±0.03)logD 7.4 + 0.99(±0.10)F + + 0.49(±0.14)F n=93, R= 0.928, R 2 =0.860, s=0.435, F=182.680 (ΙΙΙ.1α) 108
logk w(iam)7.4 = 0.38(±0.10) + 0.63(±0.03)logD 7.4 + 0.96(±0.12)F + + 0.76(±0.14)F n=98, R= 0.911, R 2 =0.830, s=0.484, F=153.318 (ΙΙΙ.1β) Συγκρίνοντας την Εξίσωση ΙΙΙ.1α με την Εξίσωση ΙΙΙ.1 παρατηρείται ότι οι συντελεστές των παραμέτρων δεν παρουσιάζουν στατιστικά σημαντική μεταβολή. Εντούτοις, στη Εξίσωση ΙΙΙ.1β παρατηρείται στατιστικά σημαντική αύξηση της παραμέτρου F -, η οποία εκμοχλεύεται από την παρουσία της όξινης ομάδας του τετραζολίου στις ενώσεις της ομάδας 3. Όσον αφορά στη στατιστική των εξισώσεων, παρατηρείται σταδιακή μείωση του συντελεστή συσχέτισης με την προσθήκη των δύο ομάδων ελέγχου. Στην περίπτωση της Εξίσωσης ΙΙΙ. 1α παρατηρείται σημαντική αύξηση της τιμής F, η οποία υποδεικνύει τη σημαντικότητα της Εξίσωσης ΙΙΙ., λόγω αύξησης των βαθμών ελευθερίας. Για την Εξίσωση ΙΙΙ.1β, ωστόσο, η αύξηση αυτή είναι μικρότερη. Στον Πίνακα III.6 παρουσιάζονται τα στατιστικά στοιχεία της συσχέτισης μεταξύ πειραματικών και προβλεπόμενων τιμών βάσει των Εξισώσεων ΙΙΙ.1α και ΙΙΙ.1β. Πίνακας III.6. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.1α και 1β) και την ομάδα ελέγχου (Εξίσωση ΙΙΙ.1α). Εξίσωση ΙΙΙ.1α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (93 ενώσεις) 0.860 1.000 3.08*10-6 0.860 0.752 0.108 Ομάδα ελέγχου 3 (5 ενώσεις) 0.959 1.124 0.987 0.260 0.412 0.605 0.193 Εξίσωση ΙΙΙ.1β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (98 ενώσεις) 0.830 1.000 9.2*10-6 0.830 0.701 0.129 *Ομάδα 3 0.961 1.108 0.710 0.607 0.712 0.105 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει, τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. 109
Παρατηρείται και στην περίπτωση της Εξίσωσης ΙΙΙ. III.1α σημαντική υποτίμηση των προβλεπόμενων τιμών logk w των ενώσεων της ομάδας 3, όπως υποδεικνύεται από την υψηλή τιμή του σταθερού όρου, παρά την πολύ καλή τιμή του συντελεστή συσχέτισης. Τα μεγέθη r /2 m και Δr 2 m βρίσκονται εντός των αποδεκτών ορίων, ενώ τα μεγέθη R 2 pred και r 2 m λαμβάνουν μη ικανοποιητικές τιμές. Η ενσωμάτωση της τρίτης ομάδας ενώσεων στην ομάδα εργασίας οδηγεί σε βελτίωση των προβλέψεων των ενώσεων αυτών, όπως φαίνεται στον Πίνακα III.6. Οι ενώσεις Καντεσαρτάνη, EXP3174 και Λοσαρτάνη εμφανίζουν αποδεκτή τιμή Δ (0.71, 0.67 και 0.52, αντίστοιχα), ενώ οι ενώσεις Καντεσαρτάνη σιλεξετίλ και Βαλσαρτάνη μη αποδεκτή (1.28 και 1.06, αντίστοιχα). Αξιολόγηση Εξίσωσης ΙΙΙ. 2 με τυφλή ομάδα ελέγχου Στον Πίνακα III.7 περιέχονται οι τιμές των υπολοίπων για την ομάδα ελέγχου βάσει της Εξίσωσης ΙΙΙ. 2. Πίνακας III.7. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Ακετυλοσαλικυλικό οξύ -0.41 1.36 Αλβενδαζόλη -0.26 0.10 Αλβενδαζόλη σουλφοξείδιο -0.53 0.42 Αμοξυκιλίνη 1.47 3.96 Ινδομεθακίνη 0.91 0.31 2 Μεβενδαζόλη 0.16 0.07 Μεπροβαμάτη -0.37 0.68 Θειική μορφίνη -0.07 0.69 Οιστραδιόλη 0.00 0.00 Πενταζοκίνη -0.40 0.23 Πεντοβαρβιτάλη 0.01 0.01 Σαλικυλικό οξύ 0.16 0.34 Σουλφαμεθοξαζόλιο 0.20 0.21 110
Τερβουταλίνη 0.32 1.76 Υδροκινόνη -1.16 2.46 Υδροχλωροθειαζίδιο 0.76 0.93 Φαινυτοϊνη 0.51 0.26 Μέσο απόλυτο σφάλμα 0.81 Γεωμετρικός μέσος 0.14 Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη -0.18 0.12 Καντεσαρτάνη σιλεξετίλ 0.82 0.18 EXP3174 1.06 0.55 3 Λοσαρτάνη 0.54 0.21 Βαλσαρτάνη 1.47 0.77 Μέσο απόλυτο σφάλμα 0.38 Γεωμετρικός μέσος 0.40 Εύρος πειραματικών τιμών logk w για την ομάδα 2: logk wμεγ (2.93) - logk wελαχ (-0.47)= 3.40 (λογαριθμικές μονάδες) Εύρος πειραματικών τιμών logk w για την ομάδα 3: logk wμεγ (4.65) - logk wελαχ (1.34)= 3.31 (λογαριθμικές μονάδες) Πίνακας III.8. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Αλβενδαζόλη Αμοξυκιλίνη Ακετυλοσαλικυλικό οξύ σουλφοξείδιο Αλβενδαζόλη Ινδομεθακίνη Υδροκινόνη Μεβενδαζόλη Υδροχλωροθειαζίδιο EXP3174 Μεπροβαμάτη Φαινυτοϊνη Βαλσαρτάνη Θειική μορφίνη Λοσαρτάνη Καντεσαρτάνη Οιστραδιόλη σιλεξετίλ Πενταζοκίνη Πεντοβαρβιτάλη Σαλικυλικό οξύ Σουλφαμεθοξαζόλιο Τερβουταλίνη Καντεσαρτάνη 111
Το μεγαλύτερο ποσοστό των ενώσεων προβλέπεται αξιόπιστα, ενώ, αξίζει να αναφερθεί ότι, από αυτές μόνο μία ανήκει στην ομάδα 3 (Καντεσαρτάνη). Όπως φαίνεται στον Πίνακα III.9, η κλίση της καμπύλης συσχέτισης μεταξύ πειραματικών και υπολογιστικών τιμών για την ομάδα 2 εμφανίζει απόκλιση από τη μονάδα, ενώ στην περίπτωση της ομάδας 3 εμφανίζεται αυξημένη η τιμή του σταθερού όρου. Εντούτοις, όταν χρησιμοποιηθούν από κοινού οι δύο ομάδες ως ομάδα ελέγχου, η καμπύλη προσεγγίζει περισσότερο την ένα προς ένα συσχέτιση. Και για τις δύο ομάδες τα στατιστικά μεγέθη του Πίνακα III.9 λαμβάνουν αρκετά ικανοποιητικές τιμές, καθώς σε κάθε περίπτωση παρατηρείται ότι R 2 pred, r 2 m, r /2 m >0.5 και Δr 2 m<0.2. Η παραπάνω συσχέτιση απεικονίζεται γραφικά στο Σχήμα III.2. Πίνακας III.9. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για την Εξίσωση ΙΙΙ.2. Εξίσωση ΙΙΙ.2 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (54 ενώσεις) 0.796 1.000 3*10-6 0.796 0.616 0.179 Ομάδα ελέγχου 2 (17 ενώσεις) 0.746 0.804 0.279 0.744 0.603 0.746 0.143 Ομάδα ελέγχου 3 (5 ενώσεις) 0.821 1.114 0.519 0.632 0.643 0.791 0.148 Ομάδα ελέγχου 2&3 (22 ενώσεις) 0.741 0.919 0.318 0.710 0.609 0.722 0.113 112
Σχήμα III.2. Γραφική απεικόνιση της σχέσης logk w(πειρ) =f(logk w(υπολ) ) (ΙΙΙ.2). Οι Εξισώσεις ΙΙΙ.2α και 2β, οι οποίες παρατίθενται στη συνέχεια, προκύπτουν από την ενσωμάτωση στην ομάδα εργασίας της ομάδας 2 και των ομάδων 2 και 3, αντίστοιχα. Η Εξίσωση ΙΙΙ.2α χρησιμοποιήθηκε στην πρόβλεψη των ενώσεων της ομάδας 3. logk w(iam)5.0 = 0.42(±0.10) + 0.54(±0.04)logD 5.0 + 0.98(±0.13)F + ph5.0 + 0.57(±0.29)I FQ n = 71, R = 0.876, R 2 = 0.767, s = 0.472, F = 73.61 (ΙΙΙ.2α) logk w(iam)5.0 = 0.47(±0.11) + 0.56(±0.04)logD 5.0 + 0.92(±0.13)F + ph5.0 + 0.60(±0.31)I FQ n = 76, R = 0.870, R 2 = 0.757, s = 0.506, F = 74.43 (ΙΙΙ.2β) 113
Συγκρίνοντας της Εξισώσεις ΙΙΙ.2α και 2β με την αρχική Εξίσωση ΙΙΙ.2, παρατηρείται μικρή αύξηση του σταθερού όρου. Η μικρή αυτή αύξηση οφείλεται στο γεγονός ότι η παράμετρος I FQ και στις δύο εξισώσεις δεν είναι στατιστικά σημαντική (t=1.941 και 1.940, αντίστοιχα). Οι συντελεστές των υπολοίπων παραμέτρων δεν παρουσιάζουν στατιστικά σημαντική μεταβολή. Αξίζει, επίσης, να αναφερθεί ότι και στις δύο περιπτώσεις παρατηρείται αύξηση του επιπέδου σημαντικότητας της εξίσωσης, γεγονός το οποίο εκφράζεται με την αύξηση της τιμής F, οποία συνοδεύει τη διεύρυνση της ομάδας εργασίας. Οι ενώσεις της ομάδας 3 προβλέπονται ικανοποιητικά από την Εξίσωση ΙΙΙ.2α, όπως υποδεικνύεται από τις τιμές των στατιστικών μεγεθών που περιέχονται στον Πίνακα III.10. Εντούτοις, η τιμή της κλίσης της καμπύλης συσχέτισης παρουσιάζει απόκλιση από τη μονάδα. Η ποιότητα της πρόβλεψης των συγκεκριμένων ενώσεων βελτιώνεται όταν ενσωματωθούν στην ομάδα εργασίας, όπως υποδεικνύεται και από τις τιμές των μεγεθών του Πίνακα. Οι ενώσεις Καντεσαρτάνη και Λοσαρτάνη προβλέπονται αξιόπιστα (Δ=0.31 και 0.44, αντίστοιχα), ενώ η τιμή Δ για τις ενώσεις EXP3174 και Βαλσαρτάνη είναι αποδεκτή (0.77 και 0.73, αντίστοιχα). Μεγάλη απόκλιση παρουσιάζει η ένωση Καντεσαρτάνη Καντεσαρτάνη σιλεξετίλ (Δ=1.32), η οποία, ωστόσο, λόγω της υψηλής πειραματικής τιμής δεν οδηγεί σε μεγάλο σχετικό σφάλμα. Πίνακας III.10. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.2α και 2β) και την ομάδα ελέγχου (Εξίσωση ΙΙΙ.2α). Εξίσωση ΙΙΙ.2α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (71 ενώσεις) 0.767 1.000 3.2*10-6 0.767 0.596 0.171 Ομάδα ελέγχου 3 (5ενώσεις) 0.821 1.217 0.317 0.666 0.720 0.782 0.062 Εξίσωση ΙΙΙ.2β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.756 1.000 3.22*10-7 0.756 0.579 0.177 114
(76 ενώσεις) *Ομάδα 3 0.820 1.172 0.278 0.734 0.768 0.034 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. Αξιολόγηση Εξίσωσης ΙΙΙ. 3 με τυφλή ομάδα ελέγχου Με τον ίδιο τρόπο αξιολογήθηκε, τέλος, η Εξίσωση ΙΙΙ.3 και στον Πίνακα III.11 παρατίθενται οι τιμές των υπολοίπων για την ομάδα ελέγχου. Πίνακας III.11. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος 2 Αλβενδαζόλη 0.37 0.17 Αλβενδαζόλη σουλφοξείδιο 0.60 0.46 Αμινοπυρίνη 0.24 0.33 Ανδροστενδιόνη 0.30 0.13 Αμοξυκιλίνη -0.03 0.12 Αντιπυρίνη -0.03 0.07 Ατροπίνη -0.93 0.89 Διγιτονίνη -0.83 0.56 Δεϋδροϊσοανδροστερόνη 0.24 0.09 5α-διϋδροτεστοστερόνη 0.39 0.14 Εφεδρίνη -0.22 0.42 Θειοριδαζίνη -0.06 0.02 Ινδομεθακίνη 0.41 0.17 Καφεΐνη 0.02 0.08 Κινιδίνη 0.00 0.00 Κοκαΐνη 0.12 0.06 Μεβενδαζόλη 0.77 0.32 Μεπροβαμάτη -0.02 0.03 Θειική μορφίνη -1.26 2.00 Οιστραδιόλη 0.33 0.13 Παπαβερίνη 0.55 0.20 Πενταζοκίνη -0.92 0.45 Πεντοβαρβιτάλη 0.43 0.34 Περφαιναζίνη 0.72 0.20 Πρεγνενολόνη 0.93 0.25 Προγεστερόνη 0.46 0.15 Ρανιτιδίνη -0.64 1.04 Ρισπεριδόνη -0.76 0.30 115
Σαλικυλικό οξύ -0.18 2.23 Σουλφαμεθοξαζόλιο -0.36 9.10 Τερβουταλίνη -0.05 0.07 Τραζοδόνη 0.06 0.03 Υδροκινόνη -0.10 0.65 Υδροχλωροθειαζίδιο 0.58 0.76 Φαιναζίνη 0.18 0.09 Φαινακετίνη 0.22 0.21 Φαινυτοϊνη 0.24 0.14 Χρωρφαινυραμίνη -0.35 0.17 Μέσο απόλυτο σφάλμα 0.59 Γεωμετρικός μέσος 0.20 3 Καντεσαρτάνη -1.60 1.60 Καντεσαρτάνη σιλεξετίλ 0.50 0.11 EXP3174-1.44 0.98 Λοσαρτάνη -0.63 0.27 Βαλσαρτάνη -1.17 0.87 Μέσο απόλυτο σφάλμα 0.77 Γεωμετρικός μέσος 0.53 Πίνακας III.12. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Αλβενδαζόλη Αλβενδαζόλη σουλφοξείδιο Θειική μορφίνη Αμινοπυρίνη Ατροπίνη Καντεσαρτάνη Ανδροστενδιόνη Διγιτονίνη EXP3174 Αμοξυκιλίνη Μεβενδαζόλη Βαλσαρτάνη Αντιπυρίνη Παπαβερίνη Δεϋδροϊσοανδροστερόνη Πενταζοκίνη 5α-διϋδροτεστοστερόνη Περφαιναζίνη Εφεδρίνη Πρεγνενολόνη Θειοριδαζίνη Ρανιτιδίνη Ινδομεθακίνη Ρισπεριδόνη Καφεΐνη Υδροχλωροθειαζίδιο Καντεσαρτάνη Κινιδίνη σιλεξετίλ Κοκαΐνη Λοσαρτάνη Μεπροβαμάτη Οιστραδιόλη Πεντοβαρβιτάλη Προγεστερόνη Σαλικυλικό οξύ Σουλφαμεθοξαζόλιο Τερβουταλίνη 116
Τραζοδόνη Υδροκινόνη Φαιναζίνη Φαινακετίνη Φαινυτοϊνη Χρωρφαινυραμίνη Όπως φαίνεται στον Πίνακα III.12, το σύνολο των ενώσεων οι οποίες προβλέπονται αξιόπιστα ανήκει στην ομάδα 2. Από την άλλη πλευρά, η πλειοψηφία των ενώσεων οι οποίες δεν προβλέπονται επιτυχώς (Δ 1.00) ανήκουν στην τρίτη ομάδα. Η ένωση Καντεσαρτάνη σιλεξετίλ, η οποία παρουσιάζει την υψηλότερη τιμή logk w, είναι η μοναδική από την ομάδα 3 η οποία υποτιμάται. Οι παραπάνω παρατηρήσεις αντικατοπτρίζονται και στα μεγέθη του Πίνακα III.13. Οι ενώσεις της ομάδας 2 προβλέπονται αρκετά ικανοποιητικά, όπως υποδεικνύεται από την τιμή της κλίσης και του σταθερού όρου της ευθείας, καθώς και από τις τιμές των στατιστικών μεγεθών. Αντιθέτως, η ομάδα 3 αν και παρουσιάζει υψηλή τιμή συντελεστή συσχέτισης, δεν προβλέπεται ικανοποιητικά, καθώς η κλίση της καμπύλης αποκλίνει σημαντικά από τη μονάδα και η τιμή του σταθερού όρου υποδηλώνει σημαντική υπερτίμηση των προβλεπόμενων τιμών, όπως φαίνεται και στο Σχήμα III.3. Επίσης, η τιμή των μεγεθών R 2 pred και r 2 m είναι αρκετά μικρότερη της αποδεκτής, ενώ το μέγεθος r /2 m δεν υπολογίζεται αξιόπιστα καθώς λαμβάνει αρνητική τιμή. Πίνακας III.13. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για την Εξίσωση ΙΙΙ.3. Εξίσωση ΙΙΙ.3 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.874 1.000 3*10-6 0.874 0.775 0.099 (54 ενώσεις) Ομάδα ελέγχου 2 0.797 0.978 0.074 0.797 0.768 0.679 0.143 (38 ενώσεις) Ομάδα ελέγχου 3 0.943 2.293-4.737 0.236 0.321-0.974 1.295 (5 ενώσεις) 117
Ομάδα ελέγχου 2&3 (43 ενώσεις) 0.721 0.908 0.096 0.711 0.689 0.563 0.123 Σχήμα III.3. Γραφική απεικόνιση της σχέσης logk w(πειρ) =f(logk w(θεωρ) ) (ΙΙΙ.3). Με την ενσωμάτωση της ομάδας 2 και κατόπιν και της ομάδας 3 προέκυψαν οι Εξισώσεις ΙΙΙ.3α και 3β, αντίστοιχα. logk w(iam)7.4 = 0.44(±0.17) 1.63(±0.10)B + 1.76(±0.11)V 0.24(±0.11)S + 0.63(±0.12)E 0.88 (±0.15)F + 0.74(±0.28)I FQ n=93, R=0.927, R 2 =0.859, s=0.441, F=87.49 (ΙΙΙ.3α) logk w(iam)7.4 = 0.24(±0.17) 1.52(±0.10)B + 1.75(±0.11)V 0.28(±0.12)S + 0.49(±0.12)E 1.03 (±0.16)F + 0.89(±0.32)I FQ n=98, R=0.908, R 2 =0.825, s=0.495, F=71.62 (ΙΙΙ.3β) 118
Και στις δύο εξισώσεις στατιστικά σημαντική μεταβολή παρουσιάζει μόνο η παράμετρος S, η απόλυτη τιμή του συντελεστή της οποίας μειώνεται σε σχέση με την αρχική Εξίσωση ΙΙΙ.3. Η συνεισφορά της παραμέτρου F (Εξίσωση ΙΙΙ.3β) παρουσιάζει μικρή αύξηση λόγω της αύξησης του αριθμού των όξινων ενώσεων. Επίσης, στην Εξίσωση ΙΙΙ.3β ο σταθερός όρος παύει να είναι στατιστικά σημαντικός (t= 1.451). Τα στατιστικά στοιχεία των δύο εξισώσεων είναι χαμηλότερα συγκριτικά με την Εξίσωση ΙΙΙ.3, εκτός από την παράμετρο F, η οποία αυξάνεται λόγω αύξηση των βαθμών ελευθερίας. Η αύξηση, ωστόσο, αυτή είναι μεγαλύτερη στην Εξίσωση ΙΙΙ.3α. Θα πρέπει, τέλος, να αναφερθεί ότι η παράμετρος Α παραμένει στατιστικά μη σημαντική και μετά την ενσωμάτωση όλων των ενώσεων. Η Εξίσωση ΙΙΙ.3α χρησιμοποιήθηκε στην πρόβλεψη της ομάδας 3 και τα αποτελέσματα συνοψίζονται στον Πίνακα III.14 Γίνεται σαφές μέσω της τιμής του σταθερού όρου της ευθείας συσχέτισης ότι οι ενώσεις της ομάδας 3 υφίστανται σημαντική υπερτίμηση από τη Εξίσωση ΙΙΙ.3α. Συνεπώς, η πρόβλεψη δεν είναι ικανοποιητική, γεγονός το οποίο επιβεβαιώνεται και από τις πολύ χαμηλές τιμές των μεγεθών R 2 pred, r 2 m και r /2 m. Σε αντίθεση με τις δύο προηγούμενες περιπτώσεις (Εξισώσεις ΙΙΙ.1β και ΙΙΙ.2β), η πρόβλεψη των ενώσεων της τρίτης ομάδας παραμένει μη ικανοποιητική, ακόμα και μετά την ενσωμάτωσή τους στην ομάδα εργασίας (Πίνακας III.14). Η μοναδική ένωση της συγκεκριμένης ομάδας η οποία προβλέπεται αξιόπιστα είναι η Λοσαρτάνη (Δ=0.25). Η τιμή Δ για τις ενώσεις Καντεσαρτάνη σιλεξετίλ και Βαλσαρτάνη είναι αποδεκτή (0.88 και 0.94, αντίστοιχα), ενώ για τις ενώσεις Καντεσαρτάνη και EXP3174 είναι πολύ υψηλή (1.25 και 1.12, αντίστοιχα). 119
Πίνακας III.14. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.3α και 3β) και την ομάδα ελέγχου (Εξίσωση ΙΙΙ.3α). Εξίσωση ΙΙΙ.3α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (94 ενώσεις) 0.859 1.000 1.10*10-5 0.859 0.750 0.109 Ομάδα ελέγχου 3 (5ενώσεις) 0.908 2.257-4.952 0.132 0.311-1.068 1.379 Εξίσωση ΙΙΙ.3β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (98 ενώσεις) 0.825 1.000 1.71*10-6 0.811 0.668 0.143 *Ομάδα 3 0.946 2.453-4.411 0.336-0.829 1.165 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. Αντιστοιχία με την κατανομή στο σύστημα οκτανόλης-νερού: Για τις ενώσεις οι οποίες περιλαμβάνονται στην Εξίσωση ΙΙΙ.3β επιχειρήθηκε η εξαγωγή μοντέλου συσχέτισης του συντελεστή κατανομής logd 7.4 με σολβατοχρωμικές παραμέτρους, με σκοπό τη σύγκριση με τα ΙΑΜ δεδομένα. Αρχικά, για την εξαγωγή του μοντέλου συμπεριλήφθηκε στο σύνολο των μεταβλητών και ο δείκτης I tetr, οπότε εξήχθη το εξής μοντέλο: logd 7.4 = 1.53(±0.38) 2.40(±0.20)B + 2.43(±0.21)V + 0.98(±0.21)E 1.38 (±0.22)F + 2.16(±0.24)F - 3.46(±0.50)I tetr n=98, R=0.896, R 2 =0.803, s=0.822, F=61.91 Οι παράμετροι Α και S δεν ήταν στατιστικά σημαντικές και δεν εισήχθησαν στο μοντέλο. Παρατηρείται έντονη αρνητική συνεισφορά του δείκτη I tetr, υποδηλώνοντας τον ιονισμό της ομάδας του τετραζολίου ο οποίος οδηγεί σε μειωμένη κατανομή στην οκτανόλη. Επίσης, το μοντέλο εμφανίζει υψηλή τιμή σταθερού όρου. Με αφαίρεση 120
του δείκτη I tetr από το σύνολο των μεταβλητών, προέκυψε το κατωτέρω μοντέλο, το οποίο παρουσιάζει ελαφρώς χαμηλότερα στατιστικά στοιχεία συγκριτικά με το προηγούμενο: logd 7.4 = 0.01(±0.43) 1.80(±0.27)B + 1.83(±0.26)V - 0.92(±0.37)Α 1.35 (±0.26)F + 2.26(±0.31)F - +0.58(±0.24)Ε n=98, R=0.849, R 2 =0.720, s=0.980, F=39.07 Παρατηρείται ότι η απομάκρυνση του δείκτη I tetr οδηγεί σε εισαγωγή της παραμέτρου Α. Η παράμετρος Α εκφράζει τη διαφορά στη βασικότητα μεταξύ των δύο φάσεων, η οποία στην περίπτωση της οκτανόλης και του νερού είναι περίπου ίδια και, κατά συνέπεια, ο όρος αυτός συνήθως δεν εμφανίζεται σε σολβατοχρωμικές αναλύσεις της κατανομής στο σύστημα οκτανόλη- νερό. Το δεύτερο μοντέλο παρουσιάζει, σε αντίθεση με το πρώτο, μη στατιστικά σημαντικό σταθερό όρο. Συγκρίνοντας τα σολβατοχρωμικά μοντέλα της κατανομής στο σύστημα οκτανόληνερό με το αντίστοιχο μοντέλο για τη συγκράτηση στη στήλη ΙΑΜ, παρατηρείται ότι στο δεύτερο απουσιάζει ο όρος F +. Αυτό πιθανώς να οφείλεται στο γεγονός ότι ο ιονισμός των βασικών ομάδων στο περιβάλλον της στήλης αντισταθμίζεται από τις ηλεκτροστατικές αλληλεπιδράσεις των πρωτονιωμένων βάσεων με τα φωσφορικά ανιόντα των ακινητοποιημένων μεμβρανών. Αντίθετα, τέτοιου είδους αλληλεπιδράσεις δεν μπορούν να λάβουν χώρα στην οκτανόλη. Ανάπτυξη νέων μοντέλων με εφαρμογή Πολλαπλής Γραμμικής Ανάλυσης Παλινδρόμησης Οι Εξισώσεις ΙΙΙ.1 και 2 δείχνουν τη συσχέτιση της συγκράτησης από τη στήλη ΙΑΜ με τη λιποφιλία και τις ηλεκτροστατικές αλληλεπιδράσεις. Περαιτέρω στόχος ήταν να 121
διερευνηθεί τυχόν επίδραση άλλων παραμέτρων με ταυτόχρονη χρήση του συνόλου των ενώσεων του Πίνακα III.1. Για το σκοπό αυτό, χρησιμοποιήθηκε μία δεξαμενή μεταβλητών η οποία περιλάμβανε εκτός από τις πειραματικά προσδιορισμένες παραμέτρους λιποφιλίας (logd 7.4, logd 5.0, logp) και ένα σύνολο θεωρητικά υπολογισμένων μοριακών, φυσικοχημικών και 3D περιγραφικών μεταβλητών. Επίσης, χρησιμοποιήθηκαν οι δείκτες I FQ και I tetr οι οποίοι υποδηλώνουν την παρουσία φθοροκινολόνης και τετραζολίου, αντίστοιχα. Ειδικά o δείκτης I tetr, αφορά στην ομάδα 3, η οποία αποτελείται από ενώσεις οι οποίες φέρουν την ομάδα του τετραζολίου. Με τον τρόπο αυτό εξετάστηκε η δυνατότητα εξαγωγής μοντέλων τα οποία θα μπορούν να επιδείξουν καλύτερα στατιστικά στοιχεία από τις Εξισώσεις ΙΙΙ.1β, 2β και 3β. Επιπροσθέτως, διερευνήθηκε η επίδραση της προσθήκης νέων ενώσεων στην ομάδα εργασίας στην επιλογή των περιγραφικών μεταβλητών. Η επιλογή των περιγραφικών μεταβλητών για την εξαγωγή των μοντέλων έγινε με την εφαρμογή του αλγορίθμου Stepwise. Αξιόλογα θεωρήθηκαν τα μοντέλα εκείνα τα οποία εμφανίζουν καλύτερα στατιστικά στοιχεία από την απευθείας συσχέτιση logk w /logd. i. Χρωματογραφικές συνθήκες: ph 7.4 Η συσχέτιση των τιμών logk w του συνόλου των ενώσεων με τις τιμές logd 7.4 είναι μέτρια (R=0.835, R 2 =0.697). Εισαγωγή επιπλέον παραμέτρων οδήγησε σε σημαντική βελτίωση της συσχέτισης, όπως φαίνεται από την Εξίσωση ΙΙΙ.4: logk w(iam)7.4 = 0.32(±0.15) + 0.37(±0.03)logD 7.4 0.59(±0.10)B + 0.27(±0.02)CMR + 0.48 (±0.09)F + n=98, R=0.949, R 2 =0.900, s=0.373, F=209.65 (ΙΙΙ.4) 122
Για την εξαγωγή της Εξίσωσης ΙΙΙ. 4 αφαιρέθηκε η ένωση Δικουμαρόλη, καθώς αποτέλεσε έκροπη τιμή. Η Εξίσωση ΙΙΙ.4 εμφανίζει πολύ καλά στατιστικά στοιχεία, ελαφρώς ανώτερα από την Εξίσωση ΙΙΙ.1β, η οποία βασίζεται στην ίδια ομάδα εργασίας. Σε αντίθεση με την Εξίσωση ΙΙΙ.1, ο όρος F - δεν ήταν στατιστικά σημαντικός ώστε να εισαχθεί στο μοντέλο. Παραμένει, ωστόσο, σημαντικός ο όρος F + υποδεικνύοντας την ισχυρή αλληλεπίδραση των PO 3-4 της στήλης με τις βασικές ομάδες. Οι όροι Β και CMR, οι οποίοι δεν περιλαμβάνονται στην Εξίσωση ΙΙΙ.1, κρίθηκαν επαρκώς σημαντικοί ( t = 5.924 και 10.505, αντίστοιχα) για την εισαγωγή τους στην εξίσωση. Με την εισαγωγή των δύο αυτών μεταβλητών επισημαίνεται η επίδραση του μοριακού όγκου, εκφρασμένου ως μοριακή διαθλασιμότητα, και της συμμετοχής σε δεσμούς υδρογόνου στην συγκράτηση από τη στήλη ΙΑΜ. Συγκεκριμένα, ο όγκος των μορίων φαίνεται να συνεισφέρει θετικά στη διαδικασία συγκράτησης, ενώ η παρουσία δεκτών σε δεσμούς υδρογόνου αποδεικνύεται ότι προκαλεί μείωση στην τιμή του παράγοντα χωρητικότητας. Παρατηρείται, επίσης, μείωση της συνεισφοράς του logd7.4 σε σχέση με την Εξίσωση ΙΙΙ.1, λόγω πιθανώς μερικής παραγοντοποίησής του στα μεγέθη B και CMR. Αξίζει, ακόμη, να σημειωθεί ότι στην εξίσωση δεν εισήχθησαν οι δείκτες I FQ και I tetr. Στον Πίνακα III.15 καταγράφονται τα μεγέθη με τα οποία αξιολογείται η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w, η οποία είναι αρκετά καλή. Πίνακας III.15. Στατιστικά δεδομένα για την Εξίσωση ΙΙΙ.4. Εξίσωση ΙΙΙ.4 R 2 Κλίση Τομή r 2 m r /2 m Δr 2 m Ομάδα εργασίας (98 ενώσεις) 0.900 1.000 3.0*10-6 0.900 0.822 0.078 *Ομάδα 3 0.991 1.320 0.586 0.798 0.748 0.050 123
*Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. ii. Χρωματογραφικές συνθήκες: ph 5.0 Η ίδια μεθοδολογία ακολουθήθηκε και στην περίπτωση της συγκράτησης σε ph κινητής φάσης 5.0. Αξιόλογο κρίθηκε το μοντέλο με καλύτερα στατιστικά στοιχεία από την απευθείας συσχέτιση logk w /logd 5.0 (R=0.674, R 2 =0.454): logk w(iam)5.0 = -0.37(±0.20) + 0.47(±0.04)logD 5.0 + 0.44(±0.14)F + + 0.13(±0.03)CMR n=76, R=0.898, R 2 =0.806, s=0.451, F=99.92 (ΙΙΙ.5) Και σε αυτή την περίπτωση, από την ομάδα εργασίας αφαιρέθηκε η ένωση Δικουμαρόλη λόγω αποκλίνουσας συμπεριφοράς συγκριτικά με το σύνολο των ενώσεων. Τα στατιστικά στοιχεία της παραπάνω Εξίσωσης ΙΙΙ. είναι ικανοποιητικά και σαφώς ανώτερα συγκρινόμενα με τα αντίστοιχα μεγέθη της Εξίσωσης ΙΙΙ. ΙΙΙ.2β η οποία βασίζεται στην ίδια ομάδα εργασίας. Ο όρος I FQ δεν αποδείχθηκε στατιστικά σημαντικός (t= 1.783) ώστε να εισαχθεί στην εξίσωση. Αντιθέτως, η μεταβλητή CMR εισήχθη για την εξαγωγή της Εξίσωσης ΙΙΙ. ΙΙΙ.5 (t= 4.836) και υποδηλώνει τη σημασία της μοριακής διαθλασιμότητας στη συγκράτηση από τη στήλη στις συγκεκριμένες χρωματογραφικές συνθήκες. Η συσχέτιση μεταξύ πειραματικών και προβλεπόμενων τιμών logk w είναι αρκετά καλή, όπως φαίνεται και στον Πίνακα III.16. Πίνακας III.16. Στατιστικά δεδομένα για την Εξίσωση ΙΙΙ.5. Εξίσωση ΙΙΙ.5 R 2 Κλίση Τομή r 2 m r /2 m Δr 2 m 124
Ομάδα εργασίας (76 ενώσεις) 0.806 1.000 1.33*10-6 0.778 0.615 0.163 *Ομάδα 3 0.882 1.120 0.350 0.785 0.661 0.124 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. ΙΙ. Χρωματογραφία Ανθρώπινης Αλβουμίνης του Ορού (HSA Chromatography) Στο ίδιο εργαστήριο πραγματοποιήθηκαν μελέτες σχετικά με τη συγκράτηση μιας σειράς 63 δομικά διαφορετικών ενώσεων (1-30 και 37-69, Πίνακας III.2) από τη στατική φάση HSA οι οποίες οδήγησαν στην εξαγωγή εξισώσεων συσχέτισης της συγκράτησης (logk 10(ACN)HSA ) με παραμέτρους λιποφιλίας (Εξισώσεις ΙΙΙ.6 και ΙΙΙ.7) και σολβατοχρωμικές παραμέτρους (Εξίσωση ΙΙΙ.8) [149]. Επιλέχθηκαν οι ισοκρατικές τιμές σε 10% ακετονιτρίλιο διότι έδειξαν καλύτερη προσομοίωση με την πρωτεϊνική σύνδεση. Οι ενώσεις 31-35 του Πίνακα 2, οι οποίες μελετήθηκαν πειραματικά στην παρούσα εργασία, χρησιμοποιήθηκαν για την αξιολόγηση των εξισώσεων αυτών. Οι ενώσεις αυτές αρχικά χρησιμοποιήθηκαν ως τυφλή ομάδα ελέγχου για την επικύρωση κάθε Εξίσωσης ΙΙΙ. και στη συνέχεια ενσωματώθηκαν στην ομάδα εργασίας, όπως και στην περίπτωση των εξισώσεων για την πρόβλεψη συγκράτησης από τη στήλη ΙΑΜ. Στο σημείο αυτό παρατίθενται οι υπάρχουσες εξισώσεις, καθώς και τα στατιστικά στοιχεία τα οποία τις συνοδεύουν: logk 10(ACN)HSA = 0.43(±0.03) logp 0.32(±0.10)F + +0.49(±0.11)F 0.66(±0.10) 125
n = 59 r = 0.905 r2 = 0.819 s = 0.313 F = 88.36 (ΙΙΙ.6) logk 10(ACN)HSA = 0.47(±0.03) logd 7.4 + 0.48(±0.12)F + +1.62(±0.17)F 0.73(±0.13) n = 59 r = 0.857 r2 = 0.735 s = 0.378 F = 54.71 (ΙΙΙ.7) logk 10(ACN)HSA = 1.40(±0.13)B + 1.58(±0.16)V+0.49(±0.15)F 0.28(±0.14)F + 1.21(±0.26) n = 59 r = 0.831 r2 = 0.691 s = 0.424 F = 33.40 (ΙΙΙ.8) Αξιολόγηση Εξίσωσης ΙΙΙ. 6 με τυφλή ομάδα ελέγχου Στον Πίνακα III.17 παρατίθενται οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk 10(ACN)HSA για την τυφλή ομάδα ελέγχου. Παρατηρείται ότι το σύνολο των ενώσεων υπερτιμάται από τη συγκεκριμένη εξίσωση (αρνητικό πρόσημο των υπολοίπων). Η ένωση Καντεσαρτάνη σιλεξετίλ είναι η μόνη η οποία προβλέπεται αξιόπιστα, ενώ για τις υπόλοιπες η πρόβλεψη μπορεί να θεωρηθεί αποδεκτή με επιφύλαξη. Πίνακας III.17. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk 10 για τις ενώσεις της ομάδας ελέγχου. Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη -0.85 2.00 Καντεσαρτάνη -0.47 0.23 σιλεξετίλ EXP3174-0.61 0.83 Λοσαρτάνη -0.91 4.26 Βαλσαρτάνη -0.93 1.77 Μέσο απόλυτο σφάλμα 1.82 Γεωμετρικός μέσος 1.24 126
Εύρος πειραματικών τιμών logk w για την ομάδα ελέγχου: logk wμεγ (2.03) - logk wελαχ (0.21)= 1.82 (λογαριθμικές μονάδες) Η ενσωμάτωση των παραπάνω ενώσεων στην ομάδα εργασίας οδήγησε στην εξαγωγή της Εξίσωσης ΙΙΙ. 6α. Συγκριτικά με την Εξίσωση ΙΙΙ.6, παρατηρείται ότι το πρόσημο των συντελεστών των περιλαμβανομένων μεταβλητών παρέμεινε το ίδιο. Επίσης, η τιμή των συντελεστών δεν παρουσίασε σημαντική στατιστικά μεταβολή, εκτός από την περίπτωση της μεταβλητής F, η οποία παρουσίασε μείωση. Με την εισαγωγή του δείκτη I tetr προέκυψε η Εξίσωση ΙΙΙ.6β, η οποία παρουσιάζει σαφώς καλύτερα στατιστικά στοιχεία σε σχέση με την Εξίσωση ΙΙΙ.6α, ενώ δεν παρατηρείται αλλαγή των συντελεστών των υπολοίπων παραμέτρων. Το αρνητικό πρόσημο της παραμέτρου Ι tetr υποδεικνύει μειωμένη συγγένεια με τη στήλη HSA, παρά τον όξινο χαρακτήρα των παραγώγων τετραζολίου, υποδηλώνοντας ότι η επίδραση του ιονισμού στη συγκράτηση είναι εντονότερη από τις αντίστοιχες ηλεκτροστατικές αλληλεπιδράσεις. logk 10(ACN)HSA = 0.59(±0.10) + 0.40(±0.03) logp 0.29(±0.11)F + +0.30(±0.11)F n = 64 r = 0.881 r2 = 0.776 s = 0.355 F = 69.15 (ΙΙΙ.6α) logk 10(ACN)HSA = 0.67(±0.09) + 0.44(±0.03) logp 0.33(±0.10)F + +0.49(±0.11)F 0.78(±0.17)Ι tetr n = 64 r = 0.915 r2 = 0.837 s = 0.306 F = 75.53 (ΙΙΙ.6β) Στον Πίνακα III.18 παρουσιάζονται τα στατιστικά στοιχεία της συσχέτισης μεταξύ πειραματικών και προβλεπόμενων τιμών logk w και για τις τρεις εξισώσεις. Η ομάδα ελέγχου υπερτιμάται σημαντικά από την Εξίσωση ΙΙΙ.6, γεγονός το οποίο διαπιστώνεται και από την τιμή των υπολοίπων, όπως υποδεικνύεται από την τιμή του 127
σταθερού όρου. Επίσης, οι τιμές των μεγεθών R 2 pred, r 2 m, r /2 m και Δr 2 m είναι εκτός των αποδεκτών ορίων. Πίνακας III.18. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.6, 6α, 6β) και τις ομάδες ελέγχου (Εξίσωση ΙΙΙ.6). Εξίσωση ΙΙΙ.6 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (59 ενώσεις) 0.819 1.008 0.004 0.819 0.735 0.084 Ομάδα ελέγχου (5 ενώσεις) 0.969 1.293-1.208-0.196 0.419-0.222 0.641 Εξίσωση ΙΙΙ.6α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.776 1.000 1.25*10-6 0.776 0.657 0.119 (64 ενώσεις) Εξίσωση ΙΙΙ.6β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (64 ενώσεις) 0.837 1.000 2.36*10-6 0.837 0.745 0.092 Αξιολόγηση Εξίσωσης ΙΙΙ. 7 με τυφλή ομάδα ελέγχου Όπως φαίνεται και στον Πίνακα III.19 η ομάδα ελέγχου εμφανίζει υψηλή τιμή μέσου απόλυτου σφάλματος. Το γεγονός αυτό οφείλεται κυρίως στην ένωση Λοσαρτάνη, η οποία παρουσιάζει πολύ υψηλό σφάλμα πρόβλεψης. Αντιθέτως, οι υπόλοιπες ενώσεις προβλέπονται αξιόπιστα (Δ<0.5). Πίνακας III.19. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk 10ACN για τις ενώσεις της ομάδας ελέγχου. Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη 0.18 0.42 Καντεσαρτάνη σιλεξετίλ -0.42 0.21 EXP3174 0.10 0.14 Λοσαρτάνη -1.11 5.20 Βαλσαρτάνη 0.28 0.52 Μέσο απόλυτο σφάλμα 1.30 Γεωμετρικός 1.30 128
μέσος Η προσθήκη της ομάδας ελέγχου στην ομάδα εργασίας οδήγησε στην Εξίσωση ΙΙΙ.7α. Η εισαγωγή της παραμέτρου I tetr δεν οδήγησε σε βελτίωση των στατιστικών της Εξίσωσης ΙΙΙ., καθώς η παράμετρος δεν ήταν στατιστικά σημαντική. logk 10(ACN)HSA = 0.44(±0.04) logd 7.4 + 0.46(±0.13)F + +1.50(±0.16)F 0.66(±0.13) n = 64 r = 0.852 r2 = 0.726 s = 0.392 F = 53.00 (ΙΙΙ.7α) Οι Εξισώσεις ΙΙΙ.7 και 7α δεν παρουσιάζουν σημαντική διαφορά σε επίπεδο στατιστικής απόδοσης (όπως φαίνεται και από τα στατιστικά μεγέθη του Πίνακα III.20), καθώς και όσον αφορά στους συντελεστές των περιεχόμενων μεταβλητών. Όπως φαίνεται και στον Πίνακα III.20,η πρόβλεψη των ενώσεων της ομάδας ελέγχου από την Εξίσωση ΙΙΙ.7 είναι οριακά μη ικανοποιητική, κυρίως λόγω της τιμής r 2 m, η οποία είναι χαμηλότερη από 0.5. Το γεγονός αυτό οφείλεται, όπως προαναφέρθηκε, κυρίως στην ένωση Λοσαρτάνη, αφαίρεση της οποίας οδηγεί σε σημαντική βελτίωση των προβλέψεων των υπολοίπων ενώσεων. Συγκρίνοντας τις Εξισώσεις ΙΙΙ.6 και 7 ως προς την ικανότητα πρόβλεψης της ομάδας ελέγχου, παρατηρείται ότι η Εξίσωση ΙΙΙ.7 εμφανίζει καλύτερη απόδοση, ακόμα και παρουσία της ένωσης Λοσαρτάνη, παρά τα ελαφρώς χαμηλότερα στατιστικά της στοιχεία. Πίνακας III.20. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.7, 7α) και τις ομάδες ελέγχου (Εξίσωση ΙΙΙ.7). Εξίσωση ΙΙΙ.7 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.735 1.006 0.005 0.735 0.617 0.118 (59 ενώσεις) Ομάδα ελέγχου 0.609 0.604 0.193 0.392 0.495 0.527 0.032 129
(5 ενώσεις) * Εξίσωση ΙΙΙ.7α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (64 ενώσεις) 0.726 1.000 8.63*10-6 0.726 0.588 0.138 *Με αφαίρεση της Λοσαρτάνης οι τιμές τις οποίες λαμβάνουν τα μεγέθη του πίνακα είναι οι εξής: R 2 = 0.997, Κλίση =0.707, Τομή =0.296, R 2 pred=0.878, r 2 m =0.671, r /2 m = 0.738, Δr 2 m =0.067. Αξιολόγηση Εξίσωσης ΙΙΙ. 8 με τυφλή ομάδα ελέγχου Όπως φαίνεται στον Πίνακα III.21, η μέση τιμή του απολύτου σφάλματος για την ομάδα ελέγχου είναι ιδιαίτερα υψηλή καθώς η μοναδική ένωση για την οποία η πρόβλεψη είναι αποδεκτή είναι η Καντεσαρτάνη σιλεξετίλ. Παρατηρείται, επίσης, ότι όλες οι ενώσεις υπερτιμώνται από την Εξίσωση ΙΙΙ.8, όπως υποδεικνύουν οι αρνητικές τιμές των υπολοίπων. Πίνακας III.21. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk 10 για τις ενώσεις της ομάδας ελέγχου. Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη -1.14 2.68 Καντεσαρτάνη σιλεξετίλ -0.82 0.40 EXP3174-1.27 1.73 Λοσαρτάνη -1.62 7.56 Βαλσαρτάνη -1.48 2.82 Μέσο απόλυτο σφάλμα 3.04 Γεωμετρικός μέσος 3.04 130
Οι Εξισώσεις ΙΙΙ.8α και 8β εξήχθησαν με την προσθήκη της ομάδας ελέγχου στην ομάδα εργασίας. Επιπλέον, στην Εξίσωση ΙΙΙ.8β προστέθηκε και ο δείκτης I tetr, ο οποίος οδήγησε σε σημαντική βελτίωση των στατιστικών στοιχείων. logk 10(ACN)HSA = 1.22(±0.13)B + 1.14(±0.13)V + 0.35(±0.15)F 0.52(±0.23) n = 64 r = 0.795 r 2 = 0.631 s = 0.459 F = 25.26 (ΙΙΙ.8α) logk 10(ACN)HSA = 1.40(±0.11)B + 1.58(±0.13)V + 0.60(±0.13)F 0.32(±0.12)F + 1.38(±0.24)I tetr - 1.20(±0.22) n = 64 r = 0.874 r 2 = 0.765 s = 0.370 F = 37.71 (ΙΙΙ.8β) Οι τιμές των συντελεστών των παραμέτρων παρουσιάζουν μικρή μεταβολή στην Εξίσωση ΙΙΙ.8α σε σχέση με την αρχική εξίσωση, και κυρίως η μεταβλητή F +, η οποία παύει να είναι στατιστικά σημαντική. Η εισαγωγή, ωστόσο, του δείκτη I tetr (Εξίσωση ΙΙΙ.8β) φαίνεται να εξισορροπεί την αλλαγή αυτή, καθώς οι τιμές των συντελεστών επανέρχονται στα αρχικά επίπεδα. Αξίζει, επίσης, να σημειωθεί ότι η Εξίσωση ΙΙΙ.8β παρουσιάζει κατά 10% αύξηση του συντελεστή συσχέτισης και γενικότερη βελτίωση των στατιστικών στοιχείων σε σχέση με την αρχική εξίσωση, όπως φαίνεται και στον Πίνακα III.22 Τα στατιστικά στοιχεία του Πίνακα III.22 επιβεβαιώνουν την αρχική διαπίστωση για την αδυναμία πρόβλεψης της ομάδας ελέγχου από την Εξίσωση ΙΙΙ.8. Συγκεκριμένα, η τιμή του σταθερού όρου της ευθείας συσχέτισης δείχνει τη συστηματική υπερτίμηση των προβλεπόμενων τιμών, ενώ οι τιμές των μεγεθών R 2 pred, r 2 m, r /2 m και Δr 2 m βρίσκονται πέραν των αποδεκτών ορίων. Πίνακας III.22. Στατιστικά δεδομένα για την ομάδα εργασίας (Εξισώσεις ΙΙΙ.8, 8α, 8β) και τις ομάδες ελέγχου (Εξίσωση ΙΙΙ.8). 131
Εξίσωση ΙΙΙ.8 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.691 1.002 0.006 0.691 0.546 0.149 (59 ενώσεις) Ομάδα ελέγχου 0.890 1.410-2.107-2.334 0.291-1.15 1.441 (5 ενώσεις) Εξίσωση ΙΙΙ.8α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.631 1.000 1.04*10-6 0.631 0.458 0.173 (64 ενώσεις) Εξίσωση ΙΙΙ.8β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (64 ενώσεις) 0.765 1.000 1.38*10-6 0.765 0.642 0.123 ΙΙΙ. Χρωματογραφία α1-όξινης Γλυκοπρωτεΐνης (AGP Chromatography) Για τη συγκράτηση στη στήλη AGP δεν υπάρχουν πολλές συστηματικές μελέτες και διαθέσιμα μοντέλα. Από προηγούμενες μελέτες στο εργαστήριο αλλά και σύμφωνα με τα αποτελέσματα της παρούσας εργασίας (Κεφάλαιο ΙΙ), προκύπτει ότι η επίδραση του ποσοστού και της φύσης του οργανικού τροποποιητή διαδραματίζει σημαντικό ρόλο στη συγκράτηση. Ως εκ τούτου, πραγματοποιήθηκε διεξοδική στατιστική επεξεργασία των διαφορετικών χρωματογραφικών δεικτών χωριστά. Παρακάτω παρατίθενται οι εξισώσεις συσχέτισης μεταξύ των παραγόντων χωρητικότητας σε ίδια ποσοστά διαφορετικού τροποποιητή, ενώ στον Πίνακα III.23 παρουσιάζονται τα στατιστικά στοιχεία κάθε Εξίσωσης ΙΙΙ.. logk w(acn)agp = 1.08 (±0.06)logk w(iso)agp +0.24(±0.09) logk 5(ACN)AGP = 1.05 (±0.05)logk 5(ISO)AGP +0.23(±0.05) logk 10(ACN)AGP = 1.09 (±0.06)logk 10(ISO)AGP +0.19(±0.04) logk 15(ACN)AGP = 1.07 (±0.05)logk 15(ISO)AGP +0.13(±0.049) logk 20(ACN)AGP = 0.997 (±0.05)logk 20(ISO)AGP +0.11(±0.03) (ΙΙΙ.9) (ΙΙΙ.10) (ΙΙΙ.11) (ΙΙΙ.12) (ΙΙΙ.13) ACN: Ακετονιτρίλιο ISO: 2- Προπανόλη Πίνακας III.23. Τα στατιστικά στοιχεία των εξισώσεων 9-13. 132
Εξίσωση n R R 2 s F ΙΙΙ.9 28 0.961 0.923 0.251 311.01 ΙΙΙ.10 28 0.969 0.939 0.205 397.37 ΙΙΙ.11 29 0.967 0.936 0.209 393.56 ΙΙΙ.12 27 0.970 0.941 0.192 398.79 ΙΙΙ.13 25 0.974 0.948 0.160 422.34 Από τις Εξισώσεις ΙΙΙ.9-13 φαίνεται ότι η διαφορά μεταξύ των χρωματογραφικών δεικτών μειώνεται με την αύξηση του οργανικού τροποποιητή (μείωση της τιμής της τομής). Επιπλέον, ο συντελεστής συσχέτισης (R 2 ) σε κάθε περίπτωση, λαμβάνει αρκετά ικανοποιητική τιμή. Στη συνέχεια, εξετάστηκε η συσχέτιση των χρωματογραφικών δεικτών με τη λιποφιλία (logp) και διαπιστώθηκε ότι επηρεάζεται ιδιαίτερα από το ποσοστό του οργανικού τροποποιητή. Συγκεκριμένα, φαίνεται ότι η αύξηση του οργανικού τροποποιητή οδηγεί σε εξασθένιση της επίδρασης της λιποφιλίας στη συγκράτηση. Στον Πίνακα 24 καταγράφονται οι τιμές του συντελεστή συσχέτισης (R 2 ) μεταξύ των διαφόρων χρωματογραφικών δεικτών και του logp, καθώς και οι συντελεστές των όρων της Εξίσωσης ΙΙΙ.. Πίνακας III.24. Τα στατιστικά δεδομένα της συσχέτισης logk= a(±s a )logp + b(s b ). logk R 2 a(±s a ) b(s b ) t logp logk w(acn)agp 0.681 0.38(±0.05) 0.32(±0.19) 7.46 logk w(iso)agp 0.526 0.31(±0.06) 0.15(±0.21) 5.48 logk wagp * 0.465 0.33(±0.07) 0.46(±0.24) 4.66 logk 5(ACN)AGP 0.560 0.36(±0.06) -0.12(±0.19) 6.38 logk 10(ACN)AGP 0.379 0.27(±0.06) -0.19(±0.20) 4.62 logk 15(ACN)AGP 0.397 0.26(±0.06) -0.49(±0.19) 4.73 logk 20(ACN)AGP 0.123 0.14(±0.07) -0.48(±0.25) 2.09 logk 5(ISO)AGP 0.537 0.32(±0.06) -0.24(±0.20) 5.49 logk 10(ISO)AGP 0.459 0.26(±0.05) -0.44(±0.20) 4.78 logk 15(ISO)AGP 0.503 0.26(±0.05) -0.66(±0.19) 5.03 logk 20(ISO)AGP 0.273 0.20(±0.07) -0.79(±0.25) 2.94 *Άμεση τιμή παράγοντα χωρητικότητας σε 100% υδατική κινητή φάση. 133
Ακολούθως, έγινε προσπάθεια εισαγωγής πρόσθετων παραμέτρων για τη βελτίωση της συσχέτισης και οι εξισώσεις οι οποίες προέκυψαν (14-24) παρατίθενται παρακάτω, ενώ τα στατιστικά τους στοιχεία παρουσιάζονται στον Πίνακα 25. logk w(acn)agp = 0.27(±0.05)logP -1.12(±0.31)A + 0.11(±0.04)HA +0.69(±0.22) (ΙΙΙ.14) logk w(iso)agp = 0.24(±0.05)logP -0.75(±0.22)A + 0.75(±0.25) logk wagp = 0.21(±0.06)logP -1.34(±0.22)A + 0.38(±0.18)B + 0.89(±0.32) logk 5(ACN)AGP = 0.25(±0.05)logP -0.83(±0.19)A + 0.57(±0.22) logk 10(ACN)AGP = 0.17(±0.05)logP -1.01(±0.21)A +0.58(±0.22) logk 15(ACN)AGP = 0.16(±0.05)logP -1.00(±0.21)A + 0.27(±0.22) logk 20(ACN)AGP = -0.78(±0.32)A + 0.52(±0.18F + + 0.04(±0.25) logk 5(ISO)AGP = 0.21(±0.05)logP -0.87(±0.18)A + 0.51(±0.21) (ΙΙΙ.15) (ΙΙΙ.16) (ΙΙΙ.17) (ΙΙΙ.18) (ΙΙΙ.19) (ΙΙΙ.20) (ΙΙΙ.21) logk 10(ISO)AGP = 0.26(±0.05)logP -0.47(±0.24)A - 0.70(±0.27)I tetr -0.09(±0.23) (ΙΙΙ.22) logk 15(ISO)AGP = 0.22(±0.04)logP -0.52(±0.21)A - 0.54(±0.18)F - -0.16(±0.19) (ΙΙΙ.23) logk 20(ISO)AGP = 0.18(±0.04)logP + 0.76(±0.13)F + -0.78(±0.19)I tetr -0.97(±0.12) ΙΙΙ.24) Πίνακας III.25. Τα στατιστικά στοιχεία των εξισώσεων 14-24. Εξίσωση n R R 2 s F 14 28 0.892 0.796 0.425 31.28 15 29 0.821 0.674 0.480 26.90 16 27 0.867 0.752 0.452 23.27 17 34 0.853 0.728 0.419 41.50 18 37 0.794 0.631 0.479 29.05 19 36 0.802 0.643 0.450 29.77 20 33 0.716 0.513 0.487 15.81 21 28 0.874 0.764 0.379 40.48 134
22 29 0.894 0.799 0.341 33.18 23 27 0.890 0.793 0.341 29.31 24 25 0.930 0.865 0.266 44.68 Παρατηρείται ότι σε υψηλά ποσοστά οργανικού τροποποιητή δεν υπάρχει συσχέτιση με την παράμετρο logp (η τιμή του συντελεστή της παραμέτρου είναι αρκετά χαμηλή, ή ο όρος δεν περιλαμβάνεται καθόλου στην εξίσωση). Αντιθέτως, η συγκράτηση φαίνεται να διέπεται κυρίως από την οξύτητα σε δεσμούς υδρογόνου (εκφράζει τη διαφορά βασικότητας μεταξύ στατικής και κινητής φάσης, με την κινητή φάση να είναι πιο βασική) και από ηλεκτροστατικές αλληλεπιδράσεις. Τέλος, επιχειρήθηκε η εξαγωγή μοντέλων με σολβατοχρωμικές παραμέτρους με τις εξισώσεις που προέκυψαν (ΙΙΙ.25-35) να επιδεικνύουν μέτρια στατιστικά στοιχεία (Πίνακας III.26). logk w(acn)agp = -1.95(±0.26)A + 0.72(±0.12)Ε +0.84(±0.24) logk w(iso)agp = -1.74(±0.25)A + 0.51(±0.12)Ε + 0.85(±0.25) logk wagp = -1.84(±0.26)A + 0.43(±0.15)Ε + 1.41(±0.27) (ΙΙΙ.25) (ΙΙΙ.26) (ΙΙΙ.27) logk 5(ACN)AGP = -1.56(±0.24)A + 0.43(±0.15)Ε 0.45(±0.20)S+ 0.83(±0.22) (ΙΙΙ.28) logk 10(ACN)AGP = -1.78(±0.22)A + 0.42(±0.11)Ε +0.53(±0.21) logk 15(ACN)AGP = -1.62(±0.21)A + 0.28(±0.11)Ε + 0.41(±0.22) logk 20(ACN)AGP = -1.24(±0.32)A + 0.50(±0.14) logk 5(ISO)AGP = -1.18(±0.25)A + 0.74(±0.15)Ε 0.63(±0.20)S + 1.07(±0.23) (ΙΙΙ.29) (ΙΙΙ.30) (ΙΙΙ.31) (ΙΙΙ.32) logk 10(ISO)AGP = -1.20(±0.24)A + 0.59(±0.17)Ε 0.48(±0.20)S + 0.72(±0.22) (ΙΙΙ.33) logk 15(ISO)AGP = -1.20(±0.22)A +0.67(±0.13) logk 20(ISO)AGP = -1.40(±0.19)A +0.43(±0.14) (ΙΙΙ.34) (ΙΙΙ.35) Πίνακας III.26. Τα στατιστικά στοιχεία των εξισώσεων 25-35. Εξίσωση n R R 2 s F 135
ΙΙΙ.25 28 0.844 0.712 0.495 30.86 ΙΙΙ.26 29 0.803 0.644 0.501 23.55 ΙΙΙ.27 27 0.826 0.682 0.501 25.68 ΙΙΙ.28 34 0.886 0.785 0.378 36.58 ΙΙΙ.29 37 0.812 0.659 0.461 32.82 ΙΙΙ.30 36 0.778 0.605 0.474 25.28 ΙΙΙ.31 33 0.662 0.438 0.515 24.19 ΙΙΙ.32 28 0.888 0.788 0.367 29.78 ΙΙΙ.33 29 0.853 0.727 0.397 22.24 ΙΙΙ.34 27 0.742 0.550 0.482 30.61 ΙΙΙ.35 25 0.751 0.564 0.455 29.73 Σε κάθε περίπτωση παρατηρείται η (αρνητική) επίδραση της παραμέτρου Α στη συγκράτηση, η οποία φαίνεται να κυριαρχεί με την αύξηση του οργανικού τροποποιητή. Επιπλέον, διαπιστώνεται η μη σημαντικότητα του όρου V, ο οποίος κατά κανόνα αποτελεί την κυριότερη παράμετρο στη σολβατοχρωμική ανάλυση. Οι ισοκρατικές τιμές logk παρουσία 5% οργανικού τροποποιητή παρουσιάζουν την καλύτερη συσχέτιση με τις σολβατοχρωμικές παραμέτρους Α, Ε και S (Εξισώσεις ΙΙΙ.28 και 32). Σύγκριση και συσχέτιση με τη στήλη HSA Συγκρίνοντας τα αποτελέσματα της στατιστικής επεξεργασίας τα οποία προέκυψαν για τις δύο στήλες, παρατηρείται ότι η λιποφιλία διαδραματίζει σημαντικότερο ρόλο στη συγκράτηση από τη στήλη HSA σε σχέση με την AGP. Επιπροσθέτως, είναι προφανής η έντονη (αρνητική) επίδραση της παραμέτρου Α (οξύτητα σε δεσμούς υδρογόνου) στη συγκράτηση από τη στήλη AGP, γεγονός το οποίο δεν ισχύει για την HSA. Μία ακόμη διαφορά, η οποία εντοπίζεται από τη σολβατοχρωμική ανάλυση, είναι ότι στην περίπτωση της HSA η συνεισφορά του όγκου στη συγκράτηση εκφράζεται μέσω της παραμέτρου V, ενώ για την AGP η επίδραση αυτή αντικατοπτρίζεται στον όρο Ε (πλεονάζουσα μοριακή διαθλασιμότητα). 136
Παρά τις διαφοροποιήσεις που αναφέρθηκαν, στη βιβλιογραφία είναι διαθέσιμες μελέτες στις οποίες αναφέρονται καλές συσχετίσεις μεταξύ των δύο στηλών, υποδεικνύοντας πιθανές ομοιότητες όσον αφορά στις αλληλεπιδράσεις με τις ακινητοποιημένες πρωτεΐνες. Οι περισσότερες εξ αυτών, ωστόσο, βασίζονται σε δομικά συγγενείς ενώσεις. Για το λόγο αυτό, επιχειρήθηκε στην παρούσα εργασία η εξαγωγή μοντέλων συσχέτισης των πειραματικών δεδομένων μεταξύ των δύο χρωματογραφικών στηλών χρησιμοποιώντας τις ενώσεις του Πίνακα III.2, οι οποίες παρουσιάζουν δομική ποικιλία. Η σχέση logk w(hsa) / logk w(acn)agp έδειξε ικανοποιητικά στατιστικά στοιχεία μετά την αφαίρεση των ενώσεων Καπτοπρίλη και Ναπροξένιο, οι οποίες αποτέλεσαν σημαντικά έκροπες τιμές (n=25, R= 0.851, R 2 =0.724, s=0.435, F=60.44). Η σχέση αυτή βελτιώθηκε σημαντικά με την προσθήκη του όρου F +, όπως φαίνεται και παρακάτω (Εξίσωση ΙΙΙ.36): logk w(hsa) = 0.89(±0.07) logk w(acn)agp -0.69(±0.13)F + +0.17(±0.12) n=25, R= 0.937, R 2 =0.878, s=0.295, F=79.33 (ΙΙΙ.36) Η αρνητική συνεισφορά του όρου F + αντανακλά τη μεγαλύτερη συγγένεια των βασικών ενώσεων για την AGP, διαπίστωση η οποία υποστηρίζεται από τη σχετική βιβλιογραφία. Στη συγκεκριμένη περίπτωση ο όρος F - δεν ήταν στατιστικά σημαντικός ( t =1.5) οπότε και δεν εισήχθη στο μοντέλο. Στη συνέχεια διερευνήθηκε η σχέση logk 10ACN(HSA) / logk 10(ACN)AGP, η οποία έδειξε λιγότερο ικανοποιητικά στατιστικά στοιχεία, αφαιρώντας τις ίδιες ενώσεις (n=34, R= 0.717, R 2 =0.514, s=0.478, F=33.84). Η εισαγωγή, εντούτοις, του όρου F - οδήγησε σε σημαντική βελτίωση: logk 10ACN(HSA) = 0.69(±0.08) logk 10(ACN)AGP +0.74(±0.14)F - -0.04(±0.10) n=34, R= 0.859, R 2 =0.739, s=0.357, F=43.80 (ΙΙΙ.37) 137
Σε αντίθεση με την Εξίσωση ΙΙΙ.36, σε αυτή την περίπτωση περισσότερο σημαντικός αποδείχθηκε ο όρος F -, ο οποίος εμφανίζει θετικό πρόσημο υποδεικνύοντας τη μεγαλύτερη συγγένεια των όξινων ενώσεων για την HSA. 2.2. Αποτελέσματα Στατιστικής Επεξεργασίας με τη Χρήση Πολυμεταβλητής Ανάλυσης Δεδομένων Ι. Συγκράτηση στη Χρωματογραφική Στήλη Ακινητοποιημένων Τεχνητών Μεμβρανών (Immobilized Artificial Membranes, IAM). Α) Εφαρμογή Ανάλυσης Κυρίων Συνιστωσών (PCA) Η Ανάλυση Κυρίων Συνιστωσών (PCA) εφαρμόστηκε με σκοπό την αρχική επισκόπηση των δεδομένων καθώς και την ανίχνευση ομάδων και τάσεων σε αυτά. Το αρχικό μοντέλο PCA αναπτύχθηκε χρησιμοποιώντας το σύνολο των ενώσεων που περιλαμβάνονται στον Πίνακα III.1, καθώς και το σύνολο των μεταβλητών (περιγραφικών και πειραματικών). Το μοντέλο περιλαμβάνει 11 κύριες συνιστώσες και έχει ικανοποιητικά στατιστικά στοιχεία (R 2 =0.862, Q 2 =0.611). Στο σημείο αυτό πρέπει να σημειωθεί ότι η επιλογή των κυρίων συνιστωσών κατά την εξαγωγή του μοντέλου πραγματοποιήθηκε έτσι ώστε να επιτευχθεί η μέγιστη τιμή Q 2. Στο διάγραμμα διασποράς των συντεταγμένων (scores scatter plot) των δύο πρώτων κυρίων συνιστωσών παρατηρείται ότι σχεδόν το σύνολο των αντικειμένων τοποθετείται εντός της έλλειψης Hotelling (Σχήμα ΙΙΙ.4). Οριακά εκτός της έλλειψης βρίσκεται η ένωση Κεφταζιδίμη, πλησίον ωστόσο των άλλων ενώσεων της ομάδας των κεφαλοσπορινών (Κεφεπίμη, Κεφπιρόμη, Κεφαδροξίλη), ενώ η ένωση Διγιτονίνη τοποθετείται αξιοσημείωτα εκτός έλλειψης. Το γεγονός αυτό οφείλεται στη διαφορά της χημικής δομής της Διγιτονίνης συγκριτικά με τις άλλες ενώσεις, καθώς είναι ο μοναδικός γλυκοσίδης ο οποίος περιλαμβάνεται στη σειρά των 138
ενώσεων. Εξετάζοντας, ωστόσο, την απόσταση των ενώσεων από το μοντέλο (DModX) των, παρατηρείται ότι η τιμή DModX για τη Διγιτονίνη δεν υπερβαίνει την κρίσιμη τιμή, γεγονός το οποίο υποδεικνύει ότι δεν αποτελεί έκροπη τιμή στο Χ- χώρο. Με περαιτέρω διερεύνηση του τρόπου ταξινόμησης των αντικειμένων στην έλλειψη Hotelling, φαίνεται ότι υπάρχει ένας βαθμός διάκρισης με βάση την τιμή logk w(iam)7.4 (Σχήμα III.4 Α). Η παρατήρηση αυτή γίνεται εμφανέστερη όταν η κατηγοριοποίηση γίνει μόνο σε δύο ομάδες (-1.94 logk w(iam)7.4 1.5 και 1.51 logk w(iam)7.4 4.6) (Σχήμα III.4 Β). Η πλειοψηφία των ενώσεων με τιμή logk w(iam)7.4 μικρότερη από 1.5 τοποθετούνται στο άνω τμήμα της έλλειψης, ενώ, αντίστοιχα το μεγαλύτερο ποσοστό των ενώσεων με μεγαλύτερες τιμές logk w(iam)7.4 τοποθετείται στο κάτω τμήμα. Επιπροσθέτως, φάνηκε ότι παρόμοια εικόνα εμφανίζεται όταν οι ενώσεις διακριθούν με βάση την τιμή ClogP, δηλαδή, ενώσεις με υψηλή τιμή ClogP τοποθετούνται στο κάτω τμήμα και, αντίστοιχα, ενώσεις με χαμηλή τιμή στο άνω. Το γεγονός αυτό επιβεβαιώνει την ισχυρή επίδραση της λιποφιλίας στη συγκράτηση των ενώσεων στη στήλη IAM (Σχήμα ΙΙΙ.5). Τέλος, ελέγχθηκε η ύπαρξη υποομάδων δομικά ή φαρμακολογικά όμοιων ενώσεων. Παρατηρήθηκε ότι, οι ενώσεις με β-λακταμικό δακτύλιο (Κεφαλοσπορίνες και Αμοξυκιλίνη) αποτελούν μια διακριτή υποομάδα και τοποθετούνται ελαφρώς εκτός του συνόλου των ενώσεων κοντά στα όρια της έλλειψης. Οι υπόλοιπες ενώσεις συγκεντρώνονται στον κεντρικό χώρο της έλλειψης και δεν παρατηρούνται έντονα διακριτές ομάδες. Εντούτοις, αρκετές ενώσεις οι οποίες ανήκουν στην ίδια φαρμακολογική ή χημική κατηγορία τοποθετούνται κοντά μεταξύ τους. Αυτό συμβαίνει κυρίως για τα στεροειδή μόρια, διάφορα αντικαταθλιπτικά και 139
αντιψυχωτικά, τα σουλφοναμιδικά αντιβιοτικά και τους ΑΤ1 ανταγωνιστές (με εξαίρεση την Καντεσαρτάνη σιλεξετίλ). Με την Ανάλυση Κυρίων Συνιστωσών επιτυγχάνεται ένα είδος ταξινόμησης στα δεδομένα χρησιμοποιώντας το σύνολο των περιγραφικών μεταβλητών. Επιπλέον, υποδεικνύεται η σημασία της λιποφιλίας όσον αφορά τη συγκράτησή τους από τη στήλη ΙΑΜ σε ph 7.4. Οι αρχικές αυτές εκτιμήσεις μπορούν να λειτουργήσουν ως κατευθυντήριοι άξονες για την περαιτέρω ανάλυση Μερικών Ελαχίστων Τετραγώνων (PLS). *η Καντεσαρτάνη αν και αρκετά λιπόφιλη (logp= 3.36) εμφανίζει μέτριο βαθμό συγκράτησης (logk w(iam)7.4 = 0.995) Σχήμα III.4 Α: Οι ενώσεις διακρίνονται σε τέσσερις κατηγορίες με βάση την τιμή logk w(iam)7.4. Β: Οι ενώσεις διακρίνονται σε δύο ομάδες με βάση την τιμή logk w(iam)7.4. 140
Σχήμα III.5. Οι ενώσεις διακρίνονται σε τρεις κατηγορίες με βάση την τιμή ClogP. Β) Εφαρμογή της Μεθόδου Μερικών Ελαχίστων Τετραγώνων (PLS) για την ανάπτυξη μοντέλων πρόβλεψης χρωματογραφικής συγκράτησης. Η ανάπτυξη των μοντέλων PLS πραγματοποιήθηκε σύμφωνα με τη μεθοδολογία της κατά χρονικά διαστήματα ενημέρωσης και αξιολόγησής τους (over time adaptiiie models) (βλ. Κεφ. III, II). Μία ακόμη επιδίωξη ήταν η ανάπτυξη των PLS μοντέλων βασισμένων σε θεωρητικά υπολογισμένες περιγραφικές μεταβλητές και όχι σε παραμέτρους πειραματικά προσδιορισμένες έτσι ώστε να μπορούν να χρησιμοποιηθούν για τη γρήγορη σάρωση βιβλιοθηκών (screening) ενώσεων με σκοπό την πρόβλεψη του παράγοντα χωρητικότητας στη στήλη ΙΑΜ ως αρχικού δείκτη διαπερατότητας. i) Χωματογραφικές συνθήκες: ph=7.4 Για την εξαγωγή μοντέλου πρόβλεψης των τιμών logk w(iam)7.4 χρησιμοποιήθηκε ως ομάδα εργασίας το σύνολο των ενώσεων της πρώτης ομάδας του Πίνακα III.1. Το αρχικό μοντέλο το οποίο προκύπτει από το σύνολο των περιγραφικών μεταβλητών αποτελείται από τρεις κύριες συνιστώσες (Α=3) και επιδεικνύει ικανοποιητικά στατιστικά στοιχεία (R 2 =0.899, Q 2 =0.780). Για τη βελτίωση του μοντέλου αρχικά 141
ελέγχθηκε η ύπαρξη έκροπων τιμών και κατόπιν έγινε επιλογή των σημαντικότερων μεταβλητών. Διαπιστώθηκε ότι η ένωση Δικουμαρόλη αποτελεί σαφώς έκροπη τιμή και, επιπλέον, εμφανίζει τιμή DModX η οποία ξεπερνά την οριακή και, συνεπώς, αφαιρέθηκε από την ομάδα εργασίας, οδηγώντας σε σαφή και στατιστικά σημαντική βελτίωση του μοντέλου (Α=3, R 2 =0.914, Q 2 =0.810). Στη συνέχεια, έγινε επιλογή των μεταβλητών έτσι ώστε να παραμείνουν όσες συνεισφέρουν πραγματικά σε αυτό και να μην περιλαμβάνονται σε αυτό παρόμοιες μεταβλητές, όπως περιγράφηκε στο Κεφάλαιο ΙΙ. Το τελικό μοντέλο το οποίο εξήχθη με την παραπάνω διαδικασία (PLS 7.4 Ι), αποτελείται από δύο κύριες συνιστώσες (Α=2) και επιδεικνύει πολύ καλά στατιστικά στοιχεία (R 2 =0.923, Q 2 =0.883, RMSEE= 0.326). Το μοντέλο αυτό περιλαμβάνει 8 περιγραφικές μεταβλητές, οι συντελεστές των οποίων απεικονίζονται στο ιστόγραμμα του Σχήματος III.5. Στους ιστοί μαύρου χρώματος αντιστοιχούν οι μεταβλητές με VIP 1. Η παράμετρος ClogP έχει τη μεγαλύτερη τιμή VIP και συνεισφέρει θετικά στη συγκράτηση, με την υψηλότερη απόλυτη τιμή συντελεστή, γεγονός το οποίο βρίσκεται σε συμφωνία με τις παρατηρήσεις του μοντέλου PCA και τα αποτελέσματα της ανάλυσης MLR. Θετική συνεισφορά και τιμή VIP >1 παρουσιάζει επίσης η μεταβλητή MR, υποδεικνύοντας ότι ο όγκος των μορίων ασκεί σημαντική επίδραση στη συγκράτησή τους από τη στήλη. Η μεταβλητή PSA έχει αρνητικό συντελεστή υποδηλώνοντας ότι η πολικότητα των μορίων, δηλαδή η δυνατότητα αλληλεπιδράσεων μέσω δεσμών υδρογόνου, μειώνει την έκταση της συγκράτησης. Το ίδιο φαίνεται να ισχύει και για την ύπαρξη όξινων κέντρων στο μόριο, και κατ επέκταση την ιοντική τους κατάσταση σε ph 7.4. Θα πρέπει να αναφερθεί, εντούτοις, ότι στο αντίστοιχο μοντέλο MLR, η παράμετρος F -, η οποία σχετίζεται άμεσα με την παρουσία όξινων 142
κέντρων, παρουσιάζει θετική και μικρότερη συγκριτικά με τις άλλες παραμέτρους τιμή συντελεστή, γεγονός με το οποίο επισημαίνεται ο διαφορετικός μηχανισμός επεξεργασίας των δεδομένων μεταξύ των δύο στατιστικών μεθόδων. Η ύπαρξη αλογόνων και ειδικότερα η ηλεκτροτοπολογική κατάσταση του χλωρίου συνδέονται θετικά με τη συγκράτηση, ενώ η ηλεκτροτοπολογική κατάσταση της αμιδικής ομάδας παρουσιάζει αρνητική συνεισφορά. Σχήμα III.5. Ιστόγραμμα των συντελεστών (coefficient) των μεταβλητών (variable) του μοντέλου PLS 7.4 Ι. Με μαύρο χρώμα απεικονίζονται οι μεταβλητές με τιμή VIP > 1. Η αξιοπιστία του μοντέλου αυτού ελέγχθηκε με τη χρήση των ομάδων 2 και 3 του Πίνακα III.1 ως τυφλή ομάδα ελέγχου (blind test set). Αρχικά, το μοντέλο εφαρμόστηκε για την πρόβλεψη των τιμών logk w(iam)7.4 των ενώσεων της ομάδας 2 για τις οποίες υπήρχαν διαθέσιμες οι αντίστοιχες πειραματικές τιμές (38 ενώσεις). Μέσω των τιμών DModX για την ομάδα ελέγχου διαπιστώθηκε ότι η ένωση Διγιτονίνη υπερβαίνει σε μεγάλο βαθμό την κρίσιμη τιμή, και συνεπώς καθίσταται επισφαλής η πρόβλεψη για την ένωση αυτή, οπότε και αφαιρέθηκε από την ομάδα ελέγχου. Στη συνέχεια, στην ομάδα ελέγχου ενσωματώθηκε και η τρίτη ομάδα του Πίνακα III.1 (42 συνολικά ενώσεις). Στον Πίνακα III.27 καταγράφονται οι τιμές των υπολοίπων για τις δύο ομάδες. 143
Πίνακας III.27. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Αλβενδαζόλη 0.87 0.40 Αλβενδαζόλη σουλφοξείδιο 0.40 0.30 Αμινοπυρίνη -0.74 1.04 Ανδροστενδιόνη 0.46 0.20 Αμοξυκιλίνη -0.22 0.90 Αντιπυρίνη -0.67 1.48 Ατροπίνη -0.59 0.56 Δεϋδροϊσοανδροστερόνη 0.56 0.22 5α-διϋδροτεστοστερόνη 0.76 0.27 Εφεδρίνη -0.46 0.87 Θειοριδαζίνη 0.52 0.13 Ινδομεθακίνη 0.23 0.10 Καφεΐνη -0.53 2.04 Κινιδίνη 0.05 0.02 Κοκαΐνη -0.03 0.02 Μεβενδαζόλη 1.12 0.46 Μεπροβαμάτη 0.27 0.37 2 Θειική μορφίνη -0.30 0.47 Οιστραδιόλη 0.99 0.38 Παπαβερίνη 0.27 0.10 Πενταζοκίνη -0.08 0.04 Πεντοβαρβιτάλη 0.67 0.52 Περφαιναζίνη 0.52 0.14 Πρεγνενολόνη 1.36 0.36 Προγεστερόνη 0.72 0.24 Ρανιτιδίνη -0.80 1.32 Ρισπεριδόνη -0.24 0.10 Σαλικυλικό οξύ -0.37 4.65 Σουλφαμεθοξαζόλιο -0.50 12.45 Τερβουταλίνη 0.79 1.01 Τραζοδόνη -0.59 0.25 Υδροκινόνη 0.54 3.57 Υδροχλωροθειαζίδιο 1.06 1.38 Φαιναζίνη 0.43 0.22 Φαινακετίνη -0.10 0.10 Φαινυτοϊνη 0.76 0.43 Χρωρφαινυραμίνη -0.48 0.24 Μέσο απόλυτο σφάλμα 1.01 Γεωμετρικός μέσος RMSEP 0.62 144
Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη -1.02 1.02 Καντεσαρτάνη σιλεξετίλ 0.76 0.17 EXP3174-0.58 0.40 3 Λοσαρτάνη -0.15 0.07 Βαλσαρτάνη -0.39 0.29 Μέσο απόλυτο σφάλμα 0.39 Γεωμετρικός μέσος 0.50 RMSEP 0.65 Πίνακας III.28. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Αλβενδαζόλη Αλβενδαζόλη Μεβενδαζόλη σουλφοξείδιο Ανδροστενδιόνη Αμινοπυρίνη Πρεγνενολόνη Αμοξυκιλίνη Αντιπυρίνη Υδροχλωροθειαζίδιο Εφεδρίνη Ατροπίνη Καντεσαρτάνη Ινδομεθακίνη Δεϋδροϊσοανδροστερόνη Κινιδίνη 5α-διϋδροτεστοστερόνη Κοκαΐνη Θειοριδαζίνη Μεπροβαμάτη Καφεΐνη Θειική μορφίνη Οιστραδιόλη Παπαβερίνη Πεντοβαρβιτάλη Πενταζοκίνη Περφαιναζίνη Ρισπεριδόνη Προγεστερόνη Σαλικυλικό οξύ Ρανιτιδίνη Φαιναζίνη Σουλφαμεθοξαζόλιο Φαινακετίνη Τερβουταλίνη Χρωρφαινυραμίνη Τραζοδόνη Λοσαρτάνη Υδροκινόνη Βαλσαρτάνη Φαινυτοϊνη Καντεσαρτάνη σιλεξετίλ EXP3174 Παρατηρείται ότι το μεγαλύτερο ποσοστό των ενώσεων εμφανίζει αποδεκτή τιμή Δ, ενώ στο αντίστοιχο μοντέλο MLR για τις ίδιες χρωματογραφικές συνθήκες (Εξίσωση ΙΙΙ.1), η πρόβλεψη για την πλειοψηφία των ενώσεων ήταν αξιόπιστη. Αξίζει να σημειωθεί, ωστόσο, ότι στον παρόν μοντέλο παρατηρείται μικρότερη απόκλιση για τις ενώσεις της ομάδας 3, σύμφωνα με τις τιμές Δ, συγκριτικά με το μοντέλο MLR. 145
Η συσχέτιση μεταξύ πειραματικών και προβλεπόμενων τιμών logk w αξιολογείται, επίσης, με τα μεγέθη τα οποία περιλαμβάνονται στον Πίνακα III.29. Οι ενώσεις της ομάδας 2 προβλέπονται ικανοποιητικά, όπως φαίνεται από την κλίση και το σταθερό όρο της ευθείας και τις τιμές των R 2 pred, r 2 m, r 2 m (>0.5) και Δr 2 m (<0.2). Ωστόσο, όπως φαίνεται και στον Πίνακα III.29, η τρίτη ομάδα δεν προβλέπεται επιτυχώς, γεγονός το οποίο αντικατοπτρίζεται στην ιδιαίτερα χαμηλή τιμή του r /2 m (0.090) και στην υψηλή τιμή του Δr 2 m (0.445). Στο Σχήμα III.6 απεικονίζεται γραφικά η συσχέτιση μεταξύ πειραματικών και προβλεπόμενων τιμών logk w. Πίνακας III.29. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για το μοντέλο. Ομάδα εργασίας (56 ενώσεις) Ομάδα ελέγχου 2 (37 ενώσεις) Ομάδα ελέγχου 3 (5 ενώσεις) Ομάδα ελέγχου 2&3 (42 ενώσεις) R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m 0.923 0.995 0.030 0.923 0.877 0.046 0.724 0.999 0.183 0.700 0.659 0.607 0.052 0.957 1.738-2.108 0.747 0.535 0.090 0.445 0.718 0.994 0.132 0.707 0.675 0.574 0.101 146
Σχήμα III.6. Διάγραμμα των πειραματικών τιμών logk w(iam)7.4 ως προς τις αντίστοιχες θεωρητικές τιμές των ενώσεων της ομάδας εκμάθησης καθώς και της ομάδας ελέγχου για το μοντέλο PLS 7.4 Ι. Στη συνέχεια, στην ομάδα εργασίας ενσωματώθηκε η δεύτερη ομάδα ενώσεων (συνολικά 93 ενώσεις) και το (δύο κυρίων συνιστωσών) μοντέλο το οποίο προέκυψε (PLS 7.4 Ι-α) παρουσίασε μείωση του R 2 κατά 6% (R 2 =0.865) και του Q 2 κατά 5% (Q 2 =0.847) και αύξηση της τιμής RMSEE κατά 30% (RMSEE= 0.425). Με την εισαγωγή της δεύτερης ομάδας ενώσεων στο μοντέλο, παρατηρήθηκε μείωση της σημαντικότητας της παραμέτρου Acidic Ionic Groups (αριθμός όξινων κέντρων στα μόρια) τόσο σε επίπεδο τιμής VIP όσο και επίπεδο συντελεστή. Επίσης, μικρή μείωση παρουσίασε η τιμή του συντελεστή για τις παραμέτρους Halogen (αριθμός αλογόνων στο μόριο) και SsCl (ηλεκτροτοπολογική κατάσταση χλωρίου). Το μοντέλο χρησιμοποιήθηκε για την πρόβλεψη των ενώσεων της ομάδας 3 και τα αποτελέσματα συνοψίζονται στον Πίνακα III.30. Και σε αυτή την περίπτωση παρατηρείται συστηματική υπερτίμηση των προβλεπόμενων τιμών της ομάδας ελέγχου, όπως υποδηλώνεται από την τιμή του σταθερού όρου. Οι τιμές των R 2 pred, 147
r 2 m, r /2 m και Δr 2 m είναι εκτός των αποδεκτών ορίων, γεγονός το οποίο επιβεβαιώνει την αδυναμία του μοντέλου να προβλέψει ικανοποιητικά την ομάδα ελέγχου. Τέλος, αναπτύχθηκε ένα τρίτο μοντέλο (PLS 7.4 Ι-β) το οποίο περιλαμβάνει το σύνολο των ενώσεων (98 ενώσεις). Τα στατιστικά στοιχεία είναι σαφώς μειωμένα, συγκριτικά με τα δύο προηγούμενα μοντέλα. Συγκεκριμένα, σε σχέση με το αρχικό μοντέλο, ο συντελεστής συσχέτισης R 2 μειώθηκε κατά 9% (R 2 = 0.840) και ο διασταυρούμενος συντελεστής συσχέτισης Q 2 κατά 8% (Q 2 = 0.815), ενώ η τιμή RMSEE αυξήθηκε κατά 42% (RMSEE= 0.465). Στον Πίνακα III.30 καταγράφονται τα στατιστικά της συσχέτισης μεταξύ πειραματικών και προβλεπόμενων τιμών logk w. Πίνακας III.30. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου. PLS 7.4 Ι-α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (93 ενώσεις) 0.864 0.997 0.016 0.865 0.766 0.099 Ομάδα ελέγχου 3 (5 ενώσεις) 0.886 1.610-2.793 0.319 0.426-0.256 0.682 PLS 7.4 Ι-β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (98 ενώσεις) 0.840 0.999 0.012 0.840 0.724 0.116 *Ομάδα 3 0.923 1.750-2.415 0.468-0.078 0.546 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. 148
Σχήμα III. 7. Γραφική απεικόνιση της σχέσης logk wπειρ =f(logk wυπολ ) για τις ενώσεις της ομάδας εργασίας (μοντέλο PLS 7.4 Ι-β). Μετά την εξαγωγή των παραπάνω μοντέλων, επιχειρήθηκε η ανάπτυξη μοντέλων στα οποία δε θα περιλαμβάνεται καμία παράμετρος λιποφιλίας (logp adme, ClogP, logd), καθώς αποτελεί σύνθετη παράμετρο και συχνά μη αξιόπιστα υπολογισμένη, αλλά περισσότερο θεμελιώδεις παράμετροι. Τα μοντέλα αναπτύχθηκαν επίσης ακολουθώντας την παραπάνω διαδικασία της κατά χρονικά διαστήματα προσθήκης ενώσεων. Για την ανάπτυξη του πρώτου μοντέλου χρησιμοποιήθηκε η πρώτη ομάδα ενώσεων, ενώ από τη δεξαμενή των μεταβλητών αφαιρέθηκαν παράμετροι σχετιζόμενες άμεσα με τη λιποφιλία. Αρχικά, προέκυψε ένα μοντέλο μίας κύριας συνιστώσας (Α=1) με R 2 =0.675, Q2=0.610 και RMSEE= 0.717. Και σε αυτήν την περίπτωση η ένωση Δικουμαρόλη αποτέλεσε έκροπη τιμή και αφαιρέθηκε οδηγώντας σε ένα μοντέλο τριών κύριων συνιστωσών (Α=3) με R 2 =0.885, Q 2 =0.752 και RMSEE=0.403. Με βάση τη διαδικασία που περιγράφηκε προηγουμένως, αφαιρέθηκαν μεταβλητές των οποίων η συνεισφορά στο μοντέλο ήταν χαμηλή καθώς και από παρόμοιες 149
μεταβλητές αυτές οι οποίες είχαν μικρότερη σημαντικότητα. Το τελικό μοντέλο (PLS 7.4 ΙΙ) δύο κυρίων συνιστωσών (Α=2) το οποίο προέκυψε είχε καλά στατιστικά στοιχεία (R 2 =0.895, Q 2 =0.857, RMSEE= 0.382). Το μοντέλο περιλαμβάνει 12 μεταβλητές, οι συντελεστές των οποίων απεικονίζονται στο Σχήμα III.7. Οι ιστοί μαύρου χρώματος αντιστοιχούν στις μεταβλητές με τιμή VIP >1. Όπως φαίνεται και στο Σχήμα III.7, η μη πολική επιφάνεια (npsa) αποτελεί πολύ σημαντική μεταβλητή με θετική συνεισφορά στη συγκράτηση. Το ίδιο ισχύει και για την παράμετρο CMR, καθώς και τα τοπολογικά μεγέθη χν1και SHother, τα οποία αποτελούν δείκτες συνδετικότητας και ηλεκτροτοπολογικής κατάστασης υδρογόνου σε μη πολικούς δεσμούς με άτομα άνθρακα (αρωματικοί άνθρακες, άνθρακες σε διπλό δεσμό), αντίστοιχα. Στο σημείο αυτό πρέπει να σημειωθεί ότι ο δείκτης χν1 έδειξε πολύ καλή συσχέτιση με παραμέτρους όγκου, όπως CMR, V, SAVol (σε κάθε περίπτωση R 2 >0.96) υποδεικνύοντας ότι σχετίζεται με το μέγεθος του μορίου. Η πολική επιφάνεια (PSA) και ο αριθμός των όξινων κέντρων (Acidic Ionic Groups) αποτελούν σημαντικές παραμέτρους για το μοντέλο και εμφανίζουν αρνητική συνεισφορά στη συγκράτηση. Στο μοντέλο περιλαμβάνεται, ακόμη, ένας αριθμός ηλεκτροτοπολογικών δεικτών, πέραν αυτών που ήδη αναφέρθηκαν. Από αυτούς, αρνητική συνεισφορά παρουσιάζουν οι gmax (δείκτης μέγιστης ηλεκτροτοπολογικής κατάστασης στο μόριο) και Samide, ενώ οι SssCH2 (δείκτης για την ομάδα CH 2 -) και SsCl φέρουν θετικό συντελεστή. 150
Σχήμα III.7. Ιστόγραμμα των συντελεστών (coefficient) των μεταβλητών (variable) του μοντέλου PLS 7.4 ΙΙ. Με μαύρο χρώμα απεικονίζονται οι μεταβλητές με τιμή VIP > 1. Ως τυφλή ομάδα ελέγχου, χρησιμοποιήθηκαν και σε αυτή την περίπτωση, οι ομάδες 2 και 3 και τα αποτελέσματα παρουσιάζονται στους Πίνακες III.31 και III.32. Πίνακας III.31. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος 2 Αλβενδαζόλη 1.18 0.53 Αλβενδαζόλη σουλφοξείδιο 0.57 0.44 Αμινοπυρίνη -0.70 0.98 Ανδροστενδιόνη 0.44 0.19 Αμοξυκιλίνη -0.47 1.90 Αντιπυρίνη -0.85 1.89 Ατροπίνη -0.88 0.84 Δεϋδροϊσοανδροστερόνη 0.60 0.23 5α-διϋδροτεστοστερόνη 0.78 0.28 Εφεδρίνη -0.56 1.05 Θειοριδαζίνη 0.42 0.11 Ινδομεθακίνη 0.53 0.22 Καφεΐνη -0.45 1.72 Κινιδίνη -0.01 0.01 Κοκαΐνη -0.03 0.01 Μεβενδαζόλη 1.29 0.53 Μεπροβαμάτη 0.37 0.51 Θειική μορφίνη -0.50 0.80 Οιστραδιόλη 1.04 0.40 Παπαβερίνη 0.31 0.11 Πενταζοκίνη 0.26 0.12 151
Πεντοβαρβιτάλη 1.04 0.81 Περφαιναζίνη 0.27 0.08 Πρεγνενολόνη 1.52 0.41 Προγεστερόνη 0.82 0.27 Ρανιτιδίνη -0.85 1.39 Ρισπεριδόνη -0.35 0.14 Σαλικυλικό οξύ -0.24 3.02 Σουλφαμεθοξαζόλιο -0.58 14.48 Τερβουταλίνη 0.79 1.02 Τραζοδόνη -0.72 0.31 Υδροκινόνη 0.42 2.79 Υδροχλωροθειαζίδιο 1.08 1.40 Φαιναζίνη 0.17 0.09 Φαινακετίνη -0.09 0.09 Φαινυτοϊνη 0.58 0.33 Χρωρφαινυραμίνη -0.83 0.41 Μέσο απόλυτο σφάλμα 1.08 Γεωμετρικός μέσος 1.03 RMSEP 0.70 Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος 3 Καντεσαρτάνη -0.57 0.57 Καντεσαρτάνη σιλεξετίλ 1.20 0.27 EXP3174-0.31 0.21 Λοσαρτάνη -0.10 0.04 Βαλσαρτάνη 0.09 0.07 Μέσο απόλυτο σφάλμα 0.23 Γεωμετρικός μέσος 0.40 RMSEP 0.62 Πίνακας III.32. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Σουλφοξείδιο της Αλβενδαζόλη Ανδροστενδιόνη Αλβενδαζόλης Αμοξυκιλίνη Αμινοπυρίνη Μεβενδαζόλη Θειοριδαζίνη Αντιπυρίνη Οιστραδιόλη Καφεΐνη Ατροπίνη Πεντοβαρβιτάλη Κινιδίνη Δεϋδροϊσοανδροστερόνη Πρεγνενολόνη Κοκαΐνη 5α-διϋδροτεστοστερόνη Υδροχλωροθειαζίδιο Μεπροβαμάτη Καντεσαρτάνη Εφεδρίνη σιλεξετίλ Παπαβερίνη Ινδομεθακίνη Πενταζοκίνη Θειική μορφίνη Περφαιναζίνη Προγεστερόνη 152
Ρισπεριδόνη Σαλικυλικό οξύ Υδροκινόνη Φαιναζίνη Φαινακετίνη EXP3174 Λοσαρτάνη Βαλσαρτάνη Ρανιτιδίνη Σουλφαμεθοξαζόλιο Τερβουταλίνη Τραζοδόνη Φαινυτοϊνη Χρωρφαινυραμίνη Καντεσαρτάνη Η πρόβλεψη για το μεγαλύτερο ποσοστό των ενώσεων είναι τουλάχιστον αποδεκτή, ενώ το 17% του συνόλου των ενώσεων δεν προβλέπεται ικανοποιητικά. Στον Πίνακα III.33 περιλαμβάνονται τα στατιστικά στοιχεία με τα οποία αξιολογείται περαιτέρω η προβλεπτική ικανότητα του μοντέλου. Η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τη δεύτερη ομάδα ενώσεων είναι μέτρια, ενώ χρησιμοποιώντας και την τρίτη ομάδα ενώσεων ως ομάδα ελέγχου, παρατηρείται μια μικρή βελτίωση. Ωστόσο, αν ληφθεί υπόψη μόνο η τρίτη ομάδα ενώσεων ως ομάδα ελέγχου, διαπιστώνεται ότι παρά την υψηλή τιμή του συντελεστή συσχέτισης, οι ενώσεις αυτές δεν μπορούν να προβλεφθούν ικανοποιητικά από το μοντέλο, όπως φαίνεται από τη σημαντική απόκλισης του σταθερού όρου από το μηδέν και την τιμή της κλίσης. Οι τιμές των μεγεθών R 2 pred, r 2 m, r 2 m και Δr 2 m για τη δεύτερης ομάδας βρίσκονται εντός των αποδεκτών ορίων (R 2 pred, r 2 m και r 2 m >0.5 και Δr 2 m <0.2). Εντούτοις, για την τρίτη ομάδα ενώσεων, αν και οι τιμές R 2 pred και r 2 m είναι μεγαλύτερες από 0.5, οι τιμές των μεγεθών r 2 m και Δr 2 m (0.326<0.5 και 0.269>0.2, αντίστοιχα) συνηγορώντας στο ότι οι ενώσεις αυτές δεν προβλέπονται ικανοποιητικά από το μοντέλο. Πίνακας III.33. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για το μοντέλο. 153
PLS 7.4 ΙΙ R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.895 1.000 0.008 0.894 0.814 0.080 (56 ενώσεις) Ομάδα ελέγχου 2 0.639 0.910 0.308 0.612 0.542 0.525 0.017 (37 ενώσεις) Ομάδα ελέγχου 3 (5 ενώσεις) 0.918 1.658-1.359 0.792 0.595 0.326 0.269 Ομάδα ελέγχου 0.659 0.953 0.230 0.640 0.590 0.521 0.069 2&3 (42 ενώσεις) Υπολογιστικό Σχήμα III.8. Διάγραμμα των πειραματικών τιμών logk w(iam)7.4 ως προς τις αντίστοιχες θεωρητικές τιμές των ενώσεων της ομάδας εκμάθησης καθώς και της ομάδας ελέγχου για το μοντέλο PLS 7.4 ΙΙ. Με ενσωμάτωση της δεύτερης ομάδας ενώσεων στην ομάδα εργασίας προέκυψε ένα μοντέλο (PLS 7.4 ΙΙ-α) δύο κυρίων συνιστωσών με χαμηλότερα στατιστικά στοιχεία σε σχέση με το αρχικό μοντέλο (R 2 =0.822, Q 2 =0.795, RMSEE= 0.488). Συγκεκριμένα, παρατηρήθηκε μείωση των συντελεστών R 2 και Q 2 κατά 8% και 7% αντίστοιχα και αύξηση της τιμής RMSEE κατά 28%. Ως τυφλή ομάδα ελέγχου για την αξιολόγηση της προβλεπτικής ικανότητας του μοντέλου χρησιμοποιήθηκε η τρίτη ομάδα ενώσεων. Η κλίση της ευθείας συσχέτισης 154
αποκλίνει σημαντικά από τη μονάδα, ενώ η τιμή του σταθερού όρου υποδηλώνει υπερτίμηση των προβλεπόμενων τιμών (Πίνακας III.34). Το μοντέλο, όσον αφορά στην ομάδα εργασίας, εμφάνισε ικανοποιητικές τιμές r 2 m, r 2 m και Δr 2 m (0.822, 0.689 και 0.133, αντίστοιχα). Αναφορικά, ωστόσο, με την ομάδα ελέγχου οι τιμές αυτές είναι οριακές (r 2 m=0.511) ή και εκτός ορίων (r 2 m=0.078<0.5 και Δr 2 m=0.433>0.2). Αντιθέτως, η τιμή R 2 pred είναι αρκετά ικανοποιητική (R 2 pred=0.727>0.5). Τέλος, με την εισαγωγή και της τρίτης ομάδας ενώσεων στην ομάδα εργασίας (98 συνολικά ενώσεις), προέκυψε ένα μοντέλο δύο κυρίων συνιστωσών με ικανοποιητικά στατιστικά στοιχεία (R 2 =0.812, Q 2 =0.770, RMSEE= 0.507). Στην περίπτωση αυτή, οι συντελεστές R 2 και Q 2 μειώθηκαν κατά 9% και 10% αντίστοιχα, ενώ το σφάλμα RMSEE αυξήθηκε κατά 33% σε σχέση με το αρχικό μοντέλο. Το μοντέλο, τέλος, έδειξε ικανοποιητικά στατιστικά στοιχεία r 2 m, r 2 m και Δr 2 m (0.811>0.5, 0.671>0.5 και 0.140<0.2, αντίστοιχα), τα οποία παρουσιάζονται στον Πίνακα.. Πίνακας III.34. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου. PLS 7.4 ΙΙ-α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.822 0.999 0.003 0.822 0.689 0.133 (93 ενώσεις) Ομάδα ελέγχου 3 0.877 1.806-1.853 0.724 0.511 0.078 0.433 (5 ενώσεις) PLS 7.4 ΙΙ-β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.812 1.000 0.003 0.811 0.671 0.140 (98 ενώσεις) *Ομάδα 3 0.907 1.733-1.624 0.551 0.206 0.345 155
*Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. Σχήμα III. 9. Διάγραμμα των πειραματικών τιμών logk w(iam)7.4 ως προς τις αντίστοιχες θεωρητικές τιμές των ενώσεων της ομάδας εκμάθησης. Σύγκριση μοντέλων PLS 7.4 Ι και PLS 7.4 ΙΙ Τα μοντέλα PLS 7.4 Ι και PLS 7.4 ΙΙ βασίζονται στην ίδια ομάδα εργασίας αλλά περιλαμβάνουν διαφορετικές περιγραφικές μεταβλητές, καθώς στόχος ήταν το μοντέλο PLS 7.4 ΙΙ να μην περιλαμβάνει κάποια παράμετρο λιποφιλίας. Το μοντέλο PLS 7.4 Ι περιλαμβάνει επτά περιγραφικές μεταβλητές (Σχήμα III.5), ενώ το μοντέλο PLS 7.4 ΙΙ περιλαμβάνει δώδεκα (Σχήμα III.7). Όπως φαίνεται από τα Σχήματα III.5 και III.7, στο μοντέλο PLS 7.4 ΙΙ εμπεριέχονται όλες οι μεταβλητές του μοντέλου PLS 7.4 Ι (εκτός, φυσικά, από την παράμετρο ClogP. Επιπλέον, το μοντέλο PLS 7.4 ΙΙ περιλαμβάνει τις παραμέτρους npsa (μη πολική επιφάνεια), Β (βασικότητα σε δεσμούς υδρογόνου), καθώς και τις (ηλεκτρο)τοπολογικές παραμέτρους χν1, SHother, SssCH2 και gmax. Η μεταβλητή npsa σχετίζεται με τις υδρόφοβες αλληλεπιδράσεις, ενώ η μεταβλητή Β με το σχηματισμό δεσμών υδρογόνου μεταξύ 156
δύο μορίων. Επομένως, μπορεί να θεωρηθεί ότι οι δύο αυτές μεταβλητές αποτελούν τη συνισταμένη της λιποφιλίας, η οποία μπορεί να θεωρηθεί ότι καθορίζεται από την υδροφοβία και την πολικότητα (Λιποφιλία = Υδροφοβία Πολικότητα). Αξίζει να σημειωθεί, επιπροσθέτως, ότι οι (ηλεκτρο)τοπολογικές μεταβλητές που προαναφέρθηκαν εκφράζουν πληροφορία η οποία κωδικοποιείται επίσης από το συντελεστή μερισμού. Είναι δυνατό, επομένως, να εξαχθεί το συμπέρασμα ότι η απουσία παραμέτρου λιποφιλίας οδήγησε στην εισαγωγή περισσότερων μεταβλητών, οι οποίες, ωστόσο, συνολικά δεν υποκαθιστούν τη λιποφιλία δεδομένου ότι τα στατιστικά στοιχεία του μοντέλου PLS 7.4 ΙΙ είναι χαμηλότερα, συγκριτικά με το μοντέλο PLS 7.4 ΙΙ. (Πίνακες III.29 και III.33). Επιπλέον, η προβλεπτική ικανότητα του μοντέλου PLS 7.4 Ι σε σχέση με τη δεύτερη ομάδα ενώσεων είναι καλύτερη συγκριτικά με το μοντέλο PLS 7.4 ΙΙ, καθώς ο συντελεστής συσχέτισης μεταξύ πειραματικών και υπολογιστικών τιμών logk w(iam)7.4 (R 2 ) είναι κατά 12% υψηλότερος. Επιπροσθέτως, καθώς οι συντελεστές R 2 pred, r 2 m, r 2 m είναι υψηλότεροι κατά 13%, 18% και 14% αντίστοιχα, αν και η τιμή Δr 2 m είναι κατά 67% μεγαλύτερη. Όσον αφορά, ωστόσο, στην τρίτη ομάδα ενώσεων, το μοντέλο PLS 7.4 ΙΙ εμφανίζει μικρή βελτίωση, ωστόσο σε καμία περίπτωση δεν μπορεί να θεωρηθεί και πάλι ότι η ομάδα αυτή προβλέπεται ικανοποιητικά. Θα πρέπει να αναφερθεί ότι από τη σύγκριση πειραματικών υπολογιστικών τιμών του συντελεστή μερισμού, το ClogP υπερτιμά σημαντικά τη λιποφιλία των ενώσεων της ομάδας αυτής. Συμπερασματικά, τα δύο μοντέλα εμφανίζουν αρκετά συγκρίσιμα στατιστικά στοιχεία και παρόμοια προβλεπτική ικανότητα. Και στις δύο περιπτώσεις διαφαίνεται η θετική επίδραση των υδρόφοβων αλληλεπιδράσεων οι οποίες αναπτύσσονται κατά 157
τη διαδικασία της συγκράτησης από τη στήλη ΙΑΜ. Η πολικότητα παρουσιάζει αρνητική συνεισφορά, όπως επίσης και η παρουσία όξινων κέντρων, η οποία σχετίζεται σε μεγάλο βαθμό με την ιοντική κατάσταση των μορίων. Αντίθετα, δεν εμφανίστηκε στατιστικά σημαντική η παρουσία βασικών κέντρων, γεγονός το οποίο επιβεβαιώνει την εξισορρόπηση του ιονισμού από την ανάπτυξη ηλεκτροστατικών αλληλεπιδράσεων με τις φωσφορικές ομάδες. Εξειδικευμένα υποδομικά και συντακτικά χαρακτηριστικά των μορίων τα οποία συνεισφέρουν στην τιμή του παράγοντα χωρητικότητας, είτε θετικά είτε αρνητικά, εκφράζονται με τις (ηλεκτρο)τοπολογικές παραμέτρους. Στο σημείο αυτό θα πρέπει να αναφερθεί ότι επιχειρήθηκε η εκ νέου εξαγωγή μοντέλου χρησιμοποιώντας ως ομάδα εργασίας το σύνολο των ενώσεων του Πίνακα III.1, διαδικασία η οποία δεν οδήγησε σε μοντέλα πιο αξιόπιστα από τα PLS 7.4 Ι-β και PLS 7.4 ΙΙ-β. Παρατηρήθηκε, ωστόσο, βελτίωση των προβλέψεων για τις ενώσεις της ομάδας 3 με εισαγωγή μεταβλητών οι οποίες σχετίζονται με όγκο και δεικτών συνδεσιμότητας (χν1, χν2) ή/και αφαίρεση των παραμέτρων λιποφιλίας. Εντούτοις, τέτοιου είδους μοντέλα έδειξαν μέτρια στατιστικά στοιχεία. ii) Χωματογραφικές συνθήκες: ph=5.0 Για την εξαγωγή μοντέλου πρόβλεψης των τιμών logk w(iam)5.0 χρησιμοποιήθηκε ως ομάδα εργασίας το σύνολο των ενώσεων της πρώτης ομάδας του Πίνακα III.1 για τις οποίες είχαν προσδιοριστεί οι τιμές logk w(iam)5.0, δηλαδή 55 ενώσεις. Το αρχικό μοντέλο το οποίο προκύπτει από το σύνολο των περιγραφικών μεταβλητών αποτελείται από τρεις κύριες συνιστώσες (Α=3) και επιδεικνύει ικανοποιητικά στατιστικά στοιχεία (R 2 =0.823, Q 2 =0.705). Η ένωση Μεφεναμικό οξύ, με αποδεκτή κατά τα άλλα τιμή DModX, θεωρήθηκε ότι αποτελεί έκροπη τιμή και αφαιρέθηκε 158
από την ομάδα εργασίας, οδηγώντας σε βελτίωση του μοντέλου (Α=3, R 2 =0.844, Q 2 =0.757). Η επιλογή των μεταβλητών έγινε με βάση τη διαδικασία η οποία περιγράφηκε προηγουμένως για το μοντέλο PLS 7.4 Ι, αφαιρώντας δηλαδή μεταβλητές με χαμηλή τιμή VIP και συντελεστή. Το βελτιωμένο μοντέλο το οποίο προέκυψε βάσει της παραπάνω διαδικασίας (PLS 5.0 Ι) χαρακτηρίζεται από ικανοποιητικά στατιστικά στοιχεία (Α=2, R 2 =0.855, Q 2 =0.810, RMSEE=0.356). Το μοντέλο περιλαμβάνει επτά περιγραφικές μεταβλητές, οι συντελεστές των οποίων απεικονίζονται στο ιστόγραμμα του Σχήματος III.10. Όπως φαίνεται και στο Σχήμα III.10, η παράμετρος ClogP είναι η μοναδική με τιμή VIP>1 (ιστός μαύρου χρώματος) και διαθέτει επίσης την υψηλότερη θετική τιμή συντελεστή. Παράμετροι οι οποίες εκφράζουν όγκο/μέγεθος όπως η προσβάσιμη από το διαλύτη επιφάνεια (SASA) και το μοριακό βάρος (molweight) εμφανίζουν επίσης θετική συνεισφορά. Θετική επίδραση στη συγκράτηση εμφανίζουν, επιπλέον, ο αριθμός αλογόνων στο μόριο, ο αριθμός δακτυλίων καθώς και ο δείκτης συνδετικότητας χvch6. Αρνητική συνεισφορά παρουσιάζει η βασικότητα σε δεσμούς υδρογόνου (Β) με υψηλή απόλυτη τιμή συντελεστή. Τέλος, ο αριθμός των όξινων ομάδων δεν περιλαμβάνεται στο μοντέλο, καθώς ο ιονισμός των όξινων ενώσεων δεν είναι σημαντικός σε ph 5.0. Αντίθετα, οι βασικές ενώσεις είναι πλήρως πρωτονιωμένες, ωστόσο και πάλι δεν παρατηρείται αρνητική συνεισφορά του αριθμού των βαδικών κέντρων λόγω εξισορρόπησης του ιονισμού από τις ηλεκτροστατικές αλληλεπιδράσεις. 159
Σχήμα III.10. Ιστόγραμμα των συντελεστών (coefficient) των μεταβλητών (variable) του μοντέλου PLS 5.0 Ι. Με μαύρο χρώμα απεικονίζονται οι μεταβλητές με τιμή VIP > 1. Και σε αυτήν την περίπτωση, οι ομάδες 2 και 3 του Πίνακα III.1 χρησιμοποιήθηκαν ως τυφλή ομάδα ελέγχου (blind test set). Αρχικά, το μοντέλο εφαρμόστηκε για την πρόβλεψη των τιμών logk w(iam)5.0 των ενώσεων της ομάδας 2 για τις οποίες υπήρχαν διαθέσιμες οι αντίστοιχες πειραματικές τιμές (17 ενώσεις). Εξετάζοντας το ιστόγραμμα των τιμών DModX για την ομάδα ελέγχου διαπιστώθηκε ότι από τις 17 ενώσεις η Θειική μορφίνη υπερβαίνει κατά μεγαλύτερο βαθμό την κρίσιμη τιμή συγκριτικά με τις υπόλοιπες ενώσεις, και συνεπώς καθίσταται επισφαλής η πρόβλεψη για την ένωση αυτή, οπότε και αφαιρέθηκε από την ομάδα ελέγχου. Στη συνέχεια, στην ομάδα ελέγχου ενσωματώθηκε και η τρίτη ομάδα του Πίνακα III.1 (21 συνολικά ενώσεις). Στον Πίνακα III.35 καταγράφονται οι τιμές των υπολοίπων για τις ενώσεις των ομάδων 2 και 3 βάσει του μοντέλου PLS 5.0 Ι. Η πρόβλεψη είναι ικανοποιητική για την πλειοψηφία των ενώσεων. Οι ενώσεις οι οποίες δεν προβλέπονται επιτυχώς είναι δύο, μία από κάθε ομάδα. Οι ενώσεις αυτές διαφέρουν από τις αντίστοιχες ενώσεις του MLR μοντέλου για τις ίδεις χρωματογραφικές συνθήκες (Αμοξυκιλίνη, Υδροκινόνη, Καντεσαρτάνη σιλεξετίλ). 160
Στον Πίνακα III.37 συνοψίζονται τα στατιστικά στοιχεία της συσχέτισης μεταξύ πειραματικών και θεωρητικών τιμών logk w(iam)5.0. Οι ενώσεις της ομάδας 2 προβλέπονται ικανοποιητικά, βάσει των τιμών των R 2 pred, r 2 m, r 2 m και Δr 2 m, παρά τη μικρή απόκλιση από τη μονάδα που εμφανίζει η κλίση της ευθείας. Ικανοποιητική είναι, επίσης, η πρόβλεψη όταν συμπεριληφθεί στην ομάδα ελέγχου και η τρίτη ομάδα ενώσεων. Ωστόσο, αν ληφθεί υπόψη μόνο η τρίτη ομάδα ως ομάδα ελέγχου, παρατηρείται ότι, παρά την καλή τιμή του συντελεστή συσχέτισης, η κλίση της ευθείας διαφέρει σημαντικά από τη μονάδα και ο σταθερός όρος είναι σαφώς διάφορος του μηδενός. Επίσης, παρά την καλή τιμή του R 2 pred, τα υπόλοιπα μεγέθη (r 2 m, r /2 m και Δr 2 m) λαμβάνουν μη αποδεκτές τιμές. Πίνακας III.35. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk w για τις ενώσεις της ομάδας ελέγχου. Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος 2 Ακετυλοσαλικυλικό οξύ -0.79 2.63 Αλβενδαζόλη 1.21 0.47 Αλβενδαζόλη σουλφοξείδιο 0.49 0.38 Αμοξυκιλίνη -0.32 0.86 Ινδομεθακίνη 0.65 0.22 Μεβενδαζόλη 0.95 0.37 Μεπροβαμάτη 0.39 0.72 Οιστραδιόλη 0.33 0.12 Πενταζοκίνη -0.50 0.29 Πεντοβαρβιτάλη 0.77 0.55 Σαλικυλικό οξύ -0.30 0.65 Σουλφαμεθοξαζόλιο 0.29 0.31 Τερβουταλίνη 0.02 0.11 Υδροκινόνη -0.74 1.57 Υδροχλωροθειαζίδιο 0.24 0.29 Φαινυτοϊνη 0.59 0.30 Μέσο απόλυτο 0.62 σφάλμα Γεωμετρικός μέσος 0.65 161
RMSEP 0.61 Ομάδα Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος 3 Καντεσαρτάνη -1.26 0.82 Καντεσαρτάνη σιλεξετίλ 0.49 0.11 EXP3174-0.77 0.40 Λοσαρτάνη 0.05 0.02 Βαλσαρτάνη -0.37 0.19 Μέσο απόλυτο 0.31 σφάλμα Γεωμετρικός μέσος 0.38 RMSEP 0.81 Πίνακας III.36. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη 0.50 Δ 0.99 Αποδεκτή Δ 1.00 Μη αποδεκτή Αλβενδαζόλη Ακετυλοσαλικυλικό Αλβενδαζόλη σουλφοξείδιο οξύ Αμοξυκιλίνη Ινδομεθακίνη Καντεσαρτάνη Μεπροβαμάτη Μεβενδαζόλη Οιστραδιόλη Πενταζοκίνη Σαλικυλικό οξύ Πεντοβαρβιτάλη Σουλφαμεθοξαζόλιο Υδροκινόνη Τερβουταλίνη Φαινυτοϊνη Υδροχλωροθειαζίδιο EXP3174 Καντεσαρτάνη σιλεξετίλ Λοσαρτάνη Βαλσαρτάνη Πίνακας III.37. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για το μοντέλο. Ομάδα εργασίας (54 ενώσεις) Ομάδα ελέγχου 2 (16 ενώσεις) Ομάδα ελέγχου 3 (5 ενώσεις) Ομάδα ελέγχου 2&3 R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m 0.855 0.999 0.003 0.838 0.711 0.127 0.757 1.261-0.048 0.716 0.737 0.577 0.160 0.787 1.504-1.829 0.714 0.501-0.025 0.526 0.715 0.952 0.109 0.716 0.678 0.581 0.097 162
(21 ενώσεις) Υπολογιστικό Σχήμα III.11. Διάγραμμα των πειραματικών τιμών logk w(iam)5.0 ως προς τις αντίστοιχες θεωρητικές τιμές των ενώσεων της ομάδας εκμάθησης καθώς και της ομάδας ελέγχου για το μοντέλο PLS 5.0 Ι. Στην ομάδα εργασίας προστέθηκε η δεύτερη ομάδα ενώσεων, εκτός από τη Θειική μορφίνη (70 συνολικά ενώσεις), οδηγώντας στην εξαγωγή ενός μοντέλου (PLS 5.0 Ι-α) δύο κυρίων συνιστωσών με στατιστικά στοιχεία λιγότερο ικανοποιητικά συγκριτικά με το αρχικό μοντέλο (R 2 =0.812, Q 2 =0.786, RMSEE=0.416). Ως ομάδα ελέγχου για την αξιολόγηση του μοντέλου χρησιμοποιήθηκε η τρίτη ομάδα ενώσεων. Η πρόβλεψη, όπως αναμενόταν δεν ήταν ικανοποιητική, γεγονός το οποίο αντικατοπτρίζεται και στον Πίνακα III.38. Τέλος, στην ομάδα εργασίας προστέθηκε και η τρίτη ομάδα ενώσεων (75 συνολικά ενώσεις). Το μοντέλο το οποίο προέκυψε (PLS 5.0 Ι-β) εμφάνισε λιγότερο ικανοποιητικά στατιστικά στοιχεία, τόσο σε σχέση με το αρχικό, όσο και με το 163
δεύτερο μοντέλο (R 2 =0.802, Q 2 =0.784, RMSEE= 0.448). Η συσχέτιση μεταξύ πειραματικών και προβλεπόμενων τιμών παρουσιάζεται στον Πίνακα III.38. Πίνακας III.38. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου. PLS 5.0 Ι-α R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.812 0.998 0.002 0.812 0.671 0.141 (71 ενώσεις) Ομάδα ελέγχου 3 0.792 1.446-1.808 0.693 0.505 0.038 0.467 (5 ενώσεις) PLS 5.0 Ι-β R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας 0.802 0.998 0.004 0.791 0.637 0.154 (76 ενώσεις) *Ομάδα 3 0.803 1.502-1.774 0.513 0.064 0.449 *Η ομάδα 3 είναι ενσωματωμένη στην ομάδα εργασίας, ωστόσο, λόγω της ιδιαιτερότητας που παρουσιάζει τα στατιστικά στοιχεία της συσχέτισης logk wπειρ =f(logk wυπολ ) καταγράφονται και ξεχωριστά. Σχήμα III. 12. Διάγραμμα των πειραματικών τιμών logk w(iam)5.0 ως προς τις αντίστοιχες θεωρητικές τιμές των ενώσεων της ομάδας εκμάθησης. Στο σημείο αυτό πρέπει να αναφερθεί ότι επιχειρήθηκε η ανάπτυξη μοντέλων με αντικατάσταση της παραμέτρου ClogP από πιο θεμελιώδεις μεταβλητές, η οποία δεν 164
οδήγησε ωστόσο σε στατιστικά αξιόπιστα μοντέλα. Επίσης, ούτε σε αυτή την περίπτωση η χρήση του συνόλου των ενώσεων του Πίνακα III.1 για την εκ νέου εξαγωγή μοντέλου οδήγησε σε μοντέλο σημαντικά καλύτερο από το μοντέλο PLS 5.0 Ι- β. ΙΙ. Συγκράτηση στη Χρωματογραφική Στήλη Ανθρώπινης Αλβουμίνης του Ορού (Human Serum Albumin, HSA) Εφαρμογή της Μεθόδου Μερικών Ελαχίστων Τετραγώνων (PLS) για την ανάπτυξη μοντέλων πρόβλεψης χρωματογραφικής συγκράτησης. Για τη μελέτη της συγκράτησης στη στήλη HSA χρησιμοποιήθηκαν οι ενώσεις του Πίνακα 2. Ως τυφλή ομάδα ελέγχου χρησιμοποιήθηκε το σύνολο των πέντε Σαρτανών και, συνεπώς, οι υπόλοιπες ενώσεις αποτέλεσαν την ομάδα εργασίας. Ως μεταβλητή απόκρισης Υ τέθηκε ο παράγοντας χωρητικότητας σε ποσοστό ακετονιτριλίου 10%, καθώς σε προηγούμενη μελέτη είχε αποδειχθεί ότι επιδεικνύει καλύτερη συσχέτιση με δεδομένα πρωτεϊνικής σύνδεσης τα οποία προκύπτουν από παραδοσιακές μεθόδους. Όπως και στην περίπτωση της μελέτης της συγκράτησης στη στήλη ΙΑΜ, ο πίνακας των μεταβλητών Χ περιελάμβανε το σύνολο των θεωρητικά υπολογισμένων περιγραφικών μεταβλητών. Το αρχικό μοντέλο το οποίο προέκυψε εμφάνισε χαμηλά στατιστικά στοιχεία (Α=2, R 2 = 0.680, Q 2 = 0.578). Η ένωση Επαλρεστάτη, αν και εμφάνισε αποδεκτή τιμή DModX, αποτέλεσεν σημαντικά έκροπη τιμή και αφαιρέθηκε από την ομάδα εργασίας οδηγώντας σε βελτίωση των στατιστικών στοιχείων (Α=2, R 2 = 0.819, Q 2 = 0.727). Εφαρμόζοντας την ίδια διαδικασία η οποία περιγράφηκε στην περίπτωση της χρωματογραφίας ΙΑΜ εξήχθη το τελικό μοντέλο, το οποίο έδειξε ικανοποιητικά 165
στατιστικά στοιχεία (A=2, R 2 = 0.809, Q 2 = 0.745, RMSEE=0.338) και περιελάμβανε 8 περιγραφικές μεταβλητές (Σχήμα III.13) (Μοντέλο PLS HSA I). Η λιποφιλία αποδεικνύεται και σε αυτή την περίπτωση ως ο κύριος παράγοντας ο οποίος καθορίζει τη συγκράτηση, καθώς παρουσιάζει την υψηλότερη τιμή συντελεστή και VIP. Όπως αναμενόταν, το κλάσμα της ανιονικής μορφής των ενώσεων στο φυσιολογικό ph ενισχύει τη συγκράτηση από τη στήλη, καθώς η παρουσία αρνητικά φορτισμένων ιοντικών κέντρων στο μόριο οδηγεί σε ηλεκτροστατικές αλληλεπιδράσεις με τη θετικά φορτισμένη πρωτεΐνη. Η βασικότητα σε δεσμούς υδρογόνου αποτελεί επίσης σημαντική παράμετρο και φαίνεται να ασκεί αρνητική συνεισφορά στον παράγοντα χωρητικότητας. Παρατηρείται, επίσης, η συμμετοχή ενός σημαντικού αριθμού (ηλεκτρο)τοπολογικών μεταβλητών στο μοντέλο, υποδεικνύοντας τη σημασία εξειδικευμένων υπο-δομικών χαρακτηριστικών για τη χρωματογραφική συμπεριφορά των ενώσεων. Από αυτές, θετική συνεισφορά παρουσιάζουν οι δείκτες χvch6 και SsCl, ενώ οι δείκτες gmin και SHCsatu (ηλεκτροτοπολογική κατάσταση ατόμων Η σε sp3 άτομα άνθρακα συνδεδεμένα με ακόρεστο άνθρακα) έχουν αρνητική συνεισφορά. Σχήμα III.13. Οι συντελεστές των μεταβλητών οι οποίες περιέχονται στο μοντέλο PLS HSA I. Οι ιστοί μαύρου χρώματος αντιστοιχούν στις παραμέτρους με τιμή VIP>1. 166
Για την αξιολόγηση του μοντέλου χρησιμοποιήθηκε η ομάδα των πέντε Σαρτανών (Πίνακας III.2) ως τυφλή ομάδα ελέγχου. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τομών logk 10(ACN)HSA για τις ενώσεις αυτές καταγράφονται στον Πίνακα III.39. Η τιμή Δ όλων των ενώσεων, πλην της Καντεσαρτάνης, υποδεικνύει αξιόπιστη πρόβλεψη. Όσον αφορά στην Καντεσαρτάνη, η τιμή Δ βρίσκεται εντός των αποδεκτών ορίων. Στο σημείο αυτό πρέπει να σημειωθεί ότι η μοναδική ένωση με τιμή DModX μεγαλύτερη της κρίσιμης τιμής είναι η Καντεσαρτάνη σιλεξετίλ. Στο Σχήμα III.14 παρουσιάζεται γραφικά η σχέση μεταξύ πειραματικών και υπολογιστικών τιμών logk 10(ACN)HSA για την ομάδα εργασίας και την ομάδα ελέγχου. Πίνακας III.39. Οι τιμές των υπολοίπων μεταξύ πειραματικών και υπολογιστικών τιμών logk 10 για τις ενώσεις της ομάδας ελέγχου. Ένωση Υπόλοιπο Απόλυτη τιμή σχετικού σφάλματος Καντεσαρτάνη -0.58 1.37 Καντεσαρτάνη σιλεξετίλ -0.07 0.04 EXP3174-0.33 0.44 Λοσαρτάνη -0.46 2.15 Βαλσαρτάνη 0.16 0.30 Μέσο απόλυτο σφάλμα 1.05 Γεωμετρικός μέσος RMSEP 0.44 Πίνακας III.40. Ταξινόμηση των ενώσεων της ομάδας ελέγχου βάσει της τιμής Δ. Ποιότητα πρόβλεψης Ένωση Δ 0.49 Αξιόπιστη Καντεσαρτάνη σιλεξετίλ EXP3174 Λοσαρτάνη Βαλσαρτάνη 0.50 Δ 0.99 Αποδεκτή Καντεσαρτάνη Δ 1.00 Μη αποδεκτή 167
Σχήμα III.14. Διάγραμμα των πειραματικών τιμών logk 10(ACN)HSA ως προς τις αντίστοιχες υπολογιστικές τιμές των ενώσεων της ομάδας εκμάθησης καθώς και της ομάδας ελέγχου για το μοντέλο. Στη συνέχεια, η ομάδα ελέγχου ενσωματώθηκε στην ομάδα εργασίας οδηγώντας στην εξαγωγή ενός μοντέλου με ελαφρώς κατώτερα στατιστικά στοιχεία σε σύγκριση με το αρχικό (Α=2, R 2 = 0.793, Q 2 = 0.720, RMSEE= 0.350) (Μοντέλο PLS HSA II). Στον Πίνακα III.41 παρουσιάζονται τα μεγέθη τα οποία χρησιμοποιούνται για την αξιολόγηση της σχέσης μεταξύ πειραματικών και υπολογιστικών τιμών logk 10(ACN)HSA για τα δύο μοντέλα. Οι τιμές των στατιστικών μεγεθών R 2 pred, r 2 m >0.5και Δr 2 m <0.2είναι εντός των αποδεκτών ορίων για την ομάδα ελέγχου, ενώ η τιμή του μεγέθους r /2 m είναι οριακά χαμηλότερη από την οριακή. Επιπλέον, η κλίση και η τομή της καμπύλης συσχέτισης λαμβάνουν ικανοποιητικές τιμές. Πίνακας III.41. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου για το μοντέλο. PLS HSA I R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (62 ενώσεις) 0.809 1.005-0.002 0.809 0.733 0.076 Ομάδα ελέγχου (5 ενώσεις) 0.829 1.002 0.258 0.660 0.667 0.477 0.190 168
PLS HSA II R 2 Κλίση Τομή R 2 pred r 2 m r /2 m Δr 2 m Ομάδα εργασίας (67ενώσεις) 0.793 1.008-0.005 0.785 0.687 0.098 Τέλος, η προσπάθεια εξαγωγής μοντέλων χωρίς παραμέτρους λιποφιλίας δεν οδήγησε σε στατιστικά ικανοποιητικά μοντέλα. ΙΙΙ. Συγκράτηση στη Χρωματογραφική Στήλη α1 Όξινης Γλυκοπρωτεΐνης (α1 Acidic Glycoprotein, AGP) Εφαρμογή της Μεθόδου Μερικών Ελαχίστων Τετραγώνων (PLS) για την ανάπτυξη μοντέλων πρόβλεψης χρωματογραφικής συγκράτησης. Έχει διαπιστωθεί ότι ο οργανικός τροποποιητής επηρεάζει σε σημαντικό βαθμό τη συγκράτηση. Ως εκ τούτου, επιχειρήθηκε η εξαγωγή χωριστού μοντέλου για τις τιμές logk w(acn)agp και logk w(iso)agp. Για την ανάπτυξη των μοντέλων χρησιμοποιήθηκαν οι ενώσεις του Πίνακα III.2 για τις οποίες υπήρχαν διαθέσιμα τα συγκεκριμένα πειραματικά δεδομένα. Ως ομάδα εργασίας σε κάθε περίπτωση χρησιμοποιήθηκε το σύνολο των ενώσεων και, συνεπώς, δεν εφαρμόστηκε η τεχνική της αξιολόγησης με τυφλή ομάδα ελέγχου, λόγω του περιορισμένου αριθμού των διαθέσιμων ενώσεων. Στην περίπτωση αυτή εφαρμόστηκε η τεχνική της εξωτερικής αξιολόγησης, κατά την οποία οι ενώσεις χωρίζονται σε διαφορετικές ομάδες εργασίας και ελέγχου και επαναλαμβάνεται η στατιστική επεξεργασία από την αρχή. Αρχικά, εξήχθη ένα μοντέλο με βάση το σύνολο των ενώσεων το οποίο στη συνέχεια συγκρίθηκε ως προς τα στατιστικά στοιχεία και τις περιεχόμενες περιγραφικές μεταβλητές με τα μοντέλα τα οποία προέκυψαν με την παραπάνω διαδικασία. 1. logk w(acn)agp 169
Το αρχικό μοντέλο το οποίο προέκυψε (PLS AGP I) περιλαμβάνει 28 ενώσεις και οκτώ περιγραφικές μεταβλητές, ενώ δεν αφαιρέθηκε κάποια ένωση ως έκροπη τιμή. Τα στατιστικά στοιχεία του μοντέλου είναι ικανοποιητικά (A=1, R 2 = 0.813, Q 2 = 0.779, RMSEE= 0.391) και παρατηρείται ότι βασίζεται στην εξαγωγή μίας μόνο κύριας συνιστώσας. Οι συντελεστές των περιγραφικών μεταβλητών οι οποίες περιλαμβάνονται στο μοντέλο απεικονίζονται στο Σχήμα III.15. Παρατηρείται η ιδιαίτερη σημασία των υδρόφοβων αλληλεπιδράσεων, καθώς είναι σημαντική η συνεισφορά τόσο της λιποφιλίας (ClogP) όσο και της μη πολικής επιφάνειας (npsa). Οι παράμετροι A, PSA, SHBint2, οι οποίες εκφράζουν οξύτητα σε δεσμούς υδρογόνου, πολική επιφάνεια και πιθανό σχηματισμό εσωτερικών δεσμών υδρογόνου, αντίστοιχα, φαίνεται να εμφανίζουν αρνητική επίδραση στη συγκράτηση. A Σχήμα III.15. Οι συντελεστές των μεταβλητών οι οποίες περιέχονται στο μοντέλο PLS AGP I. Οι ιστοί μαύρου χρώματος αντιστοιχούν στις παραμέτρους με τιμή VIP>1. Το σύνολο των ενώσεων διαιρέθηκε σε τέσσερις ομάδες, έκαστη εκ των οποίων περιλαμβάνει επτά ενώσεις. Αφαιρώντας μία ομάδα κάθε φορά αναπτύχθηκαν τέσσερα διακριτά μοντέλα, καθένα από τα οποία επικυρώθηκε χρησιμοποιώντας ως ομάδα ελέγχου αυτή η οποία αφαιρέθηκε. Στον Πίνακα III.42 καταγράφονται τα 170
στατιστικά στοιχεία κάθε μοντέλου καθώς και τα μεγέθη με τα οποία αξιολογείται η συσχέτιση μεταξύ πειραματικών και υπολογιστικών τιμών logk w(acn)agp για κάθε ομάδα ελέγχου. Πίνακας III.42. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου. Ομάδα εργασίας Ομάδα ελέγχου Α R 2 Q 2 RMSEE RMSEP R 2 r 2 m r /2 m Δr 2 m Μοντέλο 1 1 0.821 0.788 0.374 0.470 0.819 0.647 0.782 0.135 Μοντέλο 2 1 0.822 0.769 0.398 0.472 0.682 0.583 0.291 0.292 Μοντέλο 3 1 0.809 0.744 0.415 0.473 0.680 0.574 0.562 0.012 Μοντέλο 4 1 0.715 0.608 0.440 0.450 0.887 0.742 0.589 0.153 Τα μοντέλα, όπως φαίνεται και στον Πίνακα, εμφανίζουν γενικώς ικανοποιητικά στατιστικά στοιχεία, εφάμιλλα με το αρχικό μοντέλο, με εξαίρεση το τέταρτο μοντέλο στο οποίο παρατηρείται μείωση της απόδοσης. Η προβλεπτική ικανότητα των μοντέλων 1 και 4 είναι ικανοποιητική, ενώ το μοντέλο 2 αδυνατεί να προβλέψει επιτυχώς την ομάδα ελέγχου. Στην περίπτωση του μοντέλου 3, τα στατιστικά που παρουσιάζονται στον Πίνακα III.42 προκύπτουν μετά από αφαίρεση των ενώσεων Ναπροξένιο και Τριμεθοπρίμη, διαφορετικά οι τιμές των μεγεθών αυτών είναι πολύ χαμηλές (RMSEP= 0.546, R 2 = 0.272). Εντούτοις, η τιμή DModX των ενώσεων αυτών δεν ξεπερνά την οριακή, ούτε όταν συμπεριλαμβάνονται στην ομάδα εργασίας (μοντέλο PLS AGP I), ούτε ως ενώσεις ελέγχου (Μοντέλο 3). Ο Πίνακας III.43 περιέχει τις μεταβλητές οι οποίες περιλαμβάνονται σε κάθε μοντέλο, καθώς και στο αρχικό. Με τα σύμβολα (+) και (-) επισημαίνεται η θετική ή αρνητική, αντίστοιχα, συνεισφορά κάθε μεταβλητής, ενώ τα κενά κελιά υποδηλώνουν απουσία της συγκεκριμένης μεταβλητής από το μοντέλο. Οι μεταβλητές οι οποίες σχετίζονται με λιποφιλία και υδρόφοβες αλληλεπιδράσεις (ClogP, npsa) καθώς και 171
αυτές οι οποίες εκφράζουν συμμετοχή σε δεσμούς υδρογόνου (A, PSA, SHBint2) απαντώνται σε όλα τα μοντέλα, στη δεύτερη περίπτωση με μικρές διαφοροποιήσεις. Η ηλεκτροτοπολογική κατάσταση της αμιδικής ομάδας (Samide) απαντάται σε όλα τα μοντέλα πλην του αρχικού εμφανίζοντας σε κάθε περίπτωση αρνητική συνεισφορά. Η διαφοροποίηση παρατηρείται κυρίως σε (ηλεκτρο)τοπολογικές μεταβλητές, εκφράζοντας δομικές απαιτήσεις οι οποίες πιθανώς παρουσιάζουν μικρές μεταβολές ανάλογα με τη δομή των ενώσεων της ομάδας εκμάθησης. Πίνακας III.43. Μεταβλητές PLS AGP I Μοντέλο 1 Μοντέλο 2 Μοντέλο 3 Μοντέλο 4 Α - - - MR + PSA - - - - npsa + + + + + ClogP + + + + + Xvch6 + SHBint2 - - - - - SssCH2 + + - + Xvp5 + Samide - - - - Polarizability + + ncircuits + + SaasC + SsssN + 2. logk w(iso)agp Για την εξαγωγή του αρχικού μοντέλου αφαιρέθηκε η ένωση Καπτοπρίλη η οποία αποτέλεσε έκροπη τιμή. Το μοντέλο το οποίο τελικά προέκυψε (PLS AGP II) περιελάμβανε 28 ενώσεις, επτά περιγραφικές μεταβλητές και έδειξε αρκετά ικανοποιητικά στατιστικά στοιχεία (A=1, R 2 = 0.842, Q 2 = 0.811, RMSEE= 0.332). Στο Σχήμα III.16 απεικονίζονται οι συντελεστές των περιλαμβανομένων στο μοντέλο περιγραφικών μεταβλητών. Και σε αυτή την περίπτωση διαφαίνεται η σημασία των 172
υδρόφοβων αλληλεπιδράσεων (logp adme, npsa) και του σχηματισμού δεσμών υδρογόνου/πολικότητας (A, PSA, SHBint2). Σχήμα III.16. Οι συντελεστές των μεταβλητών οι οποίες περιέχονται στο μοντέλο PLS AGP II. Οι ιστοί μαύρου χρώματος αντιστοιχούν στις παραμέτρους με τιμή VIP>1. Το μοντέλο PLS AGP IΙ επικυρώθηκε, επίσης, με τη διαδικασία της εξωτερικής αξιολόγησης, όπως περιγράφηκε στην προηγούμενη παράγραφο, και τα αποτελέσματα συνοψίζονται στον Πίνακα III.44. Πίνακας III.44. Στατιστικά δεδομένα για την ομάδα εργασίας και τις ομάδες ελέγχου. Ομάδα εργασίας Ομάδα ελέγχου Α R 2 Q 2 RMSEE RMSEP R 2 r 2 m r /2 m Δr 2 m Μοντέλο 1 1 0.853 0.779 0.333 0.277 0.963 0.770 0.695 0.075 Μοντέλο 2 1 0.897 0.823 0.267 0.376 0.797 0.788 0.670 0.118 Μοντέλο 3 1 0.884 0.866 0.269 0.520 0.857 0.848 0.757 0.091 Μοντέλο 4 1 0.847 0.827 0.341 0.372 0.769 0.553 0.740 0.187 Τα μοντέλα εμφανίζουν αρκετά καλά στατιστικά στοιχεία και ελαφρώς υψηλότερα από το αρχικό, υποδεικνύοντας ότι πιθανώς δεν υπάρχει κάποια ένωση η οποία προκαλεί εκμόχλευση. Η προβλεπτική ικανότητα των όλων των μοντέλων είναι εξίσου ικανοποιητική και δεν εντοπίζονται σημαντικά έκροπες τιμές. 173
Οι περιεχόμενες στα μοντέλα μεταβλητές περιλαμβάνονται στον Πίνακα III.45. Και σε αυτή την περίπτωση δεν παρατηρούνται σημαντικές αλλαγές μεταξύ των μοντέλων. Επίσης, διαφαίνεται για ακόμη μία φορά η σημασία της λιποφιλίας και των δεσμών υδρογόνου για τη συγκράτηση από τη στήλη, καθώς οι αντίστοιχες μεταβλητές είναι παρούσες σε όλα τα μοντέλα. Πίνακας III.45. Μεταβλητές PLS AGP IΙ Μοντέλο 1 Μοντέλο 2 Μοντέλο 3 Μοντέλο 4 Α - - - - - PSA - - - - npsa + + + logpadme + + + + + ncircuits + + + SHBint2 - - - - - Samide - - - - - BasicIonGr + SHother + + SssCH2 Xvch6 + Σύγκριση μοντέλων PLS AGP I και PLS AGP IΙ Όσον αφορά στην ομάδα εργασίας, τα δύο μοντέλα διαφέρουν σε δύο ενώσεις: η ένωση Καπτοπρίλη περιλαμβάνεται στο πρώτο αλλά όχι στο δεύτερο, ενώ το αντίστροφο συμβαίνει με την ένωση Βαλσαρτάνη. Το μοντέλο PLS AGP IΙ υπερέχει ως προς τα στατιστικά στοιχεία ωστόσο κατά ποσοστό μικρότερο από 6%. Η βασική διαφορά μεταξύ των δύο μοντέλων προκύπτει μέσω της διαδικασίας αξιολόγησης, καθώς στη δεύτερη περίπτωση (PLS AGP IΙ), τα μοντέλα τα οποία προκύπτουν διαφέρουν λιγότερο από το αρχικό, τόσο σε επίπεδο περιεχόμενων περιγραφικών όσο και στη στατιστική απόδοση. Επιπροσθέτως, η προβλεπτική τους ικανότητα είναι σαφώς ανώτερη και δεν προκύπτουν έκροπες τιμές στις ομάδες ελέγχου. 174
Στο Σχήμα III.17 απεικονίζονται οι περιεχόμενες στα δύο μοντέλα περιγραφικές μεταβλητές κατά μειούμενη σειρά τιμής VIP, ώστε να διευκολύνεται η επισήμανση διαφορών και ομοιοτήτων. Παρατηρείται ότι η επίδραση παραμέτρων όγκου (npsa, MR) είναι εντονότερη στο μοντέλο PLS AGP I, ενώ, από την άλλη πλευρά, μεταβλητές οι οποίες σχετίζονται με συμμετοχή σε δεσμούς υδρογόνου και πολικότητα (Α, PSA, SHBint2) εμφανίζονται σημαντικότερες στο μοντέλο PLS AGP IΙ. Ο συντελεστής μερισμού περιέχεται και στα δύο μοντέλα, ωστόσο υπολογισμένος με διαφορετικά λογισμικά. Σχήμα III.17. Σύγκριση των ιστογραμμάτων VIP μεταξύ των μοντέλων PLS AGP I και PLS AGP IΙ. Σύγκριση ανάμεσα στη συγκράτηση στη στήλη HSA και στη στήλη AGP. Συγκρίνοντας τα μοντέλα PLS HSA I και PLS AGP I (Σχήμα III.18) παρατηρείται, αρχικά, η σημαντικότερη επίδραση της λιποφιλίας στη συγκράτηση από τη στήλη HSA, όπως έχει ήδη διαπιστωθεί και στα MLR μοντέλα. Οι αλληλεπιδράσεις με τη στήλη AGP φαίνεται να επηρεάζονται σε μεγαλύτερο βαθμό από την πολικότητα και τη 175
συμμετοχή σε δεσμούς υδρογόνου (A, PSA και SHBint2) σε σχέση με την HSA (HD). Ιδιαίτερα όσον αφορά την παράμετρο Α, ο σημαντικότερος ρόλος της στην AGP χρωματογραφία έχει ήδη γίνει εμφανής από την ανάλυση MLR. Διαπιστώνεται, ακόμη, η μεγαλύτερη επίδραση παραμέτρων όγκου (MR, npsa) στη συγκράτηση από τη στήλη AGP, ενώ η σημασία των ηλεκτροστατικών αλληλεπιδράσεων είναι εμφανέστερη στο μοντέλο PLS HSA I (F - ). Παρατηρείται, τέλος, η ύπαρξη περισσότερων ηλεκτροτοπολογικών δεικτών και δεικτών συνδετικότητας στο μοντέλο PLS HSA I, εκ των οποίων ο δείκτης χvch6 είναι κοινός και στα δύο μοντέλα. Σχήμα III.18. Ιστογράμματα VIP για τα μοντέλα PLS HSA I και PLS AGP I. IV. Ανάλυση Κυρίων Συνιστωσών για το σύνολο των χρωματογραφικών δεδομένων 176
Τα δεδομένα συγκράτησης τα οποία ελήφθησαν από τις τρεις χρωματογραφικές στήλες, καθώς και οι υπολογιστικές τιμές των παραμέτρων λιποφιλίας αποτέλεσαν τον πίνακα Χ για την εξαγωγή ενός μοντέλου PCA με σκοπό την ανίχνευση πιθανών συσχετίσεων. Για την εξαγωγή του μοντέλου χρησιμοποιήθηκαν μόνο οι ενώσεις οι οποίες είχαν πειραματικά και στις τρεις στήλες (36 ενώσεις). Το μοντέλο το οποίο προέκυψε έδειξε πολύ καλά στατιστικά στοιχεία (Α=4, R 2 =0.937, Q 2 = 0.803). Στο Σχήμα III.19 απεικονίζεται το διάγραμμα διασποράς των φορτίων των μεταβλητών. Με μαύρο κύκλο επισημαίνονται οι τιμές logk w οι οποίες προκύπτουν από τη στήλη ΙΑΜ σε δύο διαφορετικές τιμές ph (7.4 και 5.0), οι οποίες διαφοροποιούνται πιθανώς λόγω των διαφορετικών χρωματογραφικών συνθηκών (ph της κινητής φάσης). Σε κυανή έλλειψη περιλαμβάνονται τα δεδομένα από τη στήλη HSA, τα οποία και τοποθετούνται κοντά μεταξύ τους. Όσον αφορά στα δεδομένα της στήλης AGP, οι τιμές logk w τοποθετούνται κοντά μεταξύ τους (πράσινη έλλειψη). Οι ισοκρατικές τιμές logk παρουσία ακετονιτριλίου φαίνεται να τοποθετούνται παράλληλα στις αντίστοιχες τιμές παρουσία 2- προπανόλης (κίτρινο και μωβ περίγραμμα, αντίστοιχα). Σχήμα III.19. Διάγραμμα φορτίων για τα χρωματογραφικά δεδομένα. 177