ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ ΕΥΡΩΠΑΪΚΟ Υπουργείο Παιδείας και Θρησκευμάτων, Πολιτισμού και Αθλητισμού Ε. Π. Ανταγωνιστικότητα και Επιχειρηματικότητα (ΕΠΑΝ ΙΙ), ΠΕΠ Μακεδονίας Θράκης, ΠΕΠ Κρήτης και Νήσων Αιγαίου, ΠΕΠ Θεσσαλίας Στερεάς Ελλάδας Ηπείρου, ΠΕΠ Αττικής ΗΛΕΚΤΡΟΝΙΚΟΣ ΒΟΗΘΟΣ ΜΟΡΙΑΚΗΣ ΔΙΑΓΝΩΣΤΙΚΗΣ ELECTRONIC MOLECULAR DIAGNOSTICS ASSISTANT ΠΑΡΑΔΟΤΕΟ Π4.4 Εγκατάσταση και Λειτουργία των Πληροφοριακών Υπηρεσιών του emodia: Λειτουργική Αξιολόγηση Πληροφοριακών Ενοτήτων, Συστημάτων και Εργαλείων Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: ΙΤΕ-ΕΒΠ (3) Ημερομηνία: 30/06/2015 Ιστορικό Εγγράφου Έκδοση Ημερομηνία Κατάσταση 0.1 30/05/2015 Προσχέδιο 1.0 20/06/2015 1 η Έκδοση Τελική 30/06/2015 Τελικό Προετοιμασία Ονομ./Επώνυμο, (#Φορέα) Γ. Ποταμιάς (3), Α. Καντεράκης (3), Ε. Καρτσάκη (3), Γ. Ποταμιάς (3), Α. Καντεράκης (3), Ε. Καρτσάκη (3), K. Λακιωτάκη (3) Γ. Ποταμιάς (3), Α. Καντεράκης (3) Ε. Καρτσάκη (3), K. Λακιωτάκη (3), Γ. Πατρινός, (1) * Κ: Κοινοπραξία έργου, EE: ΕΥΔΕ-ΕΤΑΚ, Δ: Δημόσιο έγγραφο (ελεύθερο, π.χ., Web-Site έργου) Διανομή* K K EE
ΠΕΡΙΛΗΨΗ Το παρόν παραδοτέο (Π4.4) παρουσιάζει τα βασικά αποτελέσματα της δουλειάς στα πλαίσια του έργου emodia σε σχέση με τον ηλεκτρονικό βοηθό Φαρμακογονιδιωματικής / electronic Pharmacogenomics Assistant (epga), και των σχετικών πληροφοριακών υποσυστημάτων τα οποία αναπτύχθηκαν. Ιδιαίτερα, το παραδοτέο περιγράφει: (α) την εκμετάλλευση διεθνώς καθιερωμένων πηγών φαρμακογονιδιωματικής γνώσης και των σχετικών φαρμακογονιδιωματικών συσχετίσεων (όπως η PharmGKB); (β) τη σχεδίαση και το αντίστοιχο σχήμα οργάνωσης των σχετικών δεδομένων και τη βάση-δεδομένων που αναπτύχθηκαν; (γ) το υποσύστημα (web-application) διερεύνησης (explore) και περιήγησης (browsing) σε καθιερωμένες (και κλινικά χρήσιμες) συσχετίσεις μεταξύ παραλλαγώνγονιδίων--φαρμάκων--μεταβολικών-φαινοτύπων και των αντίστοιχων οδηγιώνδοσολογίας (dosing guidelines) και κλινικών-επισημειώσεων (clinical annotations); και τέλος (δ) το υποσύστημα (web-application) μετάφρασης (translation) φαρμακογονιδιωματικών συσχετίσεων και της εκχώρησης μεταβολικών-φαινοτύπων σε γονοτυπημένα δείγματα ατόμων/ασθενών. Το υποσύστημα μετάφρασης συνδέεται λειτουργικά με το υποσύστημα explore. Η λειτουργική αξιολόγηση των αναπτυγμένων (και εγκαταστημένων σαν διαδικτυακέςεφαρμογές) συστημάτων γίνεται με την αναλυτική παρουσίαση των σχετικών διαμέσων-επαφής συστήματος-χρηστών. Τα αποτελέσματα των εργασιών τα οποία παρουσιάζονται στο παρόν παραδοτέο έχουν δημοσιευθεί και παρουσιαστεί σε διάφορα επιστημονικά περιοδικά και διεθνείς επιστημονικές συναντήσεις (Potamias, 2014a, 2014b, 2014c, 2014d ; Potamias et al., 2014 ; Lakiotaki et al., 2014a, 2014b, 2014c, 2014d, 2014e ; Lakiotaki et al., 2015a; 2015b) βλ. κεφάλαιο ΑΝΑΦΟΡΕΣ EXECUTIVE SUMMARY This deliverable (Π4.4) presents the main results of the work within the emodia project with respect to the electronic assistant pharmacogenomics / electronic Phramacogenomics Assistant (epga), and related information sub-systems that were developed. In particular, the deliverable prsents: (a) the exploitation of internationally established pharmacogenomics knowledge sources and related pharmacogenomic associations (such as PharmGKB); (b) the design and the corresponding data-schema and data-base that was developed; (c) the sub-system (web-application) for exploring (explore) and navigating (browsing) within established (and clinically useful) pharmacogenomic associations between gene variants--drugs--metabolic phenotypes and their corresponding dosing-guidelines and clinical-annotations; and finally (d) the translation sub-system (web-application) that offer the assignment of metabolic phenotypes in genotyped samples of individuals/patients. The translation sub-stem is functionally connected/interfaced with the explore sub-system. The functional evaluation of the developed (and installed as web-applications) systems is performed with the detailed presentation of the respective user-system interfaces. The work presented in this deliverable have been published and presented at various scientific journals and international scientific meetings (Potamias, 2014a, 2014b, 2014c, 2014d ; Potamias et al., 2014 ; Lakiotaki et al., 2014a, 2014b, 2014c, 2014d, 2014e ; Lakiotaki et al., 2015a; 2015b) see chapter "ΑΝΑΦΟΡΕΣ" 1 /12 Παραδοτέο Π4.4
ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ 1. ΕΙΣΑΓΩΓΗ... 3 2. ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΕΣ ΣΥΣΧΕΤΙΣΕΙΣ... 3 3. ΠΡΟΣ ΕΝΑ ΟΛΟΚΛΗΡΩΜΕΝΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ ΠΑΡΟΧΗΣ ΒΟΗΘΕΙΑΣ ΓΙΑ ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΕΣ ΣΥΣΧΕΤΙΣΕΙΣ... 4 4. ΕΡΓΑΛΕΙΟ ΚΑΙ ΥΠΗΡΕΣΙΕΣ ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΗΣ ΜΕΤΑΦΡΑΣΗΣ... 6 4.1 Περιγραφή αλγορίθμου φαρμακογονιδιωματικής μετάφρασης... 6 4.2 Ανάπτυξη διαδικτυακής εφαρμογής υπηρεσιών PGx μετάφρασης... 8 ΑΝΑΦΟΡΕΣ... 11 2 /12 Παραδοτέο Π4.4
1. ΕΙΣΑΓΩΓΗ Φαρμακογονιδιωματική (pharmacogenomics PGx εν συντομία) είναι ο τομέας της βιολογικής και γενετικής που μελετάει την επίδραση που έχουν οι κληρονομικές μεταλλαγές του γονιδιώματος στην απορρόφηση, κατανομή, μεταβολισμό, απέκκριση και τοξικότητα στις διάφορες φαρμακευτικές ουσίες. Ο συνδυασμός των μεταλλαγών αυτών μπορεί να διαφέρει όχι μόνο μεταξύ φυλετικών ομάδων αλλά και μεταξύ ατόμων του ίδιου κληρονομικού προφίλ. Για τον λόγο αυτό η φαρμακογονιδιωματική είναι ένας σημαντικός τομέας της ιατρικής γενετικής αφού καλείται να παρέχει εξατομικευμένες πρωτόκολλα εφαρμογής θεραπειών σε ασθένειες όπου η καταπολέμησή τους εξαρτάται άμεσα με την βέλτιστη χρήση μιας φαρμακευτικής ουσίας. Η υπάρχουσα βιβλιογραφία περιέχει ένα τεράστιο πλήθος από τέτοιες εξαρτήσεις σε σημείο όπου η υποστήριξη αυτής της γνώσης να χρειάζεται ένα εξελιγμένο πληροφοριακό βοήθημα. Η φαρμακογονιδιωματική λοιπόν είναι ένα αναπόσπαστο κομμάτι και της Βιοπληροφορικής. Στα πλαίσια της ανάπτυξης ενός φαρμακογονιδιωματικού πληροφοριακού συστήματος (στα πλαίσια του electronic PharmacoGenomics Assistant epga) συλλέξαμε δεδομένα από διάφορες διεθνώς αναγνωρισμένες σχετικές βάσεις δεδομένων. Μία από αυτές είναι η PharmGKB η οποία περιέχει οδηγίες δοσολογίας για μια ποικιλία από φάρμακα ανάλογα με το γονιδιωματικό προφίλ ενός ατόμου/ασθενή. Η πληροφορία αυτή προέρχεται από ευρέως γνωστές δημοσιεύσεις και έχει εξαχθεί χειροκίνητα από ανθρώπινο προσωπικό, ενώ η εγκυρότητα των πληροφοριών ελέγχεται καθημερινά και ανανεώνεται τακτικά. Οι πληροφορίες που περιέχει ανήκει σε δύο βασικές κατηγορίες: Οι οδηγίες δοσολογιών (dosage guidelines), οι οποίες περιέχουν τις πιο τεκμηριωμένες φαρμακογονιδιωματικές γνώσεις οι οποίες υποστηρίζονται από διεθνείς οργανισμούς υγείας όπως η FDA. Οι οδηγίες αυτές είναι και οι πιο ασφαλείς στην εφαρμογή τους άμεσα από το εμπλεκόμενο κλινικό προσωπικό παροχής υγείας. Οι κλινικές επισημειώσεις (clinical annotations), οι οποίες περιέχουν φαρμακογονιδιωματικές πληροφορίες οι οποίες είτε είναι υπό έρευνα, είτε δεν υπάρχουν ακόμα στοιχεία για την άμεση κλινική εφαρμογή τους. Αποτελούν παρόλα αυτά χρήσιμη πληροφορία για την έρευνα και την παροχή ενδείξεων για πιθανές συνέπειες του γονιδιωματικού προφίλ ενός ατόμου/ασθενή στην επίδραση μια φαρμακευτικής ουσίας, και στο στα σχετικά προφίλ φαρμακευτικής απόκρισης. 2. ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΕΣ ΣΥΣΧΕΤΙΣΕΙΣ Μία φαρμακογονιδιωματική συσχέτιση αποτελείται από τρία μέρη: (1) τη φαρμακευτική ουσία, (2) το (γενετικό) διπλότυπο και (3) τις οδηγίες δοσολογίας ή σχετικές κλινικές επισημειώσεις. Η φαρμακευτική ουσία είναι κάποιος φαρμακευτικός παράγοντας ο οποίος θεωρείται πολύ σημαντικός στην αντιμετώπιση μιας ασθένειας (π.χ: η αντιπηκτική ουσία βαρφαρίνη η οποία χρησιμοποιείται σε ένα μεγάλο εύρος ασθενειών). Ο διπλότυπος είναι ένα ζευγάρι από απλότυπους. Ο απλότυπους είναι ένα σύνολο από κοινές ή μη-κοινές γονιδιωματικές παραλλαγές. Συνήθως χρησιμοποιείται ο συμβολισμός άστρου για την ονοματολογία ενός απλότυπου για ένα γονίδιο. Ο απλότυπος *1 θεωρείται ότι είναι ο κοινός ή φυσιολογικός ή ο απλότυπος-αναφοράς ή ο απλότυπος που η πλειοψηφία ενός πληθυσμού έχει και για αυτό πρέπει να εφαρμόζονται οι συνήθεις οδηγίες δοσολογίας για ένα φάρμακο. Στη συνέχεια οι απλότυποι *2, *3, περιέχουν μία ή παραπάνω μη-κοινές παραλλαγές. Για παράδειγμα ο απλότυπος *2 στο γονίδιο ABCB1 περιέχει τρεις μη-κοινές παραλλαγές. Η ονοματοδοσία συνήθως γίνεται από τους συγγραφείς της επιστημονικής αναφοράς 3 /12 Παραδοτέο Π4.4
που ανακάλυψε την συσχέτιση, ενώ για κάποια σημαντικά γονίδια όπως αυτά της οικογένειας CYP υπάρχει οργανισμός που αναλαμβάνει την ονοματοδοσία τους (CPIC: Clinical Pharmacogenetics Implementation Consortium). Τέλος υπάρχουν οδηγίες δοσολογίας οι οποίες δεν εμπεριέχουν κάποιον συγκεκριμένο απλότυπο, αλλά αναφέρονται απλά σε ένα γονίδιο. 3. ΠΡΟΣ ΕΝΑ ΟΛΟΚΛΗΡΩΜΕΝΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ ΠΑΡΟΧΗΣ ΒΟΗΘΕΙΑΣ ΓΙΑ ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΕΣ ΣΥΣΧΕΤΙΣΕΙΣ Με βάση τη παραπάνω οργάνωση της φαρμακογονιδιωματικής γνώσης εξάγαμε τη διαθέσιμη πληροφορία από ελεύθερες και ανοικτές σχετικές βάσεις δεδομένων όπως η PharmGKB. Η βάση δεδομένων που αναπτύξαμε ακολουθεί το παρακάτω σχήμα (Σχήμα 1): Σχήμα 1: Το σχήμα οργάνωσης φαρμακογονιδιωματικών πληροφοριών και γνώσεων (οδηγίες δοσολογίας, κλινικές επισημειώσεις) Το επίπεδο τεκμηρίωσης είναι από 1a, 1b, 2a, 2b, 3 έως 4 και δείχνει την αξιοπιστία μίας συσχέτισης. Μόνο οι συσχετίσεις με επίπεδο τεκμηρίωσης 1a είναι αρκετά αξιόπιστες ώστε να χαρακτηριστούν οδηγίες δοσολογίας. Τα δεδομένα εισήχθησαν σε μία βάση δεδομένων SQLite. Στη συνέχεια αναπτύξαμε μία διαδικτυακή εφαρμογή για την εύκολη και γρήγορη διερεύνηση (explore) καθώς και τη περιήγηση (browsing) στις σχετικές πληροφορίες. Για τον σκοπό αυτό χρησιμοποιήσαμε το περιβάλλον ανάπτυξης διαδικτυακών εφαρμογών Django, το οποίο είναι ένα περιβάλλον ανάπτυξης διαδικτυακών-εφαρμογών ανοικτού κώδικα και βασίζεται στη γλώσσα προγραμματισμού Python. Το περιβάλλον περιήγησης έχει τη παρακάτω μορφή εισαγωγής ερωτημάτων από το χρήστη (Σχήμα 2): Σχήμα 2: Εισαγωγή ερωτημάτων για τη περιήγηση σε φαρμακογονιδιωματικές συσχετίσεις με βάση: γονίδια, φάρμακα, μεταβολικές καταστάσεις και αλληλόμορφα/διπλότυπους. 4 /12 Παραδοτέο Π4.4
Το περιβάλλον explore που αναπτύξαμε, επιτρέπει τη μαζική και γρήγορη αναζήτηση φαρμακογονοδιωματικών συσχετίσεων για συγκεκριμένα γονίδια / ουσίες / και διπλότυπους. Τα αποτελέσματα της αναζήτησης από τον χρήστη εμφανίζονται σε δενδροειδή μορφή όπου ο χρήστης μπορεί επιπλέον να επικεντρωθεί σε συγκεκριμένες οδηγίες (Σχήμα 3): Σχήμα 3: Δενδροειδής οργάνωση των αποτελεσμάτων αναζήτησης φαρμακογονιδιωματικών συσχετίσεων και των σχετικών οδηγιών δοσολογίας/κλινικών επισημειώσεων. Άλλες υπηρεσίες που προσφέρει η διαδικτυακή εφαρμογή είναι: o RESTful API το οποίο επιτρέπει την εκτέλεση επερωτήσεων από άλλες διαδικτυακές υπηρεσίες. o Εκτύπωση των οδηγιών. o Μεταφόρτωση πολύπλοκων επερωτήσεων σε αρχείο. Το περιβάλλον είναι αρκετά «ελαφρύ» και μπορεί εύκολα να ενσωματωθεί σε πιο πολύπλοκα συστήματα Βιοπληροφορικής. Επιτρέπει επίσης την επικαιροποίηση των δεδομένων σε περίπτωση που τα πρωτογενή δεδομένα από τις ανοικτές βάσεις αλλάξουν. Τέλος το σύστημα παρέχει ολοκλήρωση με την υπηρεσία φαρμακογονιδιωματικής μετάφρασης (βλ. επόμενο κεφάλαιο) όπου όλα τα σημαντικά γονιδιωματικά προφίλ που εντοπίζονται για έναν χρήστη από την αντίστοιχη υπηρεσία και εργαλείο μετάφρασης συνδέονται με την υπηρεσία explore που περιγράφεται εδώ. Έτσι ο χρήστης μπορεί να λάβει μία πλήρη εικόνα όλων των διαθέσιμων οδηγιών δοσολογίας και κλινικών επισημειώσεων για το γονιδιωματικό/γονοτυπικό προφίλ ατόμων/ασθενών. 5 /12 Παραδοτέο Π4.4
4. ΕΡΓΑΛΕΙΟ ΚΑΙ ΥΠΗΡΕΣΙΕΣ ΦΑΡΜΑΚΟΓΟΝΙΔΙΩΜΑΤΙΚΗΣ ΜΕΤΑΦΡΑΣΗΣ Ένα από τα πιο σημαντικά στοιχεία του φαρμακογονιδιωματικού βοηθού epga είναι το εξατομικευμένο PGx εργαλείο μετάφρασης, το οποίο συνάγει μεταβολικούς φαινότυπους από ατομικά γονοτυπικά προφίλ. Η εξατομικευμένη μετάφραση έχει ως στόχο να εξυπηρετήσει: (i) την αυτόματη ανάλυση των γονοτυπικών προφίλ των ασθενών με έγκυρες παραλλαγές γονιδίων/αλληλόμορφα που ανακαλύφθηκαν πρόσφατα ή όχι με βάση τη προσαρμογή μιας λεπτομερούς διαδικασίας αντιστοίχησης αλληλομόρφων; (ii) την επαγωγή των αντίστοιχων φαινοτύπων, και (iii) την αναφορά σχετικών και ενημερωμένων κλινικών σχολίων και (φαρμακευτικών) συστάσεων δοσολογίας φαρμάκων. 4.1 Περιγραφή αλγορίθμου φαρμακογονιδιωματικής μετάφρασης Η διαδικασία της μετάφρασης του συστήματος emodia epga στηρίζεται σε δύο τύπους PGx μεταφραστικών πινάκων: i) τους πίνακες απλοτύπων που ορίζουν (γνωστούς) PGx απλότυπους σε σχέση με παραλλαγές γονιδίων, και ii) τους πίνακες φαινοτύπων που συνδέουν τους διπλότυπους με τα προφίλ μεταβολισμού. Όσον αφορά τους πρώτους, η μετάφραση βασίζεται στην εναρμόνιση των πινάκων απλοτύπων της DMET και της PharmGKB. Επιπλέον, παρέχονται υπηρεσίες για την ενημέρωση αυτών των πινάκων ή την δημιουργία νέων (με βάση δημοσιευμένα και έγκυρα ευρήματα και γνώσεις από PGx έρευνες). Η PharmGKB παρέχει μια λίστα γονιδίων που διαθέτουν πίνακες απλοτύπων. Ένας απλότυπος αποτελείται από μια ή περισσότερες παραλλαγές ( π.χ. SNPs, indels, κλπ.) μέσα σε ένα γονίδιο. Αλληλόμορφα τύπου αστέρα χρησιμοποιούνται για να ορίσουν απλότυπους για τα περισσότερα φαρμακογονίδια, ιδίως εκείνων που περιλαμβάνονται στα κυτοχρώματα της οικογένειας CYP-P450 και ακολουθούν το πρότυπο ονοματολογίας αλληλομόρφων τύπου «άστρου». Το εργαλείο μετάφρασης του epga αυτή τη στιγμή περιλαμβάνει 69 γονίδια που εμπλέκονται σε 727 παραλλαγές αναφερόμαστε σε αυτές ως φαρμακοπαραλλαγές. Παρακάτω περιγράφεται η διαδικασία μετάφρασης λεπτομερώς με ένα απλό παράδειγμα χρησιμοποιώντας το φαρμακογονίδιο UGT1A5 (ένα ένζυμο UDPγλυκουρονοσυλοτρανσφεράσης). Ένας αλγόριθμος αντιστοίχησης αλληλομόρφων (Farmen et al., 2009) έχει επεκταθεί και προσαρμοστεί κατάλληλα και η όλη διαδικασία μετάφρασης εξελίσσεται σε τέσσερα βήματα. Σχήμα 4: Βήμα 1 του αλγορίθμου μετάφρασης : τροποποίηση των πινάκων απλοτύπων. Βήμα 1 - Τροποποίηση των πινάκων απλοτύπων. Ο πίνακας απλοτύπων για το γονίδιο UGT1A5 παρουσιάζεται στο σχήμα 4Α. Κάθε στήλη αναπαριστά ένα απλότυπο ( π.χ. *4 ) και κάθε γραμμή μια δομική παραλλαγή (μονονουκλεοτιδικοί πολυμορφισμοί (SNP) ή προσθήκες/διαγραφές βάσεων του DNA (IN/DEL) ). Σύμφωνα με την ορολογία 6 /12 Παραδοτέο Π4.4
της PharmGKB, η πρώτη στήλη θεωρείται ότι αντιπροσωπεύει τον απλότυπο αναφοράς ( *1 για το γονίδιο UGT1A5) και έτσι συμπεραίνουμε το επικρατές και υπολειπόμενο αλληλόμορφο των παραλλαγών. Τα σκιασμένα κελιά δείχνουν τα υπολειπόμενα αλληλόμορφα. Τροποποιούμε τους πίνακες απλοτύπων σύμφωνα με τα ακόλουθα υποστάδια: i. Διαγραφή των παραλλαγών (γραμμές) χωρίς rsid( η παραλλαγή 776G>C εδώ) περιοριζόμαστε σε καταχωρημένες παραλλαγές στη dbsnp. ii. Διαγραφή των απλοτύπων που περιλαμβάνουν ένα υπολειπόμενο αλληλόμορφο στις παραλλαγές που διαγράφηκαν στο προηγούμενο βήμα. Έτσι εξασφαλίζουμε ότι όλοι οι απλότυποι στους τροποποιημένους πίνακες εξακολουθούν να περιέχουν όλες τις παραλλαγές όπως έχει οριστεί από τη PharmGKB. iii. Διαγραφή όλων των διπλών απλοτύπων. Έπειτα από τα τρία πρώτα στάδια, ο πίνακας απλοτύπων για το γονίδιο UGT1A5 παρουσιάζεται στο σχήμα 4Β. iv. Μετατροπή του πίνακα στην αριθμητική μορφή του ως εξής : 0 για το επικρατές αλληλόμορφο και 1,3,5 για τα υπολειπόμενα αλληλόμορφα (έως 3 πιθανές τιμές για κάθε παραλλαγή), π.χ. <1,0,0,0> για τον απλότυπο *2 του παραδείγματος μας (Σχήμα 4C). v. Δημιουργία όλων των δυνατών συνδυασμών των απλοτύπων σχηματίζοντας τους γονιδιακούς διπλότυπους. Για το γονίδιο UGT1A5, σχηματίζονται έξι διπλότυποι : *1/*1, *1/*2, *1/*3, *2/*2, *2/*3 και *3/*3. Κάθε διπλότυπος σχηματίζεται αθροίζοντας τα αριθμητικά διανύσματα των αντίστοιχων απλοτύπων, π.χ. το άθροισμα των διανυσμάτων για τους απλότυπους *2 και *3, <1,0,0,0> και <0,1,0,0> αντίστοιχα, είναι <1,1,0,0> που αντιστοιχεί στο διπλότυπο *2/*3 (Σχήμα 4D). Σχημα 5: Βήμα 2 του αλγορίθμου μετάφρασης: Τροποποίηση των γονοτυπικών προφίλ. Βήμα 2 - Τροποποίηση των γονοτυπικών προφίλ. Για τη κατάλληλη αντιστοίχιση των γονοτυπικών προφίλ (Σχήμα 5Β) με τα αριθμητικά διανύσματα των διπλότυπων (βήμα 1), μετατρέπουμε τους γονότυπους στην αριθμητική τους μορφή. Γνωρίζοντας το επικρατές και υπολειπόμενο αλληλόμορφο για κάθε παραλλαγή, ακολουθούμε μια διαδικασία παρόμοια με το βήμα 1, όπου το 0 αντιστοιχεί στο επικρατές και το 1,3,5 στο υπολειπόμενο αλληλόμορφο. Για το δείγμα γονοτυπικού προφίλ του παραδείγματος μας ο γονότυπος C/G για την παραλλαγή rs12475068 αναπαρίσταται με 0/1 (Σχήμα 5C), 0 για το επικρατές C και 1 για το υπολειπόμενο G. Τελικά, προσθέτουμε τα προαναφερθέντα νούμερα ώστε να σχηματίσουμε το αριθμητικό διάνυσμα του διπλοτύπου. Στο παράδειγμα μας, το τελικό διάνυσμα διπλοτύπου για το δείγμα μας είναι <1,1,0,0> (Σχήμα 5D), όπως προκύπτει από το άθροισμα των αντίστοιχων αριθμητικών μορφών των παραλλαγών : 0+1, 1+0, 0+0 και 0+0. 7 /12 Παραδοτέο Π4.4
Βήμα 3 Αντιστοίχιση των γονοτυπικών προφίλ με γονιδιακούς διπλότυπους. Η διαδικασία μετάφρασης διατρέχει όλα τα διανύσματα διπλοτύπων των γονιδίων (Σχήμα 4D) και προσπαθεί να τα αντιστοιχίσει με το διάνυσμα διπλοτύπου του δείγματος. Όταν βρεθεί ένας διπλότυπος που ταιριάζει, τότε αποδίδεται στο δείγμα αυτός ο διπλότυπος για το συγκεκριμένο γονίδιο. Στο παράδειγμα μας, το δείγμα αντιστοιχεί στο διπλότυπο *2/*3 για το γονίδιο UGT1A5( Σχήμα 4D και 5D). Βήμα 4 Επαγωγή φαινοτύπων από τους διπλότυπους. Στο τελευταίο βήμα της διαδικασίας της μετάφρασης, συνάγουμε ένα μεταβολικό προφίλ-φαινότυπο για κάθε δείγμα ακολουθώντας τις παρακάτω παραδοχές: (α) Υπάρχουν τέσσερα είδη μεταβολισμού φαρμάκων: ελάχιστος μεταβολισμός: υπάρχουν δύο μη λειτουργικά αλληλόμορφα και συνεπώς έχουμε χαμηλή έως και καθόλου ενζυμική δραστηριότητα μειωμένος μεταβολισμός: υπάρχει ένα μη-λειτουργικό και ένα λειτουργικό αλληλόμορφο και συνεπώς έχουμε μειωμένη ενζυμική δραστηριότητα φυσιολογικός μεταβολισμός: υπάρχουν δύο αλληλόμορφα που λειτουργούν φυσιολογικά και συνεπώς έχουμε κανονική ενζυμική δραστηριότητα και γρήγορος μεταβολισμός: υπάρχουν ένα ή περισσότερα αλληλόμορφα που δημιουργούν αυξημένη ενζυμική δραστηριότητα σε σύγκριση με το φυσιολογικό μεταβολισμό. Βέβαια, η επίδραση κάθε τύπου μεταβολισμού στην ανταπόκριση του φαρμάκου εξαρτάται από το ρόλο των αντίστοιχων ενζύμων στο μεταβολισμό του φαρμάκου. Για ένα φάρμακο που αδρανοποιείται από ένα συγκεκριμένο ένζυμο, ένα άτομο με γρήγορο μεταβολισμό μπορεί να χρειαστεί μεγαλύτερη δόση ώστε να επιτευχθεί ο επιθυμητός θεραπευτικός στόχος και για ένα φάρμακο που ενεργοποιείται από ένα συγκεκριμένο ένζυμο, ένας γρήγορος μεταβολισμός μπορεί να σχετίζεται με την αυξημένη έκθεση στο φάρμακο και συνεπώς με αυξημένο κίνδυνο ανεπιθύμητων ενεργειών του φαρμάκου. Με βάση τα παραπάνω, ορίζουμε τρεις διαφορετικές φαρμακογονιδιωματικές καταστάσεις φαινοτύπου που μπορούν να αποδοθούν σε οποιοδήποτε διπλότυπο: Reference/Reference (R/R): αναφέρεται στο συνδυασμό δύο απλοτύπων αναφοράς και αντιστοιχεί σε ένα φυσιολογικό μεταβολικό προφίλ Reference/Variant (R/V): αναφέρεται στο συνδυασμό ενός απλότυπου αναφοράς και ενός πολυμορφικού απλότυπου και αντιστοιχεί σε ένα ενδιάμεσο μεταβολικό προφίλ. Variant/Variant (V/V): αναφέρεται στο συνδυασμό δύο πολυμορφικών απλοτύπων που μπορεί να οδηγήσουν είτε σε ένα χαμηλό ή γρήγορο μεταβολικό προφίλ ένα μη-φυσιολογικό μεταβολικό προφίλ. Στο παράδειγμά μας, το δείγμα γονοτύπου αντιστοιχεί σε ένα διπλότυπο *2/*3 και ο διπλότυπος αυτός, σύμφωνα με τη παραπάνω παραδοχή αντιστοιχεί σε ένα μηφυσιολογικό μεταβολικό προφίλ (V/V). 4.2 Ανάπτυξη διαδικτυακής εφαρμογής υπηρεσιών PGx μετάφρασης Ο αλγόριθμος της μετάφρασης έχει υλοποιηθεί στη γλώσσα ανοιχτού κώδικα R και χρησιμοποιεί το πλαίσιο δημιουργίας διαδικτυακών εφαρμογών RStudio/Shiny για τη δημιουργία και ανάπτυξη της διαδικτυακής διεπαφής χρήστη. Στη συνέχεια, περιγράφεται η λειτουργία της διαδικτυακής διεπαφής του συστήματος PGx μετάφρασης (Σχήμα 6). Το σύστημα δέχεται ως είσοδο ένα όνομα χρήστη, το οποίο είναι απαραίτητο για τη διαδικασία της μετάφρασης και είναι μοναδικό για κάθε χρήστη. Έπειτα, δίνεται η δυνατότητα φόρτωσης δύο αρχείων : α) ένα αρχείο με τα γονοτυπικά προφίλ των δειγμάτων, το οποίο είναι απαραίτητο για τη μετάφραση β) ένα αρχείο με λειτουργικές παραλλαγές (SNP), με βάση το οποίο μπορεί να γίνει προσαρμοσμένη μετάφραση. Το αρχείο αυτό είναι προαιρετικό και χρησιμοποιείται μόνο στην προσαρμοσμένη μετάφραση. 8 /12 Παραδοτέο Π4.4
Σχήμα 6. Διαδικτυακή διεπαφή χρήστη και εφαρμογής PGx μετάφρασης Αφού δώσουμε ένα όνομα χρήστη και φορτώσουμε ένα αρχείο γονοτυπικών προφίλ, πατάμε το κουμπί Go! και έτσι εκτελείται ο αλγόριθμος της PGx μετάφρασης. Η εφαρμογή εμφανίζει τα αποτελέσματα σε 4 καρτέλες. Η πρώτη, epga Translation, δείχνει ένα πίνακα, όπως φαίνεται στο σχήμα 7, όπου έχουμε πέντε στήλες ως εξής: o o o o o ένα κωδικό για κάθε δείγμα που υπάρχει στο αρχείο που φορτώσαμε. ένα όνομα για κάθε γονίδιο από τα 69 διαθέσιμα στο εργαλείο μας. ένα διπλότυπο για κάθε γονίδιο που προέκυψε από την μετάφραση. Σε περίπτωση μη αντιστοίχισης δεν εμφανίζεται το αντίστοιχο γονίδιο. ένα φαινότυπο που αντιστοιχεί στον εκάστοτε διπλότυπο, σύμφωνα με τη διαδικασία που εξηγήσαμε παραπάνω. συστάσεις για τη τριπλέτα γονίδιο-διπλότυπος-φαινότυπος, σε μορφή συνδέσμου που παραπέμπει στο εργαλείο explore του epga. Σχήμα 7. Αποτέλεσμα epga μετάφρασης 9 /12 Παραδοτέο Π4.4
Οι καρτέλες Gene Summary και Sample Summary, εμφανίζουν συγκεντρωτικά ποσοστά της κατανομής των φαινοτύπων ανά γονίδιο, σχήμα 8Α και ανά δείγμα σχήμα 8Β. (Α) (Β) Σχήμα 8. Σύνοψη κατανομής φαινοτύπων ανά γονίδιο και ανά δείγμα Τέλος, η καρτέλα Genotypes εμφανίζει τα γονοτυπικά προφίλ των δειγμάτων από το αρχείο που φορτώθηκε, όπως φαίνεται στο σχήμα 9. Επίσης, η εφαρμογή δίνει τη δυνατότητα προσαρμοσμένης μετάφρασης σύμφωνα με ένα αρχείο με λειτουργικές παραλλαγές που ορίζει ο χρήστης (σχήμα 10). Συγκεκριμένα, ο χρήστης φορτώνει ένα αρχείο με τα rsid των παραλλαγών που τον ενδιαφέρει και έπειτα ο αλγόριθμος χρησιμοποιεί αυτούς τους δείκτες για να αντιστοιχίσει διπλότυπους στα γονίδια τα οποία περιλαμβάνουν τους συγκεκριμένους δείκτες. Όπως φαίνεται παρακάτω, προκύπτει ένας πίνακας παρόμοιος με τη ολοκληρωμένη μετάφραση όπου έχουμε ανά δείγμα το διπλότυπο, το φαινότυπο και τις συστάσεις που αντιστοιχούν στα διαθέσιμα γονίδια. Σχήμα 9. Γονοτυπικά προφίλ των δειγμάτων 10 /12 Παραδοτέο Π4.4
Σχήμα 10. Προσαρμοσμένη Μετάφραση ΑΝΑΦΟΡΕΣ [1] Potamias G. (2014b). Translating -omics: the pharmacogenomics dimension. ehealth Forum 2014, In From Research to Effective Impact on Health parallel session, Athens, Greece, May 12, 2014. [2] Potamias G., Lakiotaki K., Katsila T., Lee MT., Topouzis S., Cooper DN., and Patrinos GP. (2014). Deciphering next-generation pharmacogenomics: an information technology perspective. Open Biology 4(7): 66-77. Pubmed/PMID: 25030607 [3] Lakiotaki K., Patrinos GP., Potamias G. (2014a). Information technology meets pharmacogenomics: Design specifications of an integrated personalized pharmacogenomics information system. International Conference on Biomedical and Health Informatics (IEEE EMBS), Valencia, Spain, June 1-4, 2014. [4] Lakiotaki, K., Kartsaki, E., Kanterakis, A., Patrinos, GP., Potamias, G. (2014b). Pharmacogenomics Profiles from 1,092 Human Genomes. Wellcome Trust conference "1000 Genomes Project and Beyond", Churchill College, Cambridge, June 24-26, 2014. [5] Potamias G. (2014c). Towards electronic pharmacogenomic assistance and translation services. 2nd Pharmaceutical Sciences conference, Patras, Greece, October 9-11, 2014. [6] Potamias G. (2014a). Boosting pharmacogenomics: A translational bioinformatics perspective. In 2014 Golden Helix Summer School, Aegina Island, Greece, September 11-15, 2014. [7] Potamias G. (2014d). Towards an electronic PharmacoGenomics Assistant (epga). 2014 Golden Helix Summer School, Aegina Island, Greece, September 11-15, 2014. [8] Lakiotaki, K., et al. (2014c). Towards a Pharmacogenomics Information System for Personalized Medicine. 2014 Golden Helix Summer School, Aegina Island, Greece, September 11-15, 2014. 11 /12 Παραδοτέο Π4.4
[9] Lakiotaki, K., et al. (2014d). A pharmacogenomics dashboard of 1000 genomes project populations. 2014 Golden Helix Summer School, Aegina Island, Greece, September 11-15, 2014. [10] Lakiotaki K., Kartsaki E., Kanterakis A., Katsila T., Patrinos G., Potamias G. Translating Pharmacogenomics for Personalised Medicine. (2015a). (Abstract, Poster) PAGE meeting (Poppulation Approach Group in Europe), Hersonnisos, Crete Island, Greece, 2-5 June, 2015. [11] Lakiotaki K., Kartsaki E., Kanterakis A., Katsila T., Patrinos G., Potamias G. (2015b). PGA: an integrated electronic Pharmacogenomics Assistant for Personalized Medicine. (Abstract, Poster PS15.29) ESHG 2015 (The European Human Genetics Conference), Glasgow, UK, June 6-9, 2015. 12 /12 Παραδοτέο Π4.4