Υπουργείο Παιδείας και Θρησκευµάτων, Πολιτισµού και Αθλητισµού

Σχετικά έγγραφα
ΠΑΡΑΔΟΤΕΟ Π3.4. Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: ΠΔΕ (2) Ημερομηνία: 11/05/2015. Ιστορικό Εγγράφου

ΠΑΡΑΔΟΤΕΟ Π1.2. Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: DYNACOMP A.E. (4) Ημερομηνία: 10/02/2014. Ιστορικό Εγγράφου

ΠΑΡΑΔΟΤΕΟ Π1.1. Προετοιμασία Διανομή* - Ονομ./Επώνυμο, (#Φορέα) - Γ. Ποταμιάς, (3) /05/2013 Προσχέδιο Γ. Πατρινός, (1)

Υπουργείο Παιδείας και Θρησκευμάτων, Πολιτισμού και Αθλητισμού

ΠΑΡΑΔΟΤΕΟ Π2.2. adme. Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: ΙΤΕ- ΕΒΠ (3) Ημερομηνία: 11/01/2014. Ιστορικό Εγγράφου

Μαριάνθη Γεωργίτση Επίκουρη Καθηγήτρια Ιατρικής Βιολογίας-Γενετικής

ΠΑΡΑΔΟΤΕΟ Π5.3. Ζητήματα Πνευματικής Ιδιοκτησίας και Προσανατολισμού στην Αγορά - Αρχικό Σχέδιο Εκμετάλλευσης Αποτελεσμάτων

Φαρμακογονιδιωματική και κλινική πράξη

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Πρόγραμμα εξ Αποστάσεως Εκπαίδευσης E-Learning. Φαρμακογονιδιωματική και Εξατομικευμένη Θεραπεία. E-learning. Οδηγός Σπουδών

Φαρμακογονιδιωματική. G. Patrinos

Αρχές μοριακής παθολογίας. Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ

ΣΠΑΝΙΑ ΝΟΣΗΜΑΤΑ ΟΡΦΑΝΑ ΦΑΡΜΑΚΑ

Βιοπληροψορική, συσιημική βιολογία και εξατομικευμένη θεραπεία

ΚΛΙΝΙΚΗ ΦΑΡΜΑΚΟΚΙΝΗΤΙΚΗ

Πρόγραμμα εξ Αποστάσεως Εκπαίδευσης. E - learning. Εξατομικευμένη Ιατρική Για Ογκολόγους. Οδηγός Σπουδών

Μια ενημέρωση για ασθενείς και παρόχους φροντίδας

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Φαρμακογονιδιωματική στη μεταγονιδιωματική εποχή

Επιτροπή Περιβάλλοντος, Δημόσιας Υγείας και Ασφάλειας των Τροφίμων ΣΧΕΔΙΟ ΓΝΩΜΟΔΟΤΗΣΗΣ. Συντάκτης γνωμοδότησης: Cristian-Silviu Buşoi

Αρχές μοριακής παθολογίας. Α. Αρμακόλας Αν. Καθηγητής Ιατρική Σχολή ΕΚΠΑ

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΒΙΟΤΕΧΝΟΛΟΓΙΑ ΣΤ ΕΞΑΜΗΝΟΥ Τμήμα Ιατρικών Εργαστηρίων Τ.Ε.Ι. Αθήνας

Βιοπληροφορική και Πολυµέσα. Ειρήνη Αυδίκου Αθήνα

Κέντρο Βιοϊατρικής Έρευνας και Εκπαίδευσης (ΚΕΒΙΕΕ) Αστέριος Καραγιάννης Πρόεδρος Τμήματος Ιατρικής ΑΠΘ Καθηγητής Παθολογίας

Γονίδια. τη Φαρμακολογία και τη Γονιδιωματική στη Φαρμακογονιδιωματική" Από. Παρενέργειες. Φαρμακο γονιδιωματική / γενετική.

Εισαγωγή στην Ιατρική Πληροφορική

Φαρμακογενετική. Αντώνης Γούλας, Αναπλ. Καθηγητής A Εργαστήριο Φαρμακολογίας

Providing Integrated e-health Services for Personalized Medicine utilizing Cloud Infrastructure (PINCLOUD)

Μεθοδολογίες Αξιοποίησης Δεδομένων

Κλινικές Μελέτες. Αναπληρώτρια Καθηγήτρια Ιατρικής Σχολής Πανεπιστημίου Αθηνών

Ε. Θηραίος MD, MSc in Public Health Γενικός Ιατρός Δ/ντής ΕΣΥ Γενικός Γραμματέας Ιατρικής Εταιρείας Αθηνών

υπηρεσιες προστιθέμενης αξίας Υπηρεσίες προστιθέμενης αξίας

ΠΑΡΑΔΟΤΕΟ Π3.3. Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: ΠΔΕ (2) Ημερομηνία: 11/05/2015. Ιστορικό Εγγράφου

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE FACULTY OF INFORMATICS AND TELECOMMUNICATIONS

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Κεφάλαιο 1 Εισαγωγή στην Ιατρική Πληροφορική

Π3.1 ΣΧΕΔΙΟ ΑΞΙΟΛΟΓΗΣΗΣ

2. Επιστημονικές προτεραιότητες και υποστηρικτικές-ενισχυτικές δράσεις

Φαρμακοκινητική. Χρυσάνθη Σαρδέλη

Προσωπικός Ηλεκτρονικός Φάκελος Υγείας: Ασθενοκεντρική Προσέγγιση, Βελτίωση της. Επικ. Καθηγήτρια Φλώρα Μαλαματένιου

Kλινικές ΑΠΑΝΤΗΣΕΙΣ ΣΕ ΒΑΣΙΚΑ ΕΡΩΤΗΜΑΤΑ

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Κλινικές Μελέτες στην Ελλάδα Ο δρόμος προς την αξιοπιστία από την πλευρά του ερευνητή: Εμπειρίες, προβλήματα και λύσεις. Γεώργιος Β.

Βιοϊατρική τεχνολογία

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Η Ερευνητική Εργαλειοθήκη


Η συμβολή στην επιτυχία ενός οργανισμού, παρουσιάζοντας σχετικά δεδομένα με τη χρήση τεχνικών 2Δ ή 3Δ τεχνολογίας. Αρμοδιότητα

Το Μέλλον για τα Συστήματα Διαχείρισης Ακτινολογικής Εικόνας (PACS)

Δημήτριος Κουτσούρης, Καθηγητής ΕΜΠ Ηλιοπούλου Δήμητρα, Δρ. Βιοϊατρικής Τεχνολογίας, Ηλεκτρολόγος Μηχ. και Μηχ. Υπολογιστών, ΕΜΠ

Περιεχόµενα. Πληροφοριακά Συστήµατα: Κατηγορίες και Κύκλος Ζωής. Π.Σ. ιαχείρισης Πράξεων. Π.Σ. ιοίκησης. Κατηγορίες Π.Σ. Ο κύκλος ζωής Π.Σ.

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία. Ενότητα: Εισαγωγή στην Hλεκτρονική Yγεία

Προκλήσεις στη πρόσβαση στους νέους βιοδείκτες για την εξατομικευμένη ιατρική

Συγγραφή ερευνητικής πρότασης

Φαρμακογονιδιωματική και εξατομίκευση της φαρμακευτικής αγωγής

Προσδιορισμός Σημαντικών Χαρακτηριστικών της Αυθόρμητης Δραστηριότητας Απομονωμένου Εγκεφαλικού Φλοιού in vitro

Λογιστική Θεωρία και Έρευνα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΓΕΝΕΤΙΚΟΙ ΠΑΡΑΓΟΝΤΕΣ ΣΤΗΝ ΙΦΝΕ. Μ. ΜΥΛΩΝΑΚΗ Γαστρεντερολόγος Τ. Επιμελήτρια Α Γενικό Κρατικό Νοσοκομείο Νίκαιας

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.)

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Φαρμακευτ μακε ική Φροντίδα : όταν ο ασθενή ασθε ς βρίσκετ ίσκε αι στ αι ο κέντ κέ ρο της επ ε ιχειρ ιχε ηματικότητας

Τεχνικές Εξόρυξης Δεδομένων

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Βιοϊατρική Μηχανική (Biomedical Engineering) Δευτερεύον Πρόγραμμα Σπουδών

Σχεδίαση Βάσεων Δεδομένων

Γονιδιωματική. G. Patrinos

Πολιτικές Διαχείρισης των Γενοσήμων Φαρμάκων στην Ελλάδα

Σεμινάριο Τελειοφοίτων. 2 - Επιλογή Επεξεργασία Ερευνητικού Θέματος

Προσβασιμότητα και η οπτική των φαρμακευτικών εταιρειών στα στοιχεία της e-συνταγογράφησης

Π7.1 Ανάγκες Εκπαίδευσης Χρηστών & Εκπαιδευτικός Σχεδιασμός

Σημαντική Ανακοίνωση: 1η Ημερίδα Παρουσίασης Μονάδας Φαρμακο-Πληροφορικής

Η εμπειρία από την εφαρμογή των θεραπευτικών πρωτοκόλλων συνταγογράφησης

Πληροφοριακά Συστήματα Διοίκησης

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών


Κεφάλαιο 15 (Ιατρική Γενετική) Προγεννητική διάγνωση

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

O7: Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7-A1: Αναπτύσσοντας εργαλεία για το Πρόγραμμα Κατάρτισης Εκπαιδευτικών

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Ολοκληρωμένη Πλατφόρμα Δικτύωσης της Δημόσιας Διοίκησης για την παροχή ενιαίων και εξατομικευμένων ηλεκτρονικών υπηρεσιών σε πολίτες και επιχειρήσεις»

DeSqual Ενότητες κατάρτισης 1. Ενδυνάμωση των εξυπηρετούμενων

Διάγνωση και προσυμπτωματικός έλεγχος

Φόρουμ Δημόσιας Υγείας & Κοινωνικής Ιατρικής.

H Συμβολή της Υπολογιστικής Σκέψης στην Προετοιμασία του Αυριανού Πολίτη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ Τμήμα Πληροφορικής και Τηλεπικοινωνιών

Τεχνολογία Ηλεκτρονικού Εμπορίου

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Σχεδιασμός Επεξεργασίας και Τηλεπεξεργασίας

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

ΕΡΓΑΣΤΗΡΙΟ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΑΝΟΣΟΛΟΓΙΑΣ, ΤΜΗΜΑ ΦΑΡΜΑΚΕΥΤΙΚΗΣ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ

Διαχείριση Ψηφιακού Περιεχομένου στο Επιχειρησιακό Περιβάλλον

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ «ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ & ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ» ΚΑΙ ΠΕΡΙΦΕΡΕΙΩΝ ΣΕ ΜΕΤΑΒΑΣΗ

Transcript:

ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ ΕΥΡΩΠΑΪΚΟ Υπουργείο Παιδείας και Θρησκευµάτων, Πολιτισµού και Αθλητισµού Ε. Π. Ανταγωνιστικότητα και Επιχειρηματικότητα (ΕΠΑΝ ΙΙ), ΠΕΠ Μακεδονίας Θράκης, ΠΕΠ Κρήτης και Νήσων Αιγαίου, ΠΕΠ Θεσσαλίας Στερεάς Ελλάδας Ηπείρου, ΠΕΠ Αττικής ΗΛΕΚΤΡΟΝΙΚΟΣ ΒΟΗΘΟΣ ΜΟΡΙΑΚΗΣ ΔΙΑΓΝΩΣΤΙΚΗΣ ELECTRONIC MOLECULAR DIAGNOSTICS ASSISTANT ΠΑΡΑΔΟΤΕΟ Π2.4 Προσδιορισμός της Υποδομής του Ολοκληρωμένου Πληροφοριακού Περιβάλλοντος του emodia: Σχεδιασμός του Κλινικο- Γονιδιωματικού Φακέλου Υγείας και του Περιβάλλοντος (Εργαλείων & Συστημάτων) Ανακάλυψης Γνώσεων Είδος Παραδοτέου: Τεχνική Αναφορά Υπεύθυνος Φορέας: ΙΤΕ- ΕΒΠ (3) Ημερομηνία: 11/02/2014 Ιστορικό Εγγράφου Έκδοση Ημερομηνία Κατάσταση 0.1 20/12/2013 Προσχέδιο 1.0 15/01/2014 1 η έκδοση Τελική 11/02/2014 Τελικό Προετοιμασία - Ονομ./Επώνυμο, (#Φορέα) - Γ. Ποταμιάς, (3) Κ. Λακιωτάκη, (3) Ε. Καρτσάκη, (3) Γ. Ποταμιάς, (3) Γ. Πατρινός, (1) Γ. Ποταμιάς, (3) Κ. Λακιωτάκη, (3) Γ. Πατρινός, (1) * Κ: Κοινοπραξία έργου, EE: ΕΥΔΕ- ΕΤΑΚ, Δ: Δημόσιο έγγραφο (ελεύθερο, π.χ., Web- Site έργου) Διανομή* K K EE

ΠΕΡΙΛΗΨΗ Στον τομέα της φαρμακογονιδιωματικής και της εξατομικευμένης ιατρικής, έχει καταστεί προφανές ότι τα πληροφοριακά συστήματα και οι εφαρμογές των βάσεων δεδομένων που παρέχουν σημαντικές πληροφορίες σχετικά με την εμφάνιση και τις συνέπειες των γενετικών παραλλαγών που εμπλέκονται στην φαρμακοκινητική και φαρμακοδυναμική, την αποτελεσματικότητα και την τοξικότητα των φαρμάκων, θα γίνουν αναπόσπαστο εργαλείο για τους ερευνητές της βιοϊατρικής και θα επηρεάσει τη κλινική πρακτική. Σε αυτό το παραδοτέο, παρουσιάζουμε πρώτα τη πρόοδο και τις προκλήσεις στον τομέα των πληροφοριακών συστημάτων στο πεδίο της φαρμακογονιδιωματικής, η οποία προκάλεσε και την ανάπτυξη ενός ολοκληρωμένου ηλεκτρονικού φαρμακογονιδιωματικού βοηθού (electronic PharmacoGenomics Assistant - epga) στο πλαίσιο του έργου emodia. Το σύστημα epga έχει σχεδιαστεί για να παρέχει εξατομικευμένες φαρμακογονιδιωματικές συστάσεις που βασίζονται σε καθιερωμένες γονοτυπικές- φαινοτυπικές συσχετίσεις, καθώς και για την υποστήριξη των ερευνητών της βιοϊατρικής στον εντοπισμό εκείνων των φαρμακογονιδιωματικών συσχετίσεων που σχετίζονται με γενετικές παραλλαγές. Παράλληλα παρουσιάζουμε το πλαίσιο ανακάλυψης φαρμακογονιδιωματικής γνώσης το οποίο θα αναπτυχθεί και θα χρησιμοποιηθεί στα πλαίσια του έργου emodia. EXECUTIVE SUMMARY In the area of pharmacogenomics and personalized medicine, it has become evident that information systems and database applications providing important information on the occurrence and consequences of gene variants involved in pharmacokinetics, pharmacodynamics, drug efficacy and drug toxicity, will become an integral tool for researchers and medical practitioners alike. In this deliverable, we first discuss advances and challenges in the field of pharmacogenomics information systems which in turn triggered the development of an integrated electronic pharmacogenomics assistant (epga). The emodia epga system is designed to provide personalized drug recommendations based on linked genotype- to- phenotype pharmacogenomics data, as well as to support biomedical researchers in the identification of pharmacogenomic related gene variants. Wen also present the knowledge- discovery framework that is going to be adjusted and exploited in the context of the emodia project. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 1 /17 Παραδοτέο Π2.4

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ 1. Εισαγωγή... 3 2. Το Υπόβαθρο της Φαρμακογονιδιωματικής... 5 2.1 PGx Εργαλεία και Πόροι... 6 3. Ο ηλεκτρονικός PGx βοηθός του emodia : Πλήρεις Σχεδιαστικές Προδιαγραφές... 7 3.1 Οργάνωση Δεδομένων και Μηχανισμοί Ερωτημάτων του epga... 8 3.2 Διαχείριση των ατομικών γονοτυπικών προφίλ στο emodia... 9 4. Οι εξατομικευμένες PGx μεταφραστικές υπηρεσίες του emodia... 9 4.1 Παροχή εξατομικευμένων PGx συστάσεων... 10 5. Ανακάλυψη γνώσης στο emodia... 11 5.1 Χρησιμοποιώντας state- of- the- art μηχανισμούς εξόρυξης δεδομένων... 11 5.1.1 ML&KD και e- Science... 12 5.1.2 Βιοπληροφορική και In silico Βιολογία... 13 5.1.3 Επιλογή Μεταβλητών και Ανακάλυψη Βιοδεικτών... 13 5.2 Ανακάλυψη Γνώσης από τη Βιβλιογραφία... 14 5.3 Σενάριο ανακάλυψης γονοτυπικών- φαινοτυπικών συσχετίσεων... 15 Αναφορές... 16 ΕΠΑΝ ΙΙ- ΣΠ- - emodia 2 /17 Παραδοτέο Π2.4

1. Εισαγωγή Μια δεκαετία μετά την ολοκλήρωση του Προγράμματος του Ανθρώπινου Γονιδιώματος - Human Genome Project, θα περίμενε κανείς ότι η Ιατρική γενετική θα είναι μια κοινή κλινική πρακτική μέχρι τώρα. Όμως, είμαστε πραγματικά στο σημείο όπου η διαθέσιμη γενετική γνώση μεταφράζεται σε κλινικά χρήσιμη πληροφορία; Ενώ δεν υπάρχει καμία απλή απάντηση στο ερώτημα αυτό, είναι σαφές ότι η ανάπτυξη της γονιδιωματικής γνώσης δεν έχει φθάσει ακόμη, τουλάχιστον σε ένα ικανοποιητικό επίπεδο, τη κλινική πρακτική. Η εξατομικευμένη ιατρική, η οποία είναι η προσαρμογή της ιατρικής διάγνωσης, πρόγνωσης και θεραπείας στα ατομικά χαρακτηριστικά, τις ανάγκες και τις προτιμήσεις του κάθε ασθενή, δεν είναι κάτι καινούριο. Πολλά άρθρα που αναφέρονται σε αυτή την ιδέα αρχίζουν με το γνωμικό του Ιπποκράτη: «Είναι πολύ πιο σημαντικό να γνωρίζουμε τι άτομο έχει η ασθένεια από το τι ασθένεια έχει το άτομο». Το 1956, η ανακάλυψη ότι η επιλεκτική τοξικότητα των κουκιών και του ανθελονοσιακού φαρμάκου πριμακίνη, οφείλεται σε μια ανεπάρκεια στο μεταβολικό ένζυμο γλυκοζο- 6- φωσφορικής αφυδρογονάσης (G6PD) (McDonagh et al., 2013), αποτελεί ένα από τα πρώτα παραδείγματα εξατομικευμένης ιατρικής. Δεδομένου ότι ο Παγκόσμιος Ιστός έχει γίνει ένα απαραίτητο εργαλείο για τους ερευνητές της βιοϊατρικής, η «γονιδιωματική υπερφόρτωση» ήταν αναπόφευκτη. Πληθώρα ιστοσελίδων και βάσεων δεδομένων με βιολογικά δεδομένα υπάρχουν, αλλά για την απάντηση ενός συγκεκριμένου βιολογικού ερωτήματος, οι εμπλεκόμενοι ερευνητές βιοϊατρικής και κλινικοί συχνά αισθάνονται ότι κατακλύζονται από την πληθώρα των διαθέσιμων πηγών πληροφοριών και γνώσεων. Οι διαθέσιμες γονιδιακές βάσεις δεδομένων, ιδιαίτερα αυτές που συνδέονται με φαρμακογονιδιωματική, είναι περιορισμένες σε αριθμό και στο βαθμό διασύνδεσης τους και δεν συγκεντρώσουν ότι είναι γνωστό και ότι ανακαλύπτεται σχετικά με γενετικές παραλλαγές και τη συσχέτισή τους με τη ανταπόκριση των φαρμάκων (Lagoumitzis et al., 2010). Παραμένει ακόμη αναπάντητη η πρόκληση για το σχεδιασμό και την ανάπτυξη ολοκληρωμένων διαδικτυακών πληροφοριακών συστημάτων τα οποία: (α) διασυνδέουν μεγάλους όγκους και πηγές φαρμακογονιδιωματικών πληροφοριών (π.χ. φαρμακογονιδιωματικές συσχέτισης γονότυπου- φαινότυπου; G2P- genotype- to- phenotype) σε μια ενιαία διαδικτυακή πύλη και (β) η ευέλικτη και άμεση ενημέρωση των σχετικών βάσεων δεδομένων με νέα ευρήματα από τη φαρμακογονιδιωματική έρευνα (Thorisson et al., 2009). Ένα σημαντικό στοιχείο της εξατομικευμένης ιατρικής είναι η εξατομίκευση της φαρμακευτικής θεραπείας. Η κατανόηση των πολύπλοκων αλληλεπιδράσεων και των αναλυτικών χαρακτηριστικών των λειτουργικών γενετικών παραλλαγών (variations) των ADMEΤ (Absorption, Distribution, Metabolism, Excretion, Toxicity Απορρόφηση, Διασπορά, Μεταβολισμός, Απέκκριση, Τοξικότητα) χαρακτηριστικών φαρμάκων, είναι αναγκαία για να αποδειχθεί η κλινική χρησιμότητα της φαρμακογονιδιωματικής. Η φαρμακογενετική (pharmacogenetics) και η φαρμακογονιδιωματική (pharmacogenomics), εν- συντομία PGx 1, στοχεύουν στην ανακάλυψη, την ανάλυση και την ερμηνεία των 1 Χρησιμοποιούνται σαν εναλλακτικοί όροι η φαρμακογονιδιωματική αναφέρεται στον επηρεασμό της φαρμακο- ανταπόκρισης από πολλαπλές γενετικές- παραλλαγές ενώ η φαρμακογενετική αναφέρεται σε αντίστοιχους επηρεασμούς από μία συγκεκριμένη γενετική- παραλλαγή. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 3 /17 Παραδοτέο Π2.4

ευρημάτων που σχετίζονται με τις γενετικές επιδράσεις των ατόμων που οδηγούν σε διαφορετική ανταπόκριση σε φάρμακα (Evans και Relling, 2004). Όταν μια παραλλαγή σε ένα γονίδιο σχετίζεται με μια συγκεκριμένη ανταπόκριση φαρμάκου σε έναν ασθενή, υπάρχει η δυνατότητα για τη λήψη κλινικών αποφάσεων που βασίζονται σε PGx πληροφορίες ρυθμίζοντας τη δοσολογία ή επιλέγοντας ένα διαφορετικό φάρμακο. Ωστόσο, η πραγματική εξατομίκευση της θεραπείας, η οποία θα μεγιστοποιήσει την αποτελεσματικότητα του φαρμάκου και θα ελαχιστοποιήσει τη τοξικότητα του, θα πρέπει να συνυπολογίσει τα ατομικά γενετικά και φαινοτυπικά χαρακτηριστικά του ατόμου, καθώς και περιβαλλοντικούς παράγοντες που επηρεάζουν την ανταπόκριση στη θεραπεία, στο πλαίσιο μιας ολιστικής προσέγγισης (Squassina et al, 2010). Η υπηρεσία Τροφίμων και Φαρμάκων (FDA) στο τομέα της Κλινικής Φαρμακολογίας θέσπισε την ομάδα Γονιδιωματικής και Στοχευμένης Θεραπείας, ώστε να προωθήσει την εφαρμογή γονιδιωματικών προσεγγίσεων στην ανακάλυψη, ανάπτυξη, ρύθμιση και χρήση των φαρμάκων. Φάρμακα που είναι εγκεκριμένα από την υπηρεσία FDA και παρέχουν PGx πληροφορίες στις ετικέτες τους, βρίσκονται ήδη στην αγορά 2. Ωστόσο, τα εργαστήρια δεν υποχρεούται να λάβουν την έγκριση από την FDA για τις περισσότερες γενετικές εξετάσεις/ελέγχους και αυτές οι ετικέτες δεν παρέχουν πάντοτε (με βάση τις σχετικές γενετικές πληροφορίες) συγκεκριμένες συστάσεις σχετικά με τις ενέργειες που πρέπει να γίνουν με βάση τα σχετικά γενετικά προφίλ. Ως εκ τούτου, είναι εμφανής η ανάγκη για το σχεδιασμό, τη δημιουργία και την ανάπτυξη πληροφοριακών συστημάτων που παρέχουν εφικτές λύσεις για την ενσωμάτωση της PGx στη κλινική πρακτική. Τα συστήματα αυτά θα πρέπει να πληρούν δύο προϋποθέσεις: (i) να μπορούν να ενημερώνονται από τη συνεχή αύξηση των παραγόμενων PGx πληροφοριών και γνώσεων, και (ii) να μπορούν να παράγουν PGx γνώση με τη μορφή κατευθυντήριων γραμμών, ή αλλιώς συστάσεων, οι οποίες λαμβάνουν υπόψιν το αποτέλεσμα ενός PGx ελέγχου. Ο στόχος είναι η υποστήριξη όλων των εμπλεκομένων στην δημιουργία θεραπευτικών πρωτοκόλλων και στη συνταγογράφηση φαρμάκων και η παροχή ευέλικτων και αποδοτικών πρακτικών για την ενσωμάτωση της PGx στη κλινική πρακτική. Με γνώμονα τη βαρύτητα της PGx στον εντοπισμό ατόμων που ανταποκρίνονται ή όχι σε συγκεκριμένα φάρμακα, στην αποφυγή ανεπιθύμητων ενεργειών και στη βελτίωση της δοσολογίας των φαρμάκων, παρουσιάζουμε στα επόμενα κεφάλαια ένα επαρκές και ευέλικτο πλαίσιο σχεδιαστικών προδιαγραφών και ανάπτυξης ενός ολοκληρωμένου πληροφοριακού συστήματος PGx για να χρησιμεύσει ως ένας ηλεκτρονικός Βοηθός Φαρμακογονιδιωματικής (electronic PGx Assistant - epga). Οι αρχικές απαιτήσεις ενός τέτοιου συστήματος καθώς και των εμπλεκόμενων χρηστών και των ρόλων τους παρουσιάζεται στο παραδοτέο Π2.2. Εδώ, παρουσιάζουμε και προσδιορίζουμε τις λειτουργίες και υπηρεσίες που θα προσφέρει αυτό το σύστημα. Μέρος του υλικού που παρουσιάζεται σε αυτό το παραδοτέο προέρχεται από δύο πρωτότυπες δημοσιεύσεις στα πλαίσια του έργου emodia (Lakiotaki et al., 2014; Potamias et al., 2014). 2 www.fda.gov/drugs/scienceresearch/researchareas/pharmacogenetics/ucm083378.htm ΕΠΑΝ ΙΙ- ΣΠ- - emodia 4 /17 Παραδοτέο Π2.4

2. Το Υπόβαθρο της Φαρμακογονιδιωματικής Η πλειοψηφία (~75%) των κλινικώς χρησιμοποιούμενων φαρμάκων μεταβολίζεται από τα ένζυμα του κυτοχρώματος P450 (CYP450), που κωδικοποιούνται από πάνω από 50 διαφορετικά γονίδια. Αυτή η ομάδα ενζύμων είναι εξαιρετικά πολυμορφική, που σημαίνει ότι υπάρχουν πολλές διαφορετικές εκδόσεις κάθε ενζύμου λόγω της ποικιλίας κοινών γενετικών παραλλαγών, συμπεριλαμβανομένων των αλλαγών σε μονές βάσεις του DNA, των μονονουκλεοτιδικών πολυμορφισμών (SNPs Single Nucleotide Polymorphisms), των προσθηκών ή διαγραφών βάσεων του DNA και των παραλλαγών του αριθμού αντιγράφων ( CNVs Copy Number Variations), και οι οποίες επηρεάζουν την ανταπόκριση ενός ασθενούς σε ένα συγκεκριμένο φάρμακο. Η ιστοσελίδα www.cypalleles.ki.se που αφορά την ονοματολογία των αλληλομόρφων του κυτοχρώματος P450 (CYP- allele), προσφέρει μια βάση δεδομένων γενετικής πληροφορίας για τις σχετικές παραλλαγές, καθώς και για τις επιπτώσεις τους σε μοριακό και κλινικό επίπεδο (Sim et al., 2010). Εκτός από την οικογένεια του κυτοχρώματος P450, υπάρχουν και άλλα ένζυμα και πρωτεΐνες που χρησιμεύουν στην εξατομίκευση των φαρμακευτικών θεραπειών, όπως τα γονίδια HLA- B, TPMT, UGT1A1 (Sim et al., 2013). Στις περισσότερες περιπτώσεις, ειδικοί συνδυασμοί γενετικών παραλλαγών σε συγκεκριμένα γονίδια καθορίζουν την ανταπόκριση σε φάρμακα. Αυτοί οι μοναδικοί συνδυασμοί αναφέρονται ως αλληλόμορφα. Μόλις ένας ασθενής λάβει ένα φάρμακο, αυτό ταξιδεύει μέσα στο σώμα, φτάνει το στόχο (ή στόχους) του, δρα σε αυτόν (αυτούς) και μετά αφήνει το σώμα μέσω απέκκρισης. Ακολουθώντας αυτό το μονοπάτι, ένα φάρμακο μπορεί να αλληλεπιδράσει με πολλές πρωτεΐνες που βοηθούν ή εμποδίζουν τη δράση του. Αυτές οι αλληλεπιδράσεις ορίζουν τη φαρμακοκινητική του φαρμάκου, η οποία περιλαμβάνει μετρήσεις για τα ADMEΤ χαρακτηριστικά του φαρμάκου. Αυτά τα χαρακτηριστικά καθορίζουν πόσο γρήγορα ένα φάρμακο φτάνει στο στόχο του και πόσο μπορεί να διαρκέσει η δράση του (Ma and Lu, 2011). Με βάση το διαφορετικό συνδυασμό αλληλομόρφων ενός γονιδίου, ένα άτομο κληρονομεί ένα αντίστοιχο προφίλ μεταβολισμού φαρμάκων που συχνά μπορεί να προβλεφθεί. Για παράδειγμα, στο νοσοκομείο St. Jude στις ΗΠΑ, χρησιμοποιούν ένα ερευνητικό πρωτόκολλο (PG4KDS) που αποσκοπεί στην επιλεκτική ενσωμάτωση των γονότυπων, σε μορφή πίνακα, για κλινικώς σημαντικά γονίδια στον ηλεκτρονικό ιατρικό φάκελο κάθε ασθενούς (παιδιού) προληπτικά (www.stjude.org/pg4kds). Αυτό επιτυγχάνεται αξιοποιώντας τους πίνακες αντιστοίχισης γονότυπων σε φαινότυπους ( look- up tables) που έχουν δημιουργηθεί από το έργο Translational Pharmacogenetics Project (TPP; Relling et al, 2011), μια πρωτοβουλία που ηγείται το δίκτυο για τη φαρμακογονιδιωματική έρευνα (PGRN Pharmacogenomics Research Network, www.pgrn.org) στα πλαίσια του προγράμματος και της κοινοπραξίας Clinical Pharmacogenetics Implementation Consortium (CPIC, Relling and Kleine, 2011), και με στόχο τη μετάφραση ευρέως αποδεκτών PGx ανακαλύψεvn στην κλινική πρακτική. Συγκεκριμένα, έχουν οριστεί φαινότυποι για κάθε μοναδικό διπλότυπο στα γονίδια CYP2D6 και TPMT με αναφορά σε αξιολογήσεις της δραστηριότητας των λειτουργικών αλληλομόρφων (Hicks et al., 2012). ΕΠΑΝ ΙΙ- ΣΠ- - emodia 5 /17 Παραδοτέο Π2.4

2.1 PGx Εργαλεία και Πόροι Αρκετές φαρμακογενετικές εξετάσεις έχουν αναπτυχθεί με βάση στοιχεία πολυάριθμων γονιδιωματικών μελετών που έχουν γίνει ώστε να συσχετίστούν γενετικές παραλλαγές με τη μεταβλητότητα στην ανταπόκριση σε συγκεκριμένα φάρμακα (Squassina et al., 2010). Το πρώτο φαρμακογενετικό τεστ, το Roche AmpliChip, εγκρίθηκε από την FDA το 2004, και αξιολογεί τους γενετικούς δείκτες που συνδέονται με τη λειτουργία των ενζύμων CYP2D6 και CYP2C19, οι οποίοι σχετίζονται με το μεταβολισμό φαρμάκων. Το μητρώο γενετικών τεστ (GTR Genetic Testing Registry, www.ncbi.nlm.nih.gov/gtr) παρέχει μια κεντρική βάση για την εθελοντική υποβολή γενετικών πληροφοριών. Στα τέλη του 2008, η Affymetrix (www.affymetrix.com) ανέπτυξε τη πλατφόρμα γονοτύπησης DMET Drug Metabolizing Enzymes and Transporters. Η DMET προσφέρει τη δυνατότητα σάρωσης 1936 παραλλαγών σε 225 γονίδια σχετικά με το μεταβολισμό φαρμάκων και διαθέτει ευρεία κάλυψη των σχετικών PGx δεικτών σε μια πειραματική ανάλυση (Sissung et al., 2010). Αυτοί οι δείκτες καλύπτουν το μεγαλύτερο μέρος (~95%) των PharmADMΕ γονιδίων (www.pharmaadme.org) και δεικτών, μια προσπάθεια που ξεκίνησε από τη βιομηχανία με σκοπό τη καταγραφή και τεκμηρίωση τυποποιημένων και τεκμηριωμένων γενετικών βιοδεικτών, οι οποίοι σχετίζονται με το μεταβολισμό φαρμάκων και εφαρμόζονται ευρέως σε πολλές φαρμακευτικές κλινικές δοκιμές και υποβολές φαρμάκων στην FDA. H DMET εξετάζει διάφορους τύπους δεικτών, συμπεριλαμβανομένων των παραλλαγών του αριθμού αντιγράφων (CNVs), των προσθηκών/διαγραφών και των μονονουκλεοτιδικών πολυμορφισμών (SNPs) με δύο ή τρεις παραλλαγές, σε στοχευμένα φαρμακογονίδια. Αν και η DMET έχει ήδη αποδειχθεί χρήσιμη σε αρκετές PGx μελέτες και θεωρείται η πιο ολοκληρωμένη PGx πλατφόρμα μέχρι σήμερα, παρ όλα αυτά δεν είναι ευέλικτη όσον αφορά τη δυνατότητα ενσωμάτωσης νέων PGx δεικτών, καθώς περιορίζεται στην αξιοποίηση γονοτυπικής πληροφορίας για ένα περιορισμένο σύνολο 1936 PGx γονιδιακών παραλλαγών. Επιπλέον, ως αποτέλεσμα της διαδικασίας μετάφρασης, η DMET της Affymetrix παρουσιάζει ένα φαινότυπο για το μεταβολισμό φαρμάκων ανά γονότυπο, ωστόσο η πληροφορία αυτή δεν σχετίζεται άμεσα με τα φάρμακα. Η βάση PGx γνώσης PharmGKB (Pharmacogenomics Knowledge Base, www.pharmgkb.org) ξεκίνησε το 2000 ως μια από τις πρώτες μετα- γονιδιωματικές βάσεις δεδομένων για την περιγραφή και αποθήκευση γονοτυπικών και φαινοτυπικών δεδομένων από φαρμακογενετικές μελέτες (Whirl- Carrilo et al., 2012; Thorn et al., 2005; Altman, 2007). Ο στόχος της PharmGKB είναι να δημιουργήσει μια ολοκληρωμένη πηγή πληροφοριών για φαρμακογονίδια, τις παραλλαγές τους, τα φαρμακοκινητικά και φαρμακοδυναμικά μοριακά μονοπάτια τους (molecular pathways) και τις επιπτώσεις τους σε φαινότυπους που σχετίζονται με φάρμακα. Οι επιστημονικοί επιμελητές της PharmGKB διαχειρίζονται (με «χειροκίνητα» μέσα) τη σχετική PGx βιβλιογραφία ώστε να ανακαλύψουν και να εντοπίσουν σχέσεις μεταξύ γονιδίων, φαρμάκων, και ασθενειών. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 6 /17 Παραδοτέο Π2.4

! Το αντικείμενο των Ε&Α προσπαθειών στα πλαίσια του έργου emodia είναι η σχεδίαση και ανάπτυξη ενός ολοκληρωμένου πληροφοριακού συστήματος το οποίο, από τη μια πλευρά να ενσωματώνει δεδομένα και πληροφορίες από διάφορες πλατφόρμες γονοτύπησης με δυνατότητα γονοτυπικής- φαινοτυπικής μετάφρασης, όπως η DMET, καθώς και δεδομένα από καθιερωμένες και αξιόπιστες PGx βάσεις δεδομένων, εμπλουτίζοντας τα με πληροφορίες από τη σχετική επιστημονική βιβλιογραφία, και από την άλλη, να προσφέρει υπηρεσίες PGx «μίας στάσης» (one stop) μέσω μιας ενιαίας διαδικτυακής πύλης.! Η στόχευση είναι να βελτιώσουμε τη ποιότητα ζωής του ατόμου/ασθενούς ως προς δύο κατευθύνσεις: (α) προσφορά εξατομικευμένης διάγνωσης/ πρόγνωσης, βασισμένης σε αξιόπιστα γονιδιωματικά/γενετικά στοιχεία, και (β) μείωση του κόστους της ιατροφαρμακευτικής περίθαλψης βελτιώνοντας την αποτελεσματικότητα των φαρμάκων και ελαχιστοποιώντας τις ανεπιθύμητες παρενέργειες τους. 3. Ο ηλεκτρονικός PGx βοηθός του emodia : Πλήρεις Σχεδιαστικές Προδιαγραφές Στο παραδοτέο Π2.2 παρουσιάσαμε και περιγράψαμε ένα αρχικό προσχέδιο προδιαγραφών του ηλεκτρονικού βοηθού φαρμακογονιδιωματικής του emodia, epga. Προκειμένου να παρουσιάσουμε τις πλήρεις λεπτομέρειες του συστήματος, θα ανακεφαλαιώσουμε συνοπτικά τους τύπους των βασικών χρηστών του συστήματος και τους ρόλους τους. Μπορούν να προσδιοριστούν τέσσερις δυνητικοί χρήστες όσον αφορά τις πιθανές ανάγκες και ρόλους τους : (α) Άτομο/Ασθενής - κάθε χρήστης που παρέχει ένα γονοτυπικό/snp προφίλ έτσι ώστε να λάβει αντίστοιχα κλινικά σχόλια και εξατομικευμένες PGx συστάσεις (αφού έχουν αξιολογηθεί και πιστοποιηθεί από έναν επαγγελματία υγείας); (β) Eπαγγελματίας υγείας - κάθε ιατρός, γενετιστής κλπ., ο οποίος συμπεραίνει το φαινοτυπικό προφίλ ατόμων (με βάση το γονοτυπικό προφίλ τους και με αναφορά στους look- up μεταφραστικούς πίνακες γονότυπου- φαινότυπου), κρίνει και επιβλέπει τις εξατομικευμένες συστάσεις κάθε ασθενούς, τις αξιολογεί και αποφασίζει για τα επακόλουθα θεραπευτικά πρωτόκολλα και θεραπευτικές επιλογές; (γ) Πάροχος PGx πληροφοριών/δεδομένων - κάθε ερευνητής βιοϊατρικής που ανακαλύπτει και προσδιορίζει γενετικές παραλλαγές και τις αντίστοιχες PGx συσχετίσεις τους (γονίδιο/παραλλαγή φαινότυπος φάρμακο) ο συγκεκριμένος χρήστης μπορεί είτε να επικυρώσει τα ευρήματα και να εμπλουτίσει τη βάση δεδομένων του συστήματος είτε να ζητήσει μια (τοπική) έκδοση της PGx βάσης δεδομένων για να εργαστεί; (δ) Διαχειριστής - κάθε χρήστης που είναι υπεύθυνος για τη συντήρηση και αναβάθμιση του διακομιστή της βάσης δεδομένων του ηλεκτρονικού PGx βοηθού (αντίγραφα ασφαλείας, διαχείριση εκδόσεων, αποκατάσταση, κλπ.), τη διαχείριση των εργαλείων των εφαρμογών και των υπηρεσιών, τη ανάθεση και την έγκριση των ρόλων και των δικαιωμάτων των χρηστών και τη παροχή κατάλληλων υπηρεσιών ασφάλειας και προστασίας προσωπικών δεδομένων. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 7 /17 Παραδοτέο Π2.4

Στα επόμενα κεφάλαια περιγράφουμε και παρουσιάζουμε την ανάπτυξη των πιο κρίσιμων στοιχείων του συστήματος epga. Το σχήμα 1 παρουσιάζει την ανανεωμένη και εμπλουτισμένη (σε σχέση με το προσχέδιο που παρουσιάστηκε στο παραδοτέο Π2.2) βασική αρχιτεκτονική πολλαπλών επιπέδων (layered architecture) του epga, συμπεριλαμβανομένων των βασικών συστατικών του συστήματος και των αλληλεξαρτήσεων τους σε σχέση με τη ροή- πληροφοριών/δεδομένων. Σχήμα 1. Πολυεπίπεδη αρχιτεκτονική αναφοράς του συστήματος epga του emodia: συστατικά, ροή δεδομένων/πληροφοριών και PGx υπηρεσίες 3.1 Οργάνωση Δεδομένων και Μηχανισμοί Ερωτημάτων του epga Στην αρχή, αρκετές εξωτερικές πηγές δεδομένων χρησιμοποιούνται για την εξαγωγή και την ενσωμάτωση PGx πληροφοριών στο σύστημα. Για τον σκοπό αυτό υιοθετήσαμε τη προσέγγιση μιας Αποθήκης Δεδομένων (Data Warehouse DW) οργανωμένης γύρω από ένα σχήμα- αστέρα (star schema; βλ. σχήμα 1), ως το βασικό μοντέλο δεδομένων και το πιο κατάλληλο για να συμπεριλάβει τις διαφορετικές απαιτήσεις της τεχνολογίας των βάσεων δεδομένων, σε σύγκριση με τα παραδοσιακά συστήματα βάσεων δεδομένων που υποστηρίζουν τις συνήθεις διαδικτυακές εφαρμογές επεξεργασίας δεδομένων και διαδικασιών. Το συγκεκριμένο σχήμα επιτρέπει την ευελιξία στη δημιουργία και την αποδοτική εκτέλεση σχετικών με τη PGx ερωτημάτων. Για παράδειγμα, μια χαρακτηριστική ερώτηση ενός επαγγελματία υγείας θα μπορούσε να είναι «Πρόκειται να συνταγογραφήσω αριπιπραζόλη σε ένα ασθενή που μεταβολίζει εκτενώς και ταχέως το φάρμακο αυτό. Υπάρχουν κάποιες συστάσεις;» ή «Ποια φάρμακα σχετίζονται με το διπλότυπο *2/*3A του γονιδίου TPMT;» Το αντίστοιχο On Line Analytical Processing (OLAP) ερώτημα για τη πρώτη ερώτηση έχει τη μορφή: SELECT Recommendation FROM facttable, drug, phenotype WHERE facttable.recommendationid = Recommendation.RecommendationID AND facttable.drugid=drug.drugid AND facttable.phenotypeid = phenotype.phenotypeid AND phenotype.metabolstatus='extensive Metabolizer' AND drug.drugname= 'aripiprazole' ΕΠΑΝ ΙΙ- ΣΠ- - emodia 8 /17 Παραδοτέο Π2.4

3.2 Διαχείριση των ατομικών γονοτυπικών προφίλ στο emodia Όσον αφορά τη διαχείριση των γονοτυπικών/snp προφίλ των ατόμων/ασθενών, έχουμε υιοθετήσει μια «ελαφριά» λύση ηλεκτρονικού φακέλου υγείας ( EHR electronic health record). Για το σκοπό αυτό, έχουν χρησιμοποιηθεί προηγμένες κατευθυντήριες γραμμές και μοντέλα δεδομένων που σχετίζονται με τα γενετικά τεστ και τις ερμηνείες τους. Το σχήμα 1 απεικονίζει μια γενική αρχιτεκτονική δομή της ενσωμάτωσης των γονοτυπικών δεδομένων από το γενετικό εργαστήριο στο ηλεκτρονικό φάκελο υγείας. Η χρησιμότητα της σύνδεσης γονοτυπικών δεδομένων με τον ηλεκτρονικό φάκελο υγείας είναι κρίσιμη για τη μετάφραση και μεταφορά της PGx γνώσης στη κλινική πρακτική. Αυτή η προσέγγιση είναι αποδοτική τόσο σε κόστος όσο και σε χρόνο. Η δικτυακή κοινοπραξία emerge (emerge.mc.vanderbilt.edu) έχει ήδη αξιοποιήσει αυτή τη προσέγγιση με πολύ ενδιαφέροντα αποτελέσματα (Denny et al., 2013; Denny, 2013). Σχετικά με τη συλλογή, αποθήκευση και διαχείριση ατομικών γονοτυπικών, και λαμβάνοντας υπόψη την τρέχουσα αντιπαράθεση σχετικά με την εφαρμογή των ερευνητικών ευρημάτων στη κλινική ιατρική - translational research (Vayena and Prainsack, 2013), εγείρονται αρκετά και κρίσιμα ηθικά ζητήματα, όπως η δημόσια γενετική επίγνωση και η γονιδιωματική παιδεία, οι γονιδιωματικές γνώσεις των ιατρών, η διαχείριση της γονιδιωματικής πληροφορίας εντός και πέραν της κλινικής πρακτικής, η διαδικτυακή και απευθείας προς το καταναλωτή (direct- to- consumer DTC) παροχή (φαρμακο- )γονιδιωματικής πληροφορίας, με τα σχετικά επιχειρήματα να είναι ιδιαίτερα έντονα και πολωμένα (Barret and Topol, 2013). Σε αυτό το πλαίσιο, όλα τα θέματα σχετικά με την ηθική, τη προστασία των προσωπικών δεδομένων και την ασφάλεια πρέπει να αντιμετωπιστούν κατάλληλα, με ιδιαίτερη έμφαση στη μελέτη, αποδοχή και εφαρμογή των σχετικών κατευθυντήριων γραμμών, προκειμένου να εκτιμηθεί ο αντίκτυπος της γενετικής και της φαρμακογονιδιωματικής στη κοινωνία και να αυξηθεί η ευαισθητοποίηση του ευρύτερου κοινού, των επαγγελματιών υγείας και των ερευνητών βιοϊατρικής στο πλαίσιο της εξατομικευμένης ιατρικής. 4. Οι εξατομικευμένες PGx μεταφραστικές υπηρεσίες του emodia Σίγουρα η πιο σημαντική συνιστώσα μιας πλατφόρμας φαρμακογονιδιωματικού βοηθού είναι η εξατομικευμένη μετάφραση. Η ένταξη ενός εξατομικευμένου PGx εργαλείου μετάφρασης βασίζεται στην παραδοχή ότι «η κλινική προληπτική γονοτύπηση υψηλής απόδοσης τελικά θα γίνει κοινή πρακτική και οι ιατροί θα έχουν όλο και περισσότερους γονότυπους ασθενών πριν στη συντατγογράφηση ενός φαρμάκου» (Schildcrout et al., 2012). Η εξατομικευμένη μετάφραση έχει ως στόχο να εξυπηρετήσει: (α) την αυτόματη ανάλυση των γονοτυπικών προφίλ ατόμων/ασθενών με αναφορά σε έγκυρες παραλλαγές γονιδίων και αλληλόμορφα (ήδη καταγραμμένα ή πρόσφατα ανακαλυφθέντα); (β) την επαγωγή των αντίστοιχων φαινότυπων / ατομικών μεταβολικών προφίλ, και (γ) την αναφορά σε σχετικούς και ενημερωμένους κλινικούς σχολιασμούς (clinical annotations) και συστάσεων (guidelines) δοσολογίας φαρμάκων. Το σύστημα epga έχει σχεδιαστεί ώστε να ενσωματώνει εργαλεία και να προσφέρει υπηρεσίες εξατομικευμένης μετάφρασης με βάση την εναρμόνιση των PGx μεταφραστικών πινάκων (translational haplotype tables) από τη πλατφόρμα της Affymetrix DMET Plus και από τη βάση δεδομένων PharmGKB. Ταυτόχρονα, προβλέπονται εργαλεία και εφαρμογές για τη παροχή ΕΠΑΝ ΙΙ- ΣΠ- - emodia 9 /17 Παραδοτέο Π2.4

υπηρεσιών ενημέρωσης των μεταφραστικών πινάκων με παραλλαγές γονιδίων και αλληλομόρφων που έχουν πρόσφατα ανακαλυφθεί και επικυρωθεί. Η διαδικασία της PGx μετάφρασης του epga βασίζεται στην κατάλληλη προσαρμογή μιας διαδικασίας αντιστοίχησης αλληλομόρφων (Farmen et al., 2009) μια συνοπτική περιγραφή της οποίας παρουσιάζεται στο σχήμα 2. Σχήμα 2. Αντιστοίχηση γονοτυπικών(snp) προφίλ ατόμων σε αλληλόμορφα και επαγωγή φαινότυπων (κατά DMET). 4.1 Παροχή εξατομικευμένων PGx συστάσεων Με σκοπό τη παραγωγή επακριβών εξατομικευμένων συστάσεων πρέπει να δοθεί έμφαση στη σχέση μεταξύ μιας παραλλαγής και των αντίστοιχων γονιδίων, φαρμάκων και φαινοτύπων. Για παράδειγμα, ας υποθέσουμε ότι ένας ασθενής με διπολική διαταραχή κάνει μια γενετική εξέταση που έχει τη δυνατότητα να καθορίσει ένα A/C γονότυπο για τη παραλλαγή rs2032582, η οποία αντιστοιχεί στη νουκλεοτιδική θέση 7:87160618 του γονιδίου ABCB1. Πως μπορεί αυτή η πληροφορία να μεταφραστεί σε κλινική γνώση; Ο επαγγελματίας υγείας θα πρέπει να γνωρίζει ότι παρόλο που η πλειοψηφία (70-80%) των ασθενών με διπολική διαταραχή ανταποκρίνονται καλά στο λίθιο (βασικό φάρμακο στη περίπτωση της διπολικής διαταραχής), ένα σημαντικό ποσοστό αυτών θα παρουσιάσει μερική ή μη ανταπόκριση. " Ένα σενάριο PGx μετάφρασης και παροχής PGx συστάσεων. Πριν γίνει η συνταγογράφηση του φαρμάκου, ο ιατρός εισάγει τα κρυπτογραφημένα και ανώνυμα γονοτυπικά δεδομένα του ασθενούς στο σύστημα epga και στη συνέχεια εντοπίζει τη συγκεκριμένη παραλλαγή που σχετίζεται με την ανταπόκριση στο λίθιο. Πιο συγκεκριμένα, ο επαγγελματίας υγείας λαμβάνει τις ακόλουθες πληροφορίες (τις οποίες το epga έχει ανασύρει από τη PharmGKB και κατάλλhλα οργανώσει): «Ασθενείς με γονότυπο AC και κατάθλιψη μπορεί να έχουν αυξημένο κίνδυνο αυτοκτονικού ιδεασμού όταν λάβουν θεραπεία με κλομιπραμίνη, λίθιο,, ή βενλαφαξίνη σε σύγκριση με ασθενείς με γονότυπο CC». Παίρνοντας υπόψη το ιατρικό ιστορικού του ΕΠΑΝ ΙΙ- ΣΠ- - emodia 10 /17 Παραδοτέο Π2.4

ασθενούς και της οικογένειάς του, ο επαγγελματίας υγείας μπορεί τότε να αποφασίσει να παρέχει μια εναλλακτική θεραπεία και να παρακολουθεί στενά τον ασθενή. Επίσης, μπορεί να συνταγογραφήσει μια νέα γενετική εξέταση με βάση διαθέσιμες βιβλιογραφικές αναφορές και σχετικές PGx συστάσεις, οι οποίες συσχετίζουν επιπλέον γενετικές παραλλαγές με την ανταπόκριση στο λίθιο. To παραπάνω σενάριο προβλέπεται να υποστηριχθεί από το σύστημα epga μέσω σχετικών εφαρμογών και ροών (αποθηκευμένων) πληροφοριών για τη μετάφραση, την επαγωγή εξατομικευμένων φαινοτύπων και την ανάσυρση PGx συστάσεων δοσολογίας φαρμάκων (βλ. Σσχήμα 3). Σχήμα 3. Εφαρμογές PGx μετάφρασης στο epga: Επαγωγή φαινοτύπου και παροχή PGx φαρμακευτικών συστάσεων 5. Ανακάλυψη γνώσης στο emodia Μέχρι πρόσφατα, η διαγνωστική και προγνωστική αξιολόγηση των προσβεβλημένων ιστών βασιζόταν σε μεγάλο βαθμό σε έμμεσους δείκτες που επέτρεπαν μόνο γενικές κατηγοριοποιήσεις σε γενικούς ιστολογικούς ή μορφολογικούς υποτύπους. Οι SNP πλατφόρμες γονοτύπησης ευρείας απόδοσης προσφέρουν πρωτοφανείς δυνατότητες για τον εντοπισμό γενετικών βιοδεικτών. Εφοδιασμένη με προηγμένες λειτουργίες ανακάλυψης γνώσης (knowledge discovery) η ικανότητα αυτής της προσέγγισης θα είναι πολύ μεγαλύτερη από εκείνη των προσεγγίσεων που χρησιμοποιούνται σήμερα (αν και πάντοτε παραμένει ανοικτό το θέμα της επικύρωσης των σχετικών αποτελεσμάτων). 5.1 Χρησιμοποιώντας state- of- the- art μηχανισμούς εξόρυξης δεδομένων Η εξόρυξη δεδομένων έχει επιτυχώς παράσχει λύσεις για την εύρεση πληροφοριών σε πολλούς τομείς συμπεριλαμβανομένης της βιοπληροφορικής. Πολλά προβλήματα στο τομέα της επιστήμης και της βιομηχανίας έχουν αντιμετωπιστεί με μεθόδους και αλγορίθμους εξόρυξης δεδομένων όπως η ομαδοποίηση (clustering), η κατηγοριοποίηση (classification), οι κανόνες συσχέτισης (association rules) και η επιλογή μεταβλητών (feature selection). ΕΠΑΝ ΙΙ- ΣΠ- - emodia 11 /17 Παραδοτέο Π2.4

Ειδικότερα, η επιλογή μεταβλητών είναι μια πολλά υποσχόμενη προσέγγιση για τη δραστική μείωση και επιλογή αξιόπιστων γονιδιακών- παραλλαγών, και των αντίστοιχων SNPs. Η βασική ιδέα είναι η επιλογή ενός υποσυνόλου αρχικών μεταβλητών με την εξάλειψη αυτών που παρουσιάζουν περιορισμένη απόδοση πρόβλεψης. Η επιλογή μεταβλητών μπορεί να βελτιώσει σημαντικά την σαφήνεια των τελικών κατηγοριοποιητών (classifiers) και να υποστηρίξει την ανάπτυξη διαγνωστικών και προβλεπτικών προγνωστικών μοντέλων. Η μηχανική μάθηση και η ανακάλυψη γνώσης (Machine Learning & Knowledge Discovery ML&KD; Fayyad et al., 1992), σαν το βασικό υπόβαθρο τεχνικών εξόρυξης δεδομένων, έχει εξελιχθεί πάρα πολύ. Παράλληλα με σημαντικές μεθοδολογικές εξελίξεις, ο κλάδος έχει αποκτήσει μια αυξανόμενη επίγνωση της θέσης του στην «επιστήμη» και της αναγκαιότητας βάσιμων και με ακρίβεια τεχνικών αξιολόγησης αποτελεσμάτων, που στηρίζονται σε σαφείς και αξιόπιστες στατιστικές υποθέσεις και μεθόδους. Στο πίνακα 1 παρουσιάζεται μια περίληψη των τρεχόντων τάσεων. Πίνακας 1. Τρέχουσες «τάσεις» και βασικές λειτουργίες στη ML&DM Μέθοδος Κατηγοριοποίηση Μεταβλητές Ανακάλυψη Απόκτηση γνώσης Επεξεργασία φυσικής γλώσσας/εξόρυξη γνώσεων από τη Βιβλιογραφία Πράκτορες Γνωστικά μοντέλα Ανάλυση δομημένων μοντέλων Θεωρία Συγκεκριμένες Λειτουργίες Πρόβλεψη, Επανεξέταση της θεωρίας & βελτίωση της γνώσης, Χαρακτηρισμός, Παρεμβολή Επιλογή μεταβλητών, Διακριτοποίηση, Χειρισμός των άγνωστων τιμών, Χειρισμός μεροληψιών Διαμόρφωση θεωρίας, Ομαδοποίηση, Τμηματοποίηση, Συσχέτιση Ανάκτηση Πληροφορίας, Εξαγωγή πληροφορίας, Δομημένη μάθηση Εξόρυξη γνώσης από «μη δομημένες» πηγές και κείμενα (εξόρυξη και ανακάλυψη μοτίβων) Έλεγχος, Μάθηση στη ρομποτική, Μάθηση αντίληψης, Απόκτηση δεξιοτήτων, Ενεργή μάθηση, Μοντέλα μάθησης του περιβάλλοντος & των αλληλεπιδράσεων Προφίλ προτιμήσεων, Έξυπνες διεπαφές Ανάλυση χρονοσειρών, Μάθηση/Εξόρυξη ακολουθιών, Μάθηση από χωρικά και χρονικά δεδομένα, Εικονική μάθηση, Μάθηση από δεδομένα πολλαπλών μέσων Διανόρφωση θεωριών, Επιλογή υποθέσεων, Συγκρίσεις, Πολυπλοκότητα 5.1.1 ML&KD και e- Science Ακόμα και αν κάθε επιστημονικός κλάδος μπορεί να επωφεληθεί από εργαλεία ανακάλυψης γνώσης, υπάρχουν κάποιοι κλάδοι που είναι ιδιαίτερα κατάλληλοι και στους οποίους αυτά τα εργαλεία έχουν ήδη αποδειχθεί χρήσιμα. Δεδομένης της τεράστιας ποσότητας των ταχέως αναπτυσσόμενων και πολύπλοκων τύπων δεδομένων και των εκτενών μεθόδων ανάλυσης δεδομένων, η τεχνολογία εξόρυξης δεδομένων μπορεί να είναι ακόμα σε πρώιμο στάδιο, καθώς δεν είναι ακόμα επαρκής για τη διαχείριση μεγάλων και σύνθετων προβλημάτων. Η έρευνα είναι απαραίτητη για την ανάπτυξη αυτοματοποιημένων, επεκτάσιμων, ολοκληρωμένων και αξιόπιστων συστημάτων και εργαλείων εξόρυξης δεδομένων. Επιπλέον, είναι σημαντική η προώθηση της ανταλλαγής πληροφοριών μεταξύ των χρηστών, των αναλυτών δεδομένων, των προγραμματιστών και των ερευνητών που ασχολούνται με την εξόρυξη ΕΠΑΝ ΙΙ- ΣΠ- - emodia 12 /17 Παραδοτέο Π2.4

δεδομένων ώστε να διευκολυνθεί η ανάπτυξη της σχετικής έρευνας, της ανάπτυξης εφαρμογών και της μεταφοράς της τεχνογνωσίας. Ο Han (Han et al., 2003) έχει παρουσιάσει μια ανάλυση των δυνατοτήτων της ανακάλυψης γνώσης στην επιστημονική διαδικασία. 5.1.2 Βιοπληροφορική και In silico Βιολογία Η επιτυχία της βιοπληροφορικής τα τελευταία χρόνια παρακινήθηκε, σε μεγάλο βαθμό, και την ανάπτυξη μεθοδολογιών και τεχνικών εξόρυξης δεδομένων και ανακάλυψης γνώσεων (Mamitsuka et al., 2013). Πολλά ευρέως επιτυχημένα υπολογιστικά μοντέλα και εργαλεία που χρησιμοποιούνται από βιολόγους, όπως στοχαστικά μοντέλα ανάλυσης DNA- αλληλουχιών ή οι μέθοδοι ομαδοποίησης γονιδιακών- εκφράσεων από μικροσυστοιχίες DNA (DNA microarrays) είτε SNP γονοτυπικών προφίλ, έχουν επαρκώς αντιμετωπιστεί με μεθοδολογίες και προσεγγίσεις ML&KD. Παρ όλα αυτά, οι τρέχουσες εξελίξεις στη γονιδιωματική, στη πρωτεϊνωματική και στη μοντελοποίηση της κυτταρικής λειτουργίας, σε συνδυασμό με την απότομη ανάπτυξη της ικανότητα παραγωγής βιολογικών δεδομένων υψηλής απόδοσης, θα προσφέρουν νέες ευκαιρίες για στενή συνεργασία μεταξύ ερευνητών από το πεδίο ML&KD και ερευνητών από το πεδίο της βιοϊατρικής με ποθητό αποτέλεσμα την ανάπτυξη χρήσιμων εργαλείων αντιμετώπισης και επίλυσης σύνθετων και πολύπλοκων προβλημάτων βιολογίας και μεγάλου όγκου δεδομένων (Zhang and Rajapakse, 2008; Savage, 2014). 5.1.3 Επιλογή Μεταβλητών και Ανακάλυψη Βιοδεικτών Από τη μια πλευρά τα πολυδιάστατα, από άποψη των μεταβλητών αναφοράς (δεκάδες χιλιάδες), δεδομένα (π.χ. μικροσυστοιχίες) και από την άλλη τα μικρά σε μέγεθος δείγματα (δεκάδες έως εκατοντάδες), αποτελούν βασικές προκλήσεις για τις υπολογιστικές τεχνικές και τις αντίστοιχες προσεγγίσεις ανάλυσης δεδομένων. Από την οπτική γωνία της υπολογιστικής και της στατιστικής, η μείωση του συνόλου μεταβλητών και η επιλογή των πιο σχετικών μεταβλητών θα μπορούσε να βοηθήσει: (α) στην αντιμετώπιση πολυδιάστατων χώρων και στην μείωση του υπολογιστικού κόστους, και (β) στην βελτίωση της απόδοσης της κατηγοριοποίησης (classification). Από θεωρητική άποψη, η επιλογή των πιο σχετικών μεταβλητών χρησιμοποιεί την επαγωγική και μεροληπτική (inductive bias) προσέγγιση των ελάχιστων- χαρακτηριστικών (min- features) κατά την οποία προτιμούνται πιο απλά μοντέλα πρόβλεψης έναντι των πιο πολύπλοκων (Almuallim, 1991). Η επαγωγική μεροληψία βασίζεται στην αρχή Occams s razor : αν μπορούμε να προβλέψουμε τη κατηγορία ενός συνόλου από n περιπτώσεις (τα παραδείγματα εκπαίδευσης του μοντέλου) σε μια υπόθεση που χρησιμοποιεί μόνο k<<n μεταβλητές, τότε μπορούμε να είμαστε σίγουροι ότι αυτή η υπόθεση γενικεύεται καλά σε μελλοντικές περιπτώσεις (τις περιπτώσεις δοκιμής). Με βάση την αρχή αυτή, οι διεργασίες επιλογής μεταβλητών στοχεύουν στην επιλογή ενός υποσυνόλου μεταβλητών έτσι ώστε ο αρχικός χώρος να μειωθεί βέλτιστα σύμφωνα με ένα συγκεκριμένο κριτήριο αξιολόγησης. Είναι φυσικό να υποθέσουμε ότι, καθώς οι διαστάσεις ενός χώρου επεκτείνονται, ο απαραίτητος αριθμός παρατηρήσεων, ώστε να μοντελοποιηθεί μια έγκυρη υπόθεση, αυξάνεται ένα γεγονός που αξιολογείται στο πλαίσιο της θεωρίας θεωρητικής υπολογιστικής μάθησης και συγκεκριμένα υπό το πρίσμα προσεγγίσεων «κατά- προσέγγιση πιθανοθεωρητικά σωστή δυνατότητα μάθησης» (PAC- learnability; Valiant, 1984). ΕΠΑΝ ΙΙ- ΣΠ- - emodia 13 /17 Παραδοτέο Π2.4

Υπάρχει μια πληθώρα ελύθερα προσβάσιμων αλγορίθμων, εργαλείων και συστημάτων εξόρυξης δεδομένων, π.χ. Weka (www.cs.waikato.ac.nz/ml/weka), R- package/bioconductor (www.bioconductor.org) κλπ). Στα πλαίσια του έργου emodia και της εκμετάλλευσης σχετικών εργαλείων και υπηρεσιών από το σύστημα epga μας ενδιαφέρει η ανακάλυψη και ο εντοπισμός συσχετίσεων μεταξύ SNP- προφίλ και φαινότυπων και τα αντίστοιχα μοντέλα διάκρισης / ταξινόμησης.! Οι βασικές δραστηριότητες της διαδικασίας αυτής εφαρμόζονται στο σύστημα επιλογής μεταβλητών (γονιδίων) MineGene, οι λειτουργίες του οποίου θα προσαρμοστούν και θα εκμεταλλευτούν κατάλληλα στα πλαίσια του έργου (Potamias et al., 2004; 2006; 2007).! Επιπλέον, πρόκειται να αξιοποιήσουμε συστήματα ανοικτού- κώδικα (open source), όπως το plink (pngu.mgh.harvard.edu/~purcell/plink), τα οποία χρησιμοποιούνται ευρέως στην ανάλυση γονοτυπικών/snp δεδομένων και τον εντοπισμό στατιστικά- σημαντικών συσχετίσεων (τα οποία προκύπτουν από GWAS Genome Wide Association Studies; www.nature.com/nrg/series/gwas) 5.2 Ανακάλυψη Γνώσης από τη Βιβλιογραφία Η εξόρυξη δεδομένων από τη βιβλιογραφία για τη βιοϊατρική είναι η διαδικασία εξεύρεσης έγκυρων, νέων και χρήσιμων πληροφοριών και προτύπων από ελεύθερης- γραφής κείμενα (π.χ., περιλήψεις επιστημονικών εργασιών από την PubMed), και περιλαμβάνει δύο βασικές τεχνικές: (i) εξόρυξη κειμένων - text mining (TM), αναφέρεται στην ανακάλυψη γνώσης από μεγάλες συλλογές κειμένων, συνδυάζοντας έτσι μεθόδους ανακάλυψης γνώσης και επεξεργασίας κειμένων. Ασχολείται κυρίως με την ανακάλυψη ενδιαφερόντων προτύπων όπως οι ομάδες (clusters), οι συσχετίσεις, οι αποκλίσεις, οι ομοιότητες και οι διαφορές μεταξύ όρων βιοϊατρικού ενδιαφέροντος; Και (ii) εξαγωγή πληροφορίας - information extraction (IE), στοχεύει στην αναγνώριση προκαθορισμένων κατηγοριών οντοτήτων, σχέσεων και γεγονότων που αναφέρονται ρητά στη βιβλιογραφία (Mathiak and Eckstein, 2004; Ben- Dov and Feldman, 2005). Στα πλαίσια του έργου emodia μας ενδιαφέρει ιδιαίτερα η αυτοματοποιημένη εξόρυξη δεδομένων από τη βιβλιογραφία που επιτρέπει την αναγνώριση, καθώς και την τεκμηρίωση PGx συσχετίσεων της μορφής γονιδιακή- παραλλαγή (μεταβολικός) φαινότυπος φάρμακο(α). Για το σκοπό έχουμε σχεδιάσει μια πολυεπίπεδη μεθοδολογία ανακάλυψης PGx συσχετίσεων από βιβλιογραφίa η οποία εκτυλίσσεται σε τρία στάδια: (i) φιλτράρισμα της βιοϊατρικής βιβλιογραφίας για την επιλογή PGx- σχετικών εγγράφων με τη βοήθεια τεχνικών ανάκτησης πληροφορίας/κειμένων; (ii) αναγνώριση και εντοπισμός (έγκυρων) PGx οντοτήτων και όρων στα επιλεγμένα αρχεία (π.χ. γονίδια, παραλλαγές/αλληλόμορφα, φάρμακα, μεταβολικά ένζυμα, φαινότυποι) με τη βοήθεια τεχνικών εξόρυξης δεδομένων; και (iii) αναγνώριση και εξαγωγή PGx συσχετίσεων.! Στο πλαίσιο αυτό θα χρησιμοποιήσουμε και θα προσαρμόσουμε κατάλληλα λειτουργίες από το σύστημα MineBioText το οποίο έχει αναπτυχθεί από μέλη της ομάδας του emodia (Antonakaki et al., 2005). ΕΠΑΝ ΙΙ- ΣΠ- - emodia 14 /17 Παραδοτέο Π2.4

5.3 Σενάριο ανακάλυψης γονοτυπικών- φαινοτυπικών συσχετίσεων A. Συλλογή γονοτυπικών/snp προφίλ από δημόσιες βάσεις δεδομένων είτε από σχετικές δημοσιευμένες μελέτες. Προβλέπεται και η δυνατότητα διαχείρισης ατομικών SNP- προφίλ με τη προϋπόθεση της ενσωμάτωσης μηχανισμών ασφάλειας προσωπικών δεδομένων και μηχανισμών εξουσιοδότης (authorization; π.χ., από το άτομο/ασθενή στο χρήστη του συστήματος ιατρό/γενετιστή). B. Φαινοτυπική Ανάλυση - Χαρακτηρισμός και κατηγοριοποίηση δειγμάτων. Τα δείγματα των ατόμων έχουν (δυνητικά) λάβει θεραπεία με διαφορετικά φάρμακα. Τα δείγματα μπορούν να ανατεθούν, από τους εμπλεκόμενους κλινικούς ειδικούς, σε διάφορα κλινικο- ιστοπαθολογικά κατηγορίες φαρμακο- ανατπόκρισης (π.χ., πλήρης- ανταπόκριση #$ καμμία- ανταπόκριση). Σε μια πιο προωθημένη περίπτωση, μπορούμε με βάση το συνολικό κλινικο- ιστοπαθολογικό προφίλ των ατόμων/ασθενών να κατηγοριοποιήσουμε τα δείγματα σε «τεχνητές» κατηγορίες με τη χρήση αλγορίθμων/τεχνικών συσταδοποίησης/ομαδοπόιησης (clustering) βέβαια οι προκύπτουσες συστάδες (clusters) θα πρέπει να ελεγχθούν ως προς την ορθότητα και την αξιοπιστία και τη κλινική/διαγνωστική/ προγνωστική σημασία τους. Γ. Γονοτυπικές- Φαινοτυπικές συσχετίσεις. Μετά την ολοκλήρωση των i και ii έχουμε στη διάθεση μας μια μήτρα όπου οι γραμμές είναι τα στοχευμένα SNPs (συχνά της τάξης 10δων χιλιάδων, είτε χιλιάδων όπως στη περίπτωση της πλατφόρμας DMET η οποία εξάγει γονότυπους δειγμάτων για 1936 φαρμακο- παραλλαγες/snps), και οι στήλες είναι τα διαφορετικά δείγματα, κάθε ένα από τα οποία αντιστοιχεί σε έναν από δύο φαινότυπους (πλήρης- ανταπόκριση vs. καμία- ανταπόκριση). Εφαρμόζοντας προηγμένες τεχνικές ML&KD, π.χ., επιλογή χαρακτηριστικών και επαγωγή μοντέλων κατηγοριοποίησης/πρόβλεψης (classifiers / predictors), είτε τεχνικές ανάλυσης- συσχετίσεων (π.χ., με το plink) είμαστε σε θέση να εντοπίσουμε χαρακτηριστικά SNPs τα οποία διακρίνουν μεταξύ των δυο φαινοτύπων. Με άλλα λόγια, είμαστε σε θέση να συνδέσουμε πιθανές φαινοτυπικές κατηγορίες φαρμακο- αναταπόκρισης με αντίστοιχα γονοτυπικά προφίλ. Το παραπάνω ολοκληρωμένο σενάριο ανακάλυψης φαρμακογονιδιωματικής γνώσης από γονοτυπικά/snp δεδομένα απεικονίζεται στο σχήμα 4. Σχήμα 4. Ένα ολοκληρωμένο Κλινικο- Γονιδιωματικό Σενάριο Ανακάλυψης PGx συσχετίσεων ΕΠΑΝ ΙΙ- ΣΠ- - emodia 15 /17 Παραδοτέο Π2.4

Αναφορές Almuallim H, Dietterich TG. Learning With Many Irrelevant Features. In Procs of the 9 th National Conference on Artificial Intelligence, AAAI Press / The MIT Press Vol. 2, pp. 547 552], 1991. Altman RS. PharmGKB: a logical home for knowledge relating genotype to drug response phenotype. Nature Genetics 39, 426, 2007. Antonakaki D, Kanterakis A, Potamias G. Biomedical Literature Mining for Text Classification and Construction of Gene Networks. Lecture Notes in Artificial Intelligence 3955: 469-473, 2005. Barrett PM, Topol EJ. Pharm- econogenomics: a new appraisal. Clin. Chem. 59:592-594, 2013. Ben- Dov M, Feldman R. Text Mining and Information Extraction. In The Data Mining and Knowledge Discovery Handbook, Springer, 2005. Denny JC, Bastarache L, Ritchie MD, Carroll RJ, Zink R, Mosley JD. Field JR, Pulley JM, Ramirez AH, Bowton E, et al. Systematic comparison of phenome- wide association study of electronic medical record data and genome- wide association study data. Nat. Biotechnol. 31:1102-1110, 2013. Denny JC. Chapter 13: Mining electronic health records in the genomics era. PLoS Comput. Biol. 8:e1002823, 2013. Evans WE, Relling MV. Moving towards individualized medicine with pharmacogenomics. Nature 429(6990), pp. 464 468, 2004. Farmen M, Close S, Koh W. Translation of drug metabolic enzyme and transporter (DMET) genetic variants into star allele notation using SAS. In PharmaSUG, 2009 Conference, Portland, Oregon, May 31 June 3, 2009, Paper PR03-2009, 2009. Fayyad U, Piatetsky- Shapiro G, Smyth P, and Uthurasamy R. Advances in Knowledge Discovery and Data Mining. AAAI Press/ The MIT Press, 1996. Han J, Altman RB, Kumar V, Mannila H, Pregibon D. Emerging Scientific Applications in Data Mining. Communications of the ACM 45:54-58, 2003. Hicks JK, K. R. Crews KR, J. M. Hoffman JM, et al. A clinician- driven automated system for integration of pharmacogenetic interpretations into an electronic medical record. Clin. Pharmacol. Ther. 92(5):563 566, 2012. Lagoumintzis G, Poulas K, Patrinos GP. Genetic databases and their potential in pharmacogenomics. Curr. Pharm. Des., 16(20): 2224 2231, 2010. Lakiotaki K, Patrinos GP, Potamias G. Information Technology meets Pharmacogenomics: Design Specifications of an Integrated Personalized Pharmacogenomics Information System. International Conference on Biomedical and Health Informatics (BHI), 1-4 June 2014, Valencia, Spain. Ma Q, Lu A. Pharmacogenetics, pharmacogenomics, and individualized medicine. Pharmacol. Rev. 63(2):437 459, 2011. Mamitsuka H, DeLisi C, Kanehisa M (Eds.) Data Mining for Systems Biology - Methods and Protocols. Series: Methods in Molecular Biology, Vol. 939. Humana Press, 2013. Mathiak B, Eckstein S. Five Steps to Text Mining in Biomedical Literature. In Procs 2 nd European Workshop on Data Mining and Text Mining in Bioinformatics, Pisa, Italy, pp. 43-46, 2004. McDonagh EM, Thorn CF, Bautista JM, Youngster I, Altman RB, Klein TE. PharmGKB summary: very important pharmacogene information for G6PD. Pharmacogenet Genomics 22(3):219 228, 2013. Potamias G, Koumakis L, Moustakis V. Gene Selection via Discretized Gene- Expression Profiles and Greedy Feature- Elimination. Lecture Notes in Computer Science 3025:256-266, 2004. Potamias G, Lakiotaki G, Katsila T, Lee MTM, Topouzis S, Cooper DN, Patrinos GP. Deciphering next- generation pharmacogenomics: An information technology perspective. Open Biology (accepted, June 2014). Potamias G, May M, Ruping S. Grid- based Knowledge Discovery in Clinico- Genomic Data. Lecture Notes in Bioinformatics 4345:219-230, 2006.. Potamias G., et al. Mining Interesting Clinico Genomic Associations: The HealthObs Approach. In Procs IFIP Int Fed Inf 247:137-145, 2007. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 16 /17 Παραδοτέο Π2.4

Relling M, Johnson J, Roden D, Weinshilboum R, Sadee W, Klein T. Translational Pharmacogenomics Project (TPP) Annual Progress Report March 2012. Relling MV, Klein TE. CPIC: Clinical Pharmacogenetics Implementation Consortium of the Pharmacogenomics Research Network. Clin. Pharmacol. Ther. 89(3):464 467, 2011. Savage N. Bioinformatics: Big data versus the big C. Nature 509: S66- S67, 2014. Schildcrout JS, Denny JC, Bowton E, Gregg W, Pulley JM, Basford MA, Cowan JD, Xu H, Ramirez AH, Crawford DC, et al. Optimizing drug outcomes through pharmacogenetics: a case for preemptive genotyping. Clin. Pharmacol. Ther. 92:235-242, 2012. Sim SC, Ingelman- Sundberg M. The Human Cytochrome P450 (CYP) Allele Nomenclature website: a peer- reviewed database of CYP variants and their associated effects. Hum. Genomics 4(4):278 281, 2010. Sim SC, Kacevska M, Ingelman- Sundberg M. Pharmacogenomics of drug- metabolizing enzymes: a recent update on clinical implications and endogenous effects. Pharmacogenomics J. 1391):1 11, 2013. Sissung TM, English BC, Venzon D, Figg WD, Deeken JF. Clinical pharmacology and pharmacogenetics in a genomics era: the DMET platform. Pharmacogenomics 11(1):89 103, 2010. Squassina A, Manchia M, Manolopoulos VG, Artac M, Lappa- Manakou C, Karkabouna S, Mitropoulos K, Del Zompo M, and Patrinos GP. Realities and expectations of pharmacogenomics and personalized medicine: impact of translating genetic knowledge into clinical practice. Pharmacogenomics 11(8):1149 1167, 2010. Thorisson GA, Muilu J, Brookes AJ. Genotype- phenotype databases: challenges and solutions for the post- genomic era. Nat. Rev. Genet. 10(1):9 18, 2009. Thorn CF, Klein TE, Altman RB. PharmGKB: the pharmacogenetics and pharmacogenomics knowledge base. Methods Mol Biol. 311:179-191, 2005. Valiant L. (1984). A theory of the Learnable. Communications of the ACM 27(11):1134-1142, 1984. Vayena E, Prainsack B. Regulating genomics: time for a broader vision. Sci. Transl. Med. 5:198ed12, 2013. Whirl- Carrillo M, McDonagh EM, Hebert JM, et al. Pharmacogenomics knowledge for personalized medicine. Clin. Pharmacol. Ther. 92(4):414 417, 2012. Zhang Y, Rajapakse JC. Machine Learning in Bioinformatics, Wiley, 2008. ΕΠΑΝ ΙΙ- ΣΠ- - emodia 17 /17 Παραδοτέο Π2.4