Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης

Σχετικά έγγραφα
Πιθανοθεωρητικά µοντέλα αναπαράστασης ακολουθιών

Θέματα Συστημάτων Πολυμέσων

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Προγνωστικές μέθοδοι με βάση αλληλουχίες DNA

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Πανεπιστήμιο Πατρών Τμήμα Φυσικής Εργαστήριο Ηλεκτρονικής. Ψηφιακά Ηλεκτρονικά. Αριθμητικά Συστήματα. Επιμέλεια Διαφανειών: Δ.

Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βασικές Έννοιες Προγραμματισμού. Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Ψηφιακή Επεξεργασία Σήματος

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Συστήματα συντεταγμένων

Χρήση εναλλακτικών μετρικών για την αποτίμηση της διάδοσης της έρευνας σε επιστημονικά συνέδρια

Πληροφοριακά Συστήματα Διοίκησης

Σύστημα ψηφιακής επεξεργασίας ακουστικών σημάτων με χρήση προγραμματιζόμενων διατάξεων πυλών. Πτυχιακή Εργασία. Φοιτητής: ΤΣΟΥΛΑΣ ΧΡΗΣΤΟΣ

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα.

Συγκριτική Γονιδιωματική

Συμπίεση Δεδομένων

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

3-Φεβ-2009 ΗΜΥ Σήματα

Όνομα μαθήτριας: Πρίφτη Ευαγγελία-Δάφνη Σχολείο: Πρότυπο ΓΕ.Λ Βαρβακείου Σχολής Επιβλέπων καθηγητής: Λυγάτσικας Ζήνων

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Εισαγωγή στα Σήματα. Κυριακίδης Ιωάννης 2011

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

Αναπαράσταση Δεδομένων (2 ο μέρος) ΜΥΥ-106 Εισαγωγή στους Η/Υ και στην Πληροφορική

ΠΛΗ 21 - Τι είναι Ψηφιακό Σύστημα

Εισαγωγή στους Η/Υ. Γιώργος Δημητρίου. Μάθημα 7 και 8: Αναπαραστάσεις. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής

Ψηφιακή Επεξεργασία Εικόνας

Σήματα και Συστήματα ΙΙ

IEEE INFOCOM 2009 IEEE Conference on Computer Communications

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Περιεχόμενα. Περιεχόμενα

1. ΕΙΣΑΓΩΓΗ ΣΤΟ MATLAB... 13

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Δομές Δεδομένων και Αλγόριθμοι

Είδη Μεταβλητών. κλίµακα µέτρησης

ΚΕΦΑΛΑΙΟ. 1. α. Tι ονοµάζεται συνάρτηση από το σύνολο Α στο σύνολο Β; β. Tι ονοµάζεται πραγµατική συνάρτηση πραγµατικής µεταβλητής;

ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΕΥΝΑΣ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Κωδικοποίηση εικόνων κατά JPEG

Βιοπληροφορική και Πολυµέσα. Ειρήνη Αυδίκου Αθήνα

Μορφές των χωρικών δεδομένων

Δομές Δεδομένων & Αλγόριθμοι

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

ΠΛΗ21 Κεφάλαιο 2. ΠΛΗ21 Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 2 Δυαδική Κωδικοποίηση

Μαθηµατικά για Πληροφορική

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΕΡΓΑΣΤΗΡΙΟ ΜΙΚΡΟΫΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ : Κ. ΠΕΚΜΕΣΤΖΗ

Γενικό πλάνο. Μαθηµατικά για Πληροφορική. Εισαγωγή. Υπολογιστική Αλγεβρα. Μάθηµα 7

Συμπίεση Δεδομένων

Εισαγωγή στον Προγραμματισμό

Συμπίεση Δεδομένων

Ευρυζωνικά δίκτυα (2) Αγγελική Αλεξίου

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

ΤΟΜΟΣ Α : Συμβολικός Προγραμματισμός

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

Elements of Information Theory

LALING/PLALING :

ΚΕΦΑΛΑΙΟ 2: Τύποι δεδομένων και εμφάνιση στοιχείων...33

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Θέματα Διπλωματικών Εργασιών

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Πρόλογος 1. 1 Μαθηµατικό υπόβαθρο 9

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές. 5 ο Μάθημα. Λεωνίδας Αλεξόπουλος Λέκτορας ΕΜΠ. url:

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Κ15 Ψηφιακή Λογική Σχεδίαση 2: Δυαδικό Σύστημα / Αναπαραστάσεις

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΚΕΦΑΛΑΙΟ ΟΙ ΥΠΟΛΟΓΙΣΤΕΣ ΑΠΟ ΤΗΝ ΑΡΧΑΙΟΤΗΤΑ ΜΕΧΡΙ ΣΗΜΕΡΑ Ιστορική αναδρομή Υπολογιστικές μηχανές

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Πρόλογος. Πρόλογος 13. Πώς χρησιμοποείται αυτό το βιβλίο 17

ΚΑΤΑΝΟΜΗ ΜΑΘΗΜΑΤΩΝ ΣΤΑ ΕΞΑΜΗΝΑ

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος...9 ΚΕΦ. 1. ΑΡΙΘΜΗΤΙΚΑ ΣΥΣΤΗΜΑΤΑ - ΚΩΔΙΚΕΣ

Συστήματα Επικοινωνιών

Ερευνητική υπόθεση. Η ερευνητική υπόθεση αναφέρεται σε μια συγκεκριμένη πρόβλεψη σχετικά με τη σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές.

1 η Θεµατική Ενότητα : Δυαδικά Συστήµατα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΛΟΓΙΑ

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Ψηφιακοί Υπολογιστές

Συμπίεση Δεδομένων Δοκιμής (Test Data Compression) Νικολός Δημήτριος, Τμήμα Μηχ. Ηλεκτρονικών Υπολογιστών & Πληροφορικής, Παν Πατρών

Επικοινωνιών στην Εκπαίδευση. Τεχνολογίες Πληροφορίας & (ΤΠΕ-Ε)

ΠΕΡΙΕΧΟΜΕΝΑ Υλικό και Λογισμικό Αρχιτεκτονική Υπολογιστών Δομή, Οργάνωση και Λειτουργία Υπολογιστών 6

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Ανάκτηση πολυμεσικού περιεχομένου

Προσομοίωση Μοντέλων Επιχειρησιακών Διαδικασιών

ΦΥΛΟΓΕΝΕΤΙΚ Α ΔΕΝΤΡΑ

Αριθμητική Κινητής Υποδιαστολής Πρόσθεση Αριθμών Κινητής Υποδιαστολής

Περιεχόμενα Πρόλογος 5ης αναθεωρημένης έκδοσης ΚΕΦΆΛΆΙΟ 1 Ο ρόλος της επιχειρησιακής έρευνας στη λήψη αποφάσεων ΚΕΦΆΛΆΙΟ 2.

ΠΛΗΡΟΦΟΡΙΚΗ Ι Ενότητα 8: Συστήματα αρίθμησης

6 Φεβρουαρίου 2016, Λεμεσός

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Transcript:

Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης ΠΜΣ Βιοπληροφορικής Μαρίνα-Αγάπη Αθανασούλη Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών ΕΚΕΦΕ Δημόκριτος

Σκοπός Σύντομη παρουσίαση διαφορετικών αναπαραστάσεων γονιδιωματικών ακολουθιών Αξιολόγηση των συγκεκριμένων αναπαραστάσεων όσον αφορά τη χρήση τους για την ταξινόμηση ακολουθιών DNA Εύρεση και ταξινόμηση CNE s (Conserved Non-Expressed regions) εντός και μεταξύ συγκεκριμένων ειδών σε συνέχεια του Polychronopoulos et al., 2014 1

Ερευνητικό ενδιαφέρον Ανάλυση DNA ακολουθιών με επεξεργασία ψηφιακού σήματος (Digital Signal Processing) Απαραίτητη η εύρεση και χρήση τρόπων αναπαράστασης των ακολουθιών υψηλής ακρίβειας Πληθώρα αναπαραστάσεων επιλογή κατάλληλης, ανάλογα με τον πειραματικό σκοπό Βασική απαίτηση: η απεικόνιση των βιολογικών ιδιοτήτων των ακολουθιών και η αποφυγή μαθηματικών συσχετίσεων που δεν υφίστανται 2

Είδη αναπαραστάσεων 1. Αριθμητικές: μετατροπή της γονιδιωματικής (συμβολικής) ακολουθίας σε αριθμητική Δύο υποκατηγορίες: Σταθερές τιμές: μετατροπή σε σειρά αυθαίρετων αριθμητικών ακολουθιών Βάσει φυσικοχημικών ιδιοτήτων 2. Γραφικές 3. Στατιστικά μοντέλα 4. Μαρκοβιανά μοντέλα 3

Αριθμητικές αναπαραστάσεις

Fixed-mapping values(1) Voss, 1992: Αναπαράσταση Voss, όπου S n = CGAT Silverman & Linker, 1986 και Cristea, 2002: Τετράεδρο 4

Fixed-mapping values(2) Cristea, 2002: Complex, S n = CGAT Cristea, 2002: Integer Chakravarthy et al., 2004: Real Number 5

Physico-Chemical properties Achuthsankar & Sreenadhan, 2006: Electron-Ion Interaction potential (ΕΙΙΡ), S n = CGAT Holden et al., 2007:Atomic Number Akhtar et al., 2007: Paired Numeric 6

Γραφικές Αναπαραστάσεις

Graphical(1) Hamori & Rushkin, 1983: H-curve, πρώτη 3D αναπαράσταση για DNA ακολουθίες Zhang & Zhang, 1994: Z-curve Nandy et al., 1994:, S n = CGAT 2D αναπαράσταση βασισμένη στην H-curve Ανάθεση των πουρινών στον άξονα x και των πυριμιδινών στον άξονα y Randic et al. 3D (2000) και 2D (2003) αναπαράσταση Εναλλακτική προσέγγιση: αριθμητικός χαρακτηρισμός του DNA 7

Graphical(2) 3-D αναπαραστάσεις 1. Qi & Fan, 2007: PN-curve Χαρτογράφηση βάσει ζευγών νουκλεοτιδίων π.χ. εάν g i g i+1 = AA(g i g i+1 ) = (1, (AA) i, i) κ.ο.κ 2. Yu et al., 2009: TN-curve Αναπαράσταση τρινουκλεοτιδίων με σετ συντεταγμένων (x,y) και χαρτογράφηση ακολουθίας S: (S) = (s 1 s 2 s 3 )...(s i s i+1 s i+2 ), όπου (s i s i+1 s i+2 ) = {(x i, y i, i)} 4-D αναπαραστάσεις 1. Tang et al., 2009: Βασισμένη στη Z-curve 2. Tan et al., 2014: Βασισμένη στην 2-D αναπαράσταση που πρότεινε ο Randic 8

Graphical(3) Jeffrey, 1990: Αναπαράσταση παιγνίου χάους (Chaos Game Representation) Deschavanne et al., 1999: Χρήση ως γονιδιωματικές υπογραφές Karamichalis, 2016: Προσθετικές γονιδιωματικές υπογραφές Qi et al., 2011: Κωδικοποίηση Huffman Figure 1: (a) Κόμβοι-φύλλα του δυαδικού δένδρου. (b) Δημιουργία του δένδρου Figure 2: Μοναδιαία διανύσματα για τα bits 9

Στατιστικά μοντέλα

Στατιστικά μοντέλα Aires-de-Sousa & Aires-de-Sousa, 2003: Virtual Potentials Εικονικό δυναμικό μιας βάσης: VP XY = 1 d XY Αναπαράσταση DNA ακολουθιών με το ιστόγραμμα των εικονικών δυναμικών (SEQPREP) O Neill & Erill, 2016: Κατανομές Maximum Entropy και Truncated Uniform Κατασκευή κατανομών βάσει του Information Content συγκεκριμένων μοτίβων 10

Μαρκοβιανά μοντέλα

Markov Models Liu et al., 2007: Χρήση Μαρκοβιανών μοντέλων ανώτερης τάξης και μεταβλητής τάξης Μαρκοβιανό μοντέλο ανώτερης τάξης: με minimum description length και Akaike s Information Criterion Μαρκοβιανό μοντέλο μεταβλητής τάξης: με δέντρο πιθανοτήτων (Probability Suffix Tree) Pinho et al., 2011: Χρήση πολλαπλών ανταγωνιστικών πεπερασμένων Μαρκοβιανών μοντέλων Ανταγωνιστικά μοντέλα διαφορετικών τάξεων επικράτηση του καλύτερου 11

Λόγοι επιλογής Αντιπροσωπευτικό δείγμα από διαφορετικούς τύπους αναπαραστάσεων Σύγκριση των διαφορετικών προσεγγίσεων που χρησιμοποιούν Αξιολόγηση της απόδοσης τους στους ερευνητικούς σκοπούς που χρησιμοποιούνται συνήθως 12

Βιβλιογραφία Akhtar, M., Epps, J., and Ambikairajah, E. (2007). On DNA Numerical Representations for Period-3 Based Exon Prediction. In 2007 IEEE International Workshop on Genomic Signal Processing and Statistics, pages 1 4. Kwan, H. K. and Arniker, S. B. (2009). Numerical representation of DNA sequences. In 2009 IEEE International Conference on Electro/Information Technology, pages 307 310. Mendizabal-Ruiz, G., Roman-Godinez, I., Torres-Ramos, S., Salido-Ruiz, R. A., and Morales, J. A. (2017). On DNA numerical representations for genomic similarity computation. [Kwan and Arniker, 2009] [Akhtar et al., 2007] [Mendizabal-Ruiz et al., 2017] 13

Questions? 13