Προγνωστικές μέθοδοι με βάση αλληλουχίες DNA

Σχετικά έγγραφα
Πιθανοθεωρητικά µοντέλα αναπαράστασης ακολουθιών

Ζεύγη βάσεων ΓΕΝΕΤΙΚΗ. Γουανίνη Κυτοσίνη. 4α. Λειτουργία γενετικού υλικού. Φωσφοδιεστερικός δεσμός

4 ο ΚΕΦΑΛΑΙΟ. Γ ε ν ε τ ι κ ή

DNA. 2 η Βάση 3 η U C A G

DNA RNA ΝΟΥΚΛΕΙΝΙΚΑ ΟΞΕΑ. Όσα αφορούν τη δομή του DNA δόθηκαν στο κεφάλαιο οργανικές ουσίες

DNA RNA ΝΟΥΚΛΕΙΝΙΚΑ ΟΞΕΑ. Όσα αφορούν τη δομή του DNA δόθηκαν στο κεφάλαιο οργανικές ουσίες

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2010

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΔΙΕΥΘΥΝΣΗ ΑΝΩΤΕΡΗΣ ΚΑΙ ΑΝΩΤΑΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2007

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ' ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΕΞΙ (6)

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

Κεφάλαιο 2ο. Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας

5 -TACATGTCGCGATGCAAGTTCTAATCTCAATA CTT-3 3 -ATGTACAGCGCTACGTTCAAGATTAGAGTTAT GAA-5

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ 2002

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ ΥΠΗΡΕΣΙΑ ΕΞΕΤΑΣΕΩΝ ΠΑΓΚΥΠΡΙΕΣ ΕΞΕΤΑΣΕΙΣ 2018

5 -TACATGTCGCGATGCAAGTTCTAATCTCAATA CTT-3 3 -ATGTACAGCGCTACGTTCAAGATTAGAGTTAT GAA-5

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2014 ÌÅÈÏÄÉÊÏ ÊÏÌÏÔÇÍÇ

07:30 10:30. παιδιά ορρός αντι-α ορρός αντι-β ορρός αντι-d (αντι- Rhesus) 2 εν έγινε συγκόλληση Έγινε συγκόλληση Έγινε συγκόλληση

ΑΣΚΗΣΕΙΣ ΠΡΟΣ ΛΥΣΗ ΚΕΦ. 2ο

ΥΠΟΔΕΙΓΜΑΤΙΚΑ ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΚΕΦ. 2ο

ΘΕΜΑ 1ο Α. Στις ερωτήσεις 1-2, να γράψετε στο τετράδιό σας τον αριθµό της ερώτησης και δίπλα το γράµµα που αντιστοιχεί στη σωστή απάντηση.

ΗΛΙΑΣΚΟΣ ΦΡΟΝΤΙΣΤΗΡΙΑ. Θετικής Κατεύθυνσης Βιολογία Γ Λυκείου ΥΠΗΡΕΣΙΕΣ ΠΑΙΔΕΙΑΣ ΥΨΗΛΟΥ ΕΠΙΠΕΔΟΥ. Επιμέλεια: ΚΩΣΤΑΣ ΓΚΑΤΖΕΛΑΚΗΣ

1. H αλληλουχία ενός μορίου mrna που περιέχει την πληροφορία για τη σύνθεση μιας πολυπεπτιδικής αλυσίδας σε ένα βακτηριακό κύτταρο είναι η εξής:

ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ 5 ο -6 ο Κεφ. ΑΠΑΝΤΗΣΕΙΣ

ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓ. ΒΙΟΛ. ΚΑΤΕΥΘ. 6 Ο ΚΕΦ.

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΓΕΝΕΤΙΚΗΣ

ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ 19 ΙΟΥΝΙΟΥ 2018 ΕΚΦΩΝΗΣΕΙΣ ÊÁÂÁËÁ

Το ώριμο m-rna που προκύπτει μετά την απομάκρυνση του εσωνίου από το πρόδρομο m-rna είναι :

ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΘΕΡΙΝΑ ΗΜΕΡΟΜΗΝΙΑ: 26/01/2014

Supplemental file 3. All 306 mapped IDs collected by IPA program. Supplemental file 6. The functions and main focused genes in each network.

φωσφορική ομάδα Βασική μονάδα: δεοξυριβονουκλεοτίδιο: δεοξυριβόζη + φωσφορικό οξύ + αζωτούχος βάση

Μεθοδολογία Ασκήσεων ΚΕΦ. 2ο

Η νέα προσέγγιση στην ταχεία προγεννητική διάγνωση των χρωµοσωµατικών ανωµαλιών του εµβρύου

Θέματα Πανελλαδικών

Απόφαση. Ο κ. I. Κούσκος, Οικονομικός Υπεύθυνος του Ε.Ι.Π., έχοντας υπ όψιν : Αποφασίζει. Ο Οικονομικός Υπεύθυνος του Ε.Ι.Π.

Θέματα Πανελλαδικών

Supplementary Table 1. Primers used for RT-qPCR analysis of striatal and nigral tissue.

ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ

ΘΕΜΑ Α

Θέματα Πανελλαδικών

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2018 Β ΦΑΣΗ ΣΥΝΕΙΡΜΟΣ

Υποδειγματική Απάντηση

ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ)

BIOΛΟΓΙΑ ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ

ΑΠΑΝΤΗΣΕΙΣ. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:

ΑΠΑΝΤΗΣΕΙΣ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ. Θέμα A A1: β A2: β A3: γ A4: β A5: α. Θέμα Β Β1.

J. Dairy Sci. 93: doi: /jds American Dairy Science Association, 2010.

ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ 19/06/2018 ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ

Προτεινόμενα θέματα 2014

Βιολογία Προσανατολισμού. ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Θέμα Α: Α1.β, Α2.δ, Α3.γ, Α4.β, Α5.α

ΑΣΚΗΣΕΙΣ ΣΤΟ ΔΕΥΤΕΡΟ ΚΕΦΑΛΑΙΟ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2013

4. σε μια θέση έναρξης αντιγραφής η σύνθεση στη μια αλυσίδα είναι συνεχής, όπως φαίνεται και στο παρακάτω σχήμα T C C Α Α Τ A T T A A G G

Απαντήσεις διαγωνίσματος Κεφ. 6 ο : Μεταλλάξεις

Προτεινόμενες λύσεις ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΠΑΡΑΣΚΕΥΗ 27 ΜΑΪΟΥ 2016

Θέµατα Βιολογίας Θετικής Κατεύθυνσης Γ Λυκείου 2000

Κριτήριο Αξιολόγησης Βιολογίας. Γ Λυκείου. Θετικής Κατεύθυνσης

Θέµατα Βιολογίας Θετικής Κατεύθυνσης Γ Λυκείου 2000

ΑΠΑΝΤΗΣΕΙΣ. Α. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:

ΘΕΜΑ Α Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:

Γ' ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΒΙΟΛΟΓΙΑ ΑΠΑΝΤΗΣΕΙΣ ÏÅÖÅ

ΒΙΟΛΟΓΙΑ ΟΜΑΔΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

Βιολογία Κατεύθυνσης Γ Λυκείου Διαγώνισμα στο Κεφάλαιο 4 ο

Βιολογία Προσανατολισμού

ΘΕΜΑΤΑ ΠΑΝΕΛΛΗΝΙΩΝ ΕΞΕΤΑΣΕΩΝ ΣΤΗΝ ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ 2000 ΗΜΕΡΗΣΙΟ. Ζήτηµα 4ο

Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2013

ÈÅÌÅËÉÏ ÅËÅÕÓÉÍÁ ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ 1ο. 1. α 2. δ 3. β 4. β 5. α. ΘΕΜΑ 2ο

ΔΙΑΦΟΡΕΣ ΑΣΚΗΣΕΙΣ ΣΤΟ 6 ΚΕΦΑΛΑΙΟ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ηµεροµηνία: Παρασκευή 25 Απριλίου 2014 ιάρκεια Εξέτασης: 3 ώρες ΑΠΑΝΤΗΣΕΙΣ

Δύο συμπεράσματα που μπορούν να εξαχθούν είναι το φύλο του οργανισμού και η ύπαρξη δομικών ή αριθμητικών χρωμοσωμικών ανωμαλιών.

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ 1ο 1. γ 2. γ 3. β 4. α 5. δ

1 Ο ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΗΡΑΚΛΕΙΟΥ - ΚΑΠΕΤΑΝΑΚΕΙΟ ΘΕΜΑΤΑ ΠΑΝΕΛΛΗΝΙΩΝ ΕΞΕΤΑΣΕΩΝ ΣΤΟ 2 Ο ΚΕΦΑΛΑΙΟ (ΑΝΤΙΓΡΑΦΗ, ΕΚΦΡΑΣΗ ΚΑΙ ΡΥΘΜΙΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ)

ΕΞΕΤΑΣΤΕΑ ΥΛΗ για τη ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

Βιολογία Προσανατολισμού

Το πλεονέκτημα της χρήσης του DNA των φάγων λ, ως φορέα κλωνοποίησης είναι ότι μπορούμε να ενσωματώσουμε σε αυτόν μεγαλύτερα κομμάτια DNA.

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ

Θέματα Πανελλαδικών

8. Σε στέλεχος του βακτηρίου E.coli δε λειτουργεί το γονίδιο που παράγει τον καταστολέα του οπερόνιου της λακτόζης. Ποιο είναι το αποτέλεσμα σε σχέση

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΚΕΦΑΛΑΙΟ 6 - ΜΕΤΑΛΛΑΞΕΙΣ ΑΣΚΗΣΕΙΣ

ΘΕΜΑ 1 Ο ΜΑΘΗΜΑ / ΤΑΞΗ : ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΘΕΡΙΝΑ ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ/ Γ ΛΥΚΕΙΟΥ ΗΜΕΡΟΜΗΝΙΑ: 27 /9/2015

Γ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

ΑΠΑΝΤΗΣΕΙΣ. Β.2 Σελίδα 24 σχ. βιβλίο. «Κάθε φυσιολογικό μεταφασικό καρυότυπο.» και «Ο αριθμός και η μορφολογία ζεύγος ΧΧ.»

Α. Στις ερωτήσεις 1-3, να γράψετε στο τετράδιό σας τον αριθµό της ερώτησης και δίπλα το γράµµα που αντιστοιχεί στη σωστή απάντηση.

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ

ΒΙΟΛΟΓΙΑ ΟΜΑΔΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ

Bιολογία προσανατολισμού

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΤΑΞΗ

Σας αποστέλλουμε τις προτεινόμενες απαντήσεις που αφορούν τα θέματα της Βιολογίας Θετικής Κατεύθυνσης των Εσπερινών Γενικών Λυκείων.

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΚΕΦΑΛΑΙΟ 6 - ΜΕΤΑΛΛΑΞΕΙΣ ΑΣΚΗΣΕΙΣ

ΦΡΟΝΤΙΣΤΗΡΙΟ ΓΝΩΣΗ. ΘΕΜΑΤΑ ΠΡΟΣΟΜΟΙΩΣΗΣ ΠΑΝΕΛΛΑΔΙΚΩΝ ΕΞΕΤΑΣΕΩΝ 15 Μαΐου 2017 Γ ΤΑΞΗΣ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΟΜΑΔΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ

ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ 2016

Να αιτιολογήσετε την επιλογή σας. Μονάδες 3

Βιολογία Προσανατολισμού Θετικών Σπουδών. Ενδεικτικές απαντήσεις θεμάτων

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

ΑΣΚΗΣΕΙΣ ΠΡΟΣ ΛΥΣΗ ΚΕΦ 6ο

Transcript:

Προγνωστικές μέθοδοι με βάση αλληλουχίες DNA Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus

ΣΥΝΟΨΗ Εισαγωγή Αλυσίδες Markov και αλληλουχίες DNA Μέτρα κωδικοποίησης αλληλουχιών DNA Πρόβλεψη δομής (ευκαρυωτικών) γονιδίων Συζήτηση..

Εισαγωγή (χωρίς πολλά λόγια)? #@!$%@$!#%

Εισαγωγή (χωρίς πολλά λόγια) # => E $ => I @ => L % => S! => V ELVISLIVES..ATCTATGCAGTCATGCTGACGAGCAGCTGACTGACGTACGTACGATCGATCG..?

Πρόβλεψη χαρακτηριστικών από αλληλουχίες DNA CpG islands Κωδικές περιοχές Δομή γονιδίων Υποκινητές... Συχνά απαιτείται να κατασκευάσουμε ΜΟΝΤΕΛΑ για τις αλληλουχίες που μας ενδιαφέρουν

(Στοχαστικά) Μοντέλα Μοντέλο? Ένα σύστημα που προσομοιάζει ένα (πραγματικό) αντικείμενο Στοχαστικό? οι διαφορετικές καταστάσεις του μοντέλου προκύπτουν με διαφορετική πιθανότητα

Στοχαστικά Μοντέλα Ένα παράδειγμα [από Durbin et al, 1998]

Στοχαστικά Μοντέλα Ένα Βιολογικό παράδειγμα...atacgag...

Αλυσίδες Markov Markov Chain, models/processes Ορισμός: Μια στοχαστική διεργασία κατά την οποία η πιθανότητα παρατήρησης μιας κατάστασης τη χρονική στιγμή t εξαρτάται από πεπερασμένο πλήθος (k) προηγούμενων παρατηρήσεων k: τάξη (order) της διεργασίας Όταν δεν αναφέρεται η τάξη υπονοούμε ότι k=1

Αλυσίδες Markov Markov Chains [από Durbin et al, 1998]

Βιολογικές ακολουθίες και Αλυσίδες Markov [από Durbin et al, 1998]

Ποια η πιθανότητα μιας ακολουθίας δοθέντος του μοντέλου? [από Durbin et al, 1998]

Καταστάσεις Έναρξης/Λήξης [από Durbin et al, 1998] Σιωπηλές καταστάσεις

Αλυσίδες Markov για διάκριση Εφαρμογή CpG-island prediction [από Durbin et al, 1998] Δημιουργία μοντέλων που περιγράφουν 2 αλληλοαποκλειόμενες κατηγορίες ακολουθιών Άγνωστη ακολουθία Εύρεση της πιθανότητας σύμφωνα με κάθε μοντέλο Εύρεση του log-odds ratio

Δημιουργία μοντέλων [από Durbin et al, 1998] Positive examples (CpG islands) Negative examples (non-cpg islands)

Διάκριση... [από Durbin et al, 1998]

Μέτρα κωδικοποίησης Coding statistics Μέτρο κωδικοποίησης ορίζεται μια συνάρτηση η οποία με δεδομένη μια αλληλουχία DNA υπολογίζει έναν πραγματικό αριθμό, ο οποίος σχετίζεται με την πιθανοφάνεια αυτή η αλληλουχία να κωδικοποιεί μια πρωτεΐνη Οι συναρτήσεις αυτές είναι εν γένει αυθαίρετες, π.χ.: Codon usage bias Positional (within codons) base composition bias Periodicities

Κατηγοριοποίηση Μέτρων Κωδικοποίησης Ανεξάρτητα μοντέλου Αποτυπώνουν γενικά χαρακτηριστικά του κωδικού DNA Δεν απαιτούν παραμετροποίηση - εκπαίδευση Βασισμένα σε μοντέλο του κωδικού DNA Στοχαστικό μοντέλο Υπολογισμός πιθανότητας κωδικοποίησης από μια αλληλουχία δεδομένου του μοντέλου κωδικών αλληλουχιών Σύγκριση με την πιθανότητα ενός τυχαίου μοντέλου Συνήθης δείκτης ο λογάριθμος του λόγου πιθανοφανειών Απαιτούν την εκπαίδευση (εκτίμηση παραμέτρων)

Μέτρα βασισμένα σε μοντελοποίηση κωδικού DNA Πλεονεκτήματα Αποτυπώνουν εξειδικευμένα χαρακτηριστικά Εξαρτώνται από πλήθος παραμέτρων Αυξημένες δυνατότητες Μειονεκτήματα Απαιτούν αντιπροσωπευτικό δείγμα κωδικών αλληλουχιών από κάθε οργανισμό Το μέγεθος - σύσταση του δείγματος ανάλογο του πλήθους των παραμέτρων

Παράδειγμα: codon usage 0.030759 -- [ 0] AAA 0.020932 -- [ 1] AAC 0.032765 -- [ 2] AAG 0.022274 -- [ 3] AAU 0.015655 -- [ 4] ACA 0.010364 -- [ 5] ACC 0.007708 -- [ 6] ACG 0.017626 -- [ 7] ACU 0.018855 -- [ 8] AGA 0.011281 -- [ 9] AGC 0.010937 -- [10] AGG 0.013962 -- [11] AGU 0.012527 -- [12] AUA 0.018588 -- [13] AUC 0.024427 -- [14] AUG 0.021581 -- [15] AUU 0.019338 -- [16] CAA 0.008693 -- [17] CAC 0.015213 -- [18] CAG 0.013720 -- [19] CAU 0.016158 -- [20] CCA 0.005316 -- [21] CCC 0.008576 -- [22] CCG 0.018707 -- [23] CCU 0.006262 -- [24] CGA 0.003765 -- [25] CGC 0.004827 -- [26] CGG 0.009007 -- [27] CGU 0.009861 -- [28] CUA 0.016086 -- [29] CUC 0.009840 -- [30] CUG 0.024165 -- [31] CUU 0.034321 -- [32] GAA 0.017247 -- [33] GAC 0.032298 -- [34] GAG 0.036727 -- [35] GAU 0.017533 -- [36] GCA 0.010396 -- [37] GCC 0.008973 -- [38] GCG 0.028530 -- [39] GCU 0.024278 -- [40] GGA 0.009177 -- [41] GGC 0.010223 -- [42] GGG 0.022375 -- [43] GGU 0.009928 -- [44] GUA 0.012805 -- [45] GUC 0.017400 -- [46] GUG 0.027350 -- [47] GUU 0.000915 -- [48] UAA 0.013830 -- [49] UAC 0.000509 -- [50] UAG 0.014682 -- [51] UAU 0.018124 -- [52] UCA 0.011123 -- [53] UCC 0.009221 -- [54] UCG 0.025087 -- [55] UCU 0.001092 -- [56] UGA 0.007089 -- [57] UGC 0.012469 -- [58] UGG 0.010462 -- [59] UGU 0.012630 -- [60] UUA 0.020723 -- [61] UUC 0.020865 -- [62] UUG 0.021847 -- [63] UUU arab.codon.use Codon usage for Arabidopsis thaliana: 66749 from GB142/gbpln.spsum: 26545376 codons http://bioinformatics.weizmann.ac.il/blocks/help/codehop/codons/arab.codon.use

Παράδειγμα: codon usage Συγκρίνουμε τη συχνότητα εμφάνισης τριπλετών σε μια περιοχή του γονιδιώματος σε κάθε ένα από τα πλαίσια ανάγνωσης με την τυπική συχνότητα... Περιοχές για τις οποίες οι τριπλέτες χρησιμοποιούνται με παρόμοιες με τις τυπικές συχνότητες είναι πιθανότερο να αντιστοιχούν σε κωδικές περιοχές Ας το δούμε με ένα παράδειγμα...

Έστω το τμήμα αλληλουχίας S=AAGAAA του Arabidopsis thaliana P1 = P(S κωδική μοντέλο codon usage) = F(AAG) x F(AAA) 0.033 x 0.031 0.001 0.030759 -- [ 0] AAA 0.020932 -- [ 1] AAC 0.032765 -- [ 2] AAG 0.022274 -- [ 3] AAU 0.015655 -- [ 4] ACA 0.010364 -- [ 5] ACC 0.007708 -- [ 6] ACG 0.017626 -- [ 7] ACU 0.018855 -- [ 8] AGA 0.011281 -- [ 9] AGC 0.010937 -- [10] AGG 0.013962 -- [11] AGU 0.012527 -- [12] AUA 0.018588 -- [13] AUC...... Τυχαίο μοντέλο: όλα τα κωδικόνια ισοπίθανα (1/64=0.0156) P0 = P(S μη κωδική τυχαίο μοντέλο) = 0.0156 x 0.0156 = 0.000244 log( P1 / P2 ) > 0 Η ίδια διαδικασία πρέπει να ακολουθηθεί για ΟΛΑ τα πλαίσια ανάγνωσης

Μέτρα ανεξάρτητα μοντέλου Δε βασιζόμαστε σε κάποιο a priori στοχαστικό μοντέλο των κωδικών περιοχών Χρήσιμα για οργανισμούς για τα γονίδια των οποίων δεν έχουμε αρκετά δεδομένα Μια γενική παραδοχή είναι ότι οι κωδικές περιοχές χαρακτηρίζονται από μικρότερη τυχαιότητα Η παρέκκλιση από την τυχαιότητα είναι υποδεικνύει κωδικές περιοχές Εμπειρικά μέτρα

Παράδειγμα: Περιοδικές συσχετίσεις Κωδικές Περιοχές Συσχετίσεις τοπικής εμβέλειας Η τρίτη βάση επηρεάζει λιγότερο το αμινοξικό κατάλοιπο Μη κωδικές περιοχές Δεν παρουσιάζεται κάποιο γενικό μοτίβο (Tsonis AA, Elsner JB, Tsonis PA., 1991) Διαδεδομένες Μη κωδικές επαναλήψεις (SINES, LINES) FFT Αποδοτικός εντοπισμός περιοδικοτήτων για σχετικά μεγάλα μήκη ακολουθιών DNA

Περιοδικότητες σε κωδικές περιοχές Η ΙΔΑΝΙΚΗ ΠΕΡΙΠΤΩΣΗ ΚΑΘΑΡΗ ΠΕΡΙΟΔΙΚΟΤΗΤΑ Τ=0.33, f=3 ΣΤΗΝ ΠΡΑΞΗ ΤΟ ΦΑΣΜΑ ΠΕΡΙΕΧΕΙ ΟΛΕΣ ΤΙΣ ΣΥΧΝΟΤΗΤΕΣ

Συζήτηση... Διδακτικό υλικό: http://troodos.biol.ucy.ac.cy/brl/courses//index.html