Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών

Σχετικά έγγραφα
Αλληλουχίες βιολογικών µακροµορίων Δοµή, λειτουργία, εξέλιξη

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

Ασυμπτωτικός Συμβολισμός

Υπολογιστική Πολυπλοκότητα

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Ασυμπτωτικός Συμβολισμός

Ασυμπτωτικός Συμβολισμός

Ασυμπτωτικός Συμβολισμός

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Συγκριτική Γονιδιωματική

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch

Αλγοριθμικές Τεχνικές. Brute Force. Διαίρει και Βασίλευε. Παράδειγμα MergeSort. Παράδειγμα. Τεχνικές Σχεδιασμού Αλγορίθμων

Αλγοριθμικές Τεχνικές

Εισαγωγή στους Αλγόριθμους. Παύλος Εφραιμίδης, Λέκτορας

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Δομές Δεδομένων (Data Structures)

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

LALING/PLALING :

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Εισαγωγή στους Αλγόριθµους. Αλγόριθµοι. Ιστορικά Στοιχεία. Ο πρώτος Αλγόριθµος. Παραδείγµατα Αλγορίθµων. Τι είναι Αλγόριθµος

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

Αλγόριθµοι. Παράδειγµα. ιαίρει και Βασίλευε. Παράδειγµα MergeSort. Τεχνικές Σχεδιασµού Αλγορίθµων

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου

Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΦΡΟΝΤΙΣΤΗΡΙΟ ΑΛΓΟΡΙΘΜΩΝ ΒΟΗΘΟΣ: ΒΑΓΓΕΛΗΣ ΔΟΥΡΟΣ

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Ορθότητα Χωρική αποδοτικότητα. Βελτιστότητα. Θεωρητική ανάλυση Εμπειρική ανάλυση. Αλγόριθμοι - Τμήμα Πληροφορικής ΑΠΘ -4ο εξάμηνο 1

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 18: Χρονική και Χωρική Πολυπλοκότητα

Κεφάλαιο 5 Ανάλυση Αλγορίθμων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Διακριτά Μαθηματικά [Rosen, κεφ. 3] Γιάννης Εμίρης Τμήμα Πληροφορικής & Τηλεπικοινωνιών, ΕΚΠΑ Οκτώβριος 2018

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

Αλγόριθμοι και Πολυπλοκότητα

Μοντελοποίηση προβληµάτων

Πρόλογος. Πρόλογος 13. Πώς χρησιμοποείται αυτό το βιβλίο 17

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Αλγόριθµοι και Πολυπλοκότητα

Για τις λύσεις των προβλημάτων υπάρχει τρόπος εκτίμησης της επίδοσης (performance) και της αποδοτικότητας (efficiency). Ερωτήματα για την επίδοση

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Σηµειώσεις Βιοπληροφορικής

Δομές Δεδομένων και Αλγόριθμοι

Υπολογιστικό Πρόβληµα

Περιεχόμενα. Εισαγωγή του επιμελητή, Γιάννης Σταματίου 15 Πρόλογος 17 Εισαγωγή 23. Μέρος I. ΕΠΑΝΑΛΗΠΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΚΑΙ ΑΝΑΛΛΟΙΩΤΕΣ ΣΥΝΘΗΚΕΣ

Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420)

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ιακριτές Μέθοδοι για την Επιστήμη των Υπολογιστών

εισαγωγικές έννοιες Παύλος Εφραιμίδης Δομές Δεδομένων και

ο ρόλος των αλγορίθμων στις υπολογιστικές διαδικασίες Παύλος Εφραιμίδης Δομές Δεδομένων και Αλγόριθμοι

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Κεφάλαιο 2. Βασικά στοιχεία ανάλυσης αλγορίθμων. Χρησιμοποιήθηκε υλικό από τις αγγλικές διαφάνειες του Kevin Wayne.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Δομές Δεδομένων & Αλγόριθμοι

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

περιεχόμενα υπολογιστικό πρόβλημα αλγόριθμοι παράδειγμα ταξινόμησης ταξινόμηση αλγόριθμοι τεχνολογία αλγορίθμων Παύλος Εφραιμίδης

Ειδικά Θέματα Βιοπληροφορικής

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Δομές Δεδομένων Ενότητα 2

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Δομές Δεδομένων και Αλγόριθμοι

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΓΕ0170 -Αλγόριθμοι και Προηγμένες Προγραμματικές Τεχνικές. Εισαγωγή. Νίκος Αθανάσης.

Δομές Δεδομένων (Data Structures)

οµές εδοµένων 3 ο Εξάµηνο Τµήµα Πανεπιστήµιο Πληροφορικής Ιωαννίνων ΟΜΕΣ Ε ΟΜΕΝΩΝ

ρυθιμός αύξησης συναρτήσεων

Transcript:

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος Ι: Στοιχίσεις ακολουθιών κατά ζεύγη Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678, Λευκωσία ΚΥΠΡΟΣ τηλ: 00357-22892879 (εσωτ. 2879) email: vprobon@ucy.ac.cy, vprobon@biol.uoa.gr

Σύνοψη Αλγόριθμοι Βασικοί Ορισμοί Στοιχεία Ανάλυσης Αλγοριθμικής Πολυπλοκότητας Σύγκριση ή Στοίχιση Ακολουθιών? Dot Matrix Plots Μέθοδοι Δυναμικού Προγραμματισμού Τοπικές Στοιχίσεις Ολικές Στοιχίσεις Πιάσε μια απ'όλα Συζήτηση

Αλγόριθμοι Ορισμός: Αλγόριθμος είναι μια καλά προσδιορισμένη διαδικασία για την επίλυση μιας κλάσης προβλημάτων: Συγκεκριμένα δεδομένα εισόδου Πεπερασμένο πλήθος βημάτων Επίλυση Προβλήματος Χαρακτηριστικά Αλγορίθμων Ορθότητα Αποδοτικότητα

Αλγόριθμοι ΙΙ Μας ενδιαφέρουν οι ΟΡΘΟΙ αλγόριθμοι [πάντα???] Αξιολόγηση της Αποδοτικότητας Πρακτική Εφαρμογή Ασυμπτωτική Συμπεριφορά συναρτήσει του μεγέθους των δεδομένων εισόδου

Ασυμπτωτική Συμπεριφορά Αναφέρεται σε οποιαδήποτε συνάρτηση Ιδιαίτερο ενδιαφέρον: Χαρακτηριστικά εκτέλεσης (Χρόνος, Μνήμη, κλπ) ως συνάρτηση του μεγέθους n του προβλήματος Ασυμπτωτικά <=> Μεγάλο n Ο(g(n)), Ω(g(n)), Θ(g(n)) f(n)=ο(n) linear f(n)=ο(n 2 ) quadratic f(n)=ο(log(n)) logarithmic f(n)=ο(c n ) exponential από Cormen et. al

Σύγκριση; Για ποιο λόγο; Πώς; Ήταν πάντα trendy Ο τρόπος με τον οποίο θα εφαρμοσθεί εξαρτάται από: Τύπο/Πλήθος δεδομένων Ερώτημα (?) Στηριζόμαστε στο γεγονός ότι: ΟΜΟΙΟΤΗΤΑ ΑΚΟΛΟΥΘΙΩΝ =>???

ΑΚΟΛΟΥΘΙΑ == ΠΛΗΡΟΦΟΡΙΑ Αντιγραφή DNA Μεταγραφή Sequence Determines RNA Μετάφραση 3D-structure PROTEIN Function Determines

OMOIOTHTA =>?? Δομική/Λειτουργική Συσχέτιση Εξελικτική Σχέση Εντοπισμός 'κρίσιμων' καταλοίπων Εύρεση χαρακτηριστικών μοτίβων

Σύγκριση Δύο Ακολουθιών (pairwise alignment) Τύποι Σύγκρισης Μέτρο Σύγκρισης Αντικειμενικότητα Σημαντικότητα

Σύγκριση Δύο Ακολουθιών (pairwise alignment) Τύποι Σύγκρισης Τοπική, Ολική Πρωτεΐνη/DNA/RNA Τί ιδιότητες έχουν οι ακολουθίες μου?? Μέτρο Σύγκρισης Αντικειμενικότητα Σημαντικότητα

Σύγκριση Δύο Ακολουθιών (pairwise alignment) Τύποι Σύγκρισης Μέτρο Σύγκρισης Χρειαζόμαστε ένα μοντέλο => ΠΙΝΑΚΕΣ ΑΝΤΙΚΑΤΑΣΤΑΣΗΣ Εξελικτική Σχέση Αντικαταστάσεις (substitutions) Προσθήκες (insertions) Εξαλείψεις (deletions) Δομική Αντιστοιχία Φυσικοχημικές Ιδιότητες Αντικειμενικότητα Σημαντικότητα

Στοίχιση Ακολουθιών Κατά Ζεύγη (Pairwise alignment) Τύποι Σύγκρισης Μέτρο Σύγκρισης Αντικειμενικότητα Ποσοτικά vs Ποιοτικά Κριτήρια Αυτοματοποίηση (??) Σημαντικότητα

Στοίχιση Ακολουθιών Κατά Ζεύγη (Pairwise alignment) Τύποι Σύγκρισης Μέτρο Σύγκρισης Αντικειμενικότητα Σημαντικότητα... so what???

Στοίχιση Ακολουθιών Κατά Ζεύγη (Pairwise alignment) S1 HFCGGSLINEQWVVSAGHC S2 HFCGASIYNENYATAGHC Τμήματα ακολουθιών Θρυψίνης S1: Ποντικός S2: Αστακός S1 HFCGGSLINEQWVVSAGHC S2 HFCGASIYNENYA-TAGHC Με το ΧΕΡΙ!!! ή το μάτι.. S-S S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC

Πίνακες Διαγραμμάτων Σημείων (Dot Matrix Plots) BIO 650: Ειδικά Θέματα Βιοπληροφορικής, 04/02/2008

Πίνακες Διαγραμμάτων Σημείων (Dot Matrix Plots) Πλεονεκτήματα Οπτικοποίηση Εύκολη (σχετικά) κατασκευή Μικρές (σχετικά) Υπολογιστικές Απαιτήσεις Μειονεκτήματα Αντικειμενικότητα Σημαντικότητα ΣΗΜΑΝΤΙΚΟ!!! Στοίχιση == Διαδρομή

Μέθοδοι Δυναμικού Προγραμματισμού Προγραμματισμού (;) Αναζήτηση των Βέλτιστων Λύσεων μέσα από ΜΕΓΑΛΑ σύνολα λύσεων Αντιμετώπιση με στρατηγική από «Κάτω προς τα επάνω» Διαίρει και βασίλευε (;) Αλγοριθμική πολυπλοκότητα ~ Ν 2

Ολική Στοίχιση BIO 650: Ειδικά Θέματα Βιοπληροφορικής, 04/02/2008

j Ολική Στοίχιση i

Τοπική Στοίχιση BIO 650: Ειδικά Θέματα Βιοπληροφορικής, 04/02/2008

j i

Συζήτηση...