Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 10: Κατασκευή φυλογενετικών δέντρων

Σχετικά έγγραφα
Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 11: Κατασκευή φυλογενετικών δέντρων part II

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 9: Φυλογενετική ανάλυση

Εισαγωγή στους Αλγορίθμους

Εισαγωγή στους Αλγορίθμους

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Εισαγωγή στους Αλγορίθμους

Εισαγωγή στην πληροφορική

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Μαθηματική Ανάλυση Ι

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 7: Σχέσεις και Συναρτήσεις

Μαθηματική Ανάλυση ΙI

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Μαθηματική Ανάλυση Ι

Μαθηματική Ανάλυση Ι

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Διοικητική Λογιστική

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Δομές Δεδομένων Ενότητα 1

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Τεχνολογία και Καινοτομία - Οικονομική Επιστήμη και Επιχειρηματικότητα

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους

Τεχνοοικονομική Μελέτη

Αλγόριθμοι και πολυπλοκότητα Δυναμικός Προγραμματισμός

Ιστορία της μετάφρασης

Εισαγωγή στην πληροφορική

Εισαγωγή στην Διοίκηση Επιχειρήσεων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Μαθηματική Ανάλυση Ι

Εισαγωγή στον δομημένο προγραμματισμό

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

Μαθηματική Ανάλυση ΙI

Μαθηματική Ανάλυση Ι

Τεχνολογία & Καινοτομία - Αρχές Βιομηχανικής Επιστήμης

Ψηφιακή Επεξεργασία Εικόνων

Μηχανολογικό Σχέδιο Ι

Έννοιες φυσικών επιστημών Ι και αναπαραστάσεις

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Λογιστική Κόστους. Ενότητα 4: ΣΥΜΠΕΡΙΦΟΡΑ - ΦΥΣΗ ΚΟΣΤΟΥΣ. Μαυρίδης Δημήτριος Τμήμα Λογιστικής και Χρηματοοικονομικής

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Μαθηματική Ανάλυση Ι

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Μαθηματική Ανάλυση Ι

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Βάσεις Περιβαλλοντικών Δεδομένων

Εφαρμογές της Πληροφορικής στην Εκπαίδευση

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανολόγων Μηχανικών. Χημεία. Ενότητα 6: Ομοιοπολικός δεσμός. Τόλης Ευάγγελος

Εκκλησιαστικό Δίκαιο

Διδακτική της Πληροφορικής

Βέλτιστος Έλεγχος Συστημάτων

Κοινωνιολογία της Εκπαίδευσης

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Εισαγωγή στους Η/Υ. Ενότητα 2α: Χάρτης Karnaugh (Βοηθητικό υλικό)

Διοικητική Λογιστική

Τεχνοοικονομική Μελέτη

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 2: Γραφήματα

Αρχιτεκτονική Υπολογιστών

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανολόγων Μηχανικών. Χημεία. Ενότητα 10: Θεωρία μοριακών τροχιακών. Τόλης Ευάγγελος

Εκκλησιαστικό Δίκαιο

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Εισαγωγικές έννοιες θεωρίας Συστημάτων Αυτομάτου Ελέγχου Ενότητα 2 η : ΠΕΡΙΓΡΑΦΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΜΑΘΗΜΑΤΙΚΑ ΜΟΝΤΕΛΑ

Βάσεις Δεδομένων. Ενότητα 1: Εισαγωγή στις Βάσεις δεδομένων. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών σπουδών

Μαθηματική Ανάλυση Ι

Βέλτιστος Έλεγχος Συστημάτων

Μαθηματική Ανάλυση ΙI

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 5

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Οργάνωση και Διοίκηση Πωλήσεων

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Γενικά Μαθηματικά Ι. Ενότητα 14: Ολοκλήρωση Κατά Παράγοντες, Ολοκλήρωση Ρητών Συναρτήσεων Λουκάς Βλάχος Τμήμα Φυσικής

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 4

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Τεχνολογία Πολυμέσων. Ενότητα 8: Pool Table. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μαθηματική Ανάλυση ΙI

Transcript:

Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 10: Κατασκευή φυλογενετικών δέντρων Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ψηφιακά Μαθήματα στο Πανεπιστήμιο Δυτικής Μακεδονίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Κατασκευή φυλογενετικών δέντρων 4

Φυλογενετική ανάλυση Αρχή και σκοπός Εξαρτάται από μία πολύ καλή πολλαπλή στοίχιση αλληλουχιών. Οι αλληλουχίες με παρόμοιες αντικαταστάσεις ομαδοποιούνται με σκοπό να κατασκευαστεί ένα φυλογενετικό δέντρο. ΣΚΟΠΟΣ: Η ανακάλυψη των σχέσεων μεταξύ των βραχιόνων καθώς και το μήκος των βραχιόνων. Αλληλουχίες που μοιράζονται μεγάλη ομοιότητα τοποθετούνται σε γειτονικούς βραχίονες. Κατανόηση της εξελεγκτικής ιστορίας: Origin of Europeans. Πρόβλεψη λειτουργίας γονιδίου. Μελέτη των αλλαγών που συμβαίνουν σε ραγδαία μεταβαλλόμενους οργανισμούς, π.χ. ιούς (επιδημιολογία). 5

Φυλογενετικά δέντρα Εξωτερικός κόμβος Εσωτερικός κόμβος άνθρωπος άλογο βραχίονας κλάδος Φύλλα: Ταξινομικές μονάδες, όπως ομάδες οργανισμών, ειδών, γονιδίων (αλληλουχίες). Κόμβος: Τον πιο πρόσφατο κοινό πρόγονο των ταξινομικών μονάδων. Αντιπροσωπεύει τη δημιουργία διαφορετικών ειδών (ειδογένεση). ρίζα μήκος βραχίονα βάτραχος Βραχίονες: Το μήκος τους μπορεί να δείχνει το πλήθος των αλλαγών (εξελεγκτική απόσταση). Κλάδος: Περιλαμβάνει έναν κόμβο και όλες τις ταξινομικές μονάδες που προκύπτουν από αυτόν. 6

Branches Image: http://www.ncbi.nlm.nih.gov/about/primer/phylo.html 7

Μέθοδοι κατασκευής φυλογενετικών δέντρων (1/) Μέθοδοι βασισμένες σε χαρακτήρες εξελεγκτικά μοντέλα: Μέθοδος μέγιστης συντήρησης (Maximum parsimony method). Μέθοδοι βασισμένες στην απόσταση: Fitch and Margoliash Algorithm. UPGMA (Unweighted pair-group method). 8

Μέθοδος ομαδοποίησης αστάθμητων ζευγών με αριθμητικούς μέσους όρους UPGMA: Unweighted Pair Group Method with Arithmetic mean. Προτάθηκε αρχικά (Sneth & Sokal 1973) για ταξινομήσεις με βάση μορφολογικά δεδομένα, αλλά αργότερα χρησιμοποιήθηκε σε μοριακά δεδομένα χωρίς να μειωθεί η αξία της. Βασική αρχή για την κατασκευή δέντρου αποτελεί η προϋπόθεση σταθερού ρυθμού εξέλιξης μεταξύ όλων των κλάδων του δέντρου. Ο αλγόριθμος της μεθόδου καταλήγει με απλούς μαθηματικούς υπολογισμούς πάντα σε ένα φυλογενετικό δέντρο με ρίζα. 9

Μέθοδος ομαδοποίησης αστάθμητων ζευγών με αριθμητικούς μέσους όρους Μέθοδος 1. Υπολογίζονται οι γενετικές αποστάσεις για όλα τα ζεύγη των αλληλουχιών και οι τιμές τους τοποθετούνται σε μία μήτρα αποστάσεων.. Από το σύνολο των αποστάσεων της μήτρας αρχικά επιλέγεται το ζεύγος των αλληλουχιών με τη μικρότερη τιμή. Οι δύο αλληλουχίες συγκροτούν μία καινούργια μονάδα, η οποία αναφέρεται ως σύνθετη, και αποτελεί την πρώτη ομάδα του δέντρου. 3. Η σύνθετη ομάδα σε συνδυασμό με τις υπόλοιπες αλληλουχίες συνθέτουν μία καινούργια μήτρα αποστάσεων από την οποία επιλέγεται και πάλι το ζεύγος με τη μικρότερη απόσταση. 4. Η διαδικασία επαναλαμβάνεται έως το τέλος. 10

Μέθοδος ομαδοποίησης αστάθμητων ζευγών με αριθμητικούς μέσους όρους Παράδειγμα (1/3) Επιλέγεται το ζευγάρι με τη μικρότερη απόσταση, δηλ. το ΑΒ. Επειδή ο ρυθμός εξέλιξης είναι ο ίδιος, η απόσταση των Α και Β από τον κοινό τους πρόγονο είναι /=1. A B C D E F A B C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 8 8 8 Οι Α και Β θεωρούνται μία ενιαία σύνθετη μονάδα και υπολογίζεται μία καινούργια μήτρα αποστάσεων: dist(a,b),c=(distac+distbc)/=4, dist(a,b),d=dist(ad+bd)/=6 dist(a,b),e=(distae+distbe)/=6, dist(a,b),f=dist(af+bf)/=8 Κατασκευάζεται μία καινούργια μήτρα αποστάσεων. 1 1 Α Β 11

Μέθοδος ομαδοποίησης αστάθμητων ζευγών με αριθμητικούς μέσους όρους Παράδειγμα (/3) Το επόμενο ζευγάρι είναι C και ΑΒ. Με την ίδια διαδικασία έχουμε: 1 1 1 Α Β C Α,B,C D,E 6 Α,B,C D,E F F 8 8 A B C D E F A B C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 8 8 8 1

Μέθοδος ομαδοποίησης αστάθμητων ζευγών με αριθμητικούς μέσους όρους Παράδειγμα (3/3) Και τέλος, έχουμε: Α,B,C,D,E Α,B,C,D,E F 8 F Α,B,C D,E F Α,B,C D,E 6 F 8 8 1 1 1 Α 1 Α 1 Β 1 Β 1 1 1 C C 1 D 1 D E E F 4 13

UPGMA nd Example (1/15) Η πρωτεΐνη cytochrome C εκφράζεται σε 7 διαφορετικούς οργανισμούς (A, B, C, D, E, F, & G). Οι αλληλουχίες της πρωτεΐνης από τους 7 οργανισμούς συγκρίθηκαν μεταξύ τους (όλοι οι συνδυασμοί). Ο πίνακας δείχνει την απόσταση μεταξύ των αλληλουχιών. Να κατασκευαστεί το φυλογενετικό δέντρο των οργανισμών που προκύπτει από την παρακάτω μήτρα αποστάσεων. 14

UPGMA nd Example (/15) 15

UPGMA nd Example (3/15) 16

UPGMA nd Example (4/15) 17

UPGMA nd Example (5/15) 18

UPGMA nd Example (6/15) 19

UPGMA nd Example (7/15) 0

UPGMA nd Example (8/15) 1

UPGMA nd Example (9/15)

UPGMA nd Example (10/15) 3

UPGMA nd Example (11/15) 4

UPGMA nd Example (1/15) 5

UPGMA nd Example (13/15) 6

UPGMA nd Example (14/15) 7

UPGMA nd Example (15/15) 8

Μέθοδοι κατασκευής φυλογενετικών δέντρων (/) Μέθοδοι βασισμένες σε χαρακτήρες εξελεγκτικά μοντέλα: Μέθοδος μέγιστης συντήρησης (Maximum parsimony method). Μέθοδοι βασισμένες στην απόσταση: Fitch and Margoliash Algorithm. UPGMA (Unweighted pair-group method). 9

Υπολογισμός αποστάσεων με δεδομένη μήτρα διαστάσεων D, 3x3 - Fitch and Margoliash algorithm (1/) Δυαδικό δέντρο χωρίς ρίζα με 3 φύλλα και ένα κέντρο Παρατηρούμε ότι: d ic + d jc = D ij d ic + d kc = D ik d jc + d kc = D jk 30

Υπολογισμός αποστάσεων με δεδομένη μήτρα διαστάσεων D, 3x3 - Fitch and Margoliash algorithm (/) d ic + d jc = D ij + d ic + d kc = D ik d ic + d jc + d kc = D ij + D ik d ic + D jk = D ij + D ik d ic = (D ij + D ik D jk )/ Παρομοίως, d jc = (D ij + D jk D ik )/ d kc = (D ki + D kj D ij )/ 31

Υπολογισμός αποστάσεων με δεδομένη μήτρα διαστάσεων D, 3x3 - Παράδειγμα A a b B D AB = a + b = (1) D AC = a + c = 39 () D BC = b + c = 41 (3) () (3): a b = - (4) (1) + (4): a = 0, a = 10 Από (1) και (): b = 1, c = 9 c C A B C A - 39 B - - 41 C - - - B A 10 1 9 C 3

Προσθετικές και μη προσθετικές μήτρες (1/) Για n=4: Επίλυση έξι εξισώσεων με 5 μεταβλητές. Αυτό δεν είναι πάντα εφικτό για n > 3. Η μήτρα D είναι προσθετική εάν υπάρχει δέντρο Τ με d ij (T) = D ij. ή διαφορετικά: d(a,b) + d(b,c) = d(a,c). a b c για το μονοπάτι εξέλιξης μίας αλληλουχίας a b c. 33

Προσθετικές και μη προσθετικές μήτρες (/) Μη προσθετική μήτρα Each tree does correspond to one distance matrix, but the opposite is not always true 34

Example of Distance Analysis (1/3) Α. Έστω ότι έχουμε την πολλαπλή στοίχιση: A ACGCGTTGGGCGATGGCAAC B ACGCGTTGGGCGACGGTAAT C ACGCATTGAATGATGATAAT D ACACATTGAGTGATAATAAT Β. Οι αποστάσεις μεταξύ των αλληλουχιών είναι: n AB 3 n AC 7 n AD 8 Distance table A B C D n BC 6 A - 3 7 8 n BD 7 B - - 6 7 n CD 3 C - - - 3 D - - - - 35

Example of Distance Analysis (/3) A B C D A - 3 7 8 B - - 6 7 C - - - 3 D - - - - A B 1 4 1 C D A C D A - 7 8 C - - 3 D - - - 6 1 C A D A C A - 7 A 7 C C - - 36

Example of Distance Analysis (3/3) Distance table A B C D A - 3 7 8 B - - 6 7 C - - - 3 D - - - - A B 1 4 1 C D Το προτεινόμενο φυλογενετικό δέντρο για τις αλληλουχίες Α-D. Το άθροισμα των μηκών των ακμών μεταξύ δύο αλληλουχιών στο δέντρο έχει την ίδια τιμή με την απόσταση μεταξύ των αλληλουχιών. 37

Fitch and Margoliash Algorithm Μέθοδος (1/) 1. Βρίσκουμε τις αλληλουχίες με τη μεγαλύτερη ομοιότητα, για παράδειγμα την Α και τη Β.. Θεωρούμε τις υπόλοιπες αλληλουχίες σαν μία αλληλουχία. 3. Υπολογίζουμε τη μέση απόσταση της Α από όλες τις άλλες αλληλουχίες και τη μέση απόσταση της Β από όλες τις άλλες αλληλουχίες. 4. Χρησιμοποιώντας αυτές τις σχέσεις υπολογίζουμε τα a και b. 5. Στη συνέχεια συμπεριφερόμαστε στις Α και Β σαν μία αλληλουχία ΑΒ, υπολογίζουμε τη μέση απόσταση της ΑΒ από τις υπόλοιπες αλληλουχίες και κατασκευάζουμε καινούργια μήτρα αποστάσεων. 38

Fitch and Margoliash Algorithm Μέθοδος (/) 6. Βρίσκουμε το επόμενο ζευγάρι αλληλουχιών με τη μεγαλύτερη ομοιότητα και επαναλαμβάνουμε την παραπάνω διαδικασία. 7. Επαναλαμβάνω τη συνολική διαδικασία ξεκινώντας με όλα τα πιθανά ζεύγη των αλληλουχιών Α και Β, Α και C, A και D, κτλ. 8. Υπολογίζουμε την προβλεπόμενη απόσταση μεταξύ κάθε ζεύγους αλληλουχιών για κάθε δέντρο και προτείνουμε το βέλτιστο δέντρο. 39

Fitch and Margoliash Algorithm (5 sequences) (1/7) Ο αλγόριθμος μπορεί να εφαρμοστεί και σε περισσότερες αλληλουχίες. Έστω ότι έχουμε τις παρακάτω αποστάσεις. Εντοπίζουμε τις πιο κοντινές αλληλουχίες: A b a f g c d C D B e E 40

Fitch and Margoliash Algorithm (5 sequences) (/7) A c a f b g B d e C D E Δημιουργώ καινούργιο πίνακα αποστάσεων συνδυάζοντας τις υπόλοιπες αλληλουχίες (A, B, C): Απόσταση από D στο ABC: Μέση απόσταση του καθένα από το D, ((39 + 41 + 18) / 3 = 3.7). Απόσταση από E στο ABC: Μέση απόσταση του καθένα από το E, ((41+43+0)/3 = 34.7). 41

Fitch and Margoliash Algorithm (5 sequences) (3/7) D to E: d e 10 (1) A B a b f g c d e C D E D to ABC: DA DB DC 3 E to ABC: d g 3 f a d g 3 f b d g 3 c d g a b 3 f c 3.7() EA EB 3 EC e g 3 f a e g 3 f b e g 3 c e g a b 3 f c 34.7 (3) () - (3) d e (4) (1) + (4) d 8 d 4 and e 6 4

Fitch and Margoliash Algorithm (5 sequences) (4/7) Θεωρώ την DE μία αλληλουχία. Δημιουργώ καινούργια μήτρα αποστάσεων. Η απόσταση από την A στην DE είναι η μέση τιμή της A προς την D και της A προς την E. B A b a f g c 4 6 C D 5 DE E 43

Ή πιο αναλυτικά B A b a f g c 4 6 C D 5 DE E A to DE: AD a f a f AE g g a AD AE f 4 6 g 39 41 4 4 6 a f 35 or 35 g 6 a f g 5 A to DE = 40 44

Fitch and Margoliash Algorithm (5 sequences) (5/7) B A b a f g c 4 6 C D 5 DE E Επομένως χρησιμοποιούμε την C,DE σαν μία αλληλουχία. Δημιουργώ καινούργιο πίνακα συνδυάζοντας τις υπόλοιπες αλληλουχίες, δηλ, τις A,B: Μέση απόσταση της DE από την AB: (40+4)/ = 41. Μέση απόσταση της C από την AB: (39+41)/ = 40. 45

Fitch and Margoliash Algorithm (5 sequences) (6/7) Μέση απόσταση της DE από την AB: (40+4)/ = 41 Μέση απόσταση της C από την AB: (39+41)/ = 40 DE to AB: a f g 5 b f g 5 a b f g 5 41 (1) B A b a f g c 4 6 C D 5 DE E C to AB: c f a c f b c f a b 40 () (1) - (): c g 4 (3) 0μως, C to DE: 19 c g 5 19 (4) Επομένως, c=9 και g=5 B A b a f C 9 D CDE 4 5 5 9.5 DE 6 E 46

Fitch and Margoliash Algorithm (5 sequences) (7/7) Συνεχίζοντας με τον ίδιο τρόπο υπολογίζουμε όλα τα μήκη: B A a b 10 1 f 0 C c 9 g 5 d 4 6 e CDE D DE 9.5 5 E 47

Fitch and Margoliash Algorithm nd Example (1/4) A B C D A 3 7 8 B 6 7 C 3 A B a b x CD D a+b=3 (1) dist(a,cd) = a+x = (AC+AD)/ = 7.5 () dist(b,cd) = b+x = (BC+BD)/ = 6.5 (3) A B 1 5.5 CD ()-(3) a-b = 1, (1) a+b=3 a =, b = 1 & x=5.5 48

Fitch and Margoliash Algorithm nd Example (/4) A B C D A 3 7 8 B 6 7 AB y c C C 3 D d D c+d=3 (1) dist(c,ab) = c+y = (CA+CB)/ = 6.5 () AB 5.5 1 C dist(d,ab) = d+y = (DA+DB)/ = 7.5 (3) D (3)-() d-c = 1, (1) c+d=3 d =, c = 1 & y=5.5 49

Fitch and Margoliash Algorithm nd Example (3/4) A B C D A 3 7 8 B 6 7 C 3 D A B AB 1 5.5 5.5 1 CD C A??? 1 C A 4 1 C D B 1 D B 1 D dist(a,c) = 7 50

Fitch and Margoliash Algorithm nd Example (4/4) A B C D A 3 7 8 B 6 7 C 3 D A B AB 1 5.5 5.5 1 CD C A C 1 1.5 4 1.5 D B 1 D 51

Fitch and Margoliash Algorithm (1/5) B A b a f g c d e C D E 5

Fitch and Margoliash Algorithm (/5) ABC x d D e E d+e=10 (1) dist(d,abc) = d+x = (DA+DB+DC)/3 = 3.67 () dist(e, ABC) = e+x = (EA+EB+EC)/3 = 34.67 (3) (1) () (3) e = 6, d = 4, x = 8,67 53

Fitch and Margoliash Algorithm (3/5) ABC 8.67 4 D 6 E (1) () (3) e = 6, d = 4, x = 8,67 A DE: (AD+AE)/=40 B DE: (BD+BE)/=4 C DE: (CD+CE)/=19 54

Fitch and Margoliash Algorithm (4/5) AB y c C de DE c = 9, de = 10, y = 31 AB 31 9 C 10 DE A B CDE A CDE: (AC+AD+AE)/3=39.67 A 39.67 B CDE: (BC+BD+BE)/3=41.67 B 41.67 CDE 55

Fitch and Margoliash Algorithm (5/5) A B CDE A 39.67 B 41.67 A a z CDE CDE B b a = 10, b = 1, z = 9.67 A 10 9.67 CDE B 1 56

Τελικά (1/) ABC 8.67 4 D 6 E A B 10 1 9.67 CDE A B 10 1 f g 6 9 4 C D AB 31 9 C E 10 DE 57

Τελικά (/) A 10 f 9 C B 1 g 6 4 D E A B 10 1 0 (A C) C 9 5 (A D) 4 6 D E 58

Τέλος Ενότητας 59

Σημείωμα Αναφοράς Copyright, Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών, Αγγελίδης Παντελής. «Βιοπληροφορική». Έκδοση: 1.0. Κοζάνη 015. Διαθέσιμο από τη δικτυακή διεύθυνση: https: //eclass.uowm.gr/courses/icte10/ 60

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Όχι Παράγωγα Έργα Μη Εμπορική Χρήση 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] h t t p ://creativecommons.org/licenses/by-nc-nd/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό 61

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους. 6