Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Σχετικά έγγραφα
Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Κεφάλαιο 6 Φυλογενετική Ανάλυση

Βασικές αρχές φυλογένεσης

ΦΥΛΟΓΕΝΕΤΙΚ Α ΔΕΝΤΡΑ

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 5 η : Φυλογενετική ανάλυση 2. Ηλίας Καππάς Τμήμα Βιολογίας

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 10: Κατασκευή φυλογενετικών δέντρων

Φυλογένεση. 5o εργαστήριο

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΜΙΚΡΟΕΠΕΞΕΡΓΑΣΤΩΝ ΚΑΙ ΥΛΙΚΟΥ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 9: Φυλογενετική ανάλυση

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Ειδικά Θέματα Βιοπληροφορικής

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Πολλαπλή στοίχιση Φυλογένεση

Λίγη εξέλιξη: οµολογία

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 11: Κατασκευή φυλογενετικών δέντρων part II

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 4 η : Φυλογενετική ανάλυση 1. Ηλίας Καππάς Τμήμα Βιολογίας

LALING/PLALING :

Μέθοδοι μελέτης εξέλιξης

Πολλαπλή παλινδρόμηση (Multivariate regression)

Κεφάλαιο 6. Φυλογενετική Ανάλυση

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Συγκριτική Γονιδιωματική

HMY 795: Αναγνώριση Προτύπων

Αναγνώριση Προτύπων Ι

Πανεπιστήμιο Ιωαννίνων Ακαδ. Έτος Τμήμα Μηχανικών Η/Υ & Πληροφορικής. Παρασκευάς Τσανταρλιώτης Α.Μ. 318

Γενετική Ποικιλότητα και Φυλογενετικές Σχέσεις «Λιμναίων» και «Θαλάσσιων» Πληθυσμών της Atherina boyeri

p q 0 P =

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

Στοχαστικές Ανελίξεις- Ιούλιος 2015

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ IΙ ΦΥΛΟΓΕΝΕΤΙΚΗ ΑΝΑΛΥΣΗ

Κατά ζεύγη στοίχιση ακολουθιών Πολλαπλή στοίχιση ακολουθιών Patterns. Δρ. Μαργαρίτα Θεοδωροπούλου

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

a n + 6a n a n 2 + 8a n 3 = 0, a 0 = 1, a 1 = 2, a 2 = 8

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Τμήμα Μηχανικών Παραγωγής και Διοίκησης Χειμερινό Διδάσκων: Καθηγητής Παντελής Ν. Μπότσαρης Εργαστήρια/Ασκήσεις: Δρ.

«Εκτίμηση δικτύων μετάδοσης HIV σε ΧΕΝ και συσχέτιση με κοινωνικά δίκτυα»

Ειδικά Θέματα Βιοπληροφορικής

Ισορροπημένα Δένδρα. για κάθε λειτουργία; Ισορροπημένο δένδρο : Διατηρεί ύψος κάθε εισαγωγή ή διαγραφή

Επίλυση Προβλημάτων 1

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

HMY 795: Αναγνώριση Προτύπων


ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Search and Replication in Unstructured Peer-to-Peer Networks

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Αριθμήσιμα σύνολα. Μαθηματικά Πληροφορικής 5ο Μάθημα. Παραδείγματα αριθμήσιμων συνόλων. Οι ρητοί αριθμοί

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Σκορπιός Χειλόποδο Διπλόποδο Ορθόπτερο Ημίπτερο Υμενόπτερο Κολεόπτερο. Φυλογενετικό δέντρο

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Γεωγραφικά Συστήματα Πληροφοριών Τριμεταβλητές παράμετροι

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Στοχαστικές Ανελίξεις- Φεβρουάριος 2015

Ερώτημα 1. Μας δίνεται μια συλλογή από k ακολοθίες, k >=2 και αναζητούμε το πρότυπο Ρ, μεγέθους n.

ΑΝΑΛΥΣΗ 1 ΕΙΚΟΣΤΟ ΠΡΩΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Θέμα 1 ο (ΜΑΪΟΣ 2004, ΜΑΪΟΣ 2008) Να δείξετε ότι η παράγωγος της σταθερής συνάρτησης f (x) = c είναι (c) = 0. Απόδειξη

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΑΝΑΛΥΣΗ ΠΡΟΤΙΜΗΣΕΩΝ ΓΙΑ ΤΗ ΧΡΗΣΗ ΣΥΣΤΗΜΑΤΟΣ ΕΝΟΙΚΙΑΖΟΜΕΝΩΝ ΠΟΔΗΛΑΤΩΝ ΣΤΟΝ ΔΗΜΟ ΑΘΗΝΑΙΩΝ

Τεχνικές εκτίμησης και μοντελοποίησης απόστασης οργανισμών με βάση δεδομένα σύγκρισης πρωτεϊνών

Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών

Αναγνώριση Προτύπων Ι

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος

Θεωρία Υπολογισμού Αρτιοι ΑΜ Διδάσκων: Σταύρος Κολλιόπουλος eclass.di.uoa.gr

Αναλυτική Στατιστική

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο

(Μερος 2 ο ) Εισηγητής: Ν. Πουλακάκης

[1] Institutional Repository - Library & Information Centre - University of Thessaly 17/10/ :03:05 EEST

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εξήγηση του νόμου του Båth με τη βοήθεια του φυσικού χρόνου

Πληθυσμιακή και Εξελικτική Γενετική

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ

Πρότυπα τοπικής διασποράς του γονότυπου Α του HBV σε παγκόσμια κλίμακα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Κιούπη Βασιλική Βιολόγος. Φύλλο εργασίας "Η εξέλιξη του μαμούθ και των σύγχρονων συγγενών του" Ονοματεπώνυμο:.. Ημερομηνία:.

TreeTOPS. ένα εισαγωγικό παιχνίδι για τα φυλογενετικά δέντρα. Teacher s Guide. ELLS European Learning Laboratory for the Life Sciences

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Τυχαίοι γράφοι Η διάμετρος του G(n, 2 ln n/n) Ioannis Giotis

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Ποσοτική Ανάλυση Κινδύνων

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 10ο

Εξελικτική Οικολογία: Φυλογένεση

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Εξελικτική Οικολογία - Διάλεξη 9. Επικ. Καθ. Πουλακάκης Νίκος poulakakis@nhmc.uoc.gr

Υπερπροσαρμογή (Overfitting) (1)

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

Transcript:

Βιοπληροφορική Ι Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1

Φυλογενετικές σχέσεις Χρησιμοποιούνται οι ομοιότητες και οι διαφορές των μελετούμενων οργανισμών Τα χαρακτηριστικά που μελετώνται, ενώ παλιά ήταν μορφολογικά-ανατομικά, τώρα πλέον είναι όλο και περισσότερο μοριακά 2

Βασικές αρχές Οποιαδήποτε ομάδα οργανισμών προέρχεται από έναν κοινό πρόγονο μέσω της εξέλιξης Υπάρχει διχαλωτό πρότυπο στην εξέλιξη Αλλαγή στα χαρακτηριστικά εμφανίζεται μετά το πέρασμα πολλών γενιών 3

Ορολογία στα δέντρα Clade, Taxon, Node Στις πιο πολλές αναλύσεις, το μήκος των βραχιόνων ανταποκρίνεται στη φυλογενετική απόσταση-απόκλιση 4

5

6

Orthologs & Paralogs Speciation events Worm Orthologs Fly Human 1 Paralogs Human 2 Gene duplication events Yeast 1 Paralogs Yeast 2 7

8

9

Δέντρα με ρίζα (rooted trees) 10

Δέντρα χωρίς ρίζα (unrooted trees) Για να προσθέσουμε ρίζα επιλέγουμε ένα Outgroup 11

Τα βήματα μιας φυλογενετικής ανάλυσης Στοίχιση (πολλές φορές χρειάζεται manual editing) Καθορισμός του μοντέλου αντικατάστασης Κατασκευή του δέντρου Αξιολόγηση του δέντρου 12

Πιθανοθεωρητικά μοντέλα της εξέλιξης Προυποθέτουν μια Μαρκοβιανή ανέλιξη για το ρυθμό αντικαταστάσεων των νουκλεοτιδίων 13

14

15

16

17

18

Jukes and Cantor (1969) Αν α=β=γ, τότε: Το ποιο απλό μοντέλο αλλά έχει σημαντικές αδυναμίες Οι μεταπτώσεις (πουρίνη σε πουρίνη) δεν έχουν ίδιο ρυθμό εμφάνισης με τις μεταστροφές (πουρίνη σε πυριμιδίνη, και αντίστροφα) 19

Kimura (1980) 20

F81 (Felsenstein, 1981) R χρησιμοποιεί μόνο μία παράμετρο (μ) για τις μεταπτώσεις και τις μεταστροφές, αλλά μοντελοποιεί τα τέσσερα νουκλεοτίδια με διαφορετικές πιθανότητες εμφάνισης (πα, πg, πc, πt): - C G T C G T - A A G T G T - A C C A T T - A C G C G A 21

HKY85 οι μεταπτώσεις έχουν διαφορετικό ρυθμό από τις μεταστροφές, χρησιμοποιώντας δύο παραμέτρους (κ και μ): R - C G T C G T - A A G T G T - A C C A T T - A C G C G A 22

GTR Τέλος, το πιο γενικό μοντέλο αυτής της κατηγορίας, είναι το λεγόμενο γενικό χρονικά αντιστρεπτό μοντέλο (general time reversible model), το οποίο συμβολίζεται ως GTR (Tavare, 1986) και περιγράφεται από τη σχέση: R - a b c a b c C G T C G T a - a d e d e A A G T G T b d - d b f A C C A T T c e f - e f c A C G 23 C G A

Συνέπεια των απλών μοντέλων Σε κατάσταση ισορροπίας (t ), έχουμε ισοκατανομή των νουκλεοτιδίων Αυτό όμως ξέρουμε ότι δεν ισχύει καθώς οι οργανισμοί διαφέρουν στο ποσοστό GC% Άλλα μοντέλα, πιο περίπλοκα έχουν προταθεί (Lio and Goldman, Felsenstein, Penny and Hendy) όπου ο πίνακας δεν έχει την συμμετρία που είδαμε πρίν 24

Κατασκευή των δέντρων Μέθοδοι βασισμένες στην απόσταση (distance-based methods) Μέθοδοι βασισμένες στους χαρακτήρες (character-based methods) 25

Μέθοδοι βασισμένες στην απόσταση UPGMA (unweighted pair group method using arithmetic mean) (Clustering) Ενώνει τους βραχίονες με τη μεγαλύτερη ομοιότητα, και παίρνει το μέσο όρο για να ορίσει το νέο cluster. Αναμένεται να αποδώσει τα μέγιστα, αν ισχύει το «μοριακό ρολόι» 26

dij Ο πίνακας των αποστάσεων δυο ακολουθιών και, θα μπορούσε γενικά να προκύψει με πολλούς τρόπους. Ένας εύκολος τρόπος θα ήταν μετρώντας απλά το ποσοστό από τις θέσεις, στις οποίες τα κατάλοιπα διαφέρουν. Αυτό είναι ένα λογικό μέτρο, αλλά δεν αποδίδει καλά για ασυσχέτιστες ακολουθίες, καθώς θέλουμε σε αυτή την περίπτωση η απόσταση να αυξάνει. Μια καλύτερη λύση, προκύπτει από την αρχική πολλαπλή στοίχιση με χρήση κάποιου από τα πιθανοθεωρητικά μοντέλα της εξέλιξης που παρουσιάσαμε στην προηγούμενη παράγραφο. Για παράδειγμα, το μοντέλο JC69 δίνει την απόσταση: 3 log 1 4 4 3 f 1 1 dij log 1 2 f g log 1 2g 2 4 27

28

Μέθοδοι βασισμένες στην απόσταση Neighbor-Joining Method (Ένωση Γειτόνων) Ενώνει διαδοχικά τα πιο κοντινά ζευγάρια, παγίωνοντας την θέση τους σαν ένα νεό κλάδο Προχωράει προοδευτικά μέχρι τέλους Είναι αρκετά γρήγορη 29

30

Μέθοδοι βασισμένες στην απόσταση Fitch and Margoliash (FM) Μεγιστοποιεί την προσαρμογή (fit) των ανά δυο αποστάσεων σε ένα δέντρο Ελαχιστοποιεί την τετραγωνική απόκλιση των αποστάσεων, σε σχέση με όλα τα πιθανά μήκη μονοπατιών στο δέντρο Διάφορες παραλλαγές για το στάθμισμα του σφάλματος 31

Μέθοδοι βασισμένες στους χαρακτήρες (character-based methods) Μέγιστη Πιθανοφάνεια (Maximum Likelihood) Μέγιστη Φειδωλότητα (Maximum Parsimony) 32

Μέγιστη Πιθανοφάνεια (Maximum Likelihood) Η πιθανοφάνεια είναι δεσμευμένη στην αρχική στοίχιση Πρέπει να αθροιστεί για όλες τις πιθανές τοπολογίες του δέντρου Δεν μπορεί να υπολογιστεί αναλυτικά 33

34

35

36

Μέγιστη Φειδωλότητα (Maximum Parsimony) Διαφέρει ριζικά από τις προηγούµενες, στο ότι κάνει διάκριση µεταξύ πληροφοριακών και µηπληροφοριακών θέσεων στις ακολουθίες, µε τις πληροφοριακές θέσεις να είναι αυτές που παρουσιάζουν πολυµορφισµό (ύπαρξη πάνω από δυο ειδών νουκλεοτιδίων) τουλάχιστον δυο φορές. Εφαρµόζεται στην εξελικτική βιολογία προτού να εµφανιστεί η µοριακή φυλογένεια (π.χ. εφαρµοζόταν σε διάφορα φαινοτυπικά χαρακτηριστικά) και έχει σκοπό να εξηγήσει τις εξελικτικές διάφορες µε το µικρότερο αριθµό αλλαγών. Προτάθηκε αρχικά, σαν υπολογιστική προσέγγιση στη Μέγιστη Πιθανοφάνεια Έχει βρεθεί στο επίκεντρο πολλών αντιπαραθέσεων 37

38

Αξιολόγηση των Δέντρων Τυχαιοποιημένα Δέντρα Permutation Tail Probability Test Bootstrap (parametric, non-parametric) Likelihood Ratio Test 39

40

41

Συμπεράσματα Συμπερασματικά, δεν μπορούμε να αποφανθούμε με 100% σιγουριά για το ποια μέθοδος είναι καλύτερη κάτω από όλες τις περιστάσεις, και έτσι χρειάζεται προσοχή όταν έχουμε να εκτιμήσουμε ένα φυλογενετικό δέντρο. Σε γενικές γραμμές, η μέγιστη πιθανοφάνεια, φαίνεται να έχει κερδίσει στη σχετική διαμάχη, κυρίως λόγω του στέρεου μαθηματικού υποβάθρου, της δυνατότητας χρήσης πολλών εξελικτικών μοντέλων αλλά και της ευκολίας την οποία προσδίδουν οι σύγχρονοι υπολογιστές και η αυξημένη υπολογιστική ισχύς. Επιπλέον δε, φαίνεται να αποδίδει καλύτερα την ανακατασκευή δέντρων κάτω από τα περισσότερα σενάρια προσομοιώσεων. Παρόλα αυτά, η μέθοδος NJ και η φειδωλότητα εξακολουθούν να είναι δημοφιλείς ειδικά για γρήγορες αναλύσεις μεγάλου όγκου δεδομένων. Γενικά επειδή η διαδικασία κατασκευής ενός δέντρου περιλαμβάνει 3 διακριτές λειτουργίες, δηλαδή: 1) το κριτήριο καταλληλότητας για το πόσο καλά «προσαρμόζονται» τα δεδομένα στο δέντρο, 2) τη στρατηγική αναζήτησης για να βρούμε το καλύτερο δέντρο, και τέλος 3) τον έλεγχο των προϋποθέσεων κάτω από τις οποίες έχει συντελεστεί η εξέλιξη, είναι δυνατόν να έχουμε συνδυασμό πολλών μεθόδων, πράγμα που εκμεταλλεύονται αρκετά από τα σύγχρονα λογισιμικά τα οποία παρουσιάζουμε στην επόμενη παράγραφο. Για παράδειγμα, η μη παραμετρική bootstrap μπορεί να χρησιμοποιηθεί σαν μέθοδος αξιολόγησης με κάθε μέθοδο κατασκευής δέντρων, ενώ τα κλασικά μοντέλα της εξέλιξης (πχ JC69, K2P κλπ), μπορούν να χρησιμοποιηθούν τόσο με τη ΝJ (και την UPGMA), όσο και με τη μέγιστη πιθανοφάνεια (αλλά προσοχή, όχι με τη φειδωλότητα!). Ο Fenselstein έδειξε επιπλέον, ότι χρησιμοποιόντας οποιοδήποτε από τα γνωστά μοντέλα της εξελικτικής διαδικασίας, μπορούν να οριστούν «αποστάσεις μέγιστης πιθανοφάνειας» (maximum likelihood distance), οι οποίες έχουν την προσθετική ιδιότητα. Αυτές οι αποστάσεις, μπορούν να χρησιμοποιηθούν με οποιαδήποτε μέθοδο αποστάσεων (NJ, UPGMA) για να δώσουν μια μέθοδο η οποία θα δίνει καλύτερα αποτελέσματα. Μια άλλη υβριδική μέθοδος είναι η NJML, η οποία αποτελεί συνδυασμό των Neighbour Joining και Maximum Likelihood. Στο πρώτο βήμα κατασκευάζει ένα δέντρο με NJ και η αναζήτηση των πιθανών δέντρων με τη μέθοδο μέγιστης πιθανοφάνειας γίνεται μόνο στα κλαδιά με μεγάλη 42 τιμή bootstrap. Η NJML έδειξε ότι πετυχαίνει καλύτερα αποτελέσματα από την κλασική NJ αλλά σε χρόνο που είναι πολύ καλύτερος σε σχέση με τις ιδιαίτερα απαιτητικές μεθόδους πιθανοφάνειας

Πρακτικές Συμβουλές Έλεγχος των δεδομένων εισόδου (garbage in, garbage out) Χρήση διαφορετικών μεθόδων (αν υπάρχει κάτι σημαντικό, όλες θα δείξουν το ίδιο) Έλέγχος της σειράς των ακολουθιών (κάποιες μέθοδοι παράγουν άλλα αποτελέσματα ανάλογα με τη σειρά εισόδου) Επιλογή Outgroup 43

Διαθέσιμο Software PAUP (http://paup.csit.fsu.edu/) PHYLIP (http://evolution.genetics.washington.edu/phylip.html) PAML (http://abacus.gene.ucl.ac.uk/software/paml.html) HYPHY (http://www.hyphy.org) MrBayes (http://mrbayes.csit.fsu.edu/) MEGA (http://www.megasoftware.net/) PhyML (http://www.atgc-montpellier.fr/phyml/binaries.php) RAxML (http://scoh-its.org/exelixis/software.html) BEAST (http://beast.bio.ed.ac.uk) GARLI (http://code.google.com/p/garli) TNT (http://www.lillo.org.ar/phylogeny/tnt/ ) Treeview (http://taxonomy.zoology.gla.ac.uk/rod/rod.html) 44