Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Σχετικά έγγραφα
Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών

Μέθοδοι μελέτης εξέλιξης

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

LALING/PLALING :

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Σηµειώσεις Βιοπληροφορικής

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Βιοπληροφορική. Πίνακες Αντικατάστασης BLOSUM & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας

Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Κεφάλαιο 4 ο : Αλγόριθµοι προσεγγιστικής εύρεσης προτύπου και στοίχισης συµβολοσειρών.

Κατά ζεύγη στοίχιση ακολουθιών Πολλαπλή στοίχιση ακολουθιών Patterns. Δρ. Μαργαρίτα Θεοδωροπούλου

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST

Στοίχιση ανά ζεύγη Εισαγωγή

Λήψη αποφάσεων υπό αβεβαιότητα

Πιθανοθεωρητικά µοντέλα αναπαράστασης ακολουθιών

Δασική Γενετική Εισαγωγή: Βασικές έννοιες

Φυλογένεση. 5o εργαστήριο

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Λήψη αποφάσεων υπό αβεβαιότητα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Πολλαπλή στοίχιση multiple sequence alignment (MSA)

ΦΥΛΟΓΕΝΕΤΙΚ Α ΔΕΝΤΡΑ

ΜΕΛΕΤΗ ΜΕ ΥΠΟΛΟΓΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΑΝΘΡΩΠΙΝΗΣ ΠΡΩΤΕΪΝΗΣ GEMININB

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Μέθοδος μέγιστης πιθανοφάνειας

Περιεχόμενα. 1. Ειδικές συναρτήσεις. 2. Μιγαδικές Συναρτήσεις. 3. Η Έννοια του Τελεστή. Κεφάλαιο - Ενότητα

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Κεφάλαιο 4. Σύγκριση Αλληλουχιών. Στοιχίσεις και Ταχείες Αναζητήσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Kruskal-Wallis H

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Blast

Είδη Μεταβλητών. κλίµακα µέτρησης

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Εξερευνώντας την Εξέλιξη Κεφάλαιο 7

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 10: Κατασκευή φυλογενετικών δέντρων

Περιεχόμενα. σελ. Πρόλογος 1 ης Έκδοσης... ix Πρόλογος 2 ης Έκδοσης... xi Εισαγωγή... xiii

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Ανάκληση Πληποφοπίαρ. Διδάζκων Δημήηριος Καηζαρός

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Ειδικά Θέματα Βιοπληροφορικής

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

Προγνωστικές μέθοδοι με βάση αλληλουχίες DNA

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

ΠΙΝΑΚΑΣ ΕΠΙΛΑΧΟΝΤΩΝ ΗΜΕΡΟΜΗΝΙΑ ΑΙΤΗΣΗΣ

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 5 η : Φυλογενετική ανάλυση 2. Ηλίας Καππάς Τμήμα Βιολογίας

ΔΙΟΙΚΗΣΗ ΤΕΧΝΙΚΩΝ ΕΡΓΩΝ

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων:

Προβλήματα Ελάχιστου Κόστους Ροής σε Δίκτυο. Δίκτυα Ροής Ελάχιστου Κόστους (Minimum Cost Flow Networks)

Πολλαπλή στοίχιση Φυλογένεση

Ειδικά Θέματα Βιοπληροφορικής

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Κεφάλαιο 4 Πολλαπλή Στοίχιση Ακολουθιών

Λήψη αποφάσεων υπό αβεβαιότητα. Παίγνια Αποφάσεων 9 ο Εξάμηνο

Βιοπληροφορική. Πίνακες Αντικατάστασης & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Κληρονομικότητα ποσοτικών ιδιοτήτων

Transcript:

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678, Λευκωσία ΚΥΠΡΟΣ τηλ: 00357-22892879 (εσωτ. 2879) email: vprobon@ucy.ac.cy, vprobon@biol.uoa.gr

Σύνοψη Συστήματα Βαθμονόμησης Στοιχίσεων και Πίνακες Αντικατάστασης Διαισθητική προσέγγιση Εξελικτικές/Στατιστικές προσεγγίσεις Αποδεκτές Σημειακές Μεταλλαγές και Πίνακες Αντικατάστασης PAM Πίνακες BLOSUM Εναλλακτικές Προσεγγίσεις Συζήτηση...

Η σημασία των συστημάτων βαθμονόμησης Η Επιτακτική Ανάγκη ΣΥΓΚΡΙΣΗ ΑΚΟΛΟΥΘΙΩΝ (DNA/RNA/ΠΡΩΤΕΪΝΩΝ) Απαιτεί ΔΗΜΙΟΥΡΓΙΑ (ΒΕΛΤΙΣΤΩΝ) ΣΤΟΙΧΙΣΕΩΝ ΧΡΗΣΗ ΚΑΤΑΛΛΗΛΟΥ ΣΥΣΤΉΜΑΤΟΣ ΒΑΘΜΟΝΟΜΗΣΗΣ (Scoring System) ΠΙΝΑΚΕΣ ΑΝΤΙΚΑΤΑΣΤΑΣΗΣ ΠΟΙΝΕΣ ΕΙΣΑΓΩΓΗΣ ΚΕΝΩΝ

Χρήση αθροιστικών συστήματων Για κάθε θέση σε μιά στοίχιση αντιστοιχώ μια βαθμολογία Τι μπορεί να εκφράζει?? Η βαθμολογία της στοίχισης προκύπτει από το άθροισμα των βαθμολογιών Τι γίνεται όμως με τον Έλεγχο Υποθέσεων (Η 0,Η 1 )?? Θα ήθελα να έχω πιθανότητες => ολική πιθανότητα της στοίχισης Βολεύει?

Πίνακες Αντικατάστασης (ΠΑ) (aka Substitution/Mutation/Scoring Matrices) Στη γενική περίπτωση (π.χ. DNA): Συνήθως είναι Συμμετρικοί πίνακες (s i,j =s j,i ) Είναι δυνατόν να εκφράζουν μέτρο ΟΜΟΙΟΤΗΤΑΣ ή ΑΠΟΣΤΑΣΗΣ

Πως μπορώ να δημιουργήσω ένα (χρήσιμο) ΠΑ? Για Νουκλεοτιδικές Ακολουθίες: Συνήθως απλοί εμπειρικοί πίνακες [προβλήματα??] Δεν υπονοείται κάποιο συγκεκριμμένο εξελικτικό μοντέλο [??] Για Αμινοξικές Ακολουθίες: Ορισμένες μεταλλάξεις αναμένεται να είναι λιγότερο πιθανές [Κ=>R, K=>V??] Δομικές/Φυσικοχημικές/Λειτουργικές πιέσεις [εξελικτικές??] Εξάρτηση από τον τύπο των πρωτεϊνών και την εξελικτική τους συγγένεια Προϊόν ανάλυσης ΠΡΑΓΜΑΤΙΚΩΝ δεδομένων

Επιθυμητά χαρακτηριστικά ΠΑ Τα στοιχεία της κύριας διαγωνίου αναμένουμε να έχουν τη μεγαλύτερη τιμή της αντίστοιχης γραμμής/στήλης [ΓΙΑΤΙ??] Θετικά scores για συντηρητικές μεταλλαγές Προκειμένου για τοπικές στοιχίσεις αρνητική αναμενόμενη τιμή score (δείτε παρακάτω) Δυνατότητα διάκρισης σε διάφορες εξελικτικές αποστάσεις

Ένας απλός ΠΑ (για νουκλεοτιδικές ακολουθίες) Ο Μοναδιαίος Πίνακας Ταυτοτήτων (Identity Matrix)

.. κι άλλοι δυο απλοί ΠΑ Ποια η διαφορά??

Πίνακες Αντικατάστασης (για αμινοξικές ακολουθίες) Δύο κύριες προσεγγίσεις Η οικογένεια των πινάκων PAM Μαρκοβιανό μοντέλο εξέλιξης Φυλογενετικά δέντρα Λογαριθμικοί λόγοι πιθανοφάνειας (log-likelihood ratios) Η οικογένεια των πινάκων BLOSUM Λογαριθμικοί λόγοι πιθανοφάνειας (log-likelihood ratios)

Η Οικογένεια των Πινάκων PAM (Dayhoff, Schwartz, and Orcutt, 1978) Βασίζεται σε στοχαστικές Μαρκοβιανές διαδικασίες και στην κατασκευή φυλογενετικών δέντρων για το ταίριασμα με ένα εξελικτικό μοντέλο Υπολογισμός Πίνακα μεταβάσεων μετά από απαρίθμηση αντικαταστάσεων Υπολογισμός Πίνακα Αντικατάστασης (log-odds ratio) Μια Σημειακή Μεταλλαγή λέγεται αποδεκτή όταν έχει τη δυνατότητα να εξαπλωθεί και να επικρατήσει ΚΕΝΤΡΙΚΗ ΙΔΕΑ σε ένα πληθυσμό PAM (Point Accepted Mutations)

Έχω ξαναδεί πίνακα μεταβάσεων?? Ναιιιιιιιιιιιιιιιιιιιιιιι! Α a G a a a a C a T To: A G C T --------------------------------- A 1-3a a a a From: G a 1-3a a a C a a 1-3a a T a a a 1-3a

Το υποκείμενο εξελικτικό μοντέλο: Κάθε θέση σε μια ακολουθία εξελίσσεται με βάση μια ανεξάρτητη (από τη θέση) Μαρκοβιανή διαδικασία Markov Chain 1 Markov Chain 2 Markov Chain 3... M R A Q F A. M K A Q F A. M K A Q F A. M K A Q F T. 1 2 3 4 Χρόνος Όλες αυτές οι διαδικασίες έχουν τον ίδιο πίνακα μεταβάσεων P (20x20) Προσδιορισμός από δεδομένα πρωτεϊνικών ακολουθιών

Ο Πίνακας μεταβάσεων PAM1 Είναι ο πίνακας μεταβάσεων μιας Μαρκοβιανής διαδικασίας για μια χρονική περίοδο στην οποία αναμένουμε 1% των αμινοξικών καταλοίπων να υποστούν αποδεκτή σημειακή μεταλλαγή Στοίχιση όμοιων πρωτεϊνικών ακολουθιών (>85% id)???? ΓΙΑΤΙ????? ΠΙΝΑΚΑΣ? Ανακατασκευή φυλογενετικού δέντρου και ακολουθιών στους εσωτερικούς κόμβους Απαρίθμηση αντικαταστάσεων Εκτίμηση πιθανοτήτων αντικαταστάσεων

PAM1 (pt. II) Πολλαπλές στοιχίσεις χωρίς κενά 71 πρωτεϊνικές οικογένειες Επιλογή καλά διατηρημένων περιοχών (Μόνο) 1572 αντικαταστάσεις Δημιουργία φυλογενετικών δέντρων => Maximum Parsimony Ανακατασκευή αρχαίων ακολουθιών και απαρίθμηση

Ο πίνακας απαρίθμησης ACGH DEGH ADIF CEIF ACGH DEGH ADIF CEIF E-C A-D E-D A-C AEGH AEIF I-G H-F

... και το Original...

Σχετική μεταλλαξιμότητα και πίνακας μεταβάσεων Σχετική Μεταλλαξιμότητα: Για κάθε τύπο αμινοξικού καταλοίπου Χ, εκτιμώ την πιθανότητα αντικατάστασής του από οποιοδήποτε κατάλοιπο Πίνακας Μεταβάσεων

... και το Λάμδα? Παράγοντας Στάθμισης Τι σταθμίζει? Επιλογή τιμής λ ώστε 1% των καταλοίπων να παθαίνουν PAM => PAM1 Η αντίστοιχη εξελικτική απόσταση: 1-PAM

Υπολογισμός λ για 1-ΡΑΜ Έστω ότι μελετούμε μια θέση μιας ακολουθίας και A n είναι το κατάλοιπο τη χρονική στιγμή n Η πιθανότητα αλλαγής του μετά από χρόνο 1PAM είναι όπου F j η παρατηρούμενη συχνότητα του καταλοίπου τύπου j

Υπολογισμός λ για 1-ΡΑΜ (pt II)

BIO 650: Ειδικά Θέματα Βιοπληροφορικής, 18/02/2008

Κατασκευή ΠΑ ΡΑΜ1 Έστω οι ακολουθίες α=α 1 α 2...α m και β=β 1 β 2...β m Η βαθμονόμηση της στοίχισής τους αντιστοιχεί με τον έλεγχο δύο αλληλοαποκλειόμενων υποθέσεων Η 0 : οι α, β ΔΕΝ ΕΧΟΥΝ εξελικτική σχέση [τυχαία στοίχιση] Η 1 : οι α, β ΕΧΟΥΝ κοινό πρόγονο [οι α, β εξαρτώνται μέσω της Μαρκοβιανής διαδικασίας] Για τη στοίχισή τους με βάση την υπόθεση Η 0 : α 1 α 2...α m β 1 β 2...β m

Κατασκευή ΠΑ ΡΑΜ1 (pt II) Με βάση την υπόθεση Η 1 : Επιθυμούμε το score να αντικατοπτρίζει την πιθανότητα εξελικτικής σχέσης. Λογική επιλογή του λόγου:

ΡΑΜ250??

Πίνακες BLOSUM BLOcks SUbstitution Matrices Δε γίνεται καμιά αναφορά σε εξελικτικό μοντέλο Στατιστική ανάλυση συντηρημένων Blocks χωρίς κενά από σχετιζόμενες πρωτεϊνικές οικογένειες Υπολογισμός συχνοτήτων στόχων/υποβάθρου log-likelihood ratios Πατέντα!!!

BLOSUM62

Τα νούμερα των BLOSUM Ομαδοποίηση όμοιων ακολουθιών Κατώφλι ομοιότητας x% => BLOSUMx Σταθμισμένη συνεισφορά

PAM vs BLOSUM BLOSUM: σημαντικά μεγαλύτερος όγκος δεδομένων [min F = 2369] PAM1 [ακριβής] ~ PAMn [προσεγγιστικά] BLOSUM1-BLOSUM100 [ακριβής] BLOSUM100... BLOSUM62... BLOSUM10... PAM1... PAM120... PAM250...

Οι ΠΑ από μια άλλη σκοπιά

Πληροφοριακό περιεχόμενο ΠΑ Σχετική εντροπία

Συζήτηση...