Ειδικά Θέματα Βιοπληροφορικής

Σχετικά έγγραφα
Μηχανική μάθηση (Machine Learning)

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

ΔΕΥΤΕΡΟΓΕΝΕΙΣ ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Συγκριτική Γονιδιωματική

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

Μέθοδοι μελέτης εξέλιξης

Ειδικά Θέματα Βιοπληροφορικής

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Μ.Δ.Ε. ''ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ''

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΙΑΤΡΙΚΗ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Μ.Δ.Ε. ''ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ''

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

LALING/PLALING :

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες

Βιοπληροφορική. Ενότητα 19: Υπολογιστικός Προσδιορισμός Δομής (1/3), 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Πολλαπλή στοίχιση multiple sequence alignment (MSA)

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Δευτεροταγείς βάσεις δεδομένων (Secondary databases)

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST

Φυλογένεση. 5o εργαστήριο

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Βιοπληροφορική. Παντελής Γ. Μπάγκος. Πανεπιστήμιο Θεσσαλίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

Κατά ζεύγη στοίχιση ακολουθιών Πολλαπλή στοίχιση ακολουθιών Patterns. Δρ. Μαργαρίτα Θεοδωροπούλου

Θέµα 3: Dynamic Time Warping (DTW). Hidden Markov Models (HMM).

Κεφάλαιο 4 Πολλαπλή Στοίχιση Ακολουθιών

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου

Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

ΑΠΑΝΤΗΣΗ ΤΗΣ ΣΥΝΔΥΑΣΤΙΚΗΣ ΑΣΚΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

Ειδικά Θέματα Βιοπληροφορικής

Πιθανοτικός Συμπερασμός: Πού βρίσκομαι στο πλέγμα; [ΠΛΗ 513] Αυτόνομοι πράκτορες - Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΒΙΟΧΗΜΕΙΑΣ ΚΑΙ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

Κεφάλαιο 3 Πολυπλεξία

Βιοπληροφορική II. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Τι προσφέρει το NCBI. Πληκτρολογούμε:

Θεωρία Λήψης Αποφάσεων

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

Διδάσκων: Κωνσταντίνος Κώστα

Θεωρία - Εφαρμογές ΓΕΝΕΤΙΚΗ ΒΕΛΤΙΩΣΗ ΦΥΤΩΝ - ΜΟΡΙΑΚΟΙ ΔΕΙΚΤΕΣ 1

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Εξερευνώντας την Εξέλιξη Κεφάλαιο 7

ιαµέριση - Partitioning

Επικοινωνία Ανθρώπου Υπολογιστή. Β2. Αναγνώριση ομιλίας

Εργασία στο µάθηµα Ανάλυση εδοµένων

METROPOLIS. Ένα περιβάλλον σχεδιασμού για ετερογενή συστήματα

Transcript:

Ειδικά Θέματα Βιοπληροφορικής Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1

Διάλεξη 5 Profile Hidden Markov Models και Transformational Grammars 2

Profile HMM Ένα ΗΜΜ με left-to-right αρχιτεκτονική Μπορεί να ειδωθεί σαν επέκταση των profiles Διαθέτει ειδικά states τα οποία δεν έχουν emissions (non-emitting states) Περιγράφουν στατιστικά μια πολλαπλή στοίχιση Προτάθηκαν από τους Hughey and Krogh (1996) 3

Γενική αρχιτεκτονική phmm 4

Ιδιαιτερότητες Αντίστοιχα ορίζονται οι πιθανότητες γέννησης οι οποίες γεννούν τα σύμβολα σε κάθε κατάσταση. Έτσι υπάρχει και εδώ μια αλληλουχία καταστάσεων η οποία είναι κρυφή και μια αλληλουχία συμβόλων που είναι φανερή, και θεωρούμε ότι παράγεται από την αλληλουχία των καταστάσεων. Οι καταστάσεις σύμπτωσης και εισαγωγής, είναι κανονικές καταστάσεις οι οποίες συνδέονται μέσω των πιθανοτήτων γέννησης με την εμφάνιση συμβόλων. Oι μεν καταστάσεις σύμπτωσης αντιστοιχούν σε στήλες της πολλαπλής στοίχισης οι οποίες στοιχίζονται καλά και άρα αντιστοιχούν σε περιοχή με ομοιότητα, ενώ οι καταστάσεις εισαγωγής, αντιστοιχούν σε περιοχές στις οποίες έχουμε εισαγωγή χαρακτήρων που δεν στοιχίζονται καλά. Οι περιοχές αυτές, οι οποίες δεν υπάρχουν στις υπόλοιπες ακολουθίες, εμφανίζονται ως κενά τα οποία μοντελοποιούνται μέσω των σιωπηρών καταστάσεων απαλοιφής. 5

Ιδιαιτερότητες Εκπαίδευση με full Baum-Welch, Simulated annealing ή Viterbi training Για την κατασκευή μπορεί να απαιτείται μια πολλαπλή στοίχιση ή και όχι Στοίχιση της ακολουθίας με το μοντέλο με κλασσικό Viterbi Πολλαπλή στοίχιση μέσω στοίχισης ακολουθιών με το μοντέλο 6

7

Πλεονεκτήματα Με την εισαγωγή των διαφορετικών καταστάσεων σύμπτωσης και εισαγωγής, γίνεται μια σημαντική τομή σε σχέση με τις κλασσικές μεθόδους στοίχισης, οι οποίες καθώς δεν προϋποθέτουν ένα μοντέλο δεν διαχωρίζουν τις πληροφοριακές θέσεις στην στοίχιση από τις απλές τυχαίες εισαγωγές. Επιπλέον, για πρώτη φορά οι ποινές για την εισαγωγή κενών (gap penalties), δεν τίθενται εκ των προτέρων αλλά εκτιμώνται από τα δεδομένα και αναπαρίστανται με καθαρά πιθανοθεωρητικό τρόπο, αποκλείοντας την υποκειμενική παρέμβαση. Έτσι, με τέτοια μοντέλα, είμαστε σε θέση να πραγματοποιήσουμε ιδιαίτερα ευαίσθητες αναζητήσεις και να εντοπίσουμε απομακρυσμένες ομολογίες (remote homologies), τις οποίες οι παραδοσιακοί αλγόριθμοι στοίχισης δεν θα μπορούσαν να εντοπίσουν. 8

Πολλαπλή Στοίχιση 9

Χρήσεις Πολλαπλή στοίχιση Κατασκευή χαρακτηριστικών profiles Εντοπισμός remote homologues Αναζητήσεις σε βάσεις δεδομένων 10

Πολλαπλή στοίχιση a=caefddh b=cdaefpddh Viterbi a = CAEFDDH Pa=m 0 m 1 m 2 m 3 m 4 d 5 d 6 m 7 m 8 m 9 m 10 b = CDAEFPDDH Pb=m 0 m 1 i 1 m 2 m 3 m 4 d 5 m 6 m 7 m 8 m 9 m 10 C A E F D D H m 0 m 1 m 2 m 3 m 4 d 5 d 6 m 7 m 8 m 9 m 10 C D A E F P D D H m 0 m 1 i 1 m 2 m 3 m 4 d 5 m 6 m 7 m 8 m 9 m 10 11

Γενικά CAEFTPAVH CKETTPADH CAETPDDH CAEFDDH CDAEFPDDH Viterbi m 0 m 1 m 2 m 3 m 4 m 5 m 6 m 7 m 8 m 9 m 10 m 0 m 1 m 2 m 3 m 4 m 5 m 6 m 7 m 8 m 9 m 10 m 0 m 1 m 2 m 3 d 4 m 5 m 6 m 7 m 8 m 9 m 10 m 0 m 1 m 2 m 3 m 4 d 5 d 6 m 7 m 8 m 9 m 10 m 0 m 1 i 1 m 2 m 3 m 4 d 5 m 6 m 7 m 8 m 9 m 10 C-AEFTPAVH C-KETTPADH C-AE-TPDDH C-AEF--DDH CDAEF-PDDH 12

Διαδικασία Μια ακολουθία για την οποία υπάρχουν πειραματικές ενδείξεις για την λειτουργία ή τη δομή της Αναζήτηση σε βάσεις δεδομένων (BLAST, PSI- BLAST) Συλλογή ομολόγων, επιλογή ξεσκαρτάρισμα κλπ Πολλαπλή στοίχιση (μπορεί και τροποποίηση αυτής με το χέρι) Προγνώσεις (Secondary structure, TM κλπ) Κατασκευή ΗΜΜ, αξιολόγηση του Αναζήτηση εκ νέου σε βάσεις δεδομένων 13

14

15

Διαθέσιμα πακέτα HMMER (http://hmmer.wustl.edu/) HMMpro (http://www.netid.com/) SAM (http://www.cse.ucsc.edu/research/compbio/sam.h tml) PFTOOLS (http://www.isrec.isb-sib.ch/ftp-server/pftools/) [PROSITE PATTERNS] 16

HMMER GNU license Ανανεώνεται συνεχώς Τρέχει σε όλες τις πλατφόρμες Ποικιλία εργαλείων Ευέλικτη αρχιτεκτονική 17

HMMER 18

Ρουτίνες του HMMER hmmbuild: Πρόγραμμα με χρήση του οποίου, ξεκινώντας από μια αρχική πολλαπλή στοίχιση, κατασκευάζεται ένα μοντέλο ΗΜΜ το οποίο να την περιγράφει. hmmalign: Πρόγραμμα με το οποίο μια σειρά ακολουθιών οι οποίες προέρχονται από ένα ΗΜΜ, στοιχίζονται σε μια πολλαπλή στοίχιση. Η πολλαπλή στοίχιση, επιτυγχάνεται μέσω διαδοχικών στοιχίσεων των ακολουθιών με το μοντέλο. hmmsearch: Πρόγραμμα το οποίο, πραγματοποιεί αναζητήσεις ενός μοντέλου ΗΜΜ έναντι μιας βάσης ακολουθιών πρωτεϊνών. phmmer: Πρόγραμμα το οποίο πραγματοποιεί αναζήτηση μια πρωτεϊνικής αλληλουχίας έναντι μιας βάσης δεδομένων πρωτεϊνών (ανάλογο με το BLASTP) jackhmmer: Πρόγραμμα το οποίο πραγματοποιεί επαναληπτικές αναζητήσεις μια πρωτεϊνικής αλληλουχίας έναντι μιας βάσης δεδομένων πρωτεϊνών (ανάλογο με το PSI-BLAST) 19

Ρουτίνες του HMMER hmmscan: Πρόγραμμα με το οποίο πραγματοποιούνται αναζητήσεις μιας η περισσότερων ακολουθιών έναντι μιας βάσης δεδομένων από μοντέλα ΗΜΜ. Πρέπει να τονιστεί εδώ, ότι αν έχουμε μια ακολουθία και ένα ΗΜΜ, τα δυο παραπάνω προγράμματα επιστρέφουν ακριβώς το ίδιο αποτέλεσμα. Αν διαφέρουν, είτε οι ακολουθίες είτε τα μοντέλα, τότε δίνουν άλλο αποτέλεσμα, λόγω του διαφορετικού τρόπου υπολογισμού της στατιστικής σημαντικότητας. nhmmer: Πρόγραμμα που πραγματοποιεί αναζήτηση μιας ακολουθίας DNA, μιας στοίχισης ή ενός phmm, έναντι μιας βάσης ακολουθιών DNA. (ανάλογο με το BLASTN) nhmmscan: Πρόγραμμα που πραγματοποιεί αναζήτηση μιας ακολουθίας DNA έναντι μιας βάσης δεδομένων από DNA profile HMΜ. hmmconvert: Πρόγραμμα που μετατρέπει μοντέλα ΗΜΜ από και προς τη μορφή του HMMER3. hmmemit: Πρόγραμμα, με το οποίο εκπέμπεται η καλύτερη (ανάλογα με τον ορισμό) ακολουθία η οποία θα μπορούσε να παραχθεί από το μοντέλο. hmmpress: Μετατρέπει μια βάση δεδομένων HMM σε δυαδικό κώδικα για το hmmscan. hmmstat: δείχνει συνοπτικά στατιστικά για μια βάση δεδομένων ΗΜΜ. 20

21

διαδικασία χαρακτηρισμού μιας πρωτεϊνικής οικογένειας Στην αρχή, ξεκινάμε με μια ακολουθία για την οποία υπάρχουν πειραματικές ενδείξεις για τη λειτουργία ή τη δομή της Γίνεται αναζήτηση σε βάσεις δεδομένων (BLAST, PSI-BLAST ή πλέον, με το HMMER) Συλλογή ομολόγων, επιλογή και ξεσκαρτάρισμα Γίνεται μια πολλαπλή στοίχιση (μπορεί και τροποποίηση αυτής με το χέρι) Ανάλογα με την περίπτωση, πραγματοποιούνται προγνώσεις (δευτεροταγούς δομής, διαμεμβρανικών τμημάτων ή οποιουδήποτε άλλου χρήσιμου χαρακτηριστικού) Γίνεται κατασκευή ΗΜΜ και αξιολόγηση του (HMMER) Αναζήτηση εκ νέου σε βάσεις δεδομένων, μέχρι να μην προκύπτουν νέα μέλη της οικογένειας. 22

ΗΜΜpro Commercial Software Παραθυρικό interface 23

SAM 24