Μηχανική μάθηση (Machine Learning)

Σχετικά έγγραφα
Ειδικά Θέματα Βιοπληροφορικής

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

{takasu, Conditional Random Field

EM Baum-Welch. Step by Step the Baum-Welch Algorithm and its Application 2. HMM Baum-Welch. Baum-Welch. Baum-Welch Baum-Welch.

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΙΑΤΡΙΚΗ»

Buried Markov Model Pairwise

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

HMY 795: Αναγνώριση Προτύπων

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων


2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

th International Conference on Machine Learning and Applications. E d. h. U h h b w k. b b f d h b f. h w k by v y

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

Automatic extraction of bibliography with machine learning

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

: Active Learning 2017/11/12

Κβαντική Επεξεργασία Πληροφορίας

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

Stabilization of stock price prediction by cross entropy optimization

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Διακριτικές Συναρτήσεις

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π.

ΓΙΑΝΝΟΥΛΑ Σ. ΦΛΩΡΟΥ Ι ΑΚΤΟΡΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕ ΟΝΙΑΣ ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ

Vol. 31,No JOURNAL OF CHINA UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

Μηχανουργική Τεχνολογία ΙΙ

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Συγκριτική Γονιδιωματική

The Algorithm to Extract Characteristic Chord Progression Extended the Sequential Pattern Mining

1 n-gram n-gram n-gram [11], [15] n-best [16] n-gram. n-gram. 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e)

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE FACULTY OF INFORMATICS AND TELECOMMUNICATIONS

Τεχνητή Νοημοσύνη ΙΙ. Ενότητα : Μηχανική Μάθηση. Σγάρμπας Κυριάκος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Bayesian Discriminant Feature Selection

[1] DNA ATM [2] c 2013 Information Processing Society of Japan. Gait motion descriptors. Osaka University 2. Drexel University a)

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

LALING/PLALING :

Splice site recognition between different organisms

[15], [16], [17] [6] [2] [5] Jiang [6] 2.1 [6], [10] Score(x, y) y ( 1) ( 1 ) b e ( 1 ) b e. O(n 2 ) Jiang [6] (word lattice reranking)

Πληροφοριακά Συστήματα & Περιβάλλον

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

Random Forests Leo. Hitoshi Habe 1

Πρόβλημα 1: Αναζήτηση Ελάχιστης/Μέγιστης Τιμής

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

BMI/CS 776 Lecture #14: Multiple Alignment - MUSCLE. Colin Dewey

Big Data/Business Intelligence

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Επικοινωνία Ανθρώπου Υπολογιστή. Β2. Αναγνώριση ομιλίας

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

Quick algorithm f or computing core attribute

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Μελέτη αναπαραστάσεων γονιδιωματικών ακολουθιών σε προβλήματα ταξινόμησης

ΜΟΝΤΕΛΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ

Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d)

ΜΟΝΤΕΛΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

Solution Series 9. i=1 x i and i=1 x i.

EPL 603 TOPICS IN SOFTWARE ENGINEERING. Lab 5: Component Adaptation Environment (COPE)

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

Other Test Constructions: Likelihood Ratio & Bayes Tests

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

ΜΕΘΟΔΟΙ ΥΠΟΛΟΓΙΣΜΟΥ ΤΗΣ ΖΕΝΙΘΕΙΑΣ ΤΡΟΠΟΣΦΑΙΡΙΚΗΣ ΥΣΤΕΡΗΣΗΣ ΣΕ ΜΟΝΙΜΟΥΣ ΣΤΑΘΜΟΥΣ GNSS

Μάθηση Λανθανόντων Μοντέλων με Μερικώς Επισημειωμένα Δεδομένα (Learning Aspect Models with Partially Labeled Data) Αναστασία Κριθαρά.

BΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ.

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Δευτεροταγείς βάσεις δεδομένων (Secondary databases)

Πανεπιστήµιο Μακεδονίας Τµήµα ιεθνών Ευρωπαϊκών Σπουδών Πρόγραµµα Μεταπτυχιακών Σπουδών στις Ευρωπαϊκές Πολιτικές της Νεολαίας

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ΠΠΜ 512: Ανάλυση Κινδύνου για Πολιτικούς Μηχανικούς και Μηχανικούς Περιβάλλοντος

Βιοπληροφορική. Ενότητα 19: Υπολογιστικός Προσδιορισμός Δομής (1/3), 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Schedulability Analysis Algorithm for Timing Constraint Workflow Models

Detection and Recognition of Traffic Signal Using Machine Learning

Εξόρυξη Γνώσης από Βιολογικά εδομένα

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

Transcript:

Μηχανική μάθηση (Machine Learning)

Μηχανική Μάθηση The field of study that gives computers the ability to learn without being explicitly programmed Arthur Samuel (1959) "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E Tom M. Mitchell (1997)

Αλγόριθμοι Μηχανικής Μάθησης Artificial Neural Networks (ANNs) Dynamic Bayesian Networks (DBNs) Support Vector Machines (SVMs) Decision Trees, Random Forests Conditional Random Fields Hidden Markov Models (HMMs) Hidden Neural Networks (HNNs)

Μηχανική Μάθηση Επιβλεπόμενη Μάθηση (Supervised Learning) Στη µάθηση µε επίβλεψη το σύστηµα καλείται να "µάθει" µια έννοια ή συνάρτηση από ένα σύνολο δεδοµένων (labeled data), η οποία αποτελεί περιγραφή ενός µοντέλου. Μη επιβλεπόμενη Μάθηση (Unsupervised Learning) Στη µάθηση χωρίς επίβλεψη το σύστηµα πρέπει µόνο του να ανακαλύψει συσχετίσεις ή οµάδες σε ένα σύνολο δεδοµένων (unlabeled data), δηµιουργώντας πρότυπα, χωρίς να είναι γνωστό αν υπάρχουν, πόσα και ποια είναι. Μερικώς επιβλεπόμενη Μάθηση (Semi-supervised Learning) Το σύστημα σε αυτή την περίπτωση καλείται να μάθει τόσο από γνωστά δεδομένα (labeled data) όσο και από άγνωστα (unlabeled data). Μάθηση εννοιών στον Άνθρωπο!

Μηχανική Μάθηση "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E Tom M. Mitchell (1997) Μοντέλο Παρατήρηση, ανάλυση του προβλήματος Σύνολο εκπαίδευσης Αντιπροσωπευτικό, αξιόπιστο Σύνολο ελέγχου Ανεξάρτητο από σύνολο εκπαίδευσης Δείκτες επιτυχίας Κατάλληλοι για την φύση του προβλήματος

Hidden Markov Models (HMMs)

Μαρκοβιανά Μοντέλα Εξάρτησης (Markov Models) Πιθανοθεωρητικά (στοχαστικά) μοντέλα Η θεώρηση μιας ακολουθίας ενδεχομένων ως αλυσίδα Markov πολύ απλά στηρίζεται στην ιδέα ότι κάθε ένα από τα ενδεχόμενα εξαρτάται μόνο από το αμέσως προηγούμενό του, ή αλλιώς το κάθε ενδεχόμενο καθορίζει με κάποια πιθανότητα το αμέσως επόμενό του. Κατάλληλα μοντέλα για βιολογικές ακολουθίες, καθώς αντικατοπτρίζουν την έννοια της πληροφορίας που αυτές περιέχουν.

Μαρκοβιανά Μοντέλα Εξάρτησης (Markov Models) Παραδείγματα από τις φυσικές γλώσσες (στα αγγλικά το Q ακολουθείται με μεγαλύτερη πιθανότητα από U, παρά από κάποιο άλλο). Ο Markov εμπνεύστηκε τις ομώνυμες αλυσίδες απο ένα ποίημα του Pushkin (Eugene Onegin). >20.000 γράμματα 57% σύμφωνα 43% φωνήεντα αλλά Φ --> Σ 87% Σ --> Φ 66% ``My uncle -- high ideals inspire him; but when past joking he fell sick, he really forced one to admire him and never played a shrewder trick. Let others learn from his example! But God, how deadly dull to sample sickroom attendance night and day and never stir a foot away!...

Μαρκοβιανά Μοντέλα Εξάρτησης (Markov Models) Markov 1 Markov 2

Μαρκοβιανά Μοντέλα Εξάρτησης (Markov Models) ATTGTAATCTCACGGTGTACGCGCATGCACAGTCAGT

Μαρκοβιανά Μοντέλα Εξάρτησης (Markov Models) States (καταστάσεις) Transitions (μεταβάσεις)

Hidden Markov Models Αν φανταστούμε ένα καζίνο, το οποίο χρησιμοποιεί κάθε φορά με συγκεκριμένη πιθανότητα, ένα αμερόληπτο (fair) ζάρι και ένα μεροληπτικό (loaded) ζάρι. + = μεροληπτικό - = αμερόληπτο 214526436636561666232145 --------++++++++++------ Ο παίχτης κάθε φορά γνωρίζει μόνο το αποτέλεσμα, και όχι την φύση του ζαριού. Το μοντέλο που μπορεί να περιγράψει αυτή την κατάσταση είναι το Hidden Markov Model, και ονομάζεται έτσι (κρυμμένο) γιατί πλέον δεν υπάρχει 1-1 αντιστοίχηση του αποτελέσματος, με την πραγματική κατάσταση.

Hidden Markov Models Ένα Hidden Markov Model (ΗΜΜ), αποτελείται από ένα σύνολο κρυφών καταστάσεων, ένα σύνολο παρατηρούμενων συμβόλων, και δυο σύνολα πιθανοτήτων, τις πιθανότητες μετάβασης και τις πιθανότητες εκπομπής (ή γεννήσεως). Observed symbols Hidden states! Πρέπει να τονιστεί, ότι σε ένα ΗΜΜ η μαρκοβιανή ιδιότητα ισχύει για τις καταστάσεις του μοντέλου (states), και όχι για τα σύμβολα.

Hidden Markov Models 0.95 0.9 1: 1/6 2: 1/6 3: 1/6 4: 1/6 5: 1/6 6: 1/6 Αμερόληπτο ζάρι (FAIR) 0.05 0.1 1: 1/10 2: 1/10 3: 1/10 4: 1/10 5: 1/10 6: 1/2 Μεροληπτικό ζάρι (LOADED)

Τα 3 βασικά ερωτήματα σε ένα HMM...

... και οι απαντήσεις τους

Hidden Markov Models Ενα ΗΜΜ, αφού υπολογιστούν οι παραμέτροι του (πιθανότητες μεταβάσεως κλπ) απο ένα σύνολο πρωτεϊνών γνωστής δομής (training set), χρησιμοποιείται για την πρόγνωση-αποκωδικοποίηση, σε ένα σύνολο πρωτεϊνών άγνωστης δομής (test set). Οι μέθοδοι αποκωδικοποίησης, δηλαδή εύρεσης της αλληλουχίας των καταστάσεων εάν είναι γνωστή η αλληλουχία των συμβόλων, είναι βασικά 2, η αποκωδικοποίηση Viterbi, και η εκ των υστέρων αποκωδικοποίηση (posterior decoding). Συνήθως σε περιπτώσεις πολύπλοκων μοντέλων, είναι πιο χρήσιμη η εκ των υστέρων αποκωδικοποίηση.

Hidden Markov Models (πλεονεκτήματα)

Hidden Markov Models (εφαρμογές)

A E K... L Y Hidden Markov Models A E K... L Y A E K... L Y H C E

Hidden Markov Models

Hidden Markov Models Σύνολο εκπαίδευσης (αντιπροσωπευτικό, μη ομόλογο, labeled data) >protein1 KRAIYPGTFDPITNGHIDIVTRATQMFDHVILAIAASPSKKPMFTLEERVALAQQAT CEEEEEECCCCCCHHHHHHHHHHHHHCCEEEEEEECCCCCCCCCCHHHHHHHHHHHC >protein2 NSTVVSNSELILNLTPIALAYTVQSLPLIATQPAWLGTIADNYSKWRWVSLRI CCEEEEEEEEEEECCEECCCCEEEEEECCCCCCHHHHHHHCCEEEEEEEEEEE... >protein200 MVSKLSQLQTELLAALLESGLSKEALIQALG CCCCCCHHHHHHHHHHHHCCCCHHHHHHHCC

Hidden Markov Models Σύνολο ελέγχου (αντιπροσωπευτικό, μη ομόλογο, ανεξάρτητο από το σύνολο εκπαίδευσης!) >P08172 MNNSTNSSNNSLALTSPYKTFEVVFIVLVAGSLSLVTIIGNILVMVSIKVNRHLQTV NNYFLFSLTNSSNNSLALTSPYKTFEVVFIVLVAGSLSLVTIIGNILVMVSIKVNRH LQTVNNYFLFSLACADLIIGVF >P08173 MANFTPVNGSSGNQSVRLVTSSSHNRYETVEMVFIATVTGSLSLVTVVGNILVMLSI KVNRQLQTVNNYFLFSLA... >P50052 MKGNSTLATTSKNITSKNITSKNITSKNITSKNITSGLHFGLVNISGNNESTLNCSQ KPSDKHLDAIPILYYIIFVIGFLVNIVVVTLFCCQIVVVTLFCCQKGP

Hidden Markov Models

Hidden Markov Models

Hidden Markov Models (εφαρμογές)

Hidden Markov Models (εφαρμογές)

Hidden Markov Models (εφαρμογές)

Hidden Markov Models (εφαρμογές)

Hidden Markov Models (εφαρμογές)

Hidden Markov Models (εφαρμογές)

profile Hidden Markov Models (phmms) D k I k Begin M k End

profile Hidden Markov Models (phmms) Ένα HMM με left-to-right αρχιτεκτονική (μονόδρομη κατεύθυνση των μεταβάσεων). Διαθέτει ειδικά states τα οποία δεν έχουν emissions (nonemitting states) Περιγράφουν στατιστικά μια πολλαπλή στοίχιση. Προτάθηκαν απο τους Hughey και Krogh (1996).

profile Hidden Markov Models (phmms) D k I k Begin M k End

profile Hidden Markov Models (phmms) Ιδιαιτερότητες

profile Hidden Markov Models (phmms)

profile Hidden Markov Models (phmms) Πλεονεκτήματα

profile Hidden Markov Models (phmms)

profile Hidden Markov Models (phmms) Χρήσεις Πολλαπλή στοίχιση Κατασκευή χαρακτηριστικών profiles Εντοπισμός remote homologues Αναζητήσεις σε βάσεις δεδομένων

Software http://www.cfar.umd.edu/~kanungo/software/software.html HMMER (http://hmmer.org/) SAM (http://www.cse.ucsc.edu/research/compbio/sam.html) pftools package (http://web.expasy.org/pftools/)

HMMER GNU license Ανανεώνεται συνεχώς Τρέχει σε όλες τις πλατφόρμες Ποικιλία εργαλείων Ευέλικτη αρχιτεκτονική

HMMER hmmbuild: Πρόγραμμα με χρήση του οποίου, ξεκινώντας από μια αρχική πολλαπλή στοίχιση, κατασκευάζεται ένα μοντέλο ΗΜΜ το οποίο να την περιγράφει. hmmalign: Πρόγραμμα με το οποίο μια σειρά ακολουθιών οι οποίες προέρχονται από ένα ΗΜΜ, στοιχίζονται σε μια πολλαπλή στοίχιση. Η πολλαπλή στοίχιση, επιτυγχάνεται μέσω διαδοχικών στοιχίσεων των ακολουθιών με το μοντέλο. hmmsearch: Πρόγραμμα το οποίο, πραγματοποιεί αναζητήσεις ενός μοντέλου ΗΜΜ έναντι μιας βάσης ακολουθιών πρωτεϊνών. phmmer: Πρόγραμμα το οποίο πραγματοποιεί αναζήτηση μια πρωτεϊνικής αλληλουχίας έναντι μιας βάσης δεδομένων πρωτεϊνών (ανάλογο με το BLASTP) jackhmmer: Πρόγραμμα το οποίο πραγματοποιεί επαναληπτικές αναζητήσεις μια πρωτεϊνικής αλληλουχίας έναντι μιας βάσης δεδομένων πρωτεϊνών (ανάλογο με το PSI-BLAST) hmmscan: Πρόγραμμα με το οποίο πραγματοποιούνται αναζητήσεις μιας η περισσότερων ακολουθιών έναντι μιας βάσης δεδομένων από μοντέλα ΗΜΜ. Πρέπει να τονιστεί εδώ, ότι αν έχουμε μια ακολουθία και ένα ΗΜΜ, τα δυο παραπάνω προγράμματα επιστρέφουν ακριβώς το ίδιο αποτέλεσμα. Αν διαφέρουν, είτε οι ακολουθίες είτε τα μοντέλα, τότε δίνουν άλλο αποτέλεσμα, λόγω του διαφορετικού τρόπου υπολογισμού της στατιστικής σημαντικότητας.

HMMER nhmmer: Πρόγραμμα που πραγματοποιεί αναζήτηση μιας ακολουθίας DNA, μιας στοίχισης ή ενός phmm, έναντι μιας βάσης ακολουθιών DNA. (ανάλογο με το BLASTN) nhmmscan: Πρόγραμμα που πραγματοποιεί αναζήτηση μιας ακολουθίας DNA έναντι μιας βάσης δεδομένων από DNA profile HMΜ. hmmconvert: Πρόγραμμα που μετατρέπει μοντέλα ΗΜΜ από και προς τη μορφή του HMMER3. hmmemit: Πρόγραμμα, με το οποίο εκπέμπεται η καλύτερη (ανάλογα με τον ορισμό) ακολουθία η οποία θα μπορούσε να παραχθεί από το μοντέλο. hmmpress: Μετατρέπει μια βάση δεδομένων HMM σε δυαδικό κώδικα για το hmmscan. hmmstat: δείχνει συνοπτικά στατιστικά για μια βάση δεδομένων ΗΜΜ.

Lawrence R. Rabiner (February 1989). A tutorial on Hidden Markov Models and selected applications in speech recognition. Proceedings of the IEEE 77 (2): 257 28 Airoldi EM (2007) Getting Started in Probabilistic Graphical Models. PLoS Comput Biol 3(12): e252. B. H. Juang, L. R. Rabiner. The segmental K-means algorithm for estimating parameters of hidden Markov models. IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. 38, No. 9. 1639-1641 B. Merialdo, Phonetic recognition using hidden Markov models and maximum mutual information training, in Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing, 1988, pp. 111 114. Mamitsuka H. Supervised learning of hidden Markov models for sequence discrimination. Proceedings of the first annual international conference on Computational molecular biology.1997, Santa Fe, New Mexico, United State. Pages: 202-208 R. Schlüter, W. Macherey, S. Kanthak, H. Ney, L. Welling, Comparison Of Optimization Methods For Discriminative Training Criteria. In In Proc. EUROSPEECH 97, Vol. 1 (1997), pp. 15-18. Pierre Baldi, Yves Chauvin. Smooth On-Line Learning Algorithms for Hidden Markov Models (1994) Neural Computation, 6 (2). pp. 307-318 Anders Krogh. An Introduction to Hidden Markov Models for Biological Sequences. In Computational Methods in Molecular Biology, edited by S. L. Salzberg, D. B.Searls and S. Kasif, pages 45-63. Elsevier, 1998 A. Krogh and S. K. Riis. Hidden neural networks. Neural Computation, 11(2):541-563, 1999. A. Krogh. Two methods for improving performance of a HMM and their application for gene finding. In T. Gaasterland, P. Karp, K. Karplus, C. Ouzounis, C. Sander, and A. Valencia, editors, Proceedings of the Fifth International Conference on Intelligent Systems for Molecular Biology, pages 179-186, Menlo Park, CA, 1997. AAAI Press. A. Krogh. Hidden Markov models for labeled sequences. In Proceedings of the 12th IAPR International Conference on Pattern Recognition, pages 140-144, Los Alamitos, California, October 1994. IEEE Computer Society Press. S. R. Eddy. Profile Hidden Markov Models. Bioinformatics, 14:755-763, 1998. S. R. Eddy. Multiple Alignment Using Hidden Markov Models. In: Proc. Third Int. Conf. Intelligent Systems for Molecular Biology, 114-120. AAAI Press, 1995. L. Käll, A. Krogh, and E. L. Sonnhammer. An HMM posterior decoder for sequence feature prediction that includes homology information. Bioinformatics, 21(Suppl. 1):i251-i257, 2005. Piero Fariselli, Pier Luigi Martelli and Rita Casadio. A new decoding algorithm for hidden Markov models improves the prediction of the topology of all-beta membrane proteins.bmc Bioinformatics 2005, 6(Suppl 4):S12 Bagos PG, Liakopoulos TD, Hamodrakas SJ. Algorithms for incorporating prior topological information in HMMs: Application to transmembrane proteins. 2006, BMC Bioinformatics; 7:189 Bagos PG, Liakopoulos TD, Hamodrakas SJ. Faster Gradient Descent Training of Hidden Markov Models, Using Individual Learning Rate Adaptation. Proceedings of ICGI 2004 Lecture Notes In Artificial Intelligence, Vol. 3264, pp. 40-52 Bahl, L. Brown, P. de Souza, P. Mercer, R. Maximum mutual information estimation of hidden Markov model parameters for speech recognition Proceedings of IEEE International Conference on ICASSP '86 Acoustics, Speech, and Signal Processing, 1986 (11): 49-52