A sequence alignment algorithm using the transition quantity

Σχετικά έγγραφα
BMI/CS 776 Lecture #14: Multiple Alignment - MUSCLE. Colin Dewey

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 3 η : Πολλαπλή ευθυγράμμιση. Σ. Γκέλης Τμήμα Βιολογίας

Buried Markov Model Pairwise

Analysis of Protein Structure in Silico

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

Βιοπληροφορική. Πίνακες Αντικατάστασης BLOSUM & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ειδικά Θέματα Βιοπληροφορικής

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

LALING/PLALING :

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

How to design estimators tting with accuracy measures Theories and applications in bioinformatics

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices

Abstract Storage Devices

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Other Test Constructions: Likelihood Ratio & Bayes Tests

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

Αρχιτεκτονική και Υλο οίηση σε Αναδιατασσόµενη Λογική του Αλγορίθµου T-Coffee για συνένωση κοµµατιών DNA

Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d)

Fourier transform, STFT 5. Continuous wavelet transform, CWT STFT STFT STFT STFT [1] CWT CWT CWT STFT [2 5] CWT STFT STFT CWT CWT. Griffin [8] CWT CWT

CSJ. Speaker clustering based on non-negative matrix factorization using i-vector-based speaker similarity

Σηµειώσεις Βιοπληροφορικής

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

Molecular evolutionary dynamics of respiratory syncytial virus group A in

( ) , ) , ; kg 1) 80 % kg. Vol. 28,No. 1 Jan.,2006 RESOURCES SCIENCE : (2006) ,2 ,,,, ; ;

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Schedulability Analysis Algorithm for Timing Constraint Workflow Models

Approximation of distance between locations on earth given by latitude and longitude

Study of In-vehicle Sound Field Creation by Simultaneous Equation Method

Study on Re-adhesion control by monitoring excessive angular momentum in electric railway traction

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Development of a Seismic Data Analysis System for a Short-term Training for Researchers from Developing Countries

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Partial Differential Equations in Biology The boundary element method. March 26, 2013

þÿ O ÁÌ» Â Ä Å ¹µÅ Å½Ä Ç»¹

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ST5224: Advanced Statistical Theory II

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

DuPont Suva 95 Refrigerant

ΔΘΝΙΚΗ ΥΟΛΗ ΓΗΜΟΙΑ ΓΙΟΙΚΗΗ ΙΗ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ

DuPont Suva 95 Refrigerant

Present and Future Prospects of Protein Structure Prediction


th International Conference on Machine Learning and Applications. E d. h. U h h b w k. b b f d h b f. h w k by v y

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

w o = R 1 p. (1) R = p =. = 1

Assalamu `alaikum wr. wb.

Fractional Colorings and Zykov Products of graphs

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

Technical Information T-9100 SI. Suva. refrigerants. Thermodynamic Properties of. Suva Refrigerant [R-410A (50/50)]

DuPont Suva. DuPont. Thermodynamic Properties of. Refrigerant (R-410A) Technical Information. refrigerants T-410A ENG

Homomorphism in Intuitionistic Fuzzy Automata

EE 570: Location and Navigation

Single-site association results for 136 SCARB1 genotyped variants with HDL-C.

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

Overview. Transition Semantics. Configurations and the transition relation. Executions and computation

Math 6 SL Probability Distributions Practice Test Mark Scheme

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Supporting Information

Δθαξκνζκέλα καζεκαηηθά δίθηπα: ε πεξίπησζε ηνπ ζπζηεκηθνύ θηλδύλνπ ζε κηθξνεπίπεδν.

Appendix to On the stability of a compressible axisymmetric rotating flow in a pipe. By Z. Rusak & J. H. Lee

Numerical Analysis FMN011

Matrices and vectors. Matrix and vector. a 11 a 12 a 1n a 21 a 22 a 2n A = b 1 b 2. b m. R m n, b = = ( a ij. a m1 a m2 a mn. def

[4] 1.2 [5] Bayesian Approach min-max min-max [6] UCB(Upper Confidence Bound ) UCT [7] [1] ( ) Amazons[8] Lines of Action(LOA)[4] Winands [4] 1

ΧΩΡΙΚΑ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΥΠΟΔΕΙΓΜΑΤΑ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΤΩΝ ΤΙΜΩΝ ΤΩΝ ΑΚΙΝΗΤΩΝ SPATIAL ECONOMETRIC MODELS FOR VALUATION OF THE PROPERTY PRICES

CRASH COURSE IN PRECALCULUS

ΕΘΝΙΚΗ ΣΧΟΛΗ ΤΟΠΙΚΗΣ ΑΥΤΟ ΙΟΙΚΗΣΗΣ Β ΕΚΠΑΙ ΕΥΤΙΚΗ ΣΕΙΡΑ ΤΜΗΜΑ: ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΙΟΙΚΗΣΗΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ. Θέµα:

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Chapter 1 Introduction to Observational Studies Part 2 Cross-Sectional Selection Bias Adjustment

Διπλωματική Εργασία. του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ (ΣΔΟ) ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΚΑΙ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ

Table of Contents 1 Supplementary Data MCD

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Μιχαήλ Νικητάκης 1, Ανέστης Σίτας 2, Γιώργος Παπαδουράκης Ph.D 1, Θοδωρής Πιτηκάρης 3

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Resurvey of Possible Seismic Fissures in the Old-Edo River in Tokyo

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Elements of Information Theory

ECE Spring Prof. David R. Jackson ECE Dept. Notes 2

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

derivation of the Laplacian from rectangular to spherical coordinates

Congruence Classes of Invertible Matrices of Order 3 over F 2

Transcript:

1 1 1 MTRAP A sequence alignment algorithm using the transition quantity Toshihide Hara, 1 Keiko Sato 1 and Masanori Ohya 1 We have been developed a sequence alignment algorithm using the transition quantity. The transition quantity is a new measure based on transition probability between two consecutive pairs of residues. In this paper, we compare the performance of our new algorithm called MTRAP and that of the other usual algorithm. 1. 2007 FASTA 18) BLAST 2) 1 Tokyo University of Science ClustalW 21), DIALIGN 14), T-Coffee 16), MAFFT 11), MUSCLE 7), Probcons 6) 40% 4) Anfinsen 3) α β Transition quantity MTRAP 8),9) HOMSTRAD (version November 1, 2008) 13),20) PREFAB4 7) 2. Transition Quantity Ω Ω Ω Ω Ω { } Ω Ω Ω Γ Ω Ω Γ Ω Ω n A = a 1a 2 a n B = b 1b 2 b n a i, b j Ω u 1 u 2 u n, u i = (a i, b i ) Γ u i 1 c 2010 Information Processing Society of Japan

p (A; B) R (A, B) = p (A) p (B) = p (a1, a2,, an; b1, b2,, bn) p (a 1, a 2,, a n ) p (b 1, b 2,, b n ). (1) p (a) a p (a; b) 1 p (A) = p (a), p (B) = p (b) and p (A, B) = p (a, b) 1, p (A; B) log p (A) p (B) = s (a i, b i ), (2) p (a; b) s (a, b) = log (3) p (a) p (b) a, b s (a, b) S = (s (a, b)) 2 3 1) 0 1 d sub (A, B) f s : [s min, s max ] R i f s (x) s max x, 0 f s (x) 1, (4) s max { s min } s max max max {S (u)}, gap cost, { u Γ } s min min {S (u)}, gap cost. min u Γ s (a, b) s (a, b) f s (s (a, b)), a, b Ω M = ( s (a, b)) A, B d sub (A, B) = s (a i, b i ). (5) d sub (A, B) A, B 0 9) R (A, B) i R our (A, B) = R (A, B) 1 ε R t (A, B) ε, (6) n 1 R t (A, B) p (u i+1 \ u i ) (7) i=1 ε Transition quantity t (u i, u i+1 ) t (u i, u i+1 ) f t (t (u i, u i+1 ) ; u i ), t (u i, u i+1) log p (u i+1 \ u i), (8) x f t (x; u) = max v Γ { t (u, v)}, if x > 0 (9) 1, otherwise Transition quantity n 1 d trans (A, B) = t (u i, u i+1). (10) d sub d trans i=1 d MTRAP (A, B) = (1 ε) d sub (A, B) + εd trans (A, B). (11) MTRAP 8) 17) 1 1 MTRAP 2 c 2010 Information Processing Society of Japan

Transition quantity PAM 5) BLOSUM 10) SABmark version 1.63 22) superfamilies 9) 2.1 Structural Alignment HOM- STRAD PREFAB 4.0 ( 1 ) ( 2 ) ( 3 ) (2) ( 4 ) Q Score ( 5 ) (1) (4) ( 6 ) (1) (5) HOMSTRAD HOMSTRAD(HOMologous STRucture Alignment Database) 13) 2008 630 630 1 1 HOMSTRAD 0 %ID< 20 20 %ID< 40 40 %ID< 60 60 %ID< 80 80 %ID 100 ALL 87 273 160 83 27 630 2008 7 1 HOMSTRAD 630 %ID PREFAB4 PREFAB4 MUSCLE 7) 4 PREFAB4 1682 2 2 PREFAB4 0 %ID< 15 15 %ID< 30 30 %ID< 45 ALL 423 917 148 1682 PREFAB4 1682 %ID Q Score 7) Q Score Q Score L N {s 1,, s N } a ik Ω s i k s i a ik I ik a ik = 3 c 2010 Information Processing Society of Japan

I ik = 0 Q Score L N 1 N aik,a jk δ Iik,I jk k=1 i=1 j=i+1 Q Score =, L N 1 N aik,a jk { k=1 i=1 j=i+1 1, x and y x,y = 0, x = or y =. 2.2 HOMSTRAD PREFAB4 MTRAP Needle ClustalW2 MAFFT T-Coffee DIALIGN MUSCLE Probcons ( 1 ) Needle: Needle Needleman-Wunsch 15) EMBOSS 19) BLOSUM62 EMBOSS ver. 5.0.0 ( 2 ) ClustalW2: ClustalW2 12),21) ClustalW2 GONNET ClustalW2 ver. 2.0.9 ( 3 ) MAFFT: MAFFT 11) ver. 6.240 ( 4 ) T-Coffee: T-Coffee 16)?? Ver. 5.30 ( 5 ) DIALIGN: DIALIGN 14) segment-to-segment ver. 2.2.1 ( 6 ) MUSCLE: MUSCLE 7) Log-Expectation ver. 3.7 ( 7 ) Probcons: Probcons 6) Probabilistic Consistency ver. 1.12 ( 1 ) Q Score ( 2 ) Q Score Q Score 2.3 3 MTRAP Needle ClustalW2 HOMSTRAD HOM- STRAD 630 Q score HOM- STRAD MTRAP MTRAP 80% e.g., PAM250 BLOSUM622 0.817 Needle ClustalW2 80% e.g. Needle PAM250 0.768 BLOSUM62 0.768 3 30% MTRAP 3 HOMSTRAD MTRAP Matrix Sequence identity % Method 0-15% (25) 15-30% (207) 30-45% (173) ALL (630) PAM250 MTRAP 0.421 0.655 0.874 0.817 Needle 0.226 0.548 0.837 0.763 ClustalW2 0.234 0.528 0.817 0.747 BLOSUM62 MTRAP 0.410 0.653 0.878 0.817 Needle 0.223 0.556 0.843 0.768 ClustalW2 0.276 0.585 0.861 0.784 GONNET250 MTRAP 0.412 0.659 0.879 0.819 ClustalW2 0.313 0.619 0.867 0.800 HOMSTRAD Q Score Needle GONNET 4 c 2010 Information Processing Society of Japan

PAM250 MTRAP 0-15% 0.421 15-30% 0.655 PAM250 ClustalW2 0-15% 0.234 15-30% 0.528 HOMSTRAD PREFAB4 PREFAB4 1682 HOMSTRAD Q Score 2 Needle ClustalW2 Q Score MTRAP Q Score 60% 0-60% MTRAP 0-20% MTRAP Needle 1.5 2.3 Q Score ClustalW2 PAM 1.4 BLOSUM 1.3 GONNET 1.1 1.2 HOMSTRAD PREFAB4 MTRAP 11 2; Sum of pairs T-Coffee MAFFT DI- ALIGN MUSCLE ClustalW2 Probcons 4 5 MTRAP 30% 30% 4 10% 3. Transition quantity MTRAP 2 Q Score MTRAP Needle Q Score MTRAP ClustalW2 Q Score 5 c 2010 Information Processing Society of Japan

4 PREFAB4 MTRAP Method PREFAB 4.0 0-15%(423) 15-30%(917) 30-45%(148) All(1682) MTRAP a 0.248 0.674 0.877 0.615 MAFFT 0.170 0.671 0.860 0.568 DIALIGN b 0.133 0.556 0.814 0.518 MUSCLE 0.205 0.632 0.867 0.581 ClustalW2 0.199 0.644 0.859 0.586 Probcons 0.204 0.647 0.875 0.590 T-Coffee 0.198 0.642 0.872 0.585 PREFAB4 Q Score a MTRAP GONNET250 b DIALIGN Q Score 5 HOMSTRAD MTRAP Method HOMSTRAD 0-15%(25) 15-30%(207) 30-45%(173) All(630) MTRAP a 0.412 0.659 0.879 0.819 MAFFT 0.309 0.610 0.863 0.796 DIALIGN b 0.216 0.546 0.825 0.760 MUSCLE 0.337 0.625 0.868 0.802 ClustalW2 0.313 0.619 0.867 0.800 Probcons 0.344 0.650 0.884 0.816 T-Coffee 0.341 0.634 0.872 0.809 PREFAB4 Q Score 4 1) S.F. Altschul. Amino acid substitution matrices from an information theoretic perspective. J. Mol. Bd, 219:555 565, 1991. 2) S.F. Altschul, W. Gish, W. Miller, E.W. Myers, and D.J. Lipman. Basic local alignment search tool. Journal of molecular biology, 215(3):403 410, 1990. 3) C. B. Anfinsen. Principles that govern the folding of protein chains. Science, 181:223 230, Jul 1973. 4) G.Blackshields, I.M. Wallace, M.Larkin, and D.G. Higgins. Analysis and comparison of benchmarks for multiple sequence alignment. In Silico Biology, 6(4):321 339, 2006. 5) M.O. Dayhoff, R.M. Schwartz, and B.C. Orcutt. A model of evolutionary change in proteins. Atlas of Protein Sequence and Structure, 5(3):345 352, 1978. 6) C.B. Do, M.S.P. Mahabhashyam, M. Brudno, and S. Batzoglou. ProbCons: probabilistic consistency-based multiple sequence alignment. Genome Research, 15(2):330, 2005. 7) R.C. Edgar. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res., 32:1792 1797, 2004. 8) Toshihide Hara, Keiko Sato, and Masanori Ohya. Mtrap: pairwise sequence alignment algorithm by a new measure based on transition probability between two consecutive pairs of residues. BMC Bioinformatics, 11:235, 2010. 9) Toshihide Hara, Keiko Sato, and Masanori Ohya. Significant improvement of sequence alignment can be done by considering transition probability between two consecutive pairs of residues. QP-PQ: Quantum Probability and White Noise Analysis (Quantum Bio-Informatics III), 26:443 452, 2010. 10) S. Henikoff and J. G. Henikoff. Amino acid substitution matrices from protein blocks. Proc. Natl. Acad. Sci. U.S.A., 89:10915 10919, Nov 1992. 11) K.Katoh, K.Misawa, K.Kuma, and T.Miyata. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res., 30:3059 3066, Jul 2002. 12) M. A. Larkin, G. Blackshields, N. P. Brown, R. Chenna, P. A. McGettigan, H.McWilliam, F.Valentin, I.M. Wallace, A.Wilm, R.Lopez, J.D. Thompson, T.J. Gibson, and D.G. Higgins. Clustal W and Clustal X version 2.0. Bioinformatics, 6 c 2010 Information Processing Society of Japan

23:2947 2948, Nov 2007. 13) K.Mizuguchi, C.M. Deane, T.L. Blundell, and J.P. Overington. HOMSTRAD: a database of protein structure alignments for homologous families. Protein Sci., 7:2469 2471, Nov 1998. 14) B.Morgenstern. DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. Bioinformatics, 15:211 218, Mar 1999. 15) S.B. Needleman and C.D. Wunsch. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, 48:443 453, Mar 1970. 16) C.Notredame, D.G. Higgins, and J.Heringa. T-Coffee: A novel method for fast and accurate multiple sequence alignment. J. Mol. Biol., 302:205 217, Sep 2000. 17) M.Ohya and Y.Uesaka. Amino acid sequences and DP matching:a new method of alignment, Information Sciences. Information Sciences, 63:139 151, 1992. 18) W.R. Pearson and D.J. Lipman. Improved tools for biological sequence comparison. Proceedings of the National Academy of Sciences, 85(8):2444 2448, 1988. 19) P.Rice, I.Longden, and A.Bleasby. EMBOSS: the European Molecular Biology Open Software Suite. Trends Genet., 16:276 277, Jun 2000. 20) L.A. Stebbings and K. Mizuguchi. HOMSTRAD: recent developments of the homologous protein structure alignment database. Nucleic acids research, 32(Database Issue):D203, 2004. 21) J.D. Thompson, D.G. Higgins, and T.J. Gibson. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res., 22:4673 4680, Nov 1994. 22) I.VanWalle, I.Lasters, and L.Wyns. SABmark a benchmark for sequence alignment that covers the entire known fold space. Bioinformatics, 21(7):1267, 2005. 7 c 2010 Information Processing Society of Japan