ΔΠΛ 450 ΤΠΟΛΟΓΙΣΙΚΗ ΒΙΟΛΟΓΙΑ. Ευκυγράμμιςθ Δφο Ακολουκιών Πίνακεσ αντικατάςταςθσ

Σχετικά έγγραφα
Ενδεικτικά Θέματα Στατιστικής ΙΙ

H ΜΑΓΕΙΑ ΤΩΝ ΑΡΙΘΜΩΝ

Η/Υ A ΤΑΞΕΩΣ ΑΕ Συστήματα Αρίθμησης. Υποπλοίαρχος Ν. Πετράκος ΠΝ

Απνηειέζκαηα Εξσηεκαηνινγίνπ 2o ηεηξάκελν

TOOLBOOK (μάθημα 2) Δεκηνπξγία βηβιίνπ θαη ζειίδσλ ΠΡΟΑΡΜΟΓΗ: ΒΑΛΚΑΝΙΩΣΗ ΔΗΜ. ΕΚΠΑΙΔΕΤΣΙΚΟ ΠΕ19 1 TOOLBOOK ΜΑΘΗΜΑ 2

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΤΙΚΗ ΣΚΥΤΑΛΟΓΡΟΜΙΑ 2015 ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ Τεηάπηη 28 Ιανουαπίου 2015 ΛΔΥΚΩΣΙΑ Τάξη: Α Γυμναζίου

Κευάλαιο 8 Μονοπωλιακή Συμπεριφορά- Πολλαπλή Τιμολόγηση

Βάσεις Δεδομέμωμ. Εξγαζηήξην V. Τκήκα Πιεξνθνξηθήο ΑΠΘ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

ΑΛΛΑΓΗ ΟΝΟΜΑΣΟ ΚΑΙ ΟΜΑΔΑ ΕΡΓΑΙΑ, ΚΟΙΝΟΥΡΗΣΟΙ ΦΑΚΕΛΟΙ ΚΑΙ ΕΚΣΤΠΩΣΕ ΣΑ WINDOWS XP

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Α Γυμνασίου ΥΟΛΕΙΟ..

Αζκήζεις ζτ.βιβλίοσ ζελίδας 13 14

Κβαντικοί Υπολογισμοί. Πέκπηε Γηάιεμε

ΚΕΦ. 2.3 ΑΠΟΛΤΣΗ ΣΘΜΗ ΠΡΑΓΜΑΣΘΚΟΤ ΑΡΘΘΜΟΤ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙ ΜΟ

Δξγαιεία Καηαζθεπέο 1 Σάμε Σ Δ.Κ.Φ.Δ. ΥΑΝΙΧΝ ΠΡΧΣΟΒΑΘΜΙΑ ΔΚΠΑΙΓΔΤΗ. ΔΝΟΣΗΣΑ 11 ε : ΦΧ ΔΡΓΑΛΔΙΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Φαθόο κε ζσιήλα.

ΘΔΚΑ ΡΖΠ ΑΛΑΓΛΩΟΗΠΖΠ

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ. Οξηδόληηα θαη θαηαθόξπθε κεηαηόπηζε παξαβνιήο

B-Δέλδξα. Τα B-δέλδξα ρξεζηκνπνηνύληαη γηα ηε αλαπαξάζηαζε πνιύ κεγάισλ ιεμηθώλ πνπ είλαη απνζεθεπκέλα ζην δίζθν.

Σύνθεζη ηαλανηώζεων. Έζησ έλα ζώκα πνπ εθηειεί ηαπηόρξνλα δύν αξκνληθέο ηαιαληώζεηο ηεο ίδηαο ζπρλόηεηαο πνπ πεξηγξάθνληαη από ηηο παξαθάησ εμηζώζεηο:

Σήκαηα Β Α Γ Γ Δ Λ Η Σ Ο Ι Κ Ο Ν Ο Μ Ο Υ Γ Ι Α Λ Δ Ξ Η - ( 2 ) ΕΙΣΑΓΨΓΗ ΣΤΙΣ ΤΗΛΕΠΙΚΟΙΝΨΝΙΕΣ

ΛΙΜΝΗ ΤΣΑΝΤ. Σρήκα 1. Σρήκα 2

x-1 x (x-1) x 5x 2. Να απινπνηεζνύλ ηα θιάζκαηα, έηζη ώζηε λα κελ ππάξρνπλ ξηδηθά ζηνπο 22, 55, 15, 42, 93, 10 5, 12

Αντισταθμιστική ανάλυση

Απαντήσεις θέματος 2. Παξαθάησ αθνινπζεί αλαιπηηθή επίιπζε ησλ εξσηεκάησλ.

Παιχνίδι γλωζζικής καηανόηζης με ζχήμαηα!

ΚΔΦ. 2.4 ΡΗΕΔ ΠΡΑΓΜΑΣΗΚΩΝ ΑΡΗΘΜΩΝ

ΓΗΑΓΩΝΗΣΜΑ ΣΤΑ ΜΑΘΖΜΑΤΗΚΑ. Ύλη: Μιγαδικοί-Σσναρηήζεις-Παράγωγοι Θεη.-Τετν. Καη Εήηημα 1 ο :

Αζθήζεηο 5 νπ θεθαιαίνπ Crash course Step by step training. Dipl.Biol.cand.med. Stylianos Kalaitzis

iii. iv. γηα ηελ νπνία ηζρύνπλ: f (1) 2 θαη

ΟΠΤΙΚΗ Α. ΑΝΑΚΛΑΣΖ - ΓΗΑΘΛΑΣΖ

(Ενδεικηικές Απανηήζεις) ΘΔΜΑ Α. Α1. Βιέπε απόδεημε Σει. 262, ζρνιηθνύ βηβιίνπ. Α2. Βιέπε νξηζκό Σει. 141, ζρνιηθνύ βηβιίνπ

Έλαο πίνακας σσμβόλων ππνζηεξίδεη δύν βαζηθέο ιεηηνπξγίεο:

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch

Τν εθπαηδεπηηθό πιηθό ηεο Φξνληηζηεξηαθήο Δθπαίδεπζεο Τζηάξα δηαλέκεηαη δωξεάλ απνθιεηζηηθά από ηνλ ψεθηαθό ηόπν ηνπ schooltime.gr

ΑΝΤΗΛΙΑΚΑ. Η Μηκή ζθέθηεθε έλαλ ηξόπν, γηα λα ζπγθξίλεη κεξηθά δηαθνξεηηθά αληειηαθά πξντόληα. Απηή θαη ν Νηίλνο ζπλέιεμαλ ηα αθόινπζα πιηθά:

Δξγαζηεξηαθή άζθεζε 03. Σηεξενγξαθηθή πξνβνιή ζην δίθηπν Wulf

Α. Εηζαγσγή ηεο έλλνηαο ηεο ηξηγσλνκεηξηθήο εμίζσζεο κε αξρηθό παξάδεηγκα ηελ εκx = 2

Αιγόξηζκνη Γνκή επηινγήο. Πνιιαπιή Δπηινγή Δκθωιεπκέλεο Δπηινγέο. Δηζαγωγή ζηηο Αξρέο ηεο Δπηζηήκεο ηωλ Η/Υ. introcsprinciples.wordpress.

ΑΠΑΝΤΗΣΔΙΣ ΓΙΚΤΥΑ ΥΠΟΛΟΓΙΣΤΩΝ II ΔΠΑΛ

Μνλνδηάζηαηνη Πίλαθεο Λπκέλεο Αζθήζεηο. Άζθεζε 1. Πνηά ζα είλαη ηα πεξηερόκελα ηνπ πίλαθα Α κεηά ηελ εθηέιεζε ηνπ παξαθάησ αιγνξίζκνπ;

Μηα ζπλάξηεζε κε πεδίν νξηζκνύ ην Α, ζα ιέκε όηη παξνπζηάδεη ηοπικό μέγιζηο ζην, αλ ππάξρεη δ>0, ηέηνην ώζηε:

ΔΦΑΡΜΟΜΔΝΑ ΜΑΘΗΜΑΣΙΚΑ ΣΗ ΧΗΜΔΙΑ Ι ΘΔΜΑΣΑ Α επηέκβξηνο Να ππνινγηζηνύλ νη κεξηθέο παξάγσγνη πξώηεο ηάμεο ηεο ζπλάξηεζεο f(x,y) =

Φςζική Πποζαναηολιζμού Γ Λςκείος. Αζκήζειρ Ταλανηώζειρ 1 ο Φςλλάδιο

Διαηιμήζεις για Αιολικά Πάρκα. Κώδικες 28, 78 και 84

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΦΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ Μάθημα: Πιθανόηηηες και Σηαηιζηική Διδάζκων: Σ. Γ.

Πολυεπίπεδα/Διασυμδεδεμέμα Δίκτυα

Γοκή επαλάιευες Δληοιές Όζο & Μέτρης_όηοσ

ΡΤΘΜΙΕΙ ΔΙΚΣΤΟΤ ΣΑ WINDOWS

1. Οδηγίερ εγκαηάζηαζηρ και σπήζηρ έξςπνυν καπηών και τηθιακών πιζηοποιηηικών με σπήζη ηος λογιζμικού Μοzilla Thunderbird

(γ) Να βξεζεί ε ρξνλνεμαξηώκελε πηζαλόηεηα κέηξεζεο ηεο ζεηηθήο ηδηνηηκήο ηνπ ηειεζηή W.

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΔΣΑΙΡΔΙΑ ΠΑΓΚΤΠΡΙΟ ΓΙΑΓΩΝΙΜΟ Α ΛΤΚΔΙΟΤ. Ημεπομηνία: 10/12/11 Ώπα εξέτασηρ: 09:30-12:30 ΠΡΟΣΔΙΝΟΜΔΝΔ ΛΤΔΙ

ΦΥΣΙΚΗ ΤΩΝ ΡΕΥΣΤΩΝ. G. Mitsou

ΑΠΛΟΠΟΙΗΗ ΛΟΓΙΚΩΝ ΤΝΑΡΣΗΕΩΝ ΜΕ ΠΙΝΑΚΕ KARNAUGH

ΕΞΙΣΩΣΕΙΣ. (iv) (ii) (ii) (ii) 5. Γηα ηηο δηάθνξεο ηηκέο ηνπ ι λα ιπζνύλ νη εμηζώζεηο : x 6 3 9x

Να ζρεδηάζεηο ηξόπνπο ζύλδεζεο κηαο κπαηαξίαο θαη ελόο ιακπηήξα ώζηε ν ιακπηήξαο λα θσηνβνιεί.

ΠΑΡΑΡΣΗΜΑ Δ. ΔΤΡΔΗ ΣΟΤ ΜΔΣΑΥΗΜΑΣΙΜΟΤ FOURIER ΓΙΑΦΟΡΩΝ ΗΜΑΣΩΝ

Case Study. Παξαθάηω παξνπζηάδνπκε βήκα - βήκα κε screenshots έλα παξάδεηγκα ππνβνιήο κηαο εξγαζίαο θαη ηελ παξαγωγή ηνπ Originality Report.

Σημεία Ασύπματηρ Ππόσβασηρ (Hot-Spots)

7. ΚΑΤΑΧΩΡΗΤΕΣ ΕΡΩΤΗΣΕΙΣ ΑΣΚΗΣΕΙΣ. 3. Έλαο θαηαρσξεηήο SISO ησλ 4 bits έρεη: α) Μία είζνδν, β) Δύν εηζόδνπο, γ) Σέζζεξεηο εηζόδνπο.

Οργάνωση και Δομή Παρουσιάσεων

Έωρ και 28% η αύξηζη ηων ειζθοπών από ηο 2019!

Γηζδηάζηαηνη Πίλαθεο

Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο κόζηος ανά μονάδα παραγωγής. Q Η ζσνάρηηζη μέζοσ κόζηοσς μας δίνει ηο ζηαθερό κόζηος ανά μονάδα παραγωγής

Λεκηική έκθραζη, κριηική, οικειόηηηα και ηύπος δεζμού ζηις ζηενές διαπροζωπικές ζτέζεις

Παλαιοσλαβική Γλώσσα. Ενότητα 11: Μορφολογία Τα Ονόματα/Αντωνυμίες. Αλεξάνδρα Ιωαννίδου. Τμήμα Σλαβικών Σπουδών

Image J Plugin particle tracker για παρακολούθηση της κίνησης σωματιδίων

Constructors and Destructors in C++

Εςθςή ζςζηήμαηα επισειπήζεων και αξιολόγηζη

Δξγαιεία Καηαζθεπέο 1 Σάμε Δ Δ.Κ.Φ.Δ. ΥΑΝΗΩΝ ΠΡΩΣΟΒΑΘΜΗΑ ΔΚΠΑΗΓΔΤΖ. ΔΝΟΣΖΣΑ 2 ε : ΤΛΗΚΑ ΩΜΑΣΑ ΔΡΓΑΛΔΗΑ ΚΑΣΑΚΔΤΔ. Καηαζθεπή 1: Ογθνκεηξηθό δνρείν

ΜΑΘΗΜΑ / ΤΑΞΗ : ΗΛΕΚΤΡΟΛΟΓΙΑ/Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 08/09/2014

ΣΥΣΤΗΜΑΤΑ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. 1. Να ιπζνύλ ηα ζπζηήκαηα. 1 0,3x 0,1y x 3 3x 4y 2 4x 2y ( x 1) 6( y 1) (i) (ii)

ΜΑΘΗΜΑΣΑ ΦΩΣΟΓΡΑΦΙΑ. Ειζαγωγή ζηη Φωηογραθία. Χριζηάκης Σαζεΐδης EFIAP

ΙΣΤΟΡΙΑ ΤΟΥ ΑΡΧΑΙΟΥ ΚΟΣΜΟΥ

β) (βαζκνί: 2) Έζησ όηη ε ρξνλνινγηθή ζεηξά έρεη κέζε ηηκή 0 θαη είλαη αληηζηξέςηκε. Δίλεηαη ην αθόινπζν απνηέιεζκα από ην EViews γηα ηε :

IV Ο ΕΛΛΗΝΙΜΟ ΣΗ ΔΤΗ,ΠΟΛΙΣΙΜΟΙ Δ.ΜΕΟΓΕΙΟΤ ΚΑΙ ΡΩΜΗ

ΣΕΙ Δυτικήσ Μακεδονίασ, Παράρτημα Καςτοριάσ Τμήμα Πληροφορικήσ και Τεχνολογίασ Υπολογιςτών

ΓΔΧΜΔΣΡΙΑ ΓΙΑ ΟΛΤΜΠΙΑΓΔ

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗ ΦΥΣΙΚΗ. Ύλη: Εσθύγραμμη Κίνηζη

Δπηιέγνληαο ην «Πξνεπηινγή» θάζε θνξά πνπ ζα ζπλδέεζηε ζηελ εθαξκνγή ζα βξίζθεζηε ζηε λέα ρξήζε.

ΠΟΛΤΜΕΡΙΜΟ - ΠΕΣΡΟΥΗΜΙΚΑ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Σπληήξεζε ηξνθίκσλ ρσξίο ρεκηθά πξόζζεηα PROJECT B ΛΥΚΕΙΟΥ

Άζκηζη ζτέζης κόζηοσς-τρόνοσ (Cost Time trade off) Καηαζκεσαζηική ΑΔ

ΚΤΠΡΙΑΚΗ ΜΑΘΗΜΑΣΙΚΗ ΕΣΑΙΡΕΙΑ ΜΑΘΗΜΑΣΙΚΗ ΚΤΣΑΛΟΓΡΟΜΙΑ 2007 ΓΙΑ ΣΟ ΓΤΜΝΑΙΟ Παπασκευή 26 Ιανουαπίου 2007 Σάξη: Γ Γυμνασίου ΥΟΛΕΙΟ..

Η. ΣΟΗΥΔΗΑ ΠΟΤ ΓΗΑΣΖΡΟΤΝΣΑΗ

Επωηήζειρ Σωζηού Λάθοςρ ηων πανελλαδικών εξεηάζεων Σςναπηήζειρ

ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ. Αθροίσματα, Γινόμενα και Ασσμπτωτικές Εκτιμήσεις

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ Γεσηέρα 10 Ηοσνίοσ 2019 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΜΑΘΖΜΑΣΗΚΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ. (Ενδεικηικές Απανηήζεις)

ΠΑΝΔΛΛΑΓΗΚΔ ΔΞΔΣΑΔΗ Γ ΣΑΞΖ ΖΜΔΡΖΗΟΤ ΓΔΝΗΚΟΤ ΛΤΚΔΗΟΤ Γευηέρα 11 Ηουνίου 2018 ΔΞΔΣΑΕΟΜΔΝΟ ΜΑΘΖΜΑ: ΜΑΘΖΜΑΣΗΚΑ ΠΡΟΑΝΑΣΟΛΗΜΟΤ. (Ενδεικηικές Απανηήζεις)

Βιομησανικόρ ζσεδιαζμόρ πποϊόνηων από ανακςκλωμένερ ζςζκεςαζίερ

ΜΗΧΑΝΟΛΟΓΙΚΟ ΣΧΔΓΙΟ ΙΙ

ΘΔΜΑ 1 ο Μονάδες 5,10,10

ΥΡΙΣΟΤΓΔΝΝΙΑΣΙΚΔ ΚΑΣΑΚΔΤΔ

Ζαχαρίας Μ. Κοντοπόδης Εργαστήριο Λειτουργικών Συστημάτων ΙΙ

Μονοψϊνιο. Αγνξά κε ιίγνπο αγνξαζηέο. Δύναμη μονοψωνίος Η ηθαλόηεηα πνπ έρεη ν αγνξαζηήο λα επεξεάζεη ηελ ηηκή ηνπ αγαζνύ.

ΔΕΟ 13. Ποσοτικές Μέθοδοι. θαη λα ππνινγίζεηε ην θόζηνο γηα παξαγόκελα πξντόληα. Να ζρεδηαζηεί γηα εύξνο πξντόλησλ έσο

επαξθήο ζηαηηζηηθή ζπλάξηεζε, β) Έζησ η.δ. είλαη αλεμάξηεην ηνπ. Άξα πξόθεηηαη γηα 1 n

ΠΑΝΕΛΛΑΔΙΚΕ ΕΞΕΣΑΕΙ Γ ΣΑΞΗ ΗΜΕΡΗΙΟΤ ΓΕΝΙΚΟΤ ΛΤΚΕΙΟΤ & ΠΑΝΕΛΛΗΝΙΕ ΕΞΕΣΑΕΙ Γ ΣΑΞΗ ΗΜΕΡΗΙΟΤ ΕΠΑΛ (ΟΜΑΔΑ Β )

ΣΡΑΠΕΖΑ ΘΕΜΑΣΩΝ Α ΛΤΚΕΙΟΤ

Transcript:

1 ΔΠΛ 450 ΤΠΟΛΟΓΙΣΙΚΗ ΒΙΟΛΟΓΙΑ Ευκυγράμμιςθ Δφο Ακολουκιών Πίνακεσ αντικατάςταςθσ

2 Δσθσγοάμμιρη ακξλξσθιώμ Γπλακηθόο πξνγξακκαηηζκόο : κέζνδνο επζπγξάκκηζεο αθνινπζηώλ DNA θαη πξσηετληθώλ αθνινπζηώλ. Έρνπκε ρξεζηκνπνηήζεη θάπνηνπο αξηζκνύο, ηηκέο γηα λα νξίζνπκε πόζν βέιηηζηε ήηαλ ε επζπγξάκκηζε. θνξ γηα ηελ ηαύηηζε ή κε ηαύηηζε ησλ ακηλνμέσλ. θνξ γηα ηελ εηζαγσγή θαη επέθηαζε θελώλ.

3 Παοάδειγμα εσθσγοάμμιρηπ A=AGC B=AAAC θόξ Σαίξηαζκα = 1 Αζηνρία = -1 Δηζαγσγή δηαγξαθή = -2 Μαο ελδηαθέξεη ην κέγηζην ζθνξ.

4 Αουικξπίηρη πίμακα: Global Alignment A G C 0 g 2g 3g A A A C g 2g 3g 4g

5 Αουικξπίηρη πίμακα: Global Alignment A G C A -2 0-2 -4-6 A -4 A -6 C -8

6 Αλγόοιθμξπ Αξρηθνπνηνύκε ηελ πξώηε γξακκή θαη πξώηε ζηήιε ηνπ πίλαθα πκπιεξώλνπκε ηνλ ππόινηπν πίλαθα από top to bottom, αξηζηεξά πξνο δεμηά Γηα θάζε ζέζε F [ i, j ], απνζεθεύσ δείθηεο ζηα πξνεγνύκελα θειηά πνπ έδσζαλ ην θαιύηεξν ζθνξ F [m, n] πεξηέρεη ην βέιηηζην ζθνξ επζπγξάκκηζεο Από ην θειί F [m, n] αθνινπζώ ηνπο δείθηεο κέρξη ην θειί F [0, 0] γηα λα βξσ ηελ επζπγξάκκηζε

7 Αλγόοιθμξπ for i=0 to length(a) F(i,0) d*i for j=0 to length(b) F(0,j) d*j for i=1 to length(a) for j = 1 to length(b) { Choice1 F(i-1,j-1) + S(A(i), B(j)) Choice2 F(i-1, j) + d Choice3 F(i, j-1) + d F(i,j) max(choice1, Choice2, Choice3) }

8 Παοάδειγμα Global εσθσγοάμμιρηπ A G C 0-2 -4-6 A -2 A -4 max{ (0+ζκοπ(Α,Α)), (-2+-2),(-2+-2)} = max{1,-4,-4} =1 A -6 C -8

9 Παοάδειγμα Global εσθσγοάμμιρηπ A G C 0-2 -4-6 A -2 A -4 A -6 C -8 1 max{ (0+ζκοπ(Α,Α)), (-2+-2),(-2+-2)} = max{1,-4,-4} =1 max{ (-2+ζκοπ(G,Α)), (1+-2),(-4+-2)} = max{-3,-1,-6} =-1

10 Παοάδειγμα Global εσθσγοάμμιρηπ A G C A -2 A -4 A -6 0-2 -4-6 1-1 Δείκηηρ Από πού πήπαμε ηην max ηιμή max{ (-2+ζκοπ(G,Α)), (1+-2),(-4+-2)} = max{-3,-1,-6} =-1 C -8

11 Παοάδειγμα Global εσθσγοάμμιρηπ A G C A -2 A -4 0-2 -4-6 1-1 -3-1 0-2 Μια βέλτιστη ευθυγράμιιση x: y: A A A G A - C C A -6 C -8-3 -2-1 -5-4 -1

12 Ποωςεϊμικέπ ακξλξσθίεπ Βηνινγία: Κάπνηεο αιιαγέο είλαη πην πηζαλέο λα ζπκβνύλ από θάπνηεο άιιεο εκαληηθή ηδηόηεηα ησλ ακηλνμέσλ : κπνξνύλ λα αιιάδνπλ ιόγσ ηεο εμέιημεο ζε άιια ακηλνμέα ν βαζκόο πνπ γίλεηαη απηό πξνζδηνξίδεη ηελ εμέιημε ηεο πξσηεΐλεο ζην ρξόλν. Απηή ε αιιαγή νθείιεηαη ζε κεηάιιαμε, ζε εμέιημε(αλ έρνπλ ηνλ ίδην απόγνλν) ή έγηλε ηπραία;

13 σμςηοηςικέπ αλλαγέπ Ζ αληηθαηάζηαζε ελόο ακηλνμένο από έλα άιιν πνπ έρεη παξόκνην κέγεζνο ή παξόκνην ρεκηθό ηύπν, είλαη πην πηζαλόλ λα ζπκβεί παξά κηα αληηθαηάζηαζε κε έλα ακηλνμύ κε κεγάιε δηαθνξά ζηα ραξαθηεξηζηηθά ηνπο Γηαγξαθή ζπλερόκελσλ ζέζεσλ βάζεσλ ή ακηλνμέσλ είλαη πην πηζαλή από ηε δηαγξαθή ηνπ ίδηνπ αξηζκνύ ζέζεσλ ακηλνμέσλ ζε κε ζπλερόκελεο ζέζεηο ησλ αθνινπζηώλ

14 Διατξοεςικά Βάοη ρςιπ αλλαγέπ ε αθνινπζίεο DNA πηζαλά βάξε: +1 γηα ηαύηηζε βάζεσλ (match) -1 γηα αζηνρία (mismatch) -2 γηα εηζαγσγή θελνύ Γηα πξσηετληθέο αθνινπζίεο ππάξρνπλ πνιιά πηζαλά ζπζηήκαηα γηα ηηκέο ζθνξ.

15 Πιθαμά βάοη για αμιμξνέα Υσξίδνπκε ηα ακηλνμέα ζε νκάδεο κε παξόκνηνπο ρεκηθνύο ηύπνπο θνξ +1 γηα επζπγξάκκηζε 2 ακηλνμέσλ ζηελ ίδηα νκάδα θνξ -1 γηα επζπγξάκκηζε 2 ακηλνμέσλ από δηαθνξεηηθέο νκάδεο Απηό πνπ έγηλε ζηελ πξάμε ήηαλ λα αθήζνπκε ηηο ίδηεο ηηο πξσηεΐλεο λα καο δώζνπλ ην ζύζηεκα ζθνξ.

16 Χοήρη κξο πιμάκωμ για αμιμξνέα Πίλαθεο Αληηθαηάζηαζεο Ακηλνμέσλ Οη ηηκέο πνπ ρξεζηκνπνηνύληαη ζην Γπλακηθό πξνγξακκαηηζκό θαηά ηελ επζπγξάκκηζε ησλ ακηλνμέσλ πξνέξρνληαη από πίλαθεο αληηθαηάζηαζεο Γεκηνπξγήζεθαλ κεηά από κειέηε ηεο ζπρλόηεηαο εκθάληζεο ησλ ακηλνμέσλ ζηηο αθνινπζίεο. Απηό νθείιεηαη ζηηο ζρέζεηο νκνηόηεηαο πνπ έρνπλ κεηαμύ ηνπο ηα είθνζη ακηλνμηθά θαηάινηπα πνπ ζπλζέηνπλ ηηο πξσηεΐλεο

Γιαςί υοειάζξμςαι πίμακεπ αμςικαςάρςαρηπ ε κία απιή επζπγξάκκηζε ρσξίο θελά έρνπκε δύν αθνινπζίεο ρ θαη y κήθνπο n Γηα λα δώζνπκε έλα ζθνξ ζε απηή ηελ επζπγξάκκηζε (γηα λα ηελ αμηνινγήζνπκε) ρξεηαδόκαζηε έλα πίλαθα αληηθαηάζηαζεο πνπ λα ππνινγίδεη ηνλ αθόινπζν ιόγν : Πιθανότητα να έτοσν κοινό πρόγονο οι ακολοσθίες Πιθανότητα τσταίας εσθσγράμμισης τοσς 17

18 Dayhoff Ζ Margaret Dayhoff ήηαλ ε πξώηε πνπ άξρηζε λα ζπιιέγεη ζηαηηζηηθά ζηνηρεία γηα ηε ζπρλόηεηα ησλ αιιαγώλ ησλ ακηλνμέσλ ζηηο ηόηε γλσζηέο πξσηεΐλεο Γεκηνύξγεζε ηνπο πξώηνπο πίλαθεο αληηθαηάζηαζεο ην 1978 Οη πίλαθεο ηεο Dayhoff αλαλεώλνληαη θαζώο πεξηζζόηεξεο πξσηετληθέο αθνινπζίεο γίλνληαη γλσζηέο

19 Πίμακεπ για ποωςεϊμικέπ ακξλξσθίεπ Γύν γλσζηά ζύλνια πηλάθσλ γηα πξσηεηληθέο αθνινπζίεο: PAM matrices [Dayhoff et al., 1978] BLOSUM matrices[henikoff & Henikoff, 1992] Καη ηα δύν ζύλνια πξνζπαζνύλ λα θαηαγξάςνπλ ηε ζρεηηθόηεηα ηεο αληηθαηάζηαζεο ησλ ακηλνμέσλ ζηελ εμέιημε.

20 Μέςοηρη πιθαμξςήςωμ Γηα λα κεηξήζνπκε ηελ πηζαλόηεηα θάπνηαο αληηθαηάζηαζεο ακηλνμέσλ, π.ρ Serine -> Threonine κεηξάκε πόζεο θνξέο παξαηεξήζεθε ε αιιαγή από Serine ζε Threonine ζε επζπγξακκηζκέλεο αθνινπζίεο νκόινγσλ νξγαληζκώλ

21 Πίμακεπ Margaret Dayhoff (1978) Πξσηνπόξνο ζηε δεκηνπξγία πηλάθσλ αληηθαηάζηαζεο εμέιημεο ακηλνμέσλ Αληηθαηαζηάζεηο ακηλνμέσλ είλαη θνηλέο ζε ζπγγεληθέο πξσηεΐλεο. Οη δηαθνξέο ηνπο παξακέλνπλ ζπκβαηέο κε ηε δνκή θαη ιεηηνπξγία ηεο πξσηεΐλεο. Πίλαθεο Dayhoff είλαη γλσζηνί θαη ζαλ Percent Accepted Mutation (PAM)- Πνζνζηό Απνδεθηήο Μεηάιιαμεο ηεο πξσηεΐλεο.

22 Πίμακεπ PAM Οηθνγέλεηα πηλάθσλ. Παξνπζηάδεη πηζαλόηεηα αιιαγήο ελόο ακηλνμέσο ζε άιιν ιόγσ εμέιημεο ζε νκόινγεο πξσηετληθέο αθνινπζίεο. Κάπνηνο πίλαθαο δίλεη ηηο αλακελόκελεο αιιαγέο ζε νκόινγεο πξσηεΐλεο πνπ έρνπλ απνθιίλεη ιίγν κεηαμύ ηνπο θαη έρνπλ πεξίπνπ 50% νκνηόηεηα Άιινο πίλαθαο δίλεη ηηο αιιαγέο γηα κεγάιν ρξνληθό δηάζηεκα πνπ πξνθάιεζαλ κόλν 20% νκνηόηεηα

23 Markov Process Οη πίλαθεο PAM βαζίδνληαη ζην κνληέιν εμέιημεο πνπ ζεσξεί όηη νη αιιαγέο ακηλνμέσλ αθνινπζνύλ ηε δηαδηθαζία Markov (Markov Process) Markov Process: Κάζε αιιαγή ηνπ ηξέρνληνο ακηλνμένο είλαη αλεμάξηεηε από νπνηαδήπνηε πξνεγνύκελε κεηάιιαμε. Βάζε απηνύ κπνξνύλ λα εμαρζνύλ ζπκπεξάζκαηα γηα κεγάιεο πεξηόδνπο εμέιημεο έρνληαο παξαηεξήζεη κόλν ηηο αληηθαηαζηάζεηο ακηλνμέσλ ζε μικρό ρξνληθό δηάζηεκα

24 Πίμακεπ PAM Γηα ηε δεκηνπξγία ησλ πηλάθσλ: Οη αληηθαηαζηάζεηο ακηλνμέσλ ππνινγίζηεθαλ κε 1572 αιιαγέο ζε 71 ζύλνια πξσηετληθώλ αθνινπζηώλ πνπ ήηαλ 85% όκνηεο. Δπεηδή νη αιιαγέο απηέο παξαηεξνύληαη ζε αξθεηά ζπγγεληθέο πξσηεΐλεο, ανηι ποζω εύοςν ανηικαηαζηάζειρ α ινοξέων ος δεν αλλάζοςν ζη ανηικά ηη λειηοςπγία ηηρ πωηεΐνηρ Γηα απηό είλαη Απνδεθηέο Μεηαιιάμεηο ( Percent Accepted Mutation PAM )

25 Παοάδειγμα Πίμακα PAM:PAM 1 Οη πίλαθεο PAM είλαη κέηξν απόθιηζεο αθνινπζηώλ 1 PAM = 1% Percent Accepted Mutation 1% Πνζνζηό Απνδεθηήο Μεηάιιαμεο Γπν αθνινπζίεο έρνπλ 99% νκνηόηεηα πιιέγνληαο ηα ζηαηηζηηθά ησλ αιιαγώλ ησλ ακηλνμέσλ ζε δεπγάξηα αθνινπζηώλ κε 99%νκνηόηεηα ζηηο ζέζεηο ηνπο, δεκηνπξγήζεθε ν πίλαθαο 1PAM

26 Σύπξι πιμάκωμ PAM Για πιο μακπινέρ ακολοςθίερ σπηζιμοποιούμε άλλοςρ πίνακερ PAM 0 30 80 110 200 250 % identity 100 75 50 60 25 20 Σςνήθυρ, ππακηικά, σπηζιμοποιείηαι ο πίνακαρ PAM250

PAM 250 27

28 κξο ρςξ πίμακα PAM θνξ κεηάιιαμεο i<->j = = ( ή αναμενόμενης log 10 μετάλλαξης ) ή ό ά i j log 10 ό ρσθμός μετάλλαξης εξαιτίας σστνότητας i, j

29 Διαδικαρία ρσμπλήοωρηπ πίμακα PAM Τπνινγίδεηαη ην log odd score ηεο πξνεγνύκελεο εμίζσζεο γηα δπν ακηλνμέα Σν απνηέιεζκα πνιιαπιαζηάδεηαη επί 10, απιά γηα λα απνθεπρζνύλ ηα δεθαδηθά ςεθία θαη ην απνηέιεζκα κπαίλεη ζηνλ πίλαθα PAM

30 Δπενήγηρη ςιμήπ πίμακα Π.χ. (Q E)= 2 Επειδι θ τιμι του ςκορ ςτον πίνακα πολλαπλαςιάςτθκε επι 10 για να μθν ζχουμε δεκαδικά : το ςκορ είναι = 0.2 Συνεπώσ, 0.2=log 10 (ςχετικι αναμενόμενθ τιμι μετάλλαξθσ) 0.2 => Η ςχετικι αναμενόμενθ τιμι μετάλλαξθσ = 10 = 1.6 Αυτό ςθμαίνει πωσ θ μετάλλαξθ Q -> E εμφανίηεται ςε ςυγγενικζσ ακολουκίεσ 1.6 φορζσ ςυχνότερα από τυχαία

31 ημαρία πιμάκωμ Δκθαλίδνληαη ζε όιεο ηηο ζπγθξίζεηο πνπ αθνξνύλ νκνηόηεηεο αθνινπζηώλ. Ζ επηινγή ηνπ πίλαθα επεξεάδεη ζεκαληηθά ην ηειηθό απνηέιεζκα. Ο θάζε πίλαθαο αληηπξνζσπεύεη έκκεζα θάπνηα δηαδηθαζία θαη ραξαθηεξηζηηθά ηεο εμέιημεο ησλ βηνκνξίσλ. Ζ θαηαλόεζε ηεο ζεσξίαο πνπ αληηπξνζσπεύεη ν θάζε πίλαθαο, βνεζάεη ζηε ζσζηή επηινγή απηνύ πνπ ζα αληαπνθξηζεί θαιύηεξα ζηηο απαηηήζεηο καο.

32 κξο εσθσγοάμμιρηπ ποωςεϊμικώμ ακξλξσθιώμ Δθηόο από ηνπο πίλαθεο PAM (percentage accepted mutation) πνπ δεκηνπξγνύληαη βαζηζκέλνη ζε ζηνηρεία εμέιημεο ππάξρνπλ θαη νη πίλαθεο BLOSUM (Blocks Amino Acid Substitution Matrices) νη νπνίνη δεκηνπξγνύληαη βαζηζκέλνη ζε ζηαηηζηηθά ζηνηρεία ησλ δνκώλ ησλ πξσηετλώλ

33 Πίμακεπ BLOSUM Blocks Amino Acid Substitution Matrices (Henikoff and Henikoff 1992) Παξόκνηα ηδέα κε ηνπο PAM πίλαθεο. Τπνινγίδνληαη πηζαλόηεηεο γηα καθξηλά ζπγγεληθέο αθνινπζίεο. ηόρνο ηνπο: αληηθαηάζηαζε πηλάθσλ PAM κε πίλαθεο πνπ ζα εζηίαδαλ ζηελ εύξεζε καθξηλώλ αθνινπζηώλ ιακβάλνληαο ππόςε ηα θαηλνύξγηα ζηνηρεία γηα ηα ακηλνμέα πνπ δελ ππήξραλ ηελ επνρή ηεο δεκηνπξγίαο ησλ PAM

34 Πίμακεπ BLOSUM Βαζηζκέλνη ζηε βάζε δεδνκέλσλ BLOCKS πνπ πεξηέρεη επζπγξακκηζκέλεο αθνινπζίεο Σηκέο πίλαθα βαζηζκέλεο ζηηο αληηθαηαζηάζεηο ακηλνμέσλ ζε έλα κεγάιν ζύλνιν ~2000 πξνηύπσλ ακηλνμέσλ ηα blocks. Tα blocks απηά αληηπξνζσπεύνπλ πεξηζζόηεξεο από 500 νηθνγέλεηεο ζπγγεληθώλ πξσηετλώλ. Βαζηζκέλνη ζε δηαθνξεηηθή αλάιπζε αθνινπζηώλ θαη πεξηιακβάλνπλ κεγαιύηεξν ζύλνιν δεδνκέλσλ από ηνπο PAM πίλαθεο.

35 Πίμακεπ BLOSUM Σα κπινθ πνπ ραξαθηεξίδνπλ θάζε νηθνγέλεηα πξσηετλώλ (πνπ έρνπλ ηελ ίδηα βηνρεκηθή ιεηηνπξγία) έδσζαλ έλα ηύπν επζπγξάκκηζεο πνιιαπιώλ αθνινπζηώλ. Μεηξνύληαη νη αιιαγέο ακηλνμέσλ ζε θάζε ζηήιε ηεο επζπγξάκκηζεο. Γίλεηαη ζθνξ ζηηο αληηθαηαζηάζεηο γηα όια ηα επζπγξακκηζκέλα πξόηππα θαη δεκηνπξγείηαη ν πίλαθαο ζθνξ BLOSUM.

36 BLOSUM (Blocks Amino Acid Substitution Matrices) Έζησ ηα ακηλνμέα «a» θαη «b» q(a,b) ε ζπρλόηεηα εκθάληζεο ηνπο ζηηο αθνινπζίεο. p(a) = πηζαλόηεηα εκθάληζεο α BLOSUM(a,b)= log 2 q( a, b) p( a)* p( b)

37 BLOSUM62 Από πεξηνρέο επζπγξάκκηζεο θνληηλώλ αθνινπζηώλ ππνινγίδεηαη ην log odd score ηεο πξνεγνύκελεο εμίζσζεο Γηα λα απνθεπρζνύλ πεξηπηώζεηο bias θαη overweighing θνληηλώλ αθνινπζηώλ, νη Henikoffs αληηθαηέζηεζαλ πξσηεΐλεο κε νκνηόηεηα κεγαιύηεξε από κηα threshold ηηκή, (έλα πνζνζηό), κε κόλν κηα αληηπξνζσπεπηηθή πξσηεΐλε Σν πνζνζηό 62% δεκηνπξγεί ηνλ δηαδεδνκέλν πίλαθα BLOSUM62

Πίμακαπ BLOSUM62 38

39 ύγκοιρη BLOSUM με PAM πίμακεπ 1. Οη πίλαθεο PAM είλαη βαζηζκέλνη ζην κνληέιν Markov πνπ ιέεη πσο νη αιιαγέο πνπ γίλνληαη ζηα ακηλνμέα είλαη αλεμάξηεηεο από πξνεγνύκελεο αιιαγέο. Γηα λα ζπγθξίλνπλ καθξηλέο πξσηεΐλεο βαζίδνληαη πάλσ ζηηο πξώηεο αιιαγέο πνπ θαηεγξάθεζαλ ζε έλα κηθξό ρξνληθό δηάζηεκα από αθνινπζίεο πνπ είραλ 85 % νκνηόηεηα.

40 ύγκοιρη BLOSUM με PAM πίμακεπ 1. Οη πίλαθεο BLOSUM δελ βαζίδνληαη ζε δηαθξηηά εμειηθηηθά κνληέια. Τπνινγίδνληαη από ηηο αιιαγέο ησλ ακηλνμέσλ ζε κηα πεξηνρή ηεο νηθνγέλεηαο πξσηετλώλ άζρεηα από ην βαζκό νκνηόηεηαο αλάκεζα ζηηο πξσηετληθέο αθνινπζίεο.

41 ύγκοιρη BLOSUM με PAM πίμακεπ 2 of 3 2. Οη πίλαθεο PAM δίλνπλ ζθνξ γηα όιεο ηηο ζέζεηο ακηλνμέσλ ζε ζπγγεληθέο αθνινπζίεο. 2. Οη πίλαθεο BLOSSUM εμεηάδνπλ αληηθαηαζηάζεηο θαη ηηο ζέζεηο ακηλνμέσλ ζε Blocks πνπ αληηπξνζσπεύνπλ ηηο πην θνηλέο πεξηνρέο ζε ζπγγεληθέο αθνινπζίεο.

42 ύγκοιρη BLOSUM με PAM πίμακεπ 3 of 3 3. To κνληέιν ΡΑΜ ζρεδηάζηεθε γηα λα θαηαγξάθεη ηελ θαηαγσγή ηεο πξσηεΐλεο ελώ ην κνληέιν BLOSUM ζρεδηάζηεθε γηα λα βξίζθεη ηα πεδία πνπ έρνπλ δηαηεξεζεί. 4. BLOSUM, θαιύηεξν γηα καθξηλέο αθνινπζίεο.

43 Πίμακεπ Νξσκλεϊμικώμ ξνέωμ(dna) Βνεζνύλ ζηελ αμηνιόγεζε ηεο ζηαηηζηηθήο ζεκαζίαο ηεο επζπγξάκκηζεο δπν αθνινπζηώλ DNA. Οη ΡΑΜ πίλαθεο ησλ λνπθιετληθώλ νμέσλ είλαη βαζηζκέλνη ζην κνληέιν εμέιημεο Markov.

44 Ποξεςξιμαρία πιμάκωμ PAM για DNA Αξρηθά δεκηνπξγείηαη πίλαθαο κε 99% δηαηήξεζε ηεο αθνινπζίαο θαη 1% ΡΑΜ εμειηθηηθήο απόζηαζεο (1% κεηάιιαμε) Μνληέιν Α:νη κεηαιιάμεηο από έλα λνπθιενηίδην ζε έλα άιιν είλαη εμίζνπ πηζαλέο θαη ε ζπρλόηεηα παξνπζίαζεο ησλ 4 λνπθιενηηδίσλ είλαη ε ίδηα Μνληέιν Β: Μεγαιύηεξε πηζαλόηεηα αιιαγήο ηεο ησλ βάζεσλ Α ζε G (purines substitution) C ζε T (pyrimidines substitution) (θαη αληίζηξνθα) παξά αιιαγή θάπνηαο βάζεο από purines ζε pyrimidines

45 Transitions and transversions Transitions: αληηθαηαζηάζεηο αλάκεζα ζηηο purines (Α<-> G) ή αληηθαηαζηάζεηο αλάκεζα ζηηο pyrimidines (C<->T) Transversions: αληηθαηαζηάζεηο από κηα purine ζε pyrimidine ή από Pyrimidine ζε purine Transitions are more probable than transversions

Πίμακεπ ΡΑΜ για μξσκλεϊμικά ξνέα 46

47 Πίμακεπ Νξσκλεϊμικώμ ξνέωμ(dna) Όπσο θαη ζηνπο πίλαθεο ακηλνμέσλ νη πην πάλσ ηηκέο ησλ πηλάθσλ ρξεζηκνπνηνύληαη γηα λα δεκηνπξγήζνπκε ηνπο log odds πίλαθεο πνπ αληηπξνζσπεύνπλ ηε ζπρλόηεηα ησλ αληηθαηαζηάζεσλ πνπ αλακέλνληαη ζε κεγάιεο πεξηόδνπο εμέιημεο.

48 Μαθημαςικόπ Τπξλξγιρμόπ log odds Sij: H πικανότθτα ταφτιςθσ των νουκλεοτιδίων i και j δια τθν πικανότθτα τυχαίασ ευκυγράμμιςθσ τουσ Sij log( p i p i M p ij j ) Μij: θ τιμι από τον πίνακα Α ι Β (slide 46) pi,pj κεωροφνται 0,25 Λογαρικμίηοντασ με βάςθ το 2 (units of bits) και ςτρογγυλοποιώντασ το αποτζλεςμα παίρνουμε τουσ ακόλουκουσ πίνακεσ:

Ομοιόμοπθερ μεηαλλάξειρ Α G T C A 2 G -6 2 T -6-6 2 C -6-6 -6 2 Μη ομοιόμοπθερ μεηαλλάξειρ Α G T C Α 2 G -5 2 T -7-7 2 C -7-7 -5 2 49

Διραγωγή κεμώμ Δθηόο από πίλαθεο αληηθαηάζηαζεο ρξεηαδόκαζηε θαη έλα ηξόπν λα δίλνπκε ζθνξ ζηα θελά εκαληηθόο ν δηαρσξηζκόο: Αξρηθή εηζαγσγή θελνύ aaagaaa aaa-aaa Δπέθηαζε θελνύ aaaggggaaa aaa---- aaa 50

Gap penalties(κόρςξπ ΔιραγωγήπΚεμώμ) Ζ εηζαγσγή θελώλ θαη ηα gap penalties είλαη απαξαίηεηα γηα ηελ θαιύηεξε δπλαηή επζπγξάκκηζε ησλ αθνινπζηώλ Δμίζσζε Τπνινγηζκνύ : w x g rx Όπος: g : κόζηορ για ειζαγυγή κενού ή w x g r( x 1) r : κόζηορ για κάθε έξηπα ζηοισείο πος επιμηκύνει ηο κενό x : Μήκορ κενού 51

52 Gap penalties Vs Substitution Matrices Scores Υξεζηκνπνηώληαο πνιύ κεγάιν gap penalty ζε ζρέζε κε ην πεδίν ηηκώλ ησλ ζθνξ ησλ πηλάθσλ αληηθαηάζηαζεο (ακηλνμέσλ ή λνπθιετληθώλ νμέσλ) ηα θελά δελ ζα εκθαλίδνληαη πνηέ ζε επζπγξάκκηζε. Αλαιόγσο αλ είλαη πνιύ κηθξό ζα έρνπκε πνιιά θελά ζηελ επζπγξάκκηζε. Δπηπρώο, πξνγξάκκαηα όπσο ηα GCG, FASTA πξνηείλνπλ default ηηκέο γηα gap penalties.

53 CLUSTAL-W Για ευκυγράμμιςθ DNA ακολουκιών το CLUSTAL-W προτείνει +1 για Match, 0 για mismatch και gap penalties 10 για ειςαγωγι κενοφ πρώτθ φορά και 0.1 για επζκταςθ κενοφ κατά 1 κζςθ Για ευκυγράμμιςθ πρωτεϊνών το CLUSTAL-W προτείνει τον πίνακα BLOSUM62 για αντικαταςτάςεισ αμινοξζων και gap penalties 11 για ειςαγωγι αρχικοφ κενοφ και 1 για επζκταςθ του κενοφ κατά 1 κζςθ

Παοαςηοήρειπ Χριςθ μεγαλφτερων τιμών κόςτουσ για mismatch και gap penalties από τισ τιμζσ για match οδθγεί ςε τοπικζσ ευκυγραμμίςεισ (local alignments) Όταν το κόςτοσ για mismatch είναι μεγαλφτερο από το διπλάςιο του ςκορ για match τότε το gap penalty γίνεται ο κακοριςτικόσ παράγοντασ τθσ ευκυγράμμιςθσ. Για κόςτοσ mismatch μικρότερο από το διπλάςιο του ςκορ για match και ζνα ευρφ φάςμα gap penalties πολλζσ πικανζσ ευκυγραμμίςεισ είναι πικανζσ και εξαρτώνται και από τα mismatch αλλά και από τα gap penalty ςκορ. 54

55 ημαρία Δσθσγοάμμιρηπ ακξλξσθιώμ Significance test Γηαηί είλαη απαξαίηεην; Απαληά ζηελ εμήο εξώηεζε:ζ επζπγξάκκηζε πνπ βξέζεθε από ην πξόγξακκα είλαη απηή πνπ ζα αλακελόηαλ αλάκεζα ζε δπν ζπγγεληθέο αθνινπζίεο ή κπνξεί λα βξεζεί θαη αλάκεζα ζε αθνινπζίεο πνπ δελ έρνπλ ζρέζε.

56 Ανιξλόγηρη εσθσγοάμμιρηπ ακξλξσθιώμ Έζησ όηη πξνέθπςε κία ελδηαθέξνπζα νκνηόηεηα κεηαμύ δύν αθνινπζηώλ, είλαη ζεκαληηθή ή ηπραία; Έιεγρνο: Γεκηνπξγνύκε ηπραίεο κεηαζέζεηο ησλ (ακηλνμέσλ ή βάζεσλ) κίαο αθνινπζίαο Δπζπγξακκίδνπκε ηηο κεηαζέζεηο κε ηελ άιιε αθνινπζία Αλ νη αθνινπζίεο πνπ πξνήιζαλ από ηηο κεηαζέζεηο έρνπλ ην ίδην ζθνξ κε ηελ αξρηθή ηόηε δεν είναι ζημανηική η ευθυγράμμιζη.

57 Ανιξλόγηρη εσθσγοάμμιρηπ ακξλξσθιώμ Z-score score score έ ό ή ό Z-score =0 ζημαίνει πυρ η ομοιόηηηα πος πποέκςτε δεν είναι καλύηεπη από ηην ομοιόηηηα πος παπαηηπήθηκε on average ζε όλο ηο πληθςζμό, έηζι πιθανόν να είναι ηςσαία Z-score >= 5 δηλώνει ζημανηική εςθςγπάμμιζη Πληθυσμός; Οη αλαθαησκέλεο αθνινπζίεο απνηεινύλ ην λέν πιεζπζκό κε ηνλ νπνίν ζα ζπγθξίλνπκε ηελ αξρηθή καο επζπγξάκκηζε Ε-score καο δίλεη έλα κέηξν γηα ην πόζν αζπλήζηζηε είλαη ε αξρηθή καο επζπγξάκκηζε βάζεη ηνπ κέζνπ όξνπ (mean) θαη ηεο ηππηθήο απόθιηζεο (standard deviation) ησλ ζθνξ όινπ ηνπ πιεζπζκνύ αθνινπζηώλ

58 Πιθαμόςηςα P Πνιιά πξνγξάκκαηα δίλνπλ ηελ πηζαλόηεηα P, ηελ πηζαλόηεηα ε επζπγξάκκηζε καο λα κελ είλαη θαιύηεξε από κηα ηπραία επζπγξάκκηζε P: επεμήγεζε ηηκώλ: P 10 10 10 10 P -100-50 5 10 100 P -1 P P exact match 10 10 10 10 1 50 nearly identical, closely related, usually distant relatives match probably insignificant e.g SNPs homology certain

59 E-value Γηα αλαδεηήζεηο επζπγξακκίζεσλ ζε βάζεηο δεδνκέλσλ αθνινπζηώλ ρξεζηκνπνηείηαη ε ηηκή E-value BLAST ρξεζηκνπνηεί ηελ Δ-value Δ = αξηζκόο ηαηξηαζκάησλ ην ίδην θαιά κε ην ππάξρνλ, πνπ ζα πξνέθππηαλ όκσο ηπραία. E = P * κέγεζνο βάζεο. Δ<= 0.02 πηζαλώο νκόινγεο 0.02 <Δ < 1 δελ κπνξεί λα απνθιεηζηεί ε νκνινγία Δ>1 ηπραία

60 ημαρία Δσθσγοάμμιρηπ ακξλξσθιώμ- Ποξβλήμαςα Υξήζε ηπραίσλ αληί θπζηθώλ αθνινπζηώλ δελ εμεηάδεη building blocks ησλ αθνινπζηώλ αιιά ζύκβνιν κε ζύκβνιν. Οη θπζηθέο αθνινπζίεο είλαη πην πνηθίιεο από ηηο ηπραίεο θαη ε ρξήζε ησλ ηειεπηαίσλ γηα ειέγρνπο νδεγεί πνιιέο θνξέο ζε ππεξεθηίκεζε ηεο ζεκαζίαο ηεο επζπγξάκκηζεο.