Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch



Σχετικά έγγραφα
ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Ενότητα6. Μέθοδοι Κοστολόγησης. MBA Master in Business Administration Τµήµα: Οικονοµικών Επιστηµών. ιδάσκων: ρ. Γεώργιος ρογαλάς

14.00 µ.µ µ.µ. ένα (1) άτοµα (προετοιµασία παρασκευή) π.µ π.µ. δύο (2) άτοµα (προετοιµασία παρασκευή)

Αντωνία Αθανασοπούλου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΟΙΚΟΝΟΜΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΓΥΝΑΙΚΕΙΟΙ ΑΓΡΟΤΟΥΡΙΣΤΙΚΟΙ ΣΥΝΕΤΑΙΡΙΣΜΟΙ ΣΤΗΝ ΕΛΛΑ Α

ΕΛΤΙΟ Ε ΟΜΕΝΩΝ ΑΣΦΑΛΕΙΑΣ

[Σηµ: Ο ένας αστερίσκος σηµειώνει τα άρθρα που αναθεωρήθηκαν το 1986 και οι δύο, αυτά που αναθεωρήθηκαν το 2001]

ΝΟΜΟΣ 3263/2004 (ΦΕΚ 179 Α ) Μειοδοτικό σύστηµα ανάθεσης των δηµοσίων έργων και άλλες διατάξεις

/νση: ΧΑΡΑΚΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ Μ. Αλεξάνδρου 49, 66100, ράµα Τηλ&φαξ: , κιν.: info@akademia.

(Πράξη κατάθεσης Υπουργείου Απασχόλησης και Κοινωνικής Προστασίας:ΠΚ 69/ )

Α. ΟΡΓΑΝΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΕΦΑΡΜΟΓΗΣ

Επίσηµη Εφηµερίδα αριθ. C 372 της 09/12/1997 σ

5. ΤΙΜΟΛΟΓΙΟ ΜΑΡΤΙΟΣ K:\A61500\Design\tenders\2013_6151_drills_5243\Tefhi\Timologio_5243.DOC

Τα Αναβολικά. Τα αναβολικά χωρίζονται στα φυσικά και στα συνθετικά.

4 ο ΛΥΚΕΙΟ ΛΑΜΙΑΣ ΟΙΚΟΝΟΜΙΚΕΣ ΚΑΙ ΚΟΙΝΩΝΙΚΕΣ ΣΥΝΕΠΕΙΕΣ ΤΗΣ ΟΙΚΟΝΟΜΙΚΗΣ ΚΡΙΣΗΣ ΕΚΘΕΣΗ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΜΕ ΘΕΜΑ. Ε ιµέλεια Εργασίας :Τµήµα Α4

Δρ.ΠΟΛΥΚΑΡΠΟΣ ΕΥΡΙΠΙΔΟΥ

ΕΡΕΥΝΑ ΚΑΤΑΝΑΛΩΤΗ ΑΡΩΜΑΤΙΚΩΝ & ΦΑΡΜΑΚΕΥΤΙΚΩΝ ΒΙΟΚΑΥΣΙΜΩΝ

ΙΕΘΝΗΣ ΣΥΜΒΑΣΗ ΕΡΓΑΣΙΑΣ 183 «για την αναθεώρηση της (αναθεωρηµένης) σύµβασης για την προστασία της µητρότητας,»

ΕΡΓΑΣΙΑ ΣΤΗ ΓΕΩΜΕΤΡΙΑ

ΔΗΜΗΤΡΑ ΠΑΠΑΖΩΤΟΥ ΧΡΥΣΑΝΘΗ-ΣΟΦΙΑ ΠΛΑΚΑ ΑΝΤΙΓΟΝΗ ΤΣΑΡΑ

Σηµειώσεις στο ταξινοµούµε

ΚΕΦΑΛΑΙΟ 7 ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΠΡΟΤΑΣΕΙΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΝΑΥΠΗΓΩΝ ΜΗΧ/ΓΩΝ ΜΗΧΑΝΙΚΩΝ. ΘΕΜΑ: Προστασία µε επιµεταλλώσεις. Σκαβάρας Παναγιώτης

Εισαγωγή: ακαδηµαϊκά αδικήµατα και κυρώσεις

Απομόνωση χλωροφύλλης

Ρόδος και Αίγυπτος : λίκνα ευεργετισμού. Ματούλα Τομαρά-Σιδέρη

Σηµειώσεις στις Εµπορικές Εταιρίες

ΦΥΣΙΚΟΣ ΑΕΡΙΣΜΟΣ - ΡΟΣΙΣΜΟΣ

Αυτός που δεν μπορεί να δει τα μικρά πράγματα είναι τυφλός και για τα μεγαλύτερα. (Κομφούκιος, πχ)

: Aύξηση φόρου εισοδήµατος, και µείωση µισθών

ΤΜΗΜΑ ΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

ΔΥΟ ΝΕΑ ΕΡΓΑΣΤΗΡΙΑ ΔΥΟ ΝΕΑ ΠΑΙΧΝΙΔΙΑ για τη διδασκαλία της Βιολογίας στο Γυμνάσιο

ΣΥΣΤΗΜΑ ΔΙΑΓΝΩΣΗΣ ΑΝΑΓΚΩΝ ΑΓΟΡΑΣ ΕΡΓΑΣΙΑΣ ΔΙΑΓΝΩΣΗ ΑΝΑΓΚΩΝ ΣΕ ΠΕΡΙΦΕΡΕΙΑΚΟ ΕΠΙΠΕΔΟ

Η ΦΙΛΙΑ..!!! Η ΑΞΙΑ ΤΗΣ ΦΙΛΙΑΣ

ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΠΕΛΛΑΣ ΗΜΟΣ Ε ΕΣΣΑΣ

KATATAΞH APΘPΩN. 6. Αρχές της προσφοράς και προμήθειας, ανθρώπινων ιστών και/ ή κυττάρων

Α. ΠΕΡΙΓΡΑΦΗ ΜΙΚΡΟΣΚΟΠΙΟΥ Ένα απλό σχολικό µικροσκόπιο αποτελείται από τρία βασικά συστήµατα, το οπτικό, το µηχανικό και το φωτιστικό.

Το τµήµα Χηµικών Μηχανικών, Παν. Πατρών. Επιτροπή Αξιολόγησης του Προγράµµατος Μεταπτυχιακών Σπουδών

Με την ασφάλιση αυτή καλύπτεται ζηµία στα ασφαλισµένα αντικείµενα αµέσως προερχόµενη από πρόσκρουση

στήλη υγιεινολόγων στόματος

4 Περίοδοι µε 3ωρα ιαγωνίσµατα ΕΚΤΟΣ ωραρίου διδασκαλίας!!! ΠΡΟΓΡΑΜΜΑ ΙΑΓΩΝΙΣΜΩΝ

03-00: Βιομάζα για παραγωγή ενέργειας Γενικά ζητήματα εφοδιαστικών αλυσίδων

Α. Πολιτιστικοί φορείς Πλήθος φορέων Έδρα Γεωγραφική κατανομή φορέων Νομική μορφή Έτος ίδρυσης...

...ακολουθώντας τη ροή... ένα ημερολόγιο εμψύχωσης

ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ ΚΑΙ ΤΡΑΠΕΖΙΚΟ ΣΥΣΤΗΜΑ

ΕΘΝΙΚΟ ΠΛΑΙΣΙΟ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΔΡΑΣΕΩΝ

ΠΡΟΣΛΗΨΕΙΣ ΚΑΙ ΕΙΚΟΝΕΣ ΤΗΣ ΕΛΛΑΔΑΣ

Η Υγεία είναι ο παράγοντας που μετράει την φυσική, ψυχολογική ή ακόμα και την πνευματική κατάσταση ενός ζώντος οργανισμού.

Βασικά σημεία διάλεξης

Πρόγραμμα Σπουδών για το "Νέο Σχολείο"

ΑΥΓΟΥΣΤΟΣ 2008 ΥΠΟΜΝΗΜΑ ΤΗΣ ΚΕΝΤΡΙΚΗΣ ΕΝΩΣΗΣ ΕΠΙΜΕΛΗΤΗΡΙΩΝ ΕΛΛΑΔΟΣ ΑΡΧΗΓΟ ΤΗΣ ΑΞΙΩΜΑΤΙΚΗΣ ΑΝΤΙΠΟΛΙΤΕΥΣΗΣ ΚΑΙ ΠΡΟΕΔΡΟ ΤΟΥ ΠΑΣΟΚ

ΑΠΑΝΤΗΣΕΙΣ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ 2014

Αριθµ. Απόφασης: 739 / 2014 ΠΑΡΟΝΤΕΣ: ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΙΑ ΙΚΤΥΟ ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΗΜΟΣ ΣΕΡΡΩΝ

Μέθοδοι διαχωρισμού των συστατικών ενός ετερογενούς μείγματος

ΥΠΟΣΤΗΡΙΞΗ ΑΝΑΣΚΑΦΙΚΟΥ ΕΡΓΟΥ

ΚΕΦΑΛΑΙΟ 8 ΣΥΜΠΕΡΑΣΜΑΤΑ

ΣΥΣΤΗΜΑ ΔΙΑΓΝΩΣΗΣ ΑΝΑΓΚΩΝ ΑΓΟΡΑΣ ΕΡΓΑΣΙΑΣ ΠΑΡΑΔΟΤΕΟ ΕΘΝΙΚΟΥ ΜΗΧΑΝΙΣΜΟΥ

Αξιολόγηση του Εκπαιδευτικού Έργου. Διαδικασία Αυτοαξιολόγησης στη Σχολική Μονάδα

- 1 - Ενημέρωση: Αύγουστος 2015

ΤΟ ΣΥΝΤΑΓΜΑ ΤΟΥ Εξώφυλλο του Συντάγµατος του 1844 (Βιβλιοθήκη Βουλής των

Αναπαραστάσεις των φύλων στα παιδικά αναγνώσµατα του νηπιαγωγείου και του δηµοτικού σχολείου

Αρµοδιότητες Αυτοτελούς Τµήµατος Δηµοτικής Αστυνοµίας

Οι 21 όροι του Λένιν

ΠΑΙΔΑΓΩΓΙΚΗ ΣΧΟΛΗ (ΦΛΩΡΙΝΑ) ΤΜΗΜΑ ΝΗΠΙΑΓΩΓΩΝ ΕΡΓΑΣΤΗΡΙΟ ΔΙΔΑΚΤΙΚΗΣ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΠΑΡΑΓΩΓΗΣ ΔΙΔΑΚΤΙΚΟΥ ΥΛΙΚΟΥ

Επίσημη Εφημερίδα της Ευρωπαϊκής Ένωσης

Ενότητα 2. Γενικά Οργάνωση Ελέγχου (ΙΙ) Φύλλα Εργασίας Εκθέσεις Ελέγχων

Ασφάλεια στις εργασίες κοπής μετάλλων

ΘΕΜΑΤΑ ΚΑΝΟΝΙΣΜΩΝ ΒΙΒΛΙΟ ΠΕΡΙΠΤΩΣΕΩΝ ΠΕΡΙΕΧΟΜΕΝΑ

Αρωματικά φυτά της Ελλάδας

Από τη διδασκαλία της περίληψης στη διδασκαλία της έκθεσης Η διδασκόμενη θεωρία στην πράξη Εισηγήτρια: Μαρία Κάππου

ΕΓΧΕΙΡΙ ΙΟ ΛΕΙΤΟΥΡΓΙΑΣ ΚΑΙ ΟΡΓΑΝΩΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ FREDERICK

ΚΕΦΑΛΑΙΟ 3 ο ΤΟ ΜΕΛΛΟΝ ΤΗΣ ΕΥΡΩΠΑΪΚΗΣ ΕΝΩΣΗΣ. 3.1 Εισαγωγή

Επίσηµη Εφηµερίδα της Ευρωπαϊκής Ένωσης. (Νομοθετικές πράξεις) ΑΠΟΦΑΣΕΙΣ

Οι Ερασιτεχνικές Ασχολίες

Σαιξπηρικά µοτίβα. Στάθης Λιβαθηνός, σκηνοθέτης, Εθνικό Θέατρο

«ΣΥΝΕΝΤΕΥΞΗ ΤΟΥ ΗΜΑΡΧΟΥ ΙΛΙΟΥ, Κ. ΝΙΚΟΥ ΖΕΝΕΤΟΥ ΣΤΗΝ ΕΦΗΜΕΡΙ Α «ΜΙΤΟΣ» ΚΑΙ ΤΗ ΗΜΟΣΙΟΓΡΑΦΟ ΑΘΗΝΑ ΠΕΡΡΑΚΗ»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΚΟΙΝΩΝΙΚΗΣ ΑΝΘΡΩΠΟΛΟΓΙΑΣ ΚΑΙ ΙΣΤΟΡΙΑΣ Π.Μ.Σ. «ΓΥΝΑΙΚΕΣ ΚΑΙ ΦΥΛΑ: ΑΝΘΡΩΠΟΛΟΓΙΚΕΣ ΚΑΙ ΙΣΤΟΡΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ»

ΕΘΙΜΑ ΤΟΥ ΚΟΣΜΟΥ. Αγγελική Περιστέρη Α 2

ΤΟ ΝΕΡΟ ΜΕΣΑ ΑΠΟ ΤΙΣ ΠΗΓΕΣ-ΚΡΗΝΕΣ ΤΟΥ ΗΜΟΥ ΤΟΠΕΙΡΟΥ

ΕΚΘΕΣΗ ΓΙΑ ΤΗΝ ΠΑΡΑΝΟΜΗ ΙΑΚΙΝΗΣΗ ΑΝΘΡΩΠΩΝ

Ανακοίνωση σχετικά με τα επαγγέλματα που επηρεάζονται από την άρση των αδικαιολόγητων περιορισμών στην πρόσβαση και άσκηση:

ΔΙΗΜΕΡΙΔΑ ΤΕΕ ΤΜΗΜΑ ΚΕΡΚΥΡΑΣ

ΑΘ. ΚΟΥΤΟΥΚΙΔΗΣ ΓΕΩΠΟΝΟΣ Ένωση Αγροτικών Συνεταιρισμών Ορεστιάδας

Ε Κ Θ Ε Σ Η. του Διοικητικού Συμβουλίου της Ανωνύμου Εταιρίας με την επωνυμία. «Unibios Ανώνυμος Εταιρία Συμμετοχών»

Δαλιάνη Δήμητρα Λίζας Δημήτρης Μπακομήτρου Ελευθερία Ντουφεξιάδης Βαγγέλης

ΕΘΝΙΚΗ ΣΧΟΛΗ ΗΜΟΣΙΑΣ ΙΟΙΚΗΣΗΣ ΜΑΘΗΜΑ: ΟΡΓΑΝΩΣΗ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ ΚΡΑΤΟΥΣ (ΣΥΝΤΑΓΜΑΤΙΚΟ ΙΚΑΙΟ)

ενεργοί πολίτες για τη Μήλο οι θέσεις μας Υποψηφιότητα Αντώνη Καβαλιέρου δημοτικές εκλογές

Δασικά Οικοσυστήματα και Τεχνικά Έργα

Ομιλία του ημάρχου Αμαρουσίου, Προέδρου Ιατρικού Συλλόγου Αθηνών. Γιώργου Πατούλη, στην εκδήλωση μνήμης στον Ιωάννη Πασαλίδη

ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΣΚΑΛΑΣ Η ΠΥΘΑΓΟΡΕΙΑ ΦΙΛΟΣΟΦΙΑ ΚΑΙ Η ΑΝΑΚΑΛΥΨΗ ΑΣΥΜΜΕΤΡΩΝ ΜΕΓΕΘΩΝ

Πανελλαδικό Κάλεσµα για την Προοπτική Δηµιουργίας Αναρχικής Πολιτικής Οργάνωσης

Έχοντας υπόψη: τη συνθήκη για την ίδρυση της Ευρωπαϊκής Κοινότητας, και ιδίως το άρθρο 175 παράγραφος 1, την πρόταση της Επιτροπής ( 1 ),

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 23 ΜΑΪΟΥ 2002 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ: ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

ΠΕΡΙΛΗΨΗ ΣΥΝΕ ΡΙΑΣΗΣ 23 ης /2010

Το κύτταρο. Μαυροματάκης Γιώργος - Βιολόγος

Transcript:

Οµολογία ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Σελίδα 2 Οµολογία Οµολογία Οµολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός διπλασιασµός εξελικτικό "εργαλείο" ανάπτυξης διαφοροποιηµένων λειτουργιών Σελίδα 3 Σελίδα 4 Οµολογία / Οµοιότητα Οµοιότητα Οµολογία (homology) κοινή εξελικτική καταγωγή Οµοιότητα (similarity) παρατηρήσιµη ποσότητα που µπορεί να εκφρασθεί ως το ποσοστό των ταυτόσηµων καταλοίπων µεταξύ δύο ακολουθιών ή µε τη χρήση κάποιου άλλου κατάλληλου µέτρου Η υψηλή οµοιότηταοιότητα σε επίπεδο ακολουθίας αποτελεί ένδειξη κοινής εξελικτικής καταγωγής - οµολογίας. Η µελέτη των οµοιοτήτων σε επίπεδο ακολουθίας µπορεί να δώσει πληροφορίες: για την εξελικτική σχέση των ακολουθιών των βιοµακροµορίων που παρατηρούνται στους σύγχρονους οργανισµούς για τις περιοχές των ακολουθιών οι οποίες είναι σηµαντικές για τη δοµή και τη λειτουργία τους Σελίδα 5 Σελίδα 6

Μέθοδοι σύγκρισης ακολουθιών Τεχνικές που βασίζονται στη στοίχιση των ακολουθιών Η σύγκριση δύο ακολουθιών µπορεί να γίνει µε τη στοίχισή τους και τον υπολογισµό κάποιου µέτρου οµοιότητας (ή διαφοράς) µε βάση τη δεδοµένη στοίχιση. Τεχνικές που δεν βασίζονται στη στοίχιση των ακολουθιών Σελίδα 7 Στοίχιση Ακολουθιών απόκλιση από κοινό προγονικό µόριο µέσω: αντικαταστάσεων (substitutions), π.χ. G στη θέση του A indels ενθέσεων (insertions), π.χ. εισαγωγή του A µεταξύ των M και V διαγραφών (deletions), π.χ. απαλοιφή του L µεταξύ των I και Y AAVILYMV προγονικό µόριο AGVILYMV AGVILYMAV AGVIYMAV Σελίδα 8 Σε µία "ιδανική" στοίχιση: Στοίχιση Ακολουθιών Η αντιστοίχιση ανόµοιων καταλοίπων (mismatch) αντιπροσωπεύει αντικαταστάσεις. Η εισαγωγή κενών (gap) οφείλεται σε ενθέσεις ή διαγραφές. match S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC Σελίδα 9 S-S mismatch gap εδοµένα δύο ακολουθίες Στοίχιση Ακολουθιών ένα σύστηµα βαθµολόγησης της στοίχισης: Ζητούµενο όµοιων καταλοίπων (match score) ανόµοιων καταλοίπων (mismatch score) ενός καταλοίπου µε κενό (ποινή για τα κενά, gap penalty) εύρεση της βέλτιστης στοίχισης των δύο ακολουθιών που διατηρεί τη σειρά των χαρακτήρων εισάγει τα απαραίτητα κενά µεγιστοποιεί το συνολικό score οµοιότητας Σελίδα 10 Στοίχιση Ακολουθιών Είδος στοίχισης επιλογές είδος στοίχισης σύστηµα βαθµολόγησης (scoring system) αλγόριθµος για τον προσδιορισµό της στοίχισης στατιστικές µέθοδοι για την αξιολόγηση της σηµαντικότητας της βαθµολογίας (score) που προέκυψε κατά τη στοίχιση π.χ. είναι η οµοιότητα αρκετά υψηλή ώστε να αποτελεί ένδειξη οµολογίας??? Σελίδα 11 Σελίδα 12

Είδος στοίχισης Ολική στοίχιση (global alignment) στοίχιση όσο το δυνατόν περισσότερων χαρακτήρων καθ όλο το µήκος των ακολουθιών βασίζεται στο συνολικό score, ακόµα και σε βάρος τµηµάτων των ακολουθιών που έχουν προφανή οµοιότητα για κοντινές εξελικτικά ακολουθίες παρόµοιου µήκους Είδος στοίχισης Τοπική στοίχιση (local alignment) αναζήτηση όµοιων τµηµάτων των ακολουθιών για ακολουθίες διαφορετικού µήκους µε µία ή περισσότερες συντηρηµένες περιοχές δοµικά αυτοτελείς περιοχές πρωτεϊνών (domains), µε χαρακτηριστική ακολουθία και λειτουργία στοίχιση mrna µε γενωµικό DNA Σελίδα 13 Σελίδα 14 Σ ένα απλό σύστηµα βαθµολόγησης µπορούµε να ορίσουµε σταθερές τιµές για τη στοίχιση όµοιων καταλοίπων (match score) ανόµοιων καταλοίπων (mismatch score) καταλοίπου µε κενό (gap penalty) Το τελικό score οµοιότητας της στοίχισης ισούται µε το άθροισµα των επιµέρους scores. match score = 1, mismatch score = -1, gap penalty = -2 18 στοιχίσεις όµοιων καταλοίπων 32 στοιχίσεις ανόµοιων καταλοίπων 4 στοιχίσεις καταλοίπων µε κενά total score = 18 1 + 32 (-1) + 4 (-2) = -22 Σελίδα 15 Σελίδα 16 συντηρητικές αντικαταστάσεις (conservative substitutions) Η αντικατάσταση ενός αµινοξέος από κάποιο άλλο µε παρόµοιες φυσικοχηµικές ιδιότητες, είναι λιγότερο πιθανό να αλλοιώσει τη δοµή και τη λειτουργία µιας πρωτεΐνης. Lys Arg πουρίνες: αδενίνη (Α) και γουανίνη (G) πυριµιδίνες: κυτοσίνη (C) και θυµίνη (T) µεταπτώσεις (transitions): αλλαγές από πουρίνη σε πουρίνη ή από πυριµιδίνη σε πυριµιδίνη µεταστροφές (transversions): αλλαγές από πουρίνη σε πυριµιδίνη ή αντίστροφα Οι µεταπτώσεις είναι πιθανότερο να συµβούν σε σχέση µε τις µεταστροφές. Leu Σελίδα 17 Ile Σελίδα 18

(Substitution matrices) αποδίδουν διαφορετικά scores οµοιότητας για την αντιστοίχιση διαφορετικών αµινοξέων εξάγονται από πολλαπλές στοιχίσεις score ~ log 2 (observed/expected) observed παρατηρηθείσα συχνότητα αντικατάστασης expected αναµενόµενη συχνότητα αντικατάστασης (Substitution matrices) συµµετρικοί δεν είναι γνωστό πιο αµινοξύ προϋπήρχε score > 0 ένδειξη ότι η στοίχιση των καταλοίπων αποτελεί πραγµατικό εξελικτικό γεγονός score < 0 ένδειξη ότι η στοίχιση των καταλοίπων είναι λιγότερο πιθανό να βρεθεί στην ευθυγράµµιση οµόλογων ακολουθιών Σελίδα 19 Σελίδα 20 PAM (Point Accepted Mutation) (Dayhoff) 1PAM: µονάδα εξελικτικής απόκλισης που αντιστοιχεί σε αλλαγή 1% αµινοξέων 250PAM: απόκλιση ~ 80% Ένα αµινοξύ µπορεί να αλλάξει περισσότερες από µία φορές ή / και να επιστρέψει στον αρχικό του τύπο. MATCG MAGCG MATGG Κάθε αµινοξύ αποκλίνει µε διαφορετικό ρυθµό. PAM (Point Accepted Mutation) (Dayhoff) πίνακας PAM1 υπολογίσθηκε βάσει ολικών στοιχίσεων από 71 οικογένειες πρωτεϊνών µε >85% οµοιότητα πίνακας PAM250 υπολογίζεται ως η 250-ιοστή δύναµη του πίνακα PAM1 Με τον ίδιο τρόπο κατασκευάζονται πίνακες PAM µε διαφορετικούς δείκτες. Οι πίνακες PAM µε µικρότερους δείκτες χρησιµοποιούνται για τη στοίχιση κοντινότερων εξελικτικά ακολουθιών. Σελίδα 21 Σελίδα 22 PAM (Point Accepted Mutation) (Dayhoff) R, K θετικά φορτισµένα F αρωµατικό PAM (Point Accepted Mutation) (Dayhoff) Θεωρεί ότι η πιθανότητα παρατήρησης µιας µετάλλαξης είναι ανεξάρτητη από την περιοχή της πρωτεΐνης προηγούµενες µεταλλάξεις στην ίδια θέση Στηρίζεται µόνο στις ιδιότητες σφαιρικών υδατοδιαλυτών πρωτεϊνών. Σελίδα 23 Σελίδα 24

BLOSUM (Blocks Amino Acid Substitution Matrix) (Henikoff) BLOCKS database τοπική πολλαπλή στοίχιση χωρίς κενά, εξελικτικά αποµακρυσµένων πρωτεϊνών gapless alignment blocks BLOSUM (Blocks Amino Acid Substitution Matrix) (Henikoff) δείκτες πινάκων BLOSUM ποσοστό οµοιότητας των ακολουθιών που χρησιµοποιήθηκαν για την κατασκευή του πίνακα BLOSUM62: ακολουθίες µε οµοιότητα >62% έχουν οµαδοποιηθεί Οι πίνακες BLOSUM µε µικρότερους δείκτες χρησιµοποιούνται για τη σύγκριση περισσότερο αποµακρυσµένων εξελικτικά ακολουθιών. Στηρίζονται σε πραγµατικές στοιχίσεις και δεν προκύπτουν αναγωγικά όπως οι πίνακες PAM. Σελίδα 25 Σελίδα 26 BLOSUM (Blocks Amino Acid Substitution Matrix) (Henikoff) R, K θετικά φορτισµένα F αρωµατικό PAM designed to track the evolutionary origins of proteins στοίχιση συγγενών ακολουθιών BLOSUM designed to find the conserved domains of proteins στοίχιση αποµακρυσµένων ακολουθιών εύρεση τοπικών οµοιοτήτων Σελίδα 27 Σελίδα 28 Μοντέλα νουκλεοτιδικών υποκαταστάσεων Μοντέλα βαθµολόγησης των κενών κενό µήκους k καταλοίπων Linear gap penalty gap penalty a gp(k) = ak Affine gap penalty gap-opening penalty b (ποινή για το άνοιγµα κενού) gap-extension penalty a (ποινή για την επέκταση κενού) gp(k) = b + ak, ( b > a ) ευνοεί την εισαγωγή λίγων µεγάλων κενών σε σχέση µε πολλά µικρότερα κενά Σελίδα 29 Σελίδα 30

Το ολικό score της στοίχισης προκύπτει από το άθροισµα των scores των ζευγών καταλοίπων και των ποινών για τα κενά. Εµπειρική επιλογή τιµών ποινής για την εισαγωγή και την επέκταση κενών http://www.ebi.ac.uk/help/matrix.html Blosum62 gap-opening penalty = b = -10 gap-extension penalty = a = -1 score = S(Κ,K)+S(A,K)+S(H,H)+S(G,G)+S(K,V)+S(K,T)-( b + a 1) = 5 + (-1) + 8 + 6 + (-2) + (-1) - (10+1 2) = 3 Σελίδα 31 Σελίδα 32 Τεχνικές Στοίχισης Ακολουθιών Dot Plots ιαγράµµατα Πινάκων Σηµείων (Dot Matrix Plots) Αλγόριθµοι υναµικού Προγραµµατισµού Needleman-Wunsch algorithm (ολική στοίχιση) Smith-Waterman algorithm (τοπική στοίχιση) Ευριστικοί Αλγόριθµοι FASTA BLAST Σελίδα 33 Σελίδα 34 Dot Plots Dot Plots κατασκευή δισδιάστατου ορθογώνιου διαγράµµατος µε τις υπό σύγκριση ακολουθίες στη θέση των αξόνων χρωµατισµός των κελιών που αντιστοιχούν σε ταυτόσηµα κατάλοιπα των δύο ακολουθιών a-f) T 1 = T 2 g-h) T 1 T 2 περιοχές του πίνακα µε χρωµατισµένα κελιά κατά µία διαγώνιο υποδεικνύουν περιοχές ταύτισης των ακολουθιών εφαρµογή τεχνικών φιλτραρίσµατος για τη µείωση του θορύβου (µεµονωµένες ή µικρού µήκους στοιχίσεις) χρήση πινάκων αντικαταστάσεως για τη βαθµολόγηση ζευγών καταλοίπων υποκειµενική ερµηνεία των αποτελεσµάτων Σελίδα 35 Σελίδα 36

A C G T A C G T A C G T A C G T Dot Plots A C G G G G G T A C G G G G G T άµεση οπτικοποίηση επαναλήψεων παλίνδροµων ακολουθιών Dot Plots περιοχών χαµηλής πολυπλοκότητας ενθέσεων ή διαγραφών A C G T T G C A A C G T T G C A E F G H I K L N P Q E F G N P Q µελέτη γονιδιωµάτων δοµή RNA Σελίδα 37 Σελίδα 38 Μέθοδοι υναµικού Προγραµµατισµού ηµιουργία βέλτιστης στοίχισης χρησιµοποιώντας τις βέλτιστες στοιχίσεις µικρότερων ακολουθιών. Τοπική Στοίχιση (Smith-Waterman) 2 ακολουθίες x και y πίνακας F(i,j): score της βέλτιστης στοίχισης µεταξύ του αρχικού τµήµατος x 1...i της x µέχρι το κατάλοιπο x i και του αρχικού τµήµατος y 1...j της y µέχρι το κατάλοιπο y j "γέµισµα" του F(i,j): επαναληπτική διαδικασία µε F(0,0) = 0 Σελίδα 39 Η πρώτη γραµµή και η πρώτη στήλη του πίνακα συµπληρώνεται βάσει της σχέσης: A T A F i,0 i,0 = -i gap gap,, F 0,j = -j gap A G T A 0-1 d -2 d -3 d -4 d -1 d -2 d -3 d Σελίδα 40 για απλότητα d = gap Οι τιµές των άλλων κελιών υπολογίζονται κατά γραµµ µµή, ξεκινώντας από την επάνω αριστερά γωνία και προχωρώντας συνεχώς προς τα δεξιά. Όταν φτάνουµε στο τέλος µιας γραµµής ξεκινάµε από το πρώτο κελί της επόµενης. Παράλληλα µε τον υπολογισµό της τιµής ενός κελιού, φυλάσσεται σ ένα πίνακα "ιχνηθέτη" (trace-back) η διεύθυνση του κελιού βάσει του οποίου υπολογίστηκε η τιµή (από το διαγώνιο κελί, το αριστερό ή το κατακόρυφο;) A G T A 0-1 d -2 d -3 d -4 d A -1 d T -2 d A -3 d Σελίδα 42

match = 1, mismatch = -1, gap = -1 F(i,j) i = 0 1 2 3 4 j = 0 1 2 3 A G T A 0-1 -2-3 -4 A -1 1 0-1 -2 T -2 0 0 1 0 A -3-1 -1 0 2 Η τιµή στο κάτω δεξιά κελί αποτελεί τη βαθµολογία της καλύτερης δυνατής στοίχισης των δύο ακολουθιών µε βάση το συγκεκριµένο σύστηµα βαθµολόγησης. Ακολουθώντας τη διαδροµή στον πίνακα ιχνηθέτη από το κάτω δεξιά κελί παράγουµε τη συγκεκριµένη στοίχιση. Για κάθε θέση: Αν κινηθούµε διαγώνια, τότε στοιχίζουµε τα δύο κατάλοιπα που αντιστοιχούν σ εκείνη την θέση. Αν κινηθούµε οριζόντια ή κάθετα, βάζουµε κενό στην ακολουθία που δείχνει το βέλος. Σελίδα 43 Σελίδα 44 στοίχιση A G T A A -- T A F(i,j) i = 0 1 2 3 4 j = 0 1 2 3 A G T A 0-1 -2-3 -4 A -1 1 0-1 -2 T -2 0 0 1 0 A -3-1 -1 0 2 score της στοίχισης score = 2 από διαγώνιο κελί = 0 + 2 = 2 από αριστερό κελί = 1-1 = 0 από κατακόρυφο κελί = 1-1 = 0 match = 2 mismatch = 0 gap = -1 max(2, 0, 0) = 2 Σελίδα 45 Βέλτιστη Στοίχιση Στοίχιση των ακολουθιών AGTA και ΑΤΑ µε τη χρήση δυναµικού προγραµµατισµού, του πίνακα αντικατάστασης Blosum62 και linear gap penalty = -1 Score Βέλτιστης Στοίχισης = 6 Αντί για match και mismatch score, χρησιµοποιούνται τα scores που είναι καταγεγραµµένα στον πίνακα αντικατάστασης. Σελίδα 48

Τοπική Στοίχιση (Smith-Waterman) Ολική Στοίχιση Τοπική Στοίχιση F(i, 0) = F(0, j) = 0 Στοιχίσεις µε αρνητική βαθµολογία δεν παρουσιάζουν ενδιαφέρον. 1 2 3 4 0-1 d -2 d -3 d -4 d 1 2 3 4 0 0 0 0 0 Μια βέλτιστη τοπική στοίχιση κατασκευάζεται ξεκινώντας από το κελί µε τη µεγαλύτερη τιµή (όπου κι αν βρίσκεται) και τερµατίζεται µόλις συναντήσουµε για πρώτη φορά µηδενική τιµή. Y 1 Y 2 Y 3-1 d -2 d -3 d Y 1 0 Y 2 0 Y 3 0 Το score της τοπικής στοίχισης ισούται µε τη µεγαλύτερη τιµή του πίνακα. d = gap Σελίδα 49 Σελίδα 50 Ολική Στοίχιση F(i-1, j-1) j + s(x i, y j ) F(i,, j) = max F(i-1, j) gap Τοπική Στοίχιση F(i,, j-1) j gap F(i-1, j-1) j + s(x i, y j ) F(i,, j) = max F(i-1, j) gap F(i,, j-1) j gap 0 Ολική Στοίχιση 1 2 3 4 0-1 -2-3 -4 Y 1-1 3 0-1 -5 Y 2-2 0 2 6 0 Y 3-3 -5-2 0 4 Τοπική Στοίχιση 1 2 3 4 0 0 0 0 0 Y 1 0 1 3 0 1 Y 2 0 0 0 7 0 Y 3 0 1 0 0 5 Σελίδα 51 Σελίδα 52 από διαγώνιο κελί = 3 + 2 = 5 max(5, 3, 1, 0) = 5 Βέλτιστη Στοίχιση από αριστερό κελί = 4-1 =3 από κατακόρυφο κελί = 2-1 =1 0 Score match = 2 Βέλτιστης mismatch = 0 Στοίχισης gap = -1 = 11

Μέθοδοι υναµικού Προγραµµατισµού Οι αλγόριθµοι δυναµικού προγραµµατισµού εγγυώνται τη βέλτιστη στοίχιση για τις παραµέτρους που χρησιµοποιούνται. ιαφορετικές παράµετροι διαφορετική στοίχιση Η βέλτιστη στοίχιση δεν είναι απαραίτητα και η βιολογικά σωστή. BLOSUM62 gap opening penalty = -3 gap extension penalty = -0.1 score = 6.3 gap opening penalty = 0 gap extension penalty = -0.1 score = 11.3 Σελίδα 55 1...VLSPADKFLTNV 12 1 VFTELSPAKTV... 11 1 V...LSPADKFLTNV 12 1 VFTELSPA.K..T.V 11 Στοίχιση βάσει της δοµικής υπέρθεσης D_HUM vgslncivavsqnmgigkngdlpwpplrnefryfqrmtttssvegkqnlvimgkktwfsi ident D_ECO --MISLIAALAVDRVIGMENAM-PFNLPADLAWFKRNTL-------DKPVIMGRHTWESI D_HUM PeknRPLKGRINLVLSRELkEPPQGAhFLSRSLDDALKLTEqpelanKVDMVWIVGGSSV ident D_ECO G---RPLPGRKNIILSSQP-GTDDRV-TWVKSVDEAIAACG------DVPEIMVIGGGRV D_HUM YKEAMNHpghLKLFVTRIMQDFESDTFFPEIDLEKYKLLPeypgvlSDVQEE---KGIKY ident D_ECO YEQFLPK--aQKLYLTHIDAEVEGDTHFPDYEPDDWESVF------SEFHDAdaqNSHSY D_HUM KFEVYEKNd ident D_ECO CFEILERR- Σελίδα 56 Προγράµµατα Στοίχισης Ακολουθιών Dot Plots Dotlet http://myhits.isb-sib.ch/cgi-bin/dotlet Gepard http://www.helmholtz-muenchen.de/en/mips/services/analysistools/gepard/index.html υναµικός Προγραµµατισµός EMBOSS Needle http://www.ebi.ac.uk/tools/psa/emboss_needle/ EMBOSS Water http://www.ebi.ac.uk/tools/psa/emboss_water/ Σελίδα 57