ΕΠΑΝΑΛΗΨΗ Σελίδα 1
τεχνική σύγκρισης ακολουθιών υπολογισµός ενός µέτρου οµοιότητας αναζήτηση ομολογίας S-S match S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC gap mismatch Σελίδα 2
ολική ή τοπική στοίχιση πίνακες αντικατάστασης Στοίχιση Ακολουθιών διαφορετικά scores ομοιότητας για την αντιστοίχιση διαφορετικών ζευγών αμινοξέων μοντέλα βαθμολόγησης των κενών gap penalty: linear vs affine τεχνικές στοίχισης ακολουθιών dot plots δυναμικός προγραμματισμός ευριστικοί αλγόριθμοι Σελίδα 3
Blosum 62 Σελίδα 4
Μοντέλα βαθμολόγησης των κενών κενό μήκους k καταλοίπων Linear gap penalty gap penalty a gp(k) = ak Affine gap penalty gap-opening penalty b (ποινή για το άνοιγμα κενού) gap-extension penalty a (ποινή για την επέκταση κενού) gp(k) = b + ak, ( b > a ) Σελίδα 5
Υπολογίστε το score για την ακόλουθη στοίχιση χρησιμοποιώντας τον πίνακα BLOSUM62 και για τη βαθμολόγηση των κενών: (α) το μοντέλο affine gap με gap opening penalty = -11 και gap extension penalty = -1 (β) το μοντέλο linear gap με gap penalty = -8 Κ L V A H G K K K - - K H - V T Σελίδα 6
Κ L V A H G K K K - - K H - V T BLOSUM62, affine gap, gap opening = -11, gap extension = -1 S(Κ,K)+S(A,K)+S(H,H)+S(K,V)+S(K,T) = 5 + (-1) + 8 + (-2) + (-1) = 9-11 - 2 1-11 - 1 1 = -25 score = 9 25 = -16 BLOSUM62, linear gap, gap penalty = -8 S(Κ,K)+S(A,K)+S(H,H)+S(K,V)+S(K,T) = 5 + (-1) + 8 + (-2) + (-1) = 9-3 8 = -24 score = 9 24 = -15 Σελίδα 7
Δυναμικός Προγραμματισμός Στοίχιση Ακολουθιών Ολική Στοίχιση Τοπική Στοίχιση Y 1 Y 2 Y 3 X 1 X 2 X 3 X 4 0-1 d -2 d -3 d -4 d -1 d -2 d -3 d X 1 X 2 X 3 X 4 0 0 0 0 0 Y 1 0 Y 2 0 Y 3 0 d = gap Σελίδα 8
Δυναμικός Προγραμματισμός Στοίχιση Ακολουθιών Ολική Στοίχιση A G T A 0-1 -2-3 -4 A -1 1 0-1 -2 στοίχιση A G T A A -- T A T -2 0 0 1 0 A -3-1 -1 0 2 score = 2 Σελίδα 9
Δίνεται ο πίνακας δυναμικού προγραμματισμού για την ολική στοίχιση των ακολουθιών AGΤA και ATA, με το σύστημα βαθμολόγησης match = 1, mismatch = -1, gap = -1. Υπολογίστε την τιμή για το σημειωμένο κελί και τοποθετείστε το αντίστοιχο βέλος. F(i,j) i = 0 1 2 3 4 A G T A j = 0 1 2 3 0-1 -2-3 -4 A -1 1 0-1 -2 T -2 0 0 1 0 A -3-1
match = 1, mismatch = -1, gap = -1 διαγώνιος: 0+mismatch = 0-1 = -1 οριζόντια: -1+gap = -1-1 = -2 κατακόρυφα: 0+gap = 0-1 = -1 max(-1,-2,-1) = -1 F(i,j) i = 0 1 2 3 4 A G T A j = 0 1 2 3 0-1 -2-3 -4 A -1 1 0-1 -2 T -2 0 0 1 0 A -3-1 -1
Δίνεται ο πίνακας δυναμικού προγραμματισμού για την τοπική στοίχιση των ακολουθιών LIFYAV και FIYA. Ποια είναι η βέλτιστη στοίχιση; Ποιο είναι το score της στοίχισης; Σελίδα 12
F I Y A 0 0 0 0 0 L 0 0 2 0 0 I 0 0 4 2 0 F 0 6 4 7 5 Y 0 4 5 11 9 A 0 2 3 9 15 V 0 0 5 7 13 Σελίδα 13
F I Y A 0 0 0 0 0 L 0 0 2 0 0 I 0 0 4 2 0 F 0 6 4 7 5 Y 0 4 5 11 9 A 0 2 3 9 15 V 0 0 5 7 13 βέλτιστη στοίχιση score στοίχισης F I Y A F Y A Σελίδα 14 score = 15
Πολλαπλή Στοίχιση Ακολουθιών Χρησιμοποιώντας τον πίνακα αντικατάστασης Blosum62 υπολογίστε το sum-of-pairs score για την πολλαπλή στοίχιση: A L L E G L L D W L G D 1 η στήλη: S(A,G) + S(A,W) + S(G,W) = 0 + (-3) + (-2) = -5 2 η στήλη: 3 S(L,L) = 3 4 = 12 3 η στήλη: S(L,L) + 2 S(L,G) = 4 + 2 (-4) = -4 4 η στήλη: 2 S(E,D) + S(D,D) = 2 2 + 6 = 10 sum-of-pairs score = -5 + 12-4 + 10 = 13 Σελίδα 15
Σύνταξη Prosite Πολλαπλή Στοίχιση Ακολουθιών "x" οποιοδήποτε κατάλοιπο [ ] : επιτρεπτά κατάλοιπα π.χ. [ALT] = Ala ή Leu ή Thr { } : μη επιτρεπτά κατάλοιπα π.χ. {AM} οποιοδήποτε κατάλοιπο εκτός Ala και Met () : ποσοτικός τελεστής π.χ. x(3) = x-x-x, x(2,4) = x-x ή x-x-x ή x-x-x-x "-" διαχωρίζει γειτονικά στοιχεία "<" στο αμινοτελικό άκρο ">" στο καρβοξυτελικό άκρο Σελίδα 16
Πολλαπλή Στοίχιση Ακολουθιών Ποια από τις ακόλουθες κανονικές εκφράσεις μπορεί να περιγράψει την ακολουθία ADLGAVFALCDRYFQ; x(2)-{rk}-g-[av]-x(4)-{c}-d-[rk]-[yw]-f-q. [AS]-D-[IVL]-G-x(2,4)-{PG}-C-[DE]-R-[FY](2)-Q. x(2)-{rk}-g-[av]-x(4)-{c}-d-[rk]-[yw]-f-q. A D L G A V F A L C D R Y F Q δεν την περιγράφει [AS]-D-[IVL]-G-x(2,4)-{PG}-C-[DE]-R-[FY](2)-Q. A D L G A V F A L C D R Y F Q την περιγράφει Σελίδα 17
Πολλαπλή Στοίχιση Ακολουθιών [AC]-x-V-x(4)-{ED} DEHSDVLPVLDVCSVKHVAEVFQALIYWIKAMNQQTTLDT Σε ποια (-ες) θέση(-εις) της ακολουθίας ταιριάζει; DEHSDVLPVLDVCSVKHVAEVFQALIYWIKAMNQQTTLDT [AC]-x-V-x(4)-{ED} Σελίδα 18
Ποιον πίνακα αντικατάστασης θα χρησιμοποιήσετε για να στοιχίσετε αμινοξικές ακολουθίες με ισχυρή ομοιότητα; PAM1 BLOSUM45 Ποιο από τα παρακάτω προγράμματα χρησιμοποιείται για τη στοίχιση δομών; GENSCAN DALI Χαρακτηρίστε τις προτάσεις ως σωστές (Σ) ή λανθασμένες (Λ). Στην αναγνώριση διπλώματος γίνεται στοίχιση ακολουθίας δομής. Το PHI-BLAST χρησιμοποιεί για την αναζήτηση ομοιοτήτων σε βάσεις δεδομένων ακολουθιών ένα Position-Specific Scoring Matrix (PSSM). Σελίδα 19