Στοίχιση ανά ζεύγη Εισαγωγή
|
|
- Ê Δασκαλοπούλου
- 8 χρόνια πριν
- Προβολές:
Transcript
1 2 Στοίχιση ανά ζεύγη 2.1. Εισαγωγή Η πιο απλή ανάλυση που μπορεί να γίνει σε επίπεδο αλληλουχιών είναι να διερευνηθεί αν δύο αλληλουχίες «σχετίζονται» 1. Συνήθως αυτό το κάνουμε πρώτα «στοιχίζοντας» 2 τις αλληλουχίες (ή μέρη τους) και κατόπιν αποφασίζοντας αν το ταίριασμα που προέκυψε από τη στοίχιση είναι πιθανότερο να συνέβη επειδή πράγματι οι αλληλουχίες σχετίζονται ή από καθαρή τύχη. Τα σημεία κλειδιά είναι: 1. Το είδος της στοίχισης 2 που θα κάνουμε. 2. Το σύστημα βαθμολόγησης που θα χρησιμοποιούμε για τις διάφορες πιθανές στοιχίσεις. 3. Ο αλγόριθμος που θα εντοπίσει τις βέλτιστες ή έστω τις καλές στοιχίσεις. 4. Η στατιστική μέθοδος που θα αξιολογήσει τη σημασία των βαθμολογιών που έλαβαν οι στοιχίσεις. 1. Σ.τ.μ.: Ο όρος «σχετίζονται» υπονοεί ότι οι δύο αλληλουχίες είναι παρόμοιες σε βαθμό που δεν μπορεί να θεωρηθεί τυχαίο γεγονός. Κατά συνέπεια, έχουν κάποια συγγένεια πολύ πιθανό μια κοινή προγονική αλληλουχία, η οποία κατά την εξέλιξη έδωσε δύο ή περισσότερους διαφορετικούς απογόνους. 2. Σ.τ.μ.: Γενικά μιλώντας, «στοίχιση αλληλουχιών» σημαίνει να τοποθετήσουμε τις αλληλουχίες παράλληλα μεταξύ τους, με τα γράμματά τους σε αντιστοιχία ένα προς ένα. Ανάλογα με τους κανόνες που θέτουμε, επιτρέπεται: (α) οι αλληλουχίες να μην «ξεκινούν» ταυτόχρονα, (β) να εισαχθούν κενά (χάσματα, ασυνέχειες) σε διάφορα σημεία μέσα στις αλληλουχίες. Για την καταγραφή των κενών συνήθως χρησιμοποιούμε παύλες ( ). 18
2 2.1. Εισαγωγή 19 (α) (β) (γ) Εικόνα 2.1 Τρεις στοιχίσεις της αλληλουχίας των αμινοξέων από ένα τμήμα της αλυσίδας α της ανθρώπινης αιμοσφαιρίνης. (α) Εμφανής ομοιότητα προς την αλυσίδα β της ανθρώπινης αιμοσφαιρίνης. (β) Συζητήσιμη ομοιότητα προς μια ψυχανθοσφαιρίνη του κίτρινου λούπινου (πρωτεΐνη μεταφοράς οξυγόνου). (γ) Ψευδής (τυχαία) ομοιότητα ωστόσο με υψηλή βαθμολογία προς την πρωτεΐνη F11 G11.2 ενός νηματώδους οργανισμού, η οποία είναι ομόλογη 3 με το ένζυμο S-μεταφοράση της γλουταθειόνης. Στην Εικόνα 2.1 δίνονται τρεις στοιχίσεις (α, β και γ). Σε καθεμία έχουν στοιχιστεί δύο αλληλουχίες (γι αυτό μιλάμε για «στοίχιση ανά ζεύγη»). Και στις τρεις στοιχίσεις η μία αλληλουχία (η άνω) αντιστοιχεί σε μια περιοχή της πολυπεπτιδικής αλυσίδας α της ανθρώπινης αιμοσφαιρίνης (επίσημο όνομα στην Uni-Prot: HBA-HUMAN) 4. Η μεσαία γραμμή στην κάθε στοίχιση είναι «τεχνητή»: δείχνει το αποτέλεσμα της στοίχισης. Στις θέσεις όπου τα γράμματα μεταξύ των δύο αλληλουχιών είναι ταυτόσημα τοποθετείται στη μεσαία γραμμή αυτό το γράμμα. Έτσι δηλώνεται ότι στις συγκεκριμένες 3. Σ.τ.μ.: Στη βιολογία «ομόλογος» σημαίνει παρόμοιος (ως προς κάποιον άλλον) εξαιτίας συγγένειας, εξαιτίας κοινής προγονικής καταγωγής. Για παράδειγμα, τα φτερά των νυχτερίδων, τα πόδια των σκύλων και τα χέρια των ανθρώπων είναι ομόλογα όργανα: Θεωρούνται όλα εξελικτικές προσαρμογές των μπροστινών άκρων των θηλαστικών. 4. Σ.τ.μ.: Τα γράμματα που εμφανίζονται στις στοιχίσεις αλληλουχιών από πρωτεΐνες (όπως στη συγκεκριμένη περίπτωση) αντιστοιχούν στους «κωδικούς ενός μόνο γράμματος» των 20 διαφορετικών αμινοξέων που συναντώνται στις πρωτεΐνες. Έξι ακόμα γράμματα χρησιμοποιούνται για να δηλώσουν είτε τροποποιημένα αμινοξικά κατάλοιπα είτε ομάδες κατάλοιπων είτε ότι υπάρχει άγνοια για το κατάλοιπο (βλ. στα παραρτήματα).
3 20 2. Στοίχιση ανά ζεύγη θέσεις οι δύο αλληλουχίες ταυτίζονται. Όταν τα γράμματα αντιστοιχούν σε αμινοξέα με παραπλήσιες φυσικοχημικές ιδιότητες, τότε στη μεσαία γραμμή τοποθετείται το σύμβολο «+». Για τις θέσεις αυτές λέμε ότι οι αλληλουχίες είναι όμοιες (ή παρόμοιες). Όταν τα γράμματα αντιστοιχούν σε αμινοξέα με διαφορετικές ιδιότητες, τότε δεν τοποθετούμε καμία ένδειξη στη μεσαία γραμμή. (Το αν δύο αμινοξέα θα θεωρηθούν παρόμοια ή όχι εξαρτάται από τον «πίνακα αντικατάστασης» που έχουμε επιλέξει για τη στοίχιση. Υπάρχουν διάφοροι πίνακες αντικατάστασης που αποδίδουν διαφορετικούς βαθμούς ομοιότητας μεταξύ των αμινοξικών κατάλοιπων, επειδή έχουν καταστρωθεί με διαφορετικά κριτήρια. Θα μιλήσουμε γι αυτούς αργότερα). Στην πρώτη στοίχιση υπάρχουν πολλές θέσεις όπου τα αντίστοιχα κατάλοιπα ταυτίζονται, σε πολλές άλλες τα κατάλοιπα είναι «λειτουργικά συντηρημένα» 5 (δηλαδή, έχουν αρκετά παρόμοιες ιδιότητες, ώστε να θεωρούμε ότι είναι περίπου ισοδύναμα από άποψη λειτουργικότητας), όπως το ζεύγος ασπαρτικού οξέος (D) και γλουταμικού οξέος (Ε) επτά θέσεις πριν το τέλος: αμφότερα είναι αμινοξέα με χαρακτηριστικό αρνητικό φορτίο. Στη δεύτερη στοίχιση βλέπουμε επίσης αντιστοιχίες που αναμένουμε ότι έχουν βιολογική σημασία, επειδή ήδη γνωρίζουμε (από άλλες πηγές) ότι οι δύο πρωτεΐνες (κατ επέκταση και οι αλληλουχίες τους) σχετίζονται εξελικτικά: Έχουν παρόμοια τρισδιάστατη δομή και επιτελούν ίδια λειτουργία, μεταφέρουν οξυγόνο. Ωστόσο, αυτή η στοίχιση έχει μικρότερες ομοιότητες από την πρώτη και σε ορισμένα σημεία παρουσιάστηκε ανάγκη να εισαχθούν κενά στην αλληλουχία της ανθρώπινης αλυσίδας α, προκειμένου να «υπερπηδηθούν» τα «παραπανίσια» αμινοξικά κατάλοιπα της ψυχανθοσφαιρίνης και να υπάρξει ξανά ταίριασμα (αντιστοίχιση) στις μετέπειτα περιοχές τους. Η τρίτη στοίχιση μας δείχνει μια αντίστοιχη εικόνα με διάσπαρτες περιοχές ταύτισης ή συντηρημένων αλλαγών. Εδώ όμως το αποτέλεσμα είναι παραπλανητικό: Οι δύο πρωτεΐνες έχουν τελείως διαφορετική δομή και λειτουργία. Η μερική ομοιότητα που παρατηρούμε είναι τυχαία. Πώς θα διαχωρίζουμε περιπτώσεις όπως αυτές των στοιχίσεων β και γ; Αυτή ακριβώς είναι η πρόκληση για τις μεθόδους της στοίχισης ανά ζεύγη! Πρέπει δηλαδή να σκεφτούμε προσεκτικά για να ορίσουμε ένα έξυπνο σύστημα 5. Σ.τ.μ.: Στην εξελικτική βιολογία «συντηρημένο» χαρακτηρίζεται κάτι, όταν έχει μεταβληθεί ελάχιστα και διατηρεί σε υψηλό βαθμό τα αρχικά του χαρακτηριστικά.
4 2.2 Το μοντέλο βαθμολόγησης 21 βαθμολόγησης, ώστε να αξιολογούμε τις στοιχίσεις.το επόμενο τμήμα του βιβλίου μάς εισάγει σε θέματα βαθμολόγησης στοιχίσεων και μετά ακολουθούν τμήματα με μεθόδους εύρεσης των βέλτιστων στοιχίσεων, ανάλογα με το σύστημα βαθμολόγησης. Το κεφάλαιο θα κλείσει με μια συζήτηση για τη στατιστική σημασία των εκάστοτε ταιριασμάτων και με περισσότερες λεπτομέρειες για την παραμετροποίηση των συστημάτων βαθμολόγησης. Ακόμα και με τα παραπάνω, όμως, δεν θα είναι πάντα δυνατόν να αποφαίνεσθε για το αν μια στοίχιση που δείχνει καλή οφείλεται σε πραγματική λειτουργική ή/και εξελικτική συγγένεια των αλληλουχιών ή αν είναι τυχαία. Για παράδειγμα, στην πραγματικότητα θα ήταν τρομερά δύσκολο να δειχτεί με μεθόδους στοίχισης ανά ζεύγη σημαντική ομοιότητα ανάμεσα σε ολόκληρη την ψυχανθοσφαιρίνη του λούπινου και στην αλυσίδα α της ανθρώπινης αιμοσφαιρίνης. 2.2 Το μοντέλο βαθμολόγησης Όταν συγκρίνουμε αλληλουχίες, στην ουσία αναζητούμε ενδείξεις για το αν και πόσο διαφοροποιήθηκαν από μια κοινή προγονική αλληλουχία με τους μηχανισμούς των μεταλλαγών και της φυσικής επιλογής. Οι βασικοί μηχανισμοί των μεταλλαγών είναι: (α) οι αντικαταστάσεις, κατά τις οποίες αντικαθίστανται κατάλοιπα μιας αλληλουχίας από άλλα κατάλοιπα (με αντιστοιχία ένα προς ένα) (β) οι ενθέσεις, κατά τις οποίες εισάγονται (νέα) κατάλοιπα ανάμεσα στα προϋπάρχοντα και (γ) οι απαλοιφές, κατά τις οποίες εξαφανίζονται κάποια κατάλοιπα. Μαζί οι ενθέσεις και οι απαλοιφές αναφέρονται ως κενά ή χάσματα (gaps) 6. Η φυσική επιλογή υπεισέρχεται στην εξελικτική διαδικασία ως κριτής. Ελέγχει αν οι μεταλλαγές είναι κατάλληλες για το περιβάλλον (άρα, ευνοϊκές για τον φορέα τους) ή όχι και εμποδίζει τις δεύτερες να διαιωνιστούν. Έτσι, στις επόμενες γενιές κάποιες από τις αρχικές μεταλλαγές εμφανίζονται πιο συχνά από όσο άλλες μέσα στον πληθυσμό Σ.τ.μ.: Αναφέρονται ως «κενά» επειδή, όταν συμβαίνουν, πρέπει να εισαχθεί ένα κενό είτε στην πρώτη είτε στη δεύτερη αλληλουχία, προκειμένου οι δύο αλληλουχίες να ταιριάζουν στη στοίχιση κατά το υπόλοιπο μέρος τους. 7. Σ.τ.μ.: Σημειώστε ότι και η τυχαιότητα αποτελεί σημαντικό παράγοντα για το ποιες αλλαγές θα διατηρηθούν και ποιες όχι. Εξαιτίας τυχαίων γεγονότων κάποιες ευνοϊκές αλλαγές χάνονται κ.λπ.
5 22 2. Στοίχιση ανά ζεύγη Η συνολική βαθμολογία 8 που αποδίδουμε σε μια στοίχιση είναι το άθροισμα των επιμέρους σκορ 3 για κάθε στοιχισμένο ζεύγος κατάλοιπων συν το άθροισμα των επιμέρους σκορ για τα ξεχωριστά κενά. Με βάση την πιθανοκρατική ερμηνεία, η συνολική βαθμολογία αντιστοιχεί στον λογάριθμο του λόγου της πιθανοφάνειας οι δύο αλληλουχίες να σχετίζονται προς την πιθανοφάνεια οι δύο αλληλουχίες να μη σχετίζονται (ή, πιο απλά, στον λογάριθμο της σχετικής πιθανοφάνειας οι δύο αλληλουχίες να σχετίζονται σε σύγκριση με το να μη σχετίζονται). Άτυπα μιλώντας, αναμένουμε οι ταυτίσεις και οι συντηρημένες αντικαταστάσεις να εμφανίζονται πιο συχνά στις στοιχίσεις που έχουν γίνει βάσει κανόνων παρά αν τοποθετούσαμε τυχαία παράλληλα τις αλληλουχίες και τις συγκρίναμε. Γι αυτό οι ταυτίσεις και οι συντηρημένες αντικαταστάσεις συνεισφέρουν θετικά στη βαθμολόγηση. Από την άλλη, αναμένεται οι μη συντηρημένες διαφορές να εμφανίζονται πιο σπάνια στις στοιχίσεις που έχουν γίνει βάσει κανόνων παρά στις στοιχίσεις με τυχαία εναπόθεση των αλληλουχιών. Έτσι, οι μη συντηρημένες διαφορές συνεισφέρουν αρνητικά στη βαθμολόγηση. Βέβαια, η χρήση ενός συστήματος βαθμολόγησης με προσθετικές ιδιότητες υποκρύπτει ότι αποδεχόμαστε πως οι μεταλλαγές συμβαίνουν ως ανεξάρτητα γεγονότα σε διάφορες θέσεις των αλληλουχιών και ότι εκλαμβάνουμε τα κενά οποιουδήποτε μεγέθους ως απλές μεταλλαγές. Όλοι οι αλγόριθμοι για την εύρεση βέλτιστων στοιχίσεων σε αυτό το κεφάλαιο βασίζονται σε τέτοια συστήματα βαθμολόγησης. Η αποδοχή της ανεξαρτησίας των μεταλλαγών δείχνει να είναι δικαιολογημένη για το DNA και τις πρωτεΐνες, αν και γνωρίζουμε πως για την τελική δομή των πρωτεϊνών οι αλληλεπιδράσεις ανάμεσα στα αμινοξικά κατάλοιπα έχουν πολύ μεγάλη σημασία. Σίγουρα πάντως δεν ισχύει η ανεξαρτησία για όσα μόρια RNA έχει σημασία η τρισδιάστατη δομή. Εκεί το ζευγάρωμα μεταξύ συμπληρωματικών βάσεων προκαλεί σημαντικές εξαρτήσεις σε μεγάλες αποστάσεις επάνω στην αλληλουχία. Μπορεί φυσικά οι εξαρτήσεις αυτές να ληφθούν υπόψη στους υπολογισμούς, αλλά με το κό- 8. Σ.τ.μ.: Για την απόδοση του αγγλικού όρου «score» χρησιμοποιούμε κυρίως τους όρους «βαθμολογία» και «σκορ», με προτίμηση στον όρο «βαθμολογία» όταν πρόκειται για την τιμή με την οποία βαθμολογείται ένα ταίριασμα (στοίχιση, τμήμα στοίχισης κ.λπ.) και στον όρο «σκορ» όταν αναφερόμαστε στις τιμές που περιέχει ένας πίνακας αντικατάστασης και που αποδίδονται στα ξεχωριστά στοιχισμένα ζεύγη κατάλοιπων.
6 2.2 Το μοντέλο βαθμολόγησης 23 στος της αύξησης της προγραμματιστικής πολυπλοκότητας. Θα αναβάλουμε λοιπόν τη συζήτηση για τη στοίχιση των RNA μέχρι το Κεφάλαιο Πίνακες αντικατάστασης Όπως είπαμε, χρειαζόμαστε ένα στοιχειώδες σκορ για κάθε δυνατό ζευγάρι στοιχισμένων κατάλοιπων που μπορεί να προκύψει από τη διαδικασία της στοίχισης. Ένας βιολόγος με καλή αίσθηση των κανόνων που διέπουν τις πρωτεΐνες θα μπορούσε να προτείνει έναν πίνακα με 210 διαφορετικά σκορ για τα 210 δυνατά διαφορετικά ζεύγη κατάλοιπων. Ωστόσο είναι ακόμα πιο χρήσιμο να έχουμε μια θεωρία υπόβαθρο για το τι σημαίνουν αυτά τα σκορ. Παρακάτω θα παραγάγουμε σκορ αντικατάστασης χρησιμοποιώντας ένα πιθανοκρατικό μοντέλο. Κατ αρχάς, να συμφωνήσουμε για τον φορμαλισμό και τους συμβολισμούς: Θα αναφερόμαστε σε ένα ζεύγος αλληλουχιών x και y με μήκη 10 n και m, αντίστοιχα. Το χ i θα είναι το i-στό «γράμμα» της x (δηλαδή η i-στή θέση στην αλληλουχία) και το y j το j-στό γράμμα της y. Τα γράμματα θα προέρχονται από κάποιο αλφάβητο Α στην περίπτωση του DNA το αλφάβητο αντιστοιχεί στις τέσσερις νουκλεοτιδικές βάσεις και έχει οριστεί ως το σύνολο {A, G, C, T}, ενώ στην περίπτωση των πρωτεϊνών αντιστοιχεί στα 20 αμινοξέα που βρίσκονται στις πρωτεΐνες. Θα χρησιμοποιούμε τα μικρά γράμματα του λατινικού αλφάβητου για να δηλώνουμε «γράμματα» από τα δύο αλφάβητα (για παράδειγμα: a και b). Για αρχή θα ασχοληθούμε μόνο με στοιχίσεις αλληλουχιών ίσου μήκους, χωρίς ένθεση κενών, όπως στην πρώτη στοίχιση της Εικόνας 2.1. Σε ένα στοιχισμένο ζεύγος αλληλουχιών επιθυμούμε να αποδώσουμε ένα σκορ που θα προσφέρει ένα μέτρο της σχετικής πιθανοφάνειας οι αλληλουχίες να σχετίζονται προς την πιθανοφάνεια να μη σχετίζονται (βάσει της συγκεκριμένης στοίχισης). Αυτό το πετυχαίνουμε χρησιμοποιώντας μοντέλα που δίνουν την πιθανότητα εμφάνισης της στοίχισης για καθεμία από τις δύο περιπτώσεις και κατόπιν υπολογίζουμε τον λόγο των πιθανοτήτων. 9. Σ.τ.μ.: Στο Κεφάλαιο 6 υπάρχει επίσης συζήτηση για την επίδραση της δομής στη διατήρηση της ομοιότητας των αλληλουχιών. 10. Σ.τ.μ.: Μήκος αλληλουχίας ονομάζουμε το πλήθος των (διαδοχικών) κατάλοιπων από τα οποία αποτελείται η αλληλουχία.
7 24 2. Στοίχιση ανά ζεύγη Το ανεξάρτητο ή τυχαίο μοντέλο R είναι το πιο απλό. Υποθέτει ότι κάθε γράμμα a εμφανίζεται ανεξάρτητα με συχνότητα q a, και έτσι η πιθανότητα εμφάνισης των δύο αλληλουχιών προκύπτει ως γινόμενο των πιθανοτήτων της εμφάνισης κάθε κατάλοιπου της κάθε αλληλουχίας χωριστά: (2.1) Στο εναλλακτικό μοντέλο ταιριάσματος, M, τα στοιχισμένα ζεύγη των κατάλοιπων προκύπτουν με την από κοινού πιθανότητα, p ab. Η τιμή p ab μπορεί να εκληφθεί ως η πιθανότητα τα κατάλοιπα a και b να έχουν προέλθει χωριστά και ανεξάρτητα από μεταλλαγές ενός (άγνωστου) προγονικού κατάλοιπου c (χωρίς να αποκλείεται το c να είναι ίδιο με το a ή το b). Για ολόκληρη τη στοίχιση προκύπτει λοιπόν η πιθανότητα:. Ο λόγος των δύο παραπάνω πιθανοφανειών είναι γνωστός ως λόγος σχετικών πιθανοτήτων (odds ratio):. Για να δημιουργήσουμε το σύστημα της προσθετικής βαθμολόγησης λογαριθμούμε τον λόγο:. (2.2) Το S ονομάζεται λογάριθμος λό\γου σχετικών πιθανοτήτων (log-odds ratio), με. (2.3) Το s(a, b) είναι λοιπόν ο λογαριθμημένος λόγος των πιθανοφανειών το ζεύγος των κατάλοιπων (a, b) να υπάρχει ως «στοιχισμένο» ζεύγος (ζεύγος κατάλοιπων με κοινό πρόγονο) ή να υπάρχει τυχαία, ως «μη στοιχισμένο» ζεύγος (ζεύγος που εμφανίστηκε εξαιτίας της συχνότητας της παρουσίας των a και b στις αλληλουχίες).
8 2.2 Το μοντέλο βαθμολόγησης 25 Εικόνα 2.2 Ο πίνακας αντικατάστασης BLOSUM 50. Στις τιμές των λογαριθμημένων λόγων αλλάχτηκε η κλίμακα και έγιναν στρογγυλοποιήσεις προς τους πλησιέστερους ακέραιους, για να είναι πιο αποδοτική η χρήση τους στα προγράμματα Η/Υ (βλ. Ενότητα 2.8). Η διάταξη των αμινοξικών κατάλοιπων είναι ίδια στην οριζόντια και στην κάθετη διάσταση. Έτσι: (α) Η κύρια διαγώνιος (από πάνω αριστερά προς κάτω δεξιά) αντιστοιχεί στη «θεωρητική» αντικατάσταση ενός κατάλοιπου από ίδιο κατάλοιπο. (β) Συμμετρικά της κύριας διαγωνίου βρίσκονται ζεύγη κατάλοιπων με αντίστροφη διάταξη στις δύο αλληλουχίες. Όπως είναι αναμενόμενο, με τον τρόπο που ορίστηκε το s(a, b), οι τιμές του πίνακα για τα αντίστροφα ζεύγη είναι ίσες, δηλαδή s(a, b) = s(b, a). 11 Όπως το επιθυμούσαμε, η εξίσωση (2.2) αποτελεί ένα άθροισμα ανεξάρτητων σκορ, των σκορ s(a, b) για κάθε στοιχισμένο ζεύγος κατάλοιπων. Όλα αυτά τα σκορ μπορούν να τοποθετηθούν σε έναν πίνακα. Στην περίπτωση των 11. Σ.τ.μ.: Παρατηρήστε ότι όλα τα σκορ από ζεύγη κατάλοιπων που δεν ταυτίζονται είναι μικρότερα από τα σκορ των κατάλοιπων που ταυτίζονται (σκορ της διαγωνίου). Το ίδιο συμβαίνει στους περισσότερους πίνακες αντικατάστασης. Αυτό ανατανακλά το γεγονός ότι κάθε αμινοξύ έχει μοναδικές ιδιότητες και η αντικατάστασή του είναι δύσκολα αποδεκτή από τη φυσική επιλογή.
9 26 2. Στοίχιση ανά ζεύγη πρωτεϊνών θα σχηματίζαμε έναν πίνακα 20 20, με τιμές s(a i, a j ) στις θέσεις i, j του πίνακα. Τα a i και a j αντιστοιχούν στα 20 αμινοξέα (σε κάθε διάσταση του πίνακα) βάσει μιας προσυμφωνημένης σειράς. Αυτός ακριβώς είναι ο πίνακας των σκορ ή, αλλιώς, ο πίνακας αντικατάστασης. Ως παράδειγμα πίνακα αντικατάστασης που προέκυψε ουσιαστικά με τον παραπάνω τρόπο, δίνεται στην Εικόνα 2.2 ο πίνακας BLOSUM 50. Αν χρησιμοποιήσουμε τις τιμές του (τα σκορ του) για να βαθμολογήσουμε την πρώτη στοίχιση στην Εικόνα 2.1, παίρνουμε μια συνολική βαθμολογία 130. Μια άλλη σειρά (ομάδα) πινάκων αντικατάστασης που χρησιμοποιούνται συχνά είναι η σειρά PAM 12. Προς το τέλος του κεφαλαίου δίνεται λεπτομερής περιγραφή για το πώς κατασκευάστηκαν οι πίνακες BLOSUM και PAM. Μια σημαντική συνέπεια των παραπάνω είναι ότι, ακόμα και αν ένας βιολόγος συνέτασσε διαισθητικά έναν συγκεκριμένο πίνακα αντικατάστασης, ο πίνακας θα υπέκρυπτε και θα αντιστοιχούσε σε συχνότητες και πιθανότητες p ab, όπως αναφέρθηκαν στην παραπάνω θεωρία [Altchul, 1991]. Κάθε πίνακας αντικατάστασης τελικά δηλώνει (με βάση κάποιες επιλεγμένες μετρήσεις) τις πιθανότητες να «συμβούν» ζεύγη ab σε πραγματικές στοιχίσεις. Άσκηση 2.1 Τα αμινοξέα D, E και K είναι φορτισμένα, ενώ τα V, I και L είναι υδρόφοβα. Πόσο είναι το μέσο σκορ αντικατάστασης όλων των δυνατών ζευγών φορτισμένων αμινοξέων στον πίνακα BLOSUM 50; Πόσο είναι το μέσο σκορ για τα υδρόφοβα; Πόσο είναι μεταξύ όλων των δυνατών ζευγών φορτισμένου-υδρόφοβου; Προτείνετε εξηγήσεις για το αποτέλεσμα που παρατηρείτε. Οι ποινές για τα κενά Θεωρούμε ότι η ανάγκη παραγωγής κενού, προκειμένου να είναι καλή η υπόλοιπη στοίχιση, οφείλει να επισείρει ποινή στη συνολική βαθμολογία της στοίχισης. Το κόστος ενός κενού μήκους g (δηλαδή έκτασης g κατάλοιπων στην 12. Σ.τ.μ.: Οι ονομασίες είναι αρκτικόλεξα: PAM: Point Accepted Mutation Αποδεκτή Σημειακή Μετάλλαξη, BLOSUM: BLOck SUbstitution Matrix Πίνακας αντικατάστασης από συντηρημένα τμήματα (blocks) αλληλουχιών.
10 2.2 Το μοντέλο βαθμολόγησης 27 απέναντι αλληλουχία που δεν φέρει κενό) έχει τυποποιηθεί να υπολογίζεται είτε ως γραμμική συνάρτηση (μονώνυμο 1ου βαθμού) του g: γ(g) = gd (2.4) είτε ως αφινική 13 συνάρτηση (διώνυμο 1ου βαθμού) του g: γ(g) = d (g 1)e. (2.5) Το d ονομάζεται ποινή εκκίνησης για το κενό (ή, απλά, ποινή ανοίγματος) και το e ποινή επιμήκυνσης (ή επέκτασης) του κενού. Η ποινή επιμήκυνσης e ορίζεται συνήθως λίγο μικρότερη από όσο η ποινή εκκίνησης d, δίνοντας έτσι την ευκαιρία σε εκτενείς ενθέσεις ή απαλοιφές να λάβουν μικρότερη ποινή από όσο αν χρησιμοποιούνταν η γραμμική εξίσωση (2.4) με το ίδιο d. Αυτό είναι επιθυμητό, αφού στην πράξη έχει βρεθεί ότι τα κενά λίγων κατάλοιπων εμφανίζονται περίπου το ίδιο συχνά με τα κενά ενός μόνο κατάλοιπου 14. Οι ποινές των κενών που χρησιμοποιούνται αντιστοιχούν σε πιθανοκρατικά μοντέλα στοίχισης, αν και αυτό δεν είναι τόσο ευρέως γνωστό όσο η πιθανοκρατική βάση των πινάκων αντικατάστασης. Υποθέτουμε ότι η πιθανότητα να υπάρξει ένα κενό σε μια συγκεκριμένη θέση μιας αλληλουχίας δίνεται από το γινόμενο μιας συνάρτησης, f(g), του μήκους του κενού επί τη συνδυασμένη πιθανότητα να υπάρχουν εντεθειμένα τα συγκεκριμένα κατάλοιπα στην άλλη αλληλουχία 15 : P κενού = f (g). (2.6) q xi θέση i στοκενό 13. Σ.τ.μ.: Αφινική (affine) ή, αλλιώς, αγχίγραμμη σχέση παρουσιάζουν δύο ποσότητες, x, y, όταν y = αx+β, με α και β Σ.τ.μ.: Σε στενά συντηρημένες αλληλουχίες (πρωτεϊνών ή DNA) είναι σχετικά εύκολο να κάνουμε στοίχιση «με το μάτι». Σε τέτοιες στοιχίσεις έχουν παρατηρηθεί απαλοιφές και ενθέσεις με ποικιλία μηκών. Θεωρούμε ότι αυτό μαρτυρεί: (α) πως μεταξύ των δύο συγγενικών αλληλουχιών κάποια έχασε ή κάποια κέρδισε ένα ολόκληρο τμήμα με ένα μόνο εξελικτικό βήμα (μία μεταλλαγή) ή/και (β) πως, ύστερα από μια πρώτη ένθεση, οι πιθανές επόμενες, διαδοχικές ενθέσεις (που αθροίζονται στην ίδια περιοχή) είναι πιο ανεκτές λειτουργικά (και εξελικτικά) από όσο είναι η πρώτη. 15. Σ.τ.μ.: Οι τιμές q x αναφέρονται προφανώς στα κατάλοιπα της άλλης αλληλουχίας της στοίχισης, η οποία έχει κατάλοιπα στην περιοχή του χάσματος.
11 28 2. Στοίχιση ανά ζεύγη Το γεγονός ότι, για να πάρουμε την Ρ κενού, πολλαπλασιάζουμε τη συνάρτηση f(g) επί τους όρους q xi αντανακλά την παραδοχή μας ότι το μήκος ενός κενού στη μια αλληλουχία δεν συσχετίζεται με το ποια συγκεκριμένα κατάλοιπα περιέχονται στην άλλη αλληλουχία. Οι φυσικές τιμές για τις συχνότητες q a είναι οι ίδιες με εκείνες που χρησιμοποιήθηκαν στο τυχαίο μοντέλο, αφού και οι δύο αντιστοιχούν σε ανεξάρτητα, μη ταιριασμένα κατάλοιπα. Αν διαιρέσουμε με την πιθανότητα να υπάρχει αυτή η περιοχή προκειμένου να σχηματίσουμε τον λόγο των σχετικών πιθανοτήτων και σε συμφωνία με το τυχαίο μοντέλο, οι όροι q xi απαλείφονται και έτσι απομένει ένας μόνο όρος, εξαρτημένος από το μήκος: γ(g) = log(f(g)). Δηλαδή, οι ποινές των κενών αντιστοιχούν στη λογαριθμημένη πιθανότητα να υπάρχει κενό με τέτοιο μήκος. Από την άλλη μεριά, αν υπάρχει ένδειξη για διαφορετική κατανομή των κατάλοιπων της άλλης αλληλουχίας στις περιοχές των κενών, τότε για κάθε κατάλοιπο πρέπει να καθοριστεί ειδικό σκορ για τη συμμετοχή του σε κενά, το οποίο να ισούται με τον λογάριθμο του λόγου της συχνότητας εμφάνισης του κατάλοιπου σε κενά προς τη συχνότητα εμφάνισης του κατάλοιπου στις περιοχές χωρίς κενά. Αυτό θα συνέβαινε, για παράδειγμα, αν αποδεικνυόταν ότι στις στοιχίσεις τα πολικά αμινοξέα εμφανίζονται με μεγαλύτερες συχνότητες στα κενά από όσο εμφανίζονται γενικά μέσα στις αλληλουχίες. Κάτι τέτοιο θα μπορούσε να δικαιολογηθεί, αν υποθέσουμε ότι τα κενά αντιστοιχούν πιο συχνά στους βρόχους των πολυπεπτιδικών αλυσίδων, οι οποίοι με τη σειρά τους βρίσκονται συχνότερα στην επιφάνεια της πρωτεΐνης (άρα, τους ταιριάζει να είναι υδρόφιλοι/πολικοί) παρά θαμμένοι στον πυρήνα. Άσκησεις 2.2 Δείξτε ότι οι κατανομές πιθανοτήτων f(g) που αντιστοιχούν στις συναρτήσεις γραμμικής (2.4) και αφινικής (2.5) μορφής είναι αμφότερες γεωμετρικές κατανομές του τύπου f(g) = ke λg. 2.3 Στην πράξη, οι τυπικές τιμές που χρησιμοποιούνται για τις ποινές σφαλμάτων είναι η d = 8 για τη γραμμική μορφή και οι d = 12 και e = 2 για την αφινική μορφή, αμφότερες εκφρασμένες ως μισά bits. Για να εκφράσουμε σε μονάδες bits μια πιθανότητα, εξάγουμε τον λογάριθμό της με βάση το 2. Έτσι, με αλλαγή βάσης προς φυσικό λο-
12 2.3 Αλγόριθμοι στοίχισης 29 γάριθμο, οι τιμές των ποινών εκφρασμένες σε ολόκληρα bits γίνονται 16 : d' = (8 log2)/2 και d = (12 log2)/2, e = (2 log2)/2. 17 Ποιες είναι οι αντίστοιχες πιθανότητες για την ύπαρξη κενού (οσουδήποτε μήκους) και ποιες είναι οι κατανομές μηκών του κενού, με δεδομένο ότι υφίσταται κενό; 2.4 Χρησιμοποιώντας τον πίνακα BLOSUM50 της Εικόνας 2.2 και αφινικές ποινές κενού d = 12 και e = 2, υπολογίστε τις βαθμολογίες των στοιχίσεων των Εικόνων 2.1β και 2.1γ. [Ίσως γνωρίζετε ότι ο BLOSUM50 παρουσιάζει κλιμάκωση με μονάδα = ⅓ bit. Το να χρησιμοποιήσετε ποινές 12 και 2, μαζί με τα σκορ του BLOSUM50, θα οδηγήσει σε διαφορετικές πιθανότητες για την εκκίνηση και την επιμήκυνση ενός κενού, σε σχέση με αυτές που βρήκατε στην προηγούμενη άσκηση, όπου δεχόμασταν ότι οι ποινές ήταν εκφρασμένες σε μονάδες του μισού bit. Οι διάφορες τιμές ποινών για τα κενά είναι βελτιστοποιημένες για κάθε διαφορετικό πίνακα (όπως είναι άλλωστε και οι τιμές αντικατάστασης στους πίνακες), εν μέρει επειδή οι διάφοροι πίνακες χρησιμοποιούν διαφορετικό συντελεστή αναπροσαρμογής (βλ. Ενότητα 2.8) και εν μέρει επειδή κάθε πίνακας είναι φτιαγμένος να αντιστοιχεί και να εντοπίζει διαφορετικό επίπεδο εξελικτικής απόκλισης ανάμεσα στις αλληλουχίες.] 2.3 Αλγόριθμοι στοίχισης Έχοντας πλέον ένα σύστημα βαθμολόγησης, χρειαζόμαστε έναν αλγόριθμο για να βρίσκει τη βέλτιστη στοίχιση μεταξύ δύο αλληλουχιών, τη στοίχιση δηλαδή που λαμβάνει τη μέγιστη συνολική βαθμολογία. Αν και οι δύο αλληλουχίες έχουν το ίδιο μήκος n, υπάρχει μόνο ένα «πλήρες» ταίριασμα (κατάλοιπο προς κατάλοιπο) ολόκληρων των αλληλουχιών. Τα πράγματα όμως περιπλέκονται εφόσον επιτραπεί η δημιουργία κενών ή εφόσον αρχίσουμε να αναζητούμε καλά στοιχισμένα τμήματα (υποαλληλουχίες) από τις συνολικές αλληλουχίες. 16. Σ.τ.μ.: Βλ. Επίμετρο, Β Σ.τ.μ.: Ακολουθήσαμε την επιλογή του πρωτότυπου κειμένου και συμβολίζουμε τους φυσικούς λογάριθμους με log, σε όλη την έκταση του βιβλίου. Στις περιπτώσεις που πρόκειται για λογάριθμο με άλλη βάση, η βάση αναγράφεται.
13 30 2. Στοίχιση ανά ζεύγη Αν επιτραπεί η εισαγωγή κενών σε δύο αλληλουχίες μήκους n, μπορούν να σχηματιστούν μεταξύ τους 18 (2.7) διαφορετικές ολικές 19 στοιχίσεις. Είναι προφανές ότι τέτοιος όγκος συνδυασμών δεν μπορεί να αντιμετωπιστεί από άποψη χρόνου εκτέλεσης ενός προγράμματος Η/Υ, ακόμα για μικρές τιμές του n. Η μέθοδος για να βρεθούν οι σχετικά καλύτερες στοιχίσεις, όταν διαθέτουμε ένα προσθετικό σύστημα βαθμολόγησης όπως αυτά που προαναφέραμε, είναι ο δυναμικός προγραμματισμός. Οι αλγόριθμοι δυναμικού προγραμματισμού είναι ζωτικοί για την υπολογιστική ανάλυση αλληλουχιών. Σε όλα τα υπόλοιπα κεφάλαια του βιβλίου, εκτός από το τελευταίο όπου καλύπτονται οι μαθηματικές μέθοδοι, γίνεται χρήση αλγόριθμων δυναμικού προγραμματισμού. Οι πιο απλοί στην κατανόηση αλγόριθμοι δυναμικού προγραμματισμού για τη στοίχιση αλληλουχιών είναι οι αλγόριθμοι στοίχισης ανά ζεύγη. Ο αναγνώστης θα πρέπει να βεβαιωθεί ότι κατανοεί αυτό το κεφάλαιο, γιατί θέτει βάσεις για το σύνολο του βιβλίου. Οι αλγόριθμοι δυναμικού προγραμματισμού είναι εγγυημένο ότι βρίσκουν τη στοίχιση με τη βέλτιστη βαθμολογία ή μια ομάδα στοιχίσεων με τις καλύτερες βαθμολογίες. Στις περισσότερες περιπτώσεις έχουν αναπτυχθεί και ευριστικές μέθοδοι (heuristics) για να εκτελούν την ίδια εργασία. Καταφέρνουν να είναι ιδιαίτερα γρήγορες, όμως κάνουν πρόσθετες παραδοχές. Έτσι, σε κάποια ζεύγη αλληλουχιών χάνουν τη βέλτιστη στοίχιση. Θα συζητήσουμε με συντομία μερικές προσεγγίσεις στην ευριστική αναζήτηση παρακάτω στο κεφάλαιο. 18. Σ.τ.μ.: Εφόσον επιτραπεί στις δύο αλληλουχίες να μην έχουν ταυτόχρονη έναρξη και λήξη στη στοίχιση (δηλαδή, να εισάγονται ακριανά κενά χωρίς περιορισμό μήκους), οι δυνατοί συνδυασμοί είναι πολύ περισσότεροι. 19. Σ.τ.μ.: Ολική (global) χαρακτηρίζεται η στοίχιση κατά την οποία γίνεται προσπάθεια να στοιχιστούν κατά το δυνατόν στο σύνολό τους και οι δύο αλληλουχίες. Χαρακτηριστικά αυτής της στοίχισης είναι πως, όταν οι αλληλουχίες έχουν περίπου ίσο μήκος, και τα δύο άκρα τους ξεκινούν και καταλήγουν περίπου μαζί στη στοίχιση (δεν «περισσεύουν» μεγάλα ακριανά χάσματα). Οι δύο στοιχισμένες αλληλουχίες δίνουν λίγο πολύ την εικόνα ότι «προχωρούν» παράλληλα. Τοπική (local) χαρακτηρίζεται η στοίχιση στην οποία γίνεται προσπάθεια να εντοπιστούν τμήματα, σχετικά μικρού μεγέθους, οπουδήποτε μέσα στις δύο αλληλουχίες τα οποία ταιριάζουν μεταξύ τους σε υψηλό βαθμό. Τα προγράμματα τοπικής στοίχισης δίνουν στην έξοδό τους πολλές τέτοιες στοιχίσεις ανεξάρτητες μεταξύ τους (με πρωθύστερα, επικαλύψεις κ.λπ.).
14 2.3 Αλγόριθμοι στοίχισης 31 Επειδή το σύστημα βαθμολόγησης που εισαγάγαμε ακολουθεί το σχήμα της λογαρίθμησης ενός λόγου πιθανοτήτων, οι καλύτερες στοιχίσεις θα λαμβάνουν υψηλότερες βαθμολογίες. Άρα εμείς κατά την αναζήτησή μας επιθυμούμε να βρίσκουμε όλο και μεγαλύτερες βαθμολογίες, έως ότου φτάσουμε στη βέλτιστη στοίχιση. Κάποιες φορές, ωστόσο, οι βαθμολογήσεις θα αναφέρονται σε άλλες έννοιες και θα αποδίδονται με τους όρους κόστος (costs) ή απόσταση διορθώσεων (edit distances). Στις περιπτώσεις αυτές θα επιζητούμε να μειώσουμε το κόστος κατά τις διαδοχικές στοιχίσεις. Και οι δύο προσεγγίσεις έχουν χρησιμοποιηθεί στη σύγκριση των βιολογικών αλληλουχιών. Ο δυναμικός προγραμματισμός εφαρμόζεται και στις δύο περιπτώσεις, η διαφορά είναι μια απλή αλλαγή, από αναζήτηση αύξησης σε αναζήτηση μείωσης. Θα παρουσιάσουμε τέσσερις βασικούς τύπους στοίχισης. Από εκεί και πέρα, ο τύπος στοίχισης που θα προτιμάμε θα εξαρτάται από την πηγή των αλληλουχιών που καλούμαστε να στοιχίσουμε κάθε φορά. Κάθε τύπος εξυπηρετείται από έναν λίγο διαφορετικό αλγόριθμο δυναμικού προγραμματισμού. Σε αυτό το κεφάλαιο θα περιγράψουμε μόνο τη στοίχιση ανά ζεύγη. Τα κενά θα επιτρέπονται και θα λαμβάνουν ποινές με γραμμική αύξηση d για κάθε επιπλέον επιμήκυνσή τους κατά ένα κατάλοιπο. Οι αλγόριθμοι πάντως που θα παρουσιάσουμε στην αρχή θα επεκταθούν εύκολα πιο κάτω, για να εξυπηρετούν πιο περίπλοκα μοντέλα ποινών για τα κενά. Για να δείχνουμε με παραδείγματα τις διάφορες μεθόδους, θα υιοθετήσουμε δύο αμινοξικές αλληλουχίες, τις οποίες και θα στοιχίζουμε, τη HEAGAWGHEE και την PAWHEAE. Για την ώρα θα χρησιμοποιούμε τα σκορ στοίχισης του BLOSUM 50 και ποινή με κόστος d = 8 για κάθε αμινοξικό κατάλοιπο που βρίσκεται σε κενό Σ.τ.μ.: Παρατηρήστε ότι η τιμή του d δίνεται εδώ αρνητική, ενώ στην άσκηση 2.3 δόθηκε θετική. Θα συναντήσετε και αλλού την ίδια αναντιστοιχία, για παράδειγμα, στις προτεινόμενες προεπιλεγμένες τιμές των ποινών σε διάφορα διαδικτυακά προγράμματα στοίχισης αλληλουχιών. Αυτό που έχει σημασία είναι το εξής: Για την τελική βαθμολογία της στοίχισης τα επιμέρους σκορ από τον πίνακα αντικατάστασης πρέπει να αθροίζονται, ενώ οι απόλυτες τιμές των ποινών πρέπει να αφαιρούνται. Τα σκορ αντικατάστασης αθροίζονται το ένα μετά το άλλο στην υπό κατασκευή βαθμολογία, αφού δείχνουν πόσο καλά ταιριάζει ή δεν ταιριάζει ένα αμινοξύ με ένα άλλο αμινοξύ. Οι τιμές ποινής έχουν αρνητική συνεισφορά: Η ύπαρξη των κενών πάντοτε μειώνει αριθμητικά την υπό κατασκευή βαθμολογία. Οπότε, είτε ορίζουμε τις τιμές τους θετικές και τις αφαιρούμε από την υπό κατασκευή βαθμολογία είτε τις θεωρούμε αρνητικές και τις προσθέτουμε στην υπό κατασκευή βαθμολογία.
15 32 2. Στοίχιση ανά ζεύγη Εικόνα 2.3 Πίνακας που αντιστοιχεί στις δύο αλληλουχίες που θα χρησιμοποιούμε για να μελετήσουμε τους αλγόριθμους δυναμικού προγραμματισμού για στοίχιση. Η τιμή αντικατάστασης για κάθε ζευγάρι αμινοξικών κατάλοιπων λήφθηκε από τον πίνακα BLOSUM 50 (Εικόνα 2.2). Οι θετικές τιμές δείχνονται με τονισμένα γράμματα. Η Εικόνα 2.3 δίνει τον πίνακα s ij με τα σκορ αντικατάστασης s(x i, y j ) για όλα τα πιθανά ζεύγη που θα μπορούσαν να σχηματίσουν τα κατάλοιπα των δύο αλληλουχιών. Όταν στοιχίζονται ταυτόσημα ή συντηρημένα κατάλοιπα, το σκορ είναι θετικό και δίνεται τονισμένο. Γενικά μιλώντας, ο αλγόριθμος πρέπει να τείνει να φτάσει σε μια στοίχιση που να ενσωματώνει όσο γίνεται περισσότερα θετικά σκορ και όσο γίνεται λιγότερα αρνητικά. Στα τελευταία συνυπολογίζονται και οι ποινές των κενών. Άσκησεις 2.5 Αποδείξτε ότι το πλήθος των δυνατών συνδυασμών για να συγχωνεύσετε δύο ανεξάρτητες αλληλουχίες με μήκη n και m, σε μια συνολική αλληλουχία μήκους n+m, χωρίς όμως να αλλάξετε την αρχική σειρά n+ m των κατάλοιπων από την κάθε αλληλουχία, είναι ίσο με. m 2.6 Υποθέστε ότι ένας αλγόριθμος στοίχισης δεν επιτρέπει ένθεση κενού στη δεύτερη αλληλουχία μετά την ένθεση ενός κενού στην πρώτη αλληλουχία. Έτσι, μπορούν να προκύψουν στοιχίσεις όπως οι ABC/A-C Σ.τ.μ.: Η γραφή ABC / A-C είναι ένας απλοποιημένος τρόπος αναπαράστασης της στοίχισης ABC. A C
16 2.3 Αλγόριθμοι στοίχισης 33 και A-CD/AB-D αλλά όχι η AB-D/A-CD 22. (Αυτή είναι μια δικλείδα ασφαλείας γιατί, αν επιτρεπόταν η ένθεση απεριόριστων κενών και στις δύο αλληλουχίες, τότε οι περιοχές με φτωχό ταίριασμα θα παρουσίαζαν πολλές δυνατές στοιχίσεις με πολλά κενά εντός τους και βαθμολογικά ισοδύναμες, χωρίς να κερδίζεται ουσιαστική πληροφορία (Για παράδειγμα, ABB--D/A--CCD, AB-B-D/A-C-CD, AB--BC/A-CC-D κ.λπ.) Φτιάξτε μια τέτοια υποθετική στοίχιση δύο αλληλουχιών, μετά επιλέξτε κατ εναλλαγή, ένα παρά ένα, τα κατάλοιπα (ή τα κενά) από τις δύο αλληλουχίες, κατόπιν αφαιρέστε τα κενά και δείξτε ότι υπάρχει αντιστοιχία των κατάλοιπων ένα προς ένα μεταξύ των δυνατών στοιχίσεων των αλληλουχιών χωρίς κενά και των δυνατών συγχωνεύσεων των αλληλουχιών που περιγράφηκαν στην προηγούμενη άσκηση. Αποδείξτε επίσης το πρώτο μέρος της εξίσωσης Χρησιμοποιήστε την εξίσωση του Stirling για να αποδείξετε το δεύτερο μέρος της εξίσωσης 2.7. Ολική στοίχιση: Ο αλγόριθμος Needleman-Wunsch Το πρώτο πρόβλημα από αυτά που θα καταπιαστούμε είναι η βέλτιστη ολική στοίχιση δύο αλληλουχιών, με επιτρεπτή την ένθεση κενών. Στην επιστήμη της ανάλυσης των βιολογικών αλληλουχιών ο σχετικός αλγόριθμος δυναμικού προγραμματισμού είναι ο αλγόριθμος Needleman-Wunsch [Needleman & Wunsch, 1970], εμείς όμως θα εξετάσουμε μια πιο ισχυρή εκδοχή του, την οποία εισήγαγε ο Gotoh [1982]. Η κεντρική ιδέα είναι να χτίσουμε την τελική βέλτιστη στοίχιση χρησιμοποιώντας προηγούμενες βέλτιστες στοιχίσεις από μικρότερα τμήματα των αλληλουχιών. Για αρχή φτιάχνουμε έναν πίνακα F, διαστάσεων n+1 m+1 (γραμμές στήλες), όπου n και m είναι τα μήκη των δύο αλληλουχιών, x και y. Όπως κάναμε πιο πάνω, τους δείκτες για την κάθε αλληλουχία τούς ονομάζουμε i και j, στον πίνακα όμως η αρίθμησή τους θα ξεκινάει από το 0 (π.χ.: 0, 1, 2,..., n 1, n). Έτσι, για παράδειγμα, το x 3 θα είναι το τρίτο γράμμα της αλληλουχίας και θα αντιστοιχεί στην τέταρτη στήλη του F. Κα- 22. Σ.τ.μ.: Λάβετε υπόψη ότι η (τελική) διαδικασία της στοίχισης δύο αλληλουχιών ξεκινάει από το τέλος τους (από τα δεξιά άκρα).
17 34 2. Στοίχιση ανά ζεύγη θώς θα συμπληρώνουμε τον πίνακα, σε κάθε κελί F(i, j) θα τοποθετείται η βέλτιστη βαθμολογία από τη στοίχιση των τμημάτων x 1... x i και y 1...y j των δύο αλληλουχιών, δηλαδή των τμημάτων από την αρχή των αλληλουχιών (πρώτο γράμμα αριστερά) ως τις θέσεις i και j, αντίστοιχα. Ο πίνακας εκτός από το πρώτο κελί θα συμπληρωθεί αναδρομικά (recursively): Η τιμή κάθε κελιού θα είναι συνάρτηση των τιμών άλλων κελιών που έχουν ήδη συμπληρωθεί. Η συνάρτηση που χρησιμοποιείται ονομάζεται «σχέση αναδρομής» (recurrence relation). Πρώτα θέτουμε F(0, 0) = 0. Έπειτα συμπληρώνουμε τα κελιά της πρώτης γραμμής και της πρώτης στήλης και μετά όλα τα υπόλοιπα κελιά από αριστερά προς τα δεξιά και από πάνω προς τα κάτω. Ας εξετάσουμε πρώτα τη βαθμολόγηση για ένα κελί F(i, j) με i > 0 και j > 0, δηλαδή για ένα κελί που βρίσκεται εκτός της πρώτης σειράς και της πρώτης στήλης. Δεδομένου ότι θα κινούμαστε από τα αριστερά προς τα δεξιά και από επάνω προς τα κάτω, τα κελιά F(i 1, j 1), F(i 1, j) και F(i, j 1) θα έχουν ήδη υπολογιστεί πριν από το F(i, j), άρα μπορούμε να υπολογίσουμε το F(i, j) βάσει εκείνων. Δηλαδή, κατά τη διαδρομή της η στοίχιση θα μπορούσε να φτάσει στο F(i, j) από καθένα από τα άλλα τρία κελιά. Ανάλογα με το κελί, θα υποδηλωνόταν διαφορετικό ταίριασμα μεταξύ των αλληλουχιών και η βαθμολογία θα μεταβαλλόταν διαφορετικά: (α) Άφιξη από το κελί F(i 1, j 1). Αυτό σημαίνει ότι στις αλληλουχίες το σύμβολο (κατάλοιπο) x i στοιχίζεται με το σύμβολο y j. Σε αυτή την περίπτωση, η βαθμολογία θα διαμορφωθεί ως εξής: F(i, j) = F(i 1, j 1) + s(x i, y j ). (β) Άφιξη από το κελί F(i 1, j). Αυτό σημαίνει ότι στις αλληλουχίες το σύμβολο x i της αλληλουχίας x στοιχίζεται με κενό το οποίο εντίθεται στην αλληλουχία y. Η βαθμολογία θα διαμορφωθεί ως εξής: F(i, j) = F(i 1, j) d. (γ) Άφιξη από το κελί F(i, j 1). Το σύμβολο y j της αλληλουχίας y στοιχίζεται με κενό που εντίθεται στην αλληλουχία x. Η βαθμολογία θα διαμορφωθεί ως εξής: F(i, j) = F(i, j 1) d Σ.τ.μ.: Σημειώστε ότι τα κενά που εντίθενται στην αλληλουχία δεν συμμετέχουν στο σύστημα αύξουσας αρίθμησης των δεικτών i και j. Έτσι, αν σε μια αλληλουχία δύο κατάλοιπα uv είναι το i-στό και το (i+1)-στό, θα συνεχίσουν να θεωρούνται το i-στό και το (i+1)-στό, ακόμα και αν εισαχθεί κενό οποιουδήποτε μήκους ανάμεσά τους κατά τη στοίχιση. Στη στοίχιση των αλληλουχιών ένα κατάλοιπο ας πούμε της αλληλουχίας y το οποίο ακολουθείται από κενό «αναφέρεται» ως στοιχισμένο με τα κατάλοιπα της αλληλουχίας x, ξεκινώντας από
18 2.3 Αλγόριθμοι στοίχισης 35 Τελικά, για το κελί F(i, j) επιλέγεται η μεγαλύτερη από τις τρεις βαθμολογίες. Συνολικά, δηλαδή, εφαρμόζεται η συνάρτηση: (2.8) Η τιμή s( x, y ) λαμβάνεται από τον πίνακα αντικατάστασης που έχουμε i j επιλέξει για τη στοίχιση. Η διαδικασία λοιπόν ανιχνεύει ποια είναι η διαδρομή με τη μεγαλύτερη βαθμολογία έως το τρέχον κελί (i, j), το οποίο εξετάζεται. Τα παραπάνω φαίνονται επίσης στην Εικόνα 2.4 και στην εικόνα πιο κάτω. Εικόνα 2.4 Οι τρεις τρόποι με τους οποίους μια στοίχιση μπορεί να επεκταθεί έως το κελί (i, j): Το x i στοιχίζεται με το y i, το x i στοιχίζεται με ένα κενό, το y i στοιχίζεται με ένα κενό 24. Ας δούμε τώρα τι γίνεται σε οριακές συνθήκες, δηλαδή όταν υπολογίζουμε τη βαθμολογία για τα κελιά της πρώτης γραμμής και της πρώτης στήλης. Στην πρώτη γραμμή είναι j = 0, οπότε οι τιμές F(i, j 1) και F(i 1, j 1) δεν ορίζονται. Έτσι, για την τιμή F(i, 0) πρέπει να υπάρξει ειδικός χειρισμός. Στην πραγματικότητα, τα κελιά (i, 0) αντιστοιχούν σε στοιχίσεις κατάλοιπων της το κατάλοιπο με το οποίο πραγματικά βρίσκεται ταιριασμένο έως το κατάλοιπο της x που βρίσκεται απέναντι από την τελευταία θέση του κενού. Για παράδειγμα, στη στοίχιση ABCD/U--V, το κατάλοιπο U αναφέρεται ως στοιχισμένο με τα κατάλοιπα ABC της άλλης αλληλουχίας. Αντίστοιχα, ο αλγόριθμος αθροίζει τιμές ποινής για όλα τα διαδοχικά ταιριάσματα των κατάλοιπων της αλληλουχίας x με τις κενές θέσεις της y: Έτσι υπολογίζεται η (συνολική) ποινή για ολόκληρο το μήκος του κενού. 24. Σ.τ.μ.: Ένα άλλο, πιο απλό παράδειγμα είναι το εξής: Από τη στοίχιση ABC (i-1) / ABC (i-1), τα τρία δυνατά επόμενα βήματα είναι: ABC (i-1) X i / ABC (i-1) Y j, ABC (i-1) X i / ABC (i-1) -, ABC (i-1) - / ABC (j-1) Y j.
19 36 2. Στοίχιση ανά ζεύγη Εικόνα 2.5 Επάνω: Ο συνολικός πίνακας του δυναμικού προγραμματισμού για τις αλληλουχίες του παραδείγματός μας. Τα βέλη αναπαριστούν τους δείκτες, οι οποίοι υποδεικνύουν την ανάστροφη πορεία της στοίχισης. Τα τονισμένα (παχιά) βέλη μαρτυρούν τη βέλτιστη διαδρομή από το τελευταίο (κάτω δεξιά) έως το πρώτο (πάνω αριστερά) κελί. (Στις «εκφυλισμένες» καταστάσεις, δηλαδή στα κελιά που προέκυψαν δύο ή τρεις ισοδύναμες βέλτιστες τιμές κατά τον υπολογισμό της βαθμολογίας, επιλέξαμε να δίνουμε ένα μόνο βέλος, για απλοποίηση του σχήματος.) Κάτω: Η αντίστοιχη ολική στοίχιση, με συνολική βαθμολογία ίση με 1. αλληλουχίας x με ένα συνεχές υποθετικό κενό εισηγμένο στην αλληλουχία y πριν το πρώτο της κατάλοιπο. Μπορούμε να πούμε λοιπόν ότι F(i, 0) = id. (Θυμηθείτε ότι χρησιμοποιούμε την ίδια ποινή κενού, d, για την έναρξη και την επιμήκυνση του κενού). Αντίστοιχα, για τα κελιά της πρώτης στήλης, (0, j), τα σκορ θα γίνουν: F(0, j) = jd. Κάθε φορά που αποφασίζουμε τη βαθμολογία για ένα κελί, (i, j), πρέπει να τοποθετούμε έναν δείκτη, ο οποίος θα δηλώνει ποιο προηγούμενο κελί χρησιμοποιήθηκε για τον υπολογισμό της τιμής F(i,j). Γραφικά, αυτό το αποδίδουμε με ένα βέλος. Για παράδειγμα, αν η συνάρτηση 2.8 έδωσε για το κελί (i, j) τη βαθμολογία F(i, j 1) d, τότε το βέλος θα ξεκινάει από το κελί (i, j) και θα καταλήγει στο «από πάνω» κελί (i, j 1). Η αλληλουχία των βελών θα μας δείχνει λοιπόν τη διαδρομή που ακολούθησε η βέλτιστη στοίχιση από το κελί πάνω αριστερά έως το κελί κάτω δεξιά (βλ. Εικόνα 2.5).
20 2.3 Αλγόριθμοι στοίχισης 37 Κάποιες φορές, δύο από τις τρεις δυνατές παραγόμενες βαθμολογίες θα είναι ίσες μεταξύ τους και μεγαλύτερες από την τρίτη, ή ακόμα και οι τρεις βαθμολογίες θα είναι ίσες μεταξύ τους. Σε αυτές τις περιπτώσεις πρέπει να τοποθετούμε δύο ή τρεις δείκτες, αντίστοιχα. Αυτά τα σημεία δηλώνουν ότι έχουμε δύο ή τρεις ισοδύναμα καλές στοιχίσεις (από άποψη βαθμολογίας), τουλάχιστον έως εκείνη τη θέση στοίχισης. Η τιμή στο τελευταίο κελί του πίνακα F(n, m) είναι εξ ορισμού η βέλτιστη βαθμολογία για τη στοίχιση των x 1... n και y 1...m, άρα είναι αυτό που τελικά ζητούσαμε: η βαθμολογία για τη βέλτιστη στοίχιση ολόκληρων των αλληλουχιών x και y. Για την ανασύσταση της στοίχισης πρέπει να εντοπίσουμε τη διαδρομή των βέλτιστων επιλογών (που παρήχθησαν από τη συνάρτηση 2.8) οι οποίες οδήγησαν στο κελί (n, m). Η διαδικασία ονομάζεται αναστροφή ή ιχνηλασία προς τα πίσω (traceback): Χτίζουμε τη στοίχιση των δύο αλληλουχιών αντίστροφα, ξεκινώντας από το τελευταίο κελί και ακολουθώντας τον δείκτη που αποθηκεύσαμε σε κάθε κελί. Από κάθε κελί (i, j) οδηγούμαστε σε ένα από τα κελιά (i 1, j 1), (i 1, j) ή (i, j 1), από το οποίο προήλθε η τιμή F(i, j). Σε κάθε βήμα καταγράφουμε ένα σύμβολο (ένα γράμμα/κατάλοιπο ή ένα κενό) για την κάθε αλληλουχία (προχωρώντας από τα δεξιά προς τα αριστερά των αλληλουχιών): x i και y i αν το βήμα οδηγεί προς το κελί (i 1, j 1), x i και το σύμβολο του κενού () αν το βήμα οδηγεί στο κελί (i 1, j), και το σύμβολο του κενού και y i αν το βήμα οδηγεί στο κελί (i, j 1). Το τελευταίο βήμα θα οδηγήσει στο πρώτο κελί του πίνακα, με i = j = 0. Για το βήμα αυτό δεν χρειάζεται να κάνουμε καμία καταγραφή. Παράδειγμα της διαδικασίας δίνεται στην Εικόνα 2.5. Βέβαια, η ανάστροφη πορεία που παρουσιάστηκε παραπάνω προϋποθέτει ότι από κάθε κελί ξεκινάει μόνο ένα βέλος (δείκτης), δηλαδή κατά τη βαθμολόγηση υπήρχε μία μόνο μέγιστη βαθμολογία για κάθε κελί. Στις πραγματικές στοιχίσεις αρκετές φορές παρουσιάζονται δύο ή τρεις ισότιμες μέγιστες βαθμολογίες, οπότε θα έχουν τοποθετηθεί δύο ή τρεις δείκτε, αντίστοιχα. Τότε, στην ανάστροφη πορεία παρουσιάζονται σε κάθε τέτοιο κελί δύο ή τρεις ισοδύναμες επιλογές. Μια λύση είναι να επιλεγεί αυθαίρετα ή τυχαία μία από αυτές. Συνήθως όμως προστίθενται ρουτίνες στον αλγόριθμο, ώστε να μπορεί να ανιχνεύσει και να καταγράψει όλες τις πιθανές, ισότιμες και βέλτιστες πορείες και στοιχίσεις. Το σύνολο αυτών των στοιχίσεων μπορεί να αναπαρασταθεί συνοπτικά με μια δομή γράφου των αλληλουχιών [βλ.
21 38 2. Στοίχιση ανά ζεύγη Altschul & Erickson, 1986 Hein, 1989a]. Θα χρησιμοποιήσουμε δομές γράφων αλληλουχιών στο Κεφάλαιο 7, όταν θα παρουσιάσουμε τον αλγόριθμο του Hein για πολλαπλές στοιχίσεις. Τελειώνοντας, ας αναφέρουμε ξανά ότι η επιτυχία του αλγόριθμου οφείλεται στο ότι η συνολική βαθμολογία φτιάχνεται ως άθροισμα ανεξάρτητων κομματιών: Η βέλτιστη βαθμολογία έως την κάθε θέση της στοίχισης προκύπτει από τη βαθμολογία της προηγούμενης θέσης συν μία μεταβολή εξαιτίας του νέου βήματος. Όμως η βαθμολογία της προηγούμενης θέσης ήταν επίσης η βέλτιστη έως εκεί κ.ο.κ. 25 Ο συμβολισμός του «μεγάλου Ο» για την πολυπλοκότητα 26 του αλγόριθμου Είναι χρήσιμο να γνωρίζουμε πόσο και πώς αυξάνεται ο υπολογιστικός χρόνος (CPU time) του Η/Υ και πόσο περισσότερη μνήμη δεσμεύεται, καθώς αυξάνεται η κλίμακα του προβλήματος που θέτουμε στον Η/Υ. Για τον παραπάνω αλγόριθμο χρειάζεται να αποθηκεύουμε (n + 1) (m + 1) αριθμούς (για τις βαθμολογίες όλων των κελιών) 27 και καθένας από τους n m από αυτούς, προκειμένου να καθοριστεί, κοστίζει ένα σταθερό ποσό υπολογισμών (τρεις προσθέσεις και τη συνάρτηση max). Λέμε λοιπόν χοντρικά ότι ο αλγόριθμος απαιτεί χρόνο Ο(nm) και μνήμη Ο(nm), με τα n και m να είναι τα μήκη των αλληλουχιών. Το «Ο(nm)» είναι παγιωμένος συμβολισμός, σημαίνει «τάξης n m» (of Order nm) και καλείται «το μεγάλο Ο» (big O) ή «το ολικό Ο». Δηλώνει ότι ο χρόνος απασχόλησης της CPU και η μνήμη που απαιτούνται κλιμακώνονται σε αναλογία προς το γινόμενο των μηκών των αλληλουχιών, n m. Επειδή συνήθως τα n και m είναι συγκρίσιμα, ο αλγόριθμος κατατάσσεται στην κατηγορία των O(n 2 ). Αλγόριθμοι με μεγάλο εκθέτη του n είναι «ασύμφοροι» για τη στοίχιση μακρών αλληλουχιών. Για 25. Σ.τ.μ.: Για να κάνετε πρακτική εκτίμηση της αποτελεσματικότητας του αλγόριθμου και της σημασίας της σχέσης της ποινής χάσματος με τα σκορ του πίνακα αντικατάστασης, στοιχίστε τις αλληλουχίες CCCA και CACC και μετά τις αλληλουχίες CCCW και CWCC χρησιμοποιώντας τον BLOSUM 50 και d = 8. Στην πρώτη περίπτωση ως βέλτιστη στοίχιση θα προκύψει η CCCA / CACC, ενώ στη δεύτερη η C-CCW / CWCC-. Αυτό δηλώνει ότι, με τις έως τώρα παρατηρήσεις, η αλανίνη (A) είναι ανεκτά παρόμοια με την κυστεΐνη (C), ενώ η τρυπτοφάνη (W) όχι. 26. Complexity στο αγγλικό κείμενο. Με τον όρο «complexity» για ένα σύστημα αναφερόμαστε είτε στο πλήθος των μερών από τα οποία αποτελείται το σύστημα (πολυπλοκότητα) είτε στο πλήθος και στη διάταξη των αλληλεξαρτήσεων/αλληλεπιδράσεων μεταξύ των μερών (περιπλοκότητα), είτε φυσικά και στα δύο. Για απλότητα, θα αποδίδουμε πάντα τον όρο ως πολυπλοκότητα. 27. Σ.τ.μ.: Στην πραγματικότητα αποθηκεύουμε περισσότερους: τους δείκτες για κάθε κελί κ.ά.
22 2.3 Αλγόριθμοι στοίχισης 39 τις συνηθισμένες πρωτεϊνικές αλληλουχίες στους συνηθισμένους υπολογιστές γραφείου, οι αλγόριθμοι O(n 2 ) μπορούν να εφαρμοστούν, αλλά είναι κάπως αργοί. Αλγόριθμοι του τύπου O(n 3 ) είναι πρακτικά εφαρμόσιμοι μόνο για τη στοίχιση πολύ κοντών αλληλουχιών. Άσκησεις 2.8 Βρείτε μια εναλλακτική βέλτιστη στοίχιση, με την ίδια συνολική βαθμολογία, συμπληρώνοντας όπου χρειάζεται τον πίνακα δυναμικού προγραμματισμού της Εικόνας Φτιάξτε τον πίνακα δυναμικού προγραμματισμού και βρείτε τη βέλτιστη στοίχιση για τις αλληλουχίες GAATTC και GATTA από DNA, βαθμολογώντας με +2 για κάθε ταίριασμα (ίδια βάση στις δύο αλληλουχίες), με 1 για κάθε ζεύγος παράταιρων βάσεων και με γραμμική ποινή κενού, d = 2. Τοπική στοίχιση: ο αλγόριθμος Smith-Waterman Ως εδώ εργαστήκαμε με την παραδοχή ότι γνωρίζαμε ποιες (δύο συγκεκριμένες) αλληλουχίες θέλαμε να στοιχίσουμε και ότι θέλαμε να πετύχουμε ένα συνολικό ταίριασμα από τη μία άκρη κάθε αλληλουχίας έως την άλλη. Πιο συνηθισμένο όμως είναι να θέλουμε να ανακαλύψουμε βέλτιστες στοιχίσεις (βέλτιστα ταιριάσματα που υπάρχουν) μεταξύ υποτμημάτων των x και y ή να θέλουμε να ανακαλύψουμε τμήματα της x που ταιριάζουν καλά με τμήματα από ένα σύνολο αλληλουχιών που βρίσκονται σε μια βάση δεδομένων. Τέτοιου τύπου αναζήτηση κάνουμε, για παράδειγμα, όταν υποπτευόμαστε ότι οι δύο πρωτεΐνες έχουν ένα πανομοιότυπο τμήμα, ενώ στο υπόλοιπό τους είναι διαφορετικές, ή όταν συγκρίνουμε εκτενείς περιοχές γονιδιωματικών DNA. (Στην τελευταία περίπτωση, μέσα στα δύο μόρια του DNA μπορεί να κρύβονται κάποια κοινά γονίδια και μάλιστα όχι με την ίδια σειρά ενώ τα υπόλοιπα να είναι διαφορετικά). Αυτή είναι συνήθως και η πιο ευαίσθητη μέθοδος για να ανιχνεύουμε ομοιότητες σε δύο πολύ διαφοροποιημένες αλληλουχίες, που έχουν όμως απώτατη κοινή καταγωγή καθ όλο το μήκος τους. Σε τέτοιες περιπτώσεις συνήθως ένα μόνο ή λίγα τμήματα των αλληλουχιών υπέστησαν τόσο μεγάλη εξελικτική πίεση ώστε να διατηρήσουν την ομοιότητά τους, τα υπόλοιπα τμήματα των αλληλουχιών είτε διαφοροποιήθηκαν
23 40 2. Στοίχιση ανά ζεύγη Εικόνα 2.6 Επάνω: Ο πίνακας δυναμικού προγραμματισμού τοπικής στοίχισης για τις δύο αλληλουχίες που χρησιμοποιήθηκαν ως παράδειγμα και στην προηγούμενη ενότητα. Κάτω: Η βέλτιστη τοπική στοίχιση με βαθμολογία 28. εξαιτίας άλλων εξελικτικών πιέσεων είτε συσσώρευσαν με τον καιρό τόσο πολλές τυχαίες αλλαγές ώστε δεν είναι πλέον «στοιχίσιμα». (Σημειώστε ότι το αποτέλεσμα της τυχαίας απόκλισης μπορεί να θεωρείται «θόρυβος».) Η στοίχιση, βάσει της υψηλότερης βαθμολογίας, τμημάτων των αλληλουχιών x και y καλείται βέλτιστη τοπική στοίχιση. Ο αλγόριθμος που εντοπίζει τις βέλτιστες τοπικές στοιχίσεις μοιάζει πολύ με τον αλγόριθμο που περιγράφηκε στην προηγούμενη ενότητα για την ολική στοίχιση. Υπάρχουν δύο διαφορές: 1. Για τη βαθμολογία που θα δοθεί σε κάθε κελί του πίνακα F, προσφέρεται μία ακόμα δυνατότητα στις τρεις δυνατότητες που καταγράφηκαν στην εξίσωση (2.8). Τώρα το κελί F(i, j) μπορεί να βαθμολογηθεί με 0, όταν όλες οι άλλες δυνατότητες του αποδίδουν τιμή μικρότερη από το 0: (2.9) Το να δοθεί τιμή 0 σε ένα κελί σηματοδοτεί το τέλος της τρέχουσας τοπικής στοίχισης και την έναρξη μιας νέας. Η λογική πίσω από αυτό είναι πως, αν
24 2.3 Αλγόριθμοι στοίχισης 41 η βέλτιστη στοίχιση μέχρι κάποιο σημείο καταλήγει να αποκτά αρνητική βαθμολογία, τότε είναι καλύτερο να ξεκινάμε μια νέα παρά να επεκτείνουμε την παλιά. Η επιλογή της τιμής 0 εφαρμόζεται και στα κελιά της πρώτης σειράς και της πρώτης στήλης. Έτσι, όλα αυτά τα κελιά λαμβάνουν τιμή 0 αντί για id και jd που λάμβαναν στην ολική στοίχιση. 2. Απόρροια του παραπάνω είναι ότι κάθε τοπική στοίχιση μπορεί να τελειώνει οπουδήποτε μέσα στον πίνακα. Επίσης, η βέλτιστη βαθμολογία δεν βρίσκεται (απαραίτητα) στο κάτω δεξιά κελί. Αναζητούμε λοιπόν τις υψηλότερες τιμές F (i, j) παντού μέσα στον πίνακα και ξεκινάμε ανάστροφες διαδρομές από καθένα από τα αντίστοιχα κελιά. Κάθε ανάστροφη διαδρομή θα τελειώνει όταν φτάσει σε κελί με τιμή 0, το οποίο και θα σηματοδοτεί την αρχή της στοίχισης των τμημάτων των δύο αλληλουχιών. Το κελί από το οποίο ξεκινάει η ανάστροφη πορεία σηματοδοτεί τη λήξη της στοίχισης των δύο τμημάτων. Ένα παράδειγμα δίνεται στην Εικόνα 2.6. Φαίνεται η βέλτιστη τοπική στοίχιση μεταξύ των δύο αλληλουχιών, των οποίων η βέλτιστη ολική στοίχιση δόθηκε στην Εικόνα 2.5. Σε αυτό το παράδειγμα η βέλτιστη τοπική στοίχιση αντιστοιχεί σε τμήμα (μόνο) της ολικής στοίχισης, αλλά αυτό δεν αποτελεί γενικό κανόνα. Για να λειτουργεί επιτυχημένα ο αλγόριθμος της τοπικής στοίχισης (σε συνδυασμό με τον επιλεγμένο πίνακα αντικατάστασης και τις ποινές κενών), πρέπει η αναμενόμενη βαθμολογία για ένα τυχαίο εξαναγκασμένο ταίριασμα δύο αλληλουχιών να είναι αρνητική. Αν δεν συμβαίνει αυτό, σημαίνει ότι ο αλγόριθμος θα επιτρέπει σε μακρά ανόμοια τμήματα αλληλουχιών να παρουσιάζονται ως στοιχισμένα με υψηλές (> 0) βαθμολογίες. Ακόμα χειρότερα, σε μια τέτοια περίπτωση η βαθμολογία θα εξαρτάται θετικά από το μήκος των αλληλουχιών. Επίσης, ο αλγόριθμος (μαζί με τον πίνακα αντικατάστασης και τις ποινές κενών), παρότι θα λειτουργεί ως «τοπικός» (δηλαδή, με βάση τη συνάρτηση 2.9), θα παράγει ολικές ή σχεδόν ολικές στοιχίσεις. Πιθανόν, μια πραγματική τοπική στοίχιση να κρυφτεί μέσα σε μια μεγαλύτερη και λανθασμένη (από άποψη τοπικότητας) στοίχιση, απλώς εξαιτίας επιπλέον σκορ που θα προσέθετε στη βαθμολογία το «παραπανίσιο» μήκος. Από την άλλη, στον πίνακα αντικατάστασης πρέπει να υπάρχουν κάποιες τιμές s(a, b) μεγαλύτερες από 0, αλλιώς ο αλγόριθμος (με βάση τη συνάρτηση 2.9) δεν θα υποδείξει καμία στοίχιση (παντού στον πίνακα F θα τοποθετεί 0). Αλλά τι ακριβώς σημαίνει η απαίτηση «η αναμενόμενη βαθμολογία για ένα
25 42 2. Στοίχιση ανά ζεύγη τυχαίο ταίριασμα των αλληλουχιών να είναι αρνητική»; Στην περίπτωση που δεν εισάγονται κενά, υπονοείται «η βαθμολογία που λαμβάνει μια στοίχιση αλληλουχιών με συγκεκριμένο μήκος». Και αφού τα διαδοχικά στοιχισμένα ζεύγη είναι ανεξάρτητα μεταξύ τους, αρκεί να λάβουμε υπόψη μία μόνο (αντιπροσωπευτική) στοιχισμένη θέση, για την οποία να ισχύει: (2.10) όπου q a και q b είναι οι πιθανότητες εμφάνισης των συμβόλων α και β σε μια θέση της αλληλουχίας. Αν το σκορ s(a, b) δοθεί ως λογάριθμος του λόγου των πιθανοφανειών, όπως στην Ενότητα 2.2, χρησιμοποιώντας την ίδια q a όπως στις πιθανότητες του τυχαίου μοντέλου, τότε η (2.10) ικανοποιείται πάντα, και αυτό επειδή: 2 2 Η ποσότητα Hq ( p) είναι η σχετική εντροπία της κατανομής q = q q σε σχέση προς την κατανομή p και είναι πάντα θετική, εκτός από την περίπτωση που q = p (βλ. Ενότητα 11.2). Ουσιαστικά, η Hq ( p) προσφέρει 2 2 ένα φυσικό μέτρο τού πόσο διαφορετικές είναι οι δύο κατανομές. Αποτελεί επίσης εξ ορισμού ένα μέτρο σχετικά με το πόση πληροφορία αναμένουμε από κάθε στοιχισμένο ζεύγος μέσα στη στοίχιση. Δυστυχώς, δεν μπορούμε να έχουμε μια ισοδύναμη ανάλυση για τις στοιχίσεις όπου τα κενά είναι επιτρεπτά. Δεν υπάρχει αναλυτική μέθοδος που να προβλέπει πώς διαφοροποιείται η επίδραση των ποινών των κενών μεταξύ της ολικής και της τοπικής στοίχισης. Παραμένει όμως ως ερώτημα πρακτικής σημασίας, όταν διαμορφώνουμε τα συστήματα βαθμολόγησης [δηλαδή τα σκορ αντικατάστασης s(a, b) και τις ποινές γ(g)]. Επίσης, έχουν φτιαχτεί πίνακες για τα πιο συνηθισμένα συστήματα βαθμολόγησης, που δείχνουν τη «συμπεριφορά» τους ανάλογα με την τοπική ή την ολική στοίχιση, μαζί με άλλες στατιστικές ιδιότητές τους [Altschul & Gish, 1996]. Θα επιστρέψουμε αργότερα σε αυτό το θέμα, όταν θα συζητήσουμε τη στατιστική σημαντικότητα των βαθμολογιών. Ο αλγόριθμος δυναμικού προγραμματισμού για την τοπική στοίχιση αλληλουχιών αναπτύχθηκε στις αρχές της δεκαετίας του Συχνά αναφέρεται
ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων
ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΕΙΣΑΓΩΓΗ Ένας από τους πρωταρχικούς στόχους της σύγκρισης των ακολουθιών δύο µακροµορίων είναι η εκτίµηση της οµοιότητάς τους και η εξαγωγή συµπερασµάτων
Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών
Στοίχιση αλληλουχιών Σύνοψη Καθολική στοίχιση Μήτρες βαθμολόγησης Τοπική στοίχιση Στοίχιση με ποινές εισαγωγής κενών Από την LCS στη στοίχιση: αλλαγές στη βαθμολόγηση Το πρόβλημα της Μεγαλύτερης Κοινής
LALING/PLALING :
1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi
Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)
Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση κατά ζεύγη: Τι είναι Αντιστοίχιση των νουκλεοτιδίων/αµινοξέων δυο ακολουθιών, ώστε να εντοπιστούν οι οµοιότητες και οι διαφορές τους. Χρησιµοποιείται
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων
Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι
Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις
Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου
Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων
Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις
ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ
ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Ομολογία Σελίδα 2 Ομολογία Ομολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός διπλασιασμός
Κατακερματισμός (Hashing)
Κατακερματισμός (Hashing) O κατακερματισμός είναι μια τεχνική οργάνωσης ενός αρχείου. Είναι αρκετά δημοφιλής μέθοδος για την οργάνωση αρχείων Βάσεων Δεδομένων, καθώς βοηθάει σημαντικά στην γρήγορη αναζήτηση
ΕΡΩΤΗΣΕΙΣ ΚΛΕΙΣΤΟΥ Ή ΑΝΤΙΚΕΙΜΕΝΙΚΟΥ ΤΥΠΟΥ
ΕΡΩΤΗΣΕΙΣ ΚΛΕΙΣΤΟΥ Ή ΑΝΤΙΚΕΙΜΕΝΙΚΟΥ ΤΥΠΟΥ Με τις ερωτήσεις του τύπου αυτού καλείται ο εξεταζόμενος να επιλέξει την ορθή απάντηση από περιορισμένο αριθμό προτεινόμενων απαντήσεων ή να συσχετίσει μεταξύ
Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.
Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης
Εξερευνώντας την Εξέλιξη Κεφάλαιο 7
Εξερευνώντας την Εξέλιξη Κεφάλαιο 7 Εξερευνώντας την Εξέλιξη Σχέση μεταξύ αλληλουχίας αμινοξέων, δομής και λειτουργίας πρωτεϊνών Καταγωγή από έναν κοινό πρόγονο Εξελικτική Συγγένεια/Προέλευση Δύο ομάδες
Διαδικασιακός Προγραμματισμός
Τμήμα ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ ΤΕΙ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ Διαδικασιακός Προγραμματισμός Διάλεξη 2 η Τύποι Δεδομένων Δήλωση Μεταβλητών Έξοδος Δεδομένων Οι διαλέξεις βασίζονται στο βιβλίο των Τσελίκη και Τσελίκα
ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ
ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή
Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,
Αριθμητική Ανάλυση & Εφαρμογές
Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου
Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.
Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και
Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.
Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης
Αριθμητική Ανάλυση και Εφαρμογές
Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα
Αριθμητική Ανάλυση και Εφαρμογές
Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Πεπερασμένες και Διαιρεμένες Διαφορές Εισαγωγή Θα εισάγουμε την έννοια των διαφορών με ένα
Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής Παντελής Μπάγκος 1 Διάλεξη 2 Αναζήτηση ομοιότητας και κατά ζεύγη στοίχιση ακολουθιών 2 Κατά ζεύγη στοίχιση ακολουθιών Από τα πιο
ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου
ΕΠΑΝΑΛΗΨΗ Σελίδα 1 τεχνική σύγκρισης ακολουθιών υπολογισµός ενός µέτρου οµοιότητας αναζήτηση ομολογίας S-S match S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC gap mismatch Σελίδα 2 ολική
Μαθηματική Εισαγωγή Συναρτήσεις
Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,
Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ
Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν
Προβλήματα, αλγόριθμοι, ψευδοκώδικας
Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι
Μαθηματική Εισαγωγή Συναρτήσεις
Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς Καστοριά, Ιούλιος 14 A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας
bca = e. H 1j = G 2 H 5j = {f G j : f(0) = 1}
Αλγεβρα Ι, Χειμερινο Εξαμηνο 2017 18 Ασκησεις που συζητηθηκαν στο φροντιστηριο Το [Α] συμβολίζει το φυλλάδιο ασκήσεων που θα βρείτε στην ιστοσελίδα του μαθήματος επιλέγοντας «Άλλες Ασκήσεις». 1. Πόσες
ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών
ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΕΙΣΑΓΩΓΗ Η αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών (database similarity searching) αποτελεί µια από τις συχνότερα χρησιµοποιούµενες
Μέθοδοι μελέτης εξέλιξης
H διερεύνηση της μοριακής βάσης της εξέλιξης βασίζεται σε μεγάλο βαθμό στη διευκρίνιση της διαδικασίας με την οποία μετασχηματίσθηκαν στη διάρκεια της εξέλιξης πρωτεϊνες, άλλα μόρια και βιοχημικές πορείες
Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου
Ανάλυση αλγορίθμων Παράμετροι απόδοσης ενός αλγόριθμου: Χρόνος εκτέλεσης Απαιτούμενοι πόροι, π.χ. μνήμη, επικοινωνία (π.χ. σε κατανεμημένα συστήματα) Προσπάθεια υλοποίησης Ανάλυση της απόδοσης Θεωρητική
Γραμμικός Προγραμματισμός Μέθοδος Simplex
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση
Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα
Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα Παράδειγμα Να βρείτε τις ιδιοτιμές και τα αντίστοιχα ιδιοδιανύσματα του πίνακα A 4. Επίσης να προσδιοριστούν οι ιδιοχώροι και οι γεωμετρικές πολλαπλότητες των ιδιοτιμών.
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΣΗΜΕΙΩΣΕΙΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ. ρ Χρήστου Νικολαϊδη
ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΣΗΜΕΙΩΣΕΙΣ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ ρ Χρήστου Νικολαϊδη Δεκέμβριος Περιεχόμενα Κεφάλαιο : σελ. Τι είναι ένας πίνακας. Απλές πράξεις πινάκων. Πολλαπλασιασμός πινάκων.
Συνοπτική Μεθοδολογία Ασκήσεων IP Fragmentation. Ασκήσεις στο IP Fragmentation
Συνοπτική Μεθοδολογία Ασκήσεων IP Fragmentation Οι σημειώσεις που ακολουθούν περιγράφουν τις ασκήσεις IP Fragmentation που θα συναντήσετε στο κεφάλαιο 3. Η πιο συνηθισμένη και βασική άσκηση αναφέρεται
Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών
Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών Συμβολισμοί Σε αναλογία με τους ορισμούς συμβολίζουμε μια ακολουθία: 1 είτε μέσω του διανυσματικού ορισμού, παραθέτοντας αναγκαστικά
Συστήματα συντεταγμένων
Κεφάλαιο. Για να δημιουργήσουμε τρισδιάστατα αντικείμενα, που μπορούν να παρασταθούν στην οθόνη του υπολογιστή ως ένα σύνολο από γραμμές, επίπεδες πολυγωνικές επιφάνειες ή ακόμη και από ένα συνδυασμό από
ΑΝΑΛΥΣΗ 1 ΠΕΜΠΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.
ΑΝΑΛΥΣΗ 1 ΠΕΜΠΤΟ ΜΑΘΗΜΑ, 17-10-13 Μ. Παπαδημητράκης. 1 Την προηγούμενη φορά αναφέραμε (και αποδείξαμε στην περίπτωση n = 2) το θεώρημα που λέει ότι, αν n N, n 2, τότε για κάθε y 0 υπάρχει μοναδική μηαρνητική
3.7 Παραδείγματα Μεθόδου Simplex
3.7 Παραδείγματα Μεθόδου Simplex Παράδειγμα 1ο (Παράδειγμα 1ο - Κεφάλαιο 2ο - σελ. 10): Το πρόβλημα εκφράζεται από το μαθηματικό μοντέλο: max z = 600x T + 250x K + 750x Γ + 450x B 5x T + x K + 9x Γ + 12x
Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)
TETY Εφαρμοσμένα Μαθηματικά Ενότητα ΙΙ: Γραμμική Άλγεβρα Ύλη: Διανυσματικοί χώροι και διανύσματα, μετασχηματισμοί διανυσμάτων, τελεστές και πίνακες, ιδιοδιανύσματα και ιδιοτιμές πινάκων, επίλυση γραμμικών
ΚΕΦΑΛΑΙΟ 2: ΟΡΙΖΟΥΣΕΣ
ΚΕΦΑΛΑΙΟ ΚΕΦΑΛΑΙΟ :. ΕΙΣΑΓΩΓΗ Σε κάθε τετραγωνικό πίνακα ) τάξης n θα αντιστοιχίσουμε έναν πραγματικό ( ij αριθμό, τον οποίο θα ονομάσουμε ορίζουσα του πίνακα. Η ορίζουσα θα συμβολίζεται det ή Α ή n n
Μάθημα 5: Χαρακτηριστικά της Κ.Μ.Ε.
Μάθημα 5: Χαρακτηριστικά της Κ.Μ.Ε. 5.1 Το ρολόι Κάθε μία από αυτές τις λειτουργίες της Κ.Μ.Ε. διαρκεί ένα μικρό χρονικό διάστημα. Για το συγχρονισμό των λειτουργιών αυτών, είναι απαραίτητο κάποιο ρολόι.
Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου
Βιοπληροφορική Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της συσχέτισης ομολογίας ομοιότητας. Παρουσίαση των πληροφοριών
Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n
Εισαγωγή στην επιστήμη των υπολογιστών
Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 3ο Αναπαράσταση Αριθμών www.di.uoa.gr/~organosi 1 Δεκαδικό και Δυαδικό Δεκαδικό σύστημα 2 3 Δεκαδικό και Δυαδικό Δυαδικό Σύστημα
Περιεχόμενα. Πρόλογος 3
Πρόλογος Η χρησιμότητα της Γραμμικής Άλγεβρας είναι σχεδόν αυταπόδεικτη. Αρκεί μια ματιά στο πρόγραμμα σπουδών, σχεδόν κάθε πανεπιστημιακού τμήματος θετικών επιστημών, για να διαπιστώσει κανείς την παρουσία
Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ
Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ 1 Συναρτήσεις Όταν αναφερόμαστε σε μια συνάρτηση, ουσιαστικά αναφερόμαστε σε μια σχέση ή εξάρτηση. Στα μαθηματικά που θα μας απασχολήσουν, με απλά λόγια, η σχέση
Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e
Άσκηση 1 Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e Υπάρχουν τρία μαύρα τετραγωνάκια (b), τρία άσπρα (w) και ένα κενό (e). Η σπαζοκεφαλιά έχει τις ακόλουθες
Σχεδίαση και Ανάλυση Αλγορίθμων
Σχεδίαση και Ανάλυση Αλγορίθμων Ενότητα 4.0 Επιλογή Αλγόριθμοι Επιλογής Select και Quick-Select Σταύρος Δ. Νικολόπουλος 2016-17 Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros
Ασκήσεις μελέτης της 6 ης διάλεξης
Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 6 ης διάλεξης 6.1. (α) Το mini-score-3 παίζεται όπως το score-4,
Υπολογιστικά & Διακριτά Μαθηματικά
Υπολογιστικά & Διακριτά Μαθηματικά Ενότητα 1: Εισαγωγή- Χαρακτηριστικά Παραδείγματα Αλγορίθμων Στεφανίδης Γεώργιος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.
Επιχειρησιακή Έρευνα I
Επιχειρησιακή Έρευνα I Κωστής Μαμάσης Παρασκευή 09:00 12:00 Σημειώσεις των Α. Platis, K. Mamasis Περιεχόμενα 1. Εισαγωγή 2. Γραμμικός Προγραμματισμός 1. Μοντελοποίηση 2. Μέθοδος Simplex 1. Αλγόριθμός Simplex
Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017
Τμήμα Μηχανικών Πληροφορικής ΤΕ 2016-2017 Η μέθοδος Simplex Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα τελευταία ενημέρωση: 19/01/2017 1 Πλεονεκτήματα Η μέθοδος Simplex Η μέθοδος Simplex είναι μια
ΕΠΙΛΥΣΗ ΕΚΦΥΛΙΣΜΕΝΩΝ ΚΑΙ ΓΕΝΙΚΩΝ ΓΡΑΜΜΙΚΩΝ ΠΡΟΒΛΗΜΑΤΩΝ. 4.1 Επίλυση Εκφυλισμένων Γραμμικών Προβλημάτων
ΚΕΦΑΛΑΙΟ 4 ΕΠΙΛΥΣΗ ΕΚΦΥΛΙΣΜΕΝΩΝ ΚΑΙ ΓΕΝΙΚΩΝ ΓΡΑΜΜΙΚΩΝ ΠΡΟΒΛΗΜΑΤΩΝ 4. Επίλυση Εκφυλισμένων Γραμμικών Προβλημάτων Η περιγραφή του ΔΑΣΕΣ στο προηγούμενο κεφάλαιο έγινε με σκοπό να διευκολυνθούν οι αποδείξεις
x < A y f(x) < B f(y).
Χειμερινό Εξάμηνο 2016 2017 Ασκήσεις στα Κεφάλαια 5 & 6 1. Αυτή είναι ουσιαστικά η Άσκηση 5.2 (σελ. 119), από τις σημειώσεις του Σκανδάλη. Εστω A, < καλά διατεταγμένο σύνολο και έστω στοιχείο a A. Αποδείξτε
ΚΕΦΑΛΑΙΟ 5 ΑΚΟΛΟΥΘΙΕΣ ΑΡΙΘΜΗΤΙΚΗ ΓΕΩΜΕΤΡΙΚΗ ΠΡΟΟΔΟΣ
ΑΛΓΕΒΡΑ Β ΛΥΚΕΙΟΥ ΚΕΦΑΛΑΙΟ 5 ΑΚΟΛΟΥΘΙΕΣ ΑΡΙΘΜΗΤΙΚΗ ΓΕΩΜΕΤΡΙΚΗ ΠΡΟΟΔΟΣ ΓΙΑΝΝΗΣ ΠΑΤΕΡΑΣ ΜΑΘΗΜΑΤΙΚΟΣ ΑΛΓΕΒΡΑ Β ΛΥΚΕΙΟΥ ΑΚΟΛΟΥΘΙΕΣ ΚΕΦΑΛΑΙΟ 5 ΑΡΙΘΜΗΤΙΚΗ ΠΡΟΟΔΟΣ ΑΠΑΡΑΙΤΗΤΕΣ ΓΝΩΣΕΙΣ ΘΕΩΡΙΑΣ Ακολουθία ονομάζουμε
Πρόσθεση, αφαίρεση και πολλαπλασιασμός φυσικών αριθμών
Πρόσθεση, αφαίρεση και πολλαπλασιασμός φυσικών αριθμών TINΑ ΒΡΕΝΤΖΟΥ www.ma8eno.gr www.ma8eno.gr Σελίδα 1 Πρόσθεση, αφαίρεση και πολλαπλασιασμός φυσικών αριθμών Στους πραγματικούς αριθμούς ορίστηκαν οι
Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα
Ασκήσεις της Ενότητας 2 : Ζωγραφίζοντας με το ΒΥΟΒ -1- α. Η χρήση της πένας Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα Υπάρχουν εντολές που μας επιτρέπουν να επιλέξουμε το χρώμα της πένας, καθώς και το
Αλλαγεές και βελτιωέ σεις στην εέκδοση 1.50
Αλλαγεές και βελτιωέ σεις στην εέκδοση 1.50 Στο παρόν έγγραφο καταγράφονται οι βελτιώσεις και οι νέες εντολές που ενσωματώνονται στην έκδοση 1.50 των Οπλισμών. Βελτιώσεις Σχεδίαση οπλισμών Έχει βελτιωθεί
ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 7. Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ
ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ
Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ
Ασκήσεις3 Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα.
Ασκήσεις 0 Ασκήσεις Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα o H -στήλη του P P είναι E αν και μόνο αν η -στήλη του P είναι ιδιοδιάνυσμα του που αντιστοιχεί στην ιδιοτιμή
Πίνακες Διασποράς. Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h. Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση
Πίνακες Διασποράς Χρησιμοποιούμε ένα πίνακα διασποράς T και μια συνάρτηση διασποράς h Ένα στοιχείο με κλειδί k αποθηκεύεται στη θέση κλειδί k T 0 1 2 3 4 5 6 7 U : χώρος πιθανών κλειδιών Τ : πίνακας μεγέθους
Πρόβλημα. Σύνολο γνωστών αλληλουχιών
BLAST Πρόβλημα Άγνωστη αλληλουχία Σύνολο γνωστών αλληλουχιών Η χρήση ενός υπολογιστή κι ενός αλγόριθμου είναι απαραίτητη για την ανακάλυψη της σχέσης μιας αλληλουχίας με τις γνωστές υπάρχουσες Τί είναι
Αριθμητική Ανάλυση και Εφαρμογές
Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Ολοκλήρωση Εισαγωγή Έστω ότι η f είναι μία φραγμένη συνάρτηση στο πεπερασμένο
Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.
Βιοπληροφορική Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση των εφαρμογών της αναζήτησης
ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ
ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ Εργαστήριο Βιοπληροφορικής 7 ο εξάμηνο Σχολή Μηχανολόγων Μηχανικών ΕΜΠ Διδάσκων: Λεωνίδας Αλεξόπουλος Fritz Kahn (1888 1968) 1 Περιεχόμενα Ομοιότητα πρωτεϊνών Σύγκριση αλληλουχιών
Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά
Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων
22Α004 - Προχωρημένα Θέματα Θεωρίας Πληροφορίας Τελική Εξέταση
22A004 (eclass EE278) Προχωρημένα Θέματα Θεωρίας Πληροφορίας Φυλλάδιο 11 Δ. Τουμπακάρης 6 Ιουνίου 2013 22Α004 - Προχωρημένα Θέματα Θεωρίας Πληροφορίας Τελική Εξέταση Διάρκεια Εξέτασης: 3 ώρες. 4 ασκήσεις
Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II
Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 7: Σύγκριση αλληλουχιών Part II Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr
3.4.1 Ο Συντελεστής ρ του Spearman
3.4. Ο Συντελεστής ρ του Spearma Έστω (, ), (, ),..., (, ) ένα δείγμα παρατηρήσεων πάνω στο τυχαίο διάνυσμα (, ). Έστω ( ) ο βαθμός ή η τάξη μεγέθους της μεταβλητής όταν αυτή συγκρίνεται με τις άλλες Χ
9. Συστολικές Συστοιχίες Επεξεργαστών
Κεφάλαιο 9: Συστολικές συστοιχίες επεξεργαστών 208 9. Συστολικές Συστοιχίες Επεξεργαστών Οι συστολικές συστοιχίες επεξεργαστών είναι επεξεργαστές ειδικού σκοπού οι οποίοι είναι συνήθως προσκολλημένοι σε
Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο
Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,
Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής
Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)
Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τοµέας Υδατικών Πόρων Μάθηµα: Τυπικά Υδραυλικά Έργα Μέρος 2: ίκτυα διανοµής Άσκηση E0: Μαθηµατική διατύπωση µοντέλου επίλυσης απλού δικτύου διανοµής
Να επιλύουμε και να διερευνούμε γραμμικά συστήματα. Να ορίζουμε την έννοια του συμβιβαστού και ομογενούς συστήματος.
Ενότητα 2 Γραμμικά Συστήματα Στην ενότητα αυτή θα μάθουμε: Να επιλύουμε και να διερευνούμε γραμμικά συστήματα. Να ορίζουμε την έννοια του συμβιβαστού και ομογενούς συστήματος. Να ερμηνεύουμε γραφικά τη
Κεφάλαιο 2 Α Ν Τ Ι Γ Ρ Α Φ Η
ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ Κεφάλαιο 2 Μεθοδολογία Ασκήσεων Α Ν Τ Ι Γ Ρ Α Φ Η 1 η Κατηγορία: Ασκήσεις στην Αντιγραφή (υπολογιστικές) Αφού αναφέρουμε τον ημισυντηρητικό τρόπο αντιγραφής φτιάχνουμε ένα απλό σχήμα
Κεφάλαιο 3: Εισαγωγή στους αλγορίθμους - διαγράμματα ροής
Κεφάλαιο 3: Εισαγωγή στους αλγορίθμους - διαγράμματα ροής Αλγόριθμος (algorithm) λέγεται μία πεπερασμένη διαδικασία καλά ορισμένων βημάτων που ακολουθείται για τη λύση ενός προβλήματος. Το διάγραμμα ροής
ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ. 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής
ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής 1. Σύμφωνα με το νόμο της προσφοράς: α) Η προσφερόμενη ποσότητα ενός αγαθού αυξάνεται όταν μειώνεται η τιμή του στην αγορά β) Η προσφερόμενη
Μη γράφετε στο πίσω μέρος της σελίδας
Εισαγωγή στο Σχεδιασμό & την Ανάλυση Αλγορίθμων Εξέταση Ιουνίου 2015 Σελ. 1 από 7 Στη σελίδα αυτή γράψτε μόνο τα στοιχεία σας. Γράψτε τις απαντήσεις σας στις επόμενες σελίδες, κάτω από τις αντίστοιχες
Η μέθοδος Simplex. Γεωργία Φουτσιτζή-Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. Τμήμα Μηχανικών Πληροφορικής ΤΕ
Τμήμα Μηχανικών Πληροφορικής ΤΕ 2017-2018 Η μέθοδος Simplex Γεωργία Φουτσιτζή-Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα τελευταία ενημέρωση: 19/01/2017 1 Πλεονεκτήματα Η μέθοδος Simplex Η μέθοδος
Τηλεπικοινωνιακά Συστήματα ΙΙ
Τηλεπικοινωνιακά Συστήματα ΙΙ Διάλεξη 11: Κωδικοποίηση Πηγής Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα 1. Αλγόριθμοι κωδικοποίησης πηγής Αλγόριθμος Fano Αλγόριθμος Shannon Αλγόριθμος Huffman
5. (Λειτουργικά) Δομικά Διαγράμματα
5. (Λειτουργικά) Δομικά Διαγράμματα Γενικά, ένα λειτουργικό δομικό διάγραμμα έχει συγκεκριμένη δομή που περιλαμβάνει: Τις δομικές μονάδες (λειτουργικά τμήματα ή βαθμίδες) που συμβολίζουν συγκεκριμένες
Ασκήσεις κέντρου μάζας και ροπής αδράνειας. αν φανταστούμε ότι το χωρίζουμε το στερεό σώμα σε μικρά κομμάτια, μόρια, μάζας m i και θέσης r i
Κέντρο μάζας Ασκήσεις κέντρου μάζας και ροπής αδράνειας Η θέση κέντρου μάζας ορίζεται ως r r i i αν φανταστούμε ότι το χωρίζουμε το στερεό σώμα σε μικρά κομμάτια, μόρια, μάζας i και θέσης r i. Συμβολίζουμε
Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής
Θεωρία Πληροφορίας Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα Διακριτή πηγή πληροφορίας χωρίς μνήμη Ποσότητα πληροφορίας της πηγής Κωδικοποίηση
Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.
Παραδείγματα (2 ο σετ) Διανυσματικοί Χώροι Επιμέλεια: Ι. Λυχναρόπουλος
Παραδείγματα ( ο σετ) Διανυσματικοί Χώροι Επιμέλεια: Ι. Λυχναρόπουλος Παράδειγμα Έστω ο υποχώρος W του R 5 που παράγεται από τα διανύσματα v=(,,-,,), v=(,,-,6,8), v=(,,,,6), v=(,,5,,8), v5=(,7,,,9). a)
ΑΣΚΗΣΗ 6 Συνδεσμολογία Αντιστάσεων ΙI (αντιστάσεις σε παράλληλη σύνδεση) Σκοπός
ΑΣΚΗΣΗ 6 Συνδεσμολογία Αντιστάσεων ΙI (αντιστάσεις σε παράλληλη σύνδεση) Σκοπός Σκοπός της άσκησης αυτής είναι ο σπουδαστής να μπορέσει να σχεδιάζει κύκλωμα αντιστάσεων σε παράλληλη σύνδεση και να μετράει
Σχεδίαση & Ανάλυση Αλγορίθμων
Σχεδίαση & Ανάλυση Αλγορίθμων Ενότητα 3 Αλγόριθμοι Επιλογής Σταύρος Δ. Νικολόπουλος Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros Αλγόριθμοι Επιλογής Γνωρίζουμε
Συνδυαστικά Λογικά Κυκλώματα
Συνδυαστικά Λογικά Κυκλώματα Ένα συνδυαστικό λογικό κύκλωμα συντίθεται από λογικές πύλες, δέχεται εισόδους και παράγει μία ή περισσότερες εξόδους. Στα συνδυαστικά λογικά κυκλώματα οι έξοδοι σε κάθε χρονική
Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)
Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός
ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson
ΘΕΜΑ : Αλγόριθμος Ford-Fulkerson Α Να εξετάσετε αν ισχύει η συνθήκη συντήρησης της αρχικής ροής στο δίκτυο. Β Με χρήση του αλγορίθμου Ford-Fulkerson να βρεθεί η μέγιστη ροή που μπορεί να σταλεί από τον
Δασική Γενετική Εισαγωγή: Βασικές έννοιες
Δασική Γενετική Εισαγωγή: Βασικές έννοιες Χειμερινό εξάμηνο 2014-2015 Γενετική Πειραματική επιστήμη της κληρονομικότητας Προέκυψε από την ανάγκη κατανόησης της κληρονόμησης οικονομικά σημαντικών χαρακτηριστικών
ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β
ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 10 ΣΕΠΤΕΜΒΡΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:
Περιληπτικά, τα βήματα που ακολουθούμε γενικά είναι τα εξής:
Αυτό που πρέπει να θυμόμαστε, για να μη στεναχωριόμαστε, είναι πως τόσο στις εξισώσεις, όσο και στις ανισώσεις 1ου βαθμού, που θέλουμε να λύσουμε, ακολουθούμε ακριβώς τα ίδια βήματα! Εκεί που πρεπει να
ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1
ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΣΥΝΑΡΤΗΣΕΙΣ Η έννοια της συνάρτησης είναι θεμελιώδης στο λογισμό και διαπερνά όλους τους μαθηματικούς κλάδους. Για το φοιτητή είναι σημαντικό να κατανοήσει πλήρως αυτή
ΠΕΡΙΕΧΟΜΕΝΑ. Μονοδιάστατοι πίνακες Πότε πρέπει να χρησιμοποιούνται πίνακες Πολυδιάστατοι πίνακες Τυπικές επεξεργασίες πινάκων
ΠΕΡΙΕΧΟΜΕΝΑ Μονοδιάστατοι πίνακες Πότε πρέπει να χρησιμοποιούνται πίνακες Πολυδιάστατοι πίνακες Τυπικές επεξεργασίες πινάκων Εισαγωγή Η χρήση των μεταβλητών με δείκτες στην άλγεβρα είναι ένας ιδιαίτερα
Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο
Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ
ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε
Εφαρμοσμένα Μαθηματικά ΙΙ
Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας Εφαρμοσμένα Μαθηματικά ΙΙ Γραμμικά Συστήματα Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD Γραμμικό Σύστημα a11x1 + a12x2 + + a1 nxn = b1 a x + a x + +