ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ & ΥΠΟΛΟΓΙΣΤΩΝ Μέθοδοι Στοίχισης Ακολουθιών Σύγκριση Αλγορίθµων Στοίχισης Ακολουθιών σε τεχνητά ϐιολογικά δεδοµένα ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ της Χριστίνας Καπουρκατσίδου Επιβλέπων: Αναστάσιος Ντελόπουλος Επίκουρος Καθηγητής Θεσσαλονίκη, Νοέµβριος 2007

2 Abstract Multiple sequence alignment is undoubtedly the most common task in the field of Bioinformatics. It is an essential tool for discovering functional, structural and evolutionary information in biological sequences. Even in recent years, it remains challenging the generation of algorithms and software programs that ensure high quality alignments in reasonable time. In this study we tested six of the most frequently used protein alignment programs and compared their results based on synthetically generated sequences with known alignment. These protein sequences were generated randomly via the theory of Hidden Markov models in order to simulate the real evolutionary procedure. The results of our study indicate that the use of consistency based algorithms prove to be more effective in producing high quality and biologically sensible alignments. 1

3 Περιεχόµενα Abstract 1 1 Εισαγωγή 4 2 Στοίχιση ακολουθιών (Sequence Alignment) Γενικά Πρωτεϊνικές ακολουθίες Πίνακες Αντικατάστασης (Substitution Matrices) Πίνακες PAM Gap probabilities and gap penalties Gap penalties Gap probabilities Γεννήτρια ακολουθιών Κατασκευή γεννήτριας Επιλογή Παραµέτρων Παραδείγµατα Αλγόριθµος Needleman Wunch Περιγραφή αλγορίθµου Επιλογή ποινών Μέθοδοι στοίχισης ακολουθιών Προοδευτικοί αλγόριθµοι Ακριβείς αλγόριθµοι Επαναληπτικοί Αλγόριθµοι Consistency based Algorithms

4 5.5 Περιγραφή Προγραµµάτων CLUSTAL W T Coffee ProbCons (Probabilistic Consistency based) DiAlign SAGA Muscle Σύγκριση µεθόδων Μέτρο Σύγκρισης Περιγραφή πειραµάτων Πείραµα 1: Αντιστοίχιση ποινών και πινάκων αντικατάστασης Πείραµα 2: Εύρεση του καταλληλότερου πίνακα PAM για τη στοίχιση ακολουθιών Πείραµα 3: Στοίχιση τεσσάρων ακολουθιών µε τον αλγόριθµο του Needleman Wunch Πείραµα 4: Παρουσία ξένης ακολουθίας σε µία οµάδα ακολουθιών µε κοινό πρόγονο Πείραµα 5: Σύγκριση στοιχίσεων ακολουθιών χρησιµοποιώντας τον αλγόριθµο του Needleman Wunch και τα υπόλοιπα προγράµµατα Πείραµα 6: Σύγκριση στοιχίσεων ακολουθιών που προκύπτουν από κάθε πρόγραµµα Πείραµα 7: Παρουσία ξένων ακολουθιών σε µία οµάδα ακολουθιών µε κοινό πρόγονο Πείραµα 8: Πολλαπλασιασµός των πιθανοτήτων εξάλειψης και προσθήκης αµινοξέων κατά την κατασκευή των dataset Πείραµα 9: Οµάδες συγγενικών ακολουθιών µε διαφορετική εξελικτική απόσταση από τον κοινό πρόγονο Συµπεράσµατα

5 Κεφάλαιο 1 Εισαγωγή Ο όγκος των σηµερινών δεδοµένων που παράγονται στο χώρο της Μοριακής Βιολογίας και πρέπει να αναλυθούν και να επεξεργαστούν καθίστα απαραίτητη τη συνεργασία, σε πολλούς τοµείς, µε την επιστήµη της Πληροφορικής. των πεδίων ονοµάζεται Βιοπληροφορική (Bioinformatics). Ο χώρος της ένωσης αυτών Η Βιοπληροφορική λοιπόν µπορεί να οριστεί ως το επιστηµονικό πεδίο το οποίο ασχολείται µε την ανάπτυξη και την εφαρµογή υπολογιστικών τεχνικών για τη συλλογή και διαχείριση ϐιολογικών δεδοµένων καθώς και τη χρήση τους στην πρόβλεψη και προσοµοίωση ϐιολογικών διεργασιών. Η δηµιουργία εξειδικευµένων ϐιολογικών ϐάσεων δεδοµένων, η ανάπτυξη εργαλείων πρόβλεψης της δοµής γονιδίων και πρωτεϊνών, η ϕυλογενετική ανάλυση και η σύνδεση µε κλινικά δεδοµένα είναι µερικοί από τους τοµείς τους οποίους καλύπτει. Αντικείµενο της παρούσας εργασίας είναι η πολλαπλή στοίχιση ακολουθιών (multiple sequence alignment) σε ελεγχόµενης παραγωγής πρωτεϊνικά δεδοµένα, η οποία αποτελεί σηµαντικό πεδίο έρευνας της επιστήµης της Βιοπληροφορικής. Το πεδίο αυτό της έρευνας αναπτύχθηκε µε στόχο τη στοίχιση ακολουθιών νουκλεϊκών οξέων ή πρωτεϊνών. Η στοίχιση ακολουθιών είναι η διαδικασία σύγκρισης δύο (pairwise alignment) ή περισσοτέρων (multiple alignment) ακολουθιών η οποία αναζητά χαρακτήρες που εµφανίζονται µε την ίδια σειρά στις συγκρινόµενες ακολουθίες. Είναι πολύ σηµαντικό η στοίχιση να είναι όσο το δυνατόν η ϐέλτιστη προκειµένου να εξαχθούν συµπεράσµατα για τη δοµή, τη λειτουργικότητα και την εξέλιξη των ϐιολογικών ακολουθιών. Μία από τις πρώτες µεθόδους που εφαρµόστηκε και η οποία µπορεί να δώσει, µε την επιλογή των κατάλληλων παραµέτρων µία ϐέλτιστη µαθηµατικά στοίχιση είναι η εφαρµογή του δυναµικού προγραµµατισµού. Συγκεκριµένα αναπτύχθηκαν δύο 4

6 αλγόριθµοι οι οποίοι ϐασίζονται στη λογική του δυναµικού προγραµµατισµού. Ο αλγόριθµος του Needleman Wunsch [1] για ολική στοίχιση (global alignment) και ο αλγόριθµος του Smith Waterman [2] για τοπική στοίχιση (local alignment). Παρόλα αυτά στις µέρες µας δεν χρησιµοποιούνται καθώς για την εφαρµογή των αλγορίθµων αυτών απαιτείται ένας τεράστιος αριθµός υπολογισµών γεγονός που καθιστά αδύνατη την ευρεία χρήση τους. Κρίθηκε λοιπόν αναγκαία η εύρεση άλλων υπολογιστικών µεθόδων που ϑα µπορούσαν να επεξεργάζονται ένα µεγάλο πλήθος ακολουθιών και παράλληλα να δίνουν ένα ικανοποιητικό αποτέλεσµα. Για το λόγο αυτό πολλοί επιστήµονες έχουν επικεντρώσει την έρευνά τους στην εύρεση πιο λειτουργικών αλγορίθµων. Οι αλγόριθµοι που έχουν προταθεί τα τελευταία χρόνια ϑα µπορούσαν να διακριθούν στις εξής κατηγορίες [3]: Προοδευτικοί αλγόριθµοι (Progressive Algorithms) [4]: Η διαδικασία ξεκινάει µε τη στοίχιση δύο ακολουθιών και σταδιακά ενσωµατώνονται και οι υπόλοιπες. Ακριβείς αλγόριθµοι (Exact Algorithms): Στηρίζονται στον αλγόριθµο του δυναµικού προγραµµατισµού προσπαθώντας να περιορίσουν τα ϐήµατα του. Επαναληπτικοί αλγόριθµοι (Iterative Algorithms): Μέσω της διαδικασίας της επανάληψης επιδιώκεται η ϐελτιστοποίηση µιας αρχικής στοίχισης. Στην παρούσα εργασία πραγµατοποιήθηκε µία σύγκριση µεταξύ των πιο ευρέως χρησιµοποιούµενων αλγορίθµων προκειµένου να ελεγχθεί η ακρίβεια των αποτελεσµάτων τους. Η εφαρµογή των προγραµµάτων που τους υλοποιούν έγινε σ ένα δείγµα τεχνητών ακολουθιών πρωτεϊνών, και όχι σε πλήθος πραγµατικών ακολουθιών, πληθώρα των οποίων είναι διαθέσιµες στις γενετικές ϐάσεις δεδοµένων. Η επιλογή αυτή οφείλεται στο γεγονός ότι µε τον τρόπο αυτό δίνεται η δυνατότητα ελέγχου της διαδικασίας παραγωγής των ακολουθιών. Επιπλέον είναι γνωστός εκ των προτέρων ο µηχανισµός παραγωγής των ακολουθιών και κατ επέκταση η ϐέλτιστη στοίχισή τους. Η κατασκευή της γεννήτριας έγινε µε τέτοιο τρόπο, ώστε οι παραγόµενες ακολουθίες να ακολουθούν όσο πιο πιστά γίνεται το πραγµατικό µοντέλο εξέλιξης. Με ϐάση αυτές τις στοιχίσεις συγκρίθηκαν οι διάφορες µέθοδοι και ϑεωρήθηκε πιο αποτελεσµατική η µέθοδος που τις προσέγγισε µε µεγαλύτερη ακρίβεια. Τα προγράµµατα µε τα οποία στοιχήθηκαν οι ακολουθίες είναι τα εξής: Clustalw, T Coffee, Muscle, SAGA, DiAlign, ProbCons. Επίσης συµπεριλήφθηκε στα πειράµατα 5

7 και ο αλγόριθµος του Needleman Wunsch, όπου οι διαστάσεις των πειραµάτων (µήκος, αριθµός ακολουθιών) δεν καθιστούν απαγορευτική τη χρήση του. 6

8 Κεφάλαιο 2 Στοίχιση ακολουθιών (Sequence Alignment) 2.1 Γενικά Η στοίχιση ακολουθιών είναι η διαδικασία σύγκρισης δύο ή περισσοτέρων ακολουθιών η οποία αναζητά χαρακτήρες που εµφανίζονται µε την ίδια σειρά στις συγκρινόµενες ακολουθίες. Ο λόγος για τον οποίο πραγµατοποιείται η στοίχιση ακολουθιών είναι η εξαγωγή συµπερασµάτων για τη δοµή, τη λειτουργικότητα και την εξέλιξη των ϐιολογικών ακολουθιών. Πιο συγκεκριµένα η οµοιότητα µεταξύ των ακολουθιών µπορεί να συνεπάγεται την ίδια λειτουργία ή τον ίδιο ϱυθµιστικό ϱόλο, στην περίπτωση των ακολουθιών νουκλεϊκών οξέων, και την ίδια ϐιοχηµική λειτουργία ή την ίδια τριτοταγή δοµή, στην περίπτωση των πρωτεϊνών. Οταν οι συγκρινόµενες ακολουθίες προέρχονται από διαφορετικούς οργανισµούς η ενδεχόµενη οµοιότητα τους οδηγεί στο συµπέρασµα της κοινής καταγωγής τους, ενώ ο ϐαθµός οµοιότητάς τους καθορίζει τη ϑέση τους στο αντίστοιχο ϕυλογενετικό δέντρο [5]. Ετσι λοιπόν µε τη διαδικασία της στοίχισης επιδιώκεται η εύρεση των ϑεµελιωδών αλλαγών που συνέβησαν κατά τη διάρκεια της απόκλισης από το κοινό προγονικό µόριο. Οι αλλαγές αυτές µπορούν να χαρακτηριστούν ως αντικαταστάσεις (substitutions), προσθήκες (inserts) και εξαλείψεις (deletes). Στην ιδανική περίπτωση κατά την οποία µία στοίχιση απεικονίζει πραγµατικά την εξελικτική ιστορία δύο ακολουθιών, τα κατάλοιπα (residues) που έχουν στοιχιθεί αλλά δεν είναι ταυτόσηµα, αντιπροσωπεύουν τις αντικαταστάσεις. Οι περιοχές όπου τα κατάλοιπα µιας ακολουθίας δεν έχουν στοιχιθεί µε κατάλοιπα της άλλης ερµηνεύονται είτε ως 7

9 προσθήκη στη µία ακολουθία είτε ως εξάλειψη στην άλλη και εµφανίζονται ως κενά (gaps). Αυτά τα κενά παρουσιάζονται συνηθέστερα στις στοιχίσεις ως διαδοχικές παύλες στοιχισµένες µε τους υπόλοιπους χαρακτήρες (Σχήµα 2.1). G-G--GF-DAAKFSTS G-GSTGVR---K-S-S GAGSTGVRDTAK--TS Σχήµα 2.1: Πολλαπλή στοίχιση ακολουθιών. Η απόφαση για το αν ϑα ϑεωρηθούν δύο χαρακτήρες ταυτόσηµοι ή παρόµοιοι, ή για το αν ϑα πρέπει να τοποθετηθεί ένα κενό σε κάποια ϑέση λαµβάνεται µε τη ϐοήθεια µιας µαθηµατικής συνάρτησης η οποία ονοµάζεται αντικειµενική συνάρτηση (objective function, OF). Ουσιαστικά η συνάρτηση αυτή καθορίζει τον τρόπο µε τον οποίο ϑα πραγµατοποιηθεί η στοίχιση. Ορίζεται µε τέτοιο τρόπο ώστε να ενσωµατώνει πληροφορίες για τις ακολουθίες, δηλαδή στοιχεία που αφορούν τη δοµή τους, τη λειτουργία τους και κυρίως την εξελικτική τους ιστορία [3]. Η επιλογή µιας τέτοιας συνάρτησης έχει ως σκοπό µια ϐέλτιστη στοίχιση από µαθηµατικής πλευράς να ανταποκρίνεται σε µια ϐέλτιστη στοίχιση από ϐιολογικής πλευράς. Στην πραγµατικότητα είναι δύσκολο να ενσωµατώσει όλες τις παραπάνω πληροφορίες και περιορίζεται σε στοιχεία που αφορούν την οµοιότητα της πρωτοταγούς δοµής των ακολουθιών. Η πιο συνηθισµένη συνάρτηση ακολουθεί το µοντέλο σύµφωνα µε το οποίο σε κάθε Ϲεύγος καταλοίπων, ανάλογα µε την οµοιότητα τους, αποδίδεται µία τιµή ενώ στα κενά µία ποινή. Στο τέλος της στοίχισης αθροίζοντας όλες τις τιµές προκύπτει το συνολικό σκορ της στοίχισης. Οι τιµές που ϑα αποδοθούν σε κάθε Ϲεύγος είναι ενδεικτικές της συχνότητας µετάλλαξης των καταλοίπων. Ετσι σε συχνά παρατηρούµενες µεταλλάξεις αποδίδονται ϑετικές τιµές ενώ στις µεταλλάξεις που δεν συµβαίνουν συχνά αποδίδονται αρνητικές τιµές. Οι πίνακες αντικατάστασης (substitution matrices) είναι αυτοί οι οποίοι περιέχουν αυτές τις τιµές. Η στοίχιση µπορεί να είναι τοπική ή ολική. Στην περίπτωση της τοπικής, η στοίχιση εκτείνεται µόνο στις περιοχές στις οποίες ο ϐαθµός οµοιότητας είναι µεγάλος αγνοώντας τις υπόλοιπες περιοχές. Αντίθετα αν η στοίχιση είναι ολική εκτείνεται σ όλο το µήκος των ακολουθιών προκειµένου να ϐρεθούν όσο το δυνατόν περισσότεροι ταυτόσηµοι ή όµοιοι χαρακτήρες (Σχήµα 2.2). Μπορεί να πραγµατοποιηθεί είτε σε δύο ακολουθίες είτε σε µία οµάδα ακολουθιών. 8

10 Ολική(Global) FGK-GKG FGKFGKG Τοπική(Local) ---FGKGKG FGKFGKG-- Σχήµα 2.2: Παράδειγµα ολικής και τοπικής στοίχισης 2.2 Πρωτεϊνικές ακολουθίες Οι πρωτεΐνες είναι οργανικά µόρια αποτελούµενα από αµινοξέα. διαφορετικών αµινοξέων που απαντώνται στα κύτταρα είναι είκοσι. Ο αριθµός των Κάθε πρωτείνη είναι µία αλληλουχία πολλών διαφορετικών αµινοξέων. Για λόγους ευκολίας έχει υιοθετηθεί ένα σύστηµα αναπαράστασης των αµινοξέων αυτών σύµφωνα µε το οποίο µε κάθε αµινοξύ αντιστοιχίζεται ένας διαφορετικός χαρακτήρας όπως ϕαίνεται στον πίνακα 2.1. Υιοθετώντας το σύστηµα αυτό κάθε πρωτεϊνική ακολουθία αναπαριστάται από µία αλληλουχία χαρακτήρων. A Alanine G Glycine P Proline R Arginine H Histidine S Serine N Asparagine I Isoleucine T Threonine D Aspartic acid L Leucine W Tryptophan C Cystine K Lysine Y Tyrosine Q Glutamine M Methionine V Valine E Glutamic acid F Phenylalanine Πίνακας 2.1: Αντιστοίχιση αµινοξέων και χαρακτήρων. Κατά τη διαδικασία της εξέλιξης τα πρωτεϊνικά µόρια διαφοροποιούνται λόγω πιθανών εξαλείψεων, προσθηκών αλλά και µεταλλάξεων των αµινοξέων. Οι πρωτεΐνες που προκύπτουν µέσω της διαδικασίας αυτής συνδέονται εξελικτικά µε τις αρχικές πρωτεΐνες στις οποίες συνέβησαν οι µεταλλάξεις. Η εξελικτική απόσταση των ακολουθιών αυτών ορίζεται ως ο αριθµός των αλλαγών που πραγµατοποιήθηκαν για να προκύψει η τελική ακολουθία. Μία συχνά χρησιµοποιούµενη µονάδα για τον προσδιορισµό των εξελικτικών αποστάσεων αποτελεί η µονάδα PAM. Η εξελικτική απόσταση ενός PAM περιγράφει την εξέλιξη που ϑα αλλάξει κατά µέσο όρο το 1% των αµινοξέων µιας πρωτεϊνικής ακολουθίας. Βέβαια η εξελικτική απόσταση PAM δεν ερµηνεύεται ως το ποσοστό των διαφορετικών αµινοξέων στις δύο ακολουθίες καθώς είναι δυνατόν να συµβεί µετάλλαξη στην ίδια ϑέση της αρχικής ακολουθίας όχι µόνο µία ϕορά αλλά περισσότερες. Από τις µελέτες των 9

11 ακολουθιών έχει προκύψει µία αντιστοίχηση ανάµεσα στις εξελικτικές αποστάσεις και στην παρατηρούµενη ποσοστιαία διαφορά των αντίστοιχων ακολουθιών (πίνακας2.2). Απόσταση PAM Ποσοστιαία ιαφορά % Απόσταση PAM Ποσοστιαία ιαφορά % Πίνακας 2.2: Αντιστοίχιση εξελικτικών αποστάσεων και παρατηρούµενων ποσοστιαίων διαφορών στις ακολουθίες. 2.3 Πίνακες Αντικατάστασης (Substitution Matrices) Οπως αναφέρθηκε και παραπάνω απαραίτητο εργαλείο στη στοίχιση ακολουθιών είναι οι πίνακες αντικατάστασης. Ουσιαστικά οι πίνακες αυτοί παρέχουν πληροφορίες σχετικά µε τους ϱυθµούς αντικατάστασης των αµινοξέων και των νουκλεϊκών οξέων. Στην περίπτωση των νουκλεϊκών οξέων η χρήση απλών πινάκων αντικατάστασης είναι συνήθως η πιο αποτελεσµατική. Ετσι ο πίνακας του Σχήµατος 2.3 ϑα µπορούσε να χρησιµοποιηθεί ως πίνακας αντικατάστασης για την στοίχιση ακολουθιών νουκλεϊκών οξέων. S sa, a sa, c sa, g sa, t / 2 1 sc, a sc, c sc, g s c, t / 2 = s g, a s g, c s g, g s = g, t 1 / s 1 1 / t, a st, c st, g s t, t Σχήµα 2.3: Πίνακας αντικατάστασης νουκλεϊκών οξέων. Βέβαια στην περίπτωση των πρωτεϊνών τα πράγµατα δεν είναι τόσο απλά. Μερικές αντικαταστάσεις αµινοξέων είναι πολύ πιο συχνές από κάποιες άλλες εξαιτίας παρόµοιων χηµικών ιδιοτήτων των αµινοξέων αυτών. Είναι προφανές λοιπόν ότι δεν µπορεί να προκύψει ένας πίνακας αντικατάστασης µε απλό τρόπο όπως στην περίπτωση των νουκλεϊκών οξέων αλλά απαιτείται µία πιο εκτενής µελέτη. Μέσω των µελετών αυτών διαπιστώθηκε ότι είναι συχνό ϕαινόµενο η αντικατάσταση αµινοξέων από κάποια άλλα σε συγγενικές ακολουθίες διαφορετικών ειδών λόγω της 10

12 εξέλιξης των πρωτεϊνών στο χρόνο. Οι αντικαταστάσεις αυτές σε πολλές πεϱιπτώσεις δεν επηρεάζουν την λειτουργικότητα και τη δοµή των πρωτεϊνών γι αυτό και ονοµάζονται αποδεκτές µεταλλάξεις (accepted mutations). Οι πίνακες αντικατάστασης δηµιουργήθηκαν µε ϐάση τις συχνότητες εµφάνισης των αµινοξέων στις ακολουθίες και τις σχέσεις οµοιότητας που έχουν µεταξύ τους τα είκοσι αµινοξικά κατάλοιπα που συνθέτουν τις πρωτεΐνες. Με τη χρήση λοιπόν ενός πιθανοθεωρητικού µοντέλου που ϑα λαµβάνει υπόψη και τη ϕύση του ϐιολογικού προβλήµατος που ϑέλουµε να επιλυθεί µπορεί να δηµιουργηθεί ένας κατάλληλος πίνακας αντικατάστασης. Ο πίνακας αυτός ϑα είναι συµµετρικός και κάθε στήλη και γραµµή του ϑα αντιστοιχεί σε έναν από τους αµινοξικούς τύπους. Προφανώς σε κάθε γραµµή η µέγιστη τιµή ϑα ϐρίσκεται στο κελί της κύριας διαγωνίου αφού είναι λογικό να περιµένουµε στη στοίχιση να συνεισφέρει περισσότερο το ταίριασµα ταυτόσηµων χαρακτήρων. Οπως έχει αποδειχτεί [6] οποιοσδήποτε πίνακας αντικατάστασης (ακόµα και εµπειρικός) είναι δυνατόν να αναπαρασταθεί µε τη γενική µορφή S i,j = log( pi,j q i ), δηλαδή ενός πίνακα λογαρίθµων σχετικών συχνοτήτων αντικατάστασης. Η παράµετρος p ij, εκφράζει τη συχνότητα αντικατάστασης του καταλοίπου j από το i ενώ η παράµετρος q i εκφράζει τη συχνότητα εµφάνισης των αντίστοιχων καταλοίπων. Ο παραπάνω τύπος προκύπτει κατά τον υπολογισµό του score ευθυγράµµισης δύο ακολουθιών r 1 = b 1 b 2...b n και r 2 = a 1 a 2...a n. Ως συνολικό score S υιοθετείται ο λόγος της πιθανοφάνειας των δύο παρακάτω εναλλακτικών υποθέσεων: H 1 : οι r 1 και r 2 σχετίζονται εξελικτικά δηλαδή η ευθυγράµµιση τους προέκυψε ϐάσει κάποιου εξελικτικού µοντέλου H 2 : οι r 1 και r 2 δεν σχετίζονται εξελικτικά δηλαδή η ευθυγράµµιση τους προέκυψε κατά τύχη. Οι ακολουθίες αυτές στοιχίζονται χωρίς να παρεµβάλλονται κενά. Η πιθανότητα να ισχύει η πρώτη υπόθεση (H 1 ) είναι: P H1 = n q bi p ai,bi (2.1) i=1 Ενώ η πιθανότητα να ισχύει η δεύτερη υπόθεση (H 2 ) είναι: n n P H2 = ( q ai )( q bi ) = i=1 i=1 n q ai q bi (2.2) i=1 όπου q bi : πιθανότητα εµφάνισης του αµινοξέος b i στην ακολουθία r 1 11

13 q ai : πιθανότητα εµφάνισης του αµινοξέος a i στην ακολουθία r 2 p ai,b i : πιθανότητα αντικατάστασης του b i από το a i Το συνολικό σκορ της ευθυγράµµισης των ακολουθιών r 1 και r 2 προκύπτει ως, S = P n H 1 i=1 = q b i p ai,bi n p ai,b n P H2 i=1 q = i a i q bi Λογαριθµίζοντας την ποσότητα αυτή το σκορ παίρνει την παρακάτω µορφή n S = log 10 S p ai,b n = log 10 ( i ) = log q 10 ( p n a i,b i ) = S ai,bi ai q ai i=1 όπου για οποιοδήποτε Ϲεύγος αµινοξέων a και b i=1 S a,b = log 10 ( p a,b q a ) Ετσι λοιπόν υπολογίζοντας το σκορ για όλα τα δυνατά Ϲεύγη αµινοξέων µπορεί να προκύψει ο πίνακας αντικατάστασης. Οι πιο γνωστοί πίνακες οι οποίοι έχουν προκύψει έπειτα από µελέτες πρωτεϊνικών i=1 q ai i=1 ακολουθιών είναι οι πίνακες PAM, BLOSUM [7] και οι πίνακες GONNET [8]. Στην παρούσα εργασία οι πίνακες PAM επελέγησαν ως ϐάση για την κατασκευή γεννήτριας ακολουθιών αλλά και στοίχισης των ακολουθιών αυτών χρησιµοποιώντας τον αλγόριθµο Needleman Wunsch. Γι αυτό το λόγο ϑεωρείται απαραίτητη µία σύντοµη περιγραφή της διαδικασίας µέσα από την οποία προέκυψαν οι πίνακες αυτοί Πίνακες PAM Πρώτη η Margaret Dayhoff [9] το 1978 ασχολήθηκε µε τις αντικαταστάσεις αµινοξέων σε συγγενικές ακολουθίες και δηµιούργησε τους πίνακες αντικατάστασης της οικογένειας PAM µε ϐάση ένα µαρκοβιανό µοντέλο εξέλιξης. Σύµφωνα µε το µοντέλο αυτό οι παρατηρούµενες πρωτεϊνικές ακολουθίες είναι αποτέλεσµα των Αποδεκτών Σηµειακών Μεταλλάξεων (Point Accepted Mutations) στις προγονικές ακολουθίες. Ως αποδεκτή σηµειακή µετάλλαξη σε µία πρωτεΐνη ϑεωρείται η αντικατάσταση ενός καταλοίπου της µε ένα κατάλοιπο διαφορετικού τύπου, η οποία έχει γίνει αποδεκτή µέσω της διαδικασίας της ϕυσικής επιλογής. Οι µεταλλάξεις που συµβαίνουν σε µία συγκεκριµένη ϑέση µιας ακολουθίας πραγµατοποιούνται µε τέτοιο τρόπο ώστε να είναι ανεξάρτητες από τις πιθανές προηγούµενες µεταλλάξεις αλλά και από τη ϑέση του αµινοξέος στην ακολουθία. Συγκεκριµένα η Dayhoff µελέτησε 1572 αλλαγές σε 71 οµάδες πρωτεϊνικών ακολουθιών οι οποίες ήταν όµοιες τουλάχιστον κατά 85%. Υπολόγισε τα εξής στοιχεία: 12

14 τις κανονικοποιηµένες συχνότητες των αµινοξέων f i, δηλαδή τις πιθανότητες εµφάνισής τους στις ακολουθίες (Σχήµα 2.4) το συνολικό αριθµό των αποδεκτών µεταλλάξεων µεταξύ όλων των αµινοξέων A ij τη µεταλλαξιµότητα των αµινοξέων, δηλαδή τον αριθµό των αντικαταστάσεων του κάθε αµινοξέος ανά εκατό αµινοξέα m i Normalized Frequences of the Amino Acids in the Accepted Point Mutation Data Gly Arg Ala Asn Leu Phe Lys Gln Ser Ile Val His Thr Cys Pro Tyr Glu Met Asp Trp Σχήµα 2.4: Κανονικοποιηµένες συχνότητες αµινοξέων κατά Dayhoff. Χρησιµοποιώντας τα παραπάνω στοιχεία δηµιούργησε τον πίνακα µετάλλαξης M τα στοιχεία του οποίου εκφράζουν την πιθανότητα αντικατάστασης ενός αµινοξέος από κάποιο άλλο (Σχήµα 2.5). M i,j = P r (amino acid j amino acid i) Τα στοιχεία του πίνακα M υπολογίστηκαν µε ϐάση τους ακόλουθους τύπους: για i j M ij = λm ja ij i A ij και για i = j M ii = 1 λm i Η παράµετρος λ καθορίζεται από την επιθυµητή εξελικτική απόσταση. Ο πίνακας M υπολογίστηκε για εξελικτική απόσταση ενός PAM και περιγράφει την εξέλιξη που ϑα αλλάξει κατά µέσο όρο το 1% των αµινοξέων. Σε µαθηµατικό ορισµό αυτό εκφράζεται ως εξής: 20 i=1 f i (1 M ii ) =

15 Λόγω της ανεξαρτησίας των µεταλλάξεων που περιγράψαµε παραπάνω µπορούν να υπολογιστούν οι πιθανότητες µετάλλαξης και για µεγαλύτερες αποστάσεις υψώνοντας τον πίνακα M στην δύναµη n όπου το n εκφράζει την εξελικτική απόσταση σε µονάδες PAM. Για τις τιµές του πίνακα M ισχύει ότι: f i M ji = f j M ij (2.3) δηλαδή η πιθανότητα να αντικατασταθεί το i από το j είναι ίση µε την πιθανότητα να αντικατασταθεί το j από το i γεγονός που οδηγεί σε ένα συµµετρικό πίνακα αντικατάστασης. Οι πίνακες µετάλλαξης µπορούν πολύ εύκολα να µετατραπούν σε πίνακες λογαρίθµων (log odds matrix) ώστε να προκύψουν οι Ϲητούµενοι πίνακες αντικατάστασης. Ο πίνακας PAM n προκύπτει από τον τύπο: P ij = 10 log 10 ( (Mn ) ij f i ) (2.4) Ο πιο συχνά χρησιµοποιούµενος πίνακας στη στοίχιση ακολουθιών είναι ο PAM250 (Σχήµα 2.6). Η µονάδα η οποία χρησιµοποιείται για να εκφραστεί το σκορ της στοίχισης ακολουθιών είναι το bit. Συνήθως οι πίνακες PAM( ) εκφράζονται σε µονάδες του log 10 που αντιστοιχεί σε 1/3 bit ενώ οι πίνακες PAM(10-160) υπολογίζονται σε κλίµακα 1/2 bit. Κάθε ϕορά ανάλογα µε το ποιος πίνακας χρησιµοποιείται, το συνολικό σκορ της στοίχισης πρέπει να πολλαπλασιάζεται µε τον κατάλληλο παράγοντα για να εκφραστεί σε bit. 2.4 Gap probabilities and gap penalties Gap penalties Η χρήση ποινών για την εισαγωγή κενών κατά τη διάρκεια της στοίχισης είναι απαραίτητη προκειµένου η τελική στοίχιση να προσεγγίζει όσο το δυνατόν περισσότερο τη διαδικασία εξέλιξης των ακολουθιών. Η κατάλληλη επιλογή της ποινής είναι καθοριστικής σηµασίας καθώς µικρές κατ απόλυτη τιµή ποινές 1 ποινών έχουν ως αποτέλεσµα την εµφάνιση πολλών κενών στις στοιχίσεις, ενώ αντίθετα η επιλογή (απολύτως) µεγάλων 1 Ολες οι ποινές είναι αρνητικοί αριθµοί. Στην προκειµένη περίπτωση αναφερόµαστε στις απόλυτες τιµές τους. 14

16 τιµών µπορεί να οδηγήσει σε µια παράλογη στοίχιση χωρίς καθόλου κενά. Το αν ϑα χαρακτηριστεί η τιµή µιας ποινής ως µεγάλη ή ως µικρή εξαρτάται κυρίως από τον πίνακα αντικατάστασης που ϑα χρησιµοποιηθεί στη στοίχιση. Για παράδειγµα µία τιµή η οποία ϑεωρείται µικρή όταν χρησιµοποιείται σε συνδυασµό µε τον πίνακα PAM10, µπορεί να ϑεωρηθεί µεγάλη αν χρησιµοποιηθεί σε συνδυασµό µε τον πίνακα PAM250. Ετσι η επιλογή των τιµών για τις ποινές πρέπει να γίνεται λαµβάνοντας υπόψη τον αντίστοιχο πίνακα αντικατάστασης. Κατά καιρούς έχουν γίνει διάφορες µελέτες και έχουν προταθεί ποινές για συγκεκριµένους πίνακες αντικατάστασης οι οποίες πολλές ϕορές διαφέρουν αρκετά µεταξύ τους. Η πιο συχνά χρησιµοποιούµενη συνάρτηση κόστους είναι αυτή σύµφωνα µε την οποία αποδίδεται µία ποινή για το πρώτο κενό που δηµιουργείται ( gap opening penalty/gop) και µία µικρότερη τιµή για την επέκταση της συγκεκριµένης περιοχής των κενών ( gap extension penalty/gep). Η συνάρτηση κόστους έχει τη γενική µορφή: gap(k) = gop + (k 1)gep όπου k ο αριθµός των κενών που ϑα εµφανιστούν gop το κόστος για την εισαγωγή του πρώτου κενού gep το κόστος για την επέκταση της περιοχής των κενών µ ένα επιπλέον κενό Το Ϲητούµενο είναι ο υπολογισµός αυτών των παραµέτρων. Οι παράµετροι αυτοί ϑα µπορούσαν να υπολογιστούν µε τρόπο παρόµοιο µε αυτόν που υπολογίστηκαν και τα σκορ για την αντικατάσταση ενός αµινοξέος από κάποιο άλλο. Βέβαια η χρήση µιας τέτοιας µεθόδου προϋποθέτει τη γνώση των πιθανοτήτων των εξαλείψεων και των προσθηκών αµινοξέων κατά τη γέννηση της πρωτεϊνικής ακολουθίας από την προγονική της προκειµένου να υπολογιστεί η πιθανότητα εµφάνισης k συνεχόµενων κενών (P(k)). Οι εκθετικές συναρτήσεις ϑεωρούνται κατάλληλες ώστε να περιγράψουν την πιθανότητα εµφάνισης ενός κενού µήκους k στις στοιχισµένες ακολουθίες [6]. Η αντίστοιχη πιθανότητα εκφράζεται από τη σχέση 2.5. P(k) = P indel (1 P indel_extend )P k 1 indel_extend (2.5) όπου P indel η πιθανότητα µίας προσθήκης ή µίας εξάλειψης αµινοξέος 15

17 P indel_extend η πιθανότητα µίας επιπλέον προσθήκης η εξάλειψης αµινοξέος Οι τιµές για τις παραµέτρους gop και gep της συνάρτησης κόστους µπορούν να συνδεθούν µε την πιθανότητα εµφάνισης k κενών µέσω της σχέσης (2.6). gap(k) = gop + (k 1)gep = 10 log 10 P(k) (2.6) Gap probabilities Παρόλο που η Dayhoff πραγµατοποίησε µια εκτενή µελέτη όσον αφορά τις αντικαταστάσεις αµινοξέων στις πρωτεϊνικές ακολουθίες, δεν ασχολήθηκε καθόλου µε τις προσθήκες και τις εξαλείψεις αµινοξέων. Το 1992 ο Gonnet [10] ερεύνησε τις πιθανότητες εµφάνισης κενών στις ακολουθίες που προέρχονται είτε από εξαλείψεις είτε από προσθήκες αµινοξέων. Πραγµατοποίησε τη µελέτη του σε µία γενετική ϐάση πρωτεϊνικών ακολουθιών προσπαθώντας να στοιχίσει όσο το δυνατόν περισσότερες ακολουθίες. Αρχικά πραγµατοποίησε τις στοιχίσεις χρησιµοποιώντας τους πίνακες PAM και συγκεκριµένες ποινές για τα κενά. Οι ακολουθίες οι οποίες αποδείχτηκε ότι µοιάζουν αρκετά στοιχήθηκαν ξανά µε τη χρήση του δυναµικού προγραµµατισµού. Από τις τελικές αυτές στοιχίσεις δηµιούργησε ένα καινούριο ϐαθµολογικό σύστηµα και επανέλαβε τις στοιχίσεις προκειµένου να τις ϐελτιστοποιήσει ακόµα περισσότερο. Εχοντας αυτές τις τελικές στοιχίσεις µελέτησε τις συχνότητες εµφάνισης κενών στις ακολουθίες αλλά και τις εξελικτικές αποστάσεις των αντίστοιχων ακολουθιών. Τα συµπεράσµατα της µελέτης αυτής οδήγησαν στη διαπίστωση ότι η πιθανότητα εµφάνισης κενών αυξάνεται όσο αυξάνεται η εξελικτική απόσταση, αλλά και ότι η πιθανότητα επέκτασης ενός κενού δεν εξαρτάται από αυτήν. Ετσι ο Gonnet κατέληξε στον τύπο (2.7) ο οποίος συνδέει την πιθανότητα εµφάνισης ενός κενού µε την εξελικτική απόσταση. Ο τύπος αυτός δεν µπορεί να εφαρµοστεί για όλες τις αποστάσεις PAM παρά µόνο για σχετικά µικρές αποστάσεις. P indel = e PAMdistance (2.7) 16

18 PAM 1 mutation matrix ΠΙΘΑΝΟΤΗΤΕΣ ΜΕΤΑΛΛΑΞΗΣ ΑΜΙΝΟΞΕΩΝ (πολλαπλασιασµένες µε 10 4 ) Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val A R N D C Q E G H I L K M F P S T W Y V A R N D C Q E G H I L K M F P S T W Y V [ : : ] Σχήµα 2.5: Πίνακας πιθανοτήτων µεταλλάξεων για εξελικτική απόσταση 1 PAM. PAM 250 MATRIX A R N D C Q E G H I L K M F P S T W Y V A R N D C Q E G H I L K M F P S T W Y V Σχήµα 2.6: Πίνακας αντικατάστασης PAM

19 Κεφάλαιο 3 Γεννήτρια ακολουθιών Οι ακολουθίες οι οποίες αποτέλεσαν το σύνολο δεδοµένων (dataset) για την πραγµατοποίηση των διάφορων πειραµάτων κατασκευάστηκαν µε τη ϐοήθεια µιας γεννήτριας. Η επιλογή κατασκευής τεχνητών ακολουθιών οφείλεται στο γεγονός ότι µ αυτό τον τρόπο υπάρχει η δυνατότητα επιλογής του επιθυµητού dataset. Ανά πάσα στιγµή µπορεί να τροποποιηθεί το dataset προκειµένου να προσαρµοστεί στις απαιτήσεις του κάθε πειράµατος. Το µήκος και ο αριθµός των ακολουθιών, οι µεταξύ τους αποστάσεις, οι πιθανότητες εξαλείψεων και προσθηκών καταλοίπων κατά την παραγωγή των ακολουθιών είναι µερικές από τις παραµέτρους οι οποίες µπορούν να τροποποιηθούν. Εξάλλου στο χώρο της Βιοπληροφορικής όλες οι µέθοδοι εφαρµόζονται αρχικά σε τεχνητά δεδοµένα και έπειτα σε πραγµατικά. Ενα ακόµα µεγάλο πλεονέκτηµα που προσφέρει η χρήση της γεννήτριας είναι η γνώση της ϐέλτιστης, από ϐιολογικής πλευράς, στοίχισης των ακολουθιών. Μπορεί κάποιες από τις µεθόδους που έχουν προταθεί να πραγµατοποιούν µία ϐέλτιστη στοίχιση από µαθηµατικής πλευράς, όµως αυτό δε συνεπάγεται ότι είναι ϐέλτιστη και από ϐιολογικής πλευράς. Ετσι καµιά από τις υπάρχουσες µεθόδους δεν ϑα µπορούσε να πραγµατοποιήσει µία στοίχιση η οποία ϑα µπορούσε να αποτελέσει το µέτρο σύγκρισης για τις υπόλοιπες συγκρινόµενες µεθόδους. Στις επόµενες ενότητες ϑα περιγραφεί αναλυτικά η κατασκευή της γεννήτριας µε ιδιαίτερη έµφαση στην επιλογή των παραµέτρων στην περίπτωση παραγωγής ακολουθιών πρωτεϊνών, καθώς αποτέλεσαν το αντικείµενο της συγκεκριµένης µελέτης. 18

20 3.1 Κατασκευή γεννήτριας Η κατασκευή της γεννήτριας έγινε µε τέτοιο τρόπο έτσι ώστε οι παραγόµενες ακολουθίες να ακολουθούν όσο πιο πιστά γίνεται το πραγµατικό µοντέλο εξέλιξης. Για το λόγο αυτό κύριος πυρήνας για την κατασκευή της αποτέλεσε ένα µαρκοβιανό µοντέλο εξέλιξης, το οποίο µπορεί να προσεγγίσει αρκετά την κατ εκτίµηση πραγµατική εξελικτική διαδικασία. Συγκεκριµένα η κατασκευή της έγινε ϐάσει της ϑεωρίας των hidden markov models [11]. Σε µία αρχική ακολουθία, η οποία αποτελεί τον κοινό πρόγονο των παραγόµενων ακολουθιών, εφαρµόζεται το µοντέλο markov του Σχήµατος 3.1. P(i i i i ) i0 i1 i2 P(b i 0 ) P(i P(m i i i ) i m i+1 ) P(m BEGIN m1 i m i+1 ) P(b m 1 ) P(m i d i+1 ) P(b d 1 ) P(d i m i+1 ) d1 P(d i d i+1 ) m2 m3 d2 d3 Ακολουθία: a1 a2 a3 BEGIN: αρχή ακολουθίας m i : match state d i : delete state i i : insert state END: τέλος ακολουθίας END P(d i m i+1 )=1-P(d i d i+1 ) P(i i m i+1 ) =1-P(i i i i ) P(m i m i+1 )+ P(m i i i )+ P(m i d i+1 )=1 P(b d 1 )=P(m i d i+1 ) P(b m 1 )= P(m i m i+1 ) P(b i 0 )= P(m i i i ) Σχήµα 3.1: Hidden Markov Model. Σύµφωνα µε το µοντέλο αυτό σε κάθε ϑέση της αρχικής ακολουθίας µπορούν να συµβούν τρία διαφορετικά γεγονότα προκείµενου να παραχθεί η δεύτερη ακολουθία. Το γεγονός που συµβαίνει κάθε ϕορά εξαρτάται από τις πιθανότητες που έχουν αποδοθεί σ αυτά και έχουν διαµορφώσει το µοντέλο της γεννήτριας. Τα πιθανά γεγονότα είναι τα εξής: Match state: Στην περίπτωση αυτή στην ακολουθία απόγονο εµφανίζεται είτε το στοιχείο που υπήρχε στην αντίστοιχη ϑέση στην πρώτη ακολουθία είτε κάποιο άλλο, το οποίο ουσιαστικά αντικαθιστά το πρώτο. Το στοιχείο που ϑα εµφανιστεί εξαρτάται από τις πιθανότητες αντικατάστασης του αρχικού στοιχείου από τα υπόλοιπα στοιχεία. Delete State: Ουσιαστικά το γεγονός αυτό αντιπροσωπεύει τις εξαλείψεις στοιχείων που συµβαίνουν κατά τη διάρκεια της εξελικτικής διαδικασίας. Αποτέλεσµα αυτού του 19

21 γεγονότος είναι η εµφάνιση ενός κενού στην παραγόµενη ακολουθία. Αφού συµβεί µία διαγραφή στοιχείου, συµφώνα µε το µοντέλο markov υπάρχει πιθανότητα να επαναληφθεί το ίδιο γεγονός και εντέλει να επεκταθεί η περιοχή των κενών στην παραγόµενη ακολουθία. Insert State: Ακολουθείται η ίδια διαδικασία µε το delete state µόνο που αυτή τη ϕορά πραγµατοποιείται η προσθήκη ενός στοιχείου. Και σ αυτή την περίπτωση µπορεί να επαναληφθεί το ίδιο γεγονός προκειµένου να επεκταθεί η περιοχή των εισαγόµενων στοιχείων. Το στοιχείο που εισάγεται κάθε ϕορά καθορίζεται από τις πιθανότητες εισαγωγής των στοιχείων P inserti που ορίζει το µοντέλο της γεννήτριας. Η διαδικασία παραγωγής της ακολουθίας τερµατίζεται όταν το µοντέλο εφαρµοστεί και στο τελευταίο στοιχείο της αρχικής ακολουθίας. Επειτα µπορεί να επαναληφθεί η ίδια διαδικασία για να παραχθεί µια ακόµα ακολουθία η οποία ϑα έχει κοινό πρόγονο µε την προηγούµενη. Το µήκος και η σύσταση της αρχικής ακολουθίας (ακολουθίες νουκλεϊκών οξέων και αµινοξέων), ο αριθµός των παραγόµενων ακολουθιών, η απόσταση των ακολουθιών αυτών από τον πρόγονο τους, και όλες οι παραπάνω πιθανότητες που αναφέρθηκαν οι οποίες είναι απαραίτητες για την κατασκευή του µοντέλου, ορίζονται ανάλογα µε τις απαιτήσεις της κάθε περίπτωσης. 3.2 Επιλογή Παραµέτρων Για την υλοποίηση των διάφορων πειραµάτων επιλέχτηκαν ακολουθίες πρωτεϊνών. Οι αρχικές ακολουθίες, οι οποίες αποτέλεσαν τους προγόνους ϐάσει των οποίων κατασκευάστηκαν όλες οι υπόλοιπες, δηµιουργήθηκαν µε τυχαίο τρόπο έτσι ώστε οι συχνότητες εµφάνισης αµινοξέων σ αυτές να συµβαδίζουν µε τις πιθανότητες εµφάνισης των αµινοξέων όπως καταγράφονται στον πίνακα του σχήµατος 2.4. Το µήκος της αρχικής ακολουθίας αλλά και ο αριθµός των παραγόµενων ακολουθιών είναι παράµετροι που ορίζονται σύµφωνα µε τις απαιτήσεις του κάθε πειράµατος. Η επιλογή των πιθανοτήτων P(m i d i+1 ), P(m i m i+1 ), P(m i i i ) (ϐλ. σχήµα 3.1), γίνεται λαµβάνοντας υπόψη την επιθυµητή εξελικτική απόσταση των δύο ακολουθιών. Είναι προφανές ότι οι πιθανότητες να συµβούν τα γεγονότα delete και insert όταν παράγεται µία ακολουθία η οποία δεν απέχει πολύ από την προγονική της είναι πολύ µικρότερες απ όταν παράγεται µία ακολουθία η οποία απέχει αρκετά από την προγονική. 20

22 Εξάλλου όπως αναφέρθηκε και στην παράγραφο έχει αποδειχτεί ότι οι προσθήκες και οι εξαλείψεις αµινοξικών καταλοίπων ενθαρρύνονται όσο µεγαλώνει η εξελικτική απόσταση. Στην συγκεκριµένη περίπτωση ϑεωρήθηκε ότι P(m i d i+1 )=P(m i i i ). Προκειµένου να επιλεγούν οι κατάλληλες τιµές γι αυτές τις πιθανότητες έγινε χρήση του ορισµού της πιθανότητας P indel της σχέσης 2.7. Θεωρητικά η εµφάνιση κενών στην προγονική ακολουθία οφείλεται σε πιθανές προσθήκες αµινοξέων στην παραγόµενη ακολουθία και αντίστοιχα η εµφάνιση κενών στην παραγόµενη ακολουθία οφείλεται σε εξαλείψεις αµινοξέων στην προγονική. Ετσι η πιθανότητα εµφάνισης ενός κενού κατά τη στοίχιση στην προγονική ακολουθία είναι P(m i i i ) = P indel /2 ενώ στην παραγόµενη είναι P(m i d i+1 ) = P indel /2. Εννοείται ϕυσικά ότι η πιθανότητα για τη µετάβαση σε match state προκύπτει ως, P(m i m i+1 ) = 1 P(m i d i+1 ) P(m i i i ) Οσον αφορά στις πιθανότητες P(d i d i+1 ) και P(i i i i+1 ) ϑεωρήθηκαν και αυτές ίσες µεταξύ τους και αντιπροσωπεύουν την πιθανότητα επέκτασης µιας περιοχής κενών, δηλαδή την πιθανότητα P indel_extend. Επειδή η P indel_extend δεν εξαρτάται από την εξελικτική απόσταση η τιµή των P(d i d i+1 ) και P(i i i i ) διατηρήθηκε σταθερή και ίση µε P(d i d i+1 ) = P(i i i i ) = 0.3 Η ϐασική παράµετρος η οποία καθορίζει την εξελικτική απόσταση της παραγόµενης ακολουθίας από την αρχική είναι η πιθανότητα αντικατάστασης ενός αµινοξέος από κάποιο άλλο, στην περίπτωση ενός match state. Οι πιθανότητες αυτές προκύπτουν από τον πίνακα M του σχήµατος 2.5 υψώνοντάς τον στην κατάλληλη δύναµη ανάλογα µε την επιθυµητή εξελικτική απόσταση. Ετσι για απόσταση 250 µονάδων PAM ο Ϲητούµενος πίνακας είναι ο πίνακας M 250. Σε περίπτωση που οι παραγόµενες ακολουθίες είναι δύο ή περισσότερες, η απόσταση τους από την αρχική ϑα είναι 250 µονάδες PAM αλλά η µεταξύ τους απόσταση ϑα είναι 500 µονάδες PAM. Το συµπέρασµα αυτό προκύπτει αν υπολογίσουµε την πιθανότητα δυο ακολουθίες i και j να έχουν προέλθει από την ίδια ακολουθία x. Κάνοντας χρήση των σχέσεων 2.1 και 2.3 και λαµβάνοντας υπόψη το γεγονός ότι οι µεταλλάξεις που συµβαίνουν σε µια συγκεκριµένη ϑέση µιας ακολουθίας είναι ανεξάρτητες από πιθανές προηγούµενες µεταλλάξεις, υπολογίζεται η παραπάνω 21

23 πιθανότητα [12]. P(i and j descended from x) = x f x P(x i)p(x j) = x f x (M n ) ix (M n ) xj = x f j (M n ) ix (M n ) jx = f j (M 2n ) ij = f i (M 2n ) ji όπου n η εξελικτική απόσταση της παραγόµενης από την αρχική ακολουθία. Από τη σχέση f j (M 2n ) ij = f i (M 2n ) ji προκύπτει ότι οι πιθανότητες να αντικατασταθούν τα αµινοξέα της ακολουθίας i από τα αµινοξέα της ακολουθίας j και αντίστροφα λαµβάνονται από τον πίνακα M 2n. Οπως αναφέρθηκε παραπάνω ο πίνακας M t που χρησιµοποιεί το µοντέλο της γεννήτριας καθορίζει την εξελικτική απόσταση της παραγόµενης από την προγονική ακολουθία. Συγκεκριµένα η δύναµη στην οποία υψώνεται αντιστοιχεί στην απόσταση αυτή. Εποµένως η απόσταση των ακολουθιών i και j είναι 2n. Σ όλα τα πειράµατα που πραγµατοποιήθηκαν η προγονική ακολουθία αποκλειόταν από το dataset προκειµένου να είναι εφικτή η δηµιουργία µιας οικογένειας ακολουθιών στην οποία όλες οι ακολουθίες απέχουν ίσες αποστάσεις. Τέλος ϑεωρήθηκε ότι η προσθήκη κάποιου αµινοξέος σε περίπτωση ενός insert state είναι ισοπίθανη για όλα τα αµινοξέα δηλαδή P inserti = 1/ Παραδείγµατα Ακολουθούν κάποια παραδείγµατα τετράδων ακολουθιών, οι οποίες κατασκευάστηκαν µε πρόγονο την ακολουθία του Σχήµατος 3.2. Επίσης παρατίθεται και η ϐέλτιστη στοίχιση τους όπως προέκυψε από τη διαδικασία παραγωγής τους. 'SLPSVHESLCNDYTDGNSATEIYYGAVPIAECLTVKNKILHVAADLRTLL' Σχήµα 3.2: Αρχική ακολουθία. 22

24 'SLPSVHESLCSDYTDGNSATEILYGAVPIAEALTVKTKTLHVSADDLRTLL' 'SLPSVHESLCDDYADGCAAEIYYGAAPLAICLTIKNNIVLVAADLRANL' 'SLPSVHDSLAEEVTDGSSATECFYGALSIAECLTVKNKILRVAADLRTML' 'QLPSGHEKLCNDYTSGNSSTSPYYGALPIAECATYDNKILHVAADLHPLF' Σχήµα 3.3: Απόσταση ακολουθιών 40 PAM units. 'SLPSVHESLCSDYTDGNSATEILYGAVPIAEALTVKTKTLHVSADDLRTLL' 'SLPSVHESLCDDYADG-CAAEIYYGAAPLAICLTIKNNIVLVAA-DLRANL' 'SLPSVHDSLAEEVTDGSSATECFYGALSIAECLTVKNKILRVAA-DLRTML' 'QLPSGHEKLCNDYTSGNSSTSPYYGALPIAECATYDNKILHVAA-DLHPLF' Σχήµα 3.4: Βέλτιστη στοίχιση. 'SLPSVHESLCDNYSGGSQATELYYGAVPIAECLEVNSKKLHVAAALRTLL' 'VYLPEVNDTLCGDYSDGTSATEIYFAPVPIHDCLCVKNNILHASAGLRVLL' 'SLPTIHNDLCFNNYTDGNTVNKIYYEVVVKADCLTVNNKVLHVEVDLRWSLL' 'CLSSVHEALPADPAEGTTAEQLYYGAIPISNCNTVKERVLNVAALHLLL' Σχήµα 3.5: Απόσταση ακολουθιών 100 PAM units. 'S-LPSVHESLC-DNYSGGSQATELYYGAVPIAECLEVNSKKLHVAAALR-TLL' 'VYLPEVNDTLC-GDYSDGTSATEIYFAPVPIHDCLCVKNNILHASAGLR-VLL' 'S-LPTIHNDLCFNNYTDGNTVNKIYYEVVVKADCLTVNNKVLHVEVDLRWSLL' 'C-LSSVHEALP-ADPAEGTTAEQLYYGAIPISNCNTVKERVLNV-AALH-LLL' Σχήµα 3.6: Βέλτιστη στοίχιση. 'ALANVSAVAVSNFSEKSSATPLYFDVVPLVICLSEKDNKISVQANLCTLL' 'EVSGVHGAYINDYVEASDASKTVYSVPVGDCVRTDKGRLLTAESDVATNL' 'KPASQVEVAKSYAEGDTNVDIYYLDVHVAEVESASARPSSLQVKHDLKMHL' 'TVTTVHCQLCAPYTGPELLSEVEILGPGNECVSAFGALHHEDTTKSLL' Σχήµα 3.7: Απόσταση ακολουθιών 250 PAM units. 'ALANVSAVAVSNFSEKSSATPLYFDVV--PL--VICL-SEKDNKISVQANLCTLL' 'EVSGVHGAYINDYVEASDASKTVYS-V--PV--GDCVRTDKGRLLTAESDVATNL' 'K-PASQVEVAKSYAEGDTNVDIYYLDV--HVAEVESA-SARPSSLQVKHDLKMHL' 'TVTTVHCQLCAPYTGPELLSEV---EILGPG--NECV-SA-FGALHHEDTTKSLL' Σχήµα 3.8: Βέλτιστη στοίχιση. 23

25 Κεφάλαιο 4 Αλγόριθµος Needleman Wunsch 4.1 Περιγραφή αλγορίθµου Ο αλγόριθµος του Needleman Wunsch ϐασίζεται στη λογική του δυναµικού προγραµµατισµού. Σύµφωνα µε τον αλγόριθµο εκτιµώνται όλες οι πιθανές στοιχίσεις µεταξύ του συνόλου των ακολουθιών και εντέλει επιλέγεται η στοίχιση που σηµειώνει το µεγαλύτερο σκορ. Στην περίπτωση στοίχισης δύο ακολουθιών συµπληρώνεται ένας πίνακας S διάστασης (M + 1)(N + 1) όπου M και N τα µήκη των δύο ακολουθιών. Κάθε στοιχείο του πίνακα υπολογίζεται λαµβάνοντας υπόψη τις τιµές των ήδη υπολογισµένων στοιχείων (σχήµα 4.1). Συγκεκριµένα ο πίνακας S συµπληρώνεται σύµφωνα µε τον αλγόριθµο 1. Algorithm 1: Αλγόριθµος του Needleman Wunsch. (1) S[0, 0] 0 (2) for j 1 to N (3) S[0, j] S[0, j 1] + s(, b j ) (4) for i 1 to M (5) S[i, 0] S[i 1, 0] + s(a i, ) (6) for j 1 to N (7) Horizontal S[i, j 1] + s(, b j ) (8) Vertical S[i 1, j] + s(a i, ) (9) Diagonal S[i 1, j 1] + s(a i, b j ) (10) S[i, j] max{horizontal, Vertical, Diagonal} 24

26 Οι ποσότητες s(a i, ) και s(, b j ) εκφράζουν τις ποινές που αποδίδονται σε κάθε κενό. Συγκεκριµένα, αν στην προηγούµενη ϑέση (ϐάσει της οποίας ϑα υπολογιστεί το σκορ) υπάρχει κενό, τα s(a i, ) και s(, b j ) παίρνουν την τιµή gep ενώ σε αντίθετη περίπτωση παίρνουν την τιµή gop (ϐλ. εξίσωση 2.6). Η ποσότητα s(a i, b j ) λαµβάνεται από τον πίνακα αντικατάστασης. Προκείµενου να υπολογιστεί η ϐέλτιστη στοίχιση πρέπει να ϐρεθεί η αντίστοιχη διαδροµή που συνδέει το πρώτο στοιχείο του πίνακα µε το τελευταίο. Για το λόγο αυτό, ξεκινώντας από το τελευταίο στοιχείο του πίνακα επαναλαµβάνονται οι ίδιοι υπολογισµοί ώστε να ϐρεθεί η ϑέση από την οποία έγινε η µετάβαση. Η αντίστοιχη διαδικασία περιγράφεται από τον αλγόριθµο 2. Algorithm 2: Traceback. (1) i M, j N, r 1 (2) while i 0 and j 0 (3) Horizontal S[i, j 1] + s(, b j ) (4) Vertical S[i 1, j] + s(a i, ) (5) Diagonal S[i 1, j 1] + s(a i, b j ) (6) k max{horizontal, Vertical, Diagonal} (7) if k==horizontal (8) i i, j j 1 (9) else if k==vertical (10) i i 1, j j (11) else if k==diagonal (12) i i 1, j j 1 (13) Traceback[r] [i, j] (14) r r + 1 Ο αλγόριθµος αυτός µπορεί να επεκταθεί και σε περισσότερες διαστάσεις όταν στοιχίζονται περισσότερες από δύο ακολουθίες. Σ αυτήν την περίπτωση είναι εξαιρετικά επίπονη η εφαρµογή του καθώς απαιτείται ένας τεράστιος αριθµός υπολογισµών. Ο πίνακας ο οποίος συµπληρώνεται είναι πολυδιάστατος (ανάλογα µε τον αριθµό των ακολουθιών). Για τη συµπλήρωση κάθε ϑέσης του επιλέγεται η µέγιστη τιµή µεταξύ 2 m 1 διαφορετικών τιµών όπου m το πλήθος των ακολουθιών. Οι τιµές αυτές υπολογίζονται 25

27 ϐάσει της σχέσης S new = S previous + m 1 i=1 j=i+1 m s(w i, v j ) όπου S previous η τιµή της προηγούµενης ϑέσης ϐάσει της οποίας ϑα υπολογιστεί η τιµή του καινούριου στοιχείου. Από το σύνολο των τιµών S new που υπολογίστηκαν επιλέγεται η µέγιστη τιµή και µ αυτήν συµπληρώνεται η αντίστοιχη ϑέση του πίνακα. Οι w i και v j αναφέρονται είτε στα κατάλοιπα των αντίστοιχων ακολουθιών είτε στην εµφάνιση κενών στις αντίστοιχες ακολουθίες ανάλογα µε την επιλογή της προηγούµενης ϑέσης κάθε ϕορά. Οι υπολογισµοί επαναλαµβάνονται για όλους τους δυνατούς συνδυασµούς (2 m 1). Στα Ϲεύγη s(, ) αποδίδεται η τιµή µηδέν. Για παράδειγµα στην περίπτωση στοίχισης τριών ακολουθιών συµπληρώνεται ένας πίνακας διάστασης (K + 1)(L + 1)(N + 1). Σε κάθε ϑέση επιλέγεται η µέγιστη τιµή µεταξύ εφτά διαφορετικών τιµών όπως ϕαίνεται στον αλγόριθµο (3). Algorithm 3: Επέκταση αλγορίθµου σε τρείς διαστάσεις. (1) αρχικοποίηση πίνακα (2) for i 1 to K (3) for j 1 to L (4) for h 1 to N (5) S pr1 S[i 1, j 1, h 1] + s(a i, b j ) + s(a i, c h ) + s(b j, c h ) (6) S pr2 S[i 1, j 1, h] + s(a i, b j ) + s(a i, ) + s(b j, ) (7) S pr3 S[i 1, j, h 1] + s(a i, ) + s(a i, c h ) + s(, c h ) (8) S pr4 S[i, j 1, h 1] + s(, b j ) + s(, c h ) + s(b j, c h ) (9) S pr5 S[i 1, j, h] + s(a i, ) + s(a i, ) + s(, ) (10) S pr6 S[i, j 1, h] + s(, b j ) + s(, ) + s(b j, ) (11) S pr7 S[i, j, h 1] + s(, ) + s(, c h ) + s(, c h ) (12) S[i, j, h] max{s pr1, S pr2, S pr3, S pr4, S pr5, S pr6, S pr7, } Οταν συµπληρωθεί ολόκληρος ο πίνακας αναζητείται η διαδροµή η οποία οδηγεί στη ϐέλτιστη στοίχιση όπως στην περίπτωση των δύο διαστάσεων. Η πολυπλοκότητα του αλγορίθµου είναι O(N m ) όπου Ν το µήκος της µεγαλύτερης ακολουθίας και m το πλήθος των ακολουθιών. Ουσιαστικά αυτό που επιτυγχάνει ο αλγόριθµος είναι η εύρεση της ϐέλτιστης µαθηµατικά στοίχισης µε δεδοµένη µία συγκεκριµέµη objective function. 26

28 λήρωση πίνακα κατά την εφαρµογή του αλγορίθµου S(i-1,j-1) S(i,j-1) s(a i,b j ) s(-,b j ) S(i-1,j) s(a i,-) S(i,j) Περίπτωση 2 ακολουθιών Περίπτωση 3 ακολουθιών Σχήµα 4.1: Συπλήρωση πίνακα κατά την εφαρµογή του αλγορίθµου Needleman Wunsch 4.2 Επιλογή ποινών. Η τελική στοίχιση εξαρτάται από τον πίνακα αντικατάστασης αλλά και τις αντίστοιχες ποινές που χρησιµοποιούνται. Η επιλογή ποινών έγινε ϐάσει των πιθανοτήτων εισαγωγής και διαγραφής καταλοίπων που ορίζει το µοντέλο της γεννήτριας. Εστω ότι η a είναι η αρχική προγονική ακολουθία ϐάσει της οποίας κατασκευάζεται η ακολουθία b µε εξελικτική απόσταση m (ενότητα 3.1). Σε περίπτωση που στοιχιθούν οι ακολουθίες a και b οι πιθανότητες εµφάνισης k συνεχόµενων κενών δηλαδή οι πιθανότητες P a (k)=p r (εµφάνιση k συνεχόµενων κενών στην a κατά τη στοίχιση µε τη b) P b (k)=p r (εµφάνιση k συνεχόµενων κενών στην b κατά τη στοίχιση µε τη a) προκύπτουν ϐάσει των πιθανοτήτων της ενότητας 3.2 ως, P a (k) = P(m i i i )P k 1 (i i i i )(1 P(i i i i )) P b (k) = P(m i d i+1 )P k 1 (d i+1 d i+2 )(1 P(d i+1 d i+2 )) ηλαδή η εµφάνιση κενών στην προγονική ακολουθία κατά τη διαδικασία της στοίχισης οφείλεται στις εισαγωγές καταλοίπων στην ακολουθία απόγονο (κατά τη διαδικασία παραγωγής), ενώ η εµφάνιση κενών στην ακολουθία απόγονο οφείλεται στις διαγραφές καταλοίπων στην ακολουθία αυτή. Ανατρέχοντας στην ενότητα 3.2 και στον τρόπο µε τον οποίο ορίστηκαν οι διάφορες πιθανότητες του µοντέλου της γεννήτριας οι πιθανότητες P a (k) και P b (k) απλοποιούνται 27

29 στην παρακάτω µορφή: P a (k) = P b (k) = P start P k 1 cont (1 P cont ) όπου οι πιθανότητες P start και P cont έχουν οριστεί για λόγους ευκολίας ϐάσει των αντίστοιχων πιθανοτήτων της ενότητας 3.2 ως, P start = P(m i d i+1 ) = P(m i i i ) P cont = P(d i d i+1 ) = P(i i i i ) Η πιθανότητα P start έχει υπολογιστεί για εξελικτική απόσταση m όση δηλαδή και η απόσταση της κάθε ακολουθίας από την προγονική της. Προφανώς οι ποινές gop και gep υπολογίζονται ϐάσει της πιθανότητας P(k): P(k)=P r (πιθανότητα εµφάνισης k συνεχόµενων κενών στη στοίχιση των a και b) η οποία υπολογίζεται ως, P(k) = P a (k) + P b (k) = 2P start P k 1 cont (1 P cont ) Οι ποινές που χρησιµοποιούνται σε συνδυασµό µε τον πίνακα αντικατάστασης PAM m υπολογίζονται µέσω της σχέσης 2.6 δηλαδή, gap(k) = 10 log 10 2P start P k 1 cont (1 P cont ) = 10 log 10 2P start (1 P cont ) + (k 1)10 log 10 P cont Οι ποινές gop και gep παίρνουν αντίστοιχα τις τιµές: gop = 10 log 10 2P start (1 P cont ) gep = 10 log 10 P cont 28

30 Κεφάλαιο 5 Μέθοδοι στοίχισης ακολουθιών Οπως αναφέρθηκε και παραπάνω οι αλγόριθµοι που έχουν προταθεί για τη στοίχιση ακολουθιών ϑα µπορούσαν να διακριθούν σε τρεις κατηγορίες: Προοδευτικοί αλγόριθµοι, Ακριβείς αλγόριθµοι και Επαναληπτικοί αλγόριθµοι. Στις επόµενες ενότητες γίνεται µία σύντοµη περιγραφή τους προκειµένου να γίνει πιο κατανοητή η λειτουργία των διαφόρων προγραµµάτων που χρησιµοποιήθηκαν. Επιπλέον γίνεται αναφορά στους Βασισµένους στη συνέπεια αλγορίθµους ( Consistency based algorithms) οι οποίοι δεν αποτελούν µία ξεχωριστή κατηγορία αλλά αφορούν κυρίως στις objective functions που χρησιµοποιούνται στις στοιχίσεις των ακολουθιών [3]. 5.1 Προοδευτικοί αλγόριθµοι Οι προοδευτικές µέθοδοι είναι οι πιο ευρέως χρησιµοποιούµενες µέθοδοι για τη στοίχιση ακολουθιών. Αρχικά στοιχίζονται όλα τα δυνατά Ϲεύγη των ακολουθιών. Βάσει των στοιχίσεων αυτών υπολογίζονται οι αποστάσεις µεταξύ των ακολουθιών και κατασκεύαζεται το αντίστοιχο ϕυλογενετικό δέντρο. Η διαδικασία της τελικής στοίχισης ξεκινάει µε τη στοίχιση των δύο πιο κοντινών ακολουθιών όπως προκύπτει από το ϕυλογενετικό δέντρο. Στο επόµενο ϐήµα µπορεί να πραγµατοποιηθεί στοίχιση ανάµεσα σε δύο νέες ακολουθίες ή ανάµεσα σε δύο οµάδες ήδη στοιχισµένων ακολουθιών (profiles) ή ανάµεσα σε µία ακολουθία και σ ένα πλήθος ήδη στοιχισµένων ακολουθιών 29

31 Η διαδικασία αυτή συνεχίζεται µέχρι να επιτευχθεί η στοίχιση όλων των ακολουθιών. Η σειρά µε την οποία µία ακολουθία προστίθεται στην πολλαπλή στοίχιση καθορίζεται από τη ϑέση της στο ϕυλογενετικό δέντρο. Καθώς εξελίσσεται η διαδικασία ενσωµάτωσης των καινούριων ακολουθιών οι ήδη υπάρχουσες στοιχίσεις παραµένουν ανεπηρέαστες. Οι µέθοδοι αυτοί δίνουν το πλεονέκτηµα στοίχισης πολλών και µεγάλου µήκους ακολουθιών σε πολύ λίγο χρόνο και χωρίς ιδιαίτερες απαιτήσεις σε µνήµη. Ενα µειονέκτηµα είναι ότι τα λάθη που πραγµατοποιούνται στις αρχικές στοιχίσεις δεν µπορούν να διορθωθούν και επηρεάζουν και την τελική στοίχιση. 5.2 Ακριβείς αλγόριθµοι Οι αλγόριθµοι αυτοί ϐασίζονται στον αλγόριθµο του Needleman Wunsch γι αυτό και χαρακτηρίζονται ως ακριβείς. Παρόλο που δεν πραγµατοποιείται εξαντλητική αναζήτηση σ όλο το χώρο, όπως ορίζει η µέθοδος του δυναµικού προγραµµατισµού, επιλέγονται κάποια όρια που περιορίζουν τον υπάρχοντα χώρο προκειµένου να πραγµατοποιηθεί εξαντλητική αναζήτηση στον καινούριο περιορισµένο χώρο. Ουσιαστικά επιχειρείται ο περιορισµός των ϐηµάτων ώστε να µειωθεί η απαίτηση σε µνήµη και συγχρόνως να επιτευχθεί µία όσο το δυνατόν ϐέλτιστη στοίχιση. Οι Carillo και Lipman [13] πρότειναν έναν τέτοιο αλγόριθµο ο οποίος όµως δεν εγγυάται πάντα το ϐέλτιστο µαθηµατικά αποτέλεσµα. Γεγονός είναι ότι οι απαιτήσεις σε µνήµη παραµένουν υψηλές και δεν µπορούν να ανταποκριθούν σε στοιχίσεις πολλών και µεγάλου µήκους ακολουθιών. 5.3 Επαναληπτικοί Αλγόριθµοι Η ϐασική λογική των επαναληπτικών αλγορίθµων είναι ότι η λύση σ ένα πρόβληµα µπορεί να ϐρεθεί αν τροποποιηθεί µια ήδη υπάρχουσα λύση η οποία δεν είναι και η καλύτερη δυνατή. Κάθε ϐήµα τροποποίησης πραγµατοποιείται µε µία επανάληψη. Μπορούν να διακριθούν σε δύο κατηγορίες. Μη στοχατικοί επαναληπτικοί αλγόριθµοι Στην περίπτωση αυτή κύριος στόχος είναι η ϐελτίωση των στοιχίσεων και η διόρθωση των λαθών που εµφανίζονται στις στοιχίσεις που πραγµατοποιήθηκαν µε κάποιο προοδευτικό αλγόριθµο. Για το λόγο αυτό επαναλαµβάνονται οι στοιχίσεις των 30

32 ακολουθιών, χρησιµοποιώντας συνήθως κάποιον αλγόριθµο που ϐασίζεται στη λογική του δυναµικού προγραµµατισµού, µέχρι να επιτευχθεί ένα αποτέλεσµα το οποίο δεν µπορεί να ϐελτιστοποιηθεί περισσότερο. Στοχαστικοί επαναληπτικοί αλγόριθµοι Οι αλγόριθµοι της κατηγορίας αυτής ϐασίζονται στη λογική των γενετικών αλγορίθµων. Εχουν προταθεί διάφοροι αλγόριθµοι που όλοι όµως ακολουθούν την ίδια διαδικασία. Η στοίχιση τροποποιείται πολλές ϕορές κατά τυχαίο τρόπο µέχρι να ϐρεθεί κάποιο σηµείο σύγκλισης ή ικανοποιηθεί κάποιο κριτήριο. 5.4 Consistency based Algorithms Η ϐασική λογική των αλγορίθµων αυτών είναι ότι η ϐέλτιστη πολλαπλή στοίχιση των ακολουθιών είναι αυτή η οποία είναι περισσότερο συµβατή µ όλες τις ϐέλτιστες στοιχίσεις ανά Ϲεύγη των συγκεκριµένων ακολουθιών [3]. Η κύρια διαφορά τους από τους υπόλοιπους δεν αφορά στη µέθοδο µε την οποία πραγµατοποιείται η στοίχιση αλλά στην objective function που χρησιµοποιείται κατά τη διάρκεια της στοίχισης. Οι αλγόριθµοι αυτοί επιχειρούν µια διαφορετική προσέγγιση και επιδιώκουν τη δηµιουργία consistency based objective functions. Με τη χρήση των συναρτήσεων αυτών οι τελικές στοιχίσεις δε ϐασίζονται στους γνωστούς πίνακες αντικατάστασης αλλά σε ϐιβλιοθήκες που δηµιουργήθηκαν ύστερα από µελέτη των στοιχίσεων κατά Ϲεύγη των αρχικών ακολουθιών. Ετσι το σκορ που ϑα αποδοθεί σ ένα Ϲεύγος αµινοξέων δε καθορίζεται από την ίδια τη ϕύση των αµινοξέων (όπως ϑα συνέβαινε µε τη χρήση πινάκων αντικατάστασης), άλλα από τη ϑέση τους στις συγκεκριµένες ακολουθίες (position specific scoring systems). Κάθε ϕόρα ανάλογα µε το µηχανισµό που προτείνει η κάθε συνάρτηση µελετώνται στοιχεία για τα αµινοξέα των συγκεκριµένων ακολουθιών και προκύπτει ένα καινούριο ϐαθµολογικό σύστηµα ϐάσει του οποίου πραγµατοποιείται η στοίχιση. 31

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΕΙΣΑΓΩΓΗ Ένας από τους πρωταρχικούς στόχους της σύγκρισης των ακολουθιών δύο µακροµορίων είναι η εκτίµηση της οµοιότητάς τους και η εξαγωγή συµπερασµάτων

Διαβάστε περισσότερα

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής.  Στοίχιση αλληλουχιών Στοίχιση αλληλουχιών Σύνοψη Καθολική στοίχιση Μήτρες βαθμολόγησης Τοπική στοίχιση Στοίχιση με ποινές εισαγωγής κενών Από την LCS στη στοίχιση: αλλαγές στη βαθμολόγηση Το πρόβλημα της Μεγαλύτερης Κοινής

Διαβάστε περισσότερα

LALING/PLALING :

LALING/PLALING : 1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Ομολογία Σελίδα 2 Ομολογία Ομολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός διπλασιασμός

Διαβάστε περισσότερα

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων Φυλογένεση Η φυλογένεσης αφορά την ανεύρεση των συνδετικών εκείνων κρίκων που συνδέουν τα διάφορα είδη µεταξύ τους εξελικτικά, σε µονοφυλετικές

Διαβάστε περισσότερα

Μέθοδοι μελέτης εξέλιξης

Μέθοδοι μελέτης εξέλιξης H διερεύνηση της μοριακής βάσης της εξέλιξης βασίζεται σε μεγάλο βαθμό στη διευκρίνιση της διαδικασίας με την οποία μετασχηματίσθηκαν στη διάρκεια της εξέλιξης πρωτεϊνες, άλλα μόρια και βιοχημικές πορείες

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της συσχέτισης ομολογίας ομοιότητας. Παρουσίαση των πληροφοριών

Διαβάστε περισσότερα

4 ο ΚΕΦΑΛΑΙΟ. Γ ε ν ε τ ι κ ή

4 ο ΚΕΦΑΛΑΙΟ. Γ ε ν ε τ ι κ ή 4 ο ΚΕΦΑΛΑΙΟ Γ ε ν ε τ ι κ ή 1. Κύκλος της ζωής του κυττάρου 3ο Γελ. Ηλιούπολης επιμέλεια: Αργύρης Γιάννης 2 2. Μοριακή Γενετική i). Ροή της γενετικής πληροφορίας DNA RNA πρωτεΐνες νουκλεΐκά οξέα ή πρωτεΐνες

Διαβάστε περισσότερα

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ ΜΟΡΙΑΚΑ ΜΟΝΤΕΛΑ 1: ΧΩΡΟΠΛΗΡΩΤΙΚΟ ΜΟΝΤΕΛΟ (SPACE-FILLING) 1: ΧΩΡΟΠΛΗΡΩΤΙΚΟ ΜΟΝΤΕΛΟ (SPACE-FILLING)

Διαβάστε περισσότερα

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ ΜΟΡΙΑΚΑ ΜΟΝΤΕΛΑ 1: ΧΩΡΟΠΛΗΡΩΤΙΚΟ ΜΟΝΤΕΛΟ (SPACE-FILLING) 1: ΧΩΡΟΠΛΗΡΩΤΙΚΟ ΜΟΝΤΕΛΟ (SPACE-FILLING)

Διαβάστε περισσότερα

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας Βιοπληροφορική Ι Παντελής Μπάγκος Παν/µιο Στερεάς Ελλάδας Λαµία 2006 1 Βιοπληροφορική Ι Εισαγωγή: Ορισµός της Βιοπληροφορικής, Υποδιαιρέσεις της Βιοπληροφορικής, Τα είδη των δεδοµένων στη Βιοπληροφορική.

Διαβάστε περισσότερα

Ειδικά Θέματα Βιοπληροφορικής

Ειδικά Θέματα Βιοπληροφορικής Ειδικά Θέματα Βιοπληροφορικής Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1 Πολλαπλή στοίχιση ακολουθιών και φυλογενετικά δέντρα 2 Πολλαπλή στοίχιση Αναφέρεται στην ταυτόχρονη

Διαβάστε περισσότερα

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I Σελίδα 1 Πολλαπλή στοίχιση αποκαλύπτει συντηρημένες περιοχές αντιστοίχιση καταλοίπων με κριτήρια ομοιότητας σε επίπεδο δομής εξέλιξης λειτουργίας ακολουθίας Σελίδα 2 Πολλαπλή

Διαβάστε περισσότερα

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση κατά ζεύγη: Τι είναι Αντιστοίχιση των νουκλεοτιδίων/αµινοξέων δυο ακολουθιών, ώστε να εντοπιστούν οι οµοιότητες και οι διαφορές τους. Χρησιµοποιείται

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΕΙΣΑΓΩΓΗ Η αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών (database similarity searching) αποτελεί µια από τις συχνότερα χρησιµοποιούµενες

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι κατανόηση της μεθόδου προτυποποίησης πρωτεϊνών με ομολογία. παρουσίαση

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II Σελίδα 1 Υπολογιστικός Προσδιορισμός Δομής πειραματικός προσδιορισμός δομών κρυσταλλογραφία ακτίνων X πυρηνικός μαγνητικός συντονισμός (NMR) χρόνος / κόστος / περιορισμοί sequence - structure

Διαβάστε περισσότερα

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής Παντελής Μπάγκος 1 Διάλεξη 2 Αναζήτηση ομοιότητας και κατά ζεύγη στοίχιση ακολουθιών 2 Κατά ζεύγη στοίχιση ακολουθιών Από τα πιο

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου ΕΠΑΝΑΛΗΨΗ Σελίδα 1 τεχνική σύγκρισης ακολουθιών υπολογισµός ενός µέτρου οµοιότητας αναζήτηση ομολογίας S-S match S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC gap mismatch Σελίδα 2 ολική

Διαβάστε περισσότερα

Κεφάλαιο 1. Οι δομικοί λίθοι

Κεφάλαιο 1. Οι δομικοί λίθοι Κεφάλαιο 1 Οι δομικοί λίθοι Κεφάλαιο 1 Οι Δομικοί Λίθοι των Πρωτεϊνών Εικόνα 1.1 Η αμινοξική αλληλουχία μιας πρωτεϊνικής πολυπεπτιδικής αλυσίδας ονομάζεται πρωτοταγής δομή. Διαφορετικές περιοχές της αλληλουχίας

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση των μεθόδων πολλαπλής στοίχισης. Ανάδειξη των πλεονεκτημάτων και

Διαβάστε περισσότερα

Βιοπληροφορική. Πίνακες Αντικατάστασης & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας

Βιοπληροφορική. Πίνακες Αντικατάστασης & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας Βιοπληροφορική Πίνακες Αντικατάστασης & Οπτική Σύγκριση Αλληλουχιών Αλέξανδρος Τζάλλας e-mail: tzallas@teiep.gr ΤΕΙ Ηπείρου Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ Copyright Πανεπιστήμιο

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 7: Σύγκριση αλληλουχιών Part II Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΓΕΝΕΤΙΚΗΣ ΓΟΝΙ ΙΑΚΗ ΕΚΦΡΑΣΗ ΚΑΙ ΣΗΜΑΤΟ ΟΤΗΣΗ

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΓΕΝΕΤΙΚΗΣ ΓΟΝΙ ΙΑΚΗ ΕΚΦΡΑΣΗ ΚΑΙ ΣΗΜΑΤΟ ΟΤΗΣΗ ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΓΕΝΕΤΙΚΗΣ ΓΟΝΙ ΙΑΚΗ ΕΚΦΡΑΣΗ ΚΑΙ ΣΗΜΑΤΟ ΟΤΗΣΗ ρ. Α. ΓΑΛΑΝΗΣ agalanis@mbg.duth.gr Figure 6.1 The Biology of Cancer ( Garland Science 2007) Figure

Διαβάστε περισσότερα

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast Ασκήσεις 1 & 2 Βάσεις Δεδομένων Εργαλεία Αναζήτησης ClustalW & Blast Μοριακή Προσομοίωση Εισαγωγή: Δομική Βάση Βιολογικών Φαινομένων Η αξιοποίηση του πλήθους των δομικών στοιχείων για την εξαγωγή βιολογικά

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ Εργαστήριο Βιοπληροφορικής 7 ο εξάμηνο Σχολή Μηχανολόγων Μηχανικών ΕΜΠ Διδάσκων: Λεωνίδας Αλεξόπουλος Fritz Kahn (1888 1968) 1 Περιεχόμενα Ομοιότητα πρωτεϊνών Σύγκριση αλληλουχιών

Διαβάστε περισσότερα

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Δ ΕΣΠΕΡΙΝΩΝ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 19 ΙΟΥΝΙΟΥ 2018 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΕΞΙ (6) Να γράψετε στο τετράδιό

Διαβάστε περισσότερα

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι) Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι) Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Σύνοψη Εισαγωγή Πολλαπλή στοίχιση και

Διαβάστε περισσότερα

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι Φυλογένεσης Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι που βασίζονται σε χαρακτήρες Μέγιστη φειδωλότητα (Maximum

Διαβάστε περισσότερα

Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών

Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας Πίνακες αντικατάστασης για σύγκριση ακολουθιών Vasilis Promponas Bioinformatics Research Laboratory Department of

Διαβάστε περισσότερα

ΑΝΤΙΓΡΑΦΗ ΚΑΙ ΕΚΦΡΑΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΝΤΙΓΡΑΦΗ ΚΑΙ ΕΚΦΡΑΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΜΙΝΟΠΕΤΡΟΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΦΥΣΙΚΟΣ - Ρ/Η ΚΑΘΗΓΗΤΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΥΠΕΥΘΥΝΟΣ ΣΕΦΕ 2 ου ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΠΕΡΑΜΑΤΟΣ ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΑΝΤΙΓΡΑΦΗ ΚΑΙ ΕΚΦΡΑΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Διαβάστε περισσότερα

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής Βασισμένο σε μια εργασία των Καζαρλή, Καλόμοιρου, Μαστοροκώστα, Μπαλουκτσή, Καλαϊτζή, Βαλαή, Πετρίδη Εισαγωγή Η Εξελικτική Υπολογιστική

Διαβάστε περισσότερα

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading Άσκηση 7 Προσομοίωση 3D Δομών Βιομορίων μέσω Ομολογίας & Threading Προσομοίωση 2ταγούς δομής πρωτεϊνών Δευτεροταγής Δομή: Η 2ταγής δομή των πρωτεϊνών είναι σταθερή τοπική διαμόρφωση της πολυπεπτιδικής

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch

Στοίχιση Ακολουθιών. Μέθοδοι σύγκρισης ακολουθιών. Είδος στοίχισης. match. gap. mismatch Οµολογία ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Σελίδα 2 Οµολογία Οµολογία Οµολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση Ασκήσεις 3& 4 Πρωτεϊνική Αρχιτεκτονική Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής Μοριακή Απεικόνιση Πρωτεϊνική Αρχιτεκτονική Πρωτεϊνική Αρχιτεκτονική: Η τρισδιάστατη δομή μιας πρωτεΐνης και πως

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση των εφαρμογών της αναζήτησης

Διαβάστε περισσότερα

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Περιεχόμενα Παρουσίασης Βιολογικό υπόβαθρο Το κεντρικό αξίωμα Σύνοψη της Βιοπληροφορικής Ερευνητικές περιοχές Πηγές πληροφοριών Τι είναι η Βιοπληροφορική Βιο Πληροφορική μοριακή

Διαβάστε περισσότερα

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Σύνοψη Βασικές έννοιες XNU SEG LCRs και αναζητήσεις

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Επεξήγηση των μεθόδων (ανα-)κατασκευής φυλογενετικών δέντρων. Παρουσίαση

Διαβάστε περισσότερα

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος

ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ. Δυναμικός Προγραμματισμός. Παντελής Μπάγκος ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Δυναμικός Προγραμματισμός Παντελής Μπάγκος Δυναμικός Προγραμματισμός Στοίχιση (τοπική-ολική) RNA secondary structure prediction Διαμεμβρανικά τμήματα Hidden Markov Models Άλλες εφαρμογές

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ Ελαχιστοποίηση κόστους διατροφής Ηεπιχείρηση ζωοτροφών ΒΙΟΤΡΟΦΕΣ εξασφάλισε µια ειδική παραγγελίααπό έναν πελάτη της για την παρασκευή 1.000 κιλών ζωοτροφής, η οποία θα πρέπει

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Οι πρωτεΐνες δομούνται από ένα σύνολο αμινοξέων. 1/10/2015 Δ.Δ. Λεωνίδας

Οι πρωτεΐνες δομούνται από ένα σύνολο αμινοξέων. 1/10/2015 Δ.Δ. Λεωνίδας αμινοξέα Οι πρωτεΐνες δομούνται από ένα σύνολο αμινοξέων Λυσίνη CORN Ισομερές L Ισομερές D R = πλευρική αλυσίδα (side chain) Τα περισσότερα αμινοξέα είναι ασύμμετρα Όλα τα αμινοξέα που βρίσκονται στις

Διαβάστε περισσότερα

A sequence alignment algorithm using the transition quantity

A sequence alignment algorithm using the transition quantity 1 1 1 MTRAP A sequence alignment algorithm using the transition quantity Toshihide Hara, 1 Keiko Sato 1 and Masanori Ohya 1 We have been developed a sequence alignment algorithm using the transition quantity.

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Το Πιθανοκρατικό Μοντέλο Κλασικά Μοντέλα Ανάκτησης Τρία είναι τα, λεγόμενα, κλασικά μοντέλα ανάκτησης: Λογικό (Boolean) που βασίζεται στη Θεωρία Συνόλων Διανυσματικό (Vector) που βασίζεται στη Γραμμική

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

Πρόβλημα. Σύνολο γνωστών αλληλουχιών BLAST Πρόβλημα Άγνωστη αλληλουχία Σύνολο γνωστών αλληλουχιών Η χρήση ενός υπολογιστή κι ενός αλγόριθμου είναι απαραίτητη για την ανακάλυψη της σχέσης μιας αλληλουχίας με τις γνωστές υπάρχουσες Τί είναι

Διαβάστε περισσότερα

Ε ανάληψη. Α ληροφόρητη αναζήτηση

Ε ανάληψη. Α ληροφόρητη αναζήτηση ΠΛΗ 405 Τεχνητή Νοηµοσύνη Το ική Αναζήτηση Local Search Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης Ε ανάληψη Α ληροφόρητη αναζήτηση σε πλάτος, οµοιόµορφου κόστους, σε βάθος,

Διαβάστε περισσότερα

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο Βιοπληροφορική Blast/PSI-Blast 3o εργαστήριο Αναζήτηση οµόλογων ακολουθιών σε βάσεις δεδοµένων (i) Οµόλογες ακολουθίες πιθανόν να έχουν παρόµοιες λειτουργίες. Ακολουθία επερώτησης (query sequence) Υποκείµενες

Διαβάστε περισσότερα

Περί της Ταξινόμησης των Ειδών

Περί της Ταξινόμησης των Ειδών Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Tel.: +30 2310998051, Ιστοσελίδα: http://users.auth.gr/theodoru Περί της Ταξινόμησης

Διαβάστε περισσότερα

Προγραμματιστικές Ασκήσεις, Φυλλάδιο 1

Προγραμματιστικές Ασκήσεις, Φυλλάδιο 1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΣΕ C Προγραμματιστικές Ασκήσεις, Φυλλάδιο Εκφώνηση: 9/3/0 Παράδοση: 5/4/0,.59 Άσκηση 0 η : Το πρόβλημα της βελόνας του Buffon Θέμα της εργασίας

Διαβάστε περισσότερα

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΚΕΦΑΛΑΙΟ 11 ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ Θα εισαγάγουμε την έννοια του τυχαίου αριθμού με ένα παράδειγμα. Παράδειγμα: Θεωρούμε μια τυχαία μεταβλητή με συνάρτηση πιθανότητας η οποία σε

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 4: Πίνακες αντικατάστασης & οπτική σύγκριση αλληλουχιών Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία

Διαβάστε περισσότερα

Improved Peptide and Protein Torsional Energetics with the OPLS-AA Force Field

Improved Peptide and Protein Torsional Energetics with the OPLS-AA Force Field Improved Peptide and Protein Torsional Energetics with the OPLS-AA Force Field Supplementary Information Michael J. Robertson, Julian Tirado-Rives, and William L. Jorgensen* Department of Chemistry, Yale

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 3 η : Πολλαπλή ευθυγράμμιση. Σ. Γκέλης Τμήμα Βιολογίας

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 3 η : Πολλαπλή ευθυγράμμιση. Σ. Γκέλης Τμήμα Βιολογίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3 η : Πολλαπλή ευθυγράμμιση Σ. Γκέλης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Κεφάλαιο 2ο. Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας

Κεφάλαιο 2ο. Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας Κεφάλαιο 2ο Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας 1. Το DNA αυτοδιπλασιάζεται 3ο ε.λ. Ηλιούπολης επιμέλεια: Αργύρης Γιάννης 3 Ο μηχανισμός της αντιγραφής του DNA Ο μηχανισμός αυτοδιπλασιασμού

Διαβάστε περισσότερα

Διαγώνισμα Βιολογίας Προσανατολισμού Γ Λυκείου

Διαγώνισμα Βιολογίας Προσανατολισμού Γ Λυκείου Διαγώνισμα Βιολογίας Προσανατολισμού Γ Λυκείου ΘΕΜΑ Α Να βάλετε σε κύκλο το γράμμα που αντιστοιχεί στη σωστή απάντηση ή στη φράση που συμπληρώνει σωστά την πρόταση. Α1. Ουδέτερη μετάλλαξη μπορεί να είναι:

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΠΡΟΤΕΙΝΟΜΕΝΑ ΘΕΜΑΤΑ

ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΠΡΟΤΕΙΝΟΜΕΝΑ ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΠΡΟΤΕΙΝΟΜΕΝΑ ΘΕΜΑΤΑ ΘΕΜΑ Α Ο Ερωτήσεις πολλαπλής επιλογής: Α1 Στην αντιγραφή του DN το σπάσιμο των υδρογονικών δεσμών μεταξύ των δύο συμπληρωματικών αλυσίδων γίνεται με τη βοήθεια

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι παρουσίαση των μοντέλων πολλαπλής στοίχισης. κατανόηση των εφαρμογών

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

6. Στατιστικές μέθοδοι εκπαίδευσης

6. Στατιστικές μέθοδοι εκπαίδευσης 6. Στατιστικές μέθοδοι εκπαίδευσης Μία διαφορετική μέθοδος εκπαίδευσης των νευρωνικών δικτύων χρησιμοποιεί ιδέες από την Στατιστική Φυσική για να φέρει τελικά το ίδιο αποτέλεσμα όπως οι άλλες μέθοδοι,

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) Νότα Λαζαράκη

ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) Νότα Λαζαράκη ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) 04 02-2018 Νότα Λαζαράκη ΘΕΜΑ Α Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: Α1. Η διάγνωση της β θαλασσαιμίας κατά τον προγεννητικό έλεγχο

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

3.7 Παραδείγματα Μεθόδου Simplex

3.7 Παραδείγματα Μεθόδου Simplex 3.7 Παραδείγματα Μεθόδου Simplex Παράδειγμα 1ο (Παράδειγμα 1ο - Κεφάλαιο 2ο - σελ. 10): Το πρόβλημα εκφράζεται από το μαθηματικό μοντέλο: max z = 600x T + 250x K + 750x Γ + 450x B 5x T + x K + 9x Γ + 12x

Διαβάστε περισσότερα

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM)

Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM) Μέτρα της οργάνωσης και της ποιότητας για τον Self-Organizing Hidden Markov Model Map (SOHMMM) Γενική περιγραφή του SOHMMM Ένα υβριδικό νευρωνικό δίκτυο, σύζευξη δύο πολύ επιτυχημένων μοντέλων: -Self-Organizing

Διαβάστε περισσότερα

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης.

Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης. Οι Εξελικτικοί Αλγόριθμοι (ΕΑ) είναι καθολικοί στοχαστικοί αλγόριθμοι βελτιστοποίησης, εμπνευσμένοι από τις βασικές αρχές της φυσικής εξέλιξης. Ένα από τα γνωστότερα παραδείγματα των ΕΑ είναι ο Γενετικός

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

Εισαγωγή στους Αλγορίθμους Ενότητα 11η

Εισαγωγή στους Αλγορίθμους Ενότητα 11η Εισαγωγή στους Αλγορίθμους Ενότητα 11η Διδάσκων Χρήστος Ζαρολιάγκης Καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Πατρών Email: zaro@ceid.upatras.gr Δυναμικός Προγραμματισμός Σταθμισμένος Χρονοπρογραμματισμός

Διαβάστε περισσότερα

ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας

ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας ΠΛΗ513 - Αυτόνομοι Πράκτορες Αναφορά Εργασίας Ομάδα εργασίας: LAB51315282 Φοιτητής: Μάινας Νίκος ΑΦΜ: 2007030088 ΠΕΡΙΓΡΑΦΗ ΙΔΕΑΣ Η ιδέα της εργασίας βασίζεται στην εύρεση της καλύτερης πολιτικής για ένα

Διαβάστε περισσότερα

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ

ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΡΧΗ 1ης ΣΕΛΙ ΑΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ : ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΑΞΗ : Γ ΛΥΚΕΙΟΥ ΣΠΟΥΔΕΣ ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΑΓΩΝΙΣΜΑ ΠΕΡΙΟΔΟΥ : ΦΕΒΡΟΥΑΡΙΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ : 7 ΘΕΜΑ Α :

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 12/10/2017

Διαβάστε περισσότερα

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας   Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ. Βιοπληροφορική Αλέξανδρος Τζάλλας e-mail: tzallas@teiep.gr ΤΕΙ Ηπείρου Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ Περιεχόμενα Διάλεξης Βιολογικό υπόβαθρο Το κεντρικό αξίωμα Σύνοψη της

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 2. Πίνακες 45 23 28 95 71 19 30 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 21/10/2016

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 26 Ιανουαρίου 2004 ιάρκεια: 2 ώρες (9:00-:00) Στην παρακάτω

Διαβάστε περισσότερα

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6) Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τοµέας Υδατικών Πόρων Μάθηµα: Τυπικά Υδραυλικά Έργα Μέρος 2: ίκτυα διανοµής Άσκηση E0: Μαθηµατική διατύπωση µοντέλου επίλυσης απλού δικτύου διανοµής

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) ΝΟΤΑ ΛΑΖΑΡΑΚΗ

ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) ΝΟΤΑ ΛΑΖΑΡΑΚΗ ΒΙΟΛΟΓΙΑ ΟΠ Γ Λ (ΘΕΡΙΝΑ) 04 02-2018 ΝΟΤΑ ΛΑΖΑΡΑΚΗ ΘΕΜΑ Α Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: Α1. Η διάγνωση της β θαλασσαιμίας κατά τον προγεννητικό έλεγχο

Διαβάστε περισσότερα

m 1 min f = x ij 0 (8.4) b j (8.5) a i = 1

m 1 min f = x ij 0 (8.4) b j (8.5) a i = 1 KΕΦΑΛΑΙΟ 8 Προβλήµατα Μεταφοράς και Ανάθεσης 8. ΕΙΣΑΓΩΓΗ Μια ειδική κατηγορία προβληµάτων γραµµικού προγραµµατισµού είναι τα προβλήµατα µεταφοράς (Π.Μ.), στα οποία επιζητείται η ελαχιστοποίηση του κόστους

Διαβάστε περισσότερα

ΘΕΜΑ Α ΠΑΝΕΛΛΗΝΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ' ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΛΑ Β ) ΤΡΙΤΗ 19 ΙΟΥΝΙΟΥ 2018 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ Να γράψετε στο τετράδιό σας τον αριθμό καθεμιάς από

Διαβάστε περισσότερα

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης Κεφάλαιο 5 ΣΥΜΠΕΡΑΣΜΑΤΑ Το σηµαντικό στην επιστήµη δεν είναι να βρίσκεις καινούρια στοιχεία, αλλά να ανακαλύπτεις νέους τρόπους σκέψης γι' αυτά. Sir William Henry Bragg 5.1 Ανακεφαλαίωση της διατριβής

Διαβάστε περισσότερα

Δίαυλος Πληροφορίας. Δρ. Α. Πολίτης

Δίαυλος Πληροφορίας. Δρ. Α. Πολίτης Δίαυλος Πληροφορίας Η λειτουργία του διαύλου πληροφορίας περιγράφεται από: Τον πίνακα διαύλου μαθηματική περιγραφή. Το διάγραμμα διάυλου παραστατικός τρόπος περιγραφής. Πίνακας Διαύλου Κατασκευάζεται με

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Τεχνικές κατασκευής δένδρων επιθεµάτων πολύ µεγάλου µεγέθους και χρήσης

Διαβάστε περισσότερα

Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν;

Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν; Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν; Γενικά Για να προσδιορίσουμε τα 30 πρόδρομα μόρια των βιομακρομορίων θα πρέπει

Διαβάστε περισσότερα

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης). Μέθοδος Euler 3. Μέθοδοι

Διαβάστε περισσότερα

Υπολογιστικές Μέθοδοι στις Κατασκευές

Υπολογιστικές Μέθοδοι στις Κατασκευές Γενικά Για Τη Βελτιστοποίηση Η βελτιστοποίηση µπορεί να χωριστεί σε δύο µεγάλες κατηγορίες: α) την Βελτιστοποίηση Τοπολογίας (Topological Optimization) και β) την Βελτιστοποίηση Σχεδίασης (Design Optimization).

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα