Σηµειώσεις Βιοπληροφορικής

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Σηµειώσεις Βιοπληροφορικής"

Transcript

1 Σηµειώσεις Βιοπληροφορικής Πολλαπλή Στοίχιση Ακολουθιών Βασικές Έννοιες Γενίκευση των Αλγορίθµων Στοίχισης Κατά Ζεύγη Προοδευτική Πολλαπλή Στοίχιση CLUSTALW Πρακτικά Ζητήµατα ΒΑΣΙΛΗΣ ΠΡΟΜΠΟΝΑΣ ΑΘΗΝΑ , ΛΕΥΚΩΣΙΑ 2006

2 1. Εισαγωγή στην Πολλαπλή Στοίχιση Ακολουθιών Βασικές Έννοιες Μια από τις πιο σηµαντικές συνεισφορές της µοριακής βιολογίας στη µελέτη της εξέλιξης των ειδών βασίζεται στην παρατήρηση ότι οι ακολουθίες του DNA διαφορετικών οργανισµών συχνά σχετίζονται. Οι οµοιότητες αυτές είναι δυνατόν να εντοπίζονται τόσο σε κωδικές περιοχές (οπότε προφανώς συνεπάγονται και οµοιότητα στο επίπεδο των προϊόντων των αντίστοιχων γονιδίων) όσο και σε ρυθµιστικές ή µη κωδικές περιοχές του DNA. Είναι συχνή η περίπτωση όπου γονίδια µε συντηρηµένες νουκλεοτιδικές αλληλουχίες εµφανίζονται σε οργανισµούς οι οποίοι µορφολογικά είναι τελείως διαφορετικοί και αναµένουµε ότι έχουν αποµακρυνθεί σηµαντικά µεταξύ τους κατά τη διάρκεια της εξελικτικής διαδικασίας. Τα προϊόντα αυτών των συντηρηµένων κατά την εξέλιξη γονιδίων εκτελούν παρόµοιες (ή ορισµένες φορές ταυτόσηµες) κυτταρικές λειτουργίες, ή σε άλλες περιπτώσεις µεταλλάσσονται ή αναδιατάσσονται στο επίπεδο της αλληλουχίας τους, ώστε να πραγµατοποιούν διαφορετικές λειτουργίες οι οποίες παγιώνονται µέσα στα πλαίσια της φυσικής επιλογής 1. Οι µέθοδοι σύγκρισης ακολουθιών κατά ζεύγη (τόσο οι ακριβείς όσο και οι ευριστικές) στις οποίες έχουµε ήδη αναφερθεί είναι προφανές ότι µπορούν να χρησιµοποιηθούν για να αναδείξουν τέτοιες οµοιότητες. Παρόλα αυτά, είναι λογικό να σκεφτεί κανείς ότι η δυνατότητα της ταυτόχρονης στοίχισης περισσότερων των δύο ακολουθιών θα µπορούσε να δώσει περισσότερες πληροφορίες, τόσο για την υποκείµενη εξελικτική διαδικασία (την οποία δυστυχώς δεν γνωρίζουµε) όσο και για πιθανά δοµικά-λειτουργικά χαρακτηριστικά 1 Προφανώς, οι περιπτώσεις γονιδιακών προϊόντων µε διαφοροποιηµένες λειτουργίες που δεν είναι ευνοϊκές για την επιβίωση ενός οργανισµού δεν σταθεροποιούνται µε την πάροδο του χρόνου και οι οργανισµοί που τις φέρουν εκλείπουν. 1

3 των εξεταζόµενων µορίων. Συνεπώς, η δυνατότητα για την Πολλαπλή Στοίχιση Ακολουθιών (Multiple Sequence Alignment, ή απλά MSA) αποτέλεσε αφενός µια αναγκαιότητα για τη µελέτη των µοριακών δεδοµένων, αφετέρου δε υποβοηθήθηκε από την ύπαρξη µεθόδων για τη στοίχιση ακολουθιών κατά ζεύγη. Επακόλουθο ήταν να εστιαστεί µεγάλο µέρος της Βιοπληροφορικής έρευνας στην ανάπτυξη µεθόδων MSA η οποία σηµειωτέον συνεχίζεται και στις ηµέρες µας. Στις ακόλουθες παραγράφους δεν επιχειρείται η εξαντλητική επισκόπηση της µεγάλης σχετιζόµενης µε το θέµα βιβλιογραφίας αλλά η ανάπτυξη των βασικών εννοιών και η παρουσίαση θεµελιωδών αλγορίθµων που δίνουν λύσεις στο δύσκολο (όχι µόνο από υπολογιστικής σκοπιάς) πρόβληµα της Πολλαπλής Στοίχισης Ακολουθιών βιολογικών µακροµορίων. Η χρησιµότητα των Πολλαπλών Στοιχίσεων Ακολουθιών Η σηµαντικότητα των Πολλαπλών Στοιχίσεων Ακολουθιών θα µπορούσε να αναλυθεί σε σελίδες επί σελίδων κειµένου, µε κατάλληλες αναφορές σε σηµαντικές πρακτικές εφαρµογές. Θα µπορούσε να συνοψίσει κανείς τη µεγάλη τους σηµασία µε δύο φράσεις, οι οποίες αντικατοπτρίζουν αυτό το πρόβληµα:... two strings good, four strings better... (Gusfield, 1997, σελίδα 332) και One or two homologous sequences whisper... a full multiple alignment shouts out loud. (Hubbard et al., 1996) 2

4 Παρά τον έµµεσο συσχετισµό των πολλαπλών στοιχίσεων µε τις στοιχίσεις κατά ζεύγη (π.χ. για την αποκάλυψη κοινών συντηρηµένων µοτίβων), η χρήση τους είναι δυνατόν (υπό ορισµένες προϋποθέσεις) να παρέχει απαντήσεις σε τελείως διαφορετικά πρακτικά προβλήµατα. Για παράδειγµα, µια στοίχιση κατά ζεύγη είναι δυνατόν να µας βοηθήσει να «ψαρέψουµε» ακολουθίες οι οποίες µοιάζουν µεταξύ τους και µε βάση το επίπεδο οµοιότητάς τους (και την εκτίµηση της στατιστικής σηµαντικότητας) να αποφανθούµε για µια πιθανή λειτουργική-δοµική-εξελικτική µεταξύ τους σχέση. Αντίστροφα, µια πολλαπλή στοίχιση είναι δυνατόν να αποκαλύψει άγνωστες συντηρηµένες περιοχές ακολουθιών για τις οποίες είναι δυνατόν να έχουµε εκ των προτέρων υποψίες (συχνά µετά από συσχέτιση µε πειραµατικά δεδοµένα που αφορούν λειτουργία-δοµή-φυλογένεση) για τη βιολογική τους σχέση. Πολλαπλή Στοίχιση Ακολουθιών και υναµικός Προγραµµατισµός Μια προφανής προσέγγιση στο πρόβληµα της Πολλαπλής Στοίχισης Ακολουθιών προκύπτει από τη σκέψη ότι, ιδανικά, οι αλγόριθµοι δυναµικού προγραµµατισµού είναι δυνατόν να επεκταθούν και για τη στοίχιση περισσότερων από δύο ακολουθιών. Εάν βασιστούµε στην ιδέα ότι όλες οι δυνατές στοιχίσεις δύο ακολουθιών µπορούν να αντιστοιχηθούν µε διαδροµές οι οποίες διέρχονται από τους κόµβους του πλέγµατος δύο διαστάσεων που προκύπτει από την ορθογώνια διάταξη των ακολουθιών, η επέκταση στη στοίχιση τριών ακολουθιών είναι προφανής. Αρκεί να διατάξουµε µε αντίστοιχο τρόπο τις τρεις ακολουθίες που επιθυµούµε να στοιχίσουµε κατά τους άξονες ενός τρισορθογώνιου συστήµατος (Εικόνα 1). 3

5 Σύµφωνα µε όσα έχουµε ήδη συζητήσει, γίνεται προφανές ότι για τη στοίχιση τριών ακολουθιών µε δυναµικό προγραµµατισµό απαιτούνται Ο(L 1 *L 2 *L 3 ) υπολογιστικά βήµατα, όπου L 1, L 2, L 3 τα µήκη των τριών ακολουθιών. Μπορεί να αποδειχθεί στη γενική των περιπτώσεων ότι η εφαρµογή της επέκτασης των αλγορίθµων δυναµικού προγραµµατισµού για την πολλαπλή στοίχιση Ν το πλήθος ακολουθιών µε µήκη L 1, L 2,, L N έχει υπολογιστικές απαιτήσεις Ο(L 1 *L 2 * *L N ) σε µνήµη και Ο(2 Ν * L 1 *L 2 * *L N ) σε χρόνο. Αυτές οι υπολογιστικές απαιτήσεις (π.χ. χρόνος εκθετικός του πλήθους των ακολουθιών) καθιστούν την εφαρµογή των αλγορίθµων δυναµικού προγραµµατισµού για την στοίχιση περισσότερων των δύο ακολουθιών πρακτικά ασύµφορη. Αναλογιστείτε το παράδειγµα κατά το οποίο επιθυµούµε να στοιχίσουµε τρεις αµινοξικές ακολουθίες µήκους L 1 =L 2 =L 3 =300. Για απλούστευση των υπολογισµών ας υποθέσουµε ότι αγνοούµε τους υπολογισµούς για την εισαγωγή κενών. Τότε το πλήθος των υπολογισµών που απαιτούνται είναι κατά προσέγγιση = 2.7 * 10 7, ο οποίος πρακτικά επιτρέπει την εφαρµογή του δυναµικού προγραµµατισµού. Η στοίχιση όµως ακολουθιών µεγαλύτερου µήκους ή πολύ περισσότερων από τρεις το πλήθος (όπως τις περισσότερες φορές είναι η περίπτωση) δεν είναι πρακτικά εφικτή, ούτε και µε τους ταχύτερους υπολογιστές που έχουµε σήµερα διαθέσιµους 2. 2 Πιθανότατα ούτε και µε τους πιο γρήγορους υπολογιστές που θα κατασκευαστούν και σε µερικές δεκαετίες... 4

6 Εικόνα 1: Επέκταση του αλγόριθµου δυναµικού προγραµµατισµού για τη στοίχιση τριών ακολουθιών. Τα βέλη στις επιφάνειες του ορθογωνίου παραλληλεπιπέδου (Α-Β, Α-C, B- C) υποδεικνύουν τη φορά κατά την οποία θα γινόταν ο υπολογισµός των τιµών για τη στοίχιση κατά ζεύγη των αντίστοιχων ακολουθιών. Η στοίχιση των τριών ακολουθιών απαιτεί τον υπολογισµό τιµών για τους στοιχειώδεις κύβους οι οποίοι ορίζονται από τα κατάλοιπα των τριών ακολουθιών, µε τις βέλτιστες τιµές scores, ακολουθώντας την ίδια διαδικασία µε την στοίχιση κατά ζεύγη. Συγκεκριµένα, το score σε κάθε κύβο του πλέγµατος υπολογίζεται (µε βάση κάποιο δεδοµένο πίνακα αντικατάστασης και ποινή εισαγωγής κενών) λαµβάνοντας υπόψη τα scores που προκύπτουν από όλες τις πιθανές µετακινήσεις προς εκείνο το κελί. Επιλέγεται η µετακίνηση η οποία οδηγεί στο µεγαλύτερο (βέλτιστο) score, και η διαδροµή σηµειώνεται αντίστοιχα σε ένα τρισδιάστατο πίνακαιχνηθέτη. [Εικόνα από Mount, 2001]. Εξαιτίας της µεγάλης χρησιµότητας για την κατασκευή πολλαπλών στοιχίσεων από πολύ νωρίς άρχισαν προσπάθειες για την ανάπτυξη ευριστικών µεθόδων (Waterman and Perlwitz, 1984). Ακολουθώντας αντίστοιχη πορεία µε την έρευνα για τη σύγκριση/στοίχιση ακολουθιών κατά ζεύγη, οι Carrillo και Lipman (Carrillo and Lipman, 1988) πρότειναν µια ευριστική µέθοδο (υλοποίηση της οποίας πραγµατοποιήθηκε στο λογισµικό MSA, Lipman et al., 1989), που στοχεύει στη µείωση του αριθµού των υπολογισµών µε την ελάχιστη 5

7 δυνατή απόκλιση από τη βέλτιστη (µαθηµατικά) σύγκριση. Η µέθοδος MSA βασίστηκε στην εισαγωγή ενός αντικειµενικού κριτηρίου για την αξιολόγηση των διαφορετικών πολλαπλών στοιχίσεων, το οποίο ονοµάστηκε Sum-of-Pairs Score (SP-score, δείτε την επόµενη παράγραφο). Εικόνα 2: Περιορισµός του χώρου αναζήτησης στον οποίο θα προσδιοριστεί µια πολλαπλή στοίχιση που βελτιστοποιεί το SP-score, από το πρόγραµµα MSA. Ο χώρος στον οποίο περιορίζεται η εκτέλεση του αλγόριθµου δυναµικού προγραµµατισµού αντιστοιχεί στη γκρι περιοχή του ορθογώνιου παραλληλεπιπέδου και αποτελεί σηµαντικά µικρό µέρος του συνολικού χώρου αναζήτησης (ολόκληρο το ορθογώνιο παραλληλεπίπεδο). Αυτή η υποπεριοχή εντοπίζεται από τους περιορισµούς που προκύπτουν από όλες τις βέλτιστες στοιχίσεις κατά ζεύγη µεταξύ των τριών ακολουθιών καθώς και από την ευριστική προσεγγιστική πολλαπλή στοίχιση των ακολουθιών. Οι περιοχές µε πράσινο, µπλε και πορτοκαλί χρώµα στις πλευρές του ορθογωνίου παραλληλεπιπέδου αποτελούν τις ορθές προβολές της περιοχής στην οποία εκτελείται ο δυναµικός προγραµµατισµός. Παρότι η µέθοδος MSA συνέχισε να βελτιώνεται (Gupta et al., 1995) σύµφωνα µε τους απαιτούµενους υπολογιστικούς πόρους (µνήµη χρόνος), η χρήση του δεν είναι πρακτική παρά µόνο για λίγες 6

8 ακολουθίες µικρού µάλιστα µήκους (τυπικά ~5-7 ακολουθίες µε κατάλοιπα η κάθε µία). Παρότι πρακτικά ασύµφορη, η µελέτη των αλγορίθµων δυναµικού προγραµµατισµού για πολλαπλή στοίχιση ακολουθιών έχουν (τουλάχιστον) θεωρητικό ενδιαφέρον. Η επέκταση για περισσότερες από τρεις ακολουθίες (Ν) πραγµατοποιείται διαισθητικά µε την διάταξη των προς στοίχιση ακολουθιών στις ακµές ενός Ν-διάστατου υπερ-κύβου και στον υπολογισµό της διαδροµής εκείνης που αντιστοιχεί στο βέλτιστο score. Βαθµονόµηση πολλαπλών στοιχίσεων Sum-of-Pairs score Όπως ακριβώς και στη στοίχιση ακολουθιών κατά ζεύγη, έτσι και κατά την πολλαπλή στοίχιση έπρεπε να αναζητηθεί η ποσότητα εκείνη την οποία οφείλουµε να µεγιστοποιήσουµε προκειµένου να επιτύχουµε µια «καλή» στοίχιση. Μια διαισθητική προσέγγιση, η οποία µπορεί να σχετισθεί µε ένα πιθανό µοντέλο εξέλιξης είναι το λεγόµενο Sum-of-Pairs score (SPscore). Για τον υπολογισµό του SP-score µιας πολλαπλής στοίχισης αυτό που απαιτείται είναι να αθροιστούν τα scores όλων των δυνατών ζευγών καταλοίπων που καταλαµβάνουν µια στήλη της στοίχισης, µε βάση έναν πίνακα αντικατάστασης και δεδοµένες ποινές για την εισαγωγή κενών. Έτσι, κατά την πολλαπλή στοίχιση Ν ακολουθιών απαιτείται για κάθε στήλη της στοίχισης ο υπολογισµός των Ν(Ν-1)/2 scores και η άθροισή τους ώστε να υπολογιστεί το score µιας στήλης (Εικόνα 3). Η άθροιση των scores όλων των στηλών οδηγεί στο τελικό score της πολλαπλής στοίχισης 3. Από υπολογιστικής πλευράς η βέλτιστη πολλαπλή στοίχιση ακολουθιών µε βάση το SP-score αποδεικνύεται (Murata et al., 1985) ότι είναι δυνατόν να υπολογιστεί µε τη χρήση της επέκτασης 3 Από εξελικτικής σκοπιάς αυτή η προσέγγιση θεωρεί ότι εν δυνάµει κάθε ακολουθία θα µπορούσε να θεωρηθεί πιθανός πρόγονος όλων των υπόλοιπων. 7

9 των αλγορίθµων δυναµικού προγραµµατισµού που συζητήσαµε στα προηγούµενα. Παρόλα αυτά η εκθετική πολυπλοκότητα δεν επιτρέπει να έχουµε τέτοιες εφαρµογές οι οποίες να είναι πρακτικές για προβλήµατα που συναντούµε στην πράξη. Μια παραλλαγή αυτής της προσέγγισης (δείτε τα επόµενα) είναι δυνατόν να λαµβάνει υπόψη σταθµισµένα scores για τα διάφορα κατάλοιπα ώστε να µετριάζεται καταρχήν η επανειληµµένη συνεισφορά πολύ όµοιων ακολουθιών στο αποτέλεσµα της τελικής στοίχισης. l 1 k p i = i i i = 0 i < j r SP ( m ) s ( m, m ) Seq1: ALLE Seq2: GLLD Seq3: WLGD Blosum50 s(l-l) = 5 s(l-g) = -4 SP(2)=15 SP(3)=-3 Εικόνα 3: Υπολογισµός SP-score για στήλες µιας πολλαπλής στοίχισης. Ο υπολογισµός για τη στήλη i πραγµατοποιείται µε την άθροιση των επιµέρους scores για όλες τις κατά ζεύγη στοιχίσεις στη στήλη αυτή για τις l πλήθος ακολουθίες. Η άθροιση των SP-scores που προκύπτει για όλες τις στήλες της πολλαπλής στοίχισης δίνει το τελικό SP-score για την προκύπτουσα πολλαπλή στοίχιση και αποτελεί το µέτρο το οποίο επιθυµούµε να βελτιστοποιήσουµε. Να σηµειωθεί ότι κάθε ζεύγος καταλοίπων συνεισφέρει µόνο µία φορά στον υπολογισµό. Η προσέγγιση αυτή παρουσιάζει σηµαντικά µειονεκτήµατα (για λεπτοµέρειες αλλά και εναλλακτικούς τρόπους βαθµονόµησης πολλαπλών στοιχίσεων συµβουλευτείτε το σύγγραµµα Mount, 2001, 8

10 σελίδες ). Στην πράξη, όµως, είναι η ευρύτερα χρησιµοποιούµενη στους αλγορίθµους πολλαπλής στοίχισης. Αυτό συµβαίνει γιατί, αφενός µεν ο υπολογισµός του SP-score είναι πολύ απλός-ταχύς, αφετέρου δε κάποιες βελτιώσεις (όπως π.χ. ο υπολογισµός παραγόντων στάθµισης της συνεισφοράς των ακολουθιών που στοιχίζουµε δείτε επόµενες παραγράφους) αµβλύνουν σηµαντικά τα προβλήµατα. 9

11 2. Προοδευτική Πολλαπλή Στοίχιση Ακολουθιών Γενικά Οι µέθοδοι Προοδευτικής Πολλαπλής Στοίχισης Ακολουθιών (Progressive Multiple Sequence Alignment) έδωσαν σηµαντική ώθηση στη χρήση των πολλαπλών στοιχίσεων στη µελέτη οικογενειών βιολογικών µακροµορίων. Αυτό συνέβη καθώς αυτές οι προσεγγίσεις έκαναν εφικτή τη στοίχιση µεγάλου πλήθους ακολουθιών (συχνά µε µεγάλα µήκη) σε χρονικά διαστήµατα τα οποία κρίνονται ανεκτά. Η βασική ιδέα για την ανάπτυξη µεθοδολογιών αυτού του τύπου βασίζεται στη χρήση της πληροφορίας, η οποία προκύπτει από όλες τις δυνατές κατά ζεύγη στοιχίσεις των ακολουθιών των οποίων επιθυµούµε την πολλαπλή στοίχιση. Συγκεκριµένα, έχοντας προσδιορίσει την οµοιότητα µεταξύ όλων των ζευγών ακολουθιών, οι αλγόριθµοι αυτοί προσπαθούν να κατασκευάσουν προοδευτικά την πολλαπλή στοίχιση στοιχίζοντας αρχικά τις πιο όµοιες ακολουθίες, και προσθέτοντας προοδευτικά στις στοιχίσεις αυτές (από εδώ προκύπτει και ο όρος «προοδευτική») τις πιο αποµακρυσµένες από τις ακολουθίες του συνόλου που µας ενδιαφέρει. Αυτή η προσέγγιση βασίζεται ουσιαστικά στην πεποίθηση που έχουµε ότι οι περισσότερο όµοιες ακολουθίες θα στοιχίζονται µε όµοιο τρόπο στην τελική πολλαπλή στοίχιση. Έτσι, δίνεται ιδιαίτερη βαρύτητα σε αυτές και, στην ουσία, οι κατά ζεύγη στοιχίσεις των πιο όµοιων ακολουθιών αποτελούν το ικρίωµα πάνω στο οποίο θα χτιστεί η τελική πολλαπλή στοίχιση. Μια σχηµατική απεικόνιση των βασικών βηµάτων που απαιτούνται σε µια διαδικασία προοδευτικής πολλαπλής στοίχισης παρέχεται στην Εικόνα 4. 10

12 Κατά ζεύγη στοιχίσεις 1 Πίνακας Αποστάσεων A B C A - B 8 - C έντρο Οδηγός A B C 1. Στοιχίζω Πρώτα Α-Β. 2. Το αποτέλεσµα της στοίχισης των Α-Β µε τη C. Εικόνα 4: Σχηµατική απεικόνιση των βηµάτων κατά την προοδευτική πολλαπλή στοίχιση ακολουθιών. Η διαδικασία ξεκινά µε όλες τις δυνατές κατά ζεύγη στοιχίσεις, µε βάση τις οποίες υπολογίζεται ένας τριγωνικός κάτω πίνακας αποστάσεων D ij (1). Από τις τιµές του πίνακα αποστάσεων δηµιουργείται ένα δέντρο-οδηγός4, συνήθως µε µια µέθοδο clustering (2). Οι ακολουθίες στοιχίζονται µε τη σειρά µε την οποία εισήλθαν στο δέντρο δίνοντας προοδευτικά την τελική πολλαπλή στοίχιση (3). Προφανώς, τα διαφορετικά βήµατα είναι δυνατόν να υλοποιηθούν µε διαφορετικούς τρόπους. 4 Προσοχή!! Το δέντρο-οδηγός ΕΝ αποτελεί σε καµία περίπτωση φυλογενετικό δέντρο. 11

13 Η µέθοδος των Feng και Doolittle Η πρώτη µεθοδολογία αυτού του τύπου προτάθηκε το 1987 από τους Feng και Doolittle (Feng and Doolittle, 1987). Η πρώτη µορφή της µεθόδου στηρίχτηκε στη χρήση της µεθόδου Needleman-Wunsch για ολική στοίχιση κατά ζεύγη. Με επαναληπτικό τρόπο στοιχίζονται όλες οι (N το πλήθος) ακολουθίες µεταξύ τους µε αρχικό σκοπό την κατασκευή ενός (πρόχειρου) φυλογενετικού δέντρου, το οποίο ονοµάζεται δέντρο-οδηγός (guide-tree). Τα scores οµοιότητας µεταξύ δύο τυχαίων ακολουθιών s i, s j ακολουθιών µετατρέπονται σε ένα µέτρο απόστασης D ij (i,j=1,2,,n, µε i<j) µεταξύ τους σύµφωνα µε τη σχέση: D = Cln S ij όπου: S eff : Το ενεργό score (effective score) της στοίχισης µεταξύ των δύο ακολουθιών C: Μια σταθερά (συνήθως, C=100) eff Το ενεργό score S eff της στοίχισης κατά ζεύγη υπολογίζεται µε µια διαδικασία σχετικά χρονοβόρα: S eff = S ij, obs S max S S rand rand S ij,obs : Το score της στοίχισης µεταξύ των δύο ακολουθιών 12

14 S rand : To µέσο score που προκύπτει από στοιχίσεις τυχαίων ακολουθιών µε τα ίδια µήκη και την ίδια αµινοξική σύσταση µε τις s i, s j 5 S max : Το µέγιστο score για στοιχίσεις των δύο ακολουθιών, όπως προφανώς µπορεί να υπολογιστεί από τη στοίχιση κάθε ακολουθίας µε τον εαυτό της και εν συνεχεία υπολογίζοντας το µέσο όρο Καθώς η τιµή S rand µεγαλώνει (και αυτό προφανώς συµβαίνει για ακολουθίες που η µεταξύ τους εξελικτική απόσταση µεγαλώνει) η S eff µικραίνει. Λογαριθµίζοντας το ενεργό score η σχέση µεταξύ D ij και της εξελικτικής απόστασης γίνεται προσεγγιστικά γραµµική. 6 Αυτός ο τρόπος προσδιορισµού αποστάσεων απαιτεί δύο σηµαντικές παραδοχές (οι οποίες γνωρίζουµε πολύ καλά ότι δεν ισχύουν): Όλα τα κατάλοιπα µιας ακολουθίας έχουν την ίδια πιθανότητα να µεταλλαχθούν Κάθε τύπος αµινοξικού καταλοίπου έχει την ίδια πιθανότητα να αντικατασταθεί από οποιοδήποτε άλλο τύπο καταλοίπου Ο υπολογισµός των Ν(Ν-1)/2 τιµών D ij µπορεί εύκολα να αντιστοιχηθεί µε την κατασκευή ενός τριγωνικού κάτω πίνακα (Βήµα 1, Εικόνα 4). Η διαδικασία συνεχίζεται µε την κατασκευή του δέντρού-οδηγού. Οι Feng και Doolittle εφάρµοσαν τη διαδικασία που είχαν παλιότερα προτείνει οι Fitch και Margoliash (Fitch and 5 Μπορεί να υπολογιστεί ως η µέση τιµή της κατανοµής των scores που προκύπτουν µετά από επαναληπτικό τυχαίο «ανακάτεµα» (random shuffling) των καταλοίπων των ακολουθιών, διατηρώντας τα µήκη και την αµινοξική τους σύσταση αµετάβλητα. Το πλήθος των τυχαίων στοιχίσεων σε αυτό το στάδιο είναι µερικές εκατοντάδες (διαπιστώστε το κόστος σε χρόνο!!). 6 Για εναλλακτικές µεθοδολογίες µετατροπής των scores των στοιχίσεων σε αποστάσεις µεταξύ των ακολουθιών συµβουλευθείτε το βιβλίο του Mount, σελίδες

15 Margoliash, 1967). Η µέθοδος αυτή είναι µια κλασική µέθοδος ιεραρχικού clustering (hierarchical ή agglomerative clustering) 7. Το δέντρο-οδηγός που προκύπτει υποδεικνύει προσεγγιστικά µόνο τις εξελικτικές σχέσεις µεταξύ των ακολουθιών 8, αλλά είναι αυτό που καθοδηγεί τη σειρά µε την οποία θα προστεθούν οι ακολουθίες στην πολλαπλή στοίχιση. Η πολλαπλή στοίχιση ξεκινά µε την κατά ζεύγη στοίχιση των 2 πιο όµοιων ακολουθιών. Στα επόµενα βήµατα θα απαιτηθεί η στοίχιση είτε ακολουθίας µε υπάρχουσα στοίχιση είτε στοίχισης µε στοίχιση. Στην απλούστερη των περιπτώσεων, αυτή της στοίχισης ακολουθίας µε προϋπάρχουσα στοίχιση, οι Feng και Doolittle πρότειναν την εξής διαδικασία: 1. Η ακολουθία στοιχίζεται µε ΟΛΕΣ τις ακολουθίες της στοίχισης (µε το γνωστό αλγόριθµο δυναµικού προγραµµατισµού) 2. Η ακολουθία προστίθεται στην πολλαπλή στοίχιση βε βάση τη στοίχιση κατά ζεύγη του βήµατος 1 που είχε το µεγαλύτερο score. Είναι προφανής η δυνατότητα επέκτασης αυτής της ιδέας για στοίχιση µεταξύ δύο στοιχίσεων: 7 Οι µέθοδοι clustering έχουν ως σκοπό την οµαδοποίηση οντοτήτων (στη συγκεκριµένη περίπτωση οι ακολουθίες που στοιχίζουµε) µε βάση τις µεταξύ τους αποστάσεις. Οι ιεραρχικές µέθοδοι ξεκινούν φτιάχνοντας µια οµάδα για κάθε οντότητα και συνενώνουν ιεραρχικά οµάδες µεταξύ τους λαµβάνοντας υπόψη τις αποστάσεις µεταξύ των µελών των οµάδων. Μια εισαγωγική παρουσίαση τέτοιων µεθόδων µπορείτε να βρείτε online στο URL: Τεχνικές λεπτοµέρειες σχετικά µε τη µέθοδο Fitch-Margoliash µπορείτε να βρείτε επίσης στο βιβλίο του Mount, σελίδες Περιττό να σηµειώσουµε εδώ ότι οι µεθοδολογίες πολλαπλής στοίχισης θεωρούν εκ των προτέρων δεδοµένη τη συσχέτιση των ακολουθιών που επιχειρούµε να στοιχίσουµε. Αυτό προϋποθέτει (από την πλευρά του χρήστη) προσεκτική επιλογή των ακολουθιών που θα στοιχίσει. Να θυµάστε πάντα ότι κατά την πολλαπλή στοίχιση ακολουθιών ισχύει ο θεµελιώδης µνηµονικός κανόνας Garbage- IN=>Garbage-Out. Η µέθοδος επιλογής των ακολουθιών που θα στοιχίσουµε εξαρτάται από τη φύση της µελέτης µας (συζήτηση γύρω από το ζήτηµα αυτό πραγµατοποιήθηκε κατά τη διάλεξη...) 14

16 1. Οι ακολουθίες των δύο στοιχίσεων στοιχίζονται κατά ζεύγη µε ΟΛΟΥΣ τους δυνατούς τρόπους 2. Οι στοιχίσεις ενοποιούνται µε βάση τη στοίχιση κατά ζεύγη του βήµατος 1 που είχε το µεγαλύτερο score. Παράδειγµα Προοδευτικής Πολλαπλής Στοίχισης µε βάση τη µέθοδο Feng-Doolittle Έστω, οι ακολουθίες: S1: AAATCGG, S2: AAACCGG, S3: ATACCCTG, S4: AΤACCCGG και ας υποθέσουµε ότι µε κάποιο σύστηµα βαθµονόµησης για τις κατά ζεύγη στοιχίσεις προκύπτει ο παρακάτω πίνακας αποστάσεων: S1 S2 S3 S4 S1 - S2 1 - S S Ένα πιθανό δέντρο-οδηγός θα ήταν λοιπόν το: 15

17 S1 S2 S3 S4 Η πληροφορία που µας χρειάζεται για τη δηµιουργία της πολλαπλής στοίχισης (µε βάση το δέντρο-οδηγό) συνοψίζεται στις παρακάτω οδηγίες: Ο ΗΓΙΑ ΑΠΟΤΕΛΕΣΜΑ 1 Στοίχισε S1-S2 => S 1,2 AAATCGG AAACCGG 2 Στοίχισε S3-S4 => S 3,4 ATACCCTG AΤACCCGG 3 Στοίχισε S 1,2 S 3,4 είτε παρακάτω... Για τη στοίχιση S 1,2 S 3,4, πρέπει να στοιχίσω S1-S3, S1-S4, S2-S3, S3-S4. 9 Στοίχιση Score S1-S3 AAATC-GG ATACCCTG 3 9 Καλή πρακτική για την εξοικονόµηση χρόνου είναι να έχω αποθηκεύσει τις στοιχίσεις αυτές (και τα αντίστοιχα scores) από το πρώτο βήµα της διαδικασίας. Στην περίπτωση βέβαια που έχουµε πολλές ακολουθίες και η αποθήκευση όλων των κατά ζεύγη στοιχίσεών τους δεν είναι πρακτική, µπορώ να φυλάξω µόνο τα scores και να χρειαστεί να υπολογίσω ξανά µόνο εκείνη τη στοίχιση µε το µέγιστο score. 16

18 S1-S4 S2-S3 S2-S4 AAATCGG AΤACCCG AAACCG-G ATACCCTG AAACC-GG AΤACCCGG Σύµφωνα µε τα προηγούµενα, η ζητούµενη στοίχιση µεταξύ S 1,2 S 3,4 θα πραγµατοποιηθεί µε βάση τη στοίχιση S2-S4. Εποµένως: S3: ATACCCTG S4: ATACCCGG S2: AAACC-GG S1: AAATC-GG Προϋπάρχουσα Στοίχιση S3-S4 Στοίχιση S2-S4 Προϋπάρχουσα Στοίχιση S1-S2 Εικόνα 5: Η πολλαπλή στοίχιση που υπολογίστηκε για τις ακολουθίες του παραδείγµατος. Παρατηρήστε µε κόκκινο χρώµα το κενό που εισάγουµε στην ακολουθία S1, λαµβάνοντας υπόψη ότι υπήρχε κενό στην αντίστοιχη θέση της στοίχισης S2-S4 µε βάση την οποία «ενώθηκαν» οι επιµέρους στοιχίσεις. Η µέθοδος CLUSTAL 17

19 Η διαδικασία που ακολούθησαν οι Feng και Doolittle, είναι προφανές ότι µπορεί να έχει διάφορες παραλλαγές, και αυτό γιατί κάθε ένα από τα ξεχωριστά της στάδια είναι δυνατόν να υλοποιηθεί µε διαφορετικές µεθοδολογίες. Παρόλα αυτά αποτελεί εξαιρετικό παράδειγµα για την εισαγωγή των εννοιών πίσω από τη µεθοδολογία της προοδευτικής πολλαπλής στοίχισης εξαιτίας της απλότητάς του. Πέρα από τις παραδοχές που έχει εγγενώς η προοδευτική πολλαπλή στοίχιση, η µεθοδολογία αυτή εµφάνιζε ένα σηµαντικό µειονέκτηµα. Η ανάγκη για εφαρµογή δυναµικού προγραµµατισµού για µεγάλο πλήθος στοιχίσεων κατά ζεύγη καθιστά σηµαντικές τις υπολογιστικές απαιτήσεις σε χρόνο CPU. Λίγο καιρό αργότερα, οι Higgins και Sharp (Higgins and Sharp, 1988) πρότειναν µια εναλλακτική µέθοδο (CLUSTAL) η οποία (αν και είχε την ίδια φιλοσοφία) διέφερε σε δύο σηµαντικά σηµεία της βασικής διαδικασίας σε σχέση µε τη µέθοδο Feng-Doolittle: 1. Οι κατά ζεύγη στοιχίσεις ακολουθίας-ακολουθίας ήταν δυνατόν να πραγµατοποιηθούν πολύ ταχύτερα µε βάση τους νέους ευριστικούς αλγορίθµους οι οποίοι είχαν ήδη προταθεί (δείτε FASTA, Pearson and Lipman, 1988). To πλήθος των διαφορών των ακολουθιών σε αυτές τις στοιχίσεις (mismatches, indels) χρησιµοποιούνται για τη δηµιουργία του πίνακα αποστάσεων D ij. Εναλλακτικά, µπορεί να εφαρµοστεί πλήρης δυναµικός προγραµµατισµός ή η βελτιωµένη έκδοση που προτάθηκε από τους Myers και Miller (Myers and Miller, 1988) η οποία εκτελεί Π µε γραµµική απαίτηση σε χρόνο Ο(Ν) 2. Η δηµιουργία του δέντρου-οδηγού γίνεται µε µια διαφορετική µέθοδο clustering (Neighbor-joining, Saitou and Nei, 1987) 10 Σχολιάζοντας τις βασικές αυτές τροποποιήσεις της µεθοδολογίας από τους Higgins και Sharp µπορούµε εύκολα να σκεφτούµε ότι, στην 10 Τεχνικές λεπτοµέρειες στο βιβλίο του Mount, σελίδες

20 πραγµατικότητα, η χρησιµότητα των στοιχίσεων κατά ζεύγη έγκειται στον υπολογισµό των scores για την κατασκευή του δέντρουοδηγού. Με δεδοµένο ότι η απόλυτη ακρίβεια στον υπολογισµό του δέντρου αυτού δεν είναι το ζητούµενο, η χρήση προσεγγιστικών στοιχίσεων δεν αναµένουµε να επηρεάσει σηµαντικά το τελικό αποτέλεσµα. Η µέθοδος CLUSTAL συνέχισε να αναπτύσσεται συστηµατικά και σύντοµα υπήρξαν βελτιώσεις της (CLUSTALV, Higgins et al., 1992 και CLUSTALW, Thompson et al., 1994). Η µέθοδος αυτή έχει κατά κόρον χρησιµοποιηθεί σε πρακτικές εφαρµογές και αποτελεί µέτρο σύγκρισης για οποιαδήποτε νέα µέθοδο πολλαπλής στοίχισης ακολουθιών, τόσο για την ταχύτητά της όσο και για την ποιότητα των στοιχίσεων που παράγει. Αρκετές καινοτοµίες βελτίωσαν σηµαντικά την ποιότητα των αποτελεσµάτων του CLUSTAL τόσο έναντι παλαιότερων µεθόδων όσο και έναντι προγενέστερων εκδόσεων του, και τις σηµαντικότερες από αυτές θα συζητήσουµε στα επόµενα. Συγκεκριµένα, θα µας απασχολήσουν η µέθοδος στάθµισης των ακολουθιών βάσει του δέντρου-οδηγού, η διαδικασία του profile-alignment και η εισαγωγή κενών µε ποινές εξαρτώµενες από τη θέση. Στάθµιση Ακολουθιών Οι συνεισφορές ακολουθιών µε µεγάλη µεταξύ τους οµοιότητα σταθµίζονται έτσι ώστε να αποφευχθεί το πιθανό γεγονός κατά το οποίο η τελική πολλαπλή στοίχιση θα εξαρτάται σε µεγάλο βαθµό από αυτές τις ακολουθίες. Για κάθε ακολουθία, υπολογίζεται ένας παράγοντας στάθµισης (weight) µε βάση τις αποστάσεις στο των ακολουθιών στο δέντρο-οδηγό. 19

21 Εικόνα 6: Στάθµιση Ακολουθιών µε βάση το δέντρο-οδηγό Από το µήκη των κλαδιών του δέντρου-οδηγού υπολογίζεται ο παράγοντας στάθµισης για κάθε ακολουθία εφαρµόζοντας την παρακάτω διαδικασία: Από το «φύλλο» του δέντρου που αντιστοιχεί στην κάθε ακολουθία ακολουθούµε τη διαδροµή µέχρι τη «ρίζα» του δέντρου αθροίζοντας το µήκος κάθε «κλάδου» διαιρεµένο µε το πλήθος των ακολουθιών που βρίσκονται κάτω από αυτόν. Για παράδειγµα, για την ακολουθία hba_human του σχήµατος: w = 0.055/ / / / /6 = = Προφανώς, ο παράγοντας στάθµισης για µια ακολουθία η οποία βρίσκεται σε ένα κλάδο που είναι απευθείας προσαρτηµένος στη ρίζα του δέντρου ισούται µε το µήκος του κλάδου αυτού. Σηµείωση: Στην περίπτωση που µε την παραπάνω (ή κάποια άλλη διαδικασία) έχουµε υπολογίσει παράγοντες στάθµισης για τις ακολουθίες που στοιχίζουµε µπορούµε αντί του SP-score να υπολογίζουµε για κάθε στήλη ένα σταθµισµένο SP-score (weighted SP-score) πολλαπλασιάζοντας το score που προκύπτει από τον 20

22 πίνακα αντικατάστασης για κάθε στήλη καταλοίπων µε τα «βάρη» των αντίστοιχων ακολουθιών. Profile Alignment Η διαδικασία της προοδευτικής στοίχισης προϋποθέτει ότι σε κάποιο στάδιο της διαδικασίας θα πραγµατοποιηθεί στοίχιση µεταξύ κάποιας προϋπάρχουσας στοίχισης και µιας ακολουθίας ή άλλης στοίχισης. Η οµάδα του David Eisenberg (Gribskov et al., 1987) ήταν από τους πρωτοπόρους στη χρήση αποτελεσµάτων πολλαπλών στοιχίσεων ακολουθιών για την κατασκευή προφίλ (profiles, ή πίνακες οµοιότητας εξαρτώµενους από τη θέση, Position-Specific Scoring Matrix, PSSM) πρωτεϊνικών οικογενειών. Παράλληλα, πρότειναν κατάλληλη µεθοδολογία, η οποία είναι επέκταση των αλγορίθµων δυναµικού προγραµµατισµού (πάλι!!) για τη σύγκριση/στοίχιση µιας ακολουθίας µε ένα προφίλ που αντιστοιχεί σε µια πρωτεϊνική οικογένεια. Με µια απλή τροποποίηση η µέθοδός τους είναι δυνατόν να χρησιµοποιηθεί για τη στοίχιση δύο διαφορετικών profiles. Ένα profile αποτελεί µια απλή πιθανοκρατική περιγραφή µιας πολλαπλής στοίχισης, όπου κάθε στήλη της στοίχισης περιγράφεται από τη συχνότητα εµφάνισης κάθε διαφορετικού τύπου καταλοίπου. Η στοίχιση µεταξύ δύο στοιχίσεων µπορεί να υπολογιστεί µε βάση τους κλασικούς αλγορίθµους δυναµικού προγραµµατισµού εάν σκεφτούµε ότι στις γραµµές και τις στήλες του πίνακα δυναµικού προγραµµατισµού δεν τοποθετούµε δύο ακολουθίες αλλά τις στήλες κάθε µιας στοίχισης. Για τη στοίχιση S 1,2 S 3,4 που είδαµε στο παράδειγµα της µεθόδου Feng-Doolittle, η στοίχιση µε τη µέθοδο profile alignment θα γινόταν ως εξής (Εικόνα 7): 21

23 S 3,4 S3: ATACCCTG S4: ATACCCGG AA TT AA CC CC CC TG GG S 1,2 S2: AAACCGG S1: AAATCGG AA AA AA A B CT C D A + SP ( CT, TG ) D = max B g C g CC GG GG Εικόνα 7: Επέκταση του αλγόριθµου δυναµικού προγραµµατισµού για profile-alignment Βλέπουµε την περίπτωση που στοιχίζονται δύο κατά ζεύγη στοιχίσεις. Η τιµή D του score στο µπλε κελί του πίνακα υπολογίζεται από τα scores των γραµµοσκιασµένων γειτονικών κελιών του µε τη γνωστή διαδικασία µεγιστοποίησης. A, B, C είναι τα ήδη υπολογισµένα scores από προηγούµενα βήµατα του δυναµικού προγραµµατισµού, ενώ g είναι η ποινή εισαγωγής κενού. Το SP(CT, TG) είναι το SP-score για την στοίχιση των δύο στηλών των στοιχίσεων µε τα κατάλοιπα CT και TG αντίστοιχα. Στην περίπτωση που επικρατεί κάποιο από τα B-g, C-g το κενό εισάγεται στη συγκεκριµένη θέση για κάθε ακολουθία της αντίστοιχης προϋπάρχουσας στοίχισης. Να σηµειωθεί ότι αντί για το SP-score µπορεί να χρησιµοποιηθεί το σταθµισµένο SP-score (Εικόνα 8). 22

24 Εικόνα 8: Υπολογισµός σταθµισµένου SP-score. Κατά τη στοίχιση των σηµειωµένων στηλών από τις προυπάρχουσες στοιχίσεις τα scores από τον πίνακα οµοιότητας M(a,b) [score για ταίριασµα καταλοίπων a, b] πολλαπλασιάζεται µε τα βάρη των αντίστοιχων ακολουθιών και µετά πραγµατοποιείται η άθροιση όπως είδαµε στην Εικόνα 3. Ο παράγοντας 1/8 κανονικοποιεί το σταθµισµένο SP-score ανά ζεύγος καταλοίπων. Ποινές κενών εξαρτώµενες από τη θέση Το ζήτηµα της εισαγωγής κενών φάνηκε από την περίπτωση της στοίχισης ακολουθιών κατά ζεύγη ότι απαιτεί προσεκτικό χειρισµό, ενώ παράλληλα δεν υπάρχει µια κοινά αποδεκτή προσέγγιση η οποία να έχει κάποιο ισχυρό βιολογικό-θεωρητικό υπόβαθρο. Ειδικότερα, στην περίπτωση της προοδευτικής πολλαπλής στοίχισης, είναι προφανές ότι εάν σε κάποια φάση της διαδικασίας των επιµέρους στοιχίσεων εισαχθεί κενό σε κάποια θέση αυτό το κενό παραµένει «παγωµένο». Εποµένως, η όσο το δυνατόν καλύτερη τοποθέτηση των κενών από τα αρχικά κιόλας στάδια της πολλαπλής στοίχισης 23

25 αποτελεί κρίσιµο στοιχείο για την ποιότητα της τελικής πολλαπλής στοίχισης. Έχοντας αυτά υπόψη, η οµάδα ανάπτυξης της µεθόδου CLUSTAL επινόησε ένα σύστηµα για την εισαγωγή κενών το οποίο να αντιµετωπίζει µε διαφορετικό τρόπο τις διαφορετικές θέσεις των ακολουθιών, λαµβάνοντας υπόψη την πληροφορία η οποία έχει ήδη ενσωµατωθεί σε κάθε επιµέρους στοίχιση. Ειδικότερα, προκειµένου για τη στοίχιση µε τη µέθοδο profile-alignment η εισαγωγή κενών σε µια στοίχιση δεν «τιµωρείται» µε σταθερή ποινή, αλλά µε ποινή η οποία είναι εξαρτώµενη από τη θέση, και το περιεχόµενο της στοίχισης στη θέση αυτή. Εικόνα 9: Ποινές κενών εξαρτώµενες από τη θέση ιαισθητικά (για περισσότερες λεπτοµέρειες δείτε Higgins et al., 1996) µπορείτε να φανταστείτε ότι οι ποινές για την εισαγωγή κενών είναι µικρές σε στήλες της στοίχισης που περιέχουν ήδη κενά, ενώ είναι µεγαλύτερες στις γειτονικές περιοχές ή σε περιοχές που εµφανίζουν συντήρηση. Οµάδες στηλών µε πολλά υδρόφιλα κατάλοιπα (οι οποίες πιθανότατα αντιστοιχούν σε loops στην επιφάνεια της τρισδιάστατης δοµής της πρωτεΐνης) έχουν επίσης µειωµένες ποινές. Ένα παράδειγµα δίνεται στην Εικόνα 9. 24

26 3. Ερωτήσεις 1. ίνεται ένα τµήµα µίας πολλαπλής στοίχισης αµινοξικών ακολουθιών: Seq1: DDRTFRYGP Seq2: DEKSFRFGP Seq3: NDKLFKYGG Seq4: NQHTFRWGG Να υπολογίσετε: A. Το SP score κάθε στήλης B. Το σταθµισµένο SP score κάθε στήλης Σηµείωση: Να χρησιµοποιήσετε τον πίνακα αντικατάστασης BLOSUM62 ίνονται οι παράγοντες στάθµισης w1=0.031, w2 = 0.025, w3 = 0.101, και w4 = Ένας προπτυχιακός φοιτητής βιολογίας ετοιµάζοντας το σεµινάριο που του ανέθεσαν µε θέµα τις αιµοσφαιρίνες, σκέφτηκε ότι θα ήταν πολύ καλό να παρουσιάσει µια πολλαπλή στοίχιση των ακολουθιών που θα µπορούσε να βρει στις βάσεις δεδοµένων. Ο στόχος του διττός: αφενός µεν για να εντυπωσιάσει το ακροατήριο, αφετέρου για να δείξει (αφού πρώτα δει και ο ίδιος) τα διατηρηµένα χαρακτηριστικά στο επίπεδο της αµινοξικής ακολουθίας. Η διαδικασία που ακολούθησε ήταν η παρακάτω: - Στο δικτυακό τόπο πραγµατοποίησε αναζήτηση στις κύριες βάσεις (Swiss-Prot/TrEMBL) µε τον όρο Hemoglobin 25

27 - Ο φοιτητής, τρισευτυχισµένος από το µεγάλο πλήθος ακολουθιών που του επέστρεψε η αναζήτηση στις βάσεις δεδοµένων, άρχισε καρτερικά να αποθηκεύει τις ακολουθίες στον υπολογιστή του. - Χρησιµοποιώντας το CLUSTALW µέσω του διαδικτύου ( κατασκεύασε µια πολλαπλή στοίχιση µε όλες τις ακολουθίες. Να απαντήσετε στα παρακάτω ερωτήµατα: Α. Συµφωνείτε µε τις ενέργειες του συναδέλφου σας; Να δικαιολογήσετε αναλυτικά τις απόψεις σας. Β. Από το σύνολο των εγγραφών που προκύπτουν από την αναζήτηση το συναδέλφου σας να επικεντρώσετε την προσοχή σας σε εκείνες µε Uniprot AC: P18974, Q7M3B8, Q9XSN2, P20244, Q9XSK1, Q9PVM4, P83124, Q865F8. Χρησιµοποιήστε τους σχολιασµούς από τη βάση δεδοµένων και όποια σχετική βιβλιογραφία µπορείτε να βρείτε για να κατασκευάσετε µια (ή περισσότερες) πολλαπλές στοιχίσεις οι οποίες να έχουν (βιολογικά) κάποιο νόηµα. Χρησιµοποιήστε κάποιο από τα εργαλεία που προτείνονται στην ενότητα 4 για την οπτικοποίηση παρουσίαση των αποτελεσµάτων. Γ. Χρησιµοποιείστε το εργαλείο BLAST του NCBI ώστε να εντοπίσετε εάν για κάποια (ες) ακολουθία (ες) που περιλαµβάνονται στην πολλαπλή στοίχιση που κατασκευάσατε υπάρχει κάποια λυµένη δοµή στην Protein Data Bank (PDB, µε σηµαντική οµοιότητα στο επίπεδο της ακολουθίας. Σηµειώστε στην πολλαπλή στοίχιση τη θέση των στοιχείων δευτεροταγούς δοµής µε βάση την πειραµατικά προσδιορισµένη δοµή. Παραθέστε τα σχόλιά σας. 26

28 4. Συµπληρωµατικό Υλικό Χρήσιµες Πηγές στο ιαδίκτυο 1. Εργαλεία πολλαπλής στοίχισης ακολουθιών: CLUSTALW: T-COFFEE: DIALIGN: SAGA: PRALINE: 2. Εργαλεία οπτικοποίησης πολλαπλών στοιχίσεων: BOXSHADE: CINEMA: ESPript: Βιβλιογραφία Carrillo, H. and D. Lipman (1988). The multiple sequence alignment problem in biology. SIAM J. Appl. Math., 48: Feng, D. F. and R. F. Doolittle (1987). Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol, 25(4): Fitch, W. M. and E. Margoliash (1967). Construction of phylogenetic trees. Science, 155(760): Gribskov, M., A. D. McLachlan and D. Eisenberg (1987). Profile analysis: detection of distantly related proteins. Proc Natl Acad Sci U S A, 84(13): Gupta, S. K., J. D. Kececioglu and A. A. Schèaffer (1995). Improving the practical space and time efficiency of the shortest-paths approach to sum-of-pairs multiple sequence alignment. J Comput Biol, 2(3):

29 Gusfield, D. (1997). Algorithms on strings, trees, and sequences : computer science and computational biology. Cambridge [England] ; New York, Cambridge University Press. Higgins, D. G., A. J. Bleasby and R. Fuchs (1992). CLUSTAL V: improved software for multiple sequence alignment. Comput Appl Biosci, 8(2): Higgins, D. G. and P. M. Sharp (1988). CLUSTAL: a package for performing multiple sequence alignment on a microcomputer. Gene, 73(1): Higgins, D. G., J. D. Thompson and T. J. Gibson (1996). Using CLUSTAL for multiple sequence alignments. Methods Enzymol, 266: Hubbard, T. J., A. M. Lesk and A. Tramontano (1996). Gathering them in to the fold. Nat Struct Biol, 3(4): 313. Lipman, D. J., S. F. Altschul and J. D. Kececioglu (1989). A tool for multiple sequence alignment. Proc Natl Acad Sci U S A, 86(12): Mount, D. W. (2001). Bioinformatics : sequence and genome analysis. Cold Spring Harbor, N.Y., Cold Spring Harbor Laboratory Press. Murata, M., J. Richardson and J. Sussman (1985). Simultaneous comparison of three protein sequences. Proc Natl Acad Sci U S A, 82: Myers, E. W. and W. Miller (1988). Optimal alignments in linear space. Comput Appl Biosci, 4(1): Pearson, W. R. and D. J. Lipman (1988). Improved tools for biological sequence comparison. Proc Natl Acad Sci U S A, 85(8): Saitou, N. and M. Nei (1987). The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol, 4(4):

30 Thompson, J. D., D. G. Higgins and T. J. Gibson (1994). CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res, 22(22): Waterman, M. and M. Perlwitz (1984). Line Geometries for Sequence Comparisons. Bulletin of Mathematical Biology, 46(4):

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι)

Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι) Πολλαπλές στοιχίσεις ακολουθιών (Προοδευτικές μέθοδοι) Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Σύνοψη Εισαγωγή Πολλαπλή στοίχιση και

Διαβάστε περισσότερα

Ειδικά Θέματα Βιοπληροφορικής

Ειδικά Θέματα Βιοπληροφορικής Ειδικά Θέματα Βιοπληροφορικής Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1 Πολλαπλή στοίχιση ακολουθιών και φυλογενετικά δέντρα 2 Πολλαπλή στοίχιση Αναφέρεται στην ταυτόχρονη

Διαβάστε περισσότερα

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι

Διαβάστε περισσότερα

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I Σελίδα 1 Πολλαπλή στοίχιση αποκαλύπτει συντηρημένες περιοχές αντιστοίχιση καταλοίπων με κριτήρια ομοιότητας σε επίπεδο δομής εξέλιξης λειτουργίας ακολουθίας Σελίδα 2 Πολλαπλή

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση των μεθόδων πολλαπλής στοίχισης. Ανάδειξη των πλεονεκτημάτων και

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΕΙΣΑΓΩΓΗ Ένας από τους πρωταρχικούς στόχους της σύγκρισης των ακολουθιών δύο µακροµορίων είναι η εκτίµηση της οµοιότητάς τους και η εξαγωγή συµπερασµάτων

Διαβάστε περισσότερα

LALING/PLALING :

LALING/PLALING : 1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της συσχέτισης ομολογίας ομοιότητας. Παρουσίαση των πληροφοριών

Διαβάστε περισσότερα

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου

Διαβάστε περισσότερα

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας Βιοπληροφορική Ι Παντελής Μπάγκος Παν/µιο Στερεάς Ελλάδας Λαµία 2006 1 Βιοπληροφορική Ι Εισαγωγή: Ορισµός της Βιοπληροφορικής, Υποδιαιρέσεις της Βιοπληροφορικής, Τα είδη των δεδοµένων στη Βιοπληροφορική.

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της αναγκαιότητας των ευριστικών αλγορίθμων

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων Φυλογένεση Η φυλογένεσης αφορά την ανεύρεση των συνδετικών εκείνων κρίκων που συνδέουν τα διάφορα είδη µεταξύ τους εξελικτικά, σε µονοφυλετικές

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Αναφορά στις παραλλαγές του BLAST. Εξοικείωση με τη

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της αναγκαιότητας των ευριστικών αλγορίθμων

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι) Πρόγνωση δομής πρωτεϊνών (Μέρος Ι) Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678, Λευκωσία ΚΥΠΡΟΣ

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΕΙΣΑΓΩΓΗ Η αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών (database similarity searching) αποτελεί µια από τις συχνότερα χρησιµοποιούµενες

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου ΕΠΑΝΑΛΗΨΗ Σελίδα 1 τεχνική σύγκρισης ακολουθιών υπολογισµός ενός µέτρου οµοιότητας αναζήτηση ομολογίας S-S match S1 HFCGGSLINEQWVVSAGHC HFCG S NE AGHC S2 HFCGASIYNENYA-TAGHC gap mismatch Σελίδα 2 ολική

Διαβάστε περισσότερα

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο Βιοπληροφορική Blast/PSI-Blast 3o εργαστήριο Αναζήτηση οµόλογων ακολουθιών σε βάσεις δεδοµένων (i) Οµόλογες ακολουθίες πιθανόν να έχουν παρόµοιες λειτουργίες. Ακολουθία επερώτησης (query sequence) Υποκείµενες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 650) Ειδικά Θέματα Βιοπληροφορικής Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα και Πέμπτη

Διαβάστε περισσότερα

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής Παντελής Μπάγκος 1 Διάλεξη 2 Αναζήτηση ομοιότητας και κατά ζεύγη στοίχιση ακολουθιών 2 Κατά ζεύγη στοίχιση ακολουθιών Από τα πιο

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι παρουσίαση των μοντέλων πολλαπλής στοίχισης. κατανόηση των εφαρμογών

Διαβάστε περισσότερα

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast Ασκήσεις 1 & 2 Βάσεις Δεδομένων Εργαλεία Αναζήτησης ClustalW & Blast Μοριακή Προσομοίωση Εισαγωγή: Δομική Βάση Βιολογικών Φαινομένων Η αξιοποίηση του πλήθους των δομικών στοιχείων για την εξαγωγή βιολογικά

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Επεξήγηση των μεθόδων (ανα-)κατασκευής φυλογενετικών δέντρων. Παρουσίαση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 650) Ειδικά Θέματα Βιοπληροφορικής Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Επίκουρος Καθηγητής Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση των εφαρμογών της αναζήτησης

Διαβάστε περισσότερα

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Αναζήτηση οµοιοτήτων ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Σελίδα 1 εδοµένα Ακολουθία επερώτησης (query sequence) Ακολουθίες στη Βάση εδοµένων (subject sequences) Αναζήτηση Μέθοδοι δυναµικού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ BIO 230 Εισαγωγή στην Υπολογιστική Βιολογία Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Επίκουρος Καθηγητής Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα

Διαβάστε περισσότερα

Κεφάλαιο 4 Πολλαπλή Στοίχιση Ακολουθιών

Κεφάλαιο 4 Πολλαπλή Στοίχιση Ακολουθιών Κεφάλαιο 4 Πολλαπλή Στοίχιση Ακολουθιών Σύνοψη Η πολλαπλή στοίχιση είναι μια διαδικασία με κεντρική σημασία στη σύγχρονη βιοπληροφορική. Πολλαπλές στοιχίσεις χρησιμοποιούνται για να εντοπιστούν τα συντηρημένα

Διαβάστε περισσότερα

A sequence alignment algorithm using the transition quantity

A sequence alignment algorithm using the transition quantity 1 1 1 MTRAP A sequence alignment algorithm using the transition quantity Toshihide Hara, 1 Keiko Sato 1 and Masanori Ohya 1 We have been developed a sequence alignment algorithm using the transition quantity.

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Η επιστήμη της Βιολογίας έχει μετατραπεί τα τελευταία χρόνια σε μια υπερπλούσια σε πληροφορίες επιστήμη.

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Τεχνικές κατασκευής δένδρων επιθεµάτων πολύ µεγάλου µεγέθους και χρήσης

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι παρουσίαση και ανάδειξη της σημασίας της φυλογενετικής ανάλυσης. παρουσίαση των

Διαβάστε περισσότερα

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Σελίδα 1 Αναζήτηση ομοιοτήτων Δεδομένα Ακολουθία επερώτησης (query sequence) Ακολουθίες στη Βάση Δεδομένων (subject sequences) Αναζήτηση Μέθοδοι δυναμικού

Διαβάστε περισσότερα

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι Φυλογένεσης Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι που βασίζονται σε χαρακτήρες Μέγιστη φειδωλότητα (Maximum

Διαβάστε περισσότερα

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής.  Στοίχιση αλληλουχιών Στοίχιση αλληλουχιών Σύνοψη Καθολική στοίχιση Μήτρες βαθμολόγησης Τοπική στοίχιση Στοίχιση με ποινές εισαγωγής κενών Από την LCS στη στοίχιση: αλλαγές στη βαθμολόγηση Το πρόβλημα της Μεγαλύτερης Κοινής

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι κατανόηση της μεθόδου προτυποποίησης πρωτεϊνών με ομολογία. παρουσίαση

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι επισκόπηση των μεθόδων αναγνώρισης διπλώματος και απ αρχής πρόγνωσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 003) Εισαγωγή στη Βιοπληροφορική Διδάσκοντες: Χρήστος Ουζούνης, Βασίλειος Ι. Προµπονάς ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Τρίτη και Παρασκευή 10:30 12:00,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 003) Εισαγωγή στη Βιοπληροφορική Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Φροντιστήριο Τρίτη και

Διαβάστε περισσότερα

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος Ι: Στοιχίσεις ακολουθιών κατά ζεύγη Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο

Διαβάστε περισσότερα

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

Πρόβλημα. Σύνολο γνωστών αλληλουχιών BLAST Πρόβλημα Άγνωστη αλληλουχία Σύνολο γνωστών αλληλουχιών Η χρήση ενός υπολογιστή κι ενός αλγόριθμου είναι απαραίτητη για την ανακάλυψη της σχέσης μιας αλληλουχίας με τις γνωστές υπάρχουσες Τί είναι

Διαβάστε περισσότερα

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Εισαγωγή Βασικές αρχές δομής πρωτεϊνών και νουκλεϊκών

Διαβάστε περισσότερα

Συγκριτική Γονιδιωματική

Συγκριτική Γονιδιωματική ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Συγκριτική Γονιδιωματική Παντελής Μπάγκος 1 2 Μέθοδοι Ανάλυσης Μέθοδοι βασισμένες στην ομοιότητα ακολουθιών Τοπική ομοιότητα Ολική ομοιότητα Προγνωστικές μέθοδοι Δευτεροταγής δομή Διαμεμβρανικά

Διαβάστε περισσότερα

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση κατά ζεύγη: Τι είναι Αντιστοίχιση των νουκλεοτιδίων/αµινοξέων δυο ακολουθιών, ώστε να εντοπιστούν οι οµοιότητες και οι διαφορές τους. Χρησιµοποιείται

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Αναφορά στη χρησιμότητα των βιολογικών ΒΔ. Κατανόηση των χαρακτηριστικών, των ιδιαιτεροτήτων

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 11: Πολλαπλή Στοίχιση Ακολουθιών, 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 11: Πολλαπλή Στοίχιση Ακολουθιών, 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 11: Πολλαπλή Στοίχιση Ακολουθιών, 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι κατανόηση της έννοιας και των εφαρμογών της πολλαπλής στοίχισης ακολουθιών.

Διαβάστε περισσότερα

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Ομολογία Σελίδα 2 Ομολογία Ομολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός διπλασιασμός

Διαβάστε περισσότερα

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης) PSI-Blast PSI-Blast PSI-Blast: τι είναι PSI-Blast: Position-specific iterated Blast Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης) Altschul et al., 1997 http://www.ncbi.nlm.nih.gov/pmc/articles/pmc146917/pdf/253389.pdf

Διαβάστε περισσότερα

Πολλαπλή στοίχιση multiple sequence alignment (MSA)

Πολλαπλή στοίχιση multiple sequence alignment (MSA) Πολλαπλή στοίχιση multiple sequence alignment (MSA) MSA: Τι είναι Στοίχιση για 3 ή περισσότερες ακολουθίες. Αποκαλύπτονται οι συντηρηµένες περιοχές µεταξύ των ακολουθιών µιας οικογένειας. Χρειάζεται για:

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 1 Αναζήτηση πληροφορίας σε βιολογικές ΒΔ Αναζήτηση δεδομένων στην UniProt Καταγράψτε το μήκος της αμινοξικής ακολουθίας (Sequence length), τη λειτουργία (Function)

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Αναφορά στις παραλλαγές του BLAST. Εξοικείωση με τη

Διαβάστε περισσότερα

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ BIO 331 - Αρχές και Μέθοδοι Βιοπληροφορικής I Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα και Πέμπτη

Διαβάστε περισσότερα

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678,

Διαβάστε περισσότερα

Φυλογένεση. 5o εργαστήριο

Φυλογένεση. 5o εργαστήριο Φυλογένεση 5o εργαστήριο Φυλογένεση οργανισµών Δείχνει την εξελικτική πορεία µιας οµάδας οργανισµών. Οι κόµβοι (nodes) στο δένδρο απεικονίζουν γεγονότα ειδογένεσης. H φυλογένεση µπορεί να γίνει από µια

Διαβάστε περισσότερα

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 3 η : Πολλαπλή ευθυγράμμιση. Σ. Γκέλης Τμήμα Βιολογίας

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Βιοπληροφορική. Ενότητα 3 η : Πολλαπλή ευθυγράμμιση. Σ. Γκέλης Τμήμα Βιολογίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3 η : Πολλαπλή ευθυγράμμιση Σ. Γκέλης Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus ΣΥΝΟΨΗ Εισαγωγή Πρόγνωση της δομής πρωτεϊνών

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 7: Σύγκριση αλληλουχιών Part II Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr

Διαβάστε περισσότερα

Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών

Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας. Πίνακες αντικατάστασης για σύγκριση ακολουθιών Αλγόριθµοι Εύρεσης Οµοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σηµαντικότητας Πίνακες αντικατάστασης για σύγκριση ακολουθιών Vasilis Promponas Bioinformatics Research Laboratory Department of

Διαβάστε περισσότερα

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading Άσκηση 7 Προσομοίωση 3D Δομών Βιομορίων μέσω Ομολογίας & Threading Προσομοίωση 2ταγούς δομής πρωτεϊνών Δευτεροταγής Δομή: Η 2ταγής δομή των πρωτεϊνών είναι σταθερή τοπική διαμόρφωση της πολυπεπτιδικής

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 12: Αναζήτηση ομοιοτήτων έναντι βάσεων δεδομένων με τη χρήση ευρετικών αλγορίθμων Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr

Διαβάστε περισσότερα

ιαµέριση - Partitioning

ιαµέριση - Partitioning ιαµέριση - Partitioning ιαµέριση ιαµέριση είναι η διαµοίραση αντικειµένων σε οµάδες µε στόχο την βελτιστοποίηση κάποιας συνάρτησης. Στην σύνθεση η διαµέριση χρησιµοποιείται ως εξής: Οµαδοποίηση µεταβλητών

Διαβάστε περισσότερα

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον Δανάη Κούτρα Eργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων Εθνικό Μετσόβιο Πολυτεχνείο Θέματα Σκοπός της διπλωματικής

Διαβάστε περισσότερα

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Σύνοψη Βασικές έννοιες XNU SEG LCRs και αναζητήσεις

Διαβάστε περισσότερα

Μέθοδοι μελέτης εξέλιξης

Μέθοδοι μελέτης εξέλιξης H διερεύνηση της μοριακής βάσης της εξέλιξης βασίζεται σε μεγάλο βαθμό στη διευκρίνιση της διαδικασίας με την οποία μετασχηματίσθηκαν στη διάρκεια της εξέλιξης πρωτεϊνες, άλλα μόρια και βιοχημικές πορείες

Διαβάστε περισσότερα

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 3

Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου 3 Γραµµικη Αλγεβρα Ι Επιλυση Επιλεγµενων Ασκησεων Φυλλαδιου ιδασκοντες: Ν Μαρµαρίδης - Α Μπεληγιάννης Βοηθος Ασκησεων: Χ Ψαρουδάκης Ιστοσελιδα Μαθηµατος : http://wwwmathuoigr/ abeligia/linearalgebrai/laihtml

Διαβάστε περισσότερα

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Δομές Δεδομένων. Δημήτρης Μιχαήλ. Συμβολοσειρές. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Δομές Δεδομένων Συμβολοσειρές Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Συμβολοσειρές Συμβολοσειρές και προβλήματα που αφορούν συμβολοσειρές εμφανίζονται τόσο συχνά που

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι παρουσίαση των μοντέλων πολλαπλής στοίχισης. κατανόηση των εφαρμογών

Διαβάστε περισσότερα

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ ΑΡΧΕΣ ΒΙΟΛΟΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ Εργαστήριο Βιοπληροφορικής 7 ο εξάμηνο Σχολή Μηχανολόγων Μηχανικών ΕΜΠ Διδάσκων: Λεωνίδας Αλεξόπουλος Fritz Kahn (1888 1968) 1 Περιεχόμενα Ομοιότητα πρωτεϊνών Σύγκριση αλληλουχιών

Διαβάστε περισσότερα

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016 Βιοπληροφορική Μαργαρίτα Θεοδωροπούλου Πανεπιστήμιο Θεσσαλίας, Λαμία 2016 Βιοπληροφορική Εισαγωγή στη Μοριακή Βιολογία, Γενωμική και Βιοπληροφορική. Βάσεις Βιολογικών Δεδομένων. Ακολουθίες Πρωτεϊνών και

Διαβάστε περισσότερα

5.1 Δραστηριότητα: Εισαγωγή στο ορισμένο ολοκλήρωμα

5.1 Δραστηριότητα: Εισαγωγή στο ορισμένο ολοκλήρωμα 5.1 Δραστηριότητα: Εισαγωγή στο ορισμένο ολοκλήρωμα Θέμα της δραστηριότητας Η δραστηριότητα εισάγει τους μαθητές στο ολοκλήρωμα Riemann μέσω του υπολογισμού του εμβαδού ενός παραβολικού χωρίου. Στόχοι

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Χατζηλιάδη Παναγιώτα Ευανθία ΜΠΣ «ΜΕΘΟΔΟΛΟΓΙΑ ΒΪΟΙΑΤΡΙΚΗΣ ΕΡΕΥΝΑΣ, ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΚΛΙΝΙΚΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ» ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΙΑΤΡΙΚΗΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «Ανάπτυξη λογισμικού σε γλώσσα προγραματισμού python για ομαδοποίηση

Διαβάστε περισσότερα

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6) Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Πολιτικών Μηχανικών Τοµέας Υδατικών Πόρων Μάθηµα: Τυπικά Υδραυλικά Έργα Μέρος 2: ίκτυα διανοµής Άσκηση E0: Μαθηµατική διατύπωση µοντέλου επίλυσης απλού δικτύου διανοµής

Διαβάστε περισσότερα

Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών

Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών 1 Αλγόριθµοι δροµολόγησης µε µέσα µαζικής µεταφοράς στο µεταφορικό δίκτυο των Αθηνών ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ της Κωτσογιάννη Μαριάννας Περίληψη 1. Αντικείµενο- Σκοπός Αντικείµενο της διπλωµατικής αυτής εργασίας

Διαβάστε περισσότερα

Περίληψη ιπλωµατικής Εργασίας

Περίληψη ιπλωµατικής Εργασίας Περίληψη ιπλωµατικής Εργασίας Θέµα: Εναλλακτικές Τεχνικές Εντοπισµού Θέσης Όνοµα: Κατερίνα Σπόντου Επιβλέπων: Ιωάννης Βασιλείου Συν-επιβλέπων: Σπύρος Αθανασίου 1. Αντικείµενο της διπλωµατικής Ο εντοπισµός

Διαβάστε περισσότερα

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Περιεχόμενα Παρουσίασης Βιολογικό υπόβαθρο Το κεντρικό αξίωμα Σύνοψη της Βιοπληροφορικής Ερευνητικές περιοχές Πηγές πληροφοριών Τι είναι η Βιοπληροφορική Βιο Πληροφορική μοριακή

Διαβάστε περισσότερα

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 Βιοπληροφορική Ι Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1 Στοίχιση αλληλουχιών 2 Τρόποι μελέτης των ακολουθιών Global information Η ακολουθία αναπαρίσταται από ένα διάνυσμα

Διαβάστε περισσότερα

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II Σελίδα 1 Υπολογιστικός Προσδιορισμός Δομής πειραματικός προσδιορισμός δομών κρυσταλλογραφία ακτίνων X πυρηνικός μαγνητικός συντονισμός (NMR) χρόνος / κόστος / περιορισμοί sequence - structure

Διαβάστε περισσότερα

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6. Πανεπιστήµιο Πειραιώς - Τµήµα Πληροφορικής Εξόρυξη Γνώσης από εδοµένα (Data Mining) Εξόρυξη Γνώσης από χωρικά δεδοµένα (κεφ. 8) Γιάννης Θεοδωρίδης Νίκος Πελέκης http://isl.cs.unipi.gr/db/courses/dwdm Περιεχόµενα

Διαβάστε περισσότερα

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2016-17 Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα) http://mixstef.github.io/courses/csintro/ Μ.Στεφανιδάκης Αφηρημένες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 435: ΑΛΛΗΛΕΠΙ ΡΑΣΗ ΑΝΘΡΩΠΟΥ ΥΠΟΛΟΓΙΣΤΗ Ακαδηµαϊκό Έτος 2004 2005, Χειµερινό Εξάµηνο 2 Η ΟΜΑ ΙΚΗ ΕΡΓΑΣΙΑ: ΑΝΑΠΤΥΞΗ ΑΡΧΙΚΗΣ Ι ΕΑΣ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΚΑΙ ΑΝΑΛΥΣΗ ΑΝΑΓΚΩΝ

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 1: Εισαγωγή στη Βιοπληροφορική

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 1: Εισαγωγή στη Βιοπληροφορική Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 1: Εισαγωγή στη Βιοπληροφορική Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr ΕΕΔΙΠ Μπέλλου Σοφία e-mail: sbellou@uowm.gr

Διαβάστε περισσότερα

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Πρακτική µε στοιχεία στατιστικής ανάλυσης Πρακτική µε στοιχεία στατιστικής ανάλυσης 1. Για να υπολογίσουµε µια ποσότητα q = x 2 y xy 2, µετρήσαµε τα µεγέθη x και y και βρήκαµε x = 3.0 ± 0.1και y = 2.0 ± 0.1. Να βρεθεί η ποσότητα q και η αβεβαιότητά

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ 1 ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΚΕΦΑΛΑΙΟ 3ο: ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΜΕΡΟΣ 2 ο : ΣΤΟΙΒΑ & ΟΥΡΑ ΙΣΤΟΣΕΛΙΔΑ ΜΑΘΗΜΑΤΟΣ: http://eclass.sch.gr/courses/el594100/ ΣΤΟΙΒΑ 2 Μια στοίβα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ Παύλος Αντωνίου Με μια ματιά: Εισαγωγή στη Βιολογία Ευθυγράμμιση Ακολουθιών Αναζήτηση ομοίων ακολουθιών από βάσεις δεδομενων Φυλογενετική πρόβλεψη Πρόβλεψη

Διαβάστε περισσότερα

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι επισκόπηση των βασικών στοιχείων των πρωτεϊνικών δομών. συσχέτιση ακολουθίας δομής λειτουργίας.

Διαβάστε περισσότερα

Αλγόριθµοι και Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα Αλγόριθµοι και Πολυπλοκότητα Ν. Μ. Μισυρλής Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών Καθηγητής: Ν. Μ. Μισυρλής () Αλγόριθµοι και Πολυπλοκότητα 15 Ιουνίου 2009 1 / 26 Εισαγωγή Η ϑεωρία

Διαβάστε περισσότερα

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων. ΠΕΡΙΛΗΨΗ Η τεχνική αυτή έκθεση περιλαµβάνει αναλυτική περιγραφή των εναλλακτικών µεθόδων πολυκριτηριακής ανάλυσης που εξετάσθηκαν µε στόχο να επιλεγεί η µέθοδος εκείνη η οποία είναι η πιο κατάλληλη για

Διαβάστε περισσότερα

Στο Κεφάλαιο 5 µελετώντας την προβολή του τρισδιάστατου χώρου στο επίπεδο της κάµερας εξετάστηκε

Στο Κεφάλαιο 5 µελετώντας την προβολή του τρισδιάστατου χώρου στο επίπεδο της κάµερας εξετάστηκε Κεφάλαιο 6 Αποκοπή (clipping) Στο Κεφάλαιο 5 µελετώντας την προβολή του τρισδιάστατου χώρου στο επίπεδο της κάµερας εξετάστηκε η διαδικασία προβολής µεµονωµένων σηµείων και µόνο προς το τέλος του κεφαλαίου

Διαβάστε περισσότερα

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια Graph Algorithms Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια Περιεχόμενα Μεταβατικό Κλείσιμο Συνεκτικές συνιστώσες Συντομότερα μονοπάτια Breadth First Spanning

Διαβάστε περισσότερα

Chapter 6. Problem Solving and Algorithm Design. Στόχοι Ενότητας. Επίλυση προβληµάτων. Εισαγωγή. Nell Dale John Lewis

Chapter 6. Problem Solving and Algorithm Design. Στόχοι Ενότητας. Επίλυση προβληµάτων. Εισαγωγή. Nell Dale John Lewis Στόχοι Ενότητας Chapter 6 Problem Solving and Algorithm Design Nell Dale John Lewis Αναγνώριση αν ένα πρόβληµα µπορεί να επιλυθεί µε τη χρήση υπολογιστή Περιγραφή της διαδικασίας επίλυσης προβληµάτων και

Διαβάστε περισσότερα

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) +

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) + KΕΦΑΛΑΙΟ 4 Κλασσικές Μέθοδοι Βελτιστοποίησης Με Περιορισµούς Ανισότητες 4. ΠΡΟΒΛΗΜΑΤΑ ΜΕ ΠΕΡΙΟΡΙΣΜΟΥΣ ΑΝΙΣΟΤΗΤΕΣ Ζητούνται οι τιµές των µεταβλητών απόφασης που ελαχιστοποιούν την αντικειµενική συνάρτηση

Διαβάστε περισσότερα