ΜΕΛΕΤΗ ΜΕ ΥΠΟΛΟΓΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΑΝΘΡΩΠΙΝΗΣ ΠΡΩΤΕΪΝΗΣ GEMININB

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΕΛΕΤΗ ΜΕ ΥΠΟΛΟΓΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΑΝΘΡΩΠΙΝΗΣ ΠΡΩΤΕΪΝΗΣ GEMININB"

Transcript

1 ΣΧΟΛΗ ΙΑΤΡΙΚΗΣ ΤΜΗΜΑ ΒΙΟΛΟΓΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΠΛΗΡΟΦΟΡΙΚΗ ΕΠΙΣΤΗΜΩΝ ΖΩΗΣ ΜΕΛΕΤΗ ΜΕ ΥΠΟΛΟΓΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΑΝΘΡΩΠΙΝΗΣ ΠΡΩΤΕΪΝΗΣ GEMININB ΔΡΙΤΣΟΠΟΥΛΟΥ ΕΛΕΝΗ Α.Μ. 1003

2 ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΕΧΟΜΕΝΑ 2

3 ΠΕΡΙΕΧΟΜΕΝΑ ΕΙΣΑΓΩΓΗ Υπολογιστικές μέθοδοι εύρεσης γονιδίων Ανάλυση ακολουθίας Εύρεση ομοιότητας Πολλαπλή στοίχιση ακολουθιών Φυλογενετικές σχέσεις Ανάλυση Πρωτεϊνικής δομής Δευτεροταγής δομή Τριτοταγής δομή Ρύθμιση της αντιγραφής του κυττάρου και ρόλος της Geminin 34 ΣΤΟΧΟΣ 37 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ 39 ΑΠΟΤΕΛΕΣΜΑΤΑ Προσδιορισμός με υπολογιστικά εργαλεία της αμινοξικής ακολουθίας της πρωτεΐνης Εύρεση της ανθρώπινης GemininB μέσω της ομόλογής της Geminin Ανάλυση της γονιδιακής περιοχής της GemininB με βάση το πρόγραμμα MapViewer Πρόβλεψη του προτεινόμενου mrna της GemininB Εύρεση πιθανής γονιδιακής δομής Πιθανή εμφάνιση μορφών εναλλακτικού ματίσματος Προσδιορισμός αμινοξικής ακολουθίας των τριών πιθανών εναλλακτικών μορφών Ανάλυση της παραγόμενης πρωτεϊνικής ακολουθίας Προσδιορισμός φυσικοχημικών ιδιοτήτων της GemininB Εύρεση συντηρημένων δομικών περιοχών (domains) και προϊόντων αλληλούχισης (patterns) που παρουσιάζονται στις αμινοξικές ακολουθίες των τριών εναλλακτικών μορφών της GemininB και εύρεση της οικογένειας στην οποία πιθανώς ανήκουν Εύρεση της ομοιότητας των εναλλακτικών μορφών με τη Geminin Προσδιορισμός με διαδικτυακά εργαλεία της δευτεροταγούς και τριτοταγούς δομής Εύρεση πιθανής δευτεροταγούς δομής με τα προγράμματα PHD και PROF Εύρεση πιθανής τριτοταγούς δομής Εύρεση ομολόγων σε άλλους οργανισμούς και κατασκευή φυλογενετικού δένδρου με το πρόγραμμα ClustalW 68 3

4 ΠΕΡΙΕΧΟΜΕΝΑ ΣΥΖΗΤΗΣΗ 74 ΠΕΡΙΛΗΨΗ 80 ΒΙΒΛΙΟΓΡΑΦΙΑ 83 4

5 ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ 5

6 ΕΙΣΑΓΩΓΗ 1.1 Υπολογιστικές μέθοδοι εύρεσης γονιδίων Τα τελευταία χρόνια οι υπολογιστές κατακτούν σημαντική θέση σε κάθε τομέα της ζωής μας αλλά πιο ενδιαφέρουσα και προκλητική στους τομείς διαφόρων επιστημών. Η βιοπληροφορική αποτελεί ένα νέο πεδίο έρευνας, η οποία βασίζεται στα επιτεύγματα της επιστήμης των υπολογιστών και της μοριακής βιολογίας. Η τομή που παρουσιάζει ο νέος αυτός επιστημονικός κλάδος αποτελεί η χρησιμοποίηση βάσεων δεδομένων για την ανάλυση πρωτεϊνών, γονιδίων (Pevsner 2003) Από την έναρξη του πρoγράμματος για την αλληλούχιση του ανθρώπινου γονιδιώματος (Human Genome Project) το 1990, τα γονιδιώματα του ανθρώπου και πολλών οργανισμών μοντέλων έχουν αλληλουχηθεί και πολλά άλλα βρίσκονται σε εξέλιξη. Η μετατροπή όμως όλων αυτών των μη επεξεργασμένων δεδομένων σε ουσιαστική γνώση αποτελεί ένα δύσκολο εγχείρημα (Wang, Chen et al. 2004). Πολλά υπολογιστικά προγράμματα έχουν δημιουργηθεί με σκοπό να φέρουν σε πέρας μέρος αυτού του εγχειρήματος ένα τμήμα της ανάλυσης αυτής αφορά την πρόβλεψη των γονιδιακών περιοχών στα γονιδιώματα των οργανισμών (Wang, Chen et al. 2004). Η ανάγκη για ακριβή και γρήγορα εργαλεία που θα μπορούν να προβλέπουν τις γονιδιακές περιοχές στα γονιδιώματα καθώς και τις λειτουργίες τους είναι σήμερα πολύ μεγάλη (Wang, Chen et al. 2004). Για την πρόβλεψη γονιδίων αξιοποιούνται δύο πηγές πληροφοριών η πρώτη βασίζεται στη χρησιμοποίηση μεθόδων εύρεσης ομολογίας με γονιδιακές περιοχές και οι μέθοδοι αυτοί ονομάζονται και εξωγενείς ( extrinsic ) μέθοδοι (Borodovsky, Rudd et al. 1994) και η δεύτερη βασίζεται σε δομικά στοιχεία των γονιδίων καθώς και σε εύρεση μοτίβων (signal based searches) και καλούνται ab initio μέθοδοι (Fickett 1996) (Rouze, Pavy et al. 1999). Υπάρχουν και τεχνικές που συνδυάζουν και τις δύο μεθόδους. Στη παρακάτω εικόνα συνοψίζονται όλες οι προσεγγίσεις για την εύρεση γονιδίων. 6

7 ΕΙΣΑΓΩΓΗ Εικόνα 1.1: Διαγραμματική απεικόνιση των υπολογιστικών προσεγγίσεων για την εύρεση γονιδίων Η εύρεση γονιδίων στους προκαρυωτικούς οργανισμούς είναι λιγότερο δύσκολη από την εύρεση γονιδίων στους ευκαρυωτικούς οργανισμούς λόγω του ότι οι διαγονιδιακές τους περιοχές είναι πιο μικρές και δεν παρουσιάζουν ιντρόνια (Wang, Chen et al. 2004). Οπότε η εύρεση του μεγαλύτερου σε μέγεθος ανοιχτού πλαισίου ανάγνωσης (ORF-Open Reading Frame), από το κωδικόνιο έναρξης ως το κωδικόνιο λήξης, αποτελεί ισχυρή ένδειξη για την ύπαρξη ενός γονιδίου όχι όμως μόνη και ικανοποιητική (Wang, Chen et al. 2004). Κάποιοι προγράμματα που ενδείκνυνται για την πρόβλεψη προκαρυωτικών γονιδίων χρησιμοποιούν διαφορετικών τύπων αλυσίδες Markov για την εύρεση των διαφορετικών μοτίβων που παρουσιάζονται στην αλληλουχία μεταξύ των κωδικών περιοχών, των περιοχών που μεταγράφονται από την άλλη αλυσίδα και των μη κωδικών περιοχών (Wang, Chen et al. 2004). Ένα μοντέλο Markov τάξης κ αποτελεί ένα στοχαστικό μοντέλο που υποθέτει ότι η πιθανότητα εμφάνισης μιας νουκλεοτιδικής βάσης(a. T, G, C) σε μια συγκεκριμένη θέση εξαρτάται από τα προηγούμενα κ νουκλεοτίδια (Mathe, Sagot et al. 2002). Προγράμματα εύρεσης προκαρυωτικών γονιδίων είναι το GENMARK και ο αλγόριθμος του Glimmer τα οποία παρουσιάζουν καλή απόδοση (Mathe, Sagot et al. 2002). Οι δυσκολίες που παρουσιάζονται στη πρόβλεψη προκαρυωτικών γονιδίων είναι ότι συχνά τα γονίδιά τους επικαλύπτονται και είναι δύσκολο να προβλεφθεί σωστά το κωδικόνιο έναρξης της μετάφρασης (Mathe, Sagot et al. 2002). Η παρούσα εργασία θα επικεντρωθεί στην πρόβλεψη των ευκαρυωτικών γονιδίων, αφού στη παρούσα εργασία ερευνάται η δομή ενός ανθρώπινου γονιδίου. Τα 7

8 ΕΙΣΑΓΩΓΗ ευκαρυωτικά γονίδια ορίζονται ως οι περιοχές που μεταγράφονται μαζί με τις περιοχές που ρυθμίζουν in cis τη γονιδιακή έκφραση, όπως είναι η περιοχή του υποκινητή, που ελέγχει τη θέση και το εύρος της μεταγραφής και συνήθως βρίσκεται στο 5 άκρο του γονιδίου (Mathe, Sagot et al. 2002). Τα υπάρχοντα προγράμματα πρόβλεψης γονιδίων αναζητούν μόνο τις μεταγραφόμενες περιοχές και αυτές ονομάζουν γονίδια (Mathe, Sagot et al. 2002). Στα ευκαρυωτικά γονίδια οι μεταγραφόμενες περιοχές συνήθως αποτελούν μικρό μόνο μέρος ολόκληρου του γονιδιώματος εν αντιθέσει με τα προκαρυωτικά γονίδια (Mathe, Sagot et al. 2002). Οι εξωγενείς μέθοδοι πρόβλεψης γονιδίων βασίζονται σε ανιχνευτές περιεχομένου (Content sensors), οι οποίοι προσπαθούν να κατατάξουν τις γονιδιακές περιοχές σε τύπους (π.χ. κωδικές και μη κωδικές περιοχές) (Mathe, Sagot et al. 2002). Οι εξωγενείς ανιχνευτές περιεχομένου (extrinsic content sensors), δε βασίζονται αποκλειστικά σε στοιχεία της ακολουθίας αλλά αξιοποιούν και τις ομοιότητες μεταξύ μιας γονιδιακής περιοχής και των ESTs (expressed sequence tags), και με σύγκριση με γνωστά γονιδιωμάτα και πρωτεΐνες, που υπάρχουν σε βάσεις δεδομένων. Η σύγκριση της γονιδιακής περιοχής με βάσεις δεδομένων που περιέχουν ESTs μπορεί να δώσουν σημαντικές ενδείξεις για την ύπαρξη γονιδίων. Τα ESTs αποτελούν μικρές μεταγραφόμενες γονιδιακές ακολουθίες των οποίων ο αριθμός τα τελευταία χρόνια έχει αυξηθεί πάρα πολύ. Για το λόγω αυτό, αν και περιέχουν λάθη, αποτελούν ένδειξη για την ύπαρξη ενός γονιδίου, διότι για μια γονιδιακή περιοχή που μεταφράζεται, υπάρχουν πολλά ESTs τα οποία αλληλοεπικαλίπτονται και ο ερευνητής αντιλαμβάνεται τα λάθη που τυχόν περιέχουν (Wang, Chen et al. 2004). Η σύγκριση με EST βάσεις δεδομένων αποτελεί την πιο ισχυρή ένδειξη για την ύπαρξη ενός γονιδίου και η ομοιότητα με ένα μόνο EST μπορεί να είναι αρκετή για να υποπτευθούμε την ύπαρξη ενός γονιδίου (Mathe, Sagot et al. 2002). Υπολογίζεται ότι περίπου το 50% των γονιδίων μπορεί να προβλεφθεί λόγω ομοιότητας με ομόλογες πρωτεϊνικές ακολουθίες (Mathe, Sagot et al. 2002). Και σε αυτή τη περίπτωση όμως είναι δύσκολο να προβλεφθεί η ακριβής δομή του γονιδίου καθώς ομόλογες πρωτεΐνες μπορεί να μη μοιράζονται όλα τα δομικά τους τμήματα (domains) (Mathe, Sagot et al. 2002). Φυσικά οι μη μεταφραζόμενες περιοχές των γονιδίων δεν μπορούν να εντοπιστούν με αυτή τη μέθοδο (Mathe, Sagot et al. 2002). Γνωρίζοντας ότι οι κωδικές περιοχές είναι πιο συντηρημένες από τις μη κωδικές περιοχές, η σύγκριση μιας γονιδιακής ακολουθίας με γενομικό DNA μπορεί να δώσει 8

9 ΕΙΣΑΓΩΓΗ πληροφορίες για την ύπαρξη ιντρονίων και εξωνίων. Η εύρεση ομοιοτήτων με γονιδιακές ακολουθίες που βρίσκονται στο ίδιο γονιδίωμα αποτελεί ένδειξη για ομόλογες πρωτεΐνες που αποτελούν μέλη πολύ-γονιδιωματικών οικογενειών, ενώ η εύρεση ομοιοτήτων με γονιδιακές ακολουθίες σε διαφορετικά (συνήθως συγγενικά) γονιδιώματα αποτελούν ένδειξη για ύπαρξη ορθόλογων πρωτεϊνών με παρεμφερή λειτουργία (Mathe, Sagot et al. 2002). Οι ab initio μέθοδοι βασίζονται σε ανιχνευτές περιεχομένου και σε ανιχνευτές σινιάλων (Signal sensors). Στα ευκαρυωτικά γονιδιώματα οι ab initio ανιχνευτές περιεχομένου δε μπορούν να στηριχθούν μόνο στο μέγεθος του ανοιχτού πλαισίου ανάγνωσης, όπως στα προκαρυωτικά γονίδια, διότι αυτό συνήθως είναι πολύ μικρό (Fickett 1995). Για το λόγο αυτό οι συγκεκριμένοι ανιχνευτές περιεχομένου χρησιμοποιούν και άλλα στοιχεία εκτός από το μέγεθος του ανοιχτού πλαισίου ανάγνωσης όπως είναι : o o Η νουκλεοτιδική σύσταση της ακολουθίας. Αφού τα ιντρόνια είναι πιο πλούσια σε A/T από ότι τα εξώνια, ιδιαίτερα στα φυτά (Mathe, Sagot et al. 2002). Η συχνότητα των εξαμερών (hexamer frequency) η οποία βρίσκεται με μοντέλα Markov. Ομογενή μηδενικής τάξης Markov μοντέλα, που υποθέτουν ότι η κάθε βάση εμφανίζεται ανεξάρτητα από τις προηγούμενες, εφαρμόζονται κυρίως για μη κωδικές περιοχές, ενώ τα τρία περιοδικά (periodic) Markov μοντέλα (τρία διαφορετικά Markov μοντέλα) τάξης 5 ή μικρότερης εφαρμόζονται συνήθως για εύρεση κωδικών περιοχών (Mathe, Sagot et al. 2002). Υποθέτουν δηλαδή ότι οι μη κωδικές περιοχές παρουσιάζουν διαφορετικό μοτίβο νουκλεοτιδικής σύστασης από ότι οι κωδικές περιοχές. Για να προβλέψουν, αν μια περιοχή αποτελεί κωδική ή μη κωδική αλληλουχία, χωρίζουν την ακολουθία σε εξαμερή και την κατατάσσουν σε κωδική ή μη, ανάλογα με το ποια αλυσίδα Markov ανταποκρίνεται καλύτερα σε αυτήν. Οι ab initio ανιχνευτές σινιάλων στηρίζονται σε μικρές συντηρημένες νουκλεοτιδικές ακολουθίες, μοτίβα, όπως είναι οι θέσεις ματίσματος (spliced sites), που περιλαμβάνουν τα σημεία διακλάδωσης (branch points) τις πολυπυριμιδινικές περιοχές ( polypyrimidine tracks) και τα κωδικόνια έναρξης και λήξης (Wang, Chen et al. 2004). 9

10 ΕΙΣΑΓΩΓΗ Αξίζει να σημειώσουμε ότι τα εργαλεία που χρησιμοποιούν οι ab initio μέθοδοι δημιουργούνται με βάση γνωστές ακολουθίες, και για το λόγο αυτό η εφαρμογή τους περιορίζεται στις ακολουθίες που συμπεριφέρονται όπως και οι ακολουθίες εκμάθησης των αλγορίθμων που χρησιμοποιούν τα εργαλεία (Mathe, Sagot et al. 2002). Αφού τόσο οι προσεγγίσεις που βασίζονται σε εύρεση ομοιότητας όσο και οι ab initio προσεγγίσεις παρουσιάζουν ελαττώματα και περιορισμούς έχουν δημιουργηθεί κάποια νέα προγράμματα που βασίζονται και στις δύο προσεγγίσεις, ενώ κάποια υπάρχοντα προγράμματα που βασίζονται σε ab initio μεθόδους έχουν προσθέσει στοιχεία ομολογίας (Mathe, Sagot et al. 2002). Τα προγράμματα που δίνουν ως εξώνια μόνο τα εξώνια που προβλέπονται από όλους τους επιμέρους αλγόριθμους που χρησιμοποιούν, είναι πιο σίγουρα, αλλά παρουσιάζουν μικρή ευαισθησία, με αποτέλεσμα να «χάνονται» πολλά εξώνια (Mathe, Sagot et al. 2002). Υπάρχουν και πλατφόρμες οι οποίες δίνουν το αποτέλεσμα όλων των προγραμμάτων που περιέχουν, είτε αυτά βασίζονται σε μεθόδους εύρεσης ομολογίας είτε σε ab initio μεθόδους (Mathe, Sagot et al. 2002). Τέτοιες πλατφόρμες είναι το ENSEMBL (Hubbard, Barker et al. 2002) και το MagPie (Gaasterland and Sensen 1996). Οι προσεγγίσεις που προαναφέρθηκαν κυρίως χρησιμοποιούνται για την πρόβλεψη γονίδιων που μεταφράζονται σε πρωτεΐνες. Εμφανίστηκε όμως τελευταία από τον Glusman και Qin (Glusman, Qin et al. 2006) μια τρίτη προσέγγιση στην εύρεση γονιδίων και αναφέρεται κυρίως σε γονίδια τα οποία δεν μεταφράζονται σε πρωτεΐνη καθώς και σε γονίδια που εμφανίζουν μεγάλα ιντρόνια και στερούνται συντηρημένων περιοχών (Glusman, Qin et al. 2006). Η προσέγγιση αυτή βασίζεται στην εύρεση «αποτυπωμάτων» μεταγραφής (transcriptional footprints), τα οποία δημιουργούνται λόγω της μεγάλης συχνότητας μεταγραφής της γονιδιακής ακολουθίας με αποτέλεσμα να έχουν δημιουργηθεί διαφορές στις δύο αλυσίδες του DNA οι οποίες μπορούν να ανακαλυφθούν με κατάλληλη στατιστική ανάλυση (Glusman, Qin et al. 2006).(Mathe, Sagot et al. 2002). Συμπερασματικά αντιλαμβανόμαστε πως, αν και γίνονται μεγάλες προσπάθειες για την εύρεση όλο και γρηγορότερων και αποτελεσματικότερων εργαλείων για την πρόβλεψη γονιδίων, τα αποτελέσματά τους θα αποτελούν πάντα προβλέψεις οι οποίες δε θα μπορέσουν ποτέ να προσεγγίσουν ακριβώς τις πολύπλοκες βιολογικές διαδικασίες της μεταγραφής και της μετάφρασης. 10

11 ΕΙΣΑΓΩΓΗ 1.2 Ανάλυση ακολουθίας Γνωρίζοντας την ακολουθία μιας πρωτεΐνης ή ενός γονιδίου ή τμήμα αυτών, πρωταρχικό μας στόχο αποτελεί να βρούμε αν και κατά πόσο η ακολουθία αυτή σχετίζεται με κάποια άλλη αμινοξική ή νουκλεοτιδική, στοιχείο που θα οδηγούσε στην υπόθεση ότι οι ακολουθίες αυτές είναι ομόλογες. Δύο ή περισσότερες ακολουθίες ονομάζονται ομόλογες όταν προέρχονται από τον ίδιο κοινό πρόγονο. Δεν υπάρχει βαθμός ομολογίας μεταξύ δύο ακολουθιών, οι ακολουθίες είναι ή δεν είναι ομόλογες (Pevsner 2003). Στην περίπτωση που δύο αλληλουχίες είναι ομόλογες θα μπορούσαμε να οδηγηθούμε σε κάποια αρχικά συμπεράσματα για τη λειτουργία της άγνωστης αλληλουχίας. Είναι πιθανό αναλύοντας αμινοξικές ή νουκλεοτιδικές ακολουθίες να αναγνωριστούν κάποια μοτίβα ή δομικά στοιχεία (domains) τα οποία είναι κοινά σε ομάδες μορίων (Pevsner 2003). Η ανάλυση αλληλουχιών και η εύρεση της μεταξύ τους ομοιότητας πραγματοποιείται με τη στοίχιση των ακολουθιών. Η ομοιότητα εν αντιθέσει με την ομολογία είναι μια μετρήσιμη ποσότητα. Η στοίχιση μπορεί να πραγματοποιηθεί είτε κατά ζευγάρια (pairwise alignment) είτε κατά ομάδες ακολουθιών (multiple sequence alignment). Με την ολοκλήρωση της χαρτογράφησης των γονιδιωμάτων πολλών οργανισμών, γίνεται πιο εύκολο να αντιληφθούμε πως σχετίζονται και ρυθμίζονται οι πρωτεΐνες σε ένα οργανισμό ή σε διαφορετικούς οργανισμούς, ώστε να αποκωδικοποιήσουμε τις αρχές που διέπουν τη ζωή (Pevsner 2003). Για το λόγο αυτό οι τεχνικές που στοιχίζουν και συγκρίνουν ακολουθίες καθώς και αυτές που πραγματοποιούν αναζητήσεις σε βάσεις δεδομένων αποτελούν το θεμέλιο λίθο της βιοπληροφορικής (Krane D. 2002) Εύρεση ομοιότητας Όπως προαναφέρθηκε, η εύρεση ομοιότητας επιτυγχάνεται μέσω της στοίχισης των ακολουθιών. Η στοίχιση μεταξύ δύο ακολουθιών αντιπροσωπεύει μία υπόθεση για το πώς οι δύο αυτές ακολουθίες παρέκκλιναν από τον κοινό τους πρόγονο (Pevsner 2003). Τρεις τύποι αλλαγών μπορούν να συμβούν σε οποιαδήποτε θέση σε μια ακολουθία: Αντικατάσταση ενός χαρακτήρα από έναν άλλο Εισαγωγή ενός ή περισσοτέρων χαρακτήρων Αφαίρεση ενός ή περισσοτέρων χαρακτήρων 11

12 ΕΙΣΑΓΩΓΗ Η εμφάνιση των δύο τελευταίων τύπων μεταλλάξεων εμφανίζεται με κενά κατά τη στοίχιση των ακολουθιών. Η εισαγωγή και η αφαίρεση χαρακτήρων έχει βρεθεί ότι συμβαίνει στη φύση πιο σπάνια από ότι η αντικατάσταση. Επειδή υπάρχουν πολλές διαφορετικές υποθέσεις για το πώς οι δύο ακολουθίες παρέκκλιναν, πιθανότερη θεωρείται αυτή που εμφανίζει το μικρότερο αριθμό απίθανων γεγονότων (Pevsner 2003). Αν και το πραγματικό εξελικτικό μονοπάτι που οδήγησε στη διαφοροποίηση των ακολουθιών δε μπορεί να προσδιοριστεί με βεβαιότητα, οι αλγόριθμοι στοίχισης ακολουθιών μπορούν να χρησιμοποιηθούν, για να αναγνωριστούν οι στοιχίσεις που εμφανίζουν τη μικρότερη πιθανότητα να συμβαίνουν στη τύχη. Η επιλογή της συνάρτησης επιτυχίας (scoring function) έχει άμεση σχέση με τη στοίχιση που θα πραγματοποιηθεί (Τσακαλίδης 2005). Η συνάρτηση επιτυχίας βαθμολογεί με ένα ορισμένο σύνολο τιμών όλους τους πιθανούς συνδυασμούς στοίχισης μεταξύ δύο ακολουθιών (Τσακαλίδης 2005). Ως βέλτιστη στοίχιση θεωρείται εκείνη που βελτιστοποιεί τη τιμή της συνάρτησης (Τσακαλίδης 2005). Δεν υπάρχει μια τυπική συνάρτηση και οι επιστήμονες ανάλογα με τη περίπτωση χρησιμοποιούν και διαφορετικές συναρτήσεις (Τσακαλίδης 2005). Οι διαφορετικές συναρτήσεις χρησιμοποιούν και διαφορετικές τιμές ποινής (penalty) για την περίπτωση του κενού, της αντικατάστασης και του ταιριάσματος (matching), πάντα φυσικά η τιμή για το κενό είναι μικρότερη από τη τιμή της αντικατάστασης, η οποία παρουσιάζει μικρότερη τιμή από το ταίριασμα (Krane D. 2002). Συγκεκριμένα για την αντικατάσταση, λόγο του ότι στη νουκλεοτιδική ακολουθία είναι πιο πιθανό μια πουρίνη να αντικατασταθεί από μια άλλη πουρίνη και αντίστοιχα για μια πυριμιδίνη και στην περίπτωση των πρωτεϊνών είναι πιο πιθανό ένα αμινοξύ να αντικατασταθεί από ένα άλλο με περίπου το ίδιο μέγεθος και ιδιότητες, έχουν δημιουργηθεί πίνακες επιτυχίας (scoring matrix) οι οποίοι βαθμολογούν διαφορετικά τη κάθε αντικατάσταση (Krane D. 2002; Τσακαλίδης 2005). Οι πίνακες που κωδικοποιούν αυτές τις τιμές ονομάζονται πίνακες αντικατάστασης (substitution matrix). Παράδειγμα τέτοιων πινάκων είναι ο PAM (Point Accepted Mutation) και ο BLOSUM (BLOCKS Substitution) οι οποίοι έχουν δημιουργηθεί από ζεύγη στοιχίσεων ομολόγων πρωτεϊνών, από τις οποίες υπολογίστηκε η συχνότητα αντικατάστασης όλων των χαρακτήρων, οπότε προσδιορίστηκε και το βάρος για κάθε αντικατάσταση (Τσακαλίδης 2005). Ο πίνακας PAM (Dayhoff) δημιουργήθηκε βάση ενός μοντέλου εξελικτικής απόστασης από τη στοίχιση συγγενών ακολουθιών (κατά 85% περίπου όμοιων). Το μοντέλο αυτό αντιπροσωπεύει ακολουθίες που διαφέρουν κατά 1% μεταξύ τους. Οι 12

13 ΕΙΣΑΓΩΓΗ μεγάλοι βαθμού πίνακες ΡΑΜ (π.χ. ΡΑΜ 250 ), χρησιμοποιούνται για ακολουθίες που διαφέρουν αρκετά μεταξύ τους (Baxevanis A. D. 2001; Τσακαλίδης 2005). Εικόνα 1.2: Ο πίνακας αντικατάστασης PAM250. Ο πίνακας BLOSUM βασίζεται στην ίδια φιλοσοφία. Στηρίζεται σε δεδομένα από τη βάση δεδομένων BLOCKS, στην οποία υπάρχουν πρωτεΐνες που δεν είναι πολύ κοντά εξελικτικά, και δεν παρουσιάζει κενά στη στοίχιση. Ο τύπος του πίνακα δηλώνει το ποσοστό ταυτοσημίας που παρουσίασαν οι πρωτεΐνες με βάση τις οποίες έχει δημιουργηθεί. Για παράδειγμα ο BLOSUM 62 έχει βασιστεί σε πρωτεΐνες που παρουσιάζουν τουλάχιστον 62% ταυτοσημία. Οπότε εν αντιθέσει με τον ΡΑΜ οι μικρού τύπου BLOSUM χρησιμοποιούνται για ακολουθίες που παρουσιάζουν μεγάλη εξελικτική απόσταση μεταξύ τους (Baxevanis A. D. 2001; Τσακαλίδης 2005). 13

14 ΕΙΣΑΓΩΓΗ Εικόνα 1.3: Ο πίνακας αντικατάστασης BLOSUM62 Σήμερα έχουν δημιουργηθεί και νεότερες εκδόσεις των παραπάνω πινάκων όπως ο BLOCKS 13+ BLOSUM ο οποίος στηρίζεται στη βάση δεδομένων BLOCKS13+, η οποία περιέχει περισσότερες πρωτεΐνες από τη BLOCKS. Νεότερη έκδοση του ΡΑΜ αποτελεί ο VTML στον οποίον έχουν διορθωθεί κάποιες παράμετροι. Σύμφωνα με τους Price και Crooks (2005) οι οποίοι σύγκριναν τους τέσσερις παραπάνω πίνακες, θεωρούν ότι είναι καλύτερα να χρησιμοποιούνται οι νεότερες εκδόσεις(price, Crooks et al. 2005). Το επόμενο βήμα αφού επιλέξουμε κάποια συνάρτηση επιτυχίας, είναι να βρούμε τον αλγόριθμο που θα μας επιστρέψει την βέλτιστη στοίχιση ή στοιχίσεις μεταξύ δύο ακολουθιών. Επειδή συνήθως ζητάμε από έναν αλγόριθμο να στοιχίσει δύο μεγάλες σε μήκος ακολουθίες, είναι σχεδόν απίθανο να βρει όλες τι πιθανές στοιχίσεις και να 14

15 ΕΙΣΑΓΩΓΗ μας επιστρέψει τη βέλτιστη σε ένα λογικό χρονικό διάστημα. Για το λόγο αυτό χρησιμοποιείται η μέθοδος του Δυναμικού Προγραμματισμού (Dynamic Programming) κατά την οποία η αρχική ακολουθία που τίθεται ως ερώτημα (query) σπάει σε μικρότερες υπό-ακολουθίες τις οποίες μπορεί να επεξεργαστεί γρηγορότερα ο αλγόριθμος (Baxevanis A. D. 2001; Krane D. 2002). Βασίζεται δηλαδή στη παρατήρηση ότι η βέλτιστη υπο-ακολουθία δε μπορεί παρά να αποτελεί τμήμα της βέλτιστης ακολουθίας (Baxevanis A. D. 2001) Οι S.Needleman και C.Wunsch ήταν οι πρώτοι το 1970 που χρησιμοποίησαν την μέθοδο του Δυναμικού Προγραμματισμού στη στοίχιση ακολουθιών. Ο αλγόριθμός τους επεκτείνει σταδιακά τη βέλτιστη υπό-ακολουθία, ώστε στο τέλος η στοίχιση που προκύπτει να αναφέρεται στο συνολικό μήκος και των δύο ακολουθιών. Άρα πρόκειται για έναν αλγόριθμο ολικής στοίχισης και είναι κατάλληλος για ακολουθίες που τις χωρίζει μικρή εξελικτική απόσταση. Σε αντίθετη περίπτωση όμως, όταν οι δύο ακολουθίες απέχουν αρκετά εξελικτικά, απαιτείται ένας αλγόριθμος που θα επιστρέφει τη βέλτιστη στοίχιση που αναφέρεται σε τμήμα των δύο ακολουθιών και όχι σε ολόκληρο το μήκος τους, όπως είναι ο Smith-Waterman (Smith and Waterman 1981)ο οποίος αποτελεί αλγόριθμο τοπικής στοίχισης. Ο Smith-Waterman βρίσκει όλες τις βέλτιστες στοιχίσεις σε τμήματα των δύο ακολουθιών και ύστερα επιλέγει αυτή με το μεγαλύτερο σκορ. Πρόβλημα παρουσιάζεται, όταν χρειάζεται να πραγματοποιηθεί στοίχιση μιας ακολουθίας με βάσεις δεδομένων που περιέχουν εκατοντάδες χιλιάδες ακολουθίες. Στην περίπτωση αυτή ο αλγόριθμος Smith-Waterman είναι ιδιαίτερα χρονοβόρος, άρα μη πρακτικός. Για το λόγο αυτό χρησιμοποιούνται αλγόριθμοι οι οποίοι χρησιμοποιούν ευρετικές μεθόδους (heuretic methods), όπως είναι ο BLAST και ο FASTA (Baxevanis A. D. 2001; Krane D. 2002). Ο αλγόριθμος FASTA (Pearson 2000) (Pearson and Lipman 1988) ήταν το πρώτο πρόγραμμα που εμφανίστηκε για σύγκριση ακολουθίας με βάσεις δεδομένων και βασίζεται στην ιδέα της αναζήτησης μικρών υπο-ακολουθιών που εμφανίζονται και στις δύο ακολουθίες. Ο FASTA χρησιμοποιεί ευρετικές μεθόδους για να βρει περιοχές που περιέχουν κοινές υπο-ακολουθίες (k-tuples). Το μήκος των υποακολουθιών ορίζεται από το χρήστη. Αφού βρει τις περιοχές εκείνες που περιέχουν μεγάλο αριθμό κοινών υπο-ακολουθιών (που έχουν βαθμολογηθεί δηλαδή με μεγαλύτερη τιμή από κάποιο προκαθορισμένο όριο (cut-off) με βάση κάποιο πίνακα 15

16 ΕΙΣΑΓΩΓΗ αντικατάστασης), σε αυτές πραγματοποιεί στοίχιση με τον αλγόριθμο Smith- Waterman. Η έξοδος του FASTA είναι η έξοδος του Smith-Waterman. Ο αλγόριθμος BLAST (Basic Local Alignment Search Toll) (Altschul, Gish et al. 1990) δημιουργήθηκε αργότερα και η διαφορά του με τον FASTA είναι ότι σε αυτόν δεν απαιτείται το απόλυτο ταίριασμα των υπο-ακολουθιών, αλλά το score τους να υπερβαίνει το προκαθορισμένο κατώφλι. Αρχικά ο BLAST δεν επέτρεπε την ύπαρξη κενών, σε νεότερες εκδόσεις όμως επιτρέπονται τα κενά (Altschul, Madden et al. 1997) Πολλαπλή στοίχιση ακολουθιών Οι αλγόριθμοι που παρουσιάστηκαν μέχρι στιγμής έχουν σχεδιαστεί για να πραγματοποιούν στοίχιση κατά ζεύγη ακολουθιών, πολλές φορές όμως είναι αναγκαίο να πραγματοποιείται στοίχιση σε ομάδες ακολουθιών, δηλαδή πολλαπλή στοίχιση. Όταν στοιχίζονται ομάδες ακολουθιών τα κατάλοιπα (residues) τα οποία παρουσιάζονται στοιχισμένα σε όλες ή στις περισσότερες ακολουθίες συνήθως καταλαμβάνουν ίδιες θέσεις και στις τρισδιάστατες δομές των ακολουθιών(pevsner 2003). Η πολλαπλή στοίχιση ακολουθιών παρουσιάζει μεγάλο ενδιαφέρον, διότι μπορούμε να κατατάξουμε μέσω αυτής μια ακολουθία ως μέλος μιας γονιδιακής ή πρωτεϊνικής οικογένειας, αφού ομόλογες ακολουθίες τείνουν να διατηρούν όμοιες δομές και λειτουργίες (Pevsner 2003). Επίσης παρουσιάζουν ζωτική σημασία για τη δημιουργία των πινάκων επιτυχίας, όπως ο PAM και ο BLOSUM, τους οποίους αναλύσαμε παραπάνω. Διαθέτουν, όπως είναι λογικό, μεγαλύτερη ευαισθησία από ότι η στοίχιση ακολουθιών κατά ζεύγη, στην εύρεση μακρινών ομολόγων σε βάσεις δεδομένων (Park, Karplus et al. 1998). Τέλος όπως θα αναλύσουμε παρακάτω, πολλοί αλγόριθμοι εύρεσης φυλογενετικών σχέσεων βασίζονται στην πολλαπλή στοίχιση κυρίως πρωτεϊνών (Lesk 2002; Pevsner 2003) Στην περίπτωση που έχουμε να στοιχίσουμε πολύ συγγενικές ακολουθίες τότε η στοίχιση μπορεί να πραγματοποιηθεί ακόμα και με το μάτι. Όταν, όμως, οι ακολουθίες είναι πολύ μεγάλες σε μέγεθος ή πολλές σε αριθμό ή διαφέρουν πολύ εξελικτικά τότε απαιτούνται υπολογιστικές μέθοδοι προσέγγιση για την εύρεση της βέλτιστης στοίχισης (Krane D. 2002). Οι πιο πρακτικές και ακριβείς μέθοδοι που 16

17 ΕΙΣΑΓΩΓΗ χρησιμοποιούνται συνήθως σε προβλήματα πολλαπλής στοίχισης είναι οι ιεραρχικές μέθοδοι οι οποίες ολοκληρώνονται σε τρία βήματα. Αρχικά πραγματοποιείται στοίχιση κατά ζεύγη για όλες τις ακολουθίες οι οποίες πρόκειται να στοιχιθούν, συνήθως με τον αλγόριθμο Needleman και Wunsch (Needleman and Wunsch 1970). Με βάση τα αποτελέσματα του αλγόριθμου δημιουργείται ένα δενδρικό διάγραμμα (guide tree) με όλες τις ακολουθίες. Τέλος η πολλαπλή στοίχιση πραγματοποιείται με διαδοχικά βήματα ανάλογα με το τι θέση καταλαμβάνουν οι ακολουθίες στο δενδρικό διάγραμμα. Στο παρακάτω πίνακα φαίνεται η διαδικασία πραγματοποίησης της πολλαπλής στοίχιση των εφτά ακολουθιών : HAHU, HBHU, HAHO, HBHO, MYWHP, P1LHB(Baxevanis A. D. 2001; Pevsner 2003). Εικόνα 1.4 :Διαδικασία πραγματοποίησης πολλαπλής στοίχισης των ακολουθιών HAHU, HBHU, HAHO, HBHO, MYWHP, P1LHB(Η εικόνα πάρθηκε από το βιβλίο Bioinformatics : A practical guide to the analysis of genes and proteins) Ο αλγόριθμος των Da Fei Feng και Russel Doolitle (Feng and Doolittle 1987; Doolittle and Feng 1990),στον οποίο βασίζεται το υπολογιστικό πρόγραμμα ClustalW, βασίζεται σε ιεραρχικές μεθόδους. 17

18 ΕΙΣΑΓΩΓΗ Οι ιεραρχικές μέθοδοι δεν δίνουν πάντα τη μαθηματικώς βέλτιστη στοίχιση, η οποία όμως πολλές φορές δεν παρουσιάζει βιολογικό ενδιαφέρον. Κάποιες πιο σχολαστικές μέθοδοι που επιστρέφουν πιο ακριβείς στοιχίσεις (Lipman, Altschul et al. 1989)έχουν βρεθεί σε νεότερες έρευνες ότι δίνουν χειρότερα αποτελέσματα από ότι οι ιεραρχικές μέθοδοι (Raghava, Searle et al. 2003). Η μέθοδος T-Coffee (Dickerson 1971)προσπαθεί να υπερκεράσει τα προβλήματα που δημιουργούν οι ιεραρχικές μέθοδοι. Το πρόγραμμα δημιουργεί μια βιβλιοθήκη που περιέχει κατά ζεύγη στοιχίσεις όλων των ακολουθιών που πρόκειται να στοιχιθούν. Ύστερα χρησιμοποιεί αυτή τη βιβλιοθήκη, για να ενημερώσει μια ιεραρχική μέθοδο η οποία θα βρει εκείνη τη πολλαπλή στοίχιση που διατηρεί τα αποτελέσματα των κατά ζεύγη στοιχίσεων των ακολουθιών. Δυστυχώς, αν και η μέθοδος δίνει καλύτερα αποτελέσματα, είναι ιδιαίτερα χρονοβόρα στην περίπτωση μεγάλων σε μήκος ακολουθιών. Το πρόγραμμα MUSCAL που πρόσφατα αναπτύχθηκε από τον Edgar (Edgar 2004) (Edgar 2004) παρουσιάζει πολύ καλή απόδοση σε σύγκριση με άλλα εργαλεία. Πρώτα βρίσκει την ομοιότητα των τμημάτων μήκους κ με όλα τα ζευγάρια των ακολουθιών για να καθορίσει τις αποστάσεις και ύστερα εκτελεί τη σταδιακή στοίχιση. Είναι πιο γρήγορη γιατί δεν εκτελεί στοίχιση κατά ζευγάρια όλων των ακολουθιών. Κατά την πολλαπλή στοίχιση ακολουθιών παρουσιάζονται στήλες που εμφανίζουν στοίχιση σε όλες ή στις περισσότερες ακολουθίες. Οι στήλες αυτές μπορεί να αντιστοιχούν (Krane D. 2002; Lesk 2002): Σε συντηρημένα κατάλοιπα όπως οι κυστεΐνες, που παίρνουν μέρος στη δημιουργία δισουλφιδικών δεσμών ή αμινοξέα στο ενεργό κέντρο των ενζύμων. Σε συντηρημένα μοτίβα, όπως είναι οι διαμεμβρανικές περιοχές. Σε συντηρημένα στοιχεία της δευτεροταγούς δομής (σε κατάλοιπα δηλαδή που συνεισφέρουν στη δημιουργία της α-έλικας ή της β- πτυχωτής επιφάνειας) ή της τριτοταγούς δομής (σε κατάλοιπα δηλαδή σημαντικά για τη διάταξη της πρωτεΐνης στο χώρο) Σε περιοχές με ίδιες πρότυπες υπο-ακολουθίες (patterns) με ενθέσεις και διαγραφές. 18

19 ΕΙΣΑΓΩΓΗ Η πολλαπλή στοίχιση ακολουθιών βρίσκει εφαρμογή σε μεθόδους που αναγνωρίζουν ομόλγες ακολουθίες σε βάσεις δεδομένων. Δύο τέτοιες μέθοδοι είναι τα profiles (προφίλ) και το psi-blast. Τα προφίλ αναφέρονται στο μοτίβο έκφρασης των πρότυπων υποακολουθιών οι οποίες παρουσιάζονται συντηρημένες κατά την πολλαπλή στοίχιση των ομολόγων ακολουθιών. Τα διαφορετικά κατάλοιπα της υποακολουθίας παρουσιάζουν διαφορετική βαρύτητα ανάλογα με το πόσο συντηρημένα είναι. Τα προφίλ χρησιμοποιούνται κυρίως για την εύρεση ομολόγων πρωτεϊνών καθώς μπορεί να δώσουν και ενδείξεις για τις λειτουργικές περιοχές της πρωτεΐνης, αφού πολύ συντηρημένα προφίλ συνήθως αποτελούν τμήμα αυτών των περιοχών (Lesk 2002). Το πρόγραμμα psi-blast χρησιμοποιείται για την εύρεση μακρινών ομολόγων. Αρχικά πραγματοποιεί ένα απλό BLAST (επιτρέποντας την ύπαρξη κενών) με τη ακολουθία που έχουμε τοποθετήσει ως ερώτημα (query) και με τις ακολουθίες που είναι στατιστικώς σημαντικές πραγματοποιεί μια πολλαπλή στοίχιση για την εύρεση των προφιλ συντήρησης. Ακολούθως πραγματοποιεί εκ νέου στοίχιση με τη βάση δεδομένων, χρησιμοποιώντας τώρα τα νέα στατιστικώς σημαντικά ευρήματα επαναλαμβάνει τον κύκλο μέχρι να μην εμφανίζονται νέες ομόλογες ακολουθίες (Lesk 2002) Φυλογενετικές σχέσεις Η πλειοψηφία των μεθόδων και των προγραμμάτων που αναφέρθηκαν μέχρι στιγμής σε όλη την εργασία χρησιμοποιούνται σήμερα για την εύρεση των φυλογενετικών σχέσεων των οργανισμών και του ρυθμού εξέλιξής τους. Δύο θεωρίες που η κάθε μία παρατηρεί από διαφορετικό οπτικό πρίσμα την εξέλιξη των οργανισμών είναι η θεωρία του μοριακού ρολογιού (molecular clock hypothesis) και η θεωρία της επιλογικής ουδετερότητας (natural theory of molecular evolution). 19

20 ΕΙΣΑΓΩΓΗ Η θεωρία του μορίου ρολογιού (Dickerson 1971) αναφέρει την ύπαρξη ενός σταθερού ρυθμού εξέλιξης κάθε πρωτεΐνης ανάλογα με τη λειτουργία της. Πρωτεΐνες όπως οι ιστόνες υφίστανται αλλαγές με πολύ αργό ρυθμό, διότι η συντηρημένη δομή τους είναι απαραίτητη για τη σωστή λειτουργία τους, εν αντιθέσει με κάποιες άλλες πρωτεϊνικές οικογένειες, που έχουν συσσωρεύσει κατά την πορεία της εξέλιξης πολλές αντικαταστάσεις. Η θεωρία αυτή προτείνει να θεωρείτε σταθερός ο ρυθμός μοριακής εξέλιξης κάθε γονιδίου (πρωτεΐνης), κατά την εύρεση της εξελικτικής του πορείας. Η θεωρία του μοριακού ρολογιού δεν ανταποκρίνεται σε όλες τις πρωτεΐνες, αφού υπάρχουν οργανισμοί που εξελίσσονται με διαφορετικούς ρυθμούς, όπως είναι οι ιοί ή γονίδια που υφίστανται διπλασιασμό με αποτέλεσμα να επιταχύνεται ο ρυθμός εξέλιξής τους. Η θεωρία της επιλογικής ουδετερότητας του Motoo Kimura (Kimura 1968; Kimura 1983) θεωρεί ότι οι παρατηρούμενες αλλαγές στα γονίδια (πρωτεΐνες) οφείλονται πρωτίστως σε ουδέτερες μεταλλάξεις και τυχαία γενετική εκτροπή. Πιστεύει δηλαδή ότι κατά την εύρεση της εξελικτικής πορείας των οργανισμών, το μεγαλύτερο μέρος των εξελικτικών αλλαγών των μακρομορίων είναι αποτέλεσμα μιας τυχαίας διαδικασίας, που οδηγεί στην τυχαία συγκράτηση από τους οργανισμούς ουδέτερων μεταλλάξεων (Αλαχιώτης 1989). Ανεξάρτητα από τη θεωρία με την οποία προσεγγίζουμε την εξέλιξη των οργανισμών, τις εξελικτικές σχέσεις μεταξύ των οργανισμών τις αναπαριστάνουμε με τη μορφή των φυλογενετικών δένδρων. Τα φυλογενετικά δένδρα αποτελούν γραφήματα που περιλαμβάνουν κόμβους και κλάδους, όπου κάθε κλαδί συνδέει δύο κόμβους. Κάθε κόμβος διακρίνεται σε εσωτερικό (ο οποίος παράγεται από το πρόγραμμα δημιουργίας του φυλογενετικού δένδρου) και εξωτερικό ( που αναφέρεται στις ακολουθίες που εμείς παρέχουμε στο πρόγραμμα) και αναπαριστά μια νουκλεοτιδική ή πρωτεϊνική ακολουθία. Το μήκος των κλάδων είναι ανάλογο με την εξελικτική απόσταση μεταξύ των ακολουθιών που συνδέει (Pevsner 2003). Τα φυλογενετικά δένδρα που περιέχουν όλους τους απογόνους του αρχικού προγονικού είδους ονομάζονται φυλογενετικά δένδρα με ρίζα (rooted trees), όπου η ρίζα αναπαριστά το κοινό πρόγονο. Υπάρχουν και δένδρα που δεν εμφανίζουν ρίζα (unrooted trees) (Αλαχιώτης 1989). Παράδειγμα δένδρου με ρίζα και χωρίς φαίνεται στο παρακάτω σχήμα, όπου τα I, II, III, IV, V αναφέρονται και ως λειτουργικές ταξινομικές μονάδες (OTUs) τις οποίες εμείς παρέχουμε στο πρόγραμμα. 20

21 ΕΙΣΑΓΩΓΗ Εικόνα 1.5: Δεξιά παρουσιάζεται δένδρο με ρίζα και αριστερά χωρίς ρίζα(η εικόνα πάρθηκε από το βιβλίο Bioinformatics : A practical guide to the analysis of genes and proteins) Η εύρεση των φυλογενετικών σχέσεων των οργανισμών συνοψίζεται σε τέσσερα βήματα (Baxevanis A. D. 2001): Στη δημιουργία της πολλαπλής στοίχισης των ακολουθιών Στο προσδιορισμό του μοντέλου των αντικαταστάσεων Στη κατασκευή του φυλογενετικού δένδρου Στην αξιολόγηση του δένδρου Το στάδιο της πολλαπλής στοίχισης είναι πολύ σημαντικό για τη κατασκευή του φυλογενετικού δένδρου. Οι μέθοδοι πολλαπλής στοίχισης έχουν ήδη αναφερθεί, χρειάζεται όμως να τονίσουμε ότι κατά τη δημιουργία του φυλογενετικού δένδρου χρησιμοποιούνται μέθοδοι στοίχισης που λαμβάνουν υπόψη τις σχέσεις μεταξύ των ακολουθιών (Baxevanis A. D. 2001; Pevsner 2003), όπως ο αλγόριθμος Clustal ή ALIGN που παράγονται με βάση τις στοιχίσεις κατά ζεύγη των ακολουθιών. Οι πιο σημαντικοί παράμετροι σε μια μέθοδο στοίχισης είναι αυτές που καθορίζουν την τοποθέτηση των κενών και των διαγραφών και ενθέσεων. Οι παράμετροι αυτοί μεταβάλλονται ανάλογα με τις εξελικτικές αποστάσεις των ακολουθιών που στοιχίζονται (Baxevanis A. D. 2001). Πίνακες με πρότυπες αποστάσεις (fixed cost) που έχουν δημιουργηθεί από εμπειρικές παρατηρήσεις, π.χ. ότι οι αντικαταστάσεις μεταξύ πουρινών ή πυριμιδινών παρουσιάζουν διπλάσια συχνότητα από ότι οι αντικαταστάσεις μιας πουρίνης από μία πυριμιδίνη και το αντίστροφο, χρησιμοποιούνται για μεθόδους που 21

22 ΕΙΣΑΓΩΓΗ βασίζονται στους χαρακτήρες των ακολουθιών (character based methods), όπως η μέθοδος της μέγιστης φειδωλότητας (Maximum Parsimony). Εικόνα 1.6: Πίνακας αντικατάστασης που έχει δημιουργηθεί από εμπειρικές παρατηρήσεις. Παρατηρούμε ότι διαγώνια δεν παρουσιάζει τιμές αφού δεν λαμβάνονται υπόψη επαναμεταλλάξεις(η εικόνα πάρθηκε από το βιβλίο Bioinformatics : A practical guide to the analysis of genes and proteins) Ενώ οι πίνακες που έχει υπολογιστεί η συχνότητα αντικατάστασης με αλγεβρικές μεθόδους χρησιμοποιούνται για μεθόδους που βασίζονται στην απόσταση μεταξύ των ακολουθιών (Distance Based Methods) (Baxevanis A. D. 2001) Εικόνα 1.7: Πίνακας που έχει υπολογιστεί η συχνότητα αντικατάστασης με αλγεβρικές μεθόδους. Παρατηρούμε πως παρουσιάζονται τιμές και για τη διαγώνιο (Η εικόνα πάρθηκε από το βιβλίο Bioinformatics : A practical guide to the analysis of genes and proteins) 22

23 ΕΙΣΑΓΩΓΗ Όσον αφορά τη δεύτερη παράμετρο που αναφέρεται στον υπολογισμό της συχνότητας αντικατάστασης, σε συγκεκριμένες θέσεις της ακολουθίας βρίσκει εφαρμογή στην περίπτωση της αντικατάστασης του τρίτου νουκλεοτιδίου στα κωδικόνια. Γνωρίζουμε πως εξαιτίας του εκφυλισμού του γενετικού κώδικα, αλλαγές στη τρίτη θέση των κωδικονίων συνήθως δεν επηρεάζουν την παραγόμενη πρωτεΐνη, γι αυτό παρουσιάζει μεγαλύτερη συχνότητα αντικαταστάσεων η συγκεκριμένη θέση. Για το λόγο αυτό πολλές φυλογενετικές αναλύσεις κωδικών αλυσίδων DNA δεν το λαμβάνουν υπόψη (Baxevanis A. D. 2001). Αντιθέτως αντικαταστάσεις που συμβαίνουν σε συντηρημένες περιοχές της νουκλεοτιδική ή αμινοξικής ακολουθίας παρουσιάζουν μεγαλύτερη βαρύτητα κατά τη φυλογενετική ανάλυση. Όπως προαναφέραμε οι μέθοδοι κατασκευή ενός φυλογενετικού δένδρου χωρίζονται σε δύο κατηγορίες: Μέθοδοι που βασίζονται στην απόσταση (Distance based methods) Μέθοδοι που βασίζονται σε χαρακτήρες (Character based methods) Οι μέθοδοι της πρώτης κατηγορίας υπολογίζουν τις εξελικτικές αποστάσεις για όλα τα ζευγάρια των ακολουθιών και έπειτα χρησιμοποιούν έναν αλγόριθμο για τη κατασκευή του δένδρου. Βασίζονται δηλαδή στην εύρεση των αμινοξικών ή νουκλεοτιδικών αποστάσεων μεταξύ των ζευγαριών και στον αλγόριθμο δε χρησιμοποιούνται οι ακολουθίες αλλά οι μεταξύ τους αποστάσεις. Οι μέθοδοι αυτοί υπολογίζουν ακόμα και τη περίπτωση που ένα κατάλοιπο μεταλλαχθεί στην αρχική του μορφή, όπως για παράδειγμα μια βαλίνη που μεταλλάσσεται σε ισολευκίνη και ξανά σε βαλίνη. Οι πιο συνηθισμένες μέθοδοι αυτής της κατηγορίας είναι: UPGMA (Unweighted-pair-group-method with arithmetic mean). Αποτελεί την παλαιότερη και πιο απλή μέθοδο κατασκευής φυλογενετικών δένδρων. Απαιτεί την ύπαρξη δεδομένων με βάση τα οποία να μπορεί να μετρήσει την γενετική απόσταση μεταξύ όλων των ζευγαριών των ακολουθιών. Επίσης απαιτεί, η εξέλιξη των ειδών να προσεγγίζεται με τη μέθοδο του μοριακού ρολογιού, δηλαδή να υπάρχουν σταθεροί ρυθμοί εξέλιξης. Η UPGMA βρίσκει κάθε φορά τη μεγαλύτερη ομοιότητα μεταξύ είτε ακολουθιών, είτε ζευγαριών 23

24 ΕΙΣΑΓΩΓΗ ακολουθιών είτε ακολουθίας και ζευγαριού. Έπειτα ενώνει στους κλάδους του δένδρου, ώστε το μήκος του κάθε κλάδου να αντιπροσωπεύει την εξελικτική απόσταση των ακολουθιών που συνδέονται (Baxevanis A. D. 2001; Krane D. 2002). Η μέθοδος των γειτονικών ζευγαριών (Neighbor Joining). Η μέθοδος αυτή ξεκινά με ένα δένδρο χωρίς ρίζα που έχει τη μορφή αστέρα, όπου όλα τα OTUs προέρχονται από ένα κεντρικό βρόγχο. Σταδιακά βρίσκονται οι γειτονικές ακολουθίες, ώστε να ελαχιστοποιείται τελικά όλο το μήκος των κλάδων του δένδρου, όπως φαίνεται στο παρακάτω σχήμα (Baxevanis A. D. 2001) Εικόνα 1.8: Δημιουργία φυλογενετικού δένδρου με τη μέθοδο των γειτονικών ζευγαριών(η εικόνα πάρθηκε από το βιβλίο Bioinformatics : A practical guide to the analysis of genes and proteins) Στην επόμενη κατηγορία υπάγονται πολλές και διαφορετικές μέθοδοι που αντλούν πληροφορίες από τους χαρακτήρες των ακολουθιών που στοιχίζονται. Κάποιες από τις μεθόδους αυτές είναι: Η μέγιστη φειδωλότητα (Maximum Parsimony), που θεωρεί ότι η καλύτερη εξήγηση για την εξελικτική πορεία των προς εξέταση ακολουθιών είναι η πιο απλή, αυτή που απαιτεί τις λιγότερες παραδοχές (Baxevanis A. D. 2001). Το δένδρο που προκύπτει από τη μέθοδο αυτή παρουσιάζει τις λιγότερες αλλαγές. Λαμβάνει υπόψη της τι είδος αντικατάσταση έχει συμβεί κάθε φορά, όπως αναφέραμε και στο μοντέλο αντικατάστασης. Η μέθοδος αποτυγχάνει όταν παρουσιάζονται μεγάλες εξελικτικές αλλαγές μεταξύ των ακολουθιών(baxevanis A. D. 2001; Pevsner 2003) 24

25 ΕΙΣΑΓΩΓΗ Η μέγιστη πιθανότητα (Maximum Likelihood). Είναι η πιο απαιτητική υπολογιστικά, αλλά και η πιο ευέλικτη μέθοδος(baxevanis A. D. 2001). Ψάχνει για το δένδρο που παρουσιάζει τη μεγαλύτερη πιθανότητα να παράγει τα δεδομένα που του δίνουμε. Υπολογίζει τη πιθανότητα αλλαγής για κάθε κατάλοιπο της ακολουθίας με βάση ένα μοντέλο αντικατάστασης (Baxevanis A. D. 2001). Αφού δημιουργήσουμε ένα εξελικτικό δένδρο με κάποια από τις παραπάνω μεθόδους πρέπει στη συνέχεια να το αξιολογήσουμε. Η αξιολόγηση μπορεί να πραγματοποιηθεί με τη μέθοδο Bootstrap (Conrad 1979) Το μη παραμετρικό (nonparametric) bootstrap ακολουθεί τις παρακάτω διεργασίες: Χρησιμοποιεί ως είσοδο μια πολλαπλή στοίχιση ακολουθιών με βάση την οποία κατασκευάζεται το φυλογενετικό δένδρο. Το πρόγραμμα ύστερα δημιουργεί τεχνητά (artificial) δεδομένα ίδιου μεγέθους με τα δεδομένα εισόδου. Τα τεχνητά δεδομένα δημιουργούνται από τυχαία επιλεγμένες στήλες της αρχικής πολλαπλής στοίχισης, με αποτέλεσμα μια στήλη να εμφανίζεται πολλές φορές ή και καμία. Παράγονται από 100 έως 1000 νέα δένδρα τα οποία συγκρίνονται με το αρχικό. Οι πληροφορίες που παίρνουμε αναφέρονται στη συχνότητα με την οποία εμφανίζεται κάθε κλάδος από το αρχικό δένδρο. Χρειάζεται πάντα να λαμβάνουμε υπόψη, όταν κατασκευάζουμε ένα φυλογενετικό δένδρο, ότι όλες οι μέθοδοι που υπάρχουν μέχρι στιγμής βασίζονται σε υποθέσεις και παρουσιάζουν αδυναμίες, που έχουν αντίκτυπο στο δένδρο. Παραταύτα τα φυλογενετικά δένδρα αποτελούν πολύ καλό εργαλείο για την κατανόηση των φυλογενετικών σχέσεων των οργανισμών. 1.3 Ανάλυση Πρωτεϊνικής δομής Γνωρίζουμε πως η τρισδιάστατη δομή της πρωτεΐνης καθορίζει τη λειτουργία της. Παραδοσιακά, οι ερευνητές έβρισκαν τη δομή της πρωτεΐνης στο χώρο, αφού πρώτα ανακάλυπταν από πειραματικά αποτελέσματα τις λειτουργίες της. Η νέα προσέγγιση της δομικής γονιδιωματικής (structural genomics) βασίζεται στην ακριβώς αντίθετη διαδικασία, δηλαδή από τη γονιδιωματική βιβλιοθήκη εξάγουμε τις ακολουθίες (εξώνια), που εκφράζονται σε πρωτεΐνη και αφού εκφράσουμε τη πρωτεΐνη, καθορίζουμε κυρίως υπολογιστικά τη τρισδιάστατη δομή της (Pevsner 2003)(εικόνα 1.9) 25

26 ΕΙΣΑΓΩΓΗ Εικόνα 1.9 Παραδοσιακή και σύγχρονη αντίληψη για την εύρεση της τριτοταγούς δομής μιας πρωτεΐνης(η εικόνα πάρθηκε από το βιβλίο Bioinformatics and functional genomics, J. Pevsner) Δε μπορούμε να γνωρίζουμε με βάση τα δεδομένα που υπάρχουν σήμερα, πως από την αμινοξική ακολουθία καταλήγουμε στη τρισδιάστατη δομή της πρωτεΐνης. Υπάρχουν ασθένειες που προκαλούνται από την αντικατάσταση ενός αμινοξέος, με αποτέλεσμα την αλλαγή της δομής και της λειτουργίας της εκφραζόμενης πρωτεΐνης. Υπάρχουν όμως και αντικαταστάσεις οι οποίες δεν επιφέρουν καμία αλλαγή στην πρωτεΐνη που προκύπτει. Οι Wood και Pearson (Wood and Pearson 1999) αφού εξέτασαν 36 πρωτεϊνικές οικογένειες, κατέληξαν ότι υπάρχει υψηλή και γραμμική σχέση μεταξύ ομοιοτήτων της αμινοξικής ακολουθίας και ομοιοτήτων της τρισδιάστατης δομής της πρωτεΐνης, οπότε συμπέραναν ότι αλλαγές στην αμινοξική ακολουθία οδηγούν και σε αλλαγές στη δομή και επισήμαναν ότι η συχνότητα των δομικών αλλαγών είναι σχετικά σταθερή μέσα σε μια πρωτεϊνική οικογένεια Δευτεροταγής δομή Αφού δημιουργηθεί η αμινοξική ακολουθία της πρωτεΐνης στα ριβοσώματα, υφίσταται αλλαγές ώσπου να καταλάβει τη τελική της μορφή στο χώρο. Η δευτεροταγής 26

27 ΕΙΣΑΓΩΓΗ διαμόρφωση είναι αποτέλεσμα δυνάμεων, που δρουν σε τοπικό και σε πρωτεϊνικό (global) επίπεδο (Baxevanis A. D. 2001). Σε τοπικό επίπεδο παρατηρούνται απωθήσεις (repulsion) μεταξύ των υδροφοβικών πλευρικών αλυσίδων των αμινοξέων και του υδροφιλικού σκελετού της πρωτεΐνης, όπως και αλληλεπιδράσεις μεταξύ των πλευρικών αλυσίδων και του περιβάλλοντος μέσου (Pauling, Corey et al. 1951). Τέλος σε πρωτεϊνικό επίπεδο παρατηρούνται ελκτικές ή απωστικές δυνάμεις μεταξύ διαφορετικών τμημάτων της πρωτεΐνης (Baxevanis A. D. 2001). Αποτέλεσμα όλων των παραπάνω είναι τμήματα της πρωτεΐνης τελικά να διαμορφώνουν τη δομή της α-έλικας ή της β-πτυχωτής επιφάνειας ή της στροφής (Baxevanis A. D. 2001). Οι αλγόριθμοι πρόβλεψης δευτεροταγούς δομής πρωτεϊνών χρησιμοποιούν διάφορες υπολογιστικές τεχνικές η δημοφιλέστερη εκ των οποίων είναι τα νευρωνικά δίκτυα τα οποία βασίζονται στη φυσιολογία και στην ανατομία του νευρικού μας συστήματος (Lesk 2002). Όλα τα νευρωνικά δίκτυα αποτελούνται από ένα επίπεδο εισόδου (input layer), ένα επίπεδο εξόδου ( output layer) και ένα ή περισσότερα κρυφά επίπεδα (hidden layer) τα οποία διαμεσολαβούν μεταξύ των επιπέδων εισόδου και εξόδου. Για το πρόβλημα πρόβλεψης δευτεροταγούς διαμόρφωσης το επίπεδο εισόδου το αποτελούν τα αμινοξέα της πρωτεϊνικής ακολουθίας και στο επίπεδο εξόδου μπορεί να παίρνουμε τη δομή της α-έλικας ή της β-πτυχωτής επιφάνειας ή μια άλλη διαμόρφωση (π.χ. στροφής), όπως φαίνεται στο σχήμα (Baxevanis A. D. 2001) Εικόνα 1.10 Τρόπος λειτουργίας νευρωνικών δικτύων Εκτός από τα νευρωνικά δίκτυα υπάρχουν και άλλες προσεγγίσεις για τη πρόβλεψη της δευτεροταγούς δομής. Το 1978 οι Chou και Fasma ανέπτυξαν έναν αλγόριθμο πρόβλεψης δευτεροταγούς δομής, ο οποίος βασίζεται στη συχνότητα εμφάνισης 27

28 ΕΙΣΑΓΩΓΗ κάθε ενός από τα είκοσι αμινοξέα στη διαμόρφωση της α-έλικας, της β-πτυχωτής επιφάνειας και της στροφής(baxevanis A. D. 2001). Ο αλγόριθμος σαρώνει την πρωτεϊνική ακολουθία ανά εξάδες και αναγνωρίζει περιοχές όπου τουλάχιστον τέσσερα από τα έξι συνεχόμενα αμινοξέα παρουσιάζουν πιθανότητα εμφάνισης α- έλικας μεγαλύτερη από τη κατώφλιο τιμή και ύστερα επεκτείνει τη συγκεκριμένη περιοχή. Το ίδιο συμβαίνει και για τις υπόλοιπες διαμορφώσεις (Pevsner 2003). Άλλη προσέγγιση πρόβλεψης της δευτεροταγούς διαμόρφωσης είναι ο αλγόριθμος GOR (Garnier, Osguthorpe et al. 1978) ο οποίος βασίζεται σε ένα παράθυρο μήκους 17 αμινοξέων (Krane D. 2002). Όπως και στον αλγόριθμο Chou-Fasman χρησιμοποιούνται γνωστές δομές πρωτεϊνών μόνο που στον GOR δημιουργούνται πίνακες 17x20 που δείχνουν τη συχνότητα εμφάνισης κάθε αμινοξέος σε κάθε μία από τις 17 θέσεις (Krane D. 2002). Τα αποτελέσματα του GOR δίνουν 65% ακρίβεια, όταν χρησιμοποιούνται για τη πρόβλεψη της τριτοταγούς δομής. Οι εξελικτικές πληροφορίες που δίνονται ως αποτέλεσμα της πολλαπλής στοίχισης συγγενικών πρωτεϊνών αποτελούν πλεονέκτημα για τους αλγόριθμους πρόβλεψης δευτεροταγούς δομής Τριτοταγής δομή Εν σύγκριση με τη δευτεροταγή δομή η πρόβλεψη της τριτοταγούς δομής μιας πρωτεΐνης είναι μια πολύ πιο απαιτητική εργασία. Το 1968 ο C.Levinthal ανακάλυψε ότι ακόμα και για μικρού μεγέθους πολυπεπτιδικές αλυσίδες είναι τόσες πολλές οι πιθανές διαμορφώσεις που θα χρειάζονταν χρόνια για να βρεθεί η «φυσική» (native) δομή των πρωτεϊνών. Η παρατήρηση αυτή αναφέρεται ως Levinthal paradox και συμπεραίνουμε ότι πιθανώς οι πρωτεΐνες για να καταλάβουν τη φυσική τους δομή περνούν από προοδευτικά όλο και πιο σταθερές ενδιάμεσες διαμορφώσεις (Krane D. 2002) Μετά τη δημιουργία της στα ριβοσώματα η πολυπεπτιδική αλυσίδα καταλαμβάνει τελικά τη τρισδιάστατη δομή της με τη μικρότερη ελεύθερη ενέργεια (Lesk 2002). Άρα μπορούμε να υποθέσουμε ότι η φύση διαθέτει έναν «αλγόριθμο» σχηματισμού της τελικής πρωτεϊνικής δομής έχοντας ως είσοδο την αμινοξική ακολουθία(lesk 2002). Αυτό τον αλγόριθμο προσπαθούμε να προσεγγίσουμε στις υπολογιστικές μεθόδους πρόβλεψης της τριτοταγούς δομής, όπως θα δούμε και παρακάτω. 28

29 ΕΙΣΑΓΩΓΗ Πειραματικά η τρισδιάστατη δομή προσεγγίζεται με δύο τεχνικές: τη κρυσταλλογραφία με ακτίνες-χ και το πυρηνικό μαγνητικό συντονισμό ( nuclear magnetic resonance (NMR) spectroscopy) (Baxevanis A. D. 2001; Pevsner 2003). Και οι δύο τεχνικές έχουν τα πλεονεκτήματα και τα μειονεκτήματα τους. Περίπου το 80% των γνωστών δομών έχουν προβλεφθεί με τη τεχνική της κρυσταλλογραφίας με ακτίνες-χ (Pevsner 2003). Στη μέθοδο αυτή μικροί πρωτεϊνικοί κρύσταλλοι (>1mm) εκτίθενται σε έντονο παλμό ακτινών-χ, οι οποίες καθώς χτυπούν τον κρύσταλλο, διασκορπίζονται και λαμβάνονται από έναν δέκτη, που με ανάλυση της ακτίνας που έχει περιθλαστεί εξάγουμε την απεικόνιση της τρισδιάστατης δομής της πρωτεΐνης (Pevsner 2003). Το μειονέκτημα της τεχνική αποτελεί η δημιουργία των κρυστάλλων καθώς αποτελεί χρονοβόρο διαδικασία, αφού είναι ιδιαίτερα δύσκολο οι πρωτεΐνες να μετατραπούν σε κρύσταλλο και υπάρχει πιθανότητα να αλλοιωθεί η δομή της πρωτεΐνης, όταν αυτή μετατρέπεται σε κρύσταλλο (Pevsner 2003). Σχήμα 1.11 Διαδικασία εύρεσης τριτοταγούς δομής πρωτεΐνης με κρυσταλλογραφία με ακτίνες-χ(η εικόνα πάρθηκε από το βιβλίο Bioinformatics and functional genomics, J. Pevsner) 29

30 ΕΙΣΑΓΩΓΗ Η NMR spectroscopy δεν απαιτεί τη δημιουργία κρυστάλλων, καθώς το μαγνητικό πεδίο μπορεί να εφαρμοσθεί στο φυσικό μέσο της πρωτεΐνης και να παρατηρηθούν οι χαρακτηριστικές μετατοπίσεις (chemical shifts), που συμβαίνουν κατά την εφαρμογή του πεδίου. Με βάση αυτές τις παρατηρήσεις υπολογίζεται η τριτοταγή δομή της πρωτεΐνης (Pevsner 2003). Η μεγαλύτερη μέχρι σήμερα δομή που έχει λυθεί με αυτή τη μέθοδο αποτελείται από 350αα, αρκετά μικρότερη από τα μεγέθη που συνήθως βρίσκονται με κρυσταλλογραφία (Pevsner 2003). Και οι δύο πειραματικές τεχνικές συνεχώς βελτιώνονται, ώστε να μπορούν να εφαρμοστούν σε όλο και περισσότερες πρωτεΐνες. Αυτό όμως που στοχεύουν οι επιστήμονες είναι στο μέλλον να μην απαιτείται πειραματική εύρεση τριτοταγούς δομής αλλά να πραγματοποιείται ακριβής πρόβλεψη με υπολογιστικές μεθόδους. Σήμερα οι υπολογιστικές μέθοδοι εύρεσης τριτοταγούς δομής δε δίνουν ακριβή αποτελέσματα, όπως οι πειραματικές. Οι υπολογιστικές μέθοδοι πρόβλεψης τριτοταγούς δομής διακρίνονται σε ab initio προσεγγίσεις και σε μεθόδους εύρεσης ομολογίας (Pevsner 2003). Συνοπτικά ο τρόπος λειτουργίας τους φαίνεται στο παρακάτω σχήμα. Εικόνα 1.12 Τρόποι προσέγγισης της τριτοταγούς δομής των πρωτεϊνών από την μέθοδο εύρεσης ομολογίας(comparative modeling) και την ab initio μέθοδο. (Η εικόνα πάρθηκε από το βιβλίο Bioinformatics and functional genomics, J. Pevsner) 30

31 ΕΙΣΑΓΩΓΗ Οι ab initio μέθοδοι προσπαθούν να προσεγγίσουν τον «αλγόριθμο» που χρησιμοποιεί η φύση για την εύρεση της τρισδιάστατης δομής με την ελάχιστη ελεύθερη ενέργεια (Lesk 2002). Σήμερα όμως οι αλγόριθμοι που βασίζονται σε ab initio μεθόδους βρίσκονται σε πολύ πρώιμο στάδιο και απέχουν πολύ από το «βέλτιστο αλγόριθμο» που χρησιμοποιείται στα κύτταρα, γι αυτό άλλωστε και δεν είναι τόσο αξιόπιστοι (Baxevanis A. D. 2001). Παραταύτα τα μοντέλα που παράγονται μπορεί να αποτελέσουν την εναρκτήρια υπόθεση για περαιτέρω μελέτη και πειράματα ή να χρησιμοποιηθούν από τους αλγόριθμους που βασίζονται στο threading ή στην εύρεση ομολογίας (Baxevanis A. D. 2001). Η μέθοδος Rosseta Stone είναι η πιο αξιόλογη από όλες τις ab initio μεθόδους (Simsons et.al., 2001), κατά την οποία η πρωτοταγής δομή της πρωτεΐνης σπάει σε τμήματα των εννέα αμινοξέων το καθένα από τα οποία συγκρίνονται με γνωστές πρωτεϊνικές δομές από τη PDB (Protein Data Bank). Δε συγκρίνεται ολόκληρη η πρωτεΐνη, όπως θα δούμε στις μεθόδους εύρεσης ομολογίας. Με αναγωγή σε ολόκληρη της ακολουθία παράγεται η προτεινόμενη δομή της πρωτεΐνης (Pevsner 2003). Επίσης υπάρχουν ab initio προσεγγίσεις οι οποίες βασίζονται στις φυσικές δυνάμεις, που ωθούν την πρωτεΐνη να καταλάβει μια συγκεκριμένη δομή στο χώρο (Krane D. 2002). Οι προσεγγίσεις αυτές όμως δεν επιφέρουν καλά αποτελέσματα καθώς δε γνωρίζουμε πλήρως τις διαδικασίες και τις δυνάμεις που οδηγούν τη πρωτεϊνική ακολουθία στη τρισδιάστατη δομή της. Επίσης για μέσου μεγέθους πολυπεπτιδικές αλυσίδες απαιτείται τεράστια υπολογιστική δύναμη με αυτούς τους αλγόριθμους για υπολογισμό της τριτοταγής τους δομής (Krane D. 2002). Μειονέκτημα για όλους τους ab initio αλγόριθμους αποτελεί το μεγάλο χρονικό διάστημα (τουλάχιστον 1 εβδομάδα) που απαιτείται για την ανάλυση μιας πρωτεϊνικής ακολουθίας. Ενώ οι αλγόριθμοι εύρεσης ομολογίας απαιτούν μόνο μερικά λεπτά για τη πρόβλεψη της δομής της πρωτεϊνικής ακολουθίας. Οι Richard Bonneau, Jerry Tsai, Ingo Ruczinski, and David Baker αναφέρουν ότι καθώς αυξάνεται ραγδαία οι δομές των πρωτεϊνών που βρίσκονται πειραματικά μπορεί οι ab initio μέθοδοι να πάψουν να χρησιμοποιούνται αφού οι αλγόριθμοι εύρεσης ομολογίας θα παράγουν αποτελέσματα με μεγάλη ακρίβεια (Bonneau, Tsai et al. 2001). 31

32 ΕΙΣΑΓΩΓΗ Η εύρεση της τριτοταγούς δομής με τις μεθόδους εύρεσης ομολογίας αποτελεί μια πολυβηματική διαδικασία που περιλαμβάνει τη στοίχιση των ακολουθιών, τη τροποποίηση της στοίχισης αν χρειάζεται από τον ερευνητή, την έρευνα σε βάσεις δεδομένων, τη διαμόρφωση του μοντέλου, τη μετατροπή του μοντέλου με βάση την αρχή της ελαχιστοποίησης της ελεύθερης ενέργειας και την αξιολόγηση του μοντέλου με κατάλληλα εργαλεία (Baxevanis A. D. 2001) (Pevsner 2003) (Roland 2006)Το πιο σημαντικό βήμα αποτελεί η στοίχιση της αμινοξικής ακολουθίας, αφού λάθη σε αυτό το στάδιο θα οδηγήσουν σε λάθος μοντέλο (Baxevanis A. D. 2001)Για να μειωθεί η περίπτωση λάθους χρησιμοποιούνται, όταν είναι δυνατόν οι βάσεις δεδομένων με πολλαπλές στοιχίσεις ομολόγων ακολουθιών (Baxevanis A. D. 2001). Επίσης οι Roland L και Dunbrack Jr (Dunbrack 2006) αναφέρουν μια διαφορετική μέθοδο προσέγγισης για τη στοίχιση ακολουθιών στο πρώτο βήμα των αλγορίθμων εύρεσης ομολογίας, κατά την οποία λαμβάνουμε με στοίχιση μόνο τα αξιόπιστα τμήματα της πρωτεΐνης και χρησιμοποιούμε ab initio modeling για τα τμήματα με μεγάλη απόκλιση. Αυτή η προσέγγιση θα μπορούσε να χρησιμοποιηθεί στη περίπτωση μακρινών ομολόγων. Φυσικά οι αλγόριθμοι εύρεσης ομολογίας επιστρέφουν καλύτερα αποτελέσματα στις περιπτώσεις που η πρωτεΐνη παρουσιάζει ομολογία με κάποια γνωστή πρωτεϊνική δομή και συγκεκριμένα απαιτείται τουλάχιστον 30% ταυτοσημία με την ομόλογη πρωτεΐνη (Pevsner 2003) (Baxevanis A. D. 2001), Παραταύτα υπάρχουν σπάνιες περιπτώσεις, όταν οι αλγόριθμοι που υπάγονται σε αυτή τη κατηγορία, παράγουν αξιόπιστα αποτελέσματα για πρωτεΐνες με λιγότερο από 20% ταυτοσημία(baxevanis A. D. 2001). Αναπόφευκτα όμως, αφού η πρωτοταγής δομή της πρωτεΐνης δεν είναι τόσο συντηρημένη όσο η τριτοταγής διαμόρφωσή της, υπάρχουν πρωτεΐνες που ενώ παρουσιάζουν πολύ όμοια δομή στο χώρο εμφανίζουν σημαντικές διαφορές στις αμινοξικές ακολουθίες τους. Το πρόβλημα αυτό προσπαθεί να λυθεί με τη μέθοδο Threading, η οποία κατά κάποιο τρόπο αποτελεί συνέχεια των μεθόδων εύρεσης ομολογίας και για το λόγο αυτό δεν αναφέρεται σαν μια διαφορετική προσέγγιση για την υπολογιστική πρόβλεψη της τριτοταγούς δομής των πρωτεϊνών (Baxevanis A. D. 2001). Στη συγκεκριμένη μέθοδο αναζητάτε ομολογία σε βάσεις δεδομένων με τριτοταγείς δομές πρωτεϊνών (PDB κ.α.) (Krane D. 2002). Οι μέθοδοι εύρεσης ομολογίας συγκρίνουν αμινοξικές ακολουθίες για τις οποίες είναι γνωστή η τριτοταγής δομή. Οι αλγόριθμοι Threading δεν παράγουν ακριβής και λεπτομερείς δομές (όπως οι αλγόριθμοι εύρεσης ομολογίας), αλλά μια πιο γενική διαμόρφωση την οποία θα μπορούσε να καταλάβει η άγνωστη αμινοξική ακολουθία (Baxevanis A. D. 2001). Οι 32

33 ΕΙΣΑΓΩΓΗ αλγόριθμοι Threading προσομοιάζουν την τεχνική που χρησιμοποιείται, για να περάσει ένας σωλήνας από έναν αποχετευτικό αγωγό (Baxevanis A. D. 2001). Στη συγκεκριμένη περίπτωση ο λεπτός σωλήνας αντιστοιχεί στην άγνωστη πρωτεϊνική ακολουθία και ο αποχετευτικός αγωγός στις τριτοταγής διαμορφώσεις γνωστών πρωτεϊνών. Κάθε φορά που «περνάμε», αμινοξύ προς αμινοξύ, την άγνωστη ακολουθία από τη στερεοδομή μιας γνωστής πρωτεΐνης το μοντέλο αξιολογείται με βάση την ενέργεια και την ποιότητά του (Krane D. 2002). Η διαμόρφωση που καταλαμβάνει το μεγαλύτερο σκορ θεωρείται και η πιο πιθανή (Baxevanis A. D. 2001) (Pevsner 2003)Οι αλγόριθμοι Threading μπορεί να χρησιμοποιούν και τη δευτεροταγή δομή τόσο της πρωτεϊνικής ακολουθίας που μας ενδιαφέρει όσο και των γνωστών πρωτεϊνών με τις οποίες συγκρίνεται. Σχηματική αναπαράσταση της τεχνικής Threading φαίνεται παρακάτω κατά την οποία η αμινοξική ακολουθία THREADINGSE.. περνά αμινοξύ προς αμινοξύ από τις τρισδιάστατες δομές των πρωτεϊνών της PDB Εικόνα 1.13 απεικόνιση του τρόπου λειτουργίας της τεχνικής THREADING Οι Baker και Sali (Baker and Sali 2001) προσπάθησαν να συγκρίνουν τις μεθόδους εύρεσης τριτοταγούς δομής και να διαπιστώσουν την ακρίβεια τους καθώς και να αναφέρουν τις περιπτώσεις που ενδείκνυται η κάθε μέθοδος. Τα αποτελέσματά τους φαίνονται στο παρακάτω σχήμα. 33

34 ΕΙΣΑΓΩΓΗ Εικόνα 1.14 Ακρίβεια των μεθόδων πρόβλεψης τριτοταγούς δομής πρωτεϊνών και οι εφαρμογές τους όπως αναφέρονται από τους Baker και Sali (2001). (Η εικόνα πάρθηκε από το βιβλίο Bioinformatics and functional genomics, J. Pevsner) Είναι φανερό πως καθώς ανακαλύπτουμε τις τρισδιάστατες δομές όλο και πιο πολλών πρωτεϊνών, βοηθούμαστε σημαντικά στη κατανόηση της σχέσης που συνδέει τη δομή με τη λειτουργία μιας πρωτεΐνης, ώστε να μπορέσουμε να αποκωδικοποιήσουμε τις λειτουργίες του κυττάρου. Πολλές από τις τεχνικές που αναφέρθηκαν σε όλη την εισαγωγή χρησιμοποιήθηκαν στη παρούσα εργασία, ώστε να προβλέψουμε τη δομή και να υποθέσουμε κάποιες από τις λειτουργίες της ομόλογης πρωτεΐνης της ανθρώπινης Geminin. 1.4 Ρύθμιση της αντιγραφής του κυττάρου και ρόλος της Geminin Από τα πρώτα πειράματα που πραγματοποιήθηκαν σε κύτταρα ζύμης έγινε γνωστό πως η ρύθμιση του κυτταρικού κύκλου στα ευκαρυωτικά κύτταρα επιτυγχάνεται μέσω κυκλινοεξαρτώμενων κινασών ( Cyclin Depentent Kinases CDKs). Τα μόρια αυτά παρουσιάζουν καταλυτική ενεργότητα κινάσης, εμφανίζουν περιοδική διακύμανση κατά τη διάρκεια του κυτταρικού κύκλου και ενεργοποιούνται όταν τα επίπεδα της αντίστοιχης κυκλίνης είναι υψηλά. Συγκεκριμένα πιστεύεται ότι μέσω αλλαγής των 34

35 ΕΙΣΑΓΩΓΗ επιπέδων ενεργότητας των CDKs πραγματοποιείται η ρύθμιση της αντιγραφής, ώστε να συμβαίνει μόνο μία φορά ανά κυτταρικό κύκλο (Wuarin and Nurse 1996). Κατά τη φάση G1 του κυτταρικού κύκλου δημιουργείται ένα πολυπρωτεϊνικό σύμπλοκο (προ-αντιγραφικό σύμπλοκο) στις αφετηρίες της αντιγραφής το οποίο πιστεύεται ότι ενεργοποιείται κατά τη μετάβαση στη φάση S, ενώ στις φάσεις G2 και M δεν υπάρχουν οι κατάλληλες συνθήκες για τη δημιουργία του. Διάφορες πρωτεΐνες προσδένονται στις αφετηρίες της αντιγραφής και αποτελούν το σύμπλοκο αυτό μία από τις οποίες είναι και ο CDT1. Σε ανώτερους οργανισμούς υπερέκφραση του CDT1 οδηγεί τα κύτταρα σε συνεχή διπλασιασμό (Zhong, Feng et al. 2003). Για το λόγο αυτό ο παράγοντας CDT1 θεωρείται ως μόριο με πιθανή ογκογενετική δράση. Γεγονός που αποδεικνύεται από πειράματα σε ποντίκια όπoυ υπερέκφραση του CDT1 οδηγεί σε κακοήθη εξαλλαγή των κυττάρων (Arentson, Faloon et al. 2002). Η πρωτεΐνη του CDT1 είναι παρούσα μόνο στη φάση G1, καθιστώντας δυνατή τη πυροδότηση των αφετηριών αντιγραφής σε αυτή και μόνο τη φάση. Αναστολέα του παράγοντα στις φάσεις G2 και M αποτελεί στα μετάζωα η πρωτεΐνη Geminin. Πρόκειται για μικρή πυρηνική πρωτεΐνη (25 Kda) και έχει χαρακτηριστεί μέχρι σήμερα μόνο στα μετάζωα. Το όνομά της προέρχεται από τη λέξη Gemini που σημαίνει δίδυμος και αρχικά δόθηκε επειδή βρέθηκαν δύο αντίγραφά της (Geminin L Geminin H) στο Xenopus με ίδιες ακριβώς ιδιότητες αλλά και για το διπλό ρόλο που αυτή παίζει τόσο κατά τη νευρογένεση όσο και κατά την αντιγραφή. Ο ρόλος της κατά τη νευρογένεση προσδιορίστηκε όταν μετά από ένεση του mrna της σε κοιλιακά ή ραχιαία βλαστομερίδια παρατηρήθηκε επέκταση της νευρικής πλάκας (Kroll, Salic et al. 1998), Υπεύθυνο τμήμα για αυτή της την ιδιότητα θεωρείται μια περιοχή προς το αμινοτελικό άκρο. Πρόσφατα βρέθηκαν ενδείξεις ότι η Geminin αλληλεπιδρά με μέλη της οικογένειας Hox και του συμπλέγματος polycomp καθώς και με το μεταγραφικό παράγοντα Six3 και το σύμπλεγμα SWI/SNF και πιθανώς να έχει κάποιο ρόλο στη ρύθμιση της μεταγραφής(). Στα θηλαστικά η Geminin ρυθμίζεται κατά τη διάρκεια του κυτταρικού κύκλου, ώστε να συσσωρεύεται με την έναρξη της φάσης S και να παραμένει μέχρι την ανάφαση, οπότε και γίνεται πρωτεολυτικός στόχος από το σύμπλεγμα προαγωγής της ανάφασης (Anaphase Promoting Complex APC) αποτρέποντας κατά τη διάρκεια αυτών των φάσεων τη δράση του CDT1. Έχει προταθεί ότι η Geminin δρα ως επιπρόσθετος μηχανισμός που διασφαλίζει ότι δε θα δοθεί αδειοδότηση της αντιγραφής στις φάσεις S και G2, αν τυχόν υπάρξουν μόρια CDT1 στις φάσεις αυτές. 35

36 ΕΙΣΑΓΩΓΗ Δεν έχει γίνει ακόμα γνωστό πως και αν συνδέονται οι δύο δράσης της Geminin κατά την αντιγραφή του γενετικού υλικού και τη νευρογένεση. Υπάρχουν πρόσφατες έρευνες που θεωρούν ότι η Geminin θα μπορούσε να υπάρξει στόχος για κάποια νέα αντικαρκινικά φάρμακα, αφού αποτελεί αναστολέα της αντιγραφής (Yoshida 2006) 36

37 ΣΤΟΧΟΣ ΣΤΟΧΟΣ 37

38 ΣΤΟΧΟΣ Με σκοπό η παρούσα εργασία να χρησιμοποιηθεί ως υπόβαθρο για τη πειραματική προσέγγιση της ομόλογης πρωτεΐνης της ανθρώπινης Geminin, που στη παρούσα εργασία αναφέρεται ως GemininB, πραγματοποιήθηκε προσπάθεια να μελετήσουμε τη συγκεκριμένη πρωτεΐνη με υπολογιστικά μόνο εργαλεία του δυαδυκτίου. Για το λόγο αυτό η παρούσα εργασίας βαδίζει με βάση τους παρακάτω στόχους: ΣΤΟΧΟΣ 1: Προσδιορισμός της γονιδιακής περιοχής της GemininB μέσω της ομολογίας της με τη Geminin. ΣΤΟΧΟΣ 2: Προσδιορισμός ενός προτεινόμενου mrna, μέσω της ύπαρξης cdna και ESTs, μιας πιθανής γονιδιακής δομής (πρόβλεψη εσωνίων-εξωνίων) και παραγωγή της προτεινόμενης αμινοξικής ακολουθίας ΣΤΟΧΟΣ 3: Πραγματοποίηση με υπολογιστικά εργαλεία πρόβλεψης των λειτουργικών περιοχών της παραγόμενης αμινοξικής ακολουθίας ΣΤΟΧΟΣ 4: Προσδιορισμός μέσω της ομολογίας της πρωτεΐνης με τη Geminin και μέσω υπολογιστικών εργαλείων της δευτεροταγούς και τριτοταγούς δομής της GemininB ΣΤΟΧΟΣ 5: Εκτίμηση των πιθανών ομολόγων της πρωτεΐνης και δημιουργία μέσω υπολογιστικών εργαλείων του φυλογενετικού δένδρου της GemininB. 38

39 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ 39

40 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ Στη παρούσα εργασία χρησιμοποιήθηκαν υπολογιστικές τεχνικές. Το σύνολο των τεχνικών αυτών με μια σύντομη περιγραφή τους παρουσιάζεται παρακάτω. Για τη στοίχιση ακολουθιών σε όλη τη πορεία της εργασίας χρησιμοποιήθηκαν διαφόρων τύπων αλγόριθμοι Blast ( Basic Local Alignment Search Tool, όπως: Blast2sequences για τη στοίχιση δύο πρωτεϊνικών ή νουκλεοτιδικών ακολουθιών. Αποδίδει και γραφική απεικόνιση των τμημάτων των ακολουθιών που παρουσιάζουν ομοιότητα. BlastP (ProteinProtein Blast). Στοιχίζει τη πρωτεϊνική ακολουθία που τοποθετείται ως ερώτημα(query) με πρωτεϊνικές ακολουθίες που υπάρχουν σε πρωτεϊνικές βάσεις δεδομένων. BlastN (Nucleotide Blast). Εκτελεί την ίδια διεργασία όπως ο αλγόριθμος BlastP μόνο που στοιχίζει νουκλεοτιδικές ακολουθίες. TblastN (Protein query vs. translated database). Στοιχίζει τη πρωτεϊνική ακολουθία που τοποθετείται ως ερώτημα(query) με τα έξι πλαίσια ανάγνωσης νουκλεοτιδικών ακολουθιών. PSI-Blast Χρησιμοποιείται κυρίως για εύρεση μακρινών ομολόγων. Ο χρήστης κάθε φορά επιλέγει τις πρωτεΐνες που θεωρεί ότι έχουν ομολογία με τη πρωτεΐνη που έχει τοποθετήσει ως ερώτημα αρχικά με αποτέλεσμα η νέα έρευνα με Blast να έχει διαφορετικό πίνακα σκοραρίσματος(position specific scoring matrix) από την αρχική έρευνα με BLAST. Ο πίνακας σκοραρίσματος κάθε φορά προκύπτει βάση των συντηρημένων περιοχών για τη συγκεκριμένη οικογένεια. Για την εύρεση του γονιδιακού τόπου και του προφίλ έκφρασης της GemininB χρησιμοποιήθηκαν πληροφορίες από τις παρακάτω βάσεις δεδομένων και προγράμματα: UniGene ( UniGene αποτελεί μια βάση δεδομένων με αναλυτικές και οργανωμένες πληροφορίες για τα μετάγραφα των διαφόρων οργανισμών που είναι προσβάσιμο μέσω του NCBI. MapViewer ( που είναι προσβάσιμο μέσω του NCBI. Με το πρόγραμμα Mapviewer μπορούμε να πλοηγηθούμε σε γονιδιώματα διαφόρων οργανισμών. Επίσης περιέχει και συνδέσεις με περισσότερες πληροφορίες για τα γονίδια που απεικονίζονται. Από την επιλογή Maps and Options μπορούμε να επιλέξουμε να δούμε χάρτες με διαφορετικές πληροφορίες ο καθένας και να τους συγκρίνουμε μεταξύ τους. 40

41 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ Για τη παραγωγή του προτεινόμενου mrna χρησιμοποιήθηκε το πρόγραμμα: Gene2ESTBlast server ( που είναι προσβάσιμο μέσω του EBI ( και βρίσκει όλα τα ESTs που υπάρχουν σε ανθρώπινες βάσεις δεδομένων και παρουσιάζουν αντιστοίχιση με τη δοσμένη νουκλεοτιδική ακολουθία Για το προσδιορισμό της αμινοξικής ακολουθίας και των τριών εναλλακτικών μορφών ματίσματος χρησιμοποιήθηκε το πρόγραμμα: ORF finder ( που είναι προσβάσιμο από το NCBI. Το πρόγραμμα μεταφράζει τις νουκλεοτιδικές ακολουθίες που του δίνονται ως ερώτημα και για τα έξι πλαίσια ανάγνωσης. Δίνει ως έξοδο όλες τις πιθανές πρωτεϊνικές ακολουθίες, ανεξαρτήτου μήκους, που παράγονται. Για τη σύγκριση των παραγόμενων ακολουθιών με την ομόλογή τους Geminin χρησιμοποιήθηκαν οι αλγόριθμοι: Needle ( που είναι προσβάσιμο μέσω του ΕΒΙ (και άλλων σέρβερ) και επιτρέπει ολική στοίχιση των ακολουθιών που τοποθετούνται ως ερώτημα. Ο χρήστης ορίζει τη ποινή για το κενό και την επέκταση του κενού. Ο αλγόριθμος επιστρέφει το ποσοστό ομοιότητας και ταυτοσημίας των δύο ακολουθιών. Smith-Waterman ( που είναι προσβάσιμο μέσω διαφόρων σέρβερ, επιστρέφει τα ίδια αποτελέσματα όπως και ο αλγόριθμος Needle, μόνο που επιτρέπει τοπική στοίχιση των ακολουθιών. Για την ανάλυση των παραγόμενων πρωτεϊνικών ακολουθιών, των πιθανών τριών εναλλακτικών μορφών ματίσματος χρησιμοποιήθηκαν τα προγράμματα: Για την πρόβλεψη των φυσικοχημικών ιδιοτήτων των παραγόμενων πρωτεϊνών χρησιμοποιήθηκε το πρόγραμμα: ProtParam ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy. Το πρόγραμμα επιστρέφει τιμές για το μοριακό βάρος, το πιθανό ισοηλεκτρικό σημείο, τη σύνθεση σε αμινοξέα, το ποσοστό των θετικά και αρνητικά φορτισμένων αμινοξέων, στοιχεία για την ατομική σύνθεση της πρωτεΐνης, 41

42 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ πιθανό χρόνο ημίσειας ζωής, τη πιθανή σταθερότητα του μορίου και τέλος δίνει στοιχεία για την υδροφοβικότητα του μορίου. Για την πρόβλεψη πιθανών λειτουργικών περιοχών χρησιμοποιήθηκαν τα προγράμματα: ELM ( Linear Motif, που είναι προσβάσιμο μέσω του σέρβερ ExPaSy. Προβλέπει λειτουργικές θέσεις βασιζόμενο σε μοτίβα που παρουσιάζουν αυτές οι θέσεις. Motif Scan ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy. Προβλέπει και αυτό με βάση μοτίβα λειτουργικές θέσεις (φωσφοριλίωσης, γλυκοζιλίωσης, μυριστιλίωσης κ.α.) σε ακολουθίες που δίνονται ως ερώτημα. InterPro Scan ( που προβλέπει την οικογένεια στην οποία πιθανώς ανήκει η ακολουθία που δίνεται ως ερώτημα που είναι προσβάσιμο μέσω του σέρβερ του EBI. Για την πρόβλεψη της δευτεροταγούς δομής της παραγόμενης αμινοξικής ακολουθίας χρησιμοποιήθηκαν τα προγράμματα: PairCoil ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy και χρησιμοποιείται για την εύρεση πιθανής coiled coil δομής. COILS ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy και χρησιμοποιείται επίσης για την εύρεση πιθανής coiled coil δομής με διαφορετική προσέγγιση όμως από τον αλγόριθμο PairCoil. PHD ( που είναι προσβάσιμο μέσω του σέρβερ PredictProtein. Το πρόγραμμα επιστρέφει τη πιθανή θέση α-ελίκων και β- πτυχωτών επιφανειών σε δοσμένενες αμινοξικές ακολουθίες. PROF (Profile network prediction)( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy και επίσης προβλέπει τη πιθανή δευτεροταγή δομή της δοσμένης πρωτεϊνικής ακολουθίας. SAM_T02 ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy και επίσης επιστρέφει πρόβλεψη για πιθανή δευτεροταγή δομή. Το πρόγραμμα επιστρέφει τρία διαφορετικά αποτελέσματα ανάλογα με το αλφάβητο που χρησιμοποιείται κάθε φορά. 42

43 ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΜΕΘΟΔΟΙ Για την πρόβλεψη της τριτοταγούς δομής της πρωτεϊνικής ακολουθίας χρησιμοποιήθηκαν τα παρακάτω προγράμματα, που είναι προσβάσιμα από το σερβερ EXPASY εκτός από το Phyre: SWISSMODEL ( χρησιμοποιεί τη τεχνική της σύγκρισης ομολόγων πρωτεϊνικών δομών. 3D-JIGSAW ( που επίσης χρησιμοποιεί τη τεχνική της σύγκρισης ομολόγων πρωτεϊνικών δομών. LOOPP ( που χρησιμοποιεί και αποτελέσματα από τη προβλεπόμενη δευτεροταγή δομή καθώς και τη τεχνική του Threading. Phyre ( Το πρόγραμμα Phyre εκτός από πρόβλεψη της τριτοταγής δομής δίνει και τη δευτεροταγή δομή της πρωτεΐνης όπως προβλέπεται από διάφορα προγράμματα (psipred, Consencus, sspro, jnet). Για τη δημιουργία του φυλογενετικού δένδρου χρησιμοποιήθηκε το πρόγραμμα: ClustalW ( που είναι προσβάσιμο μέσω του σέρβερ ExPaSy και το πρόγραμμα παράγει τη πολλαπλή στοίχιση των πρωτεϊνικών ακολουθιών που δίνονται ως είσοδο και μέσω του αλγόριθμου που περιέχει δημιουργεί ένα πιθανό φυλογενετικό δένδρο. Ο χρήστης έχει την ελευθερία να τροποποιήσει παραμέτρους του προγράμματος και να αλλάξει το αποτέλεσμα. 43

44 ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ 44

45 ΑΠΟΤΕΛΕΣΜΑΤΑ 4.1 Προσδιορισμός με υπολογιστικά εργαλεία της αμινοξικής ακολουθίας της πρωτεΐνης Εύρεση της ανθρώπινης GemininB μέσω της ομόλογής της Geminin Η ανθρώπινη πρωτεΐνη Geminin έχει βρεθεί πειραματικά ότι βρίσκεται στο πυρήνα του κυττάρου και αποτελεί αναστολέα της αντιγραφής. Επίσης είναι γνωστή η αμινοξική της ακολουθία ( NP_ ) και ότι το γονίδιό της εδράζεται στο έκτο χρωμόσωμα και συγκεκριμένα στη περιοχή 6p22.2. Τοποθετώντας την αμινοξική ακολουθία της ανθρώπινης Geminin ως ακολουθία-ερώτημα (query) στο πρόγραμμα TblastN (Protein query- Translated database) και ως βάση δεδομένων τη Refseq με τα μελετημένα και προβλεπόμενα cdna του ανθρώπου πήραμε ως αποτέλεσμα εκτός από το mrna της ίδια την ανθρώπινη Geminin (Homo sapiens geminin, DNA replication inhibitor (GMNN), mrna μήκους 1215) και τo πιθανό mrna (PREDICTED: Homo sapiens similar to geminin (LOC345643)), μήκους 2609bp, με e-value 5e-11. Το παραπάνω πρόγραμμα το περιορίσαμε ώστε να φιλτράρει τις περιοχές με χαμηλή πολυπλοκότητα (low complexity). Η ομολογία μεταξύ της ανθρώπινης Geminin και του προβλεπόμενου mrna, που ανιχνεύθηκε με το πρόγραμμα TblastN, εντοπίζεται στην ευρύτερη περιοχή του σπειροειδούς σπειράματος (coiled coil) της Geminin. Το σπειροειδές σπείραμα της ανθρώπινης Geminin έχει βρεθεί πειραματικά ότι εντοπίζεται στην περιοχή μεταξύ 106αα-140αα (Lee, Hong et al. 2004). Η στοίχιση που πραγματοποίησε το πρόγραμμα φαίνεται παρακάτω. Query 94 PSSQYWKEVAEKRRKALYEALKENEKLHKEIEQKDNEIARLKKENKELAEVAEHVQYMAE 153 P QYWKEVA++ ++AL +AL EN +LH + QK EIA LK+ N +L E+A +++A Sbjct 710 PPEQYWKEVADQNQRALGDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLAS 889 Query 154 LIERL L Sbjct 890 VLDKL 904 Εικόνα 4.1 : Στοίχιση ανθρώπινης Geminin με το ανοιχτό πλαίσιο ανάγνωσης του προβλεπόμενου mrna (LOC345643). Στην εικόνα απεικονίζεται η ευρύτερη περιοχή του coiled coil της Geminin. 45

46 ΑΠΟΤΕΛΕΣΜΑΤΑ Η περιοχή που παρουσιάζει στοίχιση βρίσκεται στη Geminin (Query) μεταξύ 94αα- 158αα (ευρύτερη περιοχή σπειροειδούς σπειράματος) και στο προτεινόμενο mrna (Sbjct) μεταξύ νουκλεοτιδίων. Το προβλεπόμενο mrna προέκυψε από γονιδιακή περιοχή που εδράζεται στο πέμπτο χρωμόσωμα (5q11.2) και συγκεκριμένα μεταξύ των βάσεων μήκους 8517 bp. Συμπεραίνουμε ότι στην περιοχή αυτή εδράζεται γονίδιο ομόλογης πρωτεΐνης της Geminin, στο οποίο από εδώ και πέρα θα αναφερόμαστε ως GemininB Ανάλυση της γονιδιακής περιοχής της GemininB με βάση το πρόγραμμα MapViewer Με σκοπό να βρούμε πληροφορίες που υπάρχουν σε βάσεις δεδομένων του διαδικτύου και αναφέρονται στη συγκεκριμένη γονιδιακή περιοχή χρησιμοποιήσαμε προγράμματα και βάσεις δεδομένων του NCBI, όπως το UniGene, MapViewer και GENE. Από τη βάση δεδομένων UniGene και χρησιμοποιώντας το πρόγραμμα MapViewer μπορέσαμε να πραγματοποιήσουμε μια σχηματική απεικόνιση της γονιδιακής περιοχής ( Genomic locus) του γονιδίου της GemininB, όπως αυτό φαίνεται στo σχήμα παρακάτω. Εικόνα 4.2 : Γονιδιακή περιοχή της GemininB 46

47 ΑΠΟΤΕΛΕΣΜΑΤΑ Αναλυτικότερα παρατηρούμε πως αριστερά της GemininB βρίσκεται το γονίδιο FLG37927 που έχει μήκος 60180bp, κωδικοποιεί μια CDC20-like protein και απέχει bp από τη GemininΒ η οποία έχει μήκος 8517bp. Το γονίδιο UNG2 βρίσκεται δεξιά της GemininΒ, έχει μήκος 1736bp, απέχει 13275bp από τη GemininΒ και κωδικοποιεί μια uracil-dna glycosilase2. Η φορά μεταγραφής φαίνεται στο σχήμα. Λόγω του μεγάλου μεγέθους του FLG37927 γονιδίου και της μεγάλης απόστασής του από τη GemininΒ τα δύο αυτά μεγέθη εμφανίζονται με διακεκομμένη γραμμή στο σχήμα. Εκτός από τη γονιδιακή περιοχή θελήσαμε να δούμε τι άλλα στοιχεία υπάρχουν σε βάσεις δεδομένων για το γονίδιο αυτό. Από τη βάση δεδομένων UniGene, η οποία συγκεντρώνει τις υπάρχουσες πληροφορίες για κάθε πραγματικό ή προβλεπόμενο γονίδιο, πήραμε πληροφορίες τόσο για τα mrna και ESTs (expressed sequence tag) που υπάρχουν για αυτό το γονίδιο αλλά και στοιχεία για το προφίλ έκφρασης (expression profile) που προκύπτει με βάση τα ESTs. Τα ESTs αποτελούν μικρές νουκλεοτιδικές υπό-ακολουθίες μιας μεταγραφόμενης περιοχής, οι οποίες προκύπτουν από γρήγορη αλληλούχιση των άκρων των cdna που απομονώνονται από ένα συγκεκριμένο κυτταρικό ιστό. Τα ESTs χρησιμοποιούνται ευρέως για την εύρεση γονιδίων. Εξαιτίας του τρόπου με τον οποίο πραγματοποιείται ο προσδιορισμός της αλληλουχίας τους, τα ESTs περιέχουν πολλά λάθη το μεγάλο πλήθος τους όμως αντισταθμίζει το συγκεκριμένο εμπόδιο. Στο UniGene έχει καταχωριθεί ένα mrna από HeLa κύτταρα, το full-length cdna clone CS0DK002YL21 of HeLa cells Cot 25-normalized of Homo sapiens (human) ( CR ) και 11 ESTs (BX , BX , BX , BX , BX , BE , DR , AL , AL , BG , BI ). Όσον αφορά το προφίλ έκφρασης (expression profile) του γονιδίου της GemininB όπως αυτό προκύπτει από τα ESTs φαίνεται στο παρακάτω πίνακα. Ο πίνακας περιέχει τις κυτταρικές σειρές; Στις οποίες έχει ανιχνευθεί έκφραση του γονίδιο της GemininB καθώς και τα επίπεδα έκφρασης της Geminin στα κύτταρα αυτά. 47

48 ΑΠΟΤΕΛΕΣΜΑΤΑ Κυτταρική Geminin GemininB σειρά Μετάγραφα (ανά εκατομμύριο) Γονιδιακά ESTs/Ολικά ESTs Μετάγραφα (ανά εκατομμύριο) Γονιδιακά ESTs/Ολικά ESTs Μελάνωμα 56 7/ / Καρκίνος του 58 6/ / μαστού Καρκίνος του 0 0/ /68988 παγκρέατος Λευχαιμία 69 7/ / Πίνακας 4.1: Έκφραση Geminin και GemininB με βάση τα ESTs Παρατηρούμε πως ενώ η GemininB εκφράζεται σε κύτταρα από καρκίνο του παγκρέατος η Geminin δεν εκφράζεται στον ιστό αυτό. Άρα μέσω κάποιων διαδικτιακών εργαλείων μπορέσαμε να βρούμε το γονιδιακό τόπο (genomic locus), ένα cdna από HeLa κύτταρα καθώς και 11 ESTs που μας δίνουν και το προφιλ έκφρασης του γονιδίου της GemininB Πρόβλεψη του προτεινόμενου mrna της GemininB Με σκοπό να βρούμε την αμινοξική ακολουθία της ανθρώπινης πρωτεΐνης GemininB χρειάζεται πρώτα να βρούμε το mrna που πιθανώς μεταγράφει το γονίδιο. Για το σκοπό αυτό χρησιμοποιήσαμε το υπολογιστικό εργαλείο Gene2EST BLAST Server (Gemünd C., Chenna R., Altenberg-Greulich B., Gibson T.J. (2001) Gene2EST: a BLAST2 server for searching expressed sequence tag (EST) databases with eukaryotic gene-sized queries. Nucleic Acids Research, 2001, Vol. 29, No. 6, ), το οποίο βρίσκει όλα τα ESTs που υπάρχουν σε ανθρώπινες βάσεις δεδομένων και παρουσιάζουν ομολογία με τη δοσμένη νουκλεοτιδική ακολουθία. Με το εργαλείο αυτό βρήκαμε 11 ESTs για τη GemininB τοποθετώντας ως ακολουθία ερώτημα τη νουκλεοτιδική ακολουθία μήκους 8517 bp προερχόμενη από το γονιδιακό τόπο της GemininΒ. Τα συνοπτικά αποτελέσματα φαίνονται στο παρακάτω σχήμα 48

49 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.3 : Σχηματική παράσταση της στοίχισης των 11 ESTs του προβλεπόμενου mrna και του cdna από HeLa κύτταρα με τη γονιδιακή περιοχή της GemininB. Όπου το mrna αντιστοιχεί σε ένα πιθανολογούμενο mrna (LOC345643) (>gi ref XM_ Homo sapiens similar to geminin) μήκους 2739 bp που έχει δημιουργηθεί με υπολογιστικά προγράμματα που υπάρχουν στο διαδίκτυο και το cdna αντιστοιχεί στο cdna clone CS0DK002YL21 από HeLa cells. Τα υπόλοιπα αποτελούν τα ESTs τα οποία βρέθηκαν με το Gene2EST BLAST Server Παρατηρούμε ότι το αρχικό τμήμα μήκους 551 bp (11bp -562 bp) που εντοπίζεται στο πιθανολογούμενο mrna (LOC345643) δεν παρατηρείτε ούτε στο cdna clone CS0DK002YL21 από HeLa cells ούτε σε κανένα από τα 11 ESTs. Για το λόγο αυτό θεωρούμε ότι το τμήμα αυτό δεν μεταγράφεται τελικά και αποτελεί λάθος στη πρόβλεψη του πιθανολογούμενου mrna. Με βάση τα 11 ESTs και το cdna από HeLa κύτταρα καταλήξαμε σε ένα προτεινόμενο mrna το οποίο διαφέρει από το πιθανολογούμενο mrna (LOC345643) που υπάρχει στις βάσεις δεδομένων για τη γονιδιακή περιοχή της GemininB στο αρχικό τμήμα μήκους 551 bp. 49

50 ΑΠΟΤΕΛΕΣΜΑΤΑ Εύρεση πιθανής γονιδιακής δομής Με βάση το προτεινόμενο mrna πραγματοποιήθηκε πρόβλεψη για τα εσώνια και τα εξώνια του γονιδίου της GemininB (Genomic structure), η σχηματική απεικόνιση της οποίας παρουσιάζεται παρακάτω. Εικόνα 4.4: Πιθανή γονιδιακή δομή της πρωτεΐνης GemininB Παρατηρούμε ότι η GemininΒ αποτελείται από 7 εξώνια και 6 εσώνια Πιθανή εμφάνιση μορφών εναλλακτικού ματίσματος. Με σκοπό να βρούμε τυχόν διαφορές μεταξύ του cdna (CS0DK002YL21) και του προβλεπόμενου mrna, χρησιμοποιήσαμε το πρόγραμμα Blast2sequences του NCBI που εντοπίζει τα τμήματα τα οποία είναι κοινά και αυτά τα οποία διαφέρουν μεταξύ δύο δοσμένων ακολουθιών. Το πρόγραμμα μας έδειξε τέσσερα νουκλεοτίδια τα οποία ενώ υπάρχουν στο cdna δεν υπάρχουν στο προβλεπόμενο mrna. Τα νουκλεοτίδια αυτά είναι τα GCAA και η διαφορά φαίνεται στην παρακάτω εικόνα Εικόνα 2.5: Blast2sequences όπου το query αντιστοιχεί στο προβλεπόμενο mrna (LOC345643) και το Sbjct στο cdna(cs0dk002yl21) από Hela κύτταρα. 50

51 ΑΠΟΤΕΛΕΣΜΑΤΑ Τα τέσσερα αυτά νουκλεοτίδια στο γενομικό DNA βρίσκονται μεταξύ των βάσεων bp σε περιοχή που αντιστοιχεί στα όρια μεταξύ του εξωνίου 4 και του ιντρουνίου 4. Τα 4 ESTs που παρουσιάζουν ομοιότητα για τη συγκεκριμένη περιοχή, που εντοπίζονται τα 4 νουκλεοτίδια, δεν περιέχουν τα συγκεκριμένα νουκλεοτίδια, όπως φαίνεται και στην παρακάτω εικόνα που πήραμε με το πράγραμμα Gene2EST BLAST Server του EMBL. Εικόνα 4.6: Αποτέλεσμα του Gene2EST BLAST server για τη περιοχή που εντοπίζονται τα τέσσερα νουκλεοτίδια. To Query αντιστοιχεί στο γενομικό DNA(8517 bp) για τη GemininB και τα CNSLT2N06, CNSLTOYF6, BE622574, CNSLT1ZUT αντιστοιχούν στα ESTs. Επειδή τα τέσσερα αυτά νουκλεοτίδια εντοπίζονται στο cdna(cs0dk002yl21) από Hela κύτταρα και δεν εντοπίζονται στα τέσσερα ESTs που αντιστοιχούν στη συγκεκριμένη περιοχή και τέλος επειδή τα τέσσερα αυτά νουκλεοτίδια βρίσκονται σε περιοχή μεταξύ εσωνίου και εξωνίου θεωρούμε πολύ πιθανή την ύπαρξη εναλλακτικών μορφών ματίσματος. Η είσοδος των τεσσάρων αυτών νουκλεοτιδίων στο ώριμο mrna οδηγεί σε αλλαγή του πλαισίου ανάγνωσης και άρα σε παραγωγή διαφορετικών πρωτεϊνικών προϊόντων. Στην εικόνα 4.7 δείχνονται σχηματικά τα εξώνια που θα σχηματιζόντουσαν στο ανοιχτό πλαίσιο ανάγνωσης στα δύο εναλλακτικά cdna. Στο δεύτερο cdna (όπως φαίνεται στην εικόνα) ανάλογα με την εναρκτήρια μεθειονίνη μπορεί να σχηματιστούν δύο διαφορετικά ώριμα mrna, άρα και δύο διαφορετικά πρωτεϊνικά προϊόντα. 51

52 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.7: Σχηματική απεικόνιση της γονιδιακής δομής των δύο εναλλακτικών μορφών ματίσματος. Οι μεταφρασμένες περιοχές φαίνονται με κόκκινο και οι 5 και 3 αμετάφραστες περιοχές φαίνονται με μπλέ. Στην παραπάνω εικόνα φαίνεται η ακριβής θέση των τεσσάρων νουκλεοτιδίων που δημιουργούν το εναλλακτικό μάτισμα. Παρατηρούμε πως από το πρώτο mrna μήκους 2087 νουκλεοτιδίων περιλαμβάνονται εφτά εξώνια στο ανοιχτό πλαίσιο ανάγνωσης, ενώ από το δεύτερο mrna μπορεί να παραχθούν δύο πρωτεϊνικά προϊόντα τα οποία περιλαμβάνουν πέντε εξώνια και τέσσερα εξώνια. Η δεύτερη εναλλακτική μορφή ματίσματος έχει μήκος 2091 νουκλεοτίδια (αφού δεν περιέχει τα νουκλεοτίδια GCAA) Προσδιορισμός αμινοξικής ακολουθίας των τριών πιθανών εναλλακτικών μορφών Με σκοπό να βρούμε την αμινοξική ακολουθία των τριών εναλλακτικών μορφών που προκύπτουν χρησιμοποιήσαμε το εργαλείο ORF finder του NCBI. Από τη μετάφραση των mrna με τα τέσσερα νουκλεοτίδια και χωρίς τα τέσσερα νουκλεοτίδια προέκυψαν τρεις διαφορετικές πρωτεΐνες με μήκος 385aa (μορφήi), 179aa (μορφήii), 264aa (μορφήiii). Η αμινοξική τους ακολουθία και το πώς προκύπτουν φαίνεται αναλυτικά στο παρακάτω σχήμα: 52

53 ΑΠΟΤΕΛΕΣΜΑΤΑ cdna 1 atgcaggcgtgcgggggcggcgcggccggccgtcgggccttcgacagcatctgccccaacagaatgctggcactg μορφήi M Q A C G G G A A G R R A F D S I C P N R M L A L μορφήii M Q A C G G G A A G R R A F D S I C P N R M L A L μορφήiii cdna 73 ccgggccgggcgctgctctgcaagccggggaagccggagaggaagttcgctcctccgcggaagttcttccccgga μορφήi P G R A L L C K P G K P E R K F A P P R K F F P G μορφήii P G R A L L C K P G K P E R K F A P P R K F F P G μορφήiii cdna μορφήi μορφήii μορφήiii cdna μορφήi μορφήii μορφήiii tgcacaggcgggagcccggtgtcggtgtacgaggatcccccggacgccgagcccacagcgctgccagccctcacc C T G G S P V S V Y E D P P D A E P T A L P A L T C T G G S P V S V Y E D P P D A E P T A L P A L T accatagacctgcaggacctcgctgactgctcttcgctactcgggtccgacgcgccgcctggtggtgacctggcc T I D L Q D L A D C S S L L G S D A P P G G D L A T I D L Q D L A D C S S L L G S D A P P G G D L A cdna μορφήi μορφήιi μορφήiii gcctcgcagaaccattcccaccaaacggaagcagacttcaatctgcaagatttcagagacacggtggatgatctc A S Q N H S H Q T E A D F N L Q D F R D T V D D L A S Q N H S H Q T E A D F N L Q D F R D T V D D L M I S cdna atttcaggcaaactcatcctctatgatgtcgcctaccctggccagcggagacttccccttctctccttgcgacata μορφήi I S D S S S M M S P T L A S G D F P F S P C D I μορφήii I S G K L I L Y D V A Y P G Q R R L P L L S L R H μορφήiii F Q A N S S S M M S P T L A S G D F P F S P C D I cdna μορφήi μορφήii μορφήiii tcaccattcgggccctgcctctccccgccactggacccacgggccctgcagtcaccaccgctgcgccctccagac S P F G P C L S P P L D P R A L Q S P P L R P P D T I R A L P L P A T G P T G P A V T T A A P S R R S P F G P C L S P P L D P R A L Q S P P L R P P D cdna gtgcccccgcctgagcaatactggaaggaggtggcggaccagaaccagagagcgttgggagacgcgcttgttgag μορφήi V P P P E Q Y W K E V A D Q N Q R A L G D A L V E μορφήii A P A * μορφήiii V P P P E Q Y W K E V A D Q N Q R A L G D A L V E cdna aataatcaactgcacgtgacattgacccagaaacaggaggagatcgcctcgctcaaggagcggaacgtgcagctg μορφήi N N Q L H V T L T Q K Q E E I A S L K E R N V Q L μορφήii μορφήiii N N Q L H V T L T Q K Q E E I A S L K E R N V Q L cdna aaggaactcgccagccgaacccggcacctggcctcggtgctggataagctgatgatcacacagtcccgggattgt μορφήi K Q E E I A S L K E R N V Q L K L M I T Q S R D C μορφήii μορφήιii K Q E E I A S L K E R N V Q L K L M I T Q S R D C cdna ggggcggcggccgagcccttcctgctcaaggcgaaggccaaaaggagcctggaggagttggtcagcgctgcgggg μορφήi G A A A E P F L L K A K A K R S L E E L V S A A G μορφήii μορφήiii G A A A E P F L L K A K A K R S L E E L V S A A G cdna caggattgcgcggaagtggacgccatcctgagggagatttccgagcgctgcgatgaagcccttcagagccgcgat μορφήi Q D C A E V D A I L R E I S E R C D E A L Q S R D μορφήii μορφήiii Q D C A E V D A I L R E I S E R C D E A L Q S R D cdna cccaagcggccccgactgctgccagagcccgcgaatactgacaccaggcccgggaacctgcatggcgccttcaga μορφήi P K R P R L L P E P A N T D T R E I S E R C D E A μορφήii μορφήiii P K R P R L L P E P A N T D T R E I S E R C D E A cdna cttcagagccgcgatcccaagcggccccgactgctgccagagcccgcgaatactgacaccaggcccgggaacctg μορφήi D Q S R D P K R P R L L P E P A N T D T R P G N L μορφήii μορφήiii D Q S R D P K R P R L L P E P A N T D T R P G N L cdna catggcgccttccgggggctgcgcacagactgcagccggagcgcgttgaacctgagccacagtgagctggaggag μορφήi H G A F R G L R T D C S R S A L N L S H S E L E E μορφήii μορφήiii H G A F R G L R T D C S R S A L N L S H S E L E E 53

54 ΑΠΟΤΕΛΕΣΜΑΤΑ cdna ggcggctccttcagcacccgcatccgcagccacagcaccatccgcaccctcgccttcccccagggcaatgccttc μορφήi G G S F S T R I R S H S T I R T L A F P Q G N A F μορφήii μορφήiii G G S F S T R I R S H S T I R T L A F P Q G N A F cdna accatcagaacagccaacgggggttacaagttccgctgggtccccagttga μορφήi T I R T A N G G Y K F R W V P S * μορφήii μορφήiii T I R T A N G G Y K F R W V P S * Εικόνα 4.8 :Απεικόνιση αμινοξικής ακολουθίας των τριών εναλλακτικών μορφών Η μορφήιι (179aa) είναι πανομοιότυπη με το αμινοτελικό τμήμα της μορφήςi (385aa) με εξαίρεση τα 51 αμινοξέα του καρβοξυτελικού τους άκρου, ενώ η μορφήiii (264aa) είναι ταυτόσημη με το καρβοξυτελικό τμήμα της μορφήςi (385aa) με εξαίρεση τα 5 αμινοξέα του αμινοτελικού τους άκρου. Η αντιστοίχιση των εξωνίων με το τμήμα της πρωτεΐνης που το καθένα από αυτά δίνει φαίνεται στο παρακάτω σχήμα. Η αντιστοίχιση έχει γίνει μόνο για τη μεγαλύτερη από τις τρεις πρωτεΐνες, τη μορφήi μήκους 385aa. Εικόνα 4.9 : Αντιστοίχιση νουκλεοτιδικής ακολουθίας mrna της GemininB με την αμινοξική ακολουθία της πρωτεΐνης που εκφράζεται από αυτό 54

55 ΑΠΟΤΕΛΕΣΜΑΤΑ 4.2 Ανάλυση της παραγόμενης πρωτεϊνικής ακολουθίας Προσδιορισμός φυσικοχημικών ιδιοτήτων της GemininB Αφού βρήκαμε την αμινοξική ακολουθία των τριών εναλλακτικών μορφών χρησιμοποιήσαμε διαδυκτιακά εργαλεία για να προσδιορίσουμε κάποιες ιδιότητες των παραγόμενων πρωτεϊνών, με σκοπό να πάρουμε κάποια γενική ιδέα για τη τοποθεσία και τη λειτουργία των πρωτεϊνών αυτών στο κύτταρο. Αρχικά με τα πρόγραμμα Prot Param του Expasy προσδιορίστηκαν οι πιθανές φυσικοχημικές ιδιότητες των τριών εναλλακτικών μορφών. Αναλυτικότερα το πρόγραμμα επιστρέφει τιμές για το μοριακό βάρος, το πιθανό ισοηλεκτρικό σημείο, τη σύνθεση σε αμινοξέα, το ποσοστό των θετικά και αρνητικά φορτισμένων αμινοξέων, στοιχεία για την ατομική σύνθεση της πρωτεΐνης, πιθανό χρόνο ημίσιας ζωής, τη πιθανή σταθερότητα του μορίου και τέλος δίνει στοιχεία για την υδροφοβικότητα του μορίου. Τα σημαντικότερα αποτελέσματα και για τις τρεις εναλλακτικές μορφές φαίνονται στο παρακάτω πίνακα. Εναλλακτική μορφήι(385aa) Εναλλακτική μορφήii(179aa) Εναλλακτική μορφήiii(264aa) Μ.Β. pi Θετικά Φορτιμένα αμινοξ.(arg+lys) Αρνητικά Φορτισμένα Αμινοξ(Asp+Glu) Δείκτης αστάθειας Αλιφατικός δείκτης ,1%(43αα) 12,9%(50αα) 5062, %(18αα) 10%(18αα) 63,02 79, ,1%(32αα) 12,1(32αα) 64, Πίνακας 4.2 : Αποτελέσματα Prot Param και για τις τρεις εναλλακτικές μορφές της GemininB Από τους δείκτες αστάθειας και των τριών μορφών θεωρούμε τις πρωτεΐνες πιθανώς ασταθείς, αφού παρουσιάζουν δείκτη αστάθειας πάνω από 40. Ο δείκτης αστάθειας έχει προβλεφθεί με βάση κάποια διπεπτίδια τα οποία παρουσιάζουν διαφορετική συχνότητα σε ασταθείς και σταθερές πρωτεΐνες. Από τους αλιφατικούς δείκτες πιστεύουμε ότι οι πρωτεΐνες είναι πιθανώς υδρόφοβες. Η μεγαλύτερη εναλλακτική 55

56 ΑΠΟΤΕΛΕΣΜΑΤΑ μορφή που προκύπτει (formi 385aa) περιέχει περισσότερα αρνητικά φορτισμένα αμινοξέα(asp, Glu) και πιθανώς να είναι αρνητικά φορτισμένη ολόκληρη η πρωτεΐνη. Οι άλλες δύο μορφές πιθανώς να μην είναι φορτισμένες αφού περιέχουν ίδιο αριθμό θετικά και αρνητικά φορτισμένων αμινοξέων Εύρεση συντηρημένων δομικών περιοχών (domains) και προϊόντων αλληλούχισης (patterns) που παρουσιάζονται στις αμινοξικές ακολουθίες των τριών εναλλακτικών μορφών της GemininB και εύρεση της οικογένειας στην οποία πιθανώς ανήκουν. Με σκοπό να βρούμε κάποια στοιχεία για τη λειτουργία των εναλλακτικών μορφών της GeminnB προσπαθήσαμε να βρούμε κάποιες πρωτεϊνικές περιοχές (domain) και μοτίβα στις πρωτεΐνες αυτές. Στο διαδίκτυο υπάρχουν πολλοί αλγόριθμοι που βρίσκουν τέτοιες δομές, τα αποτελέσματα από κάποια από τα πιο αντιπροσωπευτικά και αξιόπιστα προγράμματα φαίνονται παρακάτω. Αναλυτικά χρησιμοποιήσαμε τα προγράμματα PairCoil και COILS από το Expasy για εύρεση μιας δομής σπειροειδούς σπειράματος, αφού και η Geminin παρουσιάει μια τέτοια δομή, και τα προγράμματα ELM και Motif Scan επίσης από το Expassy, που ψάχνουν σε βάσεις δεδομένων με προϊόντα αλληλούχισης (patterns) διαφόρων πρωτεϊνών, για εύρεση λειτουργικών τμημάτων όπως θέσεις φωσφοριλίωσης, μυριστιλίωσης και γλυκοζιλίωσης όπως και θέσεις πρόσδεσης γλυκόζης. Επίσης χρησιμοποιήσαμε και το πρόγραμμα InterPro Scan του Expassy που ψάχνει σε βάσεις δεδομένων με profil πρωτεϊνικών οικογενειών, για να βρούμε μια πιθανή οικογένεια που ανήκει η GemininB. Ενδεικτικά κάποια αποτελέσματα φαίνονται παρακάτω. 56

57 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.10 : Αποτελέσματα από COILS MTIDK matrix για την εναλλακτική μορφήι (385aa) Συνολικά από τα προγράμματα COILS και Paircoil συμπεραίνουμε πως υπάρχει δομή σπειροειδούς σπειράματος και μάλιστα μεταξύ των 192 και 226 αμινοξέων στην alternative formi (385aa) και στην alternative μορφήιii (264aa) βρίσκεται μεταξύ των 71 και 105 αμινοξέων. Στην εναλλακτική μορφήii (179aa) δεν υπάρχει δομή σπειροειδούς σπειράματος. 57

58 ΑΠΟΤΕΛΕΣΜΑΤΑ Αποτελέσματα από MotifScan ASN- CK2_Phosphosite Myristyl PKC_Phosphosite Glycosylation Εναλλακτική μορφήι (385aa) , 75-78, , , , , , , , , , , Εναλλακτική μορφήιι , , , , , (179aa) Εναλλακτική μορφήιιι (264aa) 7-10, , , , , , 87-89, 95-97, , , Πίνακας 4.3: Αποτελέσματα από Motif Scan για τις τρεις εναλλακτικές μορφές Παρατηρούμε πως τα τελευταία 51 αμινοξέα της εναλλακτικής μορφήςιι (179αα) που είναι διαφορετικά από την εναλλακτική μορφήι (385aa) παρουσιάζουν θέσεις φοσφωριλίωσης. Τα αποτελέσματα από το πρόγραμμα ELM φαίνονται παρακάτω σε σύγκριση με τη Geminin. Τα αποτελέσματα αναφέρονται στην εναλλακτική μορφήι (385aa) 58

59 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.11: Σύγκριση αποτελεσμάτων του ELM για τη Geminin και την ομόλογή της GemininB Οι θέσεις που είναι σημειωμένες δίνονται από το πρόγραμμα και για τις δύο πρωτεΐνες και αντιστοιχούν στη GemininB σε τέσσερις θέσεις πρόσδεσης κυκλίνης(lig_cyclin_1), έξι θέσεις φωσφοριλίωσης CK1(Casein kinase I)(MOD_CK1_1) και πέντε CK2 (Casein kinase II)(MOD_CK2_1) και έξι θέσεις φωσφοριλίωσης κινάσης (MOD_ProDKIN_1) Για τις δύο άλλες εναλλακτικές μορφές ματίσματος της GemininB τα αποτελέσματα από το πρόγραμμα ELM για εύρεση λειτουργικών περιοχών φαίνονται στην παρακάτω εικόνα. 59

60 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.12: Σύκριση αποτελεσμάτων από ELM για τις άλλες δύο εναλλακτικές μορφές τις GemininB Οι θέσεις που είναι σημειωμένες με μαύρο εμφανίζονται τόσο στη Geminin όσο και στη GeminnB μορφήi(385aa) Αναλύοντας τα αποτελέσματα του προγράμματος ELM σημαντική θεωρείται η περιοχή μεταξύ αα και 28-31αα που αναφέρεται από το πρόγραμμα ως θέση πρόσδεσης κυκλίνης για τη GemininB(385aa). Παρατηρούμε πως και οι δύο άλλες μορφές παρουσιάζουν θέσεις πρόσδεσεις κυκλίνης. Και η Geminin διαθέτει θέση πρόσδεσης κυκλίνης στην αμινοτελική περιοχή της η οποία αποτελεί destruction box. Το γεγονός αυτό μας προϊδεάζει για τη λειτουργία της και στη GemininB. Επίσης η μορφήii(179aa) παρουσιάζει μεταξύ των 60-63αα τη περιοχή Src-family Src Homology 2 (SH2) domains binding motif που αναγνωρίζει μικρά μοτίβα που περιέχουν φωσφοριλιωμένες τυροσίνες. Η περιοχή αυτή παρουσιάζεται πολλές φορές σε πρωτεΐνες που εμπλέκονται σε μονοπάτια μεταγωγής σήματος. Η περιοχή σημειώνεται με κόκκινο χρώμα στη παραπάνω εικόνα

61 ΑΠΟΤΕΛΕΣΜΑΤΑ Οι πολλές θέσεις πρόσδεσης κινάσης που παρουσιάζουν και οι τρεις εναλλακτικές μορφές οφείλονται σε μοτίβα με μικρή ειδικότητα και πιθανόν δεν παρουσιάζουν ιδιαίτερο ενδιαφέρον Όσον αφορά την οικογένεια στην οποία πιθανόν ανήκει η GemininB τόσο το πρόγραμμα Motif Scan όσο και το πρόγραμμα InterPro Scan του Expassy μας δείχνουν ότι η Geminin και η GemininB βρίσκονται στην ίδια οικογένεια χωρίς να αναφέρουν άλλα μέλη στην οικογένεια αυτή. Άρα συνολικά από τα προγράμματα συμπεραίνουμε πως οι μορφήi (385aa) και μορφήiii (264aa) παρουσιάζουν μια δομή σπειροειδούς σπειράματος μεταξύ των 192 και 226 αμινοξέων και 71 και 105 αμινοξέων αντίστοιχα. Επίσης και οι τρεις μορφές παρουσιάζουν θέσεις πρόσδεσης κυκλίνης που μπορεί να αποτελούν πιθανά destruction box Εύρεση της ομοιότητας των εναλλακτικών μορφών με τη Geminin Αφού βρήκαμε την νουκλεοτιδική και αμινοξική ακολουθία των τριών εναλλακτικών μορφών θελήσαμε να τις συγκρίνουμε με την ανθρώπινη Geminin και να βρούμε τα ποσοστά ομοιότητας καθώς και τις περιοχές που παρουσιάζουν τη μεγαλύτερη ομοιότητα. Για το σκοπό αυτό χρησιμοποιήσαμε τον αλγόριθμο Needle ( του EMBOSS για ολική στοίχιση (global alignment) με ποινή για κενό (Gap_penalty): 10.0 και ποινή για επέκταση του κενού (Extend_penalty): 0.5. Τα αποτελέσματα της σύγκρισης των τριών εναλλακτικών μορφών της GemininB με τη Geminin φαίνονται στο παρακάτω πίνακα 61

62 ΑΠΟΤΕΛΕΣΜΑΤΑ Ταυτοσημία (Identity) Ομοιότητα (Similarity) Εναλλακτική μορφήι(385aa) 14,6% 22,5% Εναλλακτική μορφήιι(179aa) 16.6% 26.2% Εναλλακτική μορφήιιι(264aa) 0.8% 1.1% Πίνακας 4. 4: Εύρεση ομοιότητας και ταυτοσημίας των τριών εναλλακτικών μορφών της GemininB με τη Geminin Αν και με τις τρεις εναλλακτικές μορφές της GemininB η Geminin παρουσιάζει μικρή ομοιότητα παρατηρήσαμε πως για το coiled coil παρουσιάζει μεγάλη ομοιότητα και αποτελεί τη πιο συντηρημένη περιοχή. Η ομοιότητα και η ταυτοσημία για το coiled coil της Geminin με τις δύο εναλλακτικές μορφές της GemininB που παρουσιάζουν coiled coil βρίσκεται με τον αλγόριθμο Smith-Waterman για τοπική στοίχιση (local alignment) του EMBOSS. Για το αμινοτελικό και καρβοξυτελικό τμήμα η σύγκριση γίνεται με τον αλγόριθμο Needle. Συνοπτικά τα αποτελέσματα φαίνονται στο παρακάτω σχήμα Εικόνα 4.13: Συγκριτική απεικόνιση του αμινοτελικού και καρβοξιτελικού τμήματος και του σπειροειδούς σπειράματος των μορφήi(385αα) και μορφήiiι(264αα) της GemininB με τη Geminin 62

63 ΑΠΟΤΕΛΕΣΜΑΤΑ Η μορφήιι(179αα) που προκύπτει από το εναλλακτικό μάτισμα και αποτελεί ουσιαστικά το αμινοτελικό τμήμα της πρώτης εναλλακτικής μορφής μήκους 385 αμινοξέων δεν περιέχει σπειροειδές σπείραμα στη δομή της και δεν εμφανίζει σημαντική ομοιότητα με τη Geminin. 4.3 Προσδιορισμός με διαδικτυακά εργαλεία της δευτεροταγούς και τριτοταγούς δομής Εύρεση πιθανής δευτεροταγούς δομής με τα προγράμματα PHD και PROF Έχοντας ως στόχο να βρούμε τη δευτεροταγή δομή της πρωτεΐνης χρησιμοποιήσαμε προγράμματα που δείχνουν τη πιθανή θέση α-ελίκων και β-πτυχωτών επιφανειών σε δοσμένενες αμινοξικές ακολουθίες. Η μελέτη για τη δευτεροταγή και τη τριτοταγή δομή πραγματοποιήθηκε για τη μεγαλύτερη από τις τρεις εναλλακτικές μορφές μήκους 385 αμινοξέων (μορφήi). Τα προγράμματα που χρησιμοποιήσαμε ήταν τα PHD( predicting 1D protein structure byprofil based neural networks Rost, Burkhard Meth. in Enzym. 1996, 266, (ed.: Russ Doolittle), PROF(Profile network prediction, δημιουργήθηκε από τους M Ouali και RD King από το University of Wales) και το SAM_T02 το οποίο επιστρέφει τρία διαφορετικά αποτελέσματα ανάλογα με το αλφάβητο που χρησιμοποιείται κάθε φορά. Τα αλφάβητα που χρησιμοποιούνται από το πρόγραμμα SAM_T02 είναι τα : DSSP, STR, STRIDE. Συνολικά και από τις τρεις μεθόδους πρόβλεψης δευτεροταγούς δομής πρωτεϊνών παρατηρούμε πως και οι τρεις προβλέπουν τη δομή της άλφα έλικας για τα αμινοξέα , για τα αμινοξέα (στα οποία περιέχεται και το coiled coil της πρωτεΐνης), για τα αμινοξέα και για τα αμινοξέα τα οποία βρίσκονται στο καρβοξιτελικό άκρο της πρωτεΐνης. Επίσης προβλέπουν τη δομή της πτυχωτής επιφάνειας για τα αμινοξέα και για τα αμινοξέα τα οποία επίσης βρίσκονται στο καρβοξιτελικό άκρο της πρωτεΐνης. Το πρόγραμμα SAM_T02 χρησιμοποιώντας το αλφάβητο STRIDE προβλέπει τη δομή της πτυχωτής έλικας για τα αμινοξέα Η ίδια δομή στο ίδιο σημείο προβλέπεται και από τα προγράμματα PHD και PROF. Επίσης το πρόγραμμα SAM_T02 με το αλφάβητο STRIDE προβλέπει τη δομή της πτυχωτής επιφάνειας και για τα αμινοξέα

64 ΑΠΟΤΕΛΕΣΜΑΤΑ Για τα αμινοξέα αυτά προβλέπεται η δομή της πτυχωτής επιφάνειας και από τα προγράμματα PHD και PROF. Τα αποτελέσματα και από τα τρία προγράμματα φαίνονται στο παρακάτω σχήμα. Επίσης στο σχήμα φαίνεται και η δευτεροταγής δομή που προτείνουμε με βάση το συνδυασμό των παραπάνω προγραμμάτων...., , , , , ,...6 AA MQACGGGAAGRRAFDSICPNRMLALPGRALLCKPGKPERKFAPPRKFFPGCTGGSPVSVY PHD HHHH EEEE PROF HHHH EEE DSSP HH HH EE EE EE STR STRIDE HHHHHHHHHH EE EEE Προτεινόμενο..., , , , , , AA EDPPDAEPTALPALTTIDLQDLADCSSLLGSDAPPGGDLAASQNHSHQTEADFNLQDFRD PHD EE HHHHHHHH HHH HHHHHH PROF HHHHHHHH HHH HHHHHH DSSP HHHH HH HH HHHHHHH HH STR HHHHH HHH HH STRIDE HHHHH HHHHHHHHHHHHHHH Προτεινόμενο ΗΗ..., , , , , , AA TVDDLISDSSSMMSPTLASGDFPFSPCDISPFGPCLSPPLDPRALQSPPLRPPDVPPPEQ PHD HHHHHH HH PROF HHHHHH HH DSSP HHHHHH HH STR HHHHHH HH STRIDE HHH Προτεινόμενο ΗΗΗ..., , , , , , AA YWKEVADQNQRALGDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLASVLDK PHD HHHHHHHHHHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH PROF HHHHHHHHHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH DSSP HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH STR HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH STRIDE HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH Προτεινόμενο ΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗΗ..., , , , , , AA LMITQSRDCGAAAEPFLLKAKAKRSLEELVSAAGQDCAEVDAILREISERCDEALQSRDP PHD HHHHHH HHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHH PROF HHHHHH HHHHHHHHHH HHHHHHHH HHHHHHHHHHHHHH HHH DSSP HH HHHHHHHHHHHHH HHHHHHHHHHHHHHH STR H HHHHHHHHHHHHHH HHHHHHHHHHHHHHH STRIDE HHH HHHHHHHHHH HHHHHHHHHHHHHH Προτεινόμενο ΗΗ ΗΗΗΗΗΗΗΗΗ ΗΗΗΗΗΗΗΗΗΗΗΗΗΗ..., , , , , , AA KRPRLLPEPANTDTRPGNLHGAFRGLRTDCSRSALNLSHSELEEGGSFSTRIRSHSTIRT PHD HHHH HHH EEE PROF HHH HHH HHH EEE DSSP EEEEE EEEEEE EEEE STR STRIDE EEE Προτεινόμενο 64

65 ΑΠΟΤΕΛΕΣΜΑΤΑ..., , , AA LAFPQGNAFTIRTANGGYKFRWVPS PHD EE EEEE EEEE PROF EE EEEEEE EEEEEE DSSP EE EEEEEE STR STRIDE EEEEEE EEEEEE Προτεινόμενο ΕΕΕΕ ΕΕΕΕΕ Εικόνα 4.14: Συνοπτικά αποτελέσματα των προγραμμάτων εύρεσης δευτεροταγούς δομής Εύρεση πιθανής τριτοταγούς δομής Βασιζόμενοι στη πιθανή δευτεροταγή δομή που πήραμε από τα προγράμματα στο διαδίκτυο και σε αλγορίθμους εύρεσης τριτοταγούς δομής μπορούμε να πραγματοποιήσουμε μια πρόβλεψη για τη διάταξη της GemininB στο χώρο ή τουλάχιστον για τη πιθανή διάταξη κάποιων τμημάτων της πρωτεΐνης. Στο διαδίκτυο υπάρχουν διάφοροι αλγόριθμοι εύρεσης τριτοταγούς δομής οι οποίοι μπορούν να χωριστούν σε δύο μεγάλες κατηγορίες ανάλογα με το που βασίζονται για να προβλέψουν τη στερεοδιάταξη της πρωτεΐνης. Σε αυτούς που πραγματοποιούν σύγκριση της αμινοξικής ακολουθίας με γνωστές δομές που υπάρχουν σε βάσεις δεδομένων και σε αυτούς που δε χρησιμοποιούν βάσεις δεδομένων και βασίζονται στις φυσικές ιδιότητες των πρωτεϊνών (Μέθοδοι αb initiο). Οι αλγόριθμοι που υπάγονται στη πρώτη κατηγορία είναι οι: SWISS MODEL ( 3D-JIGSAW( LOOPP ( Phyre( Όλα τα προγράμματα είναι προσβάσιμα από το σερβερ EXPASY εκτός από το Phyre Το πρόγραμμα SWISS MODEL χρησιμοποιεί αλγόριθμο εύρεσης ομοιότητας και έδωσε ως αποτέλεσμα με Blast score 1e-10 το σύμπλοκο της Geminin με το παράγοντα CDT1 και με Blast score 5e-09 το σπειροειδές σπείραμα της Geminin. Τα αποτελέσματα αυτά ήταν αναμενόμενα λόγω του ότι οι μέθοδοι που χρησιμοποιούν τεχνικές εύρεσης ομοιότητας βρίσκουν ομολογία για την αμινοξική ακολουθία των 65

66 ΑΠΟΤΕΛΕΣΜΑΤΑ πρωτεϊνών και στη συγκεκριμένη περίπτωση μας είναι γνωστή η ομολογία των δύο πρωτεϊνών και ειδικά στη περιοχή του σπειροειδούς σπειράματος. Ο αλγόριθμος 3D-JIGSAW επίσης χρησιμοποιεί τη τεχνική εύρεσης ομοιότητας. Και αυτός επίσης μας έδωσε αποτέλεσμα για την περιοχή 162aa-220aa που είναι η ευρύτερη περιοχή του σπειροειδούς σπειράματος της GemininB,με e-value 9e-28, το σπειροειδές σπείραμα της Geminin Ο αλγόριθμος LOOPP μας δίνει με μεγάλη πιθανότητα (score 3.206) για τη περιοχή από 177αα μέχρι το 229αα, που αποτελεί το σπειροειδές σπείραμα της GemininB, το σπειροειδές σπείραμα της Geminin. Επίσης μας δίνει με μέτρια πιθανότητα (score 1.639) για ολόκληρη την ακολουθία της GemininB το Cloacin translocation domain. Τέλος με πολύ μικρότερα score έρχονται κάποιες πρωτεΐνες με παράλληλα σπειροειδή σπειράματα. Ο συγκεκριμένος αλγόριθμος μας δίνει ένα σκορ βασιζόμενος κυρίως στη δευτεροταγή δομή της πρωτεΐνης αλλά και στο threading. Οι αλγόριθμοι που χρησιμοποιούν τη συγκεκριμένη τεχνική δε βασίζονται τόσο στην ομοιότητα της αμινοξικής ακολουθίας αλλά στο γεγονός ότι πολλές φορές όμοιες δομές δε παρουσιάζουν ομολογία στην αμινοξική ακολουθία τους. Συνυπολογίζει όμως και την ομολογία που μπορεί να παρουσιάζει η αμινοξική ακολουθία. Οι αλγόριθμοι που χρησιμοποιούν τη τεχνική του threading δίνουν αποτελέσματα για τμήμα της δοσμένης αμινοξικής ακολουθίας αφού συγκρίνουν κομμάτια της ακολουθίας με τρισδιάστατες δομές πρωτεϊνών που βρίσκονται σε βάσεις δεδομένων. Ο αλγόριθμος Phyre (Protein Homology/analogY Recognition Engine) που χρησιμοποιεί την ίδια τεχνική με το πρόγραμμα LOOPP εκτός από πρόβλεψη της τριτοταγούς δομής δίνει και τη δευτεροταγή δομή της πρωτεΐνης όπως προβλέπεται από διάφορα προγράμματα(psipred, Consencus, sspro, jnet). Τα αποτελέσματα που μας έδωσε ο συγκεκριμένος αλγόριθμος φαίνονται παρακάτω: Με E-value 0,15 και estimated precision 90% αναφέρει τη Geminin και συγκεκεριμένα την ευρύτερη περιοχή του σπειροειδούς σπειράματος μήκους 80 αμινοξέων. Στη παρακάτω εικόνα φαίνεται η δομή στο χώρο της περιοχής που εμφανίζει στοίχιση με τη GemininB. 66

67 ΑΠΟΤΕΛΕΣΜΑΤΑ Εικόνα 4.15: Αποτέλεσμα PHYRE Με E-value 3 και εκτιμούμενη ακρίβεια (estimated precision) 50% αναφέρει την ccaat/enhancer binding protein beta και συγκεκριμένα την ευρύτερη περιοχή του σπειροειδούς σπειράματος της πρωτεΐνης. Η πρωτεΐνη αυτή παίρνει μέρος στη μεταγραφή του DNA. Στη παρακάτω εικόνα φαίνεται η τρισδιάστατη μορφή της περιοχής που παρουσιάζει στοίχιση με τη GemininB. Εικόνα 4.16: Αποτέλεσμα από PHYRE Με μικρότερα E-values εμφανίζονται πρωτεΐνες που εμφανίζουν τη μορφή έλικα θηλιά έλικα (helix-loop-helix) και συνδέονται με το DNA (DNAbinding domain) Αρα συνολικά από όλα τα προγράμματα το τμήμα για το οποίο μας δίνουν μια τρισδιάστατη εικόνα είναι η ευρύτερη περιοχή του σπειροειδούς σπειράματος της πρωτεΐνης. 67

68 ΑΠΟΤΕΛΕΣΜΑΤΑ 4.4 Εύρεση ομολόγων σε άλλους οργανισμούς και κατασκευή φυλογενετικού δένδρου με το πρόγραμμα ClustalW Με σκοπό να ανακαλύψουμε πότε περίπου οι δύο ομόλογες πρωτεΐνες Geminin και GemininB διαχωρίστηκαν χρειάζεται να δημιουργήσουμε το φυλογενετικό δένδρο που να περιέχει ορθόλογες πρωτεΐνες και των δύο ομολόγων. Για την ανθρώπινη Geminin έχουν ήδη βρεθεί ορθόλογα στους οργανισμούς: Θηλαστικά: o Mus musculus Πτηνά o Galus galus Αμφίβια o Xenopus laevis Ψάρια o Danio rerio o Oryzias Έντομα o Drosophila o Anopheles Nematoda (σκουλίκια) o C. Elegans Με σκοπό να βρούμε κάποιες ορθόλογες πρωτεΐνες και για τη GemininB formi(385aa), που αποτελεί και τη μεγαλύτερη σε μήκος μορφή, πραγματοποιήσαμε ένα Blast και συγκεκριμένα ένα TBlastN με query τη GemininB(μορφήI) μήκους 385αα από το οποίο πήραμε το Mus musculus similar to geminin (LOC622408), mrna το οποίο βρίσκεται στο χρωμόσωμα 13 με e-value 2e-148 και πιθανώς αποτελεί ορθόλογα της GemininB του ανθρώπου. Η στοίχιση (alignment) φαίνεται παρακάτω: Query 14 FDSICPNRMLALPGRALLCKPGKPERKFAPPRKFFPGCTGGSPVSVYEDPPDAEPTALPA 73 FDSICPNRML L R L KPGKPERKF P K F GC GGSPV+VYEDPPDAEP LPA Sbjct 45 FDSICPNRMLDL-SRRTLGKPGKPERKFVPSWKSFSGCGGGSPVAVYEDPPDAEPAPLPA

69 ΑΠΟΤΕΛΕΣΜΑΤΑ Query 74 LTTIDLQDLADCSSLLGSDAPPGGDLAASQNHSHQTEADFNLQDFRDTVDDLIsdsssmm 133 LTTIDLQDLADC+SLLG++A P GD +ASQN S QTE DFNLQ+FRD +DDLI+DSSS+M Sbjct 222 LTTIDLQDLADCTSLLGTEASPSGDSSASQNPSLQTEEDFNLQNFRDAMDDLIADSSSLM 401 Query 134 sptlasgdfpfspcdispfgpclsppldpralqspplrppdvpppeqywkevadqnqral 193 SP L + DFPFSPCD+S FG CLSP LDP AL S PP EQYWKEVADQNQRAL Sbjct 402 SPPLTNSDFPFSPCDVSSFGSCLSPSLDPPALGS---PDLPPPPTEQYWKEVADQNQRAL 572 Query 194 GDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLASVLDKLMITQSRDCGAAA 253 G AL+ENNQLHVTLTQKQEEIASL+ERNVQLKELASRTRHLASVLDKLMITQS A Sbjct 573 GTALIENNQLHVTLTQKQEEIASLRERNVQLKELASRTRHLASVLDKLMITQS-----PA 737 Query 254 EPFLLKAKAKRSLEELVSA---AGQDCAEVDAILREISERCDEALQSRDPKRPRLLPEPA 310 EPF +KA KRSLEEL A AGQ CAEVDAILR+IS+RC+EAL +RDPKRPRL PEP Sbjct 738 EPFQIKATTKRSLEELFCAAGQAGQGCAEVDAILRDISQRCEEALHNRDPKRPRLQPEPD 917 Query 311 NTDTRPGNLHGAFRGLRTDCSRSALNLSHSELEEGGSFSTRIRSHSTIRTLAFPQGNAFT D NLHGAFRGLRTDCS S++NLSHSELEEGGSFST IRSHSTIRTLAFPQG AFT Sbjct 918 SKDCSSRNLHGAFRGLRTDCSASSVNLSHSELEEGGSFSTPIRSHSTIRTLAFPQGKAFT 1097 Query 371 IRTANGGYKFRWVPS 385 IRT GGYKFRWVPS Sbjct 1098 IRTVTGGYKFRWVPS 1142 Επίσης παρατηρήσαμε και το Xenopus laevis cdna clone MGC: IMAGE: , complete cds με e-value 9e-76 το οποίο αποτελεί πιθανό ορθόλογο της ανθρώπινης GemininB. Και για αυτό φαίνεται παρακάτω η στοίχιση (alignment): Query 14 FDSICPNRMLALPGRALLCKPGKPERKFAPPRKFFPGCTGGSPVSVYEDPPDAEPTALPA 73 F +CPN M L R L K K E+K K TG PV++Y DPP + + A Sbjct 125 FYKLCPNAMPDLSNR-LSKKQSKTEKKL---HKNIFAHTG--PVTIYVDPPSSAVDS--A 280 Query 74 LTTIDLQDLADCSSLLGSDAPPGGDLAASQNHSHQTEADFNLQDFRDTVDDLIsdsssmm 133 L TID QDL DC+S++ DA GG + Q+H E DF+LQ+FRD VD I+D S+M Sbjct 281 LATIDWQDLVDCNSVIQQDAA-GGAITQQQDHCLSGEPDFDLQEFRDAVDQFIADQPSLM 457 Query 134 sptlasgdfpfspcdispfgpclsppldpralqspplrppdvpppeqywkevadqnqral 193 P+L +F C++ F PC++ PL + P+ +P EQYW++VAD NQ+AL Sbjct 458 QPSLGPPEFQLPACNVPVFEPCMTNPLQAQPEHLLPINVQTIPSTEQYWRDVADHNQKAL 637 Query 194 GDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLASVLDKLMITQSRDCGAAA 253 GDALVENNQL V+LT+KQEEI SLKE+N+QL ELA++ +HL+SVLDKLM +++ A Sbjct 638 GDALVENNQLQVSLTEKQEEIVSLKEKNIQLNELANQAKHLSSVLDKLMKERTKQNSGAT 817 Query 254 EPFLLKAKAKRSLEELVSAAGQ-DCAEVDAILREISERCDEALQSRD---PKRPRLLPEP KRSLE+ + + D +VD ILREIS++C+ AL D KRPRL P Sbjct 818 QG---RLPVKRSLEDFYPQSNEPDSTQVDEILREISKKCNIALMGSDLSERKRPRLEPMD 988 Query 310 ANTDTRPG----NLHGAFRGLRTDCSRSALNLSHSELEEGGSFSTRIRSHSTIRTLAFPQ G + GAF GL+T +++NL ++LE+ SF T I+ HSTIRTLAFPQ Sbjct 989 SMDWQEEGVTEIKMCGAFHGLKTSTGLNSVNLGDTDLED-VSFRTSIKEHSTIRTLAFPQ 1165 Query 366 GNAFTIRTANGGYKFRWVPS 385 GNAFTIRT+ GGYKFRWVP+ Sbjct 1166 GNAFTIRTSGGGYKFRWVPN 1225 Τα υπόλοιπα αποτελέσματα με μικρότερα σκορ ανήκουν στην Geminin. Επίσης με ένα psiblast το οποίο είναι πιο κατάλληλο, για να βρίσκουμε ορθόλογα σε είδη με μεγάλη εξελικτική διαφορά παρατηρήσαμε την ομοιότητα που παρουσιάζει η πρωτεΐνη μας με τη πρωτεΐνη CAG08607 του Tetraodon nigroviridis μήκους 613αα το γονίδιο της οποίας εδράζεται στο χρωμόσωμα 1. Το alignment φαίνεται στο παρακάτω σχήμα 69

70 ΑΠΟΤΕΛΕΣΜΑΤΑ Query 116 QDFRDTVDDLISDSSSMMSPTLASGDFPFSPCDISPFGPCLSPPLDPRALQSPPLRPPDV 175 F D D I+DS S + +L SP ++ PF C+ PPL P+ Sbjct 306 HHFGDYALDFIADSPSTLESSL SPAELVPFHGCIIPPLTPQWDTPAEDAGLSC 358 Query 176 PPPEQYWKEVADQNQRALGDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLA 235 P +Q E Q RAL + Q+ E L+ERNV L++LA R +HLA Sbjct 359 PSTDQ---EKGGQPSRALAPEAPRVHFAPGDTGQRHPEGTDLQERNVHLRQLAKRAKHLA 415 Query 236 SVLD 239 SVL+ Sbjct 416 SVLE 419 Για τον οργανισμό Tetraodon nigroviridis επειδή παρατηρήσαμε πως η αμινοξικη ακολουθία που της πρωτεΐνης είναι ιδιαίτερα μεγάλη (613 αμινοξέα) πραγματοποιήσαμε ένα BlastP(protein protein Blast). Από τα αποτελέσματα βρήκαμε πως το πρώτο τμήμα της πρωτεϊνικής ακολουθίας της CAG08607 του Tetraodon nigroviridis μήκους περίπου 285 αμινοξέων ουσιαστικά αποτελεί τμήμα μιας άλλης πρωτεΐνης, της uracil-dna glycosylase 2 isoform a, το γονίδιο της οποίας βρίσκεται ανοδικά του γονιδίου της GemininB στο Tetraodon nigroviridis. Οπότε λανθασμένα έχει δοθεί το τμήμα αυτό στη GemininB του Tetraodon. Άρα οι οργανισμοί που μέχρι σήμερα έχουν βρεθεί πιθανά ορθόλογα της GemininB είναι οι εξής: Θηλαστικά o Mus musculus o Homo sapiens Αμφίβια o Xenopus laevis Ψάρια o Tetraodon nigroviridis Με σκοπό να δημιουργήσουμε ένα φυλογενετικό δένδρο όσο το δυνατόν πληρέστερο, για να μπορέσουμε να βρούμε πότε οι δύο ομόλογες πρωτεΐνες αποχωρίστηκαν από την πρωτεΐνη πρόγονο χρησιμοποιήσαμε πρωτεΐνες από διαφορετικές κατηγορίες οργανισμών. Για τη δημιουργία της πολλαπλής στοίχισης των ακολουθιών χρησιμοποιήσαμε το πρόγραμμα ClustalW ( από τα σελίδα του EBI. Και για τη δημιουργία του πιθανού φυλογενετικού δένδρου χρησιμοποιήσαμε το πρόγραμμα 70

71 ΑΠΟΤΕΛΕΣΜΑΤΑ Οι οργανισμοί με βάση τους οποίους δημιουργήθηκε το φυλογενετικό δένδρο ήταν: Για τη πρωτεΐνη Geminin o Θηλαστικά Human Mus musculus o Πτηνά Gallus gallus o Αμφίβια Xenopous o Ψάρια Danio rerio o Έντομα Drosophila o Σκουλίκια o C.elegans Για τη πρωτεΐνη GemininB o Θηλαστικά Human Mus musculus o Αμφίβια Xenopu laevis Οι οργανισμοί αυτοί επιλέχθηκαν ώστε να υπάρχουν αντιπρόσωποι τόσο από τα θηλαστικά, τα πτηνά, τα ψάρια, τα έντομα και για τις δύο πρωτεΐνες, όπου αυτό ήταν δυνατόν με βάση τις πληροφορίες που υπάρχουν σε βάσεις δεδομένων. Το πρόγραμμα μας έδωσε αρχικά μια πολλαπλή στοίχιση των ακολουθιών των οργανισμών αυτών το οποίο είναι: human MKQKQ- 5 Mus MNLSMKQKQ- 9 Gallus MNSKMKQSLN 10 Xenopus MNTNKKQRLD 10 Danio MSS-IRRPKN 9 MusB MQACEGSAAGRRAFDSICPNRMLDLS-RRTLGKPGKPERKFVPSWKSFSGCGGGSPVAVY 59 HumanB MQACGGGAAG-RAFDSICPNRMLALPGRALLCKPGKPERKFAPPRKFFPGCTGGSPVSVY 59 XenopusB MPDLS-NRLSKKQSKTEKKLH---KNIFAHTG--PVTIY 33 Drosophila MSSSAARVYIQVE 13 C.elegans MSRIGLQQLNNSA 13 71

72 ΑΠΟΤΕΛΕΣΜΑΤΑ human -EEIKE-NIKN SSVPRRTLKMIQPSASGSLVGRENELSAGLSKRKHRN-- 51 Mus -EGAQE-NVKN SPVPRRTLKMIQPSADGSLVGRENELPKGLFKRKLWD-- 55 Gallus VENPSG-SLQKY--LTD-TACSAAPRRTLKMIQPSAKGFLVGRCNE-KKSSVKRKLWN-- 63 Xenopus MEKPTM-SIKNY--FVDKTNESLAPRRTLKVIQPSASGCLVGRTKEPVKNSTKRKLWN-- 65 Danio AENPSE-NIKKF--LVAPTSGAGMGRRTLQVLQPSAVNKNLGRIIENGKAMPKRKMWSA- 65 MusB EDPPDA-EPAPLPALTTIDLQDLADCTSLLGTEASPSGDSSASQNPSLQTEEDFNLQNFR 118 HumanB EDPPDA-EPTALPALTTIDLQDLADCSSLLGSDAPPGGDLAASQNHSHQTEADFNLQDFR 118 XenopusB VDPPSS-AVDS--ALATIDWQDLVDCNSVIQQDAA-GGAITQQQDHCLSGEPDFDLQEFR 89 Drosophila TEAEQKEHLKQQRQTLKPLQGNVNDKENLTGSGRASIVDQLSRLKAGVQVAPKYGKRK-- 71 C.elegans RNSPFG-SEKATG--TKQIPEPLKLTAQLKKYQPITPSPLASATTITPVLSPFDVFCDDD 70 : :. human ---DHLT-STTSSPGVIV-PESSENKNLG-GVTQESFDLMIKENPS S 92 Mus ---DQLA-SQTSSCG----PEANENKDVG-DLTQEAFDLISKENPS S 93 Gallus ---NRLT-SSACKAEASV-DKEQENENT--DDVIQAIDL-IKKSPS S 102 Xenopus ---DQLT-SKKAKVEVAV-DPEHR-ENK--DCSSEAYDLMVKETPT C 104 Danio ---EQVKGSKRVKAEVAVKSTNAENENQPEGVTQEAYELMIKETPG S 109 MusB DAMDDLIADSSSLMSPPLTNSDFPFSPCDVSSFGSCLSPSLDPPALGSPDL-PP--PPTE 175 HumanB DTVDDLISDSSSMMSPTLASGDFPFSPCDISPFGPCLSPPLDPRALQAPPLRPPDVPPPE 178 XenopusB DAVDQFIADQPSLMQPSLGPPEFQLPACNVPVFEPCMTNPLQAQPEHLLPINVQTIPSTE 149 Drosophila -CVDTAPAISTKDADTQTDAEAVPLGNADKPITAEDLTSTAEPG E 115 C.elegans ---QEAKNVETQMFEYGTVSTQTIINVPHVQPKITEADLTSEKPTV :. human QYWKEVAEKRRKALYEALKENEKLHKEIEQKDNEIARLKKENKELAEVAEHVQYMAELIE 152 Mus QYWKEVAEQRRKALYEALKENEKLHKEIEQKDSEIARLRKENKDLAEVAEHVQYMAEVIE 153 Gallus QYWKEVAEERRKALYEVLQENEKLHKEIEQKDGEIARLKEENEELMSLAEHVHYLTSMIE 162 Xenopus LYWKEVAEERRKALYEALQENEKLHKEIELKDEEIARLKQENDELMELAGHVQYMANMIE 164 Danio SYWKEVAEERGKALFSVLQENEKLHKDIEAKDEQIAQLKTENEELQELAQHVQHMADMIE 169 MusB QYWKEVADQNQRALGTALIENNQLHVTLTQKQEEIASLRERNVQLKELASRTRHLASVLD 235 HumanB QYWKEVADQNQRALGDALVENNQLHVTLTQKQEEIASLKERNVQLKELASRTRHLASVLD 238 XenopusB QYWRDVADHNQKALGDALVENNQLQVSLTEKQEEIVSLKEKNIQLNELANQAKHLSSVLD 209 Drosophila NYYKLLAEQRRLALEDSLTENRHLHERIEGLEEEMDTMR---QELDEAKNLVEVLKEICE 172 C.elegans NYLRVMADRLQMDLDDEMDRNQRLVAELGDLDEKMRKIDDDTEILLEVLADIDEEQQTDE 173 * : :*:. * :.*.:* : : :: : *.. : human RLNGEPL DNFESLDNQ EFDSE------EETVEDS 180 Mus RLSNEPL DNFESPDSQ EFDSE------EEAVEYS 181 Gallus RLTGQES DNLEALESL ALDES Xenopus RLTGNAP RSLEDLKDL DLEEAR----FEDEADMA 194 Danio RLTGKSP DNLEELREI AFDAEDEELENENEDEEE 203 MusB KLMITQS-----PAEPFQIKATTKRSLEELFCAAGQAGQGCAEVDAILRDISQRCEEALH 290 HumanB KLMITQSRDCGAAAEPFLLKAKAKRSLEELVSAAGQD---CAEVDAILREISERCDEALQ 295 XenopusB KLMKERTKQ---NSGATQGRLPVKRSLEDFYPQSNEP--DSTQVDEILREISKKCNIALM 264 Drosophila EDNSEVE EDDTTGDED KVNA C.elegans EIGTAQL human LVE DSEIGTCAEGTVSSSTDAKPCI 205 Mus ELE DSGAGTCAEETVSSSTDARPCT 206 Gallus NQET Xenopus EARI EDETDMARPSNSDQNMDAHTV- 219 Danio HEDE DQEHDCEGEADESQDTEENPER 229 MusB NRDP---KRPRLQPEPDSKDCSSR-----NLHGAFRGLRTDCSASSVNLSHSELEEGGSF 342 HumanB SRDP---KRPRLLPEPANTDTRPG-----NLHGAFRGLRTDCSRSALNLSHSELEEGGSF 347 XenopusB GSDLSERKRPRLEP-MDSMDWQEEGVTEIKMCGAFHGLKTSTGLNSVNLGDTDLED-VSF 322 Drosophila C.elegans human Mus Gallus Xenopus Danio SIKHNDSATEES MusB STPIRSHSTIRTLAFPQGKAFTIRTVTGGYKFRWVPS 379 HumanB STRIRSHSTIRTLAFPQGNAFTIRTANGGYKFRWVPS 384 XenopusB RTSIKEHSTIRTLAFPQGNAFTIRTSGGGYKFRWVPN 359 Drosophila C.elegans Εικόνα 4.17 Πολλαπλή στοίχιση των πρωτεϊνών Geminin και GemininB 72

73 ΑΠΟΤΕΛΕΣΜΑΤΑ Οι οργανισμοί οι οποίοι αντιπροσωπεύουν τη GemininB είναι οι : MusB, HumanB, XenopusB. Οι παράμετροι οι οποίοι χρησιμοποιήθηκαν στη συγκεκριμένη πολλαπλή στοίχιση των ακολουθιών είναι οι εξίς: ποινή κενού (gap open) 5(default:10), ποινή προέκτασης κενού (GapExtension) 0.5(default:0.2), ώστε το πρόγραμμα να δημιουργεί πιο εύκολα μικρά κενά και παράλληλα να μην απομακρύνεται πολύ από τις αρχικές τιμές. Παρατηρούμε πως το σπειροειδές σπείραμα είναι η πιο συντηρημένη περιοχή για όλους τους αντιπροσώπους τόσο της Geminin όσο και της GemininB. Επίσης παρατηρούμε πόσο πολύ συντηρημένη είναι η καρβοξιτελική περιοχή των οργανισμών Mus, Human, Xenopus στη GemininB, αν και οι οργανισμοί αυτοί απέχουν εξελικτικά. Το φυλογενετικό δένδρο που προκύπτει από τη παραπάνω πολλαπλή στοίχιση φαίνεται παρακάτω. Εικόνα 4.18: Φυλλογενετικό δένδρο GemininB και Geminin Παρατηρούμε από το φυλογενετικό δένδρο πως οι δύο πρωτεΐνες πιθανώς να αποχωρίστηκαν μετά τα σκουλίκια (nematode) και ίσως και μετά τα έντομα (drosophila), αφού και η Geminin των εντόμων φαίνεται να διαχωρίζεται νωρίς στο παραπάνω φυλλογενετικό δένδρο και δεν έχουν βρεθεί μέχρη στιγμής ορθόλογα της GemininB στα έντομα. 73

74 ΣΥΖΗΤΗΣΗ ΣΥΖΗΤΗΣΗ 74

75 ΣΥΖΗΤΗΣΗ Οι ευκαρυωτικοί οργανισμοί έχουν αναπτύξει πολλαπλούς μηχανισμούς, ώστε να περιορίσουν η αντιγραφή του DNA να συμβαίνει μία φορά σε κάθε κυτταρικό κύκλο. Οι μηχανισμοί αυτοί εμποδίζουν τις θέσεις έναρξης της αντιγραφής να ενεργοποιηθούν για δεύτερη φορά μετά την έναρξη της αντιγραφής στην S φάση και μέχρι το τέλος της μίτωσης (Melixetian and Helin 2004). Στα μετάζωα οι μηχανισμοί αυτοί ελέγχονται και από τη δράση της πρωτεΐνης Geminin η οποία συνεργάζεται με τη CDT1 κατά την S, G2 και M φάση ώστε να εμποδιστεί η επανενεργοποίηση της αντιγραφής του DNA (Seo and Kroll 2006). Εκτός από τη ρύθμιση του κυτταρικού κύκλου η ανθρώπινη Geminin φαίνεται να ελέγχει και τη μοίρα των νευρικών κυττάρων κατά την ανάπτυξη του εμβρύου. Πρόσφατα βρέθηκαν ενδείξεις ότι η Geminin αλληλεπιδρά με τους Hox και Six3 μεταγραφικούς παράγοντες καθώς και το σύμπλεγμα polycomb και το σύμπλεγμα SWI/SNF και πιθανώς να έχει κάποιο ρόλο στη ρύθμιση της μεταγραφής. Αποτελεί έκπληξη πως ένα τόσο μικρό μόριο παίρνει μέρος στη ρύθμιση τόσων διαφορετικών διαδικασιών και αλληλεπιδρά με τόσες διαφορετικές πρωτεΐνες. Τέλος υπάρχουν πρόσφατες εργασίες που θεωρούν ότι η Geminin θα μπορούσε να υπάρξει στόχος για κάποια νέα αντικαρκινικά φάρμακα (Yoshida 2006) 5.1 Μια νέα πρωτεΐνη ομόλογη προς την Geminin εκφράζεται από το ανθρώπινο γονιδίωμα. Μετά από σύγκριση της ανθρώπινης πρωτεΐνης Geminin με το ανθρώπινο γονιδίωμα διαπιστώθηκε η ύπαρξη ενός πιθανού ομολόγου της στη πέμπτο χρωμόσωμα, το οποίο στην παρούσα εργασία αναφέρουμε ως GemininB. Διαπιστώσαμε πως η GemininB αποτελεί μία εκφραζόμενη πρωτεΐνη του κυττάρου διότι: Υπάρχουν 11 ESTs από καρκινικές σειρές κυττάρων για τη συγκεκριμένη γονιδιακή περιοχή, που αποτελεί το γονίδιο της GemininB Υπάρχει ένα cdna από HeLa κύτταρα για τη συγκεκριμένη γονιδιακή περιοχή Άρα το γονίδιο της GemininB το οποίο εδράζεται στο πέμπτο χρωμόσωμα και συγκεκριμένα στη περιοχή 5q11.2 μεταξύ των βάσεων εκφράζει τη πρωτεΐνη GemininB μήκους 385αα. Μετά από μελέτη της συγκεκριμένης πρωτεΐνης με υπολογιστικά εργαλεία εύρεσης ομολογίας καταλήξαμε ότι η GemininB αποτελεί ομόλογη πρωτεΐνη της Geminin διότι: 75

76 ΣΥΖΗΤΗΣΗ Παρουσιάζει ομοιότητα 22,5% με τη Geminin.(Η ομοιότητα αναφέρεται σε όλο το μήκος και των δύο πρωτεϊνών). Ομοιότητα πάνω από 20% μπορεί, αν και σπάνια, να αποτελέσει ένδειξη ομολογίας όπως αναφέραμε και στην εισαγωγή. Αν και η ολική ομοιότητα είναι σχετικά μικρή,για να διαπιστωθεί ομολογία, για την ευρύτερη περιοχή των coiled coil και των δύο πρωτεϊνών η ομοιότητα φθάνει το 62,5%. Επειδή η περιοχή του coiled coil της Geminin αποτελεί λειτουργική περιοχή για τη πρωτεΐνη, όπως αναφέραμε στην εισαγωγή, η μεγάλη ομοιότητα για τη περιοχή αυτή μπορεί να αποτελέσει ένδειξη ομολογίας. Τέλος κατά την πρόβλεψη της τρισδιάστατης δομής της GemininB με υπολογιστικά εργαλεία που βασίζονται στη μέθοδο Threading, βρέθηκε μεγάλη ομολογία για την ευρύτερη περιοχή του σπειροειδούς σπειράματος με την ανθρώπινη Geminin. Η μέθοδος του Threading, όπως προαναφέραμε, δε βασίζεται στην ομοιότητα που παρουσιάζει η αμινοξική ακολουθία των πρωτεϊνών αλλά προσπαθεί να προσεγγίσει την ομοιότητα των τριτοταγών δομών των πρωτεϊνών, που είναι και πιο συντηρημένες. Για το λόγο αυτό αποτελεί ένδειξη για την ομολογία των πρωτεϊνών. Κατά την πρόβλεψη του προτεινόμενου mrna της GemininB υποψιαστήκαμε την ύπαρξη εναλλακτικών μορφών ματίσματος λόγω της ύπαρξης τεσσάρων νουκλεοτιδίων στο cdna(cs0dk002yl21) από Hela κύτταρα που αναφέρεται στη GemininB τα οποία όμως δεν περιέχονται σε κανένα από τα τέσσερα ESTs που αναφέρονται στην συγκεκριμένη περιοχή. Επίσης τα τέσσερα αυτά νουκλεοτίδια βρίσκονται στη περιοχή μεταξύ εσωνίου και εξωνίου και συγκεκριμένα στο τέλος του τέταρτου εσωνίου. Η υπόθεσή αυτή μπορεί να βοηθήσει σημαντικά στη πειραματική προσέγγιση της GemininB. 5.2 Η GemininB είναι συντηρημένη κατά την πορεία της εξέλιξης. Από το προτεινόμενο mrna καταλήξαμε λόγω της πιθανής ύπαρξης εναλλακτικών μορφών ματίσματος σε τρεις πρωτεϊνικές ακολουθίες μήκους 385aa(μορφήI), 179aa (μορφήii) και 264aa(μορφήIII), αφού πρώτα πραγματοποιήθηκε πρόβλεψη της πιθανής δομής του γονιδίου(ύπαρξη εσωνίωνεξωνίων) και καταλήξαμε στην ύπαρξη εφτά εξωνίων για τη μορφήi, τεσσάρων εξωνίων για τη μορφήii και πέντε εξωνίων για τη μορφήiii. 76

77 ΣΥΖΗΤΗΣΗ Γνωρίζουμε ήδη από βιβλιογραφικές και πειραματικές προσεγγίσεις πως υπάρχουν ορθόλογα της Geminin στα μετάζωα (έχουν ανιχνευθεί ορθόλογα από τον C.elegans ως τον άνθρωπο). Δεν έχουν βρεθεί μέχρι στιγμής ορθόλογα της Geminin σε φυτά, σε μονοκύτταρους ευκαρυωτικούς οργανισμούς και σε προκαρυωτικούς οργανισμούς. Κατά τη φυλογενετική ανάλυση της GemininB εντοπίσαμε ορθόλογα της πρωτεΐνης στους οργανισμούς Mus Musculus (θηλαστικά) και στο Xenopus laevis. Για τους οργανισμούς αυτούς έχουν βρεθεί cdna τα οποία κωδικοποιούν ορθόλογες πρωτεΐνες. Επίσης εντοπίσαμε και κάποια πιθανά (predicted) ορθόλογα στους οργανισμούς Pan troglytes (253aa), Rattus norvegicus (440aa) και Macaca mulata (237aa) καθώς και στο ψάρι Tetraodon nigroviridis, που αποτελεί και το πιο μακρινό ορθόλογο, αν τελικά επαληθευτεί η πρόβλεψη. Από το πιθανό φυλογενετικό δένδρο της GemininB διαπιστώνουμε πως οι δύο πρωτεΐνες πιθανώς αποχωρίστηκαν μετά τα σκουλήκια (Nematoda) και πιθανώς και μετά τα έντομα, αφού δεν ανιχνεύεται υπολογιστικά πιθανό ορθόλογο της GemininB στους οργανισμούς αυτούς. Δεν αποκλείεται να υπάρχει στους οργανισμούς αυτούς ορθόλογο της GemininB, που λόγω της εξελικτικής απόστασης δεν έχει ανιχνευθεί ακόμα. Τα πιθανά ορθόλογα της πρωτεΐνης χρειάζεται να διερευνηθούν και πειραματικά. Όσον αφορά συντηρημένα στοιχεία και δομικές περιοχές της πρωτεΐνης, που θα μπορούσαν να αποτελέσουν ένδειξη για την ύπαρξη μακρινών ορθολόγων και σε άλλους οργανισμούς, κατά τη φυλογενετική ανάλυση της GemininB παρατηρήσαμε πώς: Στα ορθόλογα της GemininB στους οργανισμούς Mus musculus και Xenopus laevis, αλλά και στο πιθανό μακρινό ορθόλογο στο Tetraodon nigroviridis, το γονίδιο της GemininB εδράζεται πάντα σε κοντινή απόσταση με το γονίδιο της urasil- DNA glycosilase2, όπως συμβαίνει και με το γονίδια της ανθρώπινης GemininB. Άρα το γονίδιο για την urasil- DNA glycosilase2 θα μπορούσε να διευκολύνει την εντόπιση ορθολόγων και σε άλλους οργανισμούς. Η ευρύτερη περιοχή του σπειράματος της πρωτεΐνης είναι και η πιο συντηρημένη περιοχή της, αφού εκτός από τη μεγάλη ομοιότητα μεταξύ των ορθόλογων πρωτεϊνών παρουσιάζει και ομοιότητα με τη ευρύτερη περιοχή του σπειροειδούς σπειράματος της Geminin.Η λειτουργική σημασία της περιοχής αναφέρεται παρακάτω. 77

78 ΣΥΖΗΤΗΣΗ Η καρβοξιτελική περιοχή της GemininB, όπως παρατηρήσαμε στη πολλαπλή στοίχιση των ακολουθιών, παρουσιάζει μεγάλο βαθμό συντήρησης μεταξύ των ορθολόγων της πρωτεΐνης. Η περιοχή αυτή δε παρουσιάζει ομοιότητα με το καρβοξυτελικό άκρο της Geminin. Και αυτό το στοιχείο θα μπορούσε να αποτελέσει ένδειξη για την ύπαρξη ορθόλογου σε άλλους οργανισμούς. 5.3 Ανάλυση των λειτουργικών περιοχών της GemininB Με υπολογιστικά εργαλεία πραγματοποιήθηκε πρόβλεψη των λειτουργικών περιοχών της GemininB. Από τα αποτελέσματα που λάβαμε συμπεράναμε πως : Παρατηρείται μια δομή σπειροειδούς σπειράματος στις δύο εναλλακτικές μορφές ματίσματος(μορφήi 385aa, μορφήiιi 264aa). Η δομή παρουσιάζει ομοιότητα με το σπειροειδές σπείραμα της Geminin, όπως προαναφέραμε, στο οποίο συνδέεται η CDT1 πρωτεΐνη κατά τη διάρκεια του κυτταρικού κύκλου, για τη ρύθμιση της αντιγραφής. Πιθανώς στη GemininB η δομή αυτή να έχει επίσης μια παρόμοια λειτουργία κατά τη διάρκεια του κυτταρικού κύκλου., που θα μπορούσε να διερευνηθεί και πειραματικά. Η συντηρημένη, όπως προαναφέραμε, καρβοξυτελική περιοχή της πρωτεΐνης, πιθανώς αποτελεί μια σημαντική λειτουργικής σημασίας δομή. Αφού όπως προαναφέραμε δε σχετίζεται με τη Geminin και η λειτουργία της δε θα σχετίζεται με τις λειτουργίες της Geminin και θα εμπλέκεται μέσω αυτής της δομής σε ένα διαφορετικό μονοπάτι, που επίσης θα μπορούσε να διερευνηθεί πειραματικά. Παρατηρούνται σε όλες τις μορφές ματίσματος θέσεις πρόσδεσης κυκλίνης στο αμινοτελικό και καρβοξυτελικό άκρο. Η δομή των θέσεων πρόσδεσης κυκλίνης χρειάζεται να μελετηθεί πειραματικά για να διαλευκανθεί η τυχόν λειτουργία τους. Παρατηρούνται πολλές θέσεις φοσφοριλίωσης, μυριστιλίωσης και γλυκοζιλίωσης, η λειτουργία των οποίων απαιτεί πειραματική ανάλυση. Τέλος κατά της πρόβλεψη των λειτουργικών περιοχών όλων των εναλακτικών μορφών ματίσματος εντοπίσαμε στα τελευταία 51 αμινοξέα που η μορφήιι (179αα) παρουσιάζει διαφορά με τη μορφή Ι (385αα) πολλές πιθανές θέσεις φωσφοριλίωσης. Πιθανώς αυτή η περιοχή στη μορφήιι (179αα) να αποτελεί μια λειτουργική περιοχή, που θα μπορούσε να διερευνηθεί και πειραματικά 78

79 ΣΥΖΗΤΗΣΗ 5.4 Από εδώ και πέρα τι? Στην παρούσα εργασία πραγματοποιήθηκε μελέτη και ανάλυση της ανθρώπινης πρωτεΐνης GemininB. Όσον αφορά την υπολογιστική συνέχεια της εργασίας θα μπορούσε στο μέλλον να πραγματοποιηθεί περαιτέρω ανάλυση των ορθολόγων που παρουσιάστηκαν. Επίσης θα μπορούσε να πραγματοποιηθεί μια λεπτομερέστερη μελέτη της τριτοταγούς δομής της πρωτεΐνης και να υπάρξει πρόβλεψη ολόκληρης της τριτοταγούς δομής και όχι μόνο τμημάτων, όπως έγινε στην παρούσα εργασία. Όσον αφορά τη πειραματική συνέχεια της παρούσας εργασίας: Χρειάζεται οπωσδήποτε στο μέλλον να βρεθεί πειραματικά (RNAi) σε ποιους τύπους κυττάρων εκφράζεται η πρωτεΐνη (προφίλ έκφρασης). Μέχρι στιγμής η πρωτεΐνη έχει βρεθεί να εκφράζεται μόνο σε καρκινικές σειρές κυττάρων και δε γνωρίζουμε κάτι για τη φυσιολογική της έκφραση. Επίσης προσδιορισμός των επιπέδων έκφρασης σε φυσιολογικά και μη φυσιολογικά κύτταρα θα μπορούσε να μας προϊδεάσει για κάποιες λειτουργίες της πρωτεΐνης. Επίσης πειράματα με αποσιώπηση του γονιδίου θα βοηθούσαν ιδιαίτερα για την εύρεση πιθανών λειτουργιών της πρωτεΐνης. Χρειάζεται οπωσδήποτε να μελετηθεί πειραματικά η δομή του σπειροειδούς σπειράματος της GemininB η οποία, όπως αναφέραμε παρουσιάζει μεγάλη ομοιότητα με την αντίστοιχη δομή της Geminin. Τα πειράματα αυτά μπορούν να μας δώσουν πολύ σημαντικά στοιχεία για τις αλληλεπιδράσεις της πρωτεΐνης μας με άλλες πρωτεΐνες του κυττάρου, ώστε να σχηματίσουμε μια πρώτη άποψη για τη λειτουργία της. Τέλος ιδιαίτερα χρήσιμη για την εύρεση των λειτουργιών και αλληλεπιδράσεων με άλλες πρωτεΐνες μπορεί να αποβεί και η υπολογιστική και πειραματική μελέτη της GemininB σε άλλους οργανισμούς μοντέλα, όπως ο Mus musculus. 79

80 ΠΕΡΙΛΗΨΗ ΠΕΡΙΛΗΨΗ 80

81 ΠΕΡΙΛΗΨΗ Στην παρούσα εργασία ανιχνεύθηκε και μελετήθηκε υπολογιστικά πρωτεΐνη ομόλογη της ανθρώπινης Geminin, που αποτελεί μία από τις πρωτεΐνες ρυθμιστές του κυτταρικού κύκλου. Η συγκεκριμένη πρωτεΐνη αναφέρεται ως GemininB. Η ανίχνευση της GemininB πραγματοποιήθηκε μέσω της ομολογίας της με την ανθρώπινη Geminin. Εδράζεται στο πέμπτο χρωμόσωμα (5q11.2) και συγκεκριμένα μεταξύ των βάσεων , ενώ η Geminin εδράζεται στο έκτο χρωμόσωμα, και έχει μήκος 8517bp. Κατά την υπολογιστική ανάλυση της πρωτεΐνης εντοπίστηκαν 11 ESTs και 1 cdna από HeLa κύτταρα, για τη γονιδιακή περιοχή της GemininB, μέσω των οποίων καταλήξαμε σε ένα προτεινόμενο mrna. Υποψιαστήκαμε την ύπαρξη εναλλακτικών μορφών ματίσματος του πρώιμου mrna, λόγω τεσσάρων νουκλεοτιδίων (GCAA), που εντοπίστηκαν στο τέλος του τέταρτου εξώνιου, τα οποία ενώ περιλαμβάνονται στην ακολουθία του cdna από HeLa κύτταρα δε βρίσκονται στην ακολουθία κανενός από τα τέσσερα ESTs που παρουσιάζουν στοίχιση στη συγκεκριμένη γονιδιακή περιοχή. Η ύπαρξη ή όχι των τεσσάρων νουκλεοτιδίων στο ώριμο mrna οδηγεί στη δημιουργία δύο εναλλακτικών mrna μήκους 2087bp και 2091bp. Από το πρώτο mrna μήκους 2087 βάσεων προκύπτουν δύο διαφορετικά πρωτεϊνικά προϊόντα ανάλογα με τη μεθειονίνη που θα χρησιμοποιήσουμε ως εναρκτήρια, μήκους 179αα (μορφήιι) και 264αα (μορφήιιι). Από το mrna μήκους 2091 βάσεων προκύπτει ένα πρωτεϊνικό προϊόν μήκους 385αα (μορφήι). Μετά από υπολογιστική μελέτη των συγκεκριμένων πρωτεϊνικών προϊόντων καταλήξαμε ότι: Η μορφή Ι και η μορφήιιι παρουσιάζουν ταυτοσημία στο καρβοξυτελικό τμήμα τους. Συγκεκριμένα η μορφήιιι, εκτός από πέντε αμινοξέα στην αρχή αποτελεί το καρβοξυτελικό άκρο της μορφήςι. Η μορφήι (385αα) και η μορφήιι (179αα) παρουσιάζουν ταυτοσημία στο αμινοτελικό τους άκρο. Συγκεκριμένα, εκτός από τα 51 τελικά αμινοξέα η μορφή ΙΙ (179αα) αποτελεί το αμινοτελικό άκρο της μορφήι (385αα). Μέσω υπολογιστικών εργαλείων πραγματοποιήθηκε πρόβλεψη των πιθανών λειτουργικών περιοχών των τριών εναλλακτικών προϊόντων και λάβαμε τα παρακάτω αποτελέσματα: 81

82 ΠΕΡΙΛΗΨΗ Και οι τρεις μορφές παρουσιάζουν πολλές πιθανές θέσεις φωσφοριλίωσης, μυριστιλίωσης και γλυκοζιλίωσης. Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι θέσεις φωσφοριλίωσης στα τελευταία 51 αμινοξέα της μορφήςιι (179αα) Η μορφήι (385αα) και η μορφήιιι (264αα) παρουσιάζουν πιθανή δομή σπειροειδούς σπειράματος, όπως παρουσιάζει και η Geminin. Επίσης όπως και η Geminin και οι τρεις μορφές παρουσιάζουν θέσεις πρόσδεσης κυκλίνης Για την πρόβλεψη της δευτεροταγούς και τριτοταγούς δομής χρησιμοποιήθηκαν υπολογιστικά εργαλεία, μέσω των οποίων καταλήξαμε σε μια πιθανή δευτεροταγή δομή και πιθανές τριτοταγές δομές τμημάτων της GemininB. Δυστυχώς δε μπορέσαμε να δημιουργήσουμε μια τριτοταγή δομή για ολόκληρη τη πρωτεΐνη. Τέλος εντοπίστηκαν πιθανά ορθόλογα της πρωτεΐνης στους οργανισμούς Mus musculus και Xenopus, όπου με τη βοήθεια του προγράμματος ClustalW πραγματοποιήθηκε πολλαπλή στοίχιση των ορθολόγων και των ομολόγων ακολουθιών. Κατά τη πολλαπλή στοίχιση έγινε φανερό ότι μεταξύ των ορθολόγων της GemininB το καρβοξυτελικό τμήμα εμφανίζεται συντηρημένο. Η συντήρηση πιθανώς να οφείλεται σε μια σημαντική λειτουργία που η περιοχή αυτή επιτελεί και δεν είναι ακόμα σε εμάς γνωστή. Με τη πολλαπλή στοίχιση και το πρόγραμμα που περιέχεται στο σέρβερ του clustalw δημιουργήθηκε το πιθανό φυλογενετικό δένδρο των πρωτεϊνών Geminin και GemininB, όπου καταλήγουμε στο συμπέρασμα ότι οι πρωτεΐνες πιθανώς διαχωρίστηκαν πριν τα αμφίβια και μετά τα έντομα και τα nematode, αφού δεν ανιχνεύτηκαν μέχρι στιγμής στους οργανισμούς αυτούς ορθόλογα της GemininB. Από τη παρούσα εργασία αντιλαμβανόμαστε πόσο σημαντική μπορεί να είναι μια βιοπληροφοριακή μελέτη και πόσο μπορεί να βοηθήσει και να κατευθύνει μια πειραματική δουλειά. Καθώς οι βάσεις βιολογικών δεδομένων συνεχώς αυξάνονται σε μέγεθος και τα βιοπληροφοριακά εργαλεία συνεχώς βελτιώνονται ευελπιστούμε ότι στο μέλλον η πειραματική απόδειξη των βιοπληροφοριακών αποτελεσμάτων δε θα είναι καν αναγκαία, με αποτέλεσμα να αλλάξει ριζικά ο τρόπος με τον οποίο εργάζονται οι μοριακοί βιολόγοι. 82

83 ΒΙΒΛΙΟΓΡΑΦΙΑ ΒΙΒΛΙΟΓΡΑΦΙΑ 83

84 ΒΙΒΛΙΟΓΡΑΦΙΑ Altschul, S. F., W. Gish, et al. (1990). "Basic local alignment search tool." J Mol Biol 215(3): Altschul, S. F., T. L. Madden, et al. (1997). "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res 25(17): Arentson, E., P. Faloon, et al. (2002). "Oncogenic potential of the DNA replication licensing protein CDT1." Oncogene 21(8): Baker, D. and A. Sali (2001). "Protein structure prediction and structural genomics." Science 294(5540): Baxevanis A. D., O. B. F. F. (2001). BIOINFORMATICS A Practical Guide to the Analysis of Genes and Proteins, JOHN WILEY & SONS. Bonneau, R., J. Tsai, et al. (2001). "Functional inferences from blind ab initio protein structure predictions." J Struct Biol 134(2-3): Borodovsky, M., K. E. Rudd, et al. (1994). "Intrinsic and extrinsic approaches for detecting genes in a bacterial genome." Nucleic Acids Res 22(22): Conrad, M. (1979). "Bootstrapping on the adaptive landscape." Biosystems 11(2-3): Dickerson, R. E. (1971). "The structures of cytochrome c and the rates of molecular evolution." J Mol Evol 1(1): Doolittle, R. F. and D. F. Feng (1990). "Nearest neighbor procedure for relating progressively aligned amino acid sequences." Methods Enzymol 183: Dunbrack, R. L., Jr. (2006). "Sequence comparison and protein structure prediction." Curr Opin Struct Biol 16(3): Edgar, R. C. (2004). "MUSCLE: a multiple sequence alignment method with reduced time and space complexity." BMC Bioinformatics 5: 113. Feng, D. F. and R. F. Doolittle (1987). "Progressive sequence alignment as a prerequisite to correct phylogenetic trees." J Mol Evol 25(4): Fickett, J. W. (1995). "ORFs and genes: how strong a connection?" J Comput Biol 2(1): Fickett, J. W. (1996). "The gene identification problem: an overview for developers." Comput Chem 20(1): Gaasterland, T. and C. W. Sensen (1996). "Fully automated genome analysis that reflects user needs and preferences. A detailed introduction to the MAGPIE system architecture." Biochimie 78(5):

85 ΒΙΒΛΙΟΓΡΑΦΙΑ Garnier, J., D. J. Osguthorpe, et al. (1978). "Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins." J Mol Biol 120(1): Glusman, G., S. Qin, et al. (2006). "A third approach to gene prediction suggests thousands of additional human transcribed regions." PLoS Comput Biol 2(3): e18. Hubbard, T., D. Barker, et al. (2002). "The Ensembl genome database project." Nucleic Acids Res 30(1): Kimura, M. (1968). "Evolutionary rate at the molecular level." Nature 217(5129): Kimura, M. (1983). "Diffusion model of intergroup selection, with special reference to evolution of an altruistic character." Proc Natl Acad Sci U S A 80(20): Krane D., R. M. (2002). Fundamental Concepts of Bioinformatics, Benjamin Cummings. Kroll, K. L., A. N. Salic, et al. (1998). "Geminin, a neuralizing molecule that demarcates the future neural plate at the onset of gastrulation." Development 125(16): Lee, C., B. Hong, et al. (2004). "Structural basis for inhibition of the replication licensing factor Cdt1 by geminin." Nature 430(7002): Lesk, A. M. (2002). Introduction to Bioinformatics. USA, Oxford University Press. Lipman, D. J., S. F. Altschul, et al. (1989). "A tool for multiple sequence alignment." Proc Natl Acad Sci U S A 86(12): Mathe, C., M. F. Sagot, et al. (2002). "Current methods of gene prediction, their strengths and weaknesses." Nucleic Acids Res 30(19): Melixetian, M. and K. Helin (2004). "Geminin: a major DNA replication safeguard in higher eukaryotes." Cell Cycle 3(8): Needleman, S. B. and C. D. Wunsch (1970). "A general method applicable to the search for similarities in the amino acid sequence of two proteins." J Mol Biol 48(3): Park, J., K. Karplus, et al. (1998). "Sequence comparisons using multiple sequences detect three times as many remote homologues as pairwise methods." J Mol Biol 284(4): Pauling, L., R. B. Corey, et al. (1951). "The structure of proteins; two hydrogenbonded helical configurations of the polypeptide chain." Proc Natl Acad Sci U S A 37(4):

86 ΒΙΒΛΙΟΓΡΑΦΙΑ Pearson, W. R. (2000). "Flexible sequence similarity searching with the FASTA3 program package." Methods Mol Biol 132: Pearson, W. R. and D. J. Lipman (1988). "Improved tools for biological sequence comparison." Proc Natl Acad Sci U S A 85(8): Pevsner, J. (2003). Bioinformatics and functional genomics, Wiley-Liss. Price, G. A., G. E. Crooks, et al. (2005). "Statistical evaluation of pairwise protein sequence comparison with the Bayesian bootstrap." Bioinformatics 21(20): Raghava, G. P., S. M. Searle, et al. (2003). "OXBench: a benchmark for evaluation of protein multiple sequence alignment accuracy." BMC Bioinformatics 4: 47. Rouze, P., N. Pavy, et al. (1999). "Genome annotation: which tools do we have for it?" Curr Opin Plant Biol 2(2): Seo, S. and K. L. Kroll (2006). "Geminin's double life: chromatin connections that regulate transcription at the transition from proliferation to differentiation." Cell Cycle 5(4): Smith, T. F. and M. S. Waterman (1981). "Identification of common molecular subsequences." J Mol Biol 147(1): Wang, Z., Y. Chen, et al. (2004). "A brief review of computational gene prediction methods." Genomics Proteomics Bioinformatics 2(4): Wood, T. C. and W. R. Pearson (1999). "Evolution of protein sequences and structures." J Mol Biol 291(4): Wuarin, J. and P. Nurse (1996). "Regulating S phase: CDKs, licensing and proteolysis." Cell 85(6): Yoshida, K. (2006). "Geminin as a molecular target for the development of new anticancer drugs." Mini Rev Med Chem 6(4): Zhong, W., H. Feng, et al. (2003). "CUL-4 ubiquitin ligase maintains genome stability by restraining DNA-replication licensing." Nature 423(6942): Αλαχιώτης, Σ. (1989). "Εισαγωγή στη σύγχρονη γενετική." 694. Τσακαλίδης (2005). Εισαγωγή στη βιοπληροφορική. 86

87 ΒΙΒΛΙΟΓΡΑΦΙΑ Στο μέλλον θα μπορούσε να πραγματοποιηθεί ανάλογη μελέτη με υπολογιστικά εργαλεία άλλων ορθόλογων πρωτεϊνών. Ιδιαίτερο ενδιαφέρον παρουσιάζει η ορθόλογη πρωτεΐνη στο χιμπατζή Pan troglytes(253aa), στον οποίο έχει ολοκληρωθεί η αλληλούχιση του γονιδιώματός του και η συγγένειά του με τον άνθρωπο θα βοηθούσε στην πρόβλεψη της ορθόλογης πρωτεΐνης. Για τον Pan troglytes(253aa) αναφέρεται σε βάσεις δεδομένων του NCBI ένα πιθανό (predicted) mrna (XM_ CR626610), που προέρχεται από γονιδιακή περιοχή του πέμπτου χρωμοσώματος, όπως και η GemininB. Η πιθανή πρωτεΐνη παρουσιάζει 100% ταυτοσημία με την ανθρώπινη GemininB. Λόγω του μικρότερου μεγέθους της μπορούμε να υποθέσουμε ότι μεγάλη περιοχή του αμινοτελικού τμήματος της πρωτεΐνης έχει παραληφθεί κατά την πρόβλεψη. Το ίδια διαπιστώσαμε πως συμβαίνει και με τον οργανισμό Macaca mulata(237aa) που επίσης ανήκει στα πρωτεύοντα Το πιθανό mrna του χιμπατζή και του Macaca mulata θα μπορούσε να αποτελέσει το εναρκτήρια βήμα για μια υπολογιστική μελέτη και μια μετέπειτα πειραματική ανάλυση της ορθόλογης πρωτεΐνης. Στην παρούσα εργασία εμφανίστηκε μια ομόλογη πρωτεΐνη της ανθρώπινης Geminin η οποία εδράζεται στο πέμπτο χρωμόσωμα του ανθρώπου( η Geminin εδράζεται στο έκτο χρωμόσωμα) και συγκεκριμένα στη θέση 5 q11.2 μεταξύ των βάσεων και έχει μήκος 385 αμινοξέα και στη παρούσα εργασία αναφέρεται ως GemininB. H GemininB έχει βρεθεί από καρκινικές σειρές κυττάρων να εκφράζεται στο καρκίνο του παγκρέατος του στήθους, του δέρματος και στη λευχαιμία Από την ανάλυση με υπολογιστικά εργαλεία από το σέρβερ ExPaSy βρέθηκε πως πιθανώς και η GemininB να διαθέτει μια coiled coil περιοχή μεταξύ των αμινοξέων. Η ομόλογη πρωτεΐνη παρουσιάζει 22,5% ομοιότητα με τη Geminin ενώ για τη ευρύτερη περιοχή του coiled coil η ομοιότητα φθάνει το 62,5%(η σύγκριση έγινε με τον αλγόριθμο Smith-Waterman για τοπική στοίχιση). Το coiled coil αποτελεί τη περιοχή με την οποία η Geminin συνδέεται με τη CDT1 για τη ρύθμιση της αντιγραφής και για το λόγο αυτό κρίνεται ιδιαίτερα σημαντικό το μεγάλο ποσοστό ομοιότητας στη περιοχή αυτή. Κατά την πρόβλεψη του προτεινόμενου mrna της GemininB υποψιαστήκαμε την ύπαρξη εναλλακτικών μορφών ματίσματος λόγω της ύπαρξης τεσσάρων νουκλεοτιδίων στο cdna(cs0dk002yl21) από Hela cells που αναφέρεται στη GemininB τα οποία όμως δεν περιέχονται σε κανένα από τα τέσσερα ESTs που αναφέρονται στην συγκεκριμένη περιοχή. Επίσης τα τέσσερα αυτά νουκλεοτίδια βρίσκονται στη περιοχή μεταξύ εσωνίου και εξωνίου και συγκεκριμένα στο τέλος του τέταρτου εσωνίου. Η υπόθεσή μας αυτή μπορεί να βοηθήσει σημαντικά στη πειραματική προσέγγιση της GemininB. Όσον αφορά τη γονιδιακή ακολουθία του ομολόγου: Η γονιδιακή ακολουθία του ομολόγου της ανθρώπινης Geminin βρέθηκε με το υπολογιστικό εργαλείο TBLASTN. Το 87

88 ΒΙΒΛΙΟΓΡΑΦΙΑ εργαλείο βρίσκεται στο NCBI και προσπαθεί να στοιχίσει μια αμινοξική ακολουθία που υποβάλλεται ως ερώτημα στη βάση, με δεδομένα από νουκλεοτιδικές βάσεις δεδομένων τις οποίες πρώτα μεταφράζει. Επειδή η αμινοξική ακολουθία παρουσιάζει μεγαλύτερο βαθμό συντήρησης από ότι η νουκλεοτιδική ακολουθία αντιλαμβανόμαστε πως το εργαλείο αυτό είναι ιδιαίτερα χρήσιμο στην περίπτωση που αναζητούμε την ύπαρξη κάποιου ομολόγου, όπως στη προκειμένη περίπτωση. Χρησιμοποιήσαμε τη βάση δεδομένων refseq η οποία δεν παρουσιάζει επαναλήψεις. Για τη δημιουργία του προφίλ έκφρασης το πρόγραμμα Unigene βασίζεται στα ESTs που υπάρχουν σε βάσεις δεδομένων. Τα ESTs που επιβεβαιώνουν την ύπαρξη της GemininB βρίσκονται όλα σε καρκινικούς ιστούς, όπως φαίνεται στο σχήμα. Έκφραση της GemininB(όπως φαίνεται στο Expression Profile του Unigene) 88

89 ΒΙΒΛΙΟΓΡΑΦΙΑ Αντιθέτως για τη Geminin έχουν βρεθεί ESTs σε καρκινικούς και σε υγιείς ιστού, όπως φαίνεται και στο παρακάτω σχήμα. Έκφραση της Geminin(όπως φαίνεται στο expression profile του UniGene) Παρατηρώντας τη γονιδιακή περιοχή της GemininB βρίσκουμε δεξιά της σε απόσταση μόλις 13275bp το γονίδιο UNG2 το οποίο κωδικοποιεί μία uracil-dna glycosilase2 και παρουσιάζει την ίδια φορά μεταγραφής με τη GemininB Επίσης παρατηρήσαμε πως στον οργανισμό Mus musculus το ορθόλογο της ανθρώπινης GemininB επίσης εδράζεται γειτονικά με το γονίδιο UNG2 στο χρωμόσωμα 13 και παρουσιάζουν την ίδια φορά μεταγραφής, όπως φαίνεται και στην εικόνα από το πρόραμμα UniGene. Άρα μπορούμε να υποθέσουμε πως τα γονίδια αυτά πιθανώς βρίσκονται γειτονικά και σε άλλους οργανισμούς. Η παρατήρηση αυτή μπορεί να μας βοηθήσει στην εύρεση κάποιων μακρινών ορθολόγων της GemininB. Φυσικά η παρατήρηση από μόνη της δεν μπορεί για κανένα λόγο να αποτελεί απόδειξη για την ύπαρξη ενός 89

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων ΕΙΣΑΓΩΓΗ Ένας από τους πρωταρχικούς στόχους της σύγκρισης των ακολουθιών δύο µακροµορίων είναι η εκτίµηση της οµοιότητάς τους και η εξαγωγή συµπερασµάτων

Διαβάστε περισσότερα

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων Σε αυτό το κεφάλαιο παρουσιάζουµε 2 βασικούς αλγορίθµους σύγκρισης ακολουθιών Βιολογικών εδοµένων τους BLAST & FASTA. Οι δυο αλγόριθµοι

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading Άσκηση 7 Προσομοίωση 3D Δομών Βιομορίων μέσω Ομολογίας & Threading Προσομοίωση 2ταγούς δομής πρωτεϊνών Δευτεροταγής Δομή: Η 2ταγής δομή των πρωτεϊνών είναι σταθερή τοπική διαμόρφωση της πολυπεπτιδικής

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της συσχέτισης ομολογίας ομοιότητας. Παρουσίαση των πληροφοριών

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της σημασίας του συστήματος βαθμολόγησης

Διαβάστε περισσότερα

LALING/PLALING :

LALING/PLALING : 1. Άρθρα- δημοσιεύσεις Scopus DBLP Pubmed Google Scholar 2. Αναζήτηση νουκλεοτιδίου- πρωτεΐνης Entrez : http://www.ncbi.nlm.nih.gov/nuccore/ Uniprot (πρωτεΐνης): http://www.uniprot.org/ Blast : http://blast.ncbi.nlm.nih.gov/blast.cgi

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων Φυλογένεση Η φυλογένεσης αφορά την ανεύρεση των συνδετικών εκείνων κρίκων που συνδέουν τα διάφορα είδη µεταξύ τους εξελικτικά, σε µονοφυλετικές

Διαβάστε περισσότερα

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας Βιοπληροφορική Ι Παντελής Μπάγκος Παν/µιο Στερεάς Ελλάδας Λαµία 2006 1 Βιοπληροφορική Ι Εισαγωγή: Ορισµός της Βιοπληροφορικής, Υποδιαιρέσεις της Βιοπληροφορικής, Τα είδη των δεδοµένων στη Βιοπληροφορική.

Διαβάστε περισσότερα

Μέθοδοι μελέτης εξέλιξης

Μέθοδοι μελέτης εξέλιξης H διερεύνηση της μοριακής βάσης της εξέλιξης βασίζεται σε μεγάλο βαθμό στη διευκρίνιση της διαδικασίας με την οποία μετασχηματίσθηκαν στη διάρκεια της εξέλιξης πρωτεϊνες, άλλα μόρια και βιοχημικές πορείες

Διαβάστε περισσότερα

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση Ασκήσεις 3& 4 Πρωτεϊνική Αρχιτεκτονική Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής Μοριακή Απεικόνιση Πρωτεϊνική Αρχιτεκτονική Πρωτεϊνική Αρχιτεκτονική: Η τρισδιάστατη δομή μιας πρωτεΐνης και πως

Διαβάστε περισσότερα

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Στοίχιση κατά ζεύγη: Τι είναι Αντιστοίχιση των νουκλεοτιδίων/αµινοξέων δυο ακολουθιών, ώστε να εντοπιστούν οι οµοιότητες και οι διαφορές τους. Χρησιµοποιείται

Διαβάστε περισσότερα

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής.  Στοίχιση αλληλουχιών Στοίχιση αλληλουχιών Σύνοψη Καθολική στοίχιση Μήτρες βαθμολόγησης Τοπική στοίχιση Στοίχιση με ποινές εισαγωγής κενών Από την LCS στη στοίχιση: αλλαγές στη βαθμολόγηση Το πρόβλημα της Μεγαλύτερης Κοινής

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 16: Μεθοδολογίες (Ανα-) Κατασκευής, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Επεξήγηση των μεθόδων (ανα-)κατασκευής φυλογενετικών δέντρων. Παρουσίαση

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ

ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ ΚΕΦΑΛΑΙΟ 2 ο 1. Με ποιο μηχανισμό αντιγράφεται το DNA σύμφωνα με τους Watson και Crick; 2. Ένα κύτταρο που περιέχει ένα μόνο χρωμόσωμα τοποθετείται σε θρεπτικό υλικό που περιέχει ραδιενεργό

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι κατανόηση της μεθόδου προτυποποίησης πρωτεϊνών με ομολογία. παρουσίαση

Διαβάστε περισσότερα

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης

Μέθοδοι Φυλογένεσης. Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι Φυλογένεσης Μέθοδοι που βασίζονται σε αποστάσεις UPGMA Κοντινότερης γειτονίας (Neighbor joining) Fitch-Margoliash Ελάχιστης εξέλιξης Μέθοδοι που βασίζονται σε χαρακτήρες Μέγιστη φειδωλότητα (Maximum

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της αναγκαιότητας των ευριστικών αλγορίθμων

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΕΙΚΟΝΑ 2.4 ΣΤΑΔΙΑ ΜΕΤΑΦΡΑΣΗΣ σ ε λ ί δ α 1 ΕΙΚΟΝΑ 4.2β ΕΡΩΤΗΣΕΙΣ 1. Να συμπληρώσετε τα κενά πλαίσια της εικόνας με την κατάλληλη λέξη ή φράση 2. Να γράψετε τον προσανατολισμό της μετακίνησης του ριβοσώματος

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών ΕΙΣΑΓΩΓΗ Η αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών (database similarity searching) αποτελεί µια από τις συχνότερα χρησιµοποιούµενες

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Αναφορά στις παραλλαγές του BLAST. Εξοικείωση με τη

Διαβάστε περισσότερα

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

Πρόβλημα. Σύνολο γνωστών αλληλουχιών BLAST Πρόβλημα Άγνωστη αλληλουχία Σύνολο γνωστών αλληλουχιών Η χρήση ενός υπολογιστή κι ενός αλγόριθμου είναι απαραίτητη για την ανακάλυψη της σχέσης μιας αλληλουχίας με τις γνωστές υπάρχουσες Τί είναι

Διαβάστε περισσότερα

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast Ασκήσεις 1 & 2 Βάσεις Δεδομένων Εργαλεία Αναζήτησης ClustalW & Blast Μοριακή Προσομοίωση Εισαγωγή: Δομική Βάση Βιολογικών Φαινομένων Η αξιοποίηση του πλήθους των δομικών στοιχείων για την εξαγωγή βιολογικά

Διαβάστε περισσότερα

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Περιεχόμενα Παρουσίασης Βιολογικό υπόβαθρο Το κεντρικό αξίωμα Σύνοψη της Βιοπληροφορικής Ερευνητικές περιοχές Πηγές πληροφοριών Τι είναι η Βιοπληροφορική Βιο Πληροφορική μοριακή

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ EIKONA 2.1 Ημισυντηρητικός μηχανισμός αντιγραφής του DNA 1. Να γράψετε τα ένζυμα που (α) προκαλούν ξετύλιγμα των αλυσίδων του αρχικού (μητρικού μορίου) DNA και (β) συνθέτουν τις νέες αλυσίδες του DNA.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 003) Εισαγωγή στη Βιοπληροφορική Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Φροντιστήριο Τρίτη και

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου

Διαβάστε περισσότερα

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Η επιστήμη της Βιολογίας έχει μετατραπεί τα τελευταία χρόνια σε μια υπερπλούσια σε πληροφορίες επιστήμη.

Διαβάστε περισσότερα

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Αναζήτηση οµοιοτήτων ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Σελίδα 1 εδοµένα Ακολουθία επερώτησης (query sequence) Ακολουθίες στη Βάση εδοµένων (subject sequences) Αναζήτηση Μέθοδοι δυναµικού

Διαβάστε περισσότερα

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι) Πρόγνωση δομής πρωτεϊνών (Μέρος Ι) Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678, Λευκωσία ΚΥΠΡΟΣ

Διαβάστε περισσότερα

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ Σελίδα 1 Ομολογία Σελίδα 2 Ομολογία Ομολογία κοινή εξελικτική καταγωγή Ορθόλογα γονίδια ειδογένεση συνήθως, ίδια βιολογική λειτουργία Παράλογα γονίδια γονιδιακός διπλασιασμός

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση των εφαρμογών της αναζήτησης

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση της αναγκαιότητας των ευριστικών αλγορίθμων

Διαβάστε περισσότερα

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης) PSI-Blast PSI-Blast PSI-Blast: τι είναι PSI-Blast: Position-specific iterated Blast Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης) Altschul et al., 1997 http://www.ncbi.nlm.nih.gov/pmc/articles/pmc146917/pdf/253389.pdf

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Παρουσίαση της μεθόδου κατασκευής και

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ Παύλος Αντωνίου Με μια ματιά: Εισαγωγή στη Βιολογία Ευθυγράμμιση Ακολουθιών Αναζήτηση ομοίων ακολουθιών από βάσεις δεδομενων Φυλογενετική πρόβλεψη Πρόβλεψη

Διαβάστε περισσότερα

Βιολογία ΘΕΜΑ Α ΘΕΜΑ B

Βιολογία ΘΕΜΑ Α ΘΕΜΑ B Βιολογία προσανατολισμού Α. 1. β 2. γ 3. δ 4. γ 5. δ ΘΕΜΑ Α B1. 4,1,2,6,8,3,5,7 ΘΕΜΑ B B2. Σχολικό βιβλίο σελ. 103 Η γενετική καθοδήγηση είναι.υγιών απογόνων. Σχολικό βιβλίο σελ. 103 Παρ ότι γενετική καθοδήγηση

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 12: Μέθοδοι Πολλαπλής Στοίχισης, 2 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Κατανόηση των μεθόδων πολλαπλής στοίχισης. Ανάδειξη των πλεονεκτημάτων και

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 15: Φυλογενετική Ανάλυση, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι παρουσίαση και ανάδειξη της σημασίας της φυλογενετικής ανάλυσης. παρουσίαση των

Διαβάστε περισσότερα

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο Βιοπληροφορική Blast/PSI-Blast 3o εργαστήριο Αναζήτηση οµόλογων ακολουθιών σε βάσεις δεδοµένων (i) Οµόλογες ακολουθίες πιθανόν να έχουν παρόµοιες λειτουργίες. Ακολουθία επερώτησης (query sequence) Υποκείµενες

Διαβάστε περισσότερα

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Εισαγωγή Βασικές αρχές δομής πρωτεϊνών και νουκλεϊκών

Διαβάστε περισσότερα

Εξερευνώντας την Εξέλιξη Κεφάλαιο 7

Εξερευνώντας την Εξέλιξη Κεφάλαιο 7 Εξερευνώντας την Εξέλιξη Κεφάλαιο 7 Εξερευνώντας την Εξέλιξη Σχέση μεταξύ αλληλουχίας αμινοξέων, δομής και λειτουργίας πρωτεϊνών Καταγωγή από έναν κοινό πρόγονο Εξελικτική Συγγένεια/Προέλευση Δύο ομάδες

Διαβάστε περισσότερα

1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; ΘΩΜΑΣ ΑΠΑΝΤΗΣΗ. 2. Ποιες είναι οι κατηγορίες γονιδίων με κριτήριο το προϊόν της μεταγραφής τους;

1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; ΘΩΜΑΣ ΑΠΑΝΤΗΣΗ. 2. Ποιες είναι οι κατηγορίες γονιδίων με κριτήριο το προϊόν της μεταγραφής τους; Βιολογία Γ Ενιαίου Λυκείου / Θετική Κατεύθυνση κεφαλαιο 2ο: αντιγραφη, εκφραση και ρυθμιση τησ ΓενετικηΣ ΠληροφοριαΣ 1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; Ευκαρυωτικά κύτταρα: στον πυρήνα,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 003) Εισαγωγή στη Βιοπληροφορική Διδάσκοντες: Χρήστος Ουζούνης, Βασίλειος Ι. Προµπονάς ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Τρίτη και Παρασκευή 10:30 12:00,

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ

ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ 1 ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ Οι δύο πολυνουκλεοτιδικές αλυσίδες του DNA αποτελούνται από νουκλεοτίδια τα οποία ενώνονται με φωσφοδιεστερικούς δεσμούς. Πιο συγκεκριμένα

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 1 Αναζήτηση πληροφορίας σε βιολογικές ΒΔ Αναζήτηση δεδομένων στην UniProt Καταγράψτε το μήκος της αμινοξικής ακολουθίας (Sequence length), τη λειτουργία (Function)

Διαβάστε περισσότερα

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ Σελίδα 1 Αναζήτηση ομοιοτήτων Δεδομένα Ακολουθία επερώτησης (query sequence) Ακολουθίες στη Βάση Δεδομένων (subject sequences) Αναζήτηση Μέθοδοι δυναμικού

Διαβάστε περισσότερα

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II Σελίδα 1 Υπολογιστικός Προσδιορισμός Δομής πειραματικός προσδιορισμός δομών κρυσταλλογραφία ακτίνων X πυρηνικός μαγνητικός συντονισμός (NMR) χρόνος / κόστος / περιορισμοί sequence - structure

Διαβάστε περισσότερα

Ειδικά Θέματα Βιοπληροφορικής

Ειδικά Θέματα Βιοπληροφορικής Ειδικά Θέματα Βιοπληροφορικής Παντελής Μπάγκος Αναπληρωτής Καθηγητής Πανεπιστήμιο Θεσσαλίας Λαμία, 2015 1 Πολλαπλή στοίχιση ακολουθιών και φυλογενετικά δέντρα 2 Πολλαπλή στοίχιση Αναφέρεται στην ταυτόχρονη

Διαβάστε περισσότερα

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of

Διαβάστε περισσότερα

Φυλογένεση. 5o εργαστήριο

Φυλογένεση. 5o εργαστήριο Φυλογένεση 5o εργαστήριο Φυλογένεση οργανισµών Δείχνει την εξελικτική πορεία µιας οµάδας οργανισµών. Οι κόµβοι (nodes) στο δένδρο απεικονίζουν γεγονότα ειδογένεσης. H φυλογένεση µπορεί να γίνει από µια

Διαβάστε περισσότερα

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΗΜΕΡΟΜΗΝΙΑ ΕΞΕΤΑΣΗΣ: ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: 16 / 06 / 2017 ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ Θέμα Α Α1: δ Α2:

Διαβάστε περισσότερα

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA ΓΥΜΝΑΣΙΟ ΚΕΡΑΤΕΑΣ ΕΡΓΑΣΙΑ ΒΙΟΛΟΓΙΑΣ Β ΤΡΙΜΗΝΟΥ Γ 4 23.1.12 ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA ΕΡΓΑΣΤΗΚΑΝ: ΑΛΕΞΑΝΔΡΟΣ ΔΕΛΗΜΙΧΑΛΗΣ ΑΡΤΕΜΗΣ ΑΝΑΣΤΑΣΙΑΔΗΣ 1 ΕΙΣΑΓΩΓΗ Το δεοξυριβονουκλεϊκό οξύ (Deoxyribonucleic acid -

Διαβάστε περισσότερα

Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία)

Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία) Βιοτεχνολογία Φυτών ΔΠΘ / Τμήμα Αγροτικής Ανάπτυξης ΠΜΣ Αειφορικά Συστήματα Παραγωγής και Περιβάλλον στη Γεωργία Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία) Αριστοτέλης Χ. Παπαγεωργίου Εργαστήριο

Διαβάστε περισσότερα

ΘΕΜΑ Α Α1. γ Α2. γ Α3. α Α4. β Α5. β ΘΕΜΑ B B1. B2.

ΘΕΜΑ Α Α1. γ Α2. γ Α3. α Α4. β Α5. β ΘΕΜΑ B B1. B2. ΘΕΜΑ Α Α1. γ (το πριμόσωμα) Α2. γ (οι υποκινητές και οι μεταγραφικοί παράγοντες κάθε γονιδίου) Α3. α (μεταφέρει ένα συγκεκριμένο αμινοξύ στο ριβόσωμα) Α4. β (αποδιάταξη των δύο συμπληρωματικών αλυσίδων)

Διαβάστε περισσότερα

ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ

ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ ΜΕΤΡΗΣΗ ΤΗΣ ΓΩΝΙΑΣ φ φ Ccarbonyl n Ccarbonyl n N Cα n Ccarbonyl n-1 Cα n N φ Ccarbonyl n-1 ΜΕΤΡΗΣΗ ΤΗΣ ΓΩΝΙΑΣ ψ φ ψ Ccarbonyl n N (Ca

Διαβάστε περισσότερα

Κεφάλαιο 2 Α Ν Τ Ι Γ Ρ Α Φ Η

Κεφάλαιο 2 Α Ν Τ Ι Γ Ρ Α Φ Η ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ Κεφάλαιο 2 Μεθοδολογία Ασκήσεων Α Ν Τ Ι Γ Ρ Α Φ Η 1 η Κατηγορία: Ασκήσεις στην Αντιγραφή (υπολογιστικές) Αφού αναφέρουμε τον ημισυντηρητικό τρόπο αντιγραφής φτιάχνουμε ένα απλό σχήμα

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε. 2004 ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε. 2004 ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε. 2004 ΘΕΜΑ 1 Ο Α. Να επιλέξετε την ορθή πρόταση: ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 1. Το κωδικόνιο του mrna που κωδικοποιεί το αµινοξύ µεθειονίνη είναι α. 5 GUA

Διαβάστε περισσότερα

ΠΑΝΕΛΛAΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ

ΠΑΝΕΛΛAΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛAΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ 16-06-2017 ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α1. δ Α2. δ Α3. β Α4. γ Α5. α ΘΕΜΑ Β Β1. Α. φωσφορική ομάδα (Ι) E. υδροξύλιο (II) Β. mrna

Διαβάστε περισσότερα

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 IOYNIOY 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 IOYNIOY 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 IOYNIOY 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α1. δ Α2. δ Α3. β Α4. γ Α5. α ΘΕΜΑ Β Β1. Α I Β IV Γ VI

Διαβάστε περισσότερα

Περιεχόμενα. 1 Η ιστορία της εξελικτικής βιολογίας: Εξέλιξη και Γενετική 2 Η Προέλευση της Μοριακής Βιολογίας 3 Αποδείξεις για την εξέλιξη 89

Περιεχόμενα. 1 Η ιστορία της εξελικτικής βιολογίας: Εξέλιξη και Γενετική 2 Η Προέλευση της Μοριακής Βιολογίας 3 Αποδείξεις για την εξέλιξη 89 Περιεχόμενα Οι Συγγραφείς Πρόλογος της Ελληνικής Έκδοσης Πρόλογος της Αμερικανικής Έκδοσης Σκοπός και Αντικείμενο του Βιβλίου ΜΕΡΟΣ Ι ΜΙΑ ΕΠΙΣΚΟΠΗΣΗ ΤΗΣ ΕΞΕΛΙΚΤΙΚΗΣ ΒΙΟΛΟΓΙΑΣ 1 Η ιστορία της εξελικτικής

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 1 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α1. β Α2. γ Α3. α Α4. γ Α5. δ ΘΕΜΑ Β Β1.

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 11 Ιουνίου 2015 ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Απαντήσεις Θεμάτων Επαναληπτικών Πανελληνίων Εξετάσεων Ημερησίων & Εσπερινών Γενικών Λυκείων ΘΕΜΑ Α Α1. β Α2. γ Α3. α Α4. γ Α5. δ ΘΕΜΑ B Β1. 1. Β 2. Γ 3. Α

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Βιοπληροφορική Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι Αναφορά στις παραλλαγές του BLAST. Εξοικείωση με τη

Διαβάστε περισσότερα

Συγκριτική Γονιδιωματική

Συγκριτική Γονιδιωματική ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Συγκριτική Γονιδιωματική Παντελής Μπάγκος 1 2 Μέθοδοι Ανάλυσης Μέθοδοι βασισμένες στην ομοιότητα ακολουθιών Τοπική ομοιότητα Ολική ομοιότητα Προγνωστικές μέθοδοι Δευτεροταγής δομή Διαμεμβρανικά

Διαβάστε περισσότερα

ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ

ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ ΠPΩTEINEΣ Οι πρωτεΐνες παίζουν σημαντικό ρόλο σε όλες σχεδόν τις βιολογικές διεργασίες. H σημασία τους φαίνεται στις παρακάτω περιπτώσεις: 1. Κατάλυση (πχ. ένζυμα) 2. Μεταφορά

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Απαντήσεις στα θέματα των Εισαγωγικών Εξετάσεων τέκνων Ελλήνων του Εξωτερικού και τέκνων Ελλήνων Υπαλλήλων στο εξωτερικό 2013 ΘΕΜΑ Α Α1. γ Α2. β Α3. δ Α4. α Α5. δ ΘΕΜΑ Β Β1.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ (ΒΙΟ 650) Ειδικά Θέματα Βιοπληροφορικής Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα και Πέμπτη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ BIO 230 Εισαγωγή στην Υπολογιστική Βιολογία Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Επίκουρος Καθηγητής Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα

Διαβάστε περισσότερα

ΕΞΕΤΑΣΤΕΑ ΥΛΗ για τη ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

ΕΞΕΤΑΣΤΕΑ ΥΛΗ για τη ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΕΞΕΤΑΣΤΕΑ ΥΛΗ για τη ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ Κεφ. 1 : σελ. 17-21 Κεφ. 2 : σελ. 31-42 Κεφ. 5: σελ. 73-85 Κεφ. 6 : σελ. 98-105 (από την ενότητα «ΧΡΩΜΟΣΩΜΙΚΕΣ ΑΝΩΜΑΛΙΕΣ )

Διαβάστε περισσότερα

ΧΡΗΣΤΟΣ ΚΑΚΑΒΑΣ 1 ΚΑΘΗΓΗΤΗΣ ΒΙΟΛΟΓΟΣ Μ.Δ.Ε

ΧΡΗΣΤΟΣ ΚΑΚΑΒΑΣ 1 ΚΑΘΗΓΗΤΗΣ ΒΙΟΛΟΓΟΣ Μ.Δ.Ε ΚΕΦΑΛΑΙΟ 2 ον. ΑΝΤΙΓΡΑΦΗ ΚΑΙ ΕΚΦΡΑΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΙ ΠΡΕΠΕΙ ΝΑ ΞΕΡΩ. 1. Τη δομή της δίκλωνης έλικας πάρα πολύ καλά. 2. Τους δεσμούς υδρογόνου μεταξύ των συμπληρωματικών βάσεων και την επίπτωσή

Διαβάστε περισσότερα

Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ

Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ ΑΝΤΙΓΡΑΦΗ ΜΕΤΑΓΡΑΦΗ Γίνεται σύνθεση DNA. Γίνεται σύνθεση RNA. Εξασφαλίζεται η διαιώνιση της γενετικής

Διαβάστε περισσότερα

Φάσμα group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι.

Φάσμα group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. σύγχρονο Φάσμα group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. µαθητικό φροντιστήριο Γραβιάς 85 ΚΗΠΟΥΠΟΛΗ 50.51.557 50.56.296 25ης Μαρτίου 74 ΠΛ.ΠΕΤΡΟΥΠΟΛΗΣ 50.50.658 50.60.845 25ης Μαρτίου 111 ΠΕΤΡΟΥΠΟΛΗ 50.27.990

Διαβάστε περισσότερα

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΙΙ Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής Παντελής Μπάγκος 1 Διάλεξη 2 Αναζήτηση ομοιότητας και κατά ζεύγη στοίχιση ακολουθιών 2 Κατά ζεύγη στοίχιση ακολουθιών Από τα πιο

Διαβάστε περισσότερα

Τρίτη, 27 Μαΐου 2008 Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΒΙΟΛΟΓΙΑ

Τρίτη, 27 Μαΐου 2008 Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΒΙΟΛΟΓΙΑ Τρίτη, 27 Μαΐου 2008 Γ ΛΥΚΕΙΟΥ ΚΑΤΕΥΘΥΝΣΗΣ ΒΙΟΛΟΓΙΑ ΘΕΜΑ 1o Να γράψετε στο τετράδιο σας τον αριθµό καθεµιάς από τις παρακάτω ηµιτελείς προτάσεις 1 έως 5 και δίπλα το γράµµα που αντιστοιχεί στη λέξη ή τη

Διαβάστε περισσότερα

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Βιοπληροφορική Ενότητα 12: Αναζήτηση ομοιοτήτων έναντι βάσεων δεδομένων με τη χρήση ευρετικών αλγορίθμων Αν. καθηγητής Αγγελίδης Παντελής e-mail: paggelidis@uowm.gr

Διαβάστε περισσότερα

Δοµή και ιδιότητες του DNA. 09/04/ Μοριακή Βιολογία Κεφ. 1 Καθηγητής Δρ. Κ. Ε. Βοργιάς

Δοµή και ιδιότητες του DNA. 09/04/ Μοριακή Βιολογία Κεφ. 1 Καθηγητής Δρ. Κ. Ε. Βοργιάς Δοµή και ιδιότητες του DNA 09/04/2014 1 09/04/2014 2 Τόσο τα νεκρά (µε θερµική επεξεργασία) βακτήρια S όσο και τα ζωντανά βακτήρια R δεν µπορούν να θανατώσουν ποντικούς. Όµως, η ταυτόχρονη µόλυνση µε αυτά

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι επισκόπηση των βασικών στοιχείων των πρωτεϊνικών δομών. συσχέτιση ακολουθίας δομής λειτουργίας.

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 10 ΣΕΠΤΕΜΒΡΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:

Διαβάστε περισσότερα

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο Δομή και λειτουργία πρωτεϊνών Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο Πρωτεΐνες Κύριο συστατικό κυττάρου Δομικοί λίθοι αλλά και επιτελεστές λειτουργίας κυττάρου ένζυμα, μεταφορά,

Διαβάστε περισσότερα

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ Επιμέλεια: Βουδούρη Καλλιρρόη Ριζηνίας 69 & Λασαίας 21 τηλ.2810313170 www.kmathisi.com ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΟΝΟΜΑ:..

Διαβάστε περισσότερα

Γονιδιωματική Συγκριτική γονιδιωματική[4] Τμήμα Γεωπονίας, Ιχθυολογίας και Υδάτινου Περιβάλλοντος. Μεζίτη Αλεξάνδρα

Γονιδιωματική Συγκριτική γονιδιωματική[4] Τμήμα Γεωπονίας, Ιχθυολογίας και Υδάτινου Περιβάλλοντος. Μεζίτη Αλεξάνδρα Γονιδιωματική Συγκριτική γονιδιωματική[4] Τμήμα Γεωπονίας, Ιχθυολογίας και Υδάτινου Περιβάλλοντος Μεζίτη Αλεξάνδρα Μέγεθος και οργάνωση γονιδιωμάτων Μελετάμε τα γονιδιώματα για να καταλάβουμε πως λειτουργεί

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι επισκόπηση των μεθόδων αναγνώρισης διπλώματος και απ αρχής πρόγνωσης

Διαβάστε περισσότερα

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας   Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ. Βιοπληροφορική Αλέξανδρος Τζάλλας e-mail: tzallas@teiep.gr ΤΕΙ Ηπείρου Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ Περιεχόμενα Διάλεξης Βιολογικό υπόβαθρο Το κεντρικό αξίωμα Σύνοψη της

Διαβάστε περισσότερα

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA Περετσή Χριστίνα Πιτσικάλη Παναγιώτα

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA Περετσή Χριστίνα Πιτσικάλη Παναγιώτα Εργασία στη Βιολογία ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA Περετσή Χριστίνα Πιτσικάλη Παναγιώτα ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA Η ροή της πληροφορίας για το σχηματισμό των πρωτεϊνών, προϋποθέτει τη μεταφορά της από το DNA στο RNA (ΜΕΤΑΓΡΑΦΗ).

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ. Β2. Η εικόνα αντιστοιχεί σε προκαρυωτικό κύτταρο. Στους προκαρυωτικούς οργανισμούς το mrna αρχίζει να μεταφράζεται σε πρωτεΐνη πριν ακόμη

ΑΠΑΝΤΗΣΕΙΣ. Β2. Η εικόνα αντιστοιχεί σε προκαρυωτικό κύτταρο. Στους προκαρυωτικούς οργανισμούς το mrna αρχίζει να μεταφράζεται σε πρωτεΐνη πριν ακόμη ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΚΑΙ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΠΑΡΑΣΚΕΥΗ 6 ΙΟΥΝΙΟΥ 207 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α. δ Α2. δ Α3. β Α4. γ Α5.

Διαβάστε περισσότερα

Εισαγωγή στη Γενετική και στη Γονιδιωματική Τι είναι η κληρονομικότητα, και πώς μεταβιβάζεται η πληροφορία από γενιά σε γενιά;

Εισαγωγή στη Γενετική και στη Γονιδιωματική Τι είναι η κληρονομικότητα, και πώς μεταβιβάζεται η πληροφορία από γενιά σε γενιά; ΒΙΟΛΟΓΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ 12 26/10/2016 Κεφάλαιο 3 Α μέρος Εισαγωγή στη Γενετική και στη Γονιδιωματική Τι είναι η κληρονομικότητα, και πώς μεταβιβάζεται η πληροφορία από γενιά σε γενιά; Ποια είναι η δομή

Διαβάστε περισσότερα

ΤΟ DNA ΚΑΙ RNA. Θανος Εξαρχου Γ1

ΤΟ DNA ΚΑΙ RNA. Θανος Εξαρχου Γ1 ΤΟ DNA ΚΑΙ RNA Θανος Εξαρχου Γ1 ΤΟ DNA Το δε(σ)οξυριβο(ζο)νουκλεϊ(νι)κό οξu είναι νουκλεϊκό οξύ που περιέχει τις γενετικές πληροφορίες που καθορίζουν τη βιολογική ανάπτυξη όλων των κυτταρικών μορφών ζωής

Διαβάστε περισσότερα

Ημερομηνία: Σάββατο 29 Δεκεμβρίου Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ

Ημερομηνία: Σάββατο 29 Δεκεμβρίου Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ ΑΠΟ ΕΩΣ - 1η ΕΞΕΤΑΣΤΙΚΗ ΠΕΡΙΟΔΟΣ ΤΑΞΗ: ΜΑΘΗΜΑ: Γ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Ημερομηνία: Σάββατο 29 Δεκεμβρίου Διάρκεια Εξέτασης: 3 ώρες ΕΚΦΩΝΗΣΕΙΣ Στις ημιτελείς προτάσεις Α1 Α4 να γράψετε

Διαβάστε περισσότερα

ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΘΕΜΑ Α Α1 δ Α2 γ Α3 β Α4 γ Α5 β ΘΕΜΑ Β Β1 Κατά σειρά τα βήματα που οδηγούν στην κατασκευή του καρυότυπου είναι τα ακόλουθα: 4 2 1 6 3 5 Β2 α DNA πολυμεράσες

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΘΕΜΑ 1 ο Α. Ερωτήσεις πολλαπλής επιλογής 1. δ 2. β 3. γ 4. γ 5. β Β. Ερωτήσεις σωστού λάθους 1. Λάθος 2. Σωστό 3. Λάθος 4. Λάθος 5. Σωστό ΘΕΜΑ

Διαβάστε περισσότερα

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus ΣΥΝΟΨΗ Εισαγωγή Πρόγνωση της δομής πρωτεϊνών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ BIO 331 - Αρχές και Μέθοδοι Βιοπληροφορικής I Διδάσκων: Βασίλειος Ι. Προμπονάς, Ph.D. Λέκτορας Βιοπληροφορικής ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Διαλέξεις Δευτέρα και Πέμπτη

Διαβάστε περισσότερα

γραπτή εξέταση στo μάθημα ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

γραπτή εξέταση στo μάθημα ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ γραπτή εξέταση στo μάθημα ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ' ΛΥΚΕΙΟΥ Τάξη: Γ Λυκείου Τμήμα: Βαθμός: Ονοματεπώνυμο: Καθηγητές: ΠΑΣΣΙΑ Α. Θ Ε Μ Α A 1. Να επιλέξετε τη σωστή απάντηση: Α1. Κάθε μεταφορικό RNA

Διαβάστε περισσότερα

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β) ΤΕΤΑΡΤΗ 4 ΙΟΥΝΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β) ΤΕΤΑΡΤΗ 4 ΙΟΥΝΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 1 ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β) ΤΕΤΑΡΤΗ 4 ΙΟΥΝΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Α1. δ Α2. γ Α3. β Α4. γ Α5. β ΘΕΜΑ

Διαβάστε περισσότερα

Λειτουργική γονιδιωµατική. 6ο εργαστήριο

Λειτουργική γονιδιωµατική. 6ο εργαστήριο Λειτουργική γονιδιωµατική 6ο εργαστήριο Λειτουργική γονιδιωµατική Προσπαθεί να κατανοήσει τις λειτουργίες των βιολογικών µορίων, σε επίπεδο ολόκληρου του γονιδιώµατος. Γίνονται µετρήσεις για το σύνολο

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ στο 2 ο κεφάλαιο

ΑΣΚΗΣΕΙΣ στο 2 ο κεφάλαιο ΑΣΚΗΣΕΙΣ στο 2 ο κεφάλαιο 1. Ένας κλώνος ενός γονιδίου προκαρυωτικού κυττάρου έχει την παρακάτω αλληλουχία βάσεων: AAAATGTATACGGGCGCTGATACGGCAAACCCACTCATGTAA Βρείτε: Α) την αλληλουχία των βάσεων του mrna

Διαβάστε περισσότερα

Πανελλήνιες Εξετάσεις Ημερήσιων Γενικών Λυκείων. Εξεταζόμενο Μάθημα: Βιολογία Θετικής Κατεύθυνσης, Ημ/νία: 04 Ιουνίου 2014. Απαντήσεις Θεμάτων

Πανελλήνιες Εξετάσεις Ημερήσιων Γενικών Λυκείων. Εξεταζόμενο Μάθημα: Βιολογία Θετικής Κατεύθυνσης, Ημ/νία: 04 Ιουνίου 2014. Απαντήσεις Θεμάτων Πανελλήνιες Εξετάσεις Ημερήσιων Γενικών Λυκείων Εξεταζόμενο Μάθημα: Βιολογία Θετικής Κατεύθυνσης, Ημ/νία: 04 Ιουνίου 2014 Απαντήσεις Θεμάτων ΘΕΜΑ Α A1. Τα πλασμίδια είναι: δ. κυκλικά δίκλωνα μόρια DNA

Διαβάστε περισσότερα