Χρήση Προηγμένων Μεθόδων Επεξεργασίας Σήματος στην Ανάλυση Βιολογικών Σημάτων και Γενετικών Ακολουθιών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Χρήση Προηγμένων Μεθόδων Επεξεργασίας Σήματος στην Ανάλυση Βιολογικών Σημάτων και Γενετικών Ακολουθιών"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ Χρήση Προηγμένων Μεθόδων Επεξεργασίας Σήματος στην Ανάλυση Βιολογικών Σημάτων και Γενετικών Ακολουθιών Ηλίας Κ. Κίτσας Διπλ. Ηλεκτρολόγος Μηχανικός & Μηχανικός Υπολογιστών Α.Π.Θ. Επιβλέπων: Καθηγητής Σταύρος Μ. Πανάς Ιούνιος 2008

2

3 Η έγκριση της διδακτορικής διατριβής από το Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών της Πολυτεχνικής Σχολής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης, δεν υποδηλώνει ότι το Τμήμα αποδέχεται τις γνώμες του συγγραφέα. (Ν.5343/1932, Άρθρο 202, Παρ. 2)

4

5 Στους γονείς μου, Κώστα και Δέσποινα και στα αδέλφια μου, Ξενοφώντα και Παύλο, για τη συμπαράσταση και υπομονή τους στις ερευνητικές μου αναζητήσεις.

6

7 Πρόλογος Η παρούσα διατριβή εκπονήθηκε στον Τομέα Τηλεπικοινωνιών του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, της Πολυτεχνικής Σχολής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης. Η ολοκλήρωση της παρούσας διατριβής είναι το αποτέλεσμα μιας πολύχρονης ερευνητικής πορείας που πλαισιώθηκε από την καθοδήγηση, την υπομονή και την αμέριστη και ουσιαστική υποστήριξη πολλών ανθρώπων. Στο σημείο αυτό θα ήθελα να εκφράσω την ευγνωμοσύνη και τις ευχαριστίες μου στα μέλη της τριμελούς συμβουλευτικής επιτροπής: τον Καθηγητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Σταύρο Πανά, ο οποίος ως επιβλέπων, μα πάνω από όλα Δάσκαλος, ακόμα και όταν δεν είχε την ευχέρεια του χρόνου, συνέβαλε ουσιαστικά με την εμπειρία, την επιμονή και την υπομονή του απέναντί μου, στην υπέρβαση των προβλημάτων που ανέκυπταν σε όλο το διάστημα εκπόνησης της διατριβής. Τον Καθηγητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Γεώργιο Σεργιάδη, ο οποίος με τη στάση και τις παρατηρήσεις του αρκετές φορές αποτέλεσε αιτία εντονότερης ερευνητικής μου ενασχόλησης με το αντικείμενο της διατριβής. Τέλος, τον Καθηγητή του Τμήματος Πυρηνικής Τεχνολογίας του Πανεπιστημίου του Purdue, Ελευθέριο Τσουκαλά, ο οποίος αφιέρωσε πολύτιμο χρόνο, ιδιαίτερα κατά τις επισκέψεις του στην Ελλάδα, ως δέκτης των προβληματισμών μου, υποδεικνύοντας νέες διαστάσεις και αναδεικνύοντας πτυχές προοπτικές τις οποίες αγνοούσα. Η προσωπική μου πορεία μέσα στη Μονάδα Επεξεργασίας Σήματος και Βιοϊατρικής Τεχνολογίας, έχει συνδεθεί άρρηκτα με τον Επικ. Καθηγητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Λεόντιο Χατζηλεοντιάδη, τον οποίο ευχαριστώ θερμά. Ιδιαίτερα σε στιγμές που με κατέβαλε απαισιοδοξία για την ερευνητική πορεία υπήρξε συμπαραστάτης, αλλά κυρίως δημιουργός διεξόδων μέσα από τη λογική της επιμονής και πίστης στο τελικώς αίσιο αποτέλεσμα της προσπάθειας. Η καθημερινή συνεργασία με τα μέλη του Τομέα Τηλεπικοινωνιών καθώς και μέλη της ευρύτερης ακαδημαϊκής κοινότητας του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης, αποτέλεσε ξεχωριστή εμπειρία, η οποία πλαισίωσε την εκπόνηση αυτής της διατριβής, συμπληρώνοντας με μικρές ή μεγαλύτερες παρεμβάσεις τη διαμόρφωση της ερευνητικής μου πορείας και οφείλω να τα ευχαριστήσω. Θα ήθελα ωστόσο, να ευχαριστήσω ιδιαιτέρως τη Δρ. Φωτεινή Παπαδοπούλου, τον Δρ. Χρήστο Σαραγιώτη, την Δρ. Ελευθερία Σιάχαλου,

8 τους υποψήφιους διδάκτορες τον Κώστα Πανούλα, τη Στέλλα Ταπλίδου, τη Βίκυ Κοσμίδου, τον Παναγιώτη Πετραντωνάκη, καθώς και τον Δρ. Αντώνη Δημητρίου και τη Δρ. Σταυρούλα Σιάχαλου, με τους οποίους η συνεργασία μέχρι την ολοκλήρωση της παρούσας διατριβής ξεπέρασε τα στενά όρια της φιλίας, μου παρείχαν διαρκή υποστήριξη και αποτελούν για μένα την πιο όμορφη ψηφίδα στο ψηφιδωτό της διδακτορικής μου διατριβής. Θεσσαλονίκη, 4 Ιουνίου 2008 ii

9 Περιεχόμενα 1 Εισαγωγή Βασικές έννοιες Πρωτεϊνικές ακολουθίες Βάσεις δεδομένων ακολουθιών αμινοξέων Διαμεμβρανικές πρωτεΐνες Αριθμητική κωδικοποίηση (αναπαράσταση) ακολουθιών αμινοξέων Υδροφοβικότητα Σχετική συχνότητα εμφάνισης Δυναμικό Αλληλεπίδρασης Ιόντων Ηλεκτρονίων Μέθοδοι εντοπισμού διαμεμβρανικών τμημάτων σε πρωτεΐνες Περιγραφή συνόλου βάσεων δεδομένων Διατύπωση αντικειμένου διατριβής Εντοπισμός διαμεμβρανικών τμημάτων Διάκριση διαμεμβρανικών πρωτεϊνών Διάγραμμα Q-Q Μορφολογική Ανάλυση Πρωτεΐνες ενός διαμεμβρανικού τμήματος Κ4ΗΤΜ CWTHTM Αποτελέσματα Συμπεράσματα - Αξιολόγηση αποτελεσμάτων Πρωτεΐνες πολλαπλών διαμεμβρανικών τμημάτων Κ4ΗΤΜ CWTHTM Αποτελέσματα Συμπεράσματα - Αξιολόγηση αποτελεσμάτων Κατηγοριοποίηση διαμεμβρανικών τμημάτων Τύποι διαμεμβρανικών τμημάτων κριτήριο ενέργειας Κατανομή διαμεμβρανικών τμημάτων ανά τύπο Φυσιολογία-λειτουργία πρωτεϊνών ενός διαμεμβρανικού τμήματος Συμπεράσματα iii

10 5 Κατηγοριοποίηση διαμεμβρανικών πρωτεϊνών Πολυπλοκότητα τύπων Φυσιολογία-λειτουργία πρωτεϊνών πολλαπλών διαμεμβρανικών τμημάτων Συμπεράσματα Συμπεράσματα Προεκτάσεις Συμπεράσματα Μελλοντικές Προεκτάσεις Α Propensities Β Στατιστική Ανώτερης Τάξης Γ Μετασχηματισμός κυματιδίων Βιβλιογραφία Δημοσιεύσεις iv

11 Κατάλογος σχημάτων 2.1 Τα επίπεδα πρωτεϊνικής δομής. (α) Η ακολουθία αμινοξέων μιας πρωτεΐνης αναφέρεται ως πρωτοταγής δομή. (β) Δεσμοί μεταξύ γειτονικών αμινοξέων σχηματίζουν φύλλα β-πτυχώσεων και α-έλικες. (γ) Οι πρωτεΐνες αναδιπλώνονται σχηματίζοντας μια τρισδιάστατη, την τριτοταγή, δομή. (δ) Η συσσωμάτωση πρωτεϊνών με άλλες πεπτιδικές αλυσίδες δημιουργεί την τεταρτοταγή δομή της πρωτεΐνης. (Πηγή: [3]-Σχήμα 3.7, Σελ. 42) Δομή φωσφολιπιδίου. Απεικονίζεται με τη μορφή μιας πολωμένης περιοχής ακολουθούμενη από δύο μη πολωμένες λιπιδικές ουρές. (Πηγή: [3]-Σχήμα 6.2, Σελ. 104) Το μοντέλο της κυτταρικής μεμβράνης. Μια πληθώρα πρωτεϊνών προεξέχουν από την κυτταρική μεμβράνη ζωικών κυττάρων και συγκρατούνται από τις μη πολωμένες περιοχές του εσωτερικού της μεμβράνης. (Πηγή: [3]-Σχήμα 6.5, Σελ. 106) Λειτουργίες των κυτταρικών πρωτεϊνών. Οι κυτταρικές πρωτεΐνες λειτουργούν ως μεταφορείς, ένζυμα, επιφανειακοί κυτταρικοί υποδοχείς και δείκτες ταυτότητας, καθώς και διευκολύνουν την προσκόλληση κυττάρων και τη συγκράτηση του κυτταρικού σκελετού. (Πηγή: [3]-Σχήμα 6.7, Σελ. 109) Πρωτεΐνες αγκύρωσης. Η σπεκτρίνη εκτείνεται με τη μορφή βρόχου συνδεδεμένη στην κυττοπλασμική πλευρά μιας μεμβράνης ερυθρού κυττάρου. Η σύνδεση επιτυγχάνεται μέσω ειδικών πρωτεϊνών όπως συνδετικά συμπλέγματα και αγκυρίνες. Το δίκτυο αυτό παρέχει ανθεκτικότητα σε ομάδες κυττάρων όπως τα ερυθροκύτταρα. (Πηγή: [3]-Σχήμα 6.9, Σελ. 111) Μια πρωτεΐνη δίαυλος. Η πρωτεΐνη μεσολαβεί στη διαδικασία φωτοσύνθεσης του βακτηρίου Halobacterium blobium. Η πρωτεΐνη διασχίζει τη μεμβράνη επτά φορές με ακολουθίες υδροφοβικών αμινοξέων που βρίσκονται στο υδροφοβικό εσωτερικό της λιπιδικής διπλοστιβάδας. Τα τμήματα της πρωτεΐνης σχηματίζουν έναν δίαυλο διαμέσου της μεμβράνης μέσω του οποίου πρωτόνια αντλούνται μέσω των χρωμοφόρων αμφιβληστροειδούς (πράσινο). (Πηγή: [3]-Σχήμα 6.10, Σελ. 111) Μια πρωτεΐνη πόρος. Η βακτηριακή διαμεμβρανική πρωτεΐνη πορίνη σχηματίζει στην εξωτερική μεμβράνη των βακτηρίων μεγάλες σήραγγες που ονομάζονται πόροι. Οι πόροι επιτρέπουν στο νερό και σε άλλες ουσίες τη διέλευση από τη μεμβράνη. (Πηγή: [3]-Σχήμα 6.11, Σελ. 111) Διασύνδεση των διαφόρων βιομοριακών βάσεων δεδομένων μέσω της Swiss-Prot Κατανομή του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Α Κατανομή του πλήθους των πρωτεϊνών ως προς τον αριθμό των διαμεμβρανικών τμημάτων ανά πρωτεΐνη για το Σύνολο-Π Κατανομή του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Π v

12 3.1 Το διάγραμμα τεταρτημορίων (Q-Q) για την πρωτεΐνη HLA class I histocompatibility antigen' [SWISS-PROT ID: 1A01_HUMAN, AC: P30443]. Τα TM και NTM αντιστοιχούν στο διαμεμβρανικό και μη διαμεμβρανικό τμήμα της πρωτεΐνης, αντίστοιχα Παράδειγμα εφαρμογής της μεθόδου K4HTM στην πρωτεΐνη Stromal interaction molecule 2 precursor [SWISS-PROT ID: STIM2_HUMAN, AC: Q9P246]. Το διαμεμβρανικό τμήμα δηλώνεται με έντονη μαύρη γραμμή στην περιοχή των αμινοξέων , διασχίζοντας τα πεντε πρώτα διαγράμματα με συνεχή γραμμή. Pi Το P i αντιστοιχεί στην έξοδο του μετασχηματισμού των propensities. Το K 4 αντιστοιχεί στην εκτίμηση της κύρτωσης κατά τη διέλευση του κυλιόμενου παραθύρου από την ακολουθία P i. Το H αντιστοιχεί στην έξοδο του μετασχηματισμού κωδικοποίησης υδροφοβικότητας, το H m αντιστοιχεί στη μέση τιμή του κυλιόμενου Pi παραθύρου για την ακολουθία H και το K 4 H αντιστοιχεί στο γινόμενο των K 4 και H m. Το K 4 H MF αντιστοιχεί στην ακολουθία K 4 H μετά από την εφαρμογή του φιλτραρίσματος μορφολογικής ανάλυσης και το K 4 H F αντιστοιχεί στην ακολουθία K 4 H MF μετά την εφαρμογή και του τελευταίου σταδίου της μεθόδου. Για τη μεθοδολογία βλ Κλίμακες (A) propensity (P i ) και (B) υδροφοβικότητας (KD) που χρησιμοποιήθηκαν κατά τους μετασχηματισμούς propensities και υδροφοβικότητας από τη μέθοδο Κ4ΗΤΜ Παράδειγμα εφαρμογής της μεθόδου K4HTM στην πρωτεΐνη Natural cytotoxicity triggering receptor 1 precursor [SWISS-PROT ID: NCTR1_HUMAN, AC: O76036]. Το διαμεμβρανικό τμήμα δηλώνεται με έντονη μαύρη γραμμή στην περιοχή των αμινοξέων , διασχίζοντας όλα τα διαγράμματα με συνεχή γραμμή. Το P αντιστοιχεί στην έξοδο του μετασχηματισμού των propensities. Pi i ΤοK 4 αντιστοιχεί στην εκτίμηση της κύρτωσης κατά τη διέλευση του κυλιόμενου παραθύρου από την ακολουθία P i. Το H O αντιστοιχεί στην έξοδο του μετασχηματισμού κωδικοποίησης υδροφοβικότητας, το H αντιστοιχεί στη μέση τιμή του κυλιόμενου παραθύρου για την ακολουθία H O και το K 4 H αντιστοιχεί στο Pi γινόμενο των K 4 και H. Το κυλιόμενο παράθυρο που χρησιμοποιήθηκε είχε μήκος 21 σημεία και η μετατόπιση πραγματοποιήθηκε σημείο-προς-σημείο Ορισμός της μέτρου της ακρίβειας εντοπισμού της έναρξης και λήξης διαμεμβρανικών τμημάτων. Το N SC δηλώνει το δείκτη άκρου Ν, ενώ το C SC τον αντίστοιχο δείκτη του άκρου C. Θετικές τιμές αντιστοιχούν σε υπερεκτίμηση. Η συνολική ακρίβεια προκύπτει από άθροισμα των απολύτων τιμών των N SC και C SC Κατανομές των δεικτών ακριβείας εντοπισμού έναρξης, N SC, (αριστερή στήλη) και λήξης, C SC, (δεξιά στήλη) για τις μεθόδους K 4 HTM, WAVETM, SPLIT4, TMHMM2 και SOSUI Σύγκριση των αποτελεσμάτων πρόβλεψης των μεθόδων K4HTM, WAVETM, SPLIT4, TMHMM2 και SOSUI, μέσω εφαρμογής τους στην πρωτεϊνη Χονδροϊτίνη βήτα-1 [SWISS-PROT ID: CGAT1_HUMAN, AC: Q8TDX6], με ένα διαμεμβρανικό τμήμα στην περιοχή καταλοίπων. Το τμήμα της ακολουθίας δίνεται στο επάνω μέρος του σχήματος με έντονους χαρακτήρες.. Η κατακόρυφες στικτές γραμμές δηλώνουν τη θέση του διαμεμβρανικού τμήματος. Για κάθε μέθοδο το τμήμα που έχει προβλεφθεί ως διαμεμβρανικό δηλώνεται με μια βηματική vi

13 Κατάλογος σχημάτων συνάρτηση. Επίσης δίνονται και οι τιμές των δεικτών Ν SC και C SC. Η υπερεκτίμηση ή υποεκτίμηση της θέσης δηλώνονται με σκιάσεις γκρι και σκούρου γκρι χρώματος, αντίστοιχα Το μητρικό κυματίδιο της οικογένειας Symlets με οκτώ σημεία μηδενισμού (sym8) Το μητρικό κυματίδιο που προέκυψε από τη μέση τιμή των διαμεμβρανικών τμημάτων με μήκος 21 υπολείμματα από το Σύνολο-Α (α) Η ακολουθία υδροφοβικότητας της πρωτεΐνης Atrial natriuretic peptide receptor A precursor (Swiss-Prot ID: ANPRA_HUMAN, AC: P16066) (β) το πλάτος των αντίστοιχων συντελεστών CWT, (γ) το απομονωμένο τμήμα του (β) στην πραγματική θέση (υπολείμματα ) του διαμεμβρανικού τμήματος, (δ) η αντίστοιχη κανονικοποιημένη ενέργεια E n (a) του (γ) Κατανομές των δεικτών ακριβείας εντοπισμού έναρξης, N SC, (αριστερή στήλη) και λήξης, C SC, (δεξιά στήλη) για τη μέθοδο CWTTM Ανάλυση ευαισθησίας των μεθόδων K 4 HTM, CWTHTM, TMHMM2, SPLIT4, WAVETM και SOSUI ως προς τον συντελεστή πρόβλεψης Q P συναρτήσει της μεταβολής της ελάχιστης επικάλυψης μεταξύ πραγματικών και προβλεφθέντων διαμεμβρανικών τμημάτων Παράδειγμα εφαρμογής της K 4 HTM για την περίπτωση μιας πρωτεϊνης με έξι διαμεμβρανικά τμήματα: Cytochrome b-561' [SWISS-PROT ID: CY561_HUMAN, AC: P49447]. Στο επάνω μέρος απεικονίζεται η αριθμητική ακολουθία K 4 H και στη μέση οι τιμές των αθροισμάτων S του K 4 H με μορφή κουκίδων, ενώ η διακεκομμένη γραμμή αντιστοιχεί στο κατώφλι επιλογής των κορυφών. Στο κάτω τμήμα παρουσιάζονται οι θέσεις έναρξης και λήξης των προβλεφθέντων διαμεμβρανικών τμημάτων με μορφή παλμοσειρών στα όρια έναρξης και λήξης, μαζί με τις αντίστοιχες πραγματικές θέσεις (κάτω) (α) Διάγραμμα κανονικότητας αθροισμάτων υδροφοβικότητας διαμεμβρανικών τμημάτων, (β) μεγέθυνση του (α) στην περιοχή του αρχικού κατωφλίου διαχωρισμού Η κανονικοποιημένη ενέργεια, E n (a), για την πρωτεΐνη Zinc finger DHHC domain-containing protein 19 [SWISS-PROT ID: ZDH19_HUMAN, AC: Q8WVZ1]. Οι δύο περιοχές βαθμίδων που προκύπτουν προς ανάλυση διακρίνονται με κόκκινες κατακόρυφες γραμμές (12-50 και ) Εφαρμογή της μεθόδου CWTHTM στην πρωτεΐνη Zinc finger DHHC domaincontaining protein 19 [SWISS-PROT ID: ZDH19_HUMAN, AC: Q8WVZ1], με τέσσερα διαμεμβρανικά τμήματα. Απεικονίζονται (α) οι συντελεστές CWT, (β) η κανονικοποιημένη αθροιστική ισχύς E, (γ) τα αθροίσματα υδροφοβικότητας S H (k ). Με πράσινο αστερίσκο σημειώνονται αθροίσματα «έγκυρων» και με μπλε σταυρό αθροίσματα «ψευδών» κορυφών. Οι συντελεστές CWT των απομονωμένων περιοχών για τα πιθανά διαμεμβρανικά τμήματα φαίνονται στο διάγραμμα (δ) Παράδειγμα σύγκρισης των μεθόδων ως προς τον εντοπισμό θέσεων έναρξης και λήξης των διαμεμβρανικών τμημάτων, με εφαρμογή στην πρωτεΐνη Calciumactivated potassium channel subunit beta-1 [SWISS-PROT ID: KCMB1_HUMAN, AC: Q16558], η οποία περιλαμβάνει δύο διαμεμβρανικά τμήματα (υπολείμματα: και ). Οι κατακόρυφες στικτές γραμμές αντιστοιχούν στις πραγματικές θέσεις. Για κάθε μέθοδο τα διαμεμβρανικά τμήματα που έχουν προβλεφθεί απεικονίζονται με τη μορφή ακολουθιών παλμών με όρια την εκάστοτε θέση έναρξης και λήξης Sn vii

14 4.1 Η μορφή και ένα παράδειγμα από κάθε κατηγορία τύπων διαμεμβρανικών τμημάτων (I-VII), (a=12,,128), με βάση την ενεργειακή τους απεικόνιση (αριστερά) και το CWT(δεξιά) Κατανομή τύπων I-VII στο Σύνολο-Α Τυπικά διαγράμματα μέσης τιμής και τυπικής απόκλισης των καμπυλών κανονικοποιημένης ενέργειας, E n (α), για τους τύπους (α) Ι, (β) ΙΙ, (γ) ΙΙΙ και (δ) VII. Η μπλε έντονη καμπύλη στο εσωτερικό της σκιασμένης επιφάνειας αντιστοιχεί στη μέση τιμή και τα όριά της στην τυπική απόκλιση για κάθε βαθμίδα ανάλυσης Κατανομή τύπων I-VII στο Σύνολο-Π Συχνότητα εμφάνισης του τύπου Ι (α), ΙΙ (β), ΙΙΙ (γ) και VII (δ) ανά περιοχή τέταρτου μήκους της πρωτεϊνικής ακολουθίας για το Σύνολο-Α Συχνότητα εμφάνισης του τύπου (α) Ι, (β) ΙΙ, (γ) ΙΙΙ, (δ) VI και (ε) VII ανά περιοχή τέταρτου μήκους της πρωτεϊνικής ακολουθίας για το Σύνολο-Π Κατανομή των τύπων για τις βιολογικές λειτουργίες: (α) πολυμορφισμός, (β) περιοχές ανοσοσφαιρίνης, (γ) εναλλακτική συναρμολόγηση, (δ) γλυκοπρωτεΐνη, (ε) φωσφορυλίωση, (στ) υποδοχέας, (ζ) επαναλήπτης, (η) σηματοδοσία Συχνότητα εμφάνισης τύπων ανά θέση (1-14) των διαμεμβρανικών περιοχών στις πρωτεΐνες για το Σύνολο-Π Σχετική συχνότητα εμφάνισης του κάθε τύπου (I-VII) στην κάθε θέση ( 1,2,... n, n 14) εντός της ακολουθίας. Κάθε διάγραμμα ((α)-(ιγ) )απεικονίζει την κατανομή σε κάθε υποσύνολο (1-14) που προκύπτει από το πλήθος των διαμεμβρανικών τμημάτων της πρωτεΐνης Κατανομή της συχνότητας εμφάνισης τύπων διαμεμβρανικών τμημάτων για πρωτεΐνες που εμπλέκονται σε βιολογικές λειτουργίες εμφανιζόμενες τουλάχιστον στο 20% του Συνόλου-Π. (α) διαμεμβρανικότητα, (β) γλυκοπρωτεΐνη, (γ) εναλλακτική συναρμολόγηση, (δ) μεταφορέας, (ε) πολυμορφισμός και (στ) υποδοχέας Γ.1 Το μητρικό κυματίδιο Morlet Γ.2 Τα μητρικά κυματίδια της οικογένειας Daubechies με δύο, τέσσερα, έξι και οκτώ σημεία μηδενισμού Γ.3 Τα μητρικά κυματίδια της οικογένειας Symlets με δύο, τέσσερα, έξι και οκτώ σημεία μηδενισμού viii

15 Κατάλογος πινάκων 2.1 Κάθε τριπλέτα νουκλεοτιδίων κωδικοποιεί ένα αμινοξύ. Η αντιστοίχιση τριπλετών με αμινοξέα προκύπτει από το συνδυασμό του πρώτου γράμματος από την πρώτη στήλη, του δεύτερου από την ενδιάμεση και του τελευταίου από την τρίτη στήλη. Η τριπλέτα ACU αντιστοιχεί στη Θρεονίνη. Στα περισσότερα αμινοξέα αντιστοιχούν περισσότερες από μία τριπλέτες νουκλεοτιδίων (Θρεονίνη: ACU, ACC, ACA και ACG) Οι αριθμητικές τιμές υδροφοβικότητας των 20 αμινοξέων για τις πιο διαδεδομένες και χρησιμοποιούμενες κλίμακες Οι αριθμητικές τιμές του Δυναμικού Αλληλεπίδρασης Ιόντων Ηλεκτρονίων για κάθε αμινοξύ Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Α. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 499 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3T M ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά Συντελεστές επιτυχούς πρόβλεψης άκρων των διαμεμβρανικών τμημάτων για το Σύνολο-Α. Όσο πιο μικρή η τιμή του δείκτη TerSc, τόσο πιο επιτυχής η μέθοδος. Επίσης δίνονται οι τιμές των δεικτών επιτυχίας ως προς την έναρξη και λήξη, όπως επίσης και ποσοστά ορθής, υπερεκτίμησης και υποεκτίμησης των δύο άκρων Συγκριτική ανάλυση των υπαρχόντων κυματιδίων με το κυματίδιο κατασκευασμένο από τα χαρακτηριστικά των διαμεμβρανικών τμημάτων με μήκος 21 καταλοίπων Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Α. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 499 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3T M ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Π. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 2717 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για ix

16 όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3T M ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά Ποσοστά επιτυχούς ανίχνευσης και ανίχνευσης ψευδών διαμεμβρανικών τμημάτων για όλα τα υποσύνολα του Συνόλου-Π. D R είναι το ποσοστό επιτυχούς ανίχνευσης και FP είναι η εκατοστιαία ανίχνευση ψευδών κορυφών κοινωνικοποιημένη ως προς τον αριθμό των συνολικά ανιχνευμένων διαμεμβρανικών τμημάτων (N P στον Πίνακα 3.5). Το ποσοστό στη δεύτερη στήλη εκφράζει την κατανομή των διαμεμβρανικών πρωτεϊνών για διαφορετικό πλήθος διαμεμβρανικών τμημάτων (από 2 έως 14), κανονικοποιημένο ως προς τον συνολικό αριθμό πρωτεϊνών του Συνόλου-Π (2717) Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Π. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 2717 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3T M ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά Ποσοστά επιτυχούς ανίχνευσης και ανίχνευσης ψευδών διαμεμβρανικών τμημάτων για όλα τα υποσύνολα του Συνόλου-Π. D R είναι το ποσοστό επιτυχούς ανίχνευσης και FP είναι η εκατοστιαία ανίχνευση ψευδών κορυφών κοινωνικοποιημένη ως προς τον αριθμό των συνολικά ανιχνευμένων διαμεμβρανικών τμημάτων (N P στον Πίνακα 3.7). Το ποσοστό στη δεύτερη στήλη εκφράζει την κατανομή των διαμεμβρανικών πρωτεϊνών για διαφορετικό πλήθος διαμεμβρανικών τμημάτων (από 2 έως 14), κανονικοποιημένο ως προς τον συνολικό αριθμό πρωτεϊνών του Συνόλου-Π (2717) Κατανομή των τύπων διαμεμβρανικών τμημάτων σε κάθε τέταρτο μήκους της ακολουθίας για το Σύνολο-Α. Ο αριστερός υποπίνακας περιλαμβάνει τα ποσοστά ως προς τον εκάστοτε τύπο, ενώ στα δεξιά το ποσοστό εμφανίζεται ανηγμένο σε ολόκληρο το Σύνολο-Α Κατανομή των τύπων διαμεμβρανικών τμημάτων σε κάθε τέταρτο μήκους της ακολουθίας για το Σύνολο-Π. Ο αριστερός υποπίνακας περιλαμβάνει τα ποσοστά ως προς τον εκάστοτε τύπο, ενώ στα δεξιά το ποσοστό εμφανίζεται ανηγμένο σε ολόκληρο το Σύνολο-Π Ποσοστό εμφάνισης μοτίβων δύο τύπων σε βιολογικές λειτουργίες: (α) διαμεμβρανικότητα, (β) γλυκοπρωτεΐνη, (γ) εναλλακτική συναρμολόγηση, (δ) μεταφορέας, (ε) πολυμορφισμός και (στ) υποδοχέας. Παρουσιάζονται μόνο μοτίβα για τα οποία το ποσοστό ξεπερνάει το 3% σε τουλάχιστον μια βιολογική λειτουργία Ποσοστό εμφάνισης μοτίβων τριών τύπων σε βιολογικές λειτουργίες: (α) διαμεμβρανικότητα, (β) γλυκοπρωτεΐνη, (γ) εναλλακτική συναρμολόγηση, (δ) μεταφορέας, (ε) πολυμορφισμός και (στ) υποδοχέας. Παρουσιάζονται μόνο μοτίβα για τα οποία το ποσοστό ξεπερνάει το 3% σε τουλάχιστον μια βιολογική λειτουργία. Στις περιπτώσεις που δε σημειώνεται τιμή, το μοτίβο είτε απουσιάζει είτε εμφανίζεται με ποσοστό μικρότερο του 2.5% Ποσοστό εμφάνισης μοτίβων τεσσάρων τύπων σε βιολογικές λειτουργίες: (α) διαμεμβρανικότητα, (β) γλυκοπρωτεΐνη, (γ) εναλλακτική συναρμολόγηση, (δ) μεταφορέας, (ε) πολυμορφισμός και (στ) υποδοχέας. Παρουσιάζονται μόνο μοτίβα για τα οποία το ποσοστό ξεπερνάει το 3% σε τουλάχιστον μια βιολογική λειτουργία. Στις περιπτώσεις που δε σημειώνεται τιμή, το μοτίβο είτε απουσιάζει είτε εμφανίζεται με ποσοστό μικρότερο του 2.5% x

17 Κεφάλαιο 1 1. Εισαγωγή Ένας από τους πιο σημαντικούς στόχους της βιοπληροφορικής είναι η κατανόηση της σχέσης μεταξύ ακολουθιών αμινοξέων και της τρισδιάστατης δομής των πρωτεϊνών. Στην ιδανική περίπτωση κατά την οποία θα ήταν γνωστή αυτή η σχέση, θα ήταν δυνατή και η πρόβλεψη της δομής της πρωτεΐνης από την ακολουθία αμινοξέων. Δυστυχώς η σχέση αυτή δεν είναι απλή. Είναι σημαντικό να τονιστεί πως εντελώς διαφορετικές πρωτεΐνες από διαφορετικούς οργανισμούς ενδέχεται να έχουν παρόμοια δομή. Η ακολουθία ενός αρχέγονου γονιδίου με συγκεκριμένη δομή ενδέχεται να παρουσιάζει πολύ μεγάλη διαφοροποίηση μεταξύ διαφορετικών ειδών, ενώ ταυτόχρονα να εξακολουθούν διατηρούνται τα δομικά της χαρακτηριστικά. Είναι κατανοητό πως η σύγκριση των ακολουθιών σε αυτές τις περιπτώσεις ενδέχεται να είναι πολύ δύσκολη. Αντίστροφα, δύο πρωτεϊνικές ακολουθίες με μεγάλο βαθμό ομοιότητας είτε μεταξύ τους, είτε ως προς μια τρίτη ακολουθία, συνήθως έχουν κοινή προέλευση καθώς επίσης και ορισμένα κοινά δομικά χαρακτηριστικά. Ωστόσο, εξαιτίας πιθανών γενετικών μεταβολών κατά τη διάρκεια της εξέλιξης, ενδέχεται να προκύψουν διαφορετικά αντίγραφα γονιδίων τα οποία εξελισσόμενα δημιουργούν πρωτεΐνες διαφορετικών λειτουργιών και δομών. Η ακριβής πρόβλεψη συγκεκριμένων περιοχών της δομής των πρωτεϊνών από την ακολουθία αμινοξέων αποτελεί μια από τις μεγαλύτερες προκλήσεις της ανάλυσης ακολουθιών. Η αύξηση του όγκου της πληροφορίας που σχετίζεται με τα δομικά και λειτουργικά χαρακτηριστικά των πρωτεϊνών, συμβάλλουν στη συνεχή βελτίωση της ακρίβειας και αποτελεσματικότητας των μεθόδων ανίχνευσης και εντοπισμού των εν λόγω περιοχών. 1

18 Η παρούσα διατριβή εστιάζει στην προσέγγιση του παραπάνω προβλήματος με τη μεταφορά και εφαρμογή προηγμένων μεθόδων από την περιοχή της επεξεργασίας σήματος στο χώρο της βιοπληροφορικής, ακολουθώντας τη δομή που παρουσιάζεται στη συνέχεια. Η διατριβή δομείται σε έξι κεφάλαια και τρία παραρτήματα. Το πρώτο κεφάλαιο είναι η παρούσα εισαγωγή. Στο δεύτερο κεφάλαιο παρουσιάζονται κάποια στοιχεία Βιολογίας, Βιοχημείας και Βιοπληροφορικής που είναι απαραίτητα για την κατανόηση των φαινομένων που λαμβάνουν χώρα και των λειτουργιών των πρωτεϊνών. Παρουσιάζεται η μοριακή δομή της πρωτεΐνης και τα δομικά επίπεδα τα οποία αναφέρονται σε αυτή. Ακολουθεί μια περιγραφή των βάσεων δεδομένων πρωτεϊνικών ακολουθιών οι οποίες έχουν αναπτυχθεί από διάφορα ερευνητικά κέντρα και οργανισμούς σε ολόκληρο τον κόσμο και διατηρούν λεπτομερή στοιχεία για τη δομή και τις λειτουργίες στις οποίες εμπλέκονται οι πρωτεΐνες που περιλαμβάνουν. Στη συνέχεια παρουσιάζονται τα κύρια χαρακτηριστικά των πρωτεϊνών που συμμετέχουν σε βασικές κυτταρικές λειτουργίες, με ιδιαίτερη έμφαση στις διαμεμβρανικές πρωτεΐνες. Πριν από την παρουσίαση των ήδη χρησιμοποιούμενων μεθόδων που προσεγγίζουν το πρόβλημα που πραγματεύεται η διατριβή, πραγματοποιείται μια σύντομη έκθεση των μεθόδων αριθμητικής κωδικοποίησης των ακολουθιών αμινοξέων (χαρακτήρων). Το κεφάλαιο ολοκληρώνεται με την περιγραφή του συνόλου δεδομένων που χρησιμοποιήθηκαν και τη διατύπωση του αντικειμένου της διατριβής. Το τρίτο κεφάλαιο περιλαμβάνει την παρουσίαση των μεθόδων που αναπτύχθηκαν με στόχο τον εντοπισμό διαμεμβρανικών τμημάτων σε πρωτεΐνες. Προηγείται μια παρουσίαση των μεθοδολογιών που χρησιμοποιήθηκαν για το διαχωρισμό μη διαμεμβρανικών πρωτεϊνών από διαμεμβρανικές και σε δεύτερο στάδιο των πρωτεϊνών ενός από αυτές με πολλαπλά διαμεμβρανικά τμήματα. Πρώτα παρουσιάζεται η προσέγγιση με χρήση στατιστικής ανώτερης τάξης και βιοχημικών ιδιοτήτων των ακολουθιών και στη συνέχεια η αντιμετώπιση μέσα από το συνδυασμό βιοχημικών ιδιοτήτων και το συνεχή μετασχηματισμό κυματιδίων. Η παρουσίαση των μεθόδων πραγματοποιείται πρώτα για την περίπτωση των πρωτεϊνών με ένα μόνο διαμεμβρανικό τμήμα και στη συνέχεια ακολουθεί η περίπτωση των πρωτεϊνών με πολλαπλά διαμεμβρανικά τμήματα. Παράλληλα εισάγεται και η έννοια των τύπων-κατηγοριών διαμεμβρανικών τμημάτων με βάση ενεργειακά χαρακτηριστικά τους. Οι δύο μέθοδοι συγκρίνονται με τέσσερις ήδη χρησιμοποιούμενες μεθόδους, οι οποίες ανήκουν στις πλέον διαδεδομένες και αποτελεσματικές μεθόδους αντιμετώπισης του προβλήματος. Η συγκριτική αξιολόγηση των μεθόδων πραγματοποιείται 2

19 1. Εισαγωγή με την εισαγωγή δεικτών αποτελεσματικότητας και επιτυχούς ανίχνευσης από τη σχετική βιβλιογραφία. Στο τέταρτο κεφάλαιο εξετάζεται η δυνατότητα κατηγοριοποίησης των διαμεμβρανικών τμημάτων και των πρωτεϊνών με βάση τον τύπο τους. Αρχικά ορίζονται τα κριτήρια με τα οποία προσδιορίζεται ο τύπος κάθε διαμεμβρανικού τμήματος και στη συνέχεια εξετάζεται η κατανομή των διαμεμβρανικών τμημάτων ως προς τον τύπο τους, τόσο για την περίπτωση απλών όσο και για την περίπτωση των πολλαπλών διαμεμβρανικών τμημάτων στο μήκος της ακολουθίας αμινοξέων. Ακολουθεί μια ανάλυση της συσχέτισης μεταξύ των διαμεμβρανικών τμημάτων ανά τύπο και διερευνάται η σχέση του τύπου των διαμεμβρανικών τμημάτων με τη φυσιολογία και τις λειτουργίες των πρωτεϊνών με ένα μοναδικό διαμεμβρανικό τμήμα. Η επέκταση της ανάλυσης των πρωτεϊνών ενός διαμεμβρανικού τμήματος στις ακολουθίες με πολλαπλά διαμεμβρανικά τμήματα πραγματοποιείται στο πέμπτο κεφάλαιο, όπου παρουσιάζεται η κατηγοριοποίηση των διαμεμβρανικών πρωτεϊνών με βάση ένα μοντέλο βασισμένο στην πολυπλοκότητα των τύπων διαμεμβρανικών τμημάτων. Διερευνάται η σχέση της πολυπλοκότητας των εμφανιζόμενων τύπων με τη φυσιολογία και τις λειτουργίες των πρωτεϊνών με πολλαπλά διαμεμβρανικά τμήματα και εξετάζεται η εμφάνιση συγκεκριμένων αλληλουχιών τύπων διαμεμβρανικών τμημάτων. Επίσης, εξετάζεται και η προτίμηση εμφάνισης συγκεκριμένων τύπων διαμεμβρανικών τμημάτων σε ομάδες πρωτεϊνών που εμπλέκονται σε συγκεκριμένες κοινές βιολογικές λειτουργίες. Τέλος, στο έκτο κεφάλαιο παρατίθενται τα συμπεράσματα και η συμβολή της εργασίας. Επίσης αναφέρονται πιθανές μελλοντικές επεκτάσεις. Το κείμενο της διατριβής ολοκληρώνεται με την παράθεση ενός παραρτήματος (Παράρτημα Α) που αναφέρεται στην αριθμητική κωδικοποίηση ακολουθιών αμινοξέων με βάση τη σχετική συχνότητα εμφάνισης αμινοξέων (propensities), ενός παραρτήματος (Παράρτημα Β) που περιλαμβάνει την Στατιστική Ανώτερης Τάξης και πιο συγκεκριμένα τους κανονικοποιημένους σωρείτες τρίτης και τέταρτης τάξης (λοξότητα και κύρτωση, αντίστοιχα) και ενός παραρτήματος (Παράρτημα Γ) που αναφέρεται στο Συνεχή Μετασχηματισμό Κυματιδίων. 3

20 4

21 Κεφάλαιο 2 2. Βασικές έννοιες Το κύτταρο είναι η μικρότερη γνωστή ζωντανή μονάδα, που χαρακτηρίζεται από την ύπαρξη ζωής. Αποτελεί τη μορφολογική και λειτουργική μονάδα από την οποία αποτελούνται οι οργανισμοί και περιλαμβάνει δύο κύρια συστατικά: τον πυρήνα και το κυτταρόλασμα, το οποίο τον περιβάλλει. Τα συστατικά αυτά περιβάλλονται από την κυτταρική μεμβράνη, μέσω της οποίας πραγματοποιείται η επικοινωνία του κυττάρου με το εξωκυτταρικό περιβάλλον με τη βοήθεια πρωτεϊνών και άλλων ουσιών που τη διαπερνούν ή είναι προσκολλημένες σε αυτή. Οι πρωτεΐνες διαφέρουν σε μήκος ανάλογα κυρίως με τη λειτουργία τους. Η μεγάλη διακύμανση στο μήκος των πρωτεϊνών ενός οργανισμού απεικονίζει την ποικιλία συγκεκριμένων λειτουργικών ρόλων των πρωτεϊνών (από 30 έως πάνω από αμινοξέα) ανάλογα με το σχήμα τους. Για το λόγο αυτό είναι σημαντική η γνώση της τριτοταγούς (τρισδιάστατης, 3-Δ) δομής μιας πολυπεπτιδικής αλυσίδας, ώστε να μπορεί να καθοριστεί η λειτουργία της. Μέχρι σήμερα η μόνη μέθοδος που παρέχει σαφείς πληροφορίες για τις τριτοταγείς δομές είναι η ανάλυση με ακτίνες Χ [1]. Οι μεμβρανικές πρωτεΐνες έχουν μια πληθώρα ρόλων στα κύτταρα μεταξύ των οποίων η διαμεμβρανική διέλευση, η σήμανση (signalling) και η μετατροπή ενέργειας (energy transduction) [2] Πρωτεϊνικές ακολουθίες Οι πρωτεΐνες είναι μεγάλα πολυπεπτίδια καθορισμένων ακολουθιών αμινοξέων, τα οποία ορίζονται από το γονίδιο που κωδικοποιεί κάθε πρωτεΐνη [3]. Οι πρωτεΐνες βρίσκονται σε αφθονία σε όλους τους ζωντανούς οργανισμούς και είναι πραγματικά θεμελιώδεις για τη ζωή. 5

22 Το 1920 ο βιοχημικός P. A. Levene κατέληξε σωστά στο συμπέρασμα πως τα μόρια του DNA αποτελούνται από επαναλαμβανόμενες μονάδες τριών συστατικών. Κάθε μονάδα αποτελούμενη από ένα σάκχαρο προσκολλημένο σε μία φωσφορική ομάδα (PO 4 ) και μία αζωτούχο βάση ονομάζεται νουκλεοτίδιο. Η διαφοροποίηση μεταξύ των νουκλεοτιδίων πραγματοποιείται ως προς τη βάση που αυτό περιλαμβάνει. Οι αζωτούχες βάσεις διακρίνονται στις πουρίνες (αδενίνη, A, και γουανίνη, G) και τις πυριμιδίνες (θυμίνη, T, και κυτοσίνη, C, με την ουρακίλη, U, αντί της θυμίνης στην περίπτωση του RNA). Πίνακας 2.1 Κάθε τριπλέτα νουκλεοτιδίων κωδικοποιεί ένα αμινοξύ. Η αντιστοίχιση τριπλετών με αμινοξέα προκύπτει από το συνδυασμό του πρώτου γράμματος από την πρώτη στήλη, του δεύτερου από την ενδιάμεση και του τελευταίου από την τρίτη στήλη. Η τριπλέτα ACU αντιστοιχεί στη Θρεονίνη. Στα περισσότερα αμινοξέα αντιστοιχούν περισσότερες από μία τριπλέτες νουκλεοτιδίων (Θρεονίνη: ACU, ACC, ACA και ACG). Το 1964, οι Nirenberg και Philip Leder ανέπτυξαν έναν πίνακα συνδυασμού τριπλετών νουκλεοτιδίων ο οποίος συμπληρώθηκε λίγο αργότερα από τον Har Gobind Khorana. Ο πίνακας αναπτύχθηκε με βάση την παρατήρηση πως τριάδες νουκλεοτιδίων κωδικοποιούν συγκεκριμένα αμινοξέα. Ο πίνακας αυτός περιγράφει πλήρως τον γενετικό κώδικα καθώς περιλαμβάνει το αποτέλεσμα του συνδυασμού καθεμιάς από τις 64 δυνατές τριάδες νουκλεοτιδίων (Πίνακας 2.1) και είναι ενιαίος σχεδόν για όλους τους οργανισμούς. Παρόλο που οι πρωτεΐνες είναι πολύπλοκα και ευέλικτα μόρια, αποτελούν πολυμερή 20 μόνο αμινοξέων σε συγκεκριμένη σειρά. Κάθε αμινοξύ είναι ένα μόριο που περιλαμβάνει μια αμινοομάδα ( NH2), μια καρβοξυλική ομάδα ( COOH), και ένα άτομο υδρογόνου. Κάθε αμινοξύ έχει μοναδικές χημικές ιδιότητες που προσδιορίζονται από τη φύση της πλευρικής ομάδας που συνδέεται μέσω ομοιοπολικού δεσμού με το κεντρικό άτομο 6

23 2. Βασικές έννοιες άνθρακα. Η πλευρική ομάδα συμβολίζεται συνήθως με το γράμμα R και αναφέρεται μονολεκτικά ως υπόλειμμα (residue). Κάθε πρωτεΐνη αποτελείται από μία ή περισσότερες μεγάλου μήκους αλυσίδες, ή πολυπεπτίδια, που περιλαμβάνουν αμινοξέα που συνδέονται μεταξύ τους με πεπτιδικούς δεσμούς. Μόνο στις αρχές της δεκαετίας του 1950 μετά από τις έρευνες του Frederick Sanger έγινε φανερό ότι κάθε πρωτεΐνη έχει συγκεκριμένη ακολουθία αμινοξέων. Ο Sanger κατάφερε να προσδιορίσει την ακολουθία αμινοξέων της ινσουλίνης δείχνοντας συγχρόνως πως αυτή η πρωτεΐνη είχε καθορισμένη ακολουθία και μάλιστα την ίδια για όλα τα μόρια ινσουλίνης στο διάλυμα που ανέλυσε. Παρόλο που στη φύση απαντώνται πολλά διαφορετικά αμινοξέα, μόνο 20 εμφανίζονται τακτικά στις πρωτεΐνες [3]. Η μελέτη του σχήματος μιας πρωτεΐνης στο χώρο μπορεί να πραγματοποιηθεί με τη χρήση ενέργειας πολύ μικρού μήκους κύματος, με χρήση ακτινών Χ. Η ανάλυση με ακτίνες X είναι μια διαδικασία που δίνει τη δυνατότητα στον αναλυτή να απεικονίσει την τρισδιάστατη εικόνα της θέσης κάθε ατόμου στην πρωτεΐνη. Η πρώτη πρωτεΐνη που μελετήθηκε με αυτή τη μέθοδο ήταν η μυοσφαιρίνη με την αιμοσφαιρίνη να ακολουθεί. Καθώς όλο και περισσότερες πρωτεΐνες προσθέτονταν στη λίστα αυτή έγινε φανερή η ακόλουθη αρχή: σε κάθε πρωτεΐνη, ουσιαστικά όλα τα αμινοξέα στο εσωτερικό της είναι μη πολωμένα αμινοξέα, όπως η λευκίνη, η βαλίνη και η φαινυλαλανίνη. Η τάση του νερού να απωθεί λόγω υδροφοβικότητας τα μη πολωμένα μόρια ουσιαστικά ωθεί τα μη πολωμένα τμήματα της αλυσίδας αμινοξέων στο εσωτερικό της πρωτεΐνης. Το γεγονός αυτό θέτει τα παραπάνω τμήματα πολύ κοντά το ένα στο άλλο, αφήνοντας ελάχιστο κενό μεταξύ τους στο εσωτερικό της πρωτεΐνης. Τα πολωμένα και φορτισμένα αμινοξέα είναι αυτά που απομένουν στην επιφάνεια της πρωτεΐνης εκτός από ορισμένα που έχουν σημαντικό λειτουργικό ρόλο [3]. Η δομή των πρωτεϊνών αναφέρεται συνήθως στα πλαίσια τεσσάρων δομικών επιπέδων, πρωτοταγής, δευτεροταγής, τριτοταγής και τεταρτοταγής όπως απεικονίζονται στο Σχ Επιπλέον, η πρόοδος στη γνώση της πρωτεϊνικής δομής έχει οδηγήσει σε δύο επιπλέον επίπεδα που διαφοροποιούνται ολοένα και περισσότερο στο χώρο της μοριακής βιολογίας: τα μοτίβα (motifs) και οι περιοχές (domains). Πρωτοταγής δομή: η καθορισμένη ακολουθία αμινοξέων μιας πρωτεΐνης αποτελεί την πρωτοταγή της δομή. Η ακολουθία αυτή προσδιορίζεται από την ακολουθία νουκλεοτιδίων του γονιδίου που κωδικοποιεί την πρωτεΐνη. Δεδομένου ότι οι πλευρικές ομάδες R που διαφοροποιούν τα αμινοξέα δεν επηρεάζουν τον κύριο πεπτιδικό σκελετό των πρωτεϊνών, 7

24 Σχήμα 2.1: Τα επίπεδα πρωτεϊνικής δομής. (α) Η ακολουθία αμινοξέων μιας πρωτεΐνης αναφέρεται ως πρωτοταγής δομή. (β) Δεσμοί μεταξύ γειτονικών αμινοξέων σχηματίζουν φύλλα β-πτυχώσεων και α-έλικες. (γ) Οι πρωτεΐνες αναδιπλώνονται σχηματίζοντας μια τρισδιάστατη, την τριτοταγή, δομή. (δ) Η συσσωμάτωση πρωτεϊνών με άλλες πεπτιδικές αλυσίδες δημιουργεί την τεταρτοταγή δομή της πρωτεΐνης. (Πηγή: [3]-Σχήμα 3.7, Σελ. 42). 8

25 2. Βασικές έννοιες κάθε πρωτεΐνη μπορεί να αποτελείται από οποιαδήποτε ακολουθία αμινοξέων. Συνεπώς, αλληλεπιδράσεις τους με το νερό θα μπορούσαν να αντισταθμίζουν την τάση των μη πολωμένων πλευρικών ομάδων να παραμείνουν στο εσωτερικό της πρωτεΐνης. Ο λόγος για τον οποίο αυτό δε συμβαίνει στην πράξη αποκαλύπτεται από τη μελέτη της πρωτεϊνικής δομής με ανάλυση ακτινών Χ. Υπάρχουν δύο τύποι δεσμών υδρογόνου: ο πρώτος τύπος αναφέρεται στη σύνδεση ενός αμινοξέως με το άλλο στην ίδια αλυσίδα εξαιτίας του οποίου η αλυσίδα παίρνει τη μορφή έλικας που ονομάζεται α-έλικα (alpha a-helix) και ο δεύτερος τύπος εμφανίζεται μεταξύ αλυσίδων αμινοξέων συνδέοντας τα αμινοξέα της μιας αλυσίδας με αυτά της άλλης. Συχνά παρατηρείται συνένωση πολλών παράλληλων αλυσίδων με αποτέλεσμα να σχηματίζονται δομές με τη μορφή φύλλου χαρτιού, οι οποίες ονομάζονται φύλλα β-πτυχώσεων. Η αναδίπλωση των αλυσίδων αμινοξέων με δεσμούς υδρογόνου στις δύο αυτές δομές αποτελεί τη δευτεροταγή δομή της πρωτεΐνης. Μοτίβα: τα στοιχεία της δευτεροταγούς δομής μπορούν να συνδυαστούν στις πρωτεΐνες με συγκεκριμένους τρόπους που ονομάζονται μοτίβα ή υπερδευτεροταγείς δομές (supersecondary structure). Από τα πλέον συνηθισμένα παραδείγματα μοτίβων είναι τα μοτίβα β-βαρελιού και α έλικας-στροφής-α έλικας που αποτελούν φύλλα β-πτυχώσεων αναδιπλωμένα σε σχήμα κυλίνδρου ή παρουσιάζονται στις πρωτεΐνες κατά τη διασύνδεση της διπλής έλικας του DNA αντίστοιχα. Τριτοταγής δομή: η τελική αναδιπλωμένη μορφή της πρωτεΐνης που περιλαμβάνει διάφορα μοτίβα, αναδιπλώνοντας τις μη πολωμένες πλευρικές ομάδες στο εσωτερικό της αποτελεί την τριτοταγή δομή της πρωτεΐνης. Η πρωτεΐνες οδηγούνται στην τριτοταγή τους δομή εξαιτίας υδροφοβικών αλληλεπιδράσεων με το νερό. Η τελική αναδίπλωση μίας πρωτεΐνης καθορίζεται από τη χημική φύση των πλευρικών της ομάδων και συνεπώς από την πρωτοταγή της δομή. Είναι χαρακτηριστικό ότι πολλές πρωτεΐνες αναπτύσσονται και επαναδιπλώνονται στη χαρακτηριστική τους δομή αυτενεργώς. Επίσης, στο εσωτερικό των αναδιπλωμένων πρωτεϊνών δεν παρουσιάζονται κενά ή κοιλότητες. Με τον τρόπο αυτό μπορεί να εξηγηθεί και η πληθώρα των μη πολωμένων αμινοξέων (αλανίνη, βαλίνη, λευκίνη, ισολευκίνη). Κάθε αμινοξύ αποτελείται από διαφορετικού μήκους πλευρική ομάδα, επιτρέποντας ακριβή προσαρμογή των μη πολωμένων αλυσίδων στο εσωτερικό της πρωτεΐνης. Είναι προφανές ότι η αλλαγή ενός μη πολωμένου αμινοξέως στο εσωτερικό της πρωτεΐνης σε ένα άλλο διαταράσσει πολύ συχνά την ευστάθεια της πρωτεΐνης και είναι δυνατό να οδηγήσει σε αλλαγή ή απώλεια της λειτουργικότητας της. Τεταρτοταγής δομή: κατά τη διασύνδεση δύο η περισσότερων πολυπεπτιδικών αλυσίδων για τη δημιουργία μιας λειτουργικής πρωτεΐνης, οι επιμέρους αλυσίδες 9

26 αναφέρονται ως υπομονάδες της πρωτεΐνης. Οι υπομονάδες δεν είναι απαραίτητο να είναι ίδιες. Η διάταξη αυτών των υπομονάδων της πρωτεΐνης στο χώρο αποτελεί την τεταρτοταγή της δομή. Τα τμήματα των ακολουθιών αμινοξέων στις περιοχές σύνδεσης των υπομονάδων τους είναι συνήθως μη πολωμένα και έχουν σημαντικό ρόλο στη μετάδοση πληροφοριών σχετικά με την ξεχωριστή λειτουργία των υπομονάδων της πρωτεΐνης. Περιοχές: σε πολλές πρωτεΐνες παρατηρείται αναδίπλωση σε δομικά ανεξάρτητα λειτουργικά τμήματα που αναφέρονται ως περιοχές. Κατά την αναδίπλωση της πρωτεΐνης οι περιοχές αναδιπλώνονται στο κατάλληλο σχήμα σχετικά ανεξάρτητα μεταξύ τους. Είναι δυνατό οι περιοχές μιας πρωτεΐνης να έχουν σχετικά διαχωρισμένη λειτουργία. Μια περιοχή ενός ενζύμου ενδέχεται να προσαρτάται σε ένα συνένζυμο και μία άλλη στο υπόστρωμά του. Μια κατηγορία περιοχών με μεγάλο ενδιαφέρον αποτελούν και οι διαμεμβρανικές περιοχές στις διαμεμβρανικές πρωτεΐνες Βάσεις δεδομένων ακολουθιών αμινοξέων Η φαρμακευτική βιομηχανία κατά την τελευταία δεκαετία αποτελεί έναν από τους μεγαλύτερους χρήστες των βάσεων δεδομένων που περιγράφουν τη δομή των πρωτεϊνών και έναν εξίσου σημαντικό παράγοντα στην προσπάθεια να καθοριστούν νέες πρωτεϊνικές δομές [4]. Υπάρχει ένας μεγάλος αριθμός διαθέσιμων βάσεων δεδομένων πρωτεϊνικών ακολουθιών με διαφορετικούς στόχους και στοιχεία που περιέχουν. Μια σημαντική διαφοροποίηση υπάρχει ανάμεσα σε βάσεις δεδομένων γενικού περιεχομένου, οι οποίες καλύπτουν πρωτεΐνες από όλα τα είδη των ζωντανών οργανισμών, και σε εξειδικευμένες βάσεις δεδομένων που περιέχουν πληροφορίες σχετικά με οικογένειες ή ομάδες πρωτεϊνών ή με πρωτεΐνες ενός συγκεκριμένου οργανισμού. Επιπλέον, η πρώτη κατηγορία βάσεων δεδομένων διακρίνεται σε βάσεις δεδομένων συντηρούμενες μη αυτόματα από ειδικούς και σε αποθήκες ακολουθιών. Ιδιαίτερα κατά τη διάρκεια της αποκωδικοποίησης του γονιδιώματος, οι πρώτες βρέθηκαν αντιμέτωπες με μία μεγάλη πρόκληση. Η Swiss-Prot αποτελεί μια βάση πληροφοριών πρωτεϊνών που δημιουργήθηκε το 1986 και συντηρείται μέσω της συνεργασίας του Ελβετικού Ινστιτούτου Βιοπληροφορικής (Swiss Institute of Bioformatics - SIB) και του Ευρωπαϊκού Ινστιτούτου Βιοπληροφορικής (European Bioinformatics Institute - EBI) [5]. Στόχος της είναι η παροχή υψηλού επιπέδου σχολιασμού (annotation), η ελαχιστοποίηση της πλεονάζουσας πληροφορίας, το υψηλό επίπεδο συμβατότητας με άλλες βάσεις δεδομένων και η διεξοδική τεκμηρίωση των παρεχόμενων πληροφοριών. Κάθε εγγραφή της Swiss-Prot αναλύεται και ταυτοποιείται 10

27 2. Βασικές έννοιες προσεκτικά από βιολόγους, ώστε να διασφαλίζεται ένα υψηλό επίπεδο εγκυρότητας και να διατηρηθεί η ποιότητα των παρεχόμενων πληροφοριών. Η έκδοση 55.3 της βάσης περιλαμβάνει (Απρίλιος 2008) ταυτοποιημένες πρωτεϊνικές ακολουθίες από περισσότερα από 290 διαφορετικά είδη οργανισμών. Η βάση TrEMBL δημιουργήθηκε το 1996 συμπληρωματικά στη Swiss-Prot ως ανταπόκριση στην ανάγκη για όσο το δυνατό ταχύτερη διάθεση νέων ακολουθιών [5]. Αυτό δεν ήταν δυνατό να γίνει απευθείας στην ίδια τη Swiss-Prot για λόγους εγκυρότητας και ποιότητας των περιεχομένων της. Η TrEMBL αρχικά αποτελούνταν από εγγραφές που προέρχονταν από ταυτοποίηση μέσω υπολογιστή από την ερμηνεία όλων των ακολουθιών κωδικοποίησης στις βάσεις δεδομένων DDBJ, EMBL-Bank, GenBank εκτός από αυτές που περιλαμβάνονταν στη Swiss-Prot [6]. Στη συνέχεια διευρύνθηκε, ώστε να περιλαμβάνει και πρωτεϊνικές ακολουθίες που προέρχονται από τη βιβλιογραφία ή αποστέλλονται προς τη Swiss-Prot. Η έκδοση 38.3 (Απρίλιος 2008) διαθέτει περισσότερες από εγγραφές, γεγονός που δικαιολογεί τη δημιουργία της. Η άλλη καθολικού περιεχομένου βάση δεδομένων πρωτεϊνών είναι η PIR (Protein Information Resource) [7]. Η PIR αποτελεί μια κοινή προσπάθεια του Ιατρικού Κέντρου του Πανεπιστημίου του Georgetown και του Εθνικού Ιδρύματος Βιοϊατρικής Τεχνολογίας (National Biomedical Research Foundation) στην Ουάσινγκτον των Η.Π.Α. Ιδρύθηκε το 1984 και προέκυψε από την εργασία «Atlas of Protein Sequence and Structure» της Δρ. Margaret Dayhoff, που δημοσιεύτηκε στο διάστημα και αποτέλεσε την πρώτη ευρεία συλλογή πρωτεϊνικών ακολουθιών. Το 1974 όρισε την έννοια της οικογένειας και «υπεροικογένειας» (superfamily) πρωτεϊνών, με βάση την ομοιότητα των ακολουθιών, ως τρόπο οργάνωσης και κατηγοριοποίησης των πρωτεϊνών. Αυτό χρησιμοποιήθηκε από την PIR δίνοντας τη δυνατότητα ταυτοποίησης λειτουργικών και μορφολογικών χαρακτηριστικών των πρωτεϊνικών ακολουθιών μέσω υπολογιστή, αυξάνοντας τον αριθμό των καταγεγραμμένων πρωτεϊνών στην PIR, η οποία στην τελική της έκδοση (Δεκέμβριος 2004) περιλαμβάνει ακολουθίες οργανωμένες σε υπεροικογένειες με 5700 από αυτές πλήρως ταυτοποιημένες. Ενώ η Swiss-Prot και η PIR αποτελούν παραδείγματα βάσεων δεδομένων συντηρούμενων μη αυτόματα από ειδικούς, η ΤrEMBL και ένα από τα πλέον αντιπροσωπευτικά αντίστοιχα παραδείγματα από τις Η.Π.Α., η GenPept (GeneBank Gene Products Data Bank), αποτελούν βάσεις αποθήκευσης ακολουθιών. Η GenPept που συντηρείται από το Αμερικανικό Εθνικό Κέντρο Πληροφοριών Βιοτεχνολογίας (National Center of Biotechnology Information - NCBI) περιλαμβάνει ακολουθίες περιορισμένης 11

28 ταυτοποίησης ως προς τα τμήματα τους, οι οποίες εξάγονται από άλλες μεγαλύτερες βάσεις ακολουθιών και η έκδοσή της περιλαμβάνει εγγραφές (Απρίλιος 2008). Οι βάσεις δεδομένων Swiss-Prot, TrEMBL και PIR συνυπήρχαν μόνο ως ανεξάρτητες πηγές μέχρι το 2002, οπότε οι φορείς που τις συντηρούσαν δημιούργησαν τη βάση δεδομένων Uniprot, η οποία συνδυάζει τις πληροφορίες των τριών επιμέρους βάσεων δεδομένων και περιορίζει στο ελάχιστο την πλεονάζουσα διαθέσιμη πληροφορία και αριθμεί εγγραφές στην έκδοση 13.3 (Απρίλιος 2008). Εκτός από τις καθολικού περιεχομένου βάσεις δεδομένων πρωτεϊνών, υπάρχει ένας μεγάλος αριθμός εξειδικευμένων βάσεων δεδομένων. Ορισμένες από αυτές είναι επικεντρωμένες σε μια συγκεκριμένη μορφή πρωτεϊνών, ενώ άλλες στοχεύουν στη συγχώνευση ήδη υπαρχουσών πηγών πληροφοριών πρωτεϊνών για την πλήρη εκμετάλλευση των δυνατοτήτων τους. Ένα χαρακτηριστικό παράδειγμα της πρώτης κατηγορίας είναι η PDB (Protein Data Bank). Αυτή η βάση δεδομένων τρισδιάστατης δομής πρωτεϊνών αριθμεί περισσότερες από εγγραφές (Μάιος 2008). Η αύξηση του όγκου δεδομένων της συνοδεύτηκε από αύξηση τόσο ως προς το περιεχόμενό της όσο και ως προς τη δομική πολυπλοκότητα των περιεχομένων της. Η ιδιαιτερότητα της PDB έγκειται στο γεγονός ότι η γνώση της τρισδιάστατης δομής των πρωτεϊνών που περιλαμβάνει διασφαλίζει τον ορθό και ακριβή χαρακτηρισμό των διαφόρων τμημάτων τους. Ως υποκατηγορία της PDB έχουν αναπτυχθεί αρκετές επιμέρους βάσεις δεδομένων πρωτεϊνών με συγκεκριμένα χαρακτηριστικά, με αντιπροσωπευτικό παράδειγμα την PDBTM, η οποία περιλαμβάνει το σύνολο (878, Μάιος 2008) των διαμεμβρανικών πρωτεϊνών που περιέχονται στην PDB, ανεξαρτήτως ζωντανού οργανισμού στον οποίο ανήκουν. Ένας άλλος διαχωρισμός των βάσεων δεδομένων πρωτεϊνών που υπάρχουν διαθέσιμες στο διαδίκτυο σήμερα πραγματοποιεί διάκριση ανάμεσα σε τρεις βασικές κατηγορίες, οι οποίες είναι: α) βάσεις δεδομένων πρωτεϊνικών ακολουθιών, β) βάσεις δεδομένων πρωτεϊνικών δομών και γ) βάσεις δεδομένων πρωτεϊνικών οικογενειών. Χαρακτηριστικό παράδειγμα της πρώτης κατηγορίας είναι η Swiss-Prot με εκτενείς σχολιασμούς για κάθε εγγραφή, ενώ για τη δεύτερη κατηγορία η PDB, η οποία περιέχει πληροφορίες για την τρισδιάστατη δομή των πρωτεϊνών. Στην τρίτη κατηγορία ανήκουν οι βάσεις δεδομένων που είναι οργανωμένες σύμφωνα με οικογένειες πρωτεϊνών Διαμεμβρανικές πρωτεΐνες Κυτταρική Μεμβράνη: η πλασματική μεμβράνη αποτελείται κυρίως από λιπίδια και πρωτεΐνες. Το στρώμα λιπιδίων που αποτελεί τη βασική δομή μιας κυτταρικής μεμβράνης 12

29 2. Βασικές έννοιες αποτελείται από μόρια που ονομάζονται φωσφολιπίδια (Σχ. 2.2). Το ένα άκρο του φωσφολιπιδίου είναι ισχυρά μη πολωμένο (μη διαλυτό στο νερό) ενώ το άλλο ισχυρά πολωμένο (διαλυτό στο νερό). Κάθε φωσφολιπίδιο όταν βρεθεί σε υδατικό περιβάλλον διατάσσεται κατά τέτοιο τρόπο, ώστε το πολωμένο άκρο του να έχει φορά προς το νερό. Όταν σχηματιστούν δύο στρώματα φωσφολιπιδίων με τα πολωμένα άκρα τους προς αντίθετες κατευθύνσεις δημιουργείται μια σταθερή δομή καθώς αποκλείεται πλήρως το ενδεχόμενο να έρθουν σε επαφή με το υδατικό περιβάλλον τα μη πολωμένα άκρα των φωσφολιπιδίων. Η δομή αυτή ονομάζεται λιπιδική διπλοστοιβάδα. Σχήμα 2.2: Δομή φωσφολιπιδίου. Απεικονίζεται με τη μορφή μιας πολωμένης περιοχής ακολουθούμενη από δύο μη πολωμένες λιπιδικές ουρές. (Πηγή: [3]-Σχήμα 6.2, Σελ. 104). Το 1972 οι S. Singer και G. Nicolson [8] πρότειναν το ακόλουθο μοντέλο για την περιγραφή της σχέσης των πρωτεϊνών με την κυτταρική μεμβράνη: οι πρωτεΐνες βρίσκονται ενσωματωμένες στη λιπιδική διπλοστοιβάδα της μεμβράνης με τα μη πολωμένα τμήματά τους στο εσωτερικό της διπλοστοιβάδας και τα πολωμένα να προεξέχουν εκτός της επιφάνειες της μεμβράνης, όπως απεικονίζεται στο Σχ Παρόλο που τα κύτταρα αλληλεπιδρούν με το περιβάλλον τους μέσω των πλασματικών τους μεμβρανών με ποικίλους τρόπους, υπάρχουν ορισμένες χαρακτηριστικές κατηγορίες μεμβρανικών πρωτεϊνών, οι οποίες συμμετέχουν σε βασικές κυτταρικές λειτουργίες, παρουσιάζονται στο Σχ. 2.4 και περιγράφονται στη συνέχεια. Μεταφορείς: οι μεμβράνες είναι ιδιαίτερα επιλεκτικές, επιτρέποντας την είσοδο και αποχώρηση από το κύτταρο μόνο συγκεκριμένων ουσιών, είτε μέσω καναλιών είτε μέσω φορέων. 13

30 Σχήμα 2.3: Το μοντέλο της κυτταρικής μεμβράνης. Μια πληθώρα πρωτεϊνών προεξέχουν από την κυτταρική μεμβράνη ζωικών κυττάρων και συγκρατούνται από τις μη πολωμένες περιοχές του εσωτερικού της μεμβράνης. (Πηγή: [3]-Σχήμα 6.5, Σελ. 106). Σχήμα 2.4: Λειτουργίες των κυτταρικών πρωτεϊνών. Οι κυτταρικές πρωτεΐνες λειτουργούν ως μεταφορείς, ένζυμα, επιφανειακοί κυτταρικοί υποδοχείς και δείκτες ταυτότητας, καθώς και διευκολύνουν την προσκόλληση κυττάρων και τη συγκράτηση του κυτταρικού σκελετού. (Πηγή: [3]-Σχήμα 6.7, Σελ. 109). Ένζυμα: τα κύτταρα πραγματοποιούν πολλές χημικές αντιδράσεις στο εσωτερικό της πλασματικής μεμβράνης, χρησιμοποιώντας ένζυμα που βρίσκονται προσκολλημένα στη μεμβράνη. 14

31 2. Βασικές έννοιες Επιφανειακοί κυτταρικοί υποδοχείς (Cell surface receptors): οι μεμβράνες είναι εξαιρετικά ευαίσθητες σε χημικά μηνύματα τα οποία ανιχνεύουν με πρωτεΐνες υποδοχείς στην επιφάνειά τους, οι οποίες λειτουργούν ως κεραίες. Επιφανειακοί κυτταρικοί δείκτες ταυτότητας (Cell surface identity markers): οι μεμβράνες μεταφέρουν επιφανειακούς κυτταρικούς δείκτες ως στοιχεία αναγνώρισης προς άλλα κύτταρα. Στην πλειοψηφία τους τα κύτταρα όλων των τύπων μεταφέρουν τους δικούς τους δείκτες, που αποτελούνται από συγκεκριμένους συνδυασμούς πρωτεϊνών στην επιφάνεια του κυττάρου, οι οποίοι χαρακτηρίζουν τον κάθε κυτταρικό τύπο. Πρωτεΐνες προσκόλλησης κυττάρων (Cell adhesion protein): τα κύτταρα χρησιμοποιούν συγκεκριμένες πρωτεΐνες για να προσκολλώνται το ένα στο άλλο. Η προσκόλληση συμβαίνει άλλοτε προσωρινά και άλλοτε μόνιμα. Πρωτεΐνες σύνδεσης στον κυτταρικό σκελετό (Attachments to the cytoskeleton): οι επιφανειακές πρωτεΐνες που αλληλεπιδρούν με άλλα κύτταρα συνδέονται πολλές φορές με το εσωτερικό του κυττάρου μέσω πρωτεϊνών σύνδεσης. Οι δομικές μεμβρανικές πρωτεΐνες (integral membrane proteins) αντιπροσωπεύουν ένα σημαντικό και με ποικίλες λειτουργίες σύνολο πρωτεϊνικών δομών [9]. Πρόκειται για πρωτεΐνες που στις περισσότερες περιπτώσεις διαπερνούν την βιολογική μεμβράνη με την οποία συνδέονται (ιδιαίτερα την πλασματική μεμβράνη), ή βρίσκονται γενικά σε μεγάλο βαθμό εντός της μεμβράνης. Οι μεμβρανικές πρωτεΐνες παρουσιάζουν ένα περιορισμένο εύρος πτυχώσεων σε σχέση με τις υδατοδιαλυτές πρωτεΐνες, με αποτέλεσμα η πρόβλεψη της δομής τους να είναι πιο εύκολα εφικτή [10, 11]. Τα αποτελέσματα μελετών έχουν δείξει την παρουσία τοπολογικών σημάτων στις δομικές μεμβρανικές πρωτεΐνες, δηλαδή μοτίβα ακολουθιών που συσχετίζονται με την τοπολογία τμημάτων που διαπερνούν μεμβράνες [9]. Πιο συγκεκριμένα, εάν είναι γνωστές οι θέσεις και η τοπολογία των διαμεμβρανικών ελίκων με ικανοποιητική ακρίβεια, η 3-Δ δομή των διαμεμβρανικών τμημάτων μπορεί να προβλεφθεί επιτυχώς με εξαντλητική αναζήτηση όλων των δυνατών δομών στο χώρο [12]. Τα διαμεμβρανικά τμήματα στις δομικές μεμβρανικές πρωτεΐνες αποτελούνται στην πλειοψηφία τους από συνεχείς σχηματισμούς κατά κύριο λόγο υδροφοβικών αμινοξέων. Μια τέτοια διάταξη επιτρέπει στις αλυσίδες αμινοξέων να αλληλεπιδρούν κατά προτίμηση με το λιπώδες περιβάλλον της μεμβράνης. Πολλές μεμβρανικές πρωτεΐνες είναι προσκολλημένες στην επιφάνεια της μεμβράνης μέσω συγκεκριμένων μορίων που ενώνονται με φωσφολιπίδια και κατά συνέπεια συνδέουν την πρωτεΐνη με τη μεμβράνη. Άλλες πάλι πρωτεΐνες διασχίζουν την λιπιδική διπλοστοιβάδα. Τα κύτταρα περιλαμβάνουν μια ποικιλία διαφορετικών διαμεμβρανικών 15

32 πρωτεϊνών οι οποίες διαφοροποιούνται με βάση τον τρόπο που διαπερνούν τη λιπιδική διπλοστοιβάδα, ανάλογα με τη λειτουργία τους. Άγκυρες (Anchors): ένα απλό μη πολωμένο τμήμα είναι ικανό να συνδέσει μια πρωτεΐνη στη μεμβράνη. Πολλές πρωτεΐνες που λειτουργούν ως υποδοχείς εξωκυτταρικών σημάτων αποτελούν «άγκυρες» απλής διέλευσης (single pass) που διέρχονται μέσα από τη μεμβράνη μόνο μία φορά. Το τμήμα της πρωτεΐνης που εκτείνεται έξω από την επιφάνεια του κυττάρου συνδέεται με συγκεκριμένες ορμόνες ή άλλα μόρια και κατά τη σύζευξή τους υποκινούνται μεταβολές στο άλλο άκρο της πρωτεΐνης στο εσωτερικό του κυττάρου. Με τον τρόπο αυτό, πληροφορίες από το εξωτερικό του κυττάρου μπορούν να μετατραπούν σε δράσεις στο εσωτερικό του (Σχ. 2.5). Σχήμα 2.5: Πρωτεΐνες αγκύρωσης. Η σπεκτρίνη εκτείνεται με τη μορφή βρόχου συνδεδεμένη στην κυττοπλασμική πλευρά μιας μεμβράνης ερυθρού κυττάρου. Η σύνδεση επιτυγχάνεται μέσω ειδικών πρωτεϊνών όπως συνδετικά συμπλέγματα και αγκυρίνες. Το δίκτυο αυτό παρέχει ανθεκτικότητα σε ομάδες κυττάρων όπως τα ερυθροκύτταρα. (Πηγή: [3]-Σχήμα 6.9, Σελ. 111). Δίαυλοι (Channels): υπάρχουν πρωτεΐνες οι οποίες έχουν πολλαπλά ελικοειδή τμήματα που διαπερνούν την μεμβράνη από τη μία άκρη ως την άλλη και αντίστροφα σχηματίζοντας ένα δίαυλο ανάμεσα στο εξωτερικό του κυττάρου και στο κυτταρόπλασμα. Υπάρχουν επίσης πρωτεΐνες που δε δημιουργούν κανάλια αλλά λειτουργούν ως μεταφορείς μορίων διαμέσου της κυτταρικής μεμβράνης. Όλα τα υδατοδιαλυτά μόρια που εισέρχονται ή αποβάλλονται από το κύτταρο είτε μεταβιβάζονται από τους μεταφορείς είτε διέρχονται μέσα από κανάλια όπως απεικονίζεται στο Σχ

33 2. Βασικές έννοιες Σχήμα 2.6: Μια πρωτεΐνη δίαυλος. Η πρωτεΐνη μεσολαβεί στη διαδικασία φωτοσύνθεσης του βακτηρίου Halobacterium blobium. Η πρωτεΐνη διασχίζει τη μεμβράνη επτά φορές με ακολουθίες υδροφοβικών αμινοξέων που βρίσκονται στο υδροφοβικό εσωτερικό της λιπιδικής διπλοστιβάδας. Τα τμήματα της πρωτεΐνης σχηματίζουν έναν δίαυλο διαμέσου της μεμβράνης μέσω του οποίου πρωτόνια αντλούνται μέσω των χρωμοφόρων αμφιβληστροειδούς (πράσινο). (Πηγή: [3]-Σχήμα 6.10, Σελ. 111). Πόροι (Pores): ορισμένες διαμεμβρανικές πρωτεΐνες έχουν εκτεταμένες μη πολωμένες περιοχές με δευτεροταγείς δομές β-πτυχώσεων αποκτώντας μια μορφή ανάλογη των τοιχωμάτων ενός ξύλινου βαρελιού. Το χαρακτηριστικό αυτό περιγράφει την κατηγορία των πρωτεϊνών που ονομάζονται πορίνες και συναντώνται στην εξωτερική μεμβράνη ορισμένων βακτηρίων (Σχ. 2.7). Οι διαμεμβρανικές πρωτεΐνες είναι ευρύτατα διαδεδομένες. Οι διαμεμβρανικές πρωτεΐνες β-πτυχώσεων συναντώνται μόνο στις εξωτερικές πρωτεΐνες των βακτηριδίων και σε ομάδες πρωτεϊνών συγγενείς με αυτές [13]. Επιπλέον δεν έχει παρατηρηθεί ύπαρξη διαμεμβρανικών α-ελίκων και β-πτυχώσεων ταυτόχρονα στην ίδια πρωτεΐνη. Προκειμένου να διασχίσουν τη μεμβράνη οι διαμεμβρανικές α-έλικες πρέπει να έχουν μήκος τουλάχιστον 15 αμινοξέων αποτελούμενες κατά κύριο λόγο από υδροφοβικά αμινοξέα. Επίσης, τα τμήματα των πρωτεϊνών που συνδέουν διαμεμβρανικά τμήματα μεταξύ τους και δεν βρίσκονται εκτός της λιπιδικής διπλοστοιβάδας («εσωτερικά» ή κυττοπλασμικά τμήματα) περιλαμβάνουν θετικά φορτισμένα αμινοξέα, ακολουθώντας τον κανόνα που αναφέρεται στη βιβλιογραφία ως positive-inside rule [2, 9]. Με βάση τα παραπάνω, το πλήθος και η ακριβής θέση των διαμεμβρανικών τμημάτων είναι δυνατό να προβλεφθούν και συνεπώς 17

34 είναι λογικό να θεωρείται πως η πρόβλεψη της 3-Δ δομής των διαμεμβρανικών πρωτεϊνών είναι εφικτή με χρήση υπολογιστικών μεθόδων και αλγορίθμων. Σχήμα 2.7: Μια πρωτεΐνη πόρος. Η βακτηριακή διαμεμβρανική πρωτεΐνη πορίνη σχηματίζει στην εξωτερική μεμβράνη των βακτηρίων μεγάλες σήραγγες που ονομάζονται πόροι. Οι πόροι επιτρέπουν στο νερό και σε άλλες ουσίες τη διέλευση από τη μεμβράνη. (Πηγή: [3]-Σχήμα 6.11, Σελ. 111) Αριθμητική κωδικοποίηση (αναπαράσταση) ακολουθιών αμινοξέων Η επαρκής ανάλυση των πρωτεϊνικών ακολουθιών προϋποθέτει τη δυνατότητα εφαρμογής τεχνικών της ψηφιακής επεξεργασίας σήματος, με στόχο την εξαγωγή σημαντικών πληροφοριών για τη δομή και τη λειτουργία των πρωτεϊνών. Η αριθμητική κωδικοποίηση των πρωτεϊνών συνίσταται στη μετατροπή της ακολουθίας χαρακτήρων (αμινοξέων) σε αριθμητική ακολουθία. Κατά την αριθμητική κωδικοποίηση πραγματοποιείται ουσιαστικά ένας μετασχηματισμός όπου σε κάθε αμινοξύ αντιστοιχίζεται μία αριθμητική τιμή, έτσι ώστε η αριθμητική ακολουθία που προκύπτει να έχει στοιχεία που θα διευκολύνουν την περαιτέρω ανάλυσή της. Στη συνέχεια παρουσιάζονται οι κυριότερες προσεγγίσεις κωδικοποίησης που έχουν προταθεί μέχρι σήμερα στη βιβλιογραφία. 18

35 2. Βασικές έννοιες Υδροφοβικότητα Οι περισσότερες από τις κλίμακες αριθμητικής κωδικοποίησης πρωτεϊνικών ακολουθιών που έχουν προταθεί έχουν ως βάση τους την ιδιότητα της υδροφοβικότητας (hydrophobicity) των αμινοξέων. Στη συνέχεια περιγράφονται οι σημαντικότερες από αυτές, ενώ στον Πίνακα 2.2 παρατίθενται συνοπτικά οι αριθμητικές τιμές που αντιστοιχούν σε κάθε αμινοξύ σύμφωνα με τις κλίμακες αυτές. Πίνακας 2.2 Οι αριθμητικές τιμές υδροφοβικότητας των 20 αμινοξέων για τις πιο διαδεδομένες και χρησιμοποιούμενες κλίμακες Κλίμακα υδροφοβικότητας Αμινοξύ Kyte-Doolittle (KD) Engelmann Hopp-Woods Cornette Λευκίνη (Leu) Ισολευκίνη (Ile) Ασπαραγίνη (Asn) Γλυκίνη (Gly) Βαλίνη (Val) Γλουταμινικό οξύ (Glu) Προλίνη (Pro) Ιστιδίνη (His) Λυσίνη (Lys) Αλανίνη (Ala) Τυροσίνη (Tyr) Θρυπτοφανίνη (Trp) Γλουταμίνη (Gln) Μεθειονίνη (Met) Σερίνη (Ser) Κυστεΐνη (Cys) Θρεονίνη (Thr) Φαινυλαλανίνη (Phe) Αργινίνη (Arg) Ασπαραγινκό οξύ (Asp)

36 α) Κλίμακα Kyte-Doolittle (KD): χρησιμοποιείται ως επί το πλείστον κατά τον εντοπισμό υδροφοβικών τμημάτων σε πρωτεΐνες, τόσο για τμήματα πρωτεϊνών στην επιφάνεια της κυτταρικής μεμβράνης όσο και για διαμεμβρανικά τμήματα [14]. Θετικές τιμές αντιστοιχούν σε υδροφοβικές πρωτεϊνικές περιοχές. β) Κλίμακα Engelman: αναφέρεται και ως κλίμακα GES. Πρόκειται για μια ακόμη κλίμακα πρωτεϊνικής κωδικοποίησης που χρησιμοποιείται για την πρόβλεψη της υδροφοβικότητας των πρωτεϊνών [15], με ιδιαίτερη έμφαση στα διαμεμβρανικά τμήματα των ακολουθιών αμινοξέων. γ) Κλίμακα Hopp-Woods: αναπτύχθηκε από τους Hopp και Woods για τον εντοπισμό πιθανών περιοχών αντιγόνων στις πρωτεΐνες. Πρόκειται κατά βάση για ένα δείκτη υδροφιλικότητας όπου στα μη πολωμένα αμινοξέα αποδίδονται αρνητικές αριθμητικές τιμές [16]. δ) Κλίμακα Cornette: αναπτύχθηκε ως βέλτιστη κλίμακα υδροφοβικότητας βασισμένη σε 28 δημοσιευμένες κλίμακες, κατάλληλη για την πρόβλεψη α-ελίκων στις πρωτεϊνικές ακολουθίες [17] Σχετική συχνότητα εμφάνισης Πολλές από τις ιδιότητες των πρωτεϊνών αποτυπώνονται στη συχνότητα εμφάνισης των αμινοξέων από τα οποία αυτές σχηματίζονται. Με βάση αυτή την παρατήρηση έχουν προταθεί μετασχηματισμοί ακολουθιών αμινοξέων σε αριθμητικές ακολουθίες βασισμένοι στη συχνότητα εμφάνισης των αμινοξέων μέσα στην πρωτεϊνική ακολουθία ή σε μία κατηγορία πρωτεϊνικών ακολουθιών που χαρακτηρίζονται από μία ή περισσότερες κοινές ιδιότητες ή λειτουργίες [18]. Μετασχηματισμοί αυτής της μορφής προϋποθέτουν την ύπαρξη ενός συνόλου πρωτεϊνών εκπαίδευσης (training) από το οποίο προκύπτει η απεικόνιση των χαρακτήρων σε αριθμητικές τιμές με βάση τους κανόνες που διέπουν τον εκάστοτε μετασχηματισμό [9, 19]. Στην περίπτωση των μεμβρανικών πρωτεϊνών σε έναν τέτοιο μετασχηματισμό εμπλέκονται παράμετροι όπως ο αριθμός των διαμεμβρανικών τμημάτων της πρωτεΐνης, η τοπολογία τους (θέση ως προς τη μεμβράνη), το μήκος της πρωτεΐνης και η θέση ενός αμινοξέος στην πρωτεϊνική ακολουθία[9] Δυναμικό Αλληλεπίδρασης Ιόντων Ηλεκτρονίων Η ενέργεια των ηλεκτρονίων κάθε αμινοξέος μπορεί να χρησιμοποιηθεί για την αριθμητική απεικόνισή του σε μια ακολουθία αμινοξέων. Κάθε αμινοξύ αναπαριστάται με μια σταθερά, η οποία προκύπτει ως η συνολική ενέργεια όλων των ηλεκτρονίων σθένους 20

37 2. Βασικές έννοιες αυτού. Η κλίμακα αυτή είναι γνωστή ως κλίμακα Δυναμικού Αλληλεπίδρασης Ιόντων Ηλεκτρονίων (Electron Ion Interaction Potential EIIP) [20] και παρατίθεται στον Πίνακα 2.3. Πίνακας 2.3 Οι αριθμητικές τιμές του Δυναμικού Αλληλεπίδρασης Ιόντων Ηλεκτρονίων για κάθε αμινοξύ. Αμινοξύ EIIP (Ry) Λευκίνη (Leu) Ισολευκίνη (Ile) Ασπαραγίνη (Asn) Γλυκίνη (Gly) Βαλίνη (Val) Γλουταμινικό οξύ (Glu) Προλίνη (Pro) Ιστιδίνη (His) Λυσίνη (Lys) Αλανίνη (Ala) Τυροσίνη (Tyr) Θρυπτοφανίνη (Trp) Γλουταμίνη (Gln) Μεθειονίνη (Met) Σερίνη (Ser) Κυστεΐνη (Cys) Θρεονίνη (Thr) Φαινυλαλανίνη (Phe) Αργινίνη (Arg) Ασπαραγινκό οξύ (Asp) Μέθοδοι εντοπισμού διαμεμβρανικών τμημάτων σε πρωτεΐνες Παρά τους περιορισμούς και τις συνθήκες που περιγράφονται παραπάνω, προς το παρόν δεν υπάρχει καμία μέθοδος που να είναι σε θέση να προβλέψει την 3-Δ δομή οποιασδήποτε μεμβρανικής πρωτεΐνης με μοναδικό δεδομένο την ίδια την ακολουθία αμινοξέων. Αυτό 21

38 οφείλεται αφενός στον πολύ περιορισμένο αριθμό διαθέσιμων πρωτεϊνών με υψηλή ανάλυση δομής τους και αφετέρου στο ότι η δομή των πρωτεϊνών είναι πολύ πιθανό να μην είναι στην πραγματικότητα τόσο απλή όπως περιγράφεται από τα μοντέλα που έχουν προταθεί μέχρι σήμερα για αυτή. Στην πραγματικότητα, καθώς ολοένα και περισσότερες δομές πρωτεϊνών γίνονται διαθέσιμες με πειραματικές μετρήσεις και αναλύσεις γίνεται φανερό ότι οι μεμβρανικές πρωτεΐνες παρουσιάζουν μια μεγάλη ποικιλομορφία ως προς τη δομή τους. Οι περιορισμοί ως προς το μήκος των διαμεμβρανικών τμημάτων και τις γωνίες που σχηματίζουν τα διάφορα τμήματα των ακολουθιών αμινοξέων στην 3-Δ δομή τους δεν είναι τόσο αυστηρά όσο είχε αρχικά υποτεθεί [21]. Στη συνέχεια παρουσιάζονται οι κυριότερες υπολογιστικές μέθοδοι που μπορούν να εφαρμοστούν στη μελέτη και ανάλυση μεμβρανικών πρωτεϊνών. Ορισμένες από αυτές τις προσεγγίσεις αναπτύχθηκαν αποκλειστικά για μεμβρανικές πρωτεΐνες, ενώ άλλες προσαρμόστηκαν ή απλώς μεταφέρθηκαν από τεχνικές που αρχικά είχαν στόχο τη μελέτη υδατοδιαλυτών πρωτεϊνών. Στα πρώτα στάδια ανάλυσης των μεμβρανικών πρωτεϊνών παρατηρήθηκε πως οι διαμεμβρανικές έλικες μπορούσαν να αναγνωριστούν εξετάζοντας τις ακολουθίες αμινοξέων [15, 22, 23] και πιο συγκεκριμένα, αναζητώντας αλυσίδες μήκους 20 αμινοξέων στις οποίες υπερισχύουν υδροφοβικά αμινοξέα [14]. Η πρόοδος στη μελέτη των ροπών (propensities) σε μεμβρανικές περιοχές [24, 25] καθώς επίσης και οι αναλύσεις της δομής των πρωτεϊνών οδήγησαν στη βελτίωση αυτού του απλού κανόνα ανίχνευσης. Ως παράδειγμα μπορεί να αναφερθούν τα αμφιπαθή αρωματικά αμινοξέα Θρυπτοφάνη (Trp) και Τυροσίνη (Tyr) που τείνουν να βρίσκονται στο ενδιάμεσο μεταξύ διαλύματος και μεμβράνης [25-27] και η Αργινίνη (Arg) και η Λυσίνη (Lys) τα οποία βρίσκονται σε αυξημένη αφθονία σε κυττοπλασμικούς βρόχους των βακτηριδιακών μεμβρανικών πρωτεϊνών [28]. Συνδυάζοντας τα αποτελέσματα των αναλύσεων μεμβρανικών πρωτεϊνών γνωστών δομών [27] με πειραματικές μελέτες μεμβρανικών πρωτεϊνών και με μοντέλα πεπτιδικών δεσμών [29] στάθηκε δυνατή η αναγνώριση δομικών στοιχείων που σταθεροποιούν τη συμπεριφορά μιας διαμεμβρανικής έλικας. Τέτοιου είδους παρατηρήσεις έχουν ενσωματωθεί στις περισσότερες μεθόδους ανίχνευσης διαμεμβρανικών τμημάτων, με αποτέλεσμα η αρχική αναγνώριση της σημασίας των υδροφοβικών α-ελίκων να οδηγήσει σε μια πληθώρα μεθόδων ανίχνευσης της τοπολογίας των διαμεμβρανικών τμημάτων βασισμένων στην ανάλυση των μεμβρανικών πρωτεϊνικών ακολουθιών [30]. Οι κλίμακες υδροφοβικότητας χρησιμοποιήθηκαν για πρώτη φορά πριν από 20 χρόνια. Οι Kyte και Doolittle (KD) ανέπτυξαν μια από τις πρώτες μεθόδους υπολογισμού της υδροφοβικότητας και υδροφιλικότητας μιας πρωτεΐνης από την ακολουθία αμινοξέων της 22

39 2. Βασικές έννοιες [14]. Για τον εντοπισμό των διαμεμβρανικών τμημάτων εφαρμόστηκε μια προσέγγιση κινούμενου παραθύρου στην οποία αθροιζόταν οι τιμές τις υδροφοβικότητας w διαδοχικών αμινοξέων στην αρχική ακολουθία [14]. Για την επιλογή του μήκους παραθύρου εξετάστηκε μια περιοχή τιμών w = 9 21 γειτονικών αμινοξέων, οδηγώντας στην τιμή 19 ως βέλτιστη για το διαχωρισμό μεμβρανικών από μη μεμβρανικές πρωτεΐνες. Στα πρότυπα αντίστοιχων μεθόδων της εποχής ορίστηκε ένα κατώφλι Τ, ώστε να είναι δυνατός ο χαρακτηρισμός ενός τμήματος ως διαμεμβρανικού. Στην περίπτωση που το άθροισμα της υδροφοβικότητας ξεπερνά το κατώφλι Τ το τμήμα χαρακτηρίζεται ως διαμεμβρανικό. Πιο συγκεκριμένα, οι KD πρότειναν μια τιμή κατωφλίου T > 1.6 για τη μέση τιμή παραθύρου των 19 αμινοξέων. Την ίδια περίπου χρονική περίοδο, ο Eisenberg ανέπτυξε τη ροπή υδροφοβικότητας έλικας ως μέτρο της αμφιφιλικότητας μιας έλικας. Η ροπή υδροφοβικότητας διαφέρει στα διαμεμβρανικά τμήματα των πρωτεϊνών, παρέχοντας τη δυνατότητα ανίχνευσης διαμεμβρανικών τμημάτων [31]. Βελτίωση των μεθόδων ανίχνευσης πραγματοποιήθηκε μέσα από την επεξεργασία των απλών κλιμάκων υδροφοβικότητας. Το 1985 γίνεται προσπάθεια διαμόρφωσης ενός είδους χαρακτηριστικής συνάρτησης βασισμένης στην ανάλυση υδροφοβικότητας των KD [32]. Πρόκειται για την εφαρμογή μιας δευτεροβάθμιας χαρακτηριστικής συνάρτησης στην κλίμακα υδροφοβικότητας KD, ακολουθούμενη από άθροιση σε ένα παράθυρο μήκους w = 17 διαδοχικών αμινοξέων. Οι πρωτεΐνες με τιμές μικρότερες του μηδενός χαρακτηρίζονται ως διαμεμβρανικές πρωτεΐνες. Μια αντίστοιχη διαδικασία φιλτραρίσματος της αρχικής κλίμακας ακολούθησε το 1992 από τους Nakai και Kanehisa με τη μέθοδο ALOM2 [33]. Η λογική της ALOM2 είναι πως αρχικά εκτιμάται το πλήθος των υπό θεώρηση διαμεμβρανικών τμημάτων χρησιμοποιώντας ένα χαμηλό κατώφλι με τιμή 0.5. Στη συνέχεια, ο αριθμός αυτός βελτιώνεται χρησιμοποιώντας ένα πιο αυστηρό κατώφλι με τιμή 2.0. Στο τελικό στάδιο ανάλυσης εφαρμόζεται ο κανόνας Positive Inside, ώστε να προβλεφθεί πλήρως η τοπολογία των διαμεμβρανικών τμημάτων. Ο κανόνας Positive Inside απλά δηλώνει πως τα θετικά φορτισμένα υπολείμματα (Αργινίνη και Λυσίνη) είναι άφθονα στο εσωτερικό μεμβρανών [34]. Μέθοδοι που βασίζονται αποκλειστικά στην υδροφοβικότητα εξακολουθούν να χρησιμοποιούνται, ωστόσο ένα από τα μειονεκτήματά τους είναι ότι αρκετές φορές αδυνατούν να διαχωρίσουν τις μεμβρανικές πρωτεΐνες από ιδιαίτερα υδροφοβικά τμήματα μη διαμεμβρανικών πρωτεϊνών. Η πρώτη αξιόλογη προσπάθεια χρήσης στατιστικής στην ανάλυση των διαμεμβρανικών πρωτεϊνών σημειώνεται το 1999 με τον αλγόριθμο PRED-TMR, ο οποίος χρησιμοποιεί την τυπική μορφή ανάλυσης υδροφοβικότητας, δίνοντας όμως ιδιαίτερη βαρύτητα στην 23

40 πρόβλεψη του τέλους των διαμεμβρανικών τμημάτων [35]. Χρησιμοποιώντας τα propensities (Παράρτημα Α) των αμινοξέων στην περιοχή των ορίων έναρξης και λήξης των διαμεμβρανικών τμημάτων, ο αλγόριθμος εξάγει βαθμολογίες αναφερόμενες στα άκρα των διαμεμβρανικών τμημάτων. Με βάση τις δύο βαθμολογίες των άκρων, μια τιμή υδροφοβικότητας της έλικας και την παράμετρο του μήκους της υπό εξέταση ακολουθίας ο αλγόριθμος πραγματοποιεί τη βέλτιστη ανίχνευση με τη βοήθεια μιας διαδικασίας αξιολόγησης των παραπάνω παραμέτρων. Στην προσπάθεια βελτίωσης των αλγορίθμων ανίχνευσης διαμεμβρανικών τμημάτων, αλλά με χρήση διαφορετικής λογικής, το 2001 γίνεται μια προσπάθεια απευθείας βελτίωσης των κλιμάκων υδροφοβικότητας [36]. Οι κοινά χρησιμοποιούμενες κλίμακες υδροφοβικότητας παραβλέπουν τους περιορισμούς της θερμοδυναμικής των α-ελίκων που επιβάλουν τη σταθερότητα των διαμεμβρανικών τμημάτων. Με βάση τα παραπάνω, αναπτύχθηκαν νέες κλίμακες υδροφοβικότητας που συμπεριέλαβαν και τους περιορισμούς λόγω της συνολικής συμπεριφοράς της ακολουθίας. Χαρακτηριστικά παραδείγματα αποτελούν ο αλγόριθμος TMFinder και η κλίμακα Liu- Deber στην οποία λαμβάνεται υπόψη η στατιστική συχνότητα εμφάνισης των αμινοξέων σε κατάσταση α-έλικας κατά τη διάρκεια φασματοσκοπίσης με μια διαδικασία αναφερόμενη ως κυκλικός διχρωισμός [37]. Εκτός από την παρατήρηση πως τα υδροφοβικά αμινοξέα είναι άφθονα σε διαμεμβρανικά τμήματα η διαδικασία εντοπισμού διαμεμβρανικών τμημάτων είναι δυνατό να βελτιωθεί μέσω της προτίμησης που εμφανίζουν τα αμινοξέα για καθεμία από τις καταστάσεις (διαμεμβρανικά/μη διαμεμβρανικά) σε γνωστές ακολουθίες αμινοξέων. Η διαπίστωση αυτή αποτέλεσε τη βάση των πρώτων μεθόδων προσδιορισμού της δευτεροταγούς δομής σε διαχωρισμού σφαιρικών πρωτεϊνών [38-40]. Χαρακτηριστικό παράδειγμα μεθόδου που χρησιμοποιεί στατιστικές προτιμήσεις αυτής της μορφής είναι η TMpred [41], η οποία συνδυάζει διάφορους βαθμολογικούς πίνακες για την εξαγωγή της τοπολογίας της πρωτεΐνης. Μια πιο σύνθετη από πλευράς πολυπλοκότητας λογική ακολουθείται και στον αλγόριθμο SPLIT [42, 43], όπου χρησιμοποιούνται πολλαπλές κλίμακες αμινοξέων για την πρόβλεψη διαμεμβρανικών τμημάτων. Η κλίμακα προτίμησης των αμινοξέων για την κατάσταση της διαμεμβρανικής α-έλικας υπολογίστηκε από δεδομένα διαμεμβρανικών πρωτεϊνών με κατά τμήματα γνωστή δευτεροταγή δομή. Προχωρώντας ένα βήμα περισσότερο υπολογίστηκαν τα προφίλ προτίμησης για δομές β-πτυχώσεων, στροφών και μη κανονικών δομών βασισμένα σε σύνολα υδατοδιαλυτών πρωτεϊνών. Η σύγκριση των 24

41 2. Βασικές έννοιες προφίλ με διαγράμματα υδροφοβικότητας υποδηλώνει πως τα πρώτα είναι περισσότερο ακριβή και παρέχουν μεγαλύτερη αναλυτική λεπτομέρεια και περιλαμβάνουν λιγότερο θόρυβο καθώς οι αναλύσεις υδροφοβικότητας συχνά αποτυγχάνουν να εντοπίσουν μικρότερες, ασταθείς και εύκολα κινούμενες έλικες σε πρωτεΐνες που εκτελούν λειτουργίες μεταφοράς [43]. Ένα σαφώς πιο σύνθετο σχήμα επεξεργασίας των κλιμάκων υδροφοβικότητας υλοποιήθηκε στον αλγόριθμο TopPred [28]. Ο TopPred έχει τη δυνατότητα πρόβλεψης της πλήρους τοπολογίας των μεμβρανικών πρωτεϊνών χρησιμοποιώντας ανάλυση υδροφοβικότητας, αυτόματη παραγωγή πιθανών τοπολογιών και ταξινόμησης αυτών των τοπολογιών με κριτήριο τον κανόνα Positive Inside. Αρχικά χρησιμοποιείται ένα τραπεζοειδές κυλιόμενο παράθυρο για τον εντοπισμό τμημάτων με εξαιρετικά υψηλή υδροφοβικότητα, χρησιμοποιώντας την κλίμακα GES [15]. Οι δύο βάσεις του τραπεζίου επιλέχθηκαν με μήκη 11 και 21 υπολείμματα. Το σχήμα του παραθύρου επιλέχθηκε ώστε να συνδυαστεί η πλεονεκτική μείωση θορύβου ενός τριγωνικού παραθύρου [44] με μια πιο σχετική ως προς τη φυσιολογία μείωση του ορθογώνιου παραθύρου, αναπαριστώντας το κεντρικό μη πολωμένο τμήμα της λιπιδικής διπλοστιβάδας. Στη συνέχεια επιλέγεται ένα κατώφλι με βάση το οποίο χαρακτηρίζεται ένα τμήμα ως διαμεμβρανικό ή μη. Η επιλογή του κατωφλίου αντιστοιχεί στη βέλτιστη διαφορά ανάμεσα στο πλήθος των θετικά φορτισμένων καταλοίπων εντός και εκτός της μεμβράνης. Όλες οι παραπάνω διορθώσεις και βελτιώσεις οδήγησαν σε μία από τις σημαντικότερες βελτιώσεις της ακρίβειας πρόβλεψης που υλοποιήθηκε στη μέθοδο SOSUI [45]. Η SOSUI συνδύασε μια πληθώρα φυσικοχημικών παραμέτρων για την ανίχνευση διαμεμβρανικών πρωτεϊνών. Πιο συγκεκριμένα, ο εντοπισμός των διαμεμβρανικών τμημάτων πραγματοποιείται χρησιμοποιώντας την υδροφοβικότητα KD, την αμφιφιλικότητα, σχετικά και απόλυτα φορτία και το μήκος της πρωτεΐνης. Το 1994, η διαδικασία εντοπισμού διαμεμβρανικών τμημάτων βελτιώνεται ακόμα περισσότερο με ταυτόχρονη αύξηση της πολυπλοκότητας του αλγορίθμου ανίχνευσης. Ο αλγόριθμος πρόβλεψης MEMSAT [9] υλοποιεί στατιστικούς πίνακες (λογαριθμικών πιθανοτήτων) από δεδομένα σαφώς χαρακτηρισμένων διαμεμβρανικών πρωτεϊνών, συνδυάζοντας έναν αλγόριθμό δυναμικού προγραμματισμού αναγνωρίζοντας το τοπολογικό μοντέλο της πρωτεΐνης μέσω μεγιστοποίησης της εκτίμησης. Τα υπολείμματα κατηγοριοποιούνται σε μία από πέντε κατηγορίες: L i (εντός βρόχου), L o (εκτός βρόχου), H i (εσωτερικό άκρο έλικας), H m (ενδιάμεσο τμήμα έλικας), και H o (εξωτερικό άκρο έλικας). Τα άκρα των ελίκων διατηρούν μήκος τεσσάρων διαδοχικών καταλοίπων (μια στροφή έλικας). 25

42 Η μέθοδος χρησιμοποιεί διαφορετικά propensities για κάθε αμινοξύ σε κάθε μια από τις πέντε καταστάσεις από πειραματικά σαφώς καθορισμένες μεμβρανικές πρωτεΐνες (Παράρτημα Α). Για κάθε πιθανή τοπολογία, η MEMSAT υπολογίζει μία βαθμολογία με βάση την διάταξη των διαμεμβρανικών τμημάτων στην εκάστοτε τοπολογία. Το ιδιαίτερο χαρακτηριστικό της μεθόδου είναι η χρήση ενός αλγορίθμου δυναμικού προγραμματισμού, ο οποίος πραγματοποιεί βέλτιστη σύγκριση με στοίχιση ακολουθιών κατά ζεύγη [46, 47], οδηγώντας στη βέλτιστη από μια πληθώρα πιθανών τοπολογιών, με μεγάλη επιτυχία [9]. Μέχρι το 1996 οι αυτοματοποιημένες μέθοδοι βασίζονταν στις ιδιότητες των διαμεμβρανικών τμημάτων απλών πρωτεϊνικών ακολουθιών. Από την πρόγνωση της δευτεροταγούς δομής σφαιρικών πρωτεϊνών είναι γνωστό ότι η χρήση πληροφοριών στοίχισης βελτιώνει σημαντικά την ακρίβεια πρόβλεψης [48-50]. Η PHDhtm αποτέλεσε την πρώτη μέθοδο όπου χρησιμοποιήθηκε πληροφορία από οικογένειες πρωτεϊνών για πρόβλεψη διαμεμβρανικών τμημάτων [51-53]. Στην αρχική της έκδοση η θέση και η τοπολογία των διαμεμβρανικών τμημάτων ανιχνεύονταν από ένα σύστημα νευρωνικών δικτύων [51]. Στη συνέχεια, η PHDhtm εξελίχθηκε [52, 53] με εκ των υστέρων επεξεργασία της εξόδου του νευρωνικού δικτύου μέσω ενός αλγορίθμου δυναμικού προγραμματισμού. Ο συνδυασμός διαφόρων αλγορίθμων και πληροφοριών πολλαπλής στοίχισης ακολουθιών οδήγησε στις σημερινές μεθόδους υψηλής ακρίβειας. Μια ακόμη μέθοδος στην οποία χρησιμοποιήθηκε η πολλαπλή στοίχιση ακολουθιών για τον εντοπισμό διαμεμβρανικών τμημάτων είναι η TMAP [54]. Η TMAP χρησιμοποιεί τιμές propensity που προκύπτουν από τμήματα 21 διαδοχικών αμινοξέων P m και τεσσάρων καταλοίπων για τα άκρα των διαμεμβρανικών τμημάτων P e. Υπολείμματα με υψηλές τιμές P m τείνουν να είναι υδροφοβικά ενώ αυτά με υψηλή τιμή P e βασικά και πολωμένα υπολείμματα. Η διαφορά σύστασης στα τμήματα της πρωτεΐνης που είναι εκτεθειμένα στις δύο επιφάνειες της μεμβράνης προσδιορίστηκε με τη μορφή λόγου για δώδεκα υπολείμματα Asn, Asp, Gly, Phe, Pro, Trp, Tyr και Val (στην πλειοψηφία τους στο εξωτερικό της μεμβράνης) και τα Arg, Cys και Lys (κυρίως εσωτερικά). Ο προσδιορισμός της τοπολογίας πραγματοποιείται σε συνδυασμό με πολλαπλή στοίχιση των ακολουθιών ως προς τα δώδεκα παραπάνω αμινοξέα. Ωστόσο, ένα μειονέκτημα της πολλαπλής στοίχισης ακολουθιών αμινοξέων είναι το γεγονός ότι για το 20%-30% των πρωτεϊνών δεν υπάρχουν ομόλογες ακολουθίες στις υπάρχουσες βάσεις δεδομένων [55]. Το πρόβλημα αυτό ξεπεράστηκε σε μεγάλο βαθμό από τη μέθοδο DAS (Dense Alignment Surface) [56]. Η DAS βασίζεται σε ένα πίνακα βαθμολόγησης και συγκρίνει διαγράμματα κουκίδων της υπό εξέταση ακολουθίας ως προς το σύνολο όλων των μη ομόλογων διαθέσιμων ακολουθιών. 26

43 2. Βασικές έννοιες Είναι χαρακτηριστικό πως στην πορεία βελτίωσης των αλγορίθμων πρόβλεψης διαμεμβρανικών τμημάτων χρησιμοποιήθηκαν μεθοδολογίες από διάφορα ερευνητικά πεδία και επιστημονικές περιοχές. Μια μέθοδος ανίχνευσης που επιχειρεί να αντιμετωπίσει το πρόβλημα με μια ιδιαίτερη προσέγγιση είναι η WCP1 [19], η οποία αποτελεί μια μη παραμετρική μέθοδο στηριζόμενη σε φιλτράρισμα με τη βοήθεια μετασχηματισμού κυματιδίων για τον εντοπισμό του αριθμού και της τοπολογίας των διαμεμβρανικών τμημάτων. Παράλληλα, προτείνεται η δημιουργία μιας νέας κλίμακας propensities (Παράρτημα Α) βασισμένη στα στατιστικά χαρακτηριστικά της υπό ανάλυση βάσης δεδομένων. Παρόμοια προσέγγιση πραγματοποιείται και από τον αλγόριθμο της μεθόδου wavetm [57]. Η wavetm χρησιμοποιεί την ανάλυση υδροφοβικότητας των KD με ένα παράθυρο μήκους 20 στοιχείων σε συνδυασμό με έναν αλγόριθμο δυναμικού προγραμματισμού. Η ακολουθία υδροφοβικότητας υφίσταται ένα είδος αποθορυβοποίησης μέσω του μετασχηματισμού κυματιδίων και στη συνέχεια ο αλγόριθμος δυναμικού προγραμματισμού παράγει μοντέλα με το πλήθος, το μήκος και τη θέση των διαμεμβρανικών τμημάτων. Τα σημεία του τέλους των διαμεμβρανικών τμημάτων επεκτείνονται έτσι ώστε να συμπεριλάβουν και κάποια πλευρικά υδροφοβικά αμινοξέα. Το μοντέλο με την καλύτερη αξιολόγηση επιλέγεται μεταξύ όσων ικανοποιούν τα κριτήρια που προσδιορίζονται από την υπό εξέταση πρωτεΐνη. Η λιπιδική διπλοστοιβάδα περιορίζει τη δομή των τμημάτων που διαπερνούν τη μεμβράνη με διάφορους τρόπους. Η μέθοδος TMHMM εισήγαγε μια καινοτομία δημιουργώντας μοντέλα πρόβλεψης διαμεμβρανικών προτείνων λαμβάνοντας υπόψη μια πληθώρα τέτοιων περιορισμών μέσα από συγκεκριμένη μεθοδολογία [58, 59]. Παρόμοια λογική χρησιμοποιήθηκε και από την HMMTOP [60, 61]. Οι TMHMM και HMMTOP υλοποιούν τα μοντέλα τους μέσω κρυφών Μαρκοβιανών μοντέλων (HMMs). Η TMHMM περιλαμβάνει ένα κυκλικό μοντέλο με επτά καταστάσεις για τον πυρήνα του διαμεμβρανικού τμήματος, τα άκρα και στις δύο πλευρές, τα μη διαμεμβρανικά τμήματα στην κυττοπλασμική περιοχή, δύο μη διαμεμβρανικά τμήματα στη μη κυττοπλασμική περιοχή και μια κατάσταση σφαιρικής δομής ανάμεσα σε κάθε μη διαμεμβρανικό τμήμα. Τα δύο μη διαμεμβρανικά τμήματα στη μη κυττοπλασμική πλευρά σχηματίζουν βρόχους μικρού και μεγάλου μήκους, που αντιστοιχούν σε δύο διαφορετικούς μηχανισμούς εισόδου στη μεμβράνη. Σε αντίθεση, η HMMTOP κρυφό Μαρκοβιανό μοντέλο με πέντε δομικές καταστάσεις: εσωτερικό μη διαμεμβρανικό τμήμα, εσωτερικό άκρο έλικας, διαμεμβρανική έλικα, εξωτερικό άκρο έλικας και εξωτερικό μη διαμεμβρανικό τμήμα. Εννοιολογικά το μοντέλο αυτό είναι παρόμοιο με αυτό που χρησιμοποιεί η MEMSAT [9]. Η διαφορά τους 27

44 συνίσταται στο γεγονός ότι τα άκρα των ελίκων στο δεύτερο δε θεωρείται ότι ανήκουν στο διαμεμβρανικό τμήμα [60]. Μια επιπλέον κατηγορία μεθόδων που χρησιμοποιούνται στην ανάλυση μεμβρανικών πρωτεϊνών περιλαμβάνει τις μεθόδους που στηρίζονται στη δυναμική των μορίων. Οι συγκεκριμένες μέθοδοι επιχειρούν να αναπαραστήσουν σχηματισμούς πρωτεϊνών και έχουν χρησιμοποιηθεί σε συνδυασμό με κριτήρια ελαχιστοποίησης ενέργειας για να προσομοιώσουν την αναδίπλωση πρωτεϊνών [62-67]. Στην πραγματικότητα, τόσο η μεγάλη πολυπλοκότητα των ελευθέρων παραμέτρων όσο και έλλειψη ακρίβειας για πειραματικά προσδιοριζόμενες βασικές σταθερές παρεμποδίζουν την επιτυχία τέτοιων μεθόδων. Ωστόσο, κάποιες φορές παρέχουν ακριβείς προβλέψεις για πεπτίδια μικρού μήκους όπως οι μεμβρανικές έλικες. Στο παρελθόν προσομοιώσεις μοριακής δυναμικής σε λιπώδες και υδάτινο περιβάλλον έχουν πραγματοποιηθεί για τον ακριβή προσδιορισμό των άκρων διαμεμβρανικών τμημάτων [68,69]. Ουσιαστικά, δημιουργούνται πολλά πιθανά μοντέλα και σε ελάχιστες περιπτώσεις προσδιορίζεται ένα μοναδικό μοντέλο που υπερισχύει [70]. Με την πάροδο του χρόνου και την εξέλιξη της τεχνολογίας πολλές από τις ήδη χρησιμοποιούμενες μεθόδους βελτιώθηκαν χρησιμοποιώντας αλγορίθμους που διατηρούσαν τη βασική λογική της αρχικής μεθοδολογίας επιτυγχάνοντας ταυτόχρονα καλύτερη ακρίβεια πρόβλεψης. Οι σημαντικότερες από αυτές είναι η TMHMM2 [59] και η SPLIT4 [71] οι οποίες μαζί με τις ALOM2 [33], TMPRED [41],,SOSUI [45], DAS [57], HMMTOP2 [61, 62], PHD [72], TMAP [54], TOPPRED2 [73], MEMSAT [9], MPEX [74], SPLIT4 [71], TM-FINDER [22] και wavetm [58], αποτελούν ένα σύνολο από τις πλέον αντιπροσωπευτικές μεθόδους ανίχνευσης και εντοπισμού διαμεμβρανικών τμημάτων Περιγραφή συνόλου βάσεων δεδομένων Η τεράστια συσσώρευση δεδομένων για τις ακολουθίες και δομές DNA και πρωτεϊνών τα τελευταία χρόνια οδήγησε τους ερευνητές στο να δημιουργήσουν βάσεις δεδομένων όπου θα ήταν συγκεντρωμένες και οργανωμένες όλες οι απαραίτητες πληροφορίες. Αυτό έδωσε την δυνατότητα σε βιολόγους και άλλους επιστήμονες να μπορούν να αναζητήσουν εύκολα και να συλλέξουν πληροφορίες που θα ήταν χρήσιμες στην έρευνά τους. Για το σύνολο των διαμεμβρανικών πρωτεϊνών που χρησιμοποιήθηκε στα πλαίσια της παρούσας διατριβής προηγήθηκε μελέτη τριών κυρίως βάσεων δεδομένων Swiss-Prot, PDBTM, TrEMBL και επιλέχθηκε η πρώτη με κριτήριο το είδος των πληροφοριών που περιέχει και στοιχεία που παρουσιάζονται ακολούθως, μετά από μια σύντομη περιγραφή της. 28

45 2. Βασικές έννοιες Η Swiss-Prot περιλαμβάνει στα δεδομένα της πληροφορίες που έχουν προκύψει από εργαστηριακές μεθόδους αλλά και πληροφορίες που έχουν προκύψει από υπολογιστικές μεθόδους (αλγόριθμους) για τις διάφορες ακολουθίες. Η Swiss-Prot έχει δώσει έμφαση σε τρία σημεία στην οργάνωση και δομή της βάσης. Αυτά είναι: 1) Σχολιασμός: στη Swiss-Prot όπως και σε πολλές άλλες βάσεις υπάρχουν δύο κατηγορίες δεδομένων: τα κύρια δεδομένα και τα σχόλια. Τα κύρια δεδομένα περιλαμβάνουν τις εξής πληροφορίες: Ακολουθία της πρωτεΐνης: ακολουθία αμινοξέων Βιβλιογραφικές αναφορές: δημοσιευμένες εργασίες που αναφέρονται στη δομή και σύσταση της πρωτεΐνης. Πληροφορίες ταξινόμησης: περιγραφή της βιολογικής πηγής (των οργανισμών) στους οποίους απαντάται η πρωτεΐνη. Τα σχόλια περιλαμβάνουν: Λειτουργίες της πρωτεΐνης Περιοχές και τοποθεσία τους Δευτερογενής δομή Ομοιότητες με άλλες πρωτεΐνες Ασθένειες που συσχετίζονται με διάφορες ατέλειες της πρωτεΐνης Διαφοροποιήσεις ακολουθίας και παραλλαγές. Σε κάθε εγγραφή της Swiss-Prot τα σχόλια βρίσκονται κυρίως στις γραμμές CC (comment line), KW (keyword line) και στον πίνακα των χαρακτηριστικών FT (feature table). 2) Ελαχιστοποίηση του πλεονασμού: Σε πολλές βάσεις πρωτεϊνών για μια συγκεκριμένη ακολουθία υπάρχουν περισσότερες εγγραφές. Στη Swiss-Prot έχει γίνει προσπάθεια να συγκεντρωθούν για κάθε πρωτεΐνη όλες οι πληροφορίες σε μία εγγραφή. 3) Ενοποίηση με άλλες βάσεις δεδομένων: Μέσω της Swiss-Prot γίνεται μία ενοποίηση των βάσεων δεδομένων που περιέχουν ακολουθίες (ακολουθίες νουκλεϊκών οξέων, ακολουθίες πρωτεϊνών και τριτογενής δομές των πρωτεϊνών) καθώς και κάποιων εξειδικευμένων βάσεων. Στις εγγραφές περισσότερων από 50 βάσεων δεδομένων υπάρχουν παραπομπές σε πληροφορίες της Swiss-Prot. Με αυτό το εκτεταμένο δίκτυο παραπομπών η Swiss-Prot έχει σημαντικό ρόλο στη διασύνδεση των διαφόρων βιομοριακών βάσεων δεδομένων. Στο Σχ. 2.8 παρουσιάζονται οι βάσεις δεδομένων οι οποίες συσχετίζονται με την Swiss-Prot. 29

46 Σχήμα 2.8: Διασύνδεση των διαφόρων βιομοριακών βάσεων δεδομένων μέσω της Swiss-Prot. Οι διαδικασίες αναζήτησης που προσφέρει η Swiss-Prot είναι αρκετές και παρατίθενται στη συνέχεια. Ορισμένες από αυτές είναι απλές στη χρήση ενώ άλλες είναι πιο σύνθετες, δίνοντας τη δυνατότητα για πιο εξειδικευμένη αναζήτηση: 1) Sequence Retrieval System (SRS): Η SRS είναι μια μηχανή αναζήτησης για διάφορες βάσεις δεδομένων συμπεριλαμβανομένης και της SwissProt. Δίνει τη δυνατότητα συμπλήρωσης τεσσάρων πεδίων τα οποία ανάλογα με την επιλεγμένη βάση έχουν και τις αντίστοιχες επιλογές. Μέσω του SRS μπορεί να γίνει μια σύνθετη αναζήτηση. 2) Αναζήτηση πλήρους κειμένου (Full text search): Με αυτή την επιλογή πραγματοποιείται αναζήτηση μιας λέξης ή φράσης στα δεδομένα της Swiss-Prot. 3) Προηγμένη αναζήτηση (Advanced search): Για την αναζήτηση χρησιμοποιείται το SRS και ταυτόχρονα δίνεται η δυνατότητα συμπλήρωσης τριών πεδίων: α) περιγραφή (Description), β) όνομα γονιδίου (Gene name) και γ) οργανισμός (Organism). 4) Ταξινομία (NEWT): Παρέχει τη δυνατότητα αναζήτησης σύμφωνα με την ταξινόμηση (βιολογική πηγή της πρωτεΐνης) των εγγραφών. 5) Ομοιότητα BLAST: Η μέθοδος BLAST [75] περιγράφει ουσιαστικά έναν αλγόριθμο σύγκρισης μιας συγκεκριμένης ακολουθίας με όλες τις ακολουθίες της βάσης. Ως αποτέλεσμα εξάγεται ο βαθμός ομοιότητας της ακολουθίας με κάθε μία εγγραφή της βάσης. 30

47 2. Βασικές έννοιες Το αποτέλεσμα της αναζήτησης περιλαμβάνει τις ακολουθίες με τον υψηλότερο βαθμό ομοιότητας ως προς την ακολουθία αναζήτησης. 6) Αναφορά: Γνωρίζοντας το όνομα μιας δημοσίευσης ή ενός άρθρου που αναφέρεται σε κάποια πρωτεΐνη, δίνεται η δυνατότητα αναζήτησής της σε εγγραφές της Swiss-Prot. 7) Ανάκτηση συνόλου εγγραφών: Παρέχεται η δυνατότητα αναζήτησης ενός συνόλου εγγραφών της Swiss-Prot υπό την προϋπόθεση γνώσης των κωδικών ή ονομάτων τους στη βάση δεδομένων. Οι πολλαπλοί τρόποι αναζήτησης, η διαδικτυακή διαθεσιμότητα και παροχή πληροφοριών για τις λειτουργίες που επιτελούν ή στις οποίες συμμετέχουν οι πρωτεΐνες αποτελούν καθοριστικά στοιχεία για την επιλογή της συγκεκριμένης βάση δεδομένων στις αναλύσεις και αξιολογήσεις αλγορίθμων εντοπισμού διαμεμβρανικών τμημάτων. Επιπλέον, το γεγονός ότι κάθε εγγραφή της Swiss-Prot αναφέρεται σε μία πρωτεΐνη και περιέχει στα δεδομένα της ολόκληρη την ακολουθία των αμινοξέων της πρωτεΐνης μαζί με τα απαραίτητα σχόλια, αποτελεί σημαντικό στοιχείο έναντι άλλων βάσεων δεδομένων στις οποίες οι εγγραφές αναφέρονται σε τμήματα πρωτεϊνών και όχι σε ολόκληρες πρωτεΐνες (PDB). Η εξαγωγή του συνόλου των διαμεμβρανικών πρωτεϊνών που χρησιμοποιήθηκαν και αναφέρονται στη συνέχεια πραγματοποιήθηκε από τη βάση δεδομένων της Swiss-Prot. Πιο συγκεκριμένα χρησιμοποιήθηκε η έκδοση 46.0 η οποία περιλαμβάνει πρωτεΐνες που συναντώνται στον ανθρώπινο οργανισμό. Από αυτές διαχωρίστηκε αυτόματα το σύνολο των διαμεμβρανικών πρωτεϊνών με κριτήριο τη λέξη TRANSMEM στον πίνακα των χαρακτηριστικών της κάθε πρωτεΐνης (εγγραφής). Ο παραπάνω διαχωρισμός οδήγησε σε 3109 διαμεμβρανικές πρωτεΐνες από τι οποίες 1390 περιέχουν στην ακολουθία τους μόνο ένα διαμεμβρανικό τμήμα και 1719 περιέχουν στην ακολουθία τους περισσότερα από ένα διαμεμβρανικά τμήματα. Στη συνέχεια και τα δύο υποσύνολα μειώθηκαν αποκλείοντας και από τα δύο τις όμοιες ακολουθίες, έτσι ώστε στα τελικά υποσύνολα κάθε ζεύγος ακολουθιών να έχει συντελεστή ομοιότητας ακολουθίας μικρότερο από 30%. Αυτό είχε ως αποτέλεσμα να προκύψουν τελικά 499 διαμεμβρανικές πρωτεΐνες (Σύνολο-Α) με ένα μοναδικό διαμεμβρανικό τμήμα και 484 (Σύνολο-Π) με περισσότερα από ένα. Το μήκος των διαμεμβρανικών τμημάτων στο πρώτο υποσύνολο κυμαίνεται από 10 έως 30 αμινοξέα ενώ στο δεύτερο από 8 έως 38. Επιπλέον, στο δεύτερο υποσύνολο υπάρχουν 2717 διαμεμβρανικά τμήματα και ο μεγαλύτερος αριθμός διαμεμβρανικών τμημάτων που βρέθηκε σε μία πρωτεΐνη είναι ίσος με 14. Στο Σχ. 2.9, παρουσιάζεται η κατανομή του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Α και στα Σχ και 2.11 η κατανομή του αριθμού και του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Π. 31

48 Μήκος διαμεμβρανικών τμημάτων Σχήμα 2.9: Κατανομή του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Α. Πλήθος Πλήθος Αριθμός διαμεμβρανικών τμημάτων ανά πρωτεΐνη Σχήμα 2.10: Κατανομή του πλήθους των πρωτεϊνών ως προς τον αριθμό των διαμεμβρανικών τμημάτων ανά πρωτεΐνη για το Σύνολο-Π. 32

49 2. Βασικές έννοιες Πλήθος Μήκος διαμεμβρανικών τμημάτων Σχήμα 2.11: Κατανομή του μήκους των διαμεμβρανικών τμημάτων για το Σύνολο-Π. Όπως φαίνεται χαρακτηριστικά και από το Σχ. 2.9, στο Σύνολο-Α τα περισσότερα τμήματα έχουν μήκος 21 αμινοξέα. Για την ακρίβεια 319 από τα 499 διαμεμβρανικά τμήματα έχουν μήκος 21. Επίσης, είναι φανερό από το Σχ ότι οι περισσότερες πρωτεΐνες του Συνόλου-Π περιέχουν από δύο έως οκτώ διαμεμβρανικά τμήματα και κυρίως δύο, τέσσερα και επτά διαμεμβρανικά τμήματα, ενώ λίγες είναι οι πρωτεΐνες που περιέχουν από εννιά ως 14 τμήματα. Ακόμη, από το Σχ προκύπτει, όπως και στην περίπτωση του Συνόλου-Α, ότι τα περισσότερα διαμεμβρανικά τμήματα του Συνόλου-Π έχουν μήκος 21 αμινοξέα. Για την ακρίβεια, 2067 από τα 2717 τμήματα έχουν μήκος 21. Από το αρχικό σύνολο των 1390 διαμεμβρανικών πρωτεϊνών που απαντώνται στον ανθρώπινο οργανισμό επιλέχθηκαν 117 πρωτεΐνες, οι οποίες περιλαμβάνουν μόνο πειραματικά επιβεβαιωμένα διαμεμβρανικά τμήματα. Οι πρωτεΐνες αυτές αποτέλεσαν το σύνολο πρωτεϊνών εκπαίδευσης (Σύνολο-Ε). Ο διαχωρισμός αυτών των πρωτεϊνών από το αρχικό σύνολο πραγματοποιήθηκε εξαιρώντας όσες περιελάμβαναν στα σχόλια των διαμεμβρανικών τους τμημάτων τους όρους «πιθανό» (probable) ή «ενδεχόμενο» (potential). 33

50 2.7. Διατύπωση αντικειμένου διατριβής Ο ακριβής εντοπισμός των διαμεμβρανικών τμημάτων (θέση, έναρξη, λήξη) στην ακολουθία αμινοξέων μιας πρωτεΐνης είναι σημαντικός. Σε πολλές πρωτεΐνες τα τμήματα αυτά λειτουργούν ως υποδοχείς εξωκυτταρικών σημάτων ενώ σε άλλες σχηματίζουν ένα κανάλι ανάμεσα στο εξωτερικό του κυττάρου και στο κυτταρόπλασμα. Σε κάθε περίπτωση παρουσιάζουν μία ιδιαίτερη επιλεκτικότητα, επιτρέποντας μεταξύ άλλων την είσοδο και αποχώρηση από το κύτταρο μόνο συγκεκριμένων ουσιών. Η δομή των μικρών μορίων (που περιλαμβάνουν μέχρι λίγες χιλιάδες άτομα) μπορεί να αναλυθεί χρησιμοποιώντας πυρηνική μαγνητική τομογραφία. Ωστόσο, για μεγαλύτερα μόρια η μόνη διαθέσιμη τεχνική είναι η περίθλαση ακτινών-χ (εφόσον η πρωτεΐνη μπορεί να κρυσταλλοποιηθεί). Παρά την πρόοδο που έχει σημειωθεί στις τεχνικές κρυστάλλωσης, αυτή η διαδικασία είναι συχνά δύσκολη (μερικές φορές αδύνατη) και οι κρύσταλλοι που προκύπτουν δεν έχουν πάντα την βέλτιστη ποιότητα. Αντικείμενο της παρούσας διατριβής είναι η μελέτη και ανάλυση υπολογιστικών μεθόδων εντοπισμού διαμεμβρανικών τμημάτων σε πρωτεϊνικές ακολουθίες και η κατηγοριοποίησή των τμημάτων αυτών σε ομάδες με βάση ένα σύνολο χαρακτηριστικών που περιγράφουν και διαφοροποιούν τις ομάδες αυτές μεταξύ τους. Στα πλαίσια αυτά αναπτύχθηκαν αλγόριθμοι, που σκοπό είχαν να ανιχνεύσουν τα διαμεμβρανικά τμήματα σε πρωτεΐνες και να προσδιορίσουν με όσο το δυνατό μεγαλύτερη ακρίβεια τη θέση έναρξης και λήξης τους στην ακολουθία αμινοξέων. Δόθηκε ιδιαίτερη έμφαση στο διαχωρισμό των μεθόδων ανάλυσης ανάμεσα σε πρωτεΐνες με ένα μόνο διαμεμβρανικό τμήμα (single) και σε πρωτεΐνες πολλαπλών διαμεμβρανικών τμημάτων (multiple), καθώς η διαφοροποίηση στην αντιμετώπιση των δύο αυτών κατηγοριών οδηγεί σε καλύτερα αποτελέσματα, γεγονός που δεν είχε διαπιστωθεί μέχρι σήμερα. Παράλληλα, αναπτύχθηκε ένα μοντέλο κατάταξης των διαμεμβρανικών τμημάτων σε χαρακτηριστικούς τύπους-κατηγορίες με βάση τοπολογικά και ενεργειακά χαρακτηριστικά τους. Με βάση το μοντέλο αυτό διερευνάται η σχέση της πολυπλοκότητας των εμφανιζόμενων τύπων στη φυσιολογία και τις λειτουργίες των πρωτεϊνών με ένα ή περισσότερα διαμεμβρανικά τμήματα, θέτοντας τη βάση για μια διαφορετική αντιμετώπιση των διαμεμβρανικών πρωτεϊνών και των λειτουργιών τους στο μέλλον. 34

51 Κεφάλαιο 3 3. Εντοπισμός διαμεμβρανικών τμημάτων Οι μέθοδοι ανίχνευσης διαμεμβρανικών τμημάτων έχουν αποδειχθεί εξαιρετικά χρήσιμες στην πλήρη ανάλυση των πρωτεϊνών ολόκληρων οργανισμών (proteome) και γενικότερα στην ανάλυση ακολουθιών. Παρόλο που ορισμένες μέθοδοι επιδεικνύουν καλύτερα αποτελέσματα από άλλες, είναι εξαιρετικά δύσκολο να καθοριστεί μία μόνο μέθοδος η οποία να μπορεί να θεωρηθεί άριστη σε κάθε περίπτωση. Συνήθως, πιο προηγμένες μέθοδοι διαχωρίζουν με μεγαλύτερη επιτυχία τις διαμεμβρανικές από άλλες πρωτεΐνες. Οι προσεγγίσεις που παρουσιάζονται στη συνέχεια θα μπορούσαν ενδεχομένως να επηρεάσουν την πρόοδο της βιοπληροφορικής και ειδικότερα της πρωτεομικής Διάκριση διαμεμβρανικών πρωτεϊνών Η μελέτη και ανάλυση μιας πρωτεΐνης άγνωστης τοπολογίας μπορεί να βελτιωθεί σε μεγάλο βαθμό εφόσον αναγνωριστεί εάν πρόκειται για διαμεμβρανική ή μη πρωτεΐνη. Προχωρώντας ένα βήμα περισσότερο στην περίπτωση διαμεμβρανικών πρωτεϊνών η απλή περίπτωση πρωτεϊνών με ένα μόνο διαμεμβρανικό τμήμα μπορεί να διαχωριστεί από τη γενική περίπτωση πρωτεϊνών με πολλαπλά διαμεμβρανικά τμήματα οδηγώντας σε περαιτέρω βελτίωση των μεθόδων ανάλυσης, κατά περίπτωση Διάγραμμα Q-Q Για την πραγματοποίηση του ελέγχου παρουσίας ενός τουλάχιστον διαμεμβρανικού τμήματος σε μια πρωτεΐνη είναι δυνατό να εφαρμοστεί ένα στατιστικό πείραμα, με βάση το οποίο η αριθμητική ακολουθία που έχει προκύψει από την ακολουθία αμινοξέων ( 3.2.1) διαιρείται σε τέσσερα ισοδύναμα τμήματα. Τα τμήματα αυτά εξετάζονται κατά ζεύγη και η 35

52 σχέση των κατανομών που ακολουθούν ελέγχεται ως προς τη γραμμικότητά της. Το κριτήριο αυτό προκύπτει από την παρατήρηση ότι στην περιοχή των διαμεμβρανικών τμημάτων παρατηρείται μεταβολή της κατανομής των τιμών στα δείγματα της ακολουθίας. Η απόκλιση από τη γραμμικότητα υποδηλώνει παρουσία τουλάχιστον ενός διαμεμβρανικού τμήματος στην ακολουθία. Αντίθετα, στην περίπτωση μη διαμεμβρανικών πρωτεϊνών η σχέση των κατανομών παραμένει γραμμική. Πιο συγκεκριμένα, όταν οι τιμές δύο τμημάτων ακολουθούν την ίδια ή παρόμοια κατανομή, τότε το διάγραμμα τεταρτημορίων (quantilequantile plot - QQP) παρουσιάζει την κατανομή όλων των σημείων γύρω από μία ευθεία (υποδηλώνοντας γραμμική σχέση). Διαφορετικά, εφόσον πρόκειται για δείγματα που ανήκουν και στις δύο περιοχές (διαμεμβρανικές μη διαμεμβρανικές) παρατηρείται απόκλιση από την γραμμική σχέση στην απεικόνιση QQP. Με βάση αυτή την παρατήρηση, η οποία επαληθεύτηκε και με στατιστικό έλεγχο, είναι δυνατός ο διαχωρισμός διαμεμβρανικών από μη διαμεμβρανικές πρωτεΐνες μέσω των διαγραμμάτων QQP όπως φαίνεται στο Σχ Σχήμα 3.1: Το διάγραμμα τεταρτημορίων (Q-Q) για την πρωτεΐνη HLA class I histocompatibility antigen' [SWISS-PROT ID: 1A01_HUMAN, AC: P30443]. Τα TM και NTM αντιστοιχούν στο διαμεμβρανικό και μη διαμεμβρανικό τμήμα της πρωτεΐνης, αντίστοιχα Μορφολογική Ανάλυση Η μορφολογική ανάλυση σημάτων αποτελεί μια σημαντική περιοχή της μη γραμμικής ανάλυσης συναρτήσεων που έχει αρκετές εφαρμογές στο χώρο της επεξεργασίας σήματος και του μη γραμμικού φιλτραρίσματος. Οι τελεστές μορφολογικών πράξεων αποτελούν παράλληλους ή σειριακούς συνδυασμούς μορφολογικών κλιμακώσεων και αποδομήσεων [76]. Στην περίπτωση μιας ακολουθίας N -δειγμάτων { x ( n)}, n = 1,..., N, ένα είδος μορφολογικής ανάλυσης είναι δυνατό να εφαρμοστεί συμπιέζοντας όλα τα τοπικά μέγιστα που παρουσιάζουν τιμές μικρότερες από κάποιο κατώφλι p m και ταυτόχρονα 36

53 3. Εντοπισμός διαμεμβρανικών τμημάτων ενισχύοντας τοπικά μέγιστα με τιμές στην περιοχή τιμών του ολικού μεγίστου του σήματος [77]. Περαιτέρω ενίσχυση των υψηλότερων κορυφών ως προς τις χαμηλότερες είναι δυνατό να πραγματοποιηθεί εφαρμόζοντας ένα είδος «τάνυσης» (stretching) μιας ακολουθίας a [n] n = 1,..., N, σε ένα δυναμικό εύρος τιμών p, p ]. Η ακολουθία b [n] που προκύπτει από αυτή τη διαδικασία δίνεται από τη σχέση [ low high όπου 0 a[ n] plow % a[ n] plow % b [ n] = max( a[ n]) plow% a[ n] phigh % (3.1) phigh % plow % max( a[ n]) a[ n] phigh % p, p είναι η ελάχιστη και μέγιστη ποσοστιαία τιμή που προσδιορίζουν το εύρος low high τιμών της ακολουθίας στο οποίο εφαρμόζεται ο μετασχηματισμός. Ένα παράδειγμα εφαρμογής του συγκεκριμένου αλγορίθμου σε μια ακολουθία με δύο διαμεμβρανικά τμήματα φαίνεται στο Σχ Η μετατροπή της ακολουθίας αμινοξέων χαρακτήρων σε αριθμητική ακολουθία πραγματοποιήθηκε ως γινόμενο δύο ακολουθιών που προκύπτουν από αριθμητική κωδικοποίηση της πρωτεΐνης με τη διαδικασία που περιγράφεται αναλυτικά στην 3.2. Ειδικότερα, στο πρώτο και τρίτο διάγραμμα του Σχ. 3.2 απεικονίζονται οι αριθμητικές ακολουθίες (με βάση τα propensities και την υδροφοβικότητα αντίστοιχα) που χρησιμοποιήθηκαν για την παραγωγή δύο ακολουθιών P i και H, αντίστοιχα από την αρχική ακολουθία αμινοξέων (χαρακτήρων). Στο δεύτερο και τέταρτο διάγραμμα του Σχ. 3.2 οι δύο αυτές ακολουθίες αναλύονται περαιτέρω με χρήση ενός κυλιόμενου παραθύρου M-σημείων υπολογίζοντας την κύρτωση και τη μέση τιμή κάθε σήματος στο εύρος του παραθύρου. Οι ακολουθίες που προκύπτουν δηλώνονται με Pi K 4 και H m αντίστοιχα. Το γινόμενο των δύο τελευταίων απεικονίζεται στο πέμπτο διάγραμμα του Σχ Η διάκριση μεταξύ πρωτεϊνών με ένα ή περισσότερα διαμεμβρανικά τμήματα πραγματοποιείται εφαρμόζοντας τη μορφολογική ανάλυση που παρουσιάστηκε παραπάνω. Η ανάλυση αυτή διατηρεί μόνο τις σημαντικές κορυφές και συνεπώς η ύπαρξη μίας μόνο κορυφής αντιστοιχεί σε πρωτεΐνη ενός διαμεμβρανικού τμήματος, σε αντίθεση με την περίπτωση πολλαπλών κορυφών όπου υποδηλώνεται η παρουσία περισσότερων του ενός διαμεμβρανικών τμημάτων στην πρωτεϊνική ακολουθία. 37

54 Σχήμα 3.2: Παράδειγμα εφαρμογής της μεθόδου K4HTM στην πρωτεΐνη Stromal interaction molecule 2 precursor [SWISS-PROT ID: STIM2_HUMAN, AC: Q9P246]. Το διαμεμβρανικό τμήμα δηλώνεται με έντονη μαύρη γραμμή στην περιοχή των αμινοξέων , διασχίζοντας τα πέντε πρώτα διαγράμματα με συνεχή γραμμή. Το P i αντιστοιχεί στην έξοδο του μετασχηματισμού των Pi propensities. Το K 4 αντιστοιχεί στην εκτίμηση της κύρτωσης κατά τη διέλευση του κυλιόμενου παραθύρου από την ακολουθία P i. Το H αντιστοιχεί στην έξοδο του μετασχηματισμού κωδικοποίησης υδροφοβικότητας, το H m αντιστοιχεί στη μέση τιμή του κυλιόμενου παραθύρου Pi για την ακολουθία H και το K 4 H αντιστοιχεί στο γινόμενο των K 4 και H m. Το K 4 H MF αντιστοιχεί στην ακολουθία K 4 H μετά από την εφαρμογή του φιλτραρίσματος μορφολογικής ανάλυσης και το K 4 H F αντιστοιχεί στην ακολουθία K 4 H MF μετά την εφαρμογή και του τελευταίου σταδίου της μεθόδου. Για τη μεθοδολογία βλ

55 3. Εντοπισμός διαμεμβρανικών τμημάτων 3.2. Πρωτεΐνες ενός διαμεμβρανικού τμήματος Στην προσπάθεια αντιμετώπισης του προβλήματος ανίχνευσης και εντοπισμού διαμεμβρανικών τμημάτων αναπτύχθηκαν δύο αλγόριθμοι, ο Κ4ΗΤΜ που χρησιμοποιεί την υδροφοβικότητα (Πίνακας 2.2) και τα propensities (Παράρτημα Α) σε συνδυασμό με τη Στατιστική Ανώτερης Τάξης (Παράρτημα Β), και ο CWTHTM, στον οποίο η αριθμητική ακολουθία προερχόμενη από την κλίμακα υδροφοβικότητας αναλύεται με τη βοήθεια του Συνεχούς Μετασχηματισμού Κυματιδίων (CWT Παράρτημα Γ) για τον προσδιορισμό της τοπολογίας της πρωτεϊνικής ακολουθίας. Για την τοπολογική ανάλυση των πρωτεϊνών επιχειρείται διαφορετική αντιμετώπιση για τις περιπτώσεις ακολουθιών με μοναδικό ή πολλαπλά διαμεμβρανικά τμήματα Κ4ΗΤΜ Η υδροφοβικότητα αποτέλεσε έναν από τους πρώτους μετασχηματισμούς των ακολουθιών αμινοξέων (χαρακτήρων) σε αριθμητικές ακολουθίες. Παράλληλα, η βελτίωση των αλγορίθμων πρόβλεψης διαμεμβρανικών τμημάτων με τη χρήση των propensities αποτέλεσε το βασικό ερέθισμα για την ανάπτυξη ενός αλγορίθμου ανίχνευσης, ο οποίος αποτελεί ουσιαστικά συνδυασμό των δύο μεθοδολογιών (υδροφοβικότητα propensities), με ορισμένες τροποποιήσεις, οι οποίες ενισχυόμενες από τη χρήση Στατιστικής Ανώτερης τάξης οδήγησαν στον αλγόριθμο K4HTM. Το πρώτο τμήμα του αλγορίθμου Κ4ΗΤΜ αναφέρεται στην αριθμητική κωδικοποίηση της ακολουθίας χαρακτήρων (αμινοξέων) που αποτελείται κατά κύριο λόγο από δύο μετασχηματισμούς. Ο πρώτος μετασχηματισμός περιλαμβάνει τη δημιουργία αριθμητικής ακολουθίας με εφαρμογή της κλίμακας υδροφοβικότητας KD, ενώ στον δεύτερο η μετατροπή πραγματοποιείται με τη χρήση propensities. Στο σημείο αυτό κρίνεται σκόπιμο να αναφερθεί πως τα propensities που χρησιμοποιεί η K4HTM αποτελούν προσαρμογή των ήδη προταθέντων στη βιβλιογραφία (Παράρτημα Α) στην εδική περίπτωση δύο καταστάσεων αμινοξέων: εντός και εκτός της κυτταρικής μεμβράνης (TM, NTM αντίστοιχα). Πιο συγκεκριμένα, πραγματοποιήθηκε στατιστική ανάλυση της συγκέντρωσης των αμινοξέων για το Σύνολο-Ε. Η σχετική συχνότητα εμφάνισης ενός καταλοίπου i σε ένα διαμεμβρανικό τμήμα k μήκους n (k), που ανήκει σε μία κατάσταση j υπολογίζεται ως: Ni( j) ( k) fi ( j) ( k) =, j = TM, NTM. (3.1) n( k) 39

56 Στη συνέχεια υπολογίζεται η μέση συγκέντρωση (για το σύνολο των διαμεμβρανικών τμημάτων) του καταλοίπου i σε κάθε κατάσταση, C i( j) fi( j) ( k) k Ci ( j) = N, j = TM, NTM, ( j), από τη σχέση: (3.2) όπου N ( j) είναι ο αριθμός των περιοχών της πρωτεΐνης που ανήκουν στην αντίστοιχη κατάσταση. Από την εξ. (3.2) η αριθμητικές τιμές του μετασχηματισμού propensities για κάθε αμινοξύ υπολογίζονται ως Ci( TM ) P i = 100 log (3.3) C i( NTM ) Η κλίμακα propensities που προκύπτει φαίνεται στο Σχ ΗΟ Σχήμα 3.3: Κλίμακες (A) propensity (P i ) και (B) υδροφοβικότητας (KD) που χρησιμοποιήθηκαν κατά τους μετασχηματισμούς propensities και υδροφοβικότητας από τη μέθοδο Κ4ΗΤΜ. Για την καλύτερη και πληρέστερη κατανόηση του αλγορίθμου, η περιγραφή των επόμενων βημάτων που αυτός περιλαμβάνει, πραγματοποιείται μέσα από το παράδειγμα του Σχ Πρόκειται για την εφαρμογή της Κ4ΗΤΜ στην πρωτεΐνη Natural cytotoxicity 40

57 3. Εντοπισμός διαμεμβρανικών τμημάτων triggering receptor 1 precursor, [SWISS-PROT ID: NCTR1_HUMAN, AC: O76036], η οποία περιλαμβάνει ένα διαμεμβρανικό τμήμα στην περιοχή των αμινοξέων Σχήμα 3.4: Παράδειγμα εφαρμογής της μεθόδου K4HTM στην πρωτεΐνη Natural cytotoxicity triggering receptor 1 precursor [SWISS-PROT ID: NCTR1_HUMAN, AC: O76036]. Το διαμεμβρανικό τμήμα δηλώνεται με έντονη μαύρη γραμμή στην περιοχή των αμινοξέων , διασχίζοντας όλα τα διαγράμματα με συνεχή γραμμή. Το P i αντιστοιχεί στην έξοδο του μετασχηματισμού των Pi propensities. Το K 4 αντιστοιχεί στην εκτίμηση της κύρτωσης κατά τη διέλευση του κυλιόμενου παραθύρου από την ακολουθία P i. Το H O αντιστοιχεί στην έξοδο του μετασχηματισμού κωδικοποίησης υδροφοβικότητας, το H αντιστοιχεί στη μέση τιμή του κυλιόμενου παραθύρου για Pi την ακολουθία H O και το K 4 H αντιστοιχεί στο γινόμενο των K 4 και H. Το κυλιόμενο παράθυρο που χρησιμοποιήθηκε είχε μήκος 21 σημεία και η μετατόπιση πραγματοποιήθηκε σημείο-προς-σημείο. Οι αριθμητικές ακολουθίες που προκύπτουν από τους μετασχηματισμούς υδροφοβικότητας και propensities δηλώνονται με P i και H O. Δυστυχώς δεν υπάρχει εμφανής πληροφορία σχετικά με τη θέση και το μήκος των διαμεμβρανικών τμημάτων στις υπό ανάλυση ακολουθίες (Σχ. 3.4 πρώτο και τρίτο διάγραμμα, αντίστοιχα). Για τον λόγο αυτό οι ακολουθίες P i και θέση καταλοίπου H O αναλύονται περαιτέρω χρησιμοποιώντας ένα παράθυρο 41

58 M σημείων με μετατόπιση σημείο-προς-σημείο κατά μήκος των ακολουθιών P i και H O. Στην περίπτωση της ακολουθίας H O, υπολογίζεται η μέση τιμή της υδροφοβικότητας σε κάθε θέση του παραθύρου και αντιστοιχίζεται στην έναρξη του κυλιόμενου παραθύρου με αποτέλεσμα την ακολουθία H (Σχ. 3.4 δεύτερο διάγραμμα). Με ανάλογο τρόπο όπως στην ακολουθία υδροφοβικότητας, στην περίπτωση της ακολουθίας των propensities P i, υπολογίζεται η τιμή της κύρτωσης χρησιμοποιώντας την εξ. (Β.13β) για κάθε θέση παραθύρου και αντιστοιχίζεται στην αρχή του παραθύρου. Η διαδικασία αυτή οδηγεί σε μια νέα ακολουθία, Pi K 4 (Σχ. 3.4 τέταρτο διάγραμμα). Η κύρτωση αντιπροσωπεύει τη συχνότητα εμφάνισης κορυφών ενός συνόλου δεδομένων και εκφράζεται ως λόγος της τέταρτης κεντρικής οπής προς το τετράγωνο της διασποράς (Παράρτημα Β). Θεωρώντας την απλή περίπτωση ενός ημιτονοειδούς σήματος αποδεικνύεται [78] ότι η χρήση κεντρικών ροπών περιγράφει σε πολύ μεγάλο βαθμό μικρές μεταβολές της συνάρτησης. Επιπλέον, η κύρτωση εκφράζει την απόκλιση μιας κατανομής από την Κανονική κατανομή, καθώς έχει μηδενική τιμή στην περίπτωση της τελευταίας. Τα παραπάνω, σε συνδυασμό με την παρατήρηση πως η εμφάνιση ενός διαμεμβρανικού τμήματος σε μία ακολουθία αμινοξέων εισάγει μια μεταβολή στην ακολουθία propensities, η οποία έχει άμεσο αντίκτυπο στην τιμή της κύρτωσης, υπαγορεύουν τη χρήση της κύρτωσης σε αυτό το στάδιο ανάλυσης. Εξετάζοντας τις ακολουθίες Pi K 4 και H (Σχ. 3.4), είναι φανερό πως και στις δύο περιπτώσεις παρατηρείται μία διακριτή κορυφή στην περιοχή του διαμεμβρανικού τμήματος (υπολείμματα ) σε σχέση με το υπόλοιπο τμήμα της ακολουθίας που αντιστοιχεί σε μη διαμεμβρανικά τμήματα. Η συγκεκριμένη κορύφωση είναι λιγότερο εμφανής όταν αντί της κύρτωσης χρησιμοποιηθεί η στατιστική τρίτης τάξης (λοξότητα) που δηλώνεται ως Pi K 3 στο τέταρτο διάγραμμα του Σχ Σε κάθε περίπτωση η θέση του μεγίστου δεν αντιστοιχεί σε κάποια συγκεκριμένη θέση του διαμεμβρανικού τμήματος (έναρξη/λήξη) που να συμπίπτει και για τις δύο ακολουθίες. Ωστόσο, υπολογίζοντας το γινόμενο, Pi K 4 H, των K 4 και H, το σήμα που προκύπτει παρουσιάζει μέγιστο στη σωστή θέση έναρξης της διαμεμβρανικής έλικας (υπόλειμμα 259, βλ. Σχ. 3.4 πέμπτο διάγραμμα). Η παραπάνω διαδικασία οδηγεί σε σωστή εκτίμηση της έναρξης του διαμεμβρανικού τμήματος. Η επιλογή του μήκους M του παραθύρου βασίζεται στο μέσο μήκος των διαμεμβρανικών τμημάτων που περιλαμβάνονται στο υπό ανάλυση Σύνολο-Α, και έχει την τιμή M = 21. Παρατηρήθηκε πως μικρότερες τιμές του M είχαν ως 42

59 3. Εντοπισμός διαμεμβρανικών τμημάτων αποτέλεσμα την εμφάνιση περιττών κορυφών στις ακολουθίες τιμές παρήγαγαν ομαλοποιημένα σήματα Pi K 4 και H, ενώ μεγαλύτερες Pi K 4 και H, μειώνοντας αισθητά την επιτυχία εντοπισμού της προτεινόμενης μεθόδου. Για την εκτίμηση της θέσης λήξης του διαμεμβρανικού τμήματος εφαρμόζεται στην ακολουθία K 4 H ένα παράθυρο 35-σημείων, με σημείο έναρξης το σημείο έναρξης του διαμεμβρανικού τμήματος. Σε αυτό το τμήμα της ακολουθίας υπολογίζονται οι αλλαγές πρόσημου της πρώτης παραγώγου και ως σημείο λήξης του διαμεμβρανικού τμήματος αντιστοιχίζεται η θέση στην οποία παρουσιάζεται αλλαγή πρόσημου και έχει μέγιστη δυνατή απόσταση από το σημείο έναρξης. Υπό την προϋπόθεση πως δεν ξεπερνιέται το μήκος της πρωτεϊνικής ακολουθίας το παράθυρο είναι δυνατό να επεκταθεί μέχρι το τέλος της. Το ίδιο συμβαίνει και στην περίπτωση που το τέλος της πρωτεϊνικής ακολουθίας περιλαμβάνεται στο παράθυρο ανίχνευσης, οπότε το μήκος του παραθύρου ελαττώνεται, ώστε το τέλος του να συμπίπτει με το τέλος της ακολουθίας. Στην περίπτωση που δεν παρατηρηθούν αλλαγές πρόσημου στην πρώτη παράγωγο, το μήκος του παραθύρου επεκτείνεται σε 40 σημεία και επαναλαμβάνεται η αναζήτηση σημείων αλλαγής πρόσημου της πρώτης παραγώγου. Αν και πάλι δεν εντοπιστούν αλλαγές πρόσημου ως τέλος του διαμεμβρανικού τμήματος ορίζεται το τελευταίο σημείο του παραθύρου. Για τη μέτρηση της ακρίβειας πρόβλεψης της μεθόδου Κ4ΗΤΜ ακολουθήθηκε αρχικά η μεθοδολογία που προτείνεται από τους Tusnády και Simon [60]. Με βάση αυτή καταμετρώνται αρχικά τα διαμεμβρανικά τμήματα που α) υπάρχουν πραγματικά, β) έχουν προβλεφθεί και γ) έχουν προβλεφθεί σωστά ( N, N και O P N C αντίστοιχα) σε ολόκληρο το σύνολο (Σύνολο-Α). Προϋπόθεση για να θεωρηθεί πως ένα διαμεμβρανικό τμήμα έχει προβλεφθεί σωστά είναι να υπάρχει επικάλυψη τουλάχιστον τριών αμινοξέων μεταξύ αυτού και του πραγματικού διαμεμβρανικού. των λόγων Ο συνολικός συντελεστής πρόβλεψης, N C / NO και C N P N / : Q P, υπολογίστηκε ως ο γεωμετρικός μέσος Q P N N C C = 100. (3.4) O N N P Επιπλέον, υπολογίστηκε και το πλήθος, NTM, των διαμεμβρανικών πρωτεϊνών για τις οποίες όλα τα διαμεμβρανικά τμήματα εντοπίστηκαν σωστά. Ο έλεγχος της σταθερότητας της μεθόδου Κ4ΗΤΜ πραγματοποιήθηκε υπολογίζοντας την ακρίβεια πρόβλεψης για τιμές επικάλυψης ως προς τα πραγματικά διαμεμβρανικά τμήματα οι οποίες κυμαίνονταν από 1 έως 30 αμινοξέα. Ακολουθώντας τη μεθοδολογία των Cuthbertson et al. 43

60 [2] υπολογίστηκαν ορισμένοι επιπλέον δείκτες για τον έλεγχο της ακρίβειας της μεθόδου ανά υπόλειμμα. Πιο συγκεκριμένα, υπολογίστηκαν δύο δείκτες Q 3 TM και Q 3 NTM που αντιστοιχούν στη μέση σωστή αντιστοίχηση καταλοίπου στην κατάσταση διαμεμβρανικών και μη-διαμεμβρανικών καταλοίπων, αντίστοιχα. Ακόμη, χρησιμοποιήθηκε ένας επιπλέον δείκτης, Q 3, που αντιστοιχεί στη ταξινόμηση καταλοίπων στη σωστή κατάσταση. Η αξιολόγηση της ικανότητας της μεθόδου K4HTM να προβλέψει τις θέσεις έναρξης και λήξης διαμεμβρανικών τμημάτων πραγματοποιήθηκε με χρήση της μεθοδολογίας αξιολόγησης που προτάθηκε από τον Cuthbertson et al. [2]. Σύμφωνα με αυτή, για κάθε διαμεμβρανικό τμήμα υπολογίστηκαν οι δείκτες άκρων N και C, N, C, αντίστοιχα, ορίζοντας μια τιμή ευθέως ανάλογη προς τη μετατόπιση της προβλεφθείσας θέσης άκρου N/C από την πραγματική θέση. Θετικές τιμές αντιστοιχούν σε υπερεκτίμηση, δηλαδή τα άκρα του διαμεμβρανικού τμήματος εκτιμώνται έξω από τα πραγματικά όρια του τμήματος, ενώ αρνητικές τιμές ισοδυναμούν με υποεκτίμηση, όπου η εκτίμηση των ορίων ανήκει στο εσωτερικό του διαμεμβρανικού τμήματος και συνεπώς αυτό έχει εκτιμηθεί με μήκος μικρότερο του πραγματικού. Η περίπτωση μηδενικής τιμής για τους δείκτες αντιστοιχεί σε ακριβή πρόβλεψη των ορίων. Ως συνολική τιμή αξιολόγησης για κάθε πρωτεΐνη υπολογίστηκε το συνολικό άθροισμα των N SC και C SC. Ένα παράδειγμα του παραπάνω ορισμού φαίνεται στο Σχ Το συνολικό αυτό άθροισμα κανονικοποιήθηκε ως προς τον αριθμό των σωστά εντοπισμένων τμημάτων, παρέχοντας ένα μέτρο της ακρίβειας της μεθόδου στην πρόβλεψη των άκρων των διαμεμβρανικών τμημάτων, το οποίο δηλώνεται ως TerSc. Επίσης τα αθροίσματα N SC και C SC κανονικοποιήθηκαν ως προς τον αριθμό των σωστά εκτιμηθέντων άκρων Ν και C, έχοντας ως αποτέλεσμα τους δείκτες SC SC T N SC T και CSC αντίστοιχα. Για την περαιτέρω αξιολόγηση του αλγορίθμου υπολογίστηκαν υπό μορφή ποσοστών η υπό-/υπερ-εκτίμηση και ακριβής εκτίμηση για τα άκρα Ν/C των διαμεμβρανικών τμημάτων, ως προς το σύνολο των πρωτεϊνών του Συνόλου-Α, οπότε προέκυψαν οι παράμετροι N, N, N, C, C, C, αντίστοιχα. UN OV CO UN Τα αποτελέσματα της εφαρμογής του K4HTM στο Σύνολο-Α φαίνονται στο Σχ. 3.6 και τους Πίνακες 3.1 και 3.2. Πιο συγκεκριμένα, στο πρώτο διάγραμμα του Σχ. 3.6 απεικονίζεται η κατανομή των N SC και C SC για όλες τις πρωτεΐνες του Συνόλου-Α για τις τέσσερις περισσότερο χρησιμοποιούμενες μεθόδους, οι οποίες διαθέτουν και περιβάλλον OV CO 44

61 3. Εντοπισμός διαμεμβρανικών τμημάτων υπερεκτίμηση N SC υποεκτίμηση C SC υπερεκτίμηση γνωστή δομή πρόβλεψη δομής N SC = 2 C SC = -1 TerSc = N SC + C SC = = 3 Σχήμα 3.5: Ορισμός της μέτρου της ακρίβειας εντοπισμού της έναρξης και λήξης διαμεμβρανικών τμημάτων. Το N SC δηλώνει το δείκτη άκρου Ν, ενώ το CSC τον αντίστοιχο δείκτη του άκρου C. Θετικές τιμές αντιστοιχούν σε υπερεκτίμηση. Η συνολική ακρίβεια προκύπτει από άθροισμα των απολύτων τιμών των N SC και C SC. ελέγχου των αποτελεσμάτων σε πραγματικό χρόνο μέσω διαδικτύου (SOSUI, TMHMM2, SPLIT4, WAVETM). Από το διάγραμμα αυτό είναι προφανές ότι και στις δύο περιπτώσεις οι τιμές κατανέμονται στην περιοχή κοντά στο μηδέν, όπου και παρουσιάζεται μια κορύφωση. Επίσης η απόκλιση από το μηδέν παρουσιάζει φθίνουσα πορεία και κυμαίνεται από -3 έως +3 και από -4 έως +2 για τα N SC και C SC, αντίστοιχα. Αυτές οι τιμές αποκαλύπτουν την αποδοτικότητα της μεθόδου K4HTM στο να περιορίζει το σφάλμα εκτίμησης άκρων των διαμεμβρανικών τμημάτων σε αποδεκτό εύρος. Η ικανότητα της μεθόδου K4HTM να εντοπίζει τόσο το πλήθος όσο και τη θέση όλων των διαμεμβρανικών τμημάτων που περιλαμβάνονται στο Σύνολο-Α παρουσιάζεται μέσω των αριθμητικών αποτελεσμάτων των Πινάκων 3.1 και 3.2. Οι τιμές των δεικτών αξιολόγησης της ανά διαμεμβρανικό τμήμα ικανότητας εντοπισμού ( N, N, N ), που περιλαμβάνονται στον Πίνακα 3.1 υπολογίστηκαν με την προϋπόθεση επικάλυψης τουλάχιστον τριών καταλοίπων μεταξύ του εκτιμηθέντος και του πραγματικού διαμεμβρανικού τμήματος. Με βάση αυτή την υπόθεση υπολογίζεται και ο συντελεστής πρόβλεψης Q P. Οι κατά τμήμα δείκτες ακρίβειας ανίχνευσης του Πίνακα 3.1 παρουσιάζουν το ποσοστό των σωστά χαρακτηρισμένων αμινοξέων είτε ως διαμεμβρανικά ( P C Q 3 TM TM ) είτε μηδιαμεμβρανικά ( Q 3 NTM ), με τον συντελεστή Q 3 να εκφράζει τη συνολική ακρίβεια ανίχνευσης. Όπως φαίνεται από τον Πίνακα 3.1 (πρώτη γραμμή), ο συντελεστής πρόβλεψης της μεθόδου K4HTM είναι μέγιστος (100%), δεδομένου ότι ανιχνεύθηκαν σωστά όλες οι πρωτεΐνες του Συνόλου-Α ως πρωτεΐνες με ένα μόνο διαμεμβρανικό τμήμα, με τη χρήση της πληροφορίας από την μέθοδο ελέγχου ύπαρξης διαμεμβρανικών τμημάτων σε πρωτεΐνες QQPs (βλ ). Όπως αναφέρεται και στη βιβλιογραφία [2] είναι απαραίτητο να 45

62 αναφέρονται οι τιμές τόσο για την κατάσταση διαμεμβρανικών όσο και μη-διαμεμβρανικών αμινοξέων, καθώς πολλές διαμεμβρανικές πρωτεΐνες περιλαμβάνουν εξωμεμβρανικά τμήματα πολύ μεγάλου μήκους και κατά συνέπεια υπάρχουν περισσότερα μηδιαμεμβρανικά αμινοξέα από τα διαμεμβρανικά στο σύνολο των πρωτεϊνών. Συνεπώς η ακρίβεια των μη-διαμεμβρανικών αμινοξέων αναμένεται πως θα τείνει να κυριαρχεί στον συνολικό συντελεστή ακριβείας ανίχνευσης. Αυτό γίνεται φανερό από τις τιμές του Πίνακα 3.1 (πρώτη γραμμή), όπου ο δείκτης Q 3 NTM είναι μεγαλύτερος σε σχέση με τον Q 3 TM και το συνολικό συντελεστή Q 3. Ωστόσο, σε κάθε περίπτωση η τιμές των παραπάνω δεικτών είναι μεγαλύτερες από 93.5%, με τον Q 3 = 99.68%, να παρουσιάζει τη μεγαλύτερη απόδοση για τη μέθοδο K4HTM στο σύνολο των μεθόδων. Οι συντελεστές επιτυχούς εντοπισμού των άκρων των διαμεμβρανικών τμημάτων υπολογίστηκαν για τις μεθόδους SOSUI, TMHMM2, SPLIT4, WAVETM και τα αποτελέσματα φαίνονται στον Πίνακα 3.2. Πιο συγκεκριμένα, η ανάλυση της απόδοσης υπόκαι υπερ-εκτίμησης για την περίπτωση της μεθόδου K4HTM (Πίνακας 3.2-πρώτη γραμμή) αποκαλύπτει πως η προτεινόμενη μέθοδος παρουσιάζει μια χαμηλή τιμή του συνολικού θέση ως προς την έναρξη θέση ως προς τη λήξη Σχήμα 3.6: Κατανομές των δεικτών ακριβείας εντοπισμού έναρξης, N SC, (αριστερή στήλη) και λήξης, C SC, (δεξιά στήλη) για τις μεθόδους K 4 HTM, WAVETM, SPLIT4, TMHMM2 και SOSUI. 46

63 3. Εντοπισμός διαμεμβρανικών τμημάτων Πίνακας 3.1: Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Α. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 499 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3TM ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά. Μέθοδος πρόβλεψης N P N C Q P (%) Q 3TM (%) Q 3NTM (%) Q 3 (%) N TM K 4 HTM WAVETM SPLIT TMHMM SOSUI Πίνακας 3.2: Συντελεστές επιτυχούς πρόβλεψης άκρων των διαμεμβρανικών τμημάτων για το Σύνολο-Α. Όσο πιο μικρή η τιμή του δείκτη TerSc, τόσο πιο επιτυχής η μέθοδος. Επίσης δίνονται οι τιμές των δεικτών επιτυχίας ως προς την έναρξη και λήξη, όπως επίσης και ποσοστά ορθής, υπερεκτίμησης και υποεκτίμησης των δύο άκρων. Μέθοδος πρόβλεψης TerSc T N SC T CSC % NUN % N OV % N CO % CUN % COV %CCO K 4 HTM WAVETM SPLIT TMHMM SOSUI T σκορ ( TerSc = ), το οποίο κατανέμεται κατά 41% ( N = ) και 59% T ( C = 0. 23) στην έναρξη και λήξη των διαμεμβρανικών τμημάτων αντίστοιχα. Από τον SC Πίνακα 3.2 (πρώτη γραμμή) φαίνεται μια μέτρια τάση της μεθόδου K4HTM να προβλέπει τα άκρα N και C μετά την πραγματική θέση έναρξης και πριν το πραγματικό τους τέλος N > N και C UN > COV ). Αυτό εμφανίζεται κατά πάσα πιθανότητα λόγω του γεγονότος ότι η μέθοδος K4HTM μπορεί να εντοπίσει το κύριο μέρος του διαμεμβρανικού τμήματος, όμως τείνει να χάνει τις περισσότερο πολωμένες επεκτάσεις των άκρων του διαμεμβρανικού τμήματος [79]. Ωστόσο, ανάλογη εικόνα με τις εκατοστιαίες τιμές παρουσιάζεται και στην περίπτωση υπολογισμού των υπολοίπων δεικτών εντοπισμού της ( UN OV ακριβούς θέσης των άκρων. Για την ακρίβεια, ο συντελεστής SC C CO ξεπερνάει τους C OV και C UN, ενώ ο N CO έχει τιμή κοντά στην τιμή N OV. Συνδυάζοντας τα παραπάνω αποτελέσματα με αυτά που προκύπτουν από το πρώτο διάγραμμα του Σχ. 3.6 φαίνεται πως η μέθοδος K4HTM παρουσιάζει αξιόλογη απόδοση στον εντοπισμό των άκρων των 47

64 διαμεμβρανικών τμημάτων, δεδομένου ότι τα ποσοστά των δεικτών N CO και C CO είναι συγκρίσιμα με αυτά των συντελεστών υπό- και υπερ-εκτίμησης και το σφάλμα θέσης κυμαίνεται στην περιοχή [-4, 3]. Ως ένα επιπλέον βήμα στη σύγκριση μεταξύ των μεθόδων επιχειρήθηκε η σύγκριση των πρωτεϊνών στις οποίες οι μέθοδοι παρουσιάζουν μειωμένη απόδοση. Για το λόγο αυτό πραγματοποιήθηκε ταξινόμηση των πρωτεϊνών με βάση το ποσοστό επιτυχούς εντοπισμού των διαμεμβρανικών τους τμημάτων από κάθε μέθοδο. Υπολογίζοντας τη μέση τιμή±τυπική απόκλισή του TerSc για κάθε μια από τις μεθόδους οι πρωτεΐνες του Συνόλου-Α ταξινομήθηκαν σε τρεις κατηγορίες: «δύσκολες», «συνήθεις», «εύκολες» με βάση τον αριθμό των μεθόδων (4 από τις 5, 2-3 από τις 5, 0-1 από τις 5) που παρήγαγαν TerSc υψηλότερο από τη μέση τιμή±τυπική απόκλιση του συνόλου. Το 6.2% των περιπτώσεων χαρακτηρίστηκαν ως «δύσκολες», 46.2% ως «συνήθεις» και 47.6% «εύκολες». Πρέπει επίσης να αναφερθεί ότι δεν παρουσιάστηκε περίπτωση στην οποία το παραπάνω κατώφλι να ξεπεραστεί από όλες ταυτόχρονα τις μεθόδους. Ένα παράδειγμα «δύσκολης» περίπτωσης φαίνεται στο Σχ. 3.7 όπου παρουσιάζεται η πρωτεΐνη Χονδροϊτίνη βήτα-1 (SWISS-PROT ID: CGAT1_HUMAN, SWISS-PROT AC: Q8TDX6), χαρακτηρισμένη ως άγκυρα για πρωτεΐνες τύπου II, η οποία περιλαμβάνει ένα διαμεμβρανικό τμήμα στα υπολείμματα (αμινοξέα έντονης γραφής) χωρίς πειραματικά στοιχεία. Στο ίδιο σχήμα φαίνονται και οι τιμές των NSC και C SC για κάθε μέθοδο. Οι τιμές του TerSc είναι μηδέν για την K4HTM, 7 για την SPLIT4, 9 για την WAVETM, 12 για την SOSUI και 14 για την TMHMM2. Αυτό αποδεικνύει για μια ακόμη φορά την ικανότητα της μεθόδου K4HTM να εντοπίζει επιτυχώς την ακριβή θέση των άκρων σε διαμεμβρανικά τμήματα, ακόμα και σε δύσκολες περιπτώσεις που οι υπόλοιπες μέθοδοι δεν παρουσιάζουν υψηλά ποσοστά επιτυχίας. 48

65 3. Εντοπισμός διαμεμβρανικών τμημάτων θέση καταλοίπου Σχήμα 3.7: Σύγκριση των αποτελεσμάτων πρόβλεψης των μεθόδων K4HTM, WAVETM, SPLIT4, TMHMM2 και SOSUI, μέσω εφαρμογής τους στην πρωτεΐνη Χονδροϊτίνη βήτα-1 [SWISS- PROT ID: CGAT1_HUMAN, AC: Q8TDX6], με ένα διαμεμβρανικό τμήμα στην περιοχή καταλοίπων. Το τμήμα της ακολουθίας δίνεται στο επάνω μέρος του σχήματος με έντονους χαρακτήρες. Οι κατακόρυφες στικτές γραμμές δηλώνουν τη θέση του διαμεμβρανικού τμήματος. Για κάθε μέθοδο το τμήμα που έχει προβλεφθεί ως διαμεμβρανικό δηλώνεται με μια βηματική συνάρτηση. Επίσης δίνονται και οι τιμές των δεικτών Ν SC και C SC. Η υπερεκτίμηση ή υποεκτίμηση της θέσης δηλώνονται με σκιάσεις γκρι και σκούρου γκρι χρώματος, αντίστοιχα CWTHTM Παρόλο που τα κυματίδια προέρχονται από το χώρο των μαθηματικών, έχουν βρει εφαρμογή σε αρκετά πεδία, όπως η επεξεργασία σήματος και εικόνας, η αριθμητική ανάλυση και η στατιστική. Στο χώρο της βιοπληροφορικής, και ειδικότερα της ανάλυσης πρωτεϊνών, τα κυματίδια έχουν χρησιμοποιηθεί κυρίως σε εφαρμογές αποθορυβοποίησης της ακολουθίας υδροφοβικότητας [19, 57], ανάλυσης ομοιότητας πρωτεϊνών [80] αλλά και για την πρόβλεψη της δευτεροταγούς δομής [81, 82] και αναγνώριση συγκεκριμένων μοτίβων στην πρωτεϊνική ακολουθία [83]. Μια πρώτη προσπάθεια πραγματοποιήθηκε εφαρμόζοντας το διακριτό μετασχηματισμό κυματιδίων στην αριθμητική ακολουθία των propensities, σε συνδυασμό 49

66 με προσαρμοζόμενο φιλτράρισμα των συντελεστών ανάλυσης [84]. Ωστόσο, στην προσπάθεια βελτίωσης του αλγορίθμου και ανάπτυξης μιας μεθόδου ανεξάρτητης συνόλου εκπαίδευσης, έχοντας υπόψη τις παραπάνω προσεγγίσεις, επιχειρήθηκε να αντιμετωπιστεί το πρόβλημα της ανίχνευσης και εντοπισμού των διαμεμβρανικών τμημάτων με τη χρήση του CWT (Παράτημα Γ). Για το σκοπό αυτό αναπτύχθηκε ο αλγόριθμος CWTHTM. Ο αλγόριθμος χρησιμοποιεί την αριθμητική ακολουθία υδροφοβικότητας βασισμένη στην κλίμακα KD [14] μιας πρωτεΐνης σε συνδυασμό με ορισμένα κριτήρια που προκύπτουν από τα ενεργειακά χαρακτηριστικά της για τον προσδιορισμό των ορίων του διαμεμβρανικού τμήματος. Πιο συγκεκριμένα, στην ακολουθία υδροφοβικότητας H O εφαρμόζεται ο CWT, βασισμένος στο κυματίδιο Symlet με οκτώ σημεία μηδενισμού (Sym-8, Παράρτημα Γ), η μορφή του οποίου φαίνεται στο Σχ Στη συνέχεια, στους συντελεστές του CWT σε όλες τις βαθμίδες ανάλυσης εφαρμόζεται ένα κατώφλι, ώστε να μηδενιστούν οι αρνητικές τιμές. Το επόμενο στάδιο περιλαμβάνει τη σάρωση του συνόλου των συντελεστών για έλεγχο ως προς τη συνέχεια τόσο στο χρόνο όσο και στη συχνότητα (βαθμίδα). Αυτές οι περιοχές διατηρούνται και αντιστοιχούν σε περιοχές με πιθανά διαμεμβρανικά τμήματα. Στο σημείο αυτό κρίνεται σκόπιμο να αναφερθεί πως η επιλογή του κυματιδίου της οικογένειας Symlet πραγματοποιήθηκε κατόπιν συγκριτικής ανάλυσης των κυματιδίων που είναι ήδη διαθέσιμα στη βιβλιογραφία (Παράρτημα Γ), ώστε να εκφράζονται κατά το μέγιστο βαθμό οι ιδιότητες και τα χαρακτηριστικά των διαμεμβρανικών τμημάτων. Για τον λόγο αυτό από το σύνολο των διαμεμβρανικών τμημάτων επιλέχθηκαν όσα είχαν μήκος 21 αμινοξέων (εκφράζοντας το μέσο μήκος των διαμεμβρανικών τμημάτων) και από τη μέση τους τιμή δημιουργήθηκε ένα μητρικό κυματίδιο, tm, με τα χαρακτηριστικά τους, όπως φαίνεται στο Σχ Το κυματίδιο αυτό κατασκευάστηκε, ώστε να πραγματοποιηθεί η σύγκριση των κυματιδίων των οικογενειών Daubechies (Daubechies, Παράρτημα Γ) και Symlet (Symlet, Παράρτημα Γ) με δύο, τέσσερα, έξι και οκτώ σημεία μηδενισμού και Morlet (Morlet, Παράρτημα Γ) και να επιλεγεί το κατάλληλο από αυτά για την περαιτέρω ανάλυση. Τα αποτελέσματα της συγκριτικής ανάλυσης απεικονίζοντα στον Πίνακα 3.3. Από τον πίνακα αυτό προκύπτει ότι το κυματίδιο Symlet-8 παρουσιάζει το μεγαλύτερο συντελεστή συσχέτισης (0.4) και ταυτόχρονα υψηλό συντελεστή βεβαιότητας (97.44%). Συνεπώς επιλέχθηκε ως το πλέον κατάλληλο για την περαιτέρω ανάλυση. Οι απεικονίσεις των κυριότερων κυματιδίων παρατίθενται στο τέλος του Παραρτήματος Γ. 50

67 3. Εντοπισμός διαμεμβρανικών τμημάτων Σχήμα 3.8: Το μητρικό κυματίδιο της οικογένειας Symlets με οκτώ σημεία μηδενισμού (sym8). Σχήμα 3.9: Το μητρικό κυματίδιο που προέκυψε από τη μέση τιμή των διαμεμβρανικών τμημάτων με μήκος 21 υπολλείματα από το Σύνολο-Α. Πίνακας 3.3 Συγκριτική ανάλυση των υπαρχόντων κυματιδίων με το κυματίδιο κατασκευασμένο από τα χαρακτηριστικά των διαμεμβρανικών τμημάτων με μήκος 21 καταλοίπων. Κυματίδιο Συντελεστής Ποσοστό συσχέτισης βεβαιότητας db db db db sym sym sym sym morl Η ανίχνευση του διαμεμβρανικού τμήματος πραγματοποιείται επιλέγοντας την περιοχή στην οποία παρατηρείται συνέχεια των συντελεστών CWT στο μέγιστο βαθμό όχι 51

68 μόνο ως προς το χρόνο (τμήμα ακολουθίας αμινοξέων), αλλά και ως προς τη συχνότητα (βαθμίδες). Για τον εντοπισμό της ακριβούς θέσης έναρξης και λήξης του διαμεμβρανικού τμήματος υπολογίζονται για κάθε βαθμίδα οι κανονικοποιημένες αποστάσεις έναρξης και λήξης, DSn ( a), DEn ( a), από το μέγιστο, b M (a), της συνεχούς περιοχής μη-μηδενικών συντελεστών CWT και κανονικοποιούνται ως προς τη διάρκεια, δηλαδή τη διαφορά θέσης λήξης-έναρξης σε κάθε βαθμίδα: D D Sn En b ( a) = M b ( a) = E ( a) bs ( a) Δb( a) ( a) bm ( a) Δb( a) a [ s min, smax ] (3.5α) (3.5β) όπου τα bs ( a), be ( a) αντιστοιχούν στις θέσεις έναρξης και λήξης μη-μηδενικών συντελεστών CWT για τη βαθμίδα α, Δ b( a) = be ( a) bs ( a), και τα s min και s max ορίζουν το συνεχές εύρος βαθμίδων, στο οποίο εμφανίζονται οι μη-μηδενικοί συντελεστές CWT της πρωτεϊνικής ακολουθίας. Η εξαγωγή κανόνων για την επιλογή της βαθμίδας ή των βαθμίδων που προσδιορίζουν με τον καλύτερο δυνατό τρόπο την έναρξη και τη λήξη του διαμεμβρανικού τμήματος, πραγματοποιείται μετά από τον υπολογισμό ενός επιπλέον μεγέθους που εκφράζει ουσιαστικά την κανονικοποιημένη ενέργεια, E n (a), της ακολουθίας αμινοξέων σε κάθε βαθμίδα α. Η κανονικοποιημένη ενέργεια στη βαθμίδα α, ορίστηκε ως το άθροισμα των τετραγώνων των συντελεστών του CWT στη βαθμίδα αυτή με μια κλιμάκωση ως προς το εύρος (διάρκεια) των μη-μηδενικών συντελεστών στο μήκος της ακολουθίας: pmax ( a) 1 2 E ( a) = n Wx ( a, bi ), a = 1,..., S, Δb( α) i= pmin ( a) (3.6) όπου τα p ( a ) και p ( a ) ορίζουν το εύρος, Δ b(a), της ακολουθίας στο οποίο min max εμφανίζονται οι μη-μηδενικοί συντελεστές CWT του διαμεμβρανικού τμήματος (όπως ορίστηκε και παραπάνω) και S η μέγιστη βαθμίδα ανάλυσης του CWT. Σε κάθε περίπτωση, ανάλογα με τα χαρακτηριστικά πλάτους, τα ακρότατα και τη μονοτονία των E n (a), D Sn (a) και D En (a) επιλέγεται η κατάλληλη βαθμίδα είτε από τις θέσεις των μεγίστων των D Sn (a) και (a), είτε από τις θέσεις μηδενισμού της διαφοράς τους. Ένα D En χαρακτηριστικό παράδειγμα μιας ακολουθίας υδροφοβικότητας H O, των αντίστοιχων 52

69 3. Εντοπισμός διαμεμβρανικών τμημάτων συντελεστών CWT (πριν και μετά την απομόνωση του διαμεμβρανικού τμήματος), καθώς και την προκύπτουσα κανονικοποιημένη ενέργειά του φαίνονται στο Σχ Υδροφοβικότητα Hydrophobicity Residue position θέση καταλοίπου CWT υδροφοβικότητας CWT of Hydrophobicity (α) βαθμίδες Scales εντοπισμός του CWT που αντιστοιχεί στο απλό διαμεμβρανικό τμήμα ( ) Identification of the CWT corresponding to single TM (true TM location: ) (β) Residue position θέση καταλοίπου (γ) E n (a) 0.5 (δ) a scales βαθμίδες Σχήμα 3.10: (α) Η ακολουθία υδροφοβικότητας της πρωτεΐνης Atrial natriuretic peptide receptor A precursor (Swiss-Prot ID: ANPRA_HUMAN, AC: P16066) (β) το πλάτος των αντίστοιχων συντελεστών CWT, (γ) το απομονωμένο τμήμα του (β) στην πραγματική θέση (υπολείμματα ) του διαμεμβρανικού τμήματος, (δ) η αντίστοιχη κανονικοποιημένη ενέργεια E n (a) του (γ). 53

70 Αποτελέσματα Τα αποτελέσματα της εφαρμογής του CWTHTM στο Σύνολο-Α φαίνονται στο Σχ και τον Πίνακα 3.4. Στο διάγραμμα του Σχ απεικονίζεται η κατανομή των N SC και C SC για όλες τις πρωτεΐνες του Συνόλου-Α για τη μέθοδο CWΤΗΤΜ. Από το διάγραμμα αυτό φαίνεται ότι στις περισσότερες περιπτώσεις οι τιμές, τόσο ως προς την έναρξη όσο και ως προς τη λήξη, κατανέμονται στην περιοχή κοντά στο μηδέν και ειδικότερα στο διάστημα -5 έως +5 και από -3 έως +5 για τα N SC και C SC, αντίστοιχα. Ο Πίνακας 3.4 διαφέρει από τον Πίνακα 3.1 ως προς την πρώτη γραμμή, η οποία περιλαμβάνει τα αποτελέσματα της μεθόδου CWTHTM για το Σύνολο-Α. Παρατίθεται σε αυτό το σημείο εμπλουτισμένος με τα αποτελέσματα αυτά για λόγους ευκολίας σύγκρισης. Από τις τιμές του Πίνακα 3.4 (πρώτη γραμμή), φαίνεται ότι η CWTHTM παρουσιάζει τον υψηλότερο συντελεστή πρόβλεψης (μετά την K4HTM) ( Q = 95.19% ). Επιπλέον, ο δείκτης Q 3 είναι από τους πιο υψηλούς ανάμεσα στις συγκρινόμενες μεθόδους ανίχνευσης Q 3 = 98.41%, γεγονός που απεικονίζει την υψηλή απόδοση του αλγορίθμου στην ανίχνευση διαμεμβρανικών τμημάτων σε πρωτεΐνες ενός διαμεμβρανικού τμήματος. P θέση ως προς την έναρξη θέση ως προς τη λήξη Σχήμα 3.11 Κατανομές των δεικτών ακριβείας εντοπισμού έναρξης, N SC, (αριστερή στήλη) και λήξης, C SC, (δεξιά στήλη) για τη μέθοδο CWTΗTM. Πίνακας 3.4 Πρόβλεψη αριθμού και θέσης διαμεμβρανικών τμημάτων: Σύνολο-Α. Το N P αντιστοιχεί στον αριθμό των διαμεμβρανικών τμημάτων που προβλέφθηκαν και N C είναι ο αριθμός των τμημάτων που προβλέφθηκαν σωστά από το σύνολο των 499 πραγματικών διαμεμβρανικών τμημάτων. Δείκτες ακρίβειας πρόβλεψης είναι ο συνολικός συντελεστής πρόβλεψης Q P και οι δείκτες μέσης σωστής αντιστοίχησης για όλα τα αμινοξέα (Q), για τα διαμεμβρανικά (Q 3TM ) και τα μη-διαμεμβρανικά (Q 3NTM ) αμινοξέα. Το N TM εκφράζει τον αριθμό των ακολουθιών για τις οποίες όλα τα διαμεμβρανικά τμήματα προβλέφθηκαν σωστά. Μέθοδος πρόβλεψης N P N C Q P (%) Q 3TM (%) Q 3NTM (%) Q 3 (%) N TM CWTHTM K 4 HTM WAVETM SPLIT TMHMM SOSUI

71 3. Εντοπισμός διαμεμβρανικών τμημάτων Παρόλο που η μέθοδος δεν επιτυγχάνει να ξεπεράσει την Κ4ΗΤΜ, παρουσιάζει σαφώς καλύτερες επιδόσεις σε σχέση με τις υπόλοιπες τέσσερις μεθόδους Συμπεράσματα - Αξιολόγηση αποτελεσμάτων Κατά την ανάλυση και αξιολόγηση των αλγορίθμων έγινε προσπάθεια να συμπεριληφθούν αλγόριθμοι με ποικιλία μεθοδολογιών όπως ανάλυση κυματιδίων (WAVETM) [57], στατιστική ανάλυση (SPLIT4) [71], κρυφά Μαρκοβιανά Μοντέλα (TMHMM2) [59] και ανάλυση υδροφοβικότητας (SOSUI) [45]. Αξίζει μάλιστα να σημειωθεί πως οι TMHMM2 και SPLIT4 κατατάχθηκαν ανάμεσα στις πιο σταθερές από πλευράς απόδοσης μεθόδους [2] και κατά συνέπεια κρίθηκε απαραίτητη η σύγκριση των προτεινόμενων μεθόδων με αυτές. Παρατηρώντας τα Σχ. 3.6 και 3.11 προκύπτει πως οι μέθοδοι WAVETM και SPLIT4 εμφανίζουν μεγαλύτερη διασπορά τιμών σε σύγκριση με τις υπόλοιπες μεθόδους, κυμαινόμενες στο διάστημα [-18, 8]. Ειδικότερα, ο δείκτης N SC της μεθόδου SPLIT4 κατανέμεται γύρω από την περιοχή του -2, ενώ η μέθοδος SOSUI παρουσιάζει δύο κορυφές ίδιου μεγέθους στις θέσεις -2 και 0. Είναι προφανές πως η μέθοδος TMHMM2 παρουσιάζει την πιο συγκεντρωμένη κατανομή γύρω από το μηδέν ως προς τις μεθόδους WAVETM, SPLIT4 και SOSUI. Ωστόσο, η διασπορά της είναι μεγαλύτερη από αυτή της μεθόδου K4HTM, τόσο για το N SC όσο και για το C SC. Σε ότι αφορά το συντελεστή πρόβλεψης των συγκρινόμενων μεθόδων, ο Πίνακας 3.4 δείχνει ότι οι μέθοδοι WAVETM και SOSUI ανιχνεύουν πολύ μεγαλύτερο αριθμό διαμεμβρανικών τμημάτων, με συντελεστή πρόβλεψης Q < 31.5%. Οι TMHMM2 και SPLIT4 παρουσιάζουν παρόμοια μεταξύ τους απόδοση ( Q περίπου 82%), ωστόσο αυτή είναι σαφώς μικρότερη από την αντίστοιχη των K4HTM και CWTHTM ( Q = 100% και Q P = 95.19%, αντίστοιχα Πίνακας 3.4). Το γεγονός ότι ο συντελεστής σωστής αντιστοίχησης καταλοίπων για τα μη διαμεμβρανικά αμινοξέα ( υψηλότερος από την περίπτωση των διαμεμβρανικών ( P P Q 3 TM Q 3 NTM P ) είναι σαφώς ) της K4HTM ισχύει και στις WAVETM, SPLIT4, TMHMM2, SOSUI και CWTHTM, με την TMHMM2 να διατηρεί την μεγαλύτερη τιμή Q 99.77% μεταξύ τους, ωστόσο μικρότερη από αυτή της 3 NTM = μεθόδου K4HTM (99.86%). Επιπλέον, η τιμή του Q 3 TM (93.84%) της K4HTM υπερβαίνει ξεκάθαρα αυτές των υπολοίπων μεθοδολογιών, με την WAVETM να 55

72 παρουσιάζει την υψηλότερη τιμή μεταξύ αυτών ( Q 3 TM = 81.97% ). Συνολικά η μέθοδος K4HTM παρουσιάζει τη μεγαλύτερη ακρίβεια ανά υπόλειμμα με τιμή Q 3 = 99.68% ακολουθούμενη από τις TMHMM2 και WAVETM με τιμή Q 3 = 99.17% και για τις δύο μεθόδους. Μέχρι το σημείο αυτό, κριτήριο για τη σωστή πρόβλεψη ενός διαμεμβρανικού τμήματος αποτέλεσε η επικάλυψη τριών καταλοίπων ενός πιθανού τμήματος σε σύγκριση με την πραγματική τους θέση στην ακολουθία. Ωστόσο, κρίνεται σημαντικό να εξεταστεί η ευαισθησία των δεικτών πρόβλεψης ως προς την επικάλυψη καταλοίπων, όπως προκύπτει από την επίδραση της τελευταίας στον συντελεστή πρόβλεψης Q P. Για το λόγο αυτό ο συντελεστής επικάλυψης διακυμάνθηκε από ένα έως 30 υπολείμματα και τα αποτελέσματα του ελέγχου απεικονίζονται στο διάγραμμα του Σχ Από το σχήμα αυτό φαίνεται πως η μεταβολή του συντελεστή επικάλυψης από ένα μέχρι 17 υπολείμματα έχει ελάχιστη επίδραση στην κατάταξη των μεθόδων, η οποία αρχίζει να αλλάζει σε μεγαλύτερες τιμές της επικάλυψης. Μια ενδεικτική κατάταξη των μεθόδων για την περιοχή επικάλυψης ενός έως 20 καταλοίπων είναι (κατά φθίνουσα σειρά των τιμών Q P ) K4HTM, CWTHTM, TMHMM2, SPLIT4, WAVETM και SOSUI. Ωστόσο, είναι χαρακτηριστικό πως η τιμή του συντελεστή πρόβλεψης, Q P, μειώνεται δραματικά για τιμές της επικάλυψης μεγαλύτερες από 20. Σχήμα 3.12: Ανάλυση ευαισθησίας των μεθόδων K 4 HTM, CWTHTM, TMHMM2, SPLIT4, WAVETM και SOSUI ως προς τον συντελεστή πρόβλεψης Q P συναρτήσει της μεταβολής της ελάχιστης επικάλυψης μεταξύ πραγματικών και προβλεφθέντων διαμεμβρανικών τμημάτων. 56

KΕΦΑΛΑΙΟ 1ο Χημική σύσταση του κυττάρου. Να απαντήσετε σε καθεμιά από τις παρακάτω ερωτήσεις με μια πρόταση:

KΕΦΑΛΑΙΟ 1ο Χημική σύσταση του κυττάρου. Να απαντήσετε σε καθεμιά από τις παρακάτω ερωτήσεις με μια πρόταση: KΕΦΑΛΑΙΟ 1ο Χημική σύσταση του κυττάρου Ενότητα 1.1: Χημεία της ζωής Ενότητα 2.1: Μακρομόρια Να απαντήσετε σε καθεμιά από τις παρακάτω ερωτήσεις με μια πρόταση: 1. Για ποιο λόγο θεωρείται αναγκαία η σταθερότητα

Διαβάστε περισσότερα

Τα χημικά στοιχεία που είναι επικρατέστερα στους οργανισμούς είναι: i..

Τα χημικά στοιχεία που είναι επικρατέστερα στους οργανισμούς είναι: i.. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ «XHMIKH ΣΥΣΤΑΣΗ ΤΟΥ ΚΥΤΤΑΡΟΥ» ΕΙΣΑΓΩΓΗ ΚΑΙ Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ Α. ΔΡΑΣΤΗΡΙΟΤΗΤΕΣ ΜΕΣΑ ΣΤΗΝ ΤΑΞΗ 1. Όταν αναφερόμαστε στον όρο «Χημική Σύσταση του Κυττάρου», τί νομίζετε ότι

Διαβάστε περισσότερα

Θέματα πριν τις εξετάσεις. Καλό διάβασμα Καλή επιτυχία

Θέματα πριν τις εξετάσεις. Καλό διάβασμα Καλή επιτυχία Θέματα πριν τις εξετάσεις Καλό διάβασμα Καλή επιτυχία 2013-2014 Θέματα πολλαπλής επιλογής Μετουσίωση είναι το φαινόμενο α. κατά το οποίο συνδέονται δύο αμινοξέα για τον σχηματισμό μιας πρωτεΐνης β. κατά

Διαβάστε περισσότερα

Βιολογία Β Λυκείου θέματα

Βιολογία Β Λυκείου θέματα Ι. Οι υδατάνθρακες διακρίνονται σε μονοσακχαρίτες, δισακχαρίτες και πολυσακχαρίτες. α) Να αναφέρετε από δύο παραδείγματα μονοσακχαριτών, δισακχαριτών και πολυσακχαριτών. (6μ) β) Σε ένα κύτταρο συναντώνται

Διαβάστε περισσότερα

ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ

ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ ΔΟΜΗ ΚΑΙ ΔΡΑΣΗ ΠΡΩΤΕΙΝΩΝ ΠPΩTEINEΣ Οι πρωτεΐνες παίζουν σημαντικό ρόλο σε όλες σχεδόν τις βιολογικές διεργασίες. H σημασία τους φαίνεται στις παρακάτω περιπτώσεις: 1. Κατάλυση (πχ. ένζυμα) 2. Μεταφορά

Διαβάστε περισσότερα

ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ

ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ ΜΕΤΡΗΣΗ ΤΗΣ ΓΩΝΙΑΣ φ φ Ccarbonyl n Ccarbonyl n N Cα n Ccarbonyl n-1 Cα n N φ Ccarbonyl n-1 ΜΕΤΡΗΣΗ ΤΗΣ ΓΩΝΙΑΣ ψ φ ψ Ccarbonyl n N (Ca

Διαβάστε περισσότερα

ΣΥΜΠΥΚΝΩΣΗ: αφαίρεση ενός μορίου νερού - σύνθεση ενός διμερούς ΥΔΡΟΛΥΣΗ : προσθήκη ενός μορίου νερού - διάσπαση του διμερούς στα συστατικά του

ΣΥΜΠΥΚΝΩΣΗ: αφαίρεση ενός μορίου νερού - σύνθεση ενός διμερούς ΥΔΡΟΛΥΣΗ : προσθήκη ενός μορίου νερού - διάσπαση του διμερούς στα συστατικά του ΣΥΜΠΥΚΝΩΣΗ: αφαίρεση ενός μορίου νερού - σύνθεση ενός διμερούς ΥΔΡΟΛΥΣΗ : προσθήκη ενός μορίου νερού - διάσπαση του διμερούς στα συστατικά του ΤΑ ΜΟΝΟΜΕΡΗ ΣΥΝΔΕΟΝΤΑΙ ΜΕ ΟΜΟΙΟΠΟΛΙΚΟ ΔΕΣΜΟ. 1. ΠΡΩΤΕΪΝΕΣ

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΕΙΚΟΝΑ 2.4 ΣΤΑΔΙΑ ΜΕΤΑΦΡΑΣΗΣ σ ε λ ί δ α 1 ΕΙΚΟΝΑ 4.2β ΕΡΩΤΗΣΕΙΣ 1. Να συμπληρώσετε τα κενά πλαίσια της εικόνας με την κατάλληλη λέξη ή φράση 2. Να γράψετε τον προσανατολισμό της μετακίνησης του ριβοσώματος

Διαβάστε περισσότερα

ΔΙΑΚΡΙΣΗ ΣΤΟΙΧΕΙΩΝ ΜΑΚΡΟΘΡΕΠΤΙΚΑ (C, H, N, O) 96% ΜΙΚΡΟΘΡΕΠΤΙΚΑ (πχ. Na, K, P, Ca, Mg) 4% ΙΧΝΟΣΤΟΙΧΕΙΑ (Fe, I) 0,01%

ΔΙΑΚΡΙΣΗ ΣΤΟΙΧΕΙΩΝ ΜΑΚΡΟΘΡΕΠΤΙΚΑ (C, H, N, O) 96% ΜΙΚΡΟΘΡΕΠΤΙΚΑ (πχ. Na, K, P, Ca, Mg) 4% ΙΧΝΟΣΤΟΙΧΕΙΑ (Fe, I) 0,01% ΔΙΑΚΡΙΣΗ ΣΤΟΙΧΕΙΩΝ ΜΑΚΡΟΘΡΕΠΤΙΚΑ (C, H, N, O) 96% ΜΙΚΡΟΘΡΕΠΤΙΚΑ (πχ. Na, K, P, Ca, Mg) 4% ΙΧΝΟΣΤΟΙΧΕΙΑ (Fe, I) 0,01% Ο άνθρακας, το υδρογόνο, το οξυγόνο και το άζωτο συμμετέχουν, σε σημαντικό βαθμό, στη

Διαβάστε περισσότερα

Μεταγωγή σήματος και βιολογικές μεμβράνες

Μεταγωγή σήματος και βιολογικές μεμβράνες Μεταγωγή σήματος και βιολογικές μεμβράνες ΜΕΜΒΡΑΝΙΚΕΣ ΠΡΩΤΕΪΝΕΣ ΠΡΩΤΕΪΝΕΣ ΒΙΟΛΟΓΙΚΩΝ ΜΕΜΒΡΑΝΩΝ Ορισμός / Μονάδες Δομές (πρωτοταγής κλπ) Ταξινόμηση με βάση τις λειτουργίες Απεικόνιση - Μοντέλα (συρμάτων

Διαβάστε περισσότερα

Βιολογία Γενικής Παιδείας Β Λυκείου

Βιολογία Γενικής Παιδείας Β Λυκείου Απρίλιος Μάιος 12 Βιολογία Γενικής Παιδείας Β Λυκείου Βιολογία Γενικής Παιδείας Β Λυκείου (Ερωτήσεις που παρουσιάζουν ενδιαφέρον) 1. Τι είναι τα βιομόρια και ποια είναι τα βασικά χαρακτηριστικά τους; Βιομόρια

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ

ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ 1 ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ Οι δύο πολυνουκλεοτιδικές αλυσίδες του DNA αποτελούνται από νουκλεοτίδια τα οποία ενώνονται με φωσφοδιεστερικούς δεσμούς. Πιο συγκεκριμένα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ Παύλος Αντωνίου Με μια ματιά: Εισαγωγή στη Βιολογία Ευθυγράμμιση Ακολουθιών Αναζήτηση ομοίων ακολουθιών από βάσεις δεδομενων Φυλογενετική πρόβλεψη Πρόβλεψη

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ_ Β ΛΥΚΕΙΟΥ

ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ_ Β ΛΥΚΕΙΟΥ Θα πρέπει να γνωρίζετε: Τη χημική σύσταση και τη δομή των νουκλεοτιδίων Πώς σχηματίζεται μια πολυνουκλεοτιδική αλυσίδα Πώς σταθεροποιείται η διπλή έλικα του DNA Τι υποδηλώνει ο όρος συμπληρωματικές αλυσίδες

Διαβάστε περισσότερα

τα βιβλία των επιτυχιών

τα βιβλία των επιτυχιών Τα βιβλία των Εκδόσεων Πουκαμισάς συμπυκνώνουν την πολύχρονη διδακτική εμπειρία των συγγραφέων μας και αποτελούν το βασικό εκπαιδευτικό υλικό που χρησιμοποιούν οι μαθητές των φροντιστηρίων μας. Μέσα από

Διαβάστε περισσότερα

αποτελούν το 96% κ.β Ποικιλία λειτουργιών

αποτελούν το 96% κ.β Ποικιλία λειτουργιών ΧΗΜΙΚΑ ΣΤΟΙΧΕΙΑ ΠΟΥ ΣΥΝΘΕΤΟΥΝ ΤΟΥΣ ΟΡΓΑΝΙΣΜΟΥΣ 92 στοιχεία στο φλοιό της Γης 27 απαραίτητα για τη ζωή H, Ο, Ν, C αποτελούν το 96% κ.β S, Ca, P, Cl, K, Na, Mg αποτελούν το 4% κ.β. Fe, I Ιχνοστοιχεία αποτελούν

Διαβάστε περισσότερα

Βιολογικές Μεμβράνες και Μεταγωγή Σήματος

Βιολογικές Μεμβράνες και Μεταγωγή Σήματος ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Βιολογικές Μεμβράνες και Μεταγωγή Σήματος Πρωτεΐνες Διδάσκουσα: Καθ. Μαρία - Ελένη Ε. Λέκκα Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών

Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών Βασίλης Προμπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήμιο Κύπρου Ταχ.Κιβ. 20537 1678,

Διαβάστε περισσότερα

Μόρια-κλειδιά των ζωντανών οργανισμών καθώς περιέχουν την γενετική πληροφορία Νουκλεϊκά οξέα:

Μόρια-κλειδιά των ζωντανών οργανισμών καθώς περιέχουν την γενετική πληροφορία Νουκλεϊκά οξέα: Μόρια-κλειδιά των ζωντανών οργανισμών καθώς περιέχουν την γενετική πληροφορία 1. Δεοξυριβονουκλεϊκό οξύ (DNA) Νουκλεϊκά οξέα: Φορέας της γενετικής πληροφορίας 2. Ριβονουκλεϊκό οξύ (RNA) Συμμετοχή στην

Διαβάστε περισσότερα

ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ ΒΙΒΛΙΟ ΜΟΥ (YΠΟ ΕΚ ΟΣΗ): ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ

ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ ΒΙΒΛΙΟ ΜΟΥ (YΠΟ ΕΚ ΟΣΗ): ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ ΒΙΒΛΙΟ ΜΟΥ (YΠΟ ΕΚ ΟΣΗ): ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ (Περιέχει 67 ερωτήσεις θεωρίας µε απαντήσεις, 116 ασκήσεις ανοικτού- κλειστού τύπου µε µ

Διαβάστε περισσότερα

Διπλωματική Εργασία ΕΝΤΟΠΙΣΜΟΣ ΠΕΠΤΙΔΙΟΥ ΣΗΜΑΤΟΣ ΣΕ ΔΙΑΜΕΜΒΡΑΝΙΚΕΣ ΠΡΩΤΕΪΝΕΣ ΜΕ ΕΦΑΡΜΟΓΗ ΤΟΥ ΣΥΝΕΧΟΥΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ ΚΥΜΑΤΙΔΙΩΝ

Διπλωματική Εργασία ΕΝΤΟΠΙΣΜΟΣ ΠΕΠΤΙΔΙΟΥ ΣΗΜΑΤΟΣ ΣΕ ΔΙΑΜΕΜΒΡΑΝΙΚΕΣ ΠΡΩΤΕΪΝΕΣ ΜΕ ΕΦΑΡΜΟΓΗ ΤΟΥ ΣΥΝΕΧΟΥΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ ΚΥΜΑΤΙΔΙΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ Διπλωματική Εργασία ΕΝΤΟΠΙΣΜΟΣ ΠΕΠΤΙΔΙΟΥ ΣΗΜΑΤΟΣ ΣΕ ΔΙΑΜΕΜΒΡΑΝΙΚΕΣ ΠΡΩΤΕΪΝΕΣ

Διαβάστε περισσότερα

ΔΟΜΗ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑ ΠΛΑΣΜΑΤΙΚΗΣ ΜΕΜΒΡΑΝΗΣ. Πετρολιάγκης Σταμάτης Τμήμα Γ4

ΔΟΜΗ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑ ΠΛΑΣΜΑΤΙΚΗΣ ΜΕΜΒΡΑΝΗΣ. Πετρολιάγκης Σταμάτης Τμήμα Γ4 ΔΟΜΗ ΚΑΙ ΛΕΙΤΟΥΡΓΙΑ ΠΛΑΣΜΑΤΙΚΗΣ ΜΕΜΒΡΑΝΗΣ Πετρολιάγκης Σταμάτης Τμήμα Γ4 ΕΝΝΟΙΑ ΤΗΣ ΠΛΑΣΜΑΤΙΚΗΣ ΜΕΜΒΡΑΝΗΣ Η κυτταρική μεμβράνη ή πλασματική μεμβράνη είναι η εξωτερική μεμβράνη που περιβάλλει το κύτταρο

Διαβάστε περισσότερα

Τράπεζα Θεμάτων Βιολογίας Β' Λυκείου 2014-2015 Κεφάλαιο 1 ΚΕΦΑΛΑΙΟ 1

Τράπεζα Θεμάτων Βιολογίας Β' Λυκείου 2014-2015 Κεφάλαιο 1 ΚΕΦΑΛΑΙΟ 1 ΓΗ_Β_ΒΙΟ_0_14306 - Β1 ΚΕΦΑΛΑΙΟ 1 Ι. Στην ακόλουθη εικόνα παρουσιάζονται σχηματικά δύο χημικές αντιδράσεις. Να απαντήσετε στις ερωτήσεις: α) Πώς χαρακτηρίζονται τα χημικά μόρια Α και Β; Πώς χαρακτηρίζεται

Διαβάστε περισσότερα

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο Δομή και λειτουργία πρωτεϊνών Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο Πρωτεΐνες Κύριο συστατικό κυττάρου Δομικοί λίθοι αλλά και επιτελεστές λειτουργίας κυττάρου ένζυμα, μεταφορά,

Διαβάστε περισσότερα

ΒΙΟΧΗΜΕΙΑ Ι. ΚΕΦΑΛΑΙΟ 2 ο Βιοχημική εξέλιξη

ΒΙΟΧΗΜΕΙΑ Ι. ΚΕΦΑΛΑΙΟ 2 ο Βιοχημική εξέλιξη ΒΙΟΧΗΜΕΙΑ Ι ΚΕΦΑΛΑΙΟ 2 ο Βιοχημική εξέλιξη ΣΥΝΔΕΣΗ ΜΕ ΤΑ ΠΡΟΗΓΟΥΜΕΝΑ Τι είναι ΒΙΟΧΗΜΕΙΑ DNA ΠΡΩΤΕΙΝΕΣ ΑΛΛΑ ΣΥΝΔΕΣΗ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΧΗΜΕΙΑΣ (Δεσμοί, ενέργεια, δομή) ΕΞΕΛΙΞΗ ΤΗΣ ΖΩΗΣ Υπάρχει μια συνεχή εξελικτική

Διαβάστε περισσότερα

πρωτεΐνες πολυμερείς ουσίες δομούν λειτουργούν λευκώματα 1.Απλές πρωτεΐνες 2.Σύνθετες πρωτεΐνες πρωτεΐδια μη πρωτεϊνικό μεταλλοπρωτεΐνες

πρωτεΐνες πολυμερείς ουσίες δομούν λειτουργούν λευκώματα 1.Απλές πρωτεΐνες 2.Σύνθετες πρωτεΐνες πρωτεΐδια μη πρωτεϊνικό μεταλλοπρωτεΐνες ΠΡΩΤΕΙΝΕΣ Οι πρωτεΐνες είναι πολυμερείς ουσίες με κυρίαρχο και πρωταρχικό ρόλο στη ζωή. Πρωτεΐνες είναι οι ουσίες που κυρίως δομούν και λειτουργούν τους οργανισμούς. Λέγονται και λευκώματα λόγω του λευκού

Διαβάστε περισσότερα

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ 2017-2018 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ 1. Σε ποια μορφή της αιμοσφαιρίνης συνδέεται το 2,3, BPG, ποιο είναι το ηλεκτρικό του φορτίο, με

Διαβάστε περισσότερα

Νουκλεϊκά οξέα: νήµατα και αγγελιαφόροι της ζωής

Νουκλεϊκά οξέα: νήµατα και αγγελιαφόροι της ζωής Νουκλεϊκά οξέα: νήµατα και αγγελιαφόροι της ζωής Αριστοτέλης Κωτίτσας Οι λειτουργίες των οργανισµών πραγµατοποιούνται χάρη στις πρωτεΐνες. Ο βιολογικός ρόλος των πρωτεϊνών καθορίζεται από τη µορφή τους.

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΔΙΑΓΩΝΙΣΜΑ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ 12-9-2015

ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΔΙΑΓΩΝΙΣΜΑ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ 12-9-2015 ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΔΙΑΓΩΝΙΣΜΑ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ 12-9-2015 ΘΕΜΑ Α Α1. α. in vitro β. in vivo γ. in vitro δ. in vitro Α2. γ Μεταξύ των δύο δεοξυριβονουκλεοτιδίων έχουμε συμπληρωματικότητα (Α=Τ)

Διαβάστε περισσότερα

«ΠΡΩΤΕΪΝΕΣ: ΧΗΜΙΚΗ ΔΟΜΗ ΚΑΙ ΒΙΟΛΟΓΙΚΟΣ ΡΟΛΟΣ»

«ΠΡΩΤΕΪΝΕΣ: ΧΗΜΙΚΗ ΔΟΜΗ ΚΑΙ ΒΙΟΛΟΓΙΚΟΣ ΡΟΛΟΣ» «ΠΡΩΤΕΪΝΕΣ: ΧΗΜΙΚΗ ΔΟΜΗ ΚΑΙ ΒΙΟΛΟΓΙΚΟΣ ΡΟΛΟΣ» Τι είναι οι πρωτεΐνες; Από τι αποτελούνται; Ποιος είναι ο βιολογικός του ρόλος; Ας ρίξουμε μία ματιά σε όλα αυτά τα ερωτήματα που μας απασχολούν ΚΕΦΑΛΑΙΟ 1:

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ.-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ.-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ.-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ 1. Τοποθετείστε στο διάγραμμα που ακολουθεί, τους όρους: σύνθεση, υδρόλυση, μακρομόριο, μονομερή. Ερμηνεύστε το διάγραμμα. Η -Q-

Διαβάστε περισσότερα

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading Άσκηση 7 Προσομοίωση 3D Δομών Βιομορίων μέσω Ομολογίας & Threading Προσομοίωση 2ταγούς δομής πρωτεϊνών Δευτεροταγής Δομή: Η 2ταγής δομή των πρωτεϊνών είναι σταθερή τοπική διαμόρφωση της πολυπεπτιδικής

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ_ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ_ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΕΙΚΟΝΑ_1.1 In vivo πειράματα απόδειξης της έννοιας του μετασχηματισμού και in vitro απόδειξη ότι το DNA είναι αυτό που προκαλεί το μετασχηματισμό. ΕΡΩΤΗΣΕΙΣ 1. Γιατί πιστεύετε ότι θανατώνονται τα βακτήρια

Διαβάστε περισσότερα

ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ

ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ ΚΕΦΑΛΑΙΟ 2 ο 1. Με ποιο μηχανισμό αντιγράφεται το DNA σύμφωνα με τους Watson και Crick; 2. Ένα κύτταρο που περιέχει ένα μόνο χρωμόσωμα τοποθετείται σε θρεπτικό υλικό που περιέχει ραδιενεργό

Διαβάστε περισσότερα

Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ. Καρβουντζή Ηλιάνα Βιολόγος

Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ. Καρβουντζή Ηλιάνα Βιολόγος Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ Χημικά στοιχεία που συνθέτουν τους οργανισμούς Ο C, το H 2, το O 2 και το N 2 είναι τα επικρατέστερα στους οργανισμούς σε ποσοστό 96% κ.β. Γιατί; Συμμετέχουν σε σημαντικό βαθμό στη σύνθεση

Διαβάστε περισσότερα

Δομικές κατηγορίες πρωτεϊνών

Δομικές κατηγορίες πρωτεϊνών 3-1 Κεφάλαι ο Δομικές κατηγορίες πρωτεϊνών 3.1. α-δομές πρωτεϊνών Οι α-έλικες είναι δομικά στοιχεία που μπορούν να σχηματίσουν πολλές κατηγορίες στερεοδομών και με πολλές διαφορετικές λειτουργίες. Εκτός

Διαβάστε περισσότερα

Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν;

Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν; Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν; Γενικά Για να προσδιορίσουμε τα 30 πρόδρομα μόρια των βιομακρομορίων θα πρέπει

Διαβάστε περισσότερα

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΕΙΣ 4 & 5 (29/2 & 2/3/2016)

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΕΙΣ 4 & 5 (29/2 & 2/3/2016) Kυτταρική Bιολογία ΔIAΛEΞΕΙΣ 4 & 5 (29/2 & 2/3/2016) ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ Οι λιπιδικές διπλοστιβάδες λειτουργούν ως φραγμοί Νερό Υδρόφιλες φωσφολιπιδικές κεφαλές

Διαβάστε περισσότερα

ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: 1 ΗΜΕΡΟΜΗΝΙΑ: 21 / 09 /2014

ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: 1 ΗΜΕΡΟΜΗΝΙΑ: 21 / 09 /2014 ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: 1 ΗΜΕΡΟΜΗΝΙΑ: 21 / 09 /2014 ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Για τις ερωτήσεις Α1 έως και Α3 να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης και δίπλα το γράμμα

Διαβάστε περισσότερα

ΘΕΜΑ 1ο Α. Στις ερωτήσεις 1-5, να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης και δίπλα το γράμμα που αντιστοιχεί στη σωστή απάντηση.

ΘΕΜΑ 1ο Α. Στις ερωτήσεις 1-5, να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης και δίπλα το γράμμα που αντιστοιχεί στη σωστή απάντηση. ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γʹ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 20 ΙΟΥΝΙΟΥ 2000 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ : ΒΙΟΛΟΓΙΑ ΘΕΜΑ 1ο Α. Στις ερωτήσεις 1-5, να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης

Διαβάστε περισσότερα

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 ΙΟΥΝΙΟΥ 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 ΙΟΥΝΙΟΥ 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 ΙΟΥΝΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΘΕΜΑ Α Α1. δ Α2. δ Α3. β Α4. γ Α5. α ΘΕΜΑ B B1. I Α II Ε III

Διαβάστε περισσότερα

ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΟΥ ΚΥΤΤΑΡΟΥ. Τα χημικά μόρια που οικοδομούν τους οργανισμούς

ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΟΥ ΚΥΤΤΑΡΟΥ. Τα χημικά μόρια που οικοδομούν τους οργανισμούς ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΟΥ ΚΥΤΤΑΡΟΥ Τα χημικά μόρια που οικοδομούν τους οργανισμούς Μελέτη φαινομένου της ζωής o Η μελέτη του φαινομένου της ζωής ξεκινά από το μοριακό επίπεδο δηλαδή από τα χημικά μόρια που οικοδομούν

Διαβάστε περισσότερα

Βιολογία Γ Γενικού Λυκείου Θετικής κατεύθυνσης. Κεφάλαιο 1α Το Γενετικό Υλικό

Βιολογία Γ Γενικού Λυκείου Θετικής κατεύθυνσης. Κεφάλαιο 1α Το Γενετικό Υλικό Βιολογία Γ Γενικού Λυκείου Θετικής κατεύθυνσης Κεφάλαιο 1α Το Γενετικό Υλικό Το DNA είναι το γενετικό υλικό Αρχικά οι επιστήμονες θεωρούσαν ότι οι πρωτεΐνες αποτελούσαν το γενετικό υλικό των οργανισμών.

Διαβάστε περισσότερα

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA ΓΥΜΝΑΣΙΟ ΚΕΡΑΤΕΑΣ ΕΡΓΑΣΙΑ ΒΙΟΛΟΓΙΑΣ Β ΤΡΙΜΗΝΟΥ Γ 4 23.1.12 ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA ΕΡΓΑΣΤΗΚΑΝ: ΑΛΕΞΑΝΔΡΟΣ ΔΕΛΗΜΙΧΑΛΗΣ ΑΡΤΕΜΗΣ ΑΝΑΣΤΑΣΙΑΔΗΣ 1 ΕΙΣΑΓΩΓΗ Το δεοξυριβονουκλεϊκό οξύ (Deoxyribonucleic acid -

Διαβάστε περισσότερα

Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία)

Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία) Βιοτεχνολογία Φυτών ΔΠΘ / Τμήμα Αγροτικής Ανάπτυξης ΠΜΣ Αειφορικά Συστήματα Παραγωγής και Περιβάλλον στη Γεωργία Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία) Αριστοτέλης Χ. Παπαγεωργίου Εργαστήριο

Διαβάστε περισσότερα

ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013

ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013 ΜΑΘΗΜΑ / ΤΑΞΗ : ΧΗΜΕΙΑ ΒΙΟΧΗΜΕΙΑ / Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013 ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ Α Για τις ερωτήσεις Α1 έως Α3 να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης και δίπλα το γράμμα που αντιστοιχεί

Διαβάστε περισσότερα

Χαρίλαος Μέγας Ελένη Φωτάκη Ελευθέριος Νεοφύτου

Χαρίλαος Μέγας Ελένη Φωτάκη Ελευθέριος Νεοφύτου Χαρίλαος Μέγας Ελένη Φωτάκη Ελευθέριος Νεοφύτου Απαντήσεις στις ερωτήσεις: Πρόλογος Το βιβλίο αυτό γράφτηκε για να βοηθήσει το μαθητή της Γ Γυμνασίου στην κατανόηση των θεμελιωδών γνώσεων της Βιολογίας

Διαβάστε περισσότερα

ΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ

ΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΚΕΦΑΛΑΙΟ 1: Το γενετικό υλικό ΘΕΜΑ: 1 ο (Μονάδες 25 ) Να επιλέξετε τη σωστή απάντηση στις παρακάτω ερωτήσεις. 1. Το πείραµα των Hershey και Chase ήταν:

Διαβάστε περισσότερα

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΠΕΡΙΓΡΑΜΜΑ 2.1 ΒΑΣΙΚΑ ΟΡΓΑΝΙΚΑ ΜΟΡΙΑ ΧΡΗΣΙΜΟΠΟΙΟΥΝΤΑΙ ΑΠΌ ΤΟΥΣ ΖΩΝΤΕΣ ΟΡΓΑΝΙΣΜΟΥΣ 2.2 Η ΕΞΕΛΙΞΗ ΧΡΕΙΑΖΕΤΑΙ ΑΝΑΠΑΡΑΓΩΓΗ, ΠΟΙΚΙΛΟΜΟΡΦΙΑ, ΚΑΙ ΕΞΕΛΙΚΤΙΚΗ ΠΙΕΣΗ 2.3 ΕΝΕΡΓΕΙΑΚΟΙ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΕΊΝΑΙ ΑΠΑΡΑΙΤΗΤΟΙ

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β ΘΕΜΑ Α Α1. β Α2. γ Α3. δ Α4. γ Α5. β 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 10 ΣΕΠΤΕΜΒΡΙΟΥ 2014 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:

Διαβάστε περισσότερα

Κυτταρική Βιολογία. Ενότητα 08 : Βιολογικές μεμβράνες, μεμβρανικά διαμερίσματα, μεταφορά πρωτεϊνών Παναγιωτίδης Χρήστος Τμήμα Φαρμακευτικής ΑΠΘ

Κυτταρική Βιολογία. Ενότητα 08 : Βιολογικές μεμβράνες, μεμβρανικά διαμερίσματα, μεταφορά πρωτεϊνών Παναγιωτίδης Χρήστος Τμήμα Φαρμακευτικής ΑΠΘ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Κυτταρική Βιολογία Ενότητα 08 : Βιολογικές μεμβράνες, μεμβρανικά διαμερίσματα, μεταφορά πρωτεϊνών Παναγιωτίδης Χρήστος Φαρμακευτικής ΑΠΘ

Διαβάστε περισσότερα

8. Σε στέλεχος του βακτηρίου E.coli δε λειτουργεί το γονίδιο που παράγει τον καταστολέα του οπερόνιου της λακτόζης. Ποιο είναι το αποτέλεσμα σε σχέση

8. Σε στέλεχος του βακτηρίου E.coli δε λειτουργεί το γονίδιο που παράγει τον καταστολέα του οπερόνιου της λακτόζης. Ποιο είναι το αποτέλεσμα σε σχέση Γονιδιακή ρύθμιοη 1. Εντοπίστε δύο διαφορές στον έλεγχο της γονιδιακής έκφρασης ανάμεσα στους προκαρυωτικούς και στους ευκαρυωτικούς οργανισμούς. Α. Η ρύθμιση της γσνιδιακής έκφρασης στους προκαρυωτικούς

Διαβάστε περισσότερα

Πανεπιστήμιο Θεσσαλίας Τμήμα βιοχημείας και βιοτεχνολογίας

Πανεπιστήμιο Θεσσαλίας Τμήμα βιοχημείας και βιοτεχνολογίας Πανεπιστήμιο Θεσσαλίας Τμήμα βιοχημείας και βιοτεχνολογίας Διδακτική με έμφαση στις βιοεπιστήμες Μαρία Ευαγγελία Βασιλογιάννη Στοιχεία Μαθήματος 1. Μάθημα : Βιολογία 2. Τίτλος ενότητας: Η ροή της γενετικής

Διαβάστε περισσότερα

Ποιος είναι ο ρόλος των πρωτεϊνών στα κύτταρα και ποιες είναι οι δομικές τους μονάδες;

Ποιος είναι ο ρόλος των πρωτεϊνών στα κύτταρα και ποιες είναι οι δομικές τους μονάδες; Ποιος είναι ο ρόλος των πρωτεϊνών στα κύτταρα και ποιες είναι οι δομικές τους μονάδες; Οι πρωτεΐνες αποτελούν δομικά ή λειτουργικά συστατικά των κυττάρων και δομούνται από απλούστερες ενώσεις, τα αμινοξέα.

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2. Η σύσταση των κυττάρων

ΚΕΦΑΛΑΙΟ 2. Η σύσταση των κυττάρων ΚΕΦΑΛΑΙΟ 2 Η σύσταση των κυττάρων Τα μόρια των κυττάρων Νερό Υδατάνθρακες Λιπίδια Νουκλεϊκά οξέα Πρωτεΐνες Νερό Νερό: ένα μόριο με πολικότητα 1: 554 million Copyright 2002 Pearson Education, Inc., publishing

Διαβάστε περισσότερα

ΤΟ DNA ΚΑΙ RNA. Θανος Εξαρχου Γ1

ΤΟ DNA ΚΑΙ RNA. Θανος Εξαρχου Γ1 ΤΟ DNA ΚΑΙ RNA Θανος Εξαρχου Γ1 ΤΟ DNA Το δε(σ)οξυριβο(ζο)νουκλεϊ(νι)κό οξu είναι νουκλεϊκό οξύ που περιέχει τις γενετικές πληροφορίες που καθορίζουν τη βιολογική ανάπτυξη όλων των κυτταρικών μορφών ζωής

Διαβάστε περισσότερα

ΠΡΩΤΕΪΝΕΣ. Φατούρος Ιωάννης Αναπληρωτής Καθηγητής

ΠΡΩΤΕΪΝΕΣ. Φατούρος Ιωάννης Αναπληρωτής Καθηγητής ΠΡΩΤΕΪΝΕΣ Φατούρος Ιωάννης Αναπληρωτής Καθηγητής Θέματα Διάλεξης Δομή, αριθμός και διαχωρισμός των αμινοξέων Ένωση αμινοξέων με τον πεπτιδικό δεσμό για τη δημιουργία πρωτεΐνης Λειτουργίες των πρωτεϊνών

Διαβάστε περισσότερα

Βιολογία Προσανατολισμού Γ Λυκείου Κεφάλαιο: Κεφάλαια 1,2,4 Ονοματεπώνυμο Μαθητή: Ημερομηνία: 08/12/2018 Επιδιωκόμενος Στόχος: 75/100

Βιολογία Προσανατολισμού Γ Λυκείου Κεφάλαιο: Κεφάλαια 1,2,4 Ονοματεπώνυμο Μαθητή: Ημερομηνία: 08/12/2018 Επιδιωκόμενος Στόχος: 75/100 Μάθημα/Τάξη: Βιολογία Προσανατολισμού Γ Λυκείου Κεφάλαιο: Κεφάλαια 1,2,4 Ονοματεπώνυμο Μαθητή: Ημερομηνία: 08/12/2018 Επιδιωκόμενος Στόχος: 75/100 ΘΕΜΑ Α Να γράψετε στο τετράδιο σας τον αριθμό καθεμιάς

Διαβάστε περισσότερα

ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ. 1. (α) Ποιο μόριο απεικονίζεται στο σχεδιάγραμμα; (β) Ποια είναι η απλούστερη μορφή του R;

ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ. 1. (α) Ποιο μόριο απεικονίζεται στο σχεδιάγραμμα; (β) Ποια είναι η απλούστερη μορφή του R; ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ 1. (α) Ποιο μόριο απεικονίζεται στο σχεδιάγραμμα; (β) Ποια είναι η απλούστερη μορφή του R; (γ) Ποιο μέρος του μορίου προσδίδει σε αυτό όξινες ιδιότητες; (δ) Ποιο μέρος του μορίου προσδίδει

Διαβάστε περισσότερα

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΕΙΣ 4 & 5 (3/3 & 6/3/2017)

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΕΙΣ 4 & 5 (3/3 & 6/3/2017) Kυτταρική Bιολογία ΔIAΛEΞΕΙΣ 4 & 5 (3/3 & 6/3/2017) ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ Οι λιπιδικές διπλοστιβάδες λειτουργούν ως φραγμοί Νερό Υδρόφιλες φωσφολιπιδικές κεφαλές

Διαβάστε περισσότερα

CO 2 H 2 O O 2 C 6 H 12 O 6 ATP ADP DNA NADPH - TAC AAA CAT CCC GGG TTT ATT

CO 2 H 2 O O 2 C 6 H 12 O 6 ATP ADP DNA NADPH - TAC AAA CAT CCC GGG TTT ATT ΘΕΜΑ ο Α. (Μ 5) Ποιο φαινόµενο ονοµάζεται «µετουσίωση των πρωτεινών»; Να αναφέρεις ένα παράδειγµα. Β. (Μ 5) Να περιγράψεις το φαινόµενο της «ενδοκύττωσης» Γ. (Μ 5) Στις παρακάτω ερωτήσεις -5 να γράψεις

Διαβάστε περισσότερα

ΘΕΜΑ 1 ο. 1.2 Όξινο είναι το υδατικό διάλυμα του α. ΝaCl. β. ΝΗ 4 Cl. γ. CH 3 COONa. δ. KOH. Μονάδες 5 ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΤΑΞΗ ΤΕΛΟΣ 1ΗΣ ΑΠΟ 7 ΣΕΛΙ ΕΣ

ΘΕΜΑ 1 ο. 1.2 Όξινο είναι το υδατικό διάλυμα του α. ΝaCl. β. ΝΗ 4 Cl. γ. CH 3 COONa. δ. KOH. Μονάδες 5 ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΤΑΞΗ ΤΕΛΟΣ 1ΗΣ ΑΠΟ 7 ΣΕΛΙ ΕΣ ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΘΕΜΑ 1 ο ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 30 ΜΑΪΟΥ 2008 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΠΑΡΑΓΩΓΗΣ): ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΑΚΟ ΚΕΝΤΡΟ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Ν. ΜΑΓΝΗΣΙΑΣ ( Ε.Κ.Φ.Ε ) ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΛΟΓΙΑΣ

ΕΡΓΑΣΤΗΡΙΑΚΟ ΚΕΝΤΡΟ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Ν. ΜΑΓΝΗΣΙΑΣ ( Ε.Κ.Φ.Ε ) ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΛΟΓΙΑΣ ΕΡΓΑΣΤΗΡΙΑΚΟ ΚΕΝΤΡΟ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Ν. ΜΑΓΝΗΣΙΑΣ ( Ε.Κ.Φ.Ε ) ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΛΟΓΙΑΣ Θέμα: ΜΕΤΟΥΣΙΩΣΗ ΠΡΩΤΕΪΝΩΝ (άσκηση 7 του εργαστηριακού οδηγού) Μέσος χρόνος πειράματος: 45 λεπτά Α. ΑΝΑΛΩΣΙΜΑ Εργαλεία

Διαβάστε περισσότερα

ΒΙΟΧΗΜΕΙΑ ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΒΙΟΛΟΓΙΚΩΝ ΜΟΡΙΩΝ. Στοιχείο O C H N Ca P K S Na Mg περιεκτικότητα % ,5 1 0,35 0,25 0,15 0,05

ΒΙΟΧΗΜΕΙΑ ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΒΙΟΛΟΓΙΚΩΝ ΜΟΡΙΩΝ. Στοιχείο O C H N Ca P K S Na Mg περιεκτικότητα % ,5 1 0,35 0,25 0,15 0,05 ΒΙΟΧΗΜΕΙΑ Βιοχημεία: είναι η επιστήμη που ασχολείται με τη μελέτη των οργανικών ενώσεων που συναντώνται στον οργανισμό, καθώς και με τον μεταβολισμό τους. ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΒΙΟΛΟΓΙΚΩΝ ΜΟΡΙΩΝ 108 στοιχεία

Διαβάστε περισσότερα

σελ 1 από 8 Τμήμα Τεχνολογίας Τροφίμων ΤΕΙ Αθήνας Εαρινό Εξάμηνο a 2 η Εξέταση στην Βιοχημεία

σελ 1 από 8 Τμήμα Τεχνολογίας Τροφίμων ΤΕΙ Αθήνας Εαρινό Εξάμηνο a 2 η Εξέταση στην Βιοχημεία Τμήμα Τεχνολογίας Τροφίμων ΤΕΙ Αθήνας Εαρινό Εξάμηνο 2006 2007 a 2 η Εξέταση στην Βιοχημεία σελ 1 από 8 Ονοματεπώνυμο : Τυπικό εξάμηνο : Αριθμός Μητρώου : Σε κάθε ερώτηση αντιστοιχούν πέντε απαντήσεις

Διαβάστε περισσότερα

οµή και Αναδίπλωση πρωτεϊνών

οµή και Αναδίπλωση πρωτεϊνών οµή και Αναδίπλωση πρωτεϊνών Νηφόρου Κατερίνα Μεταδιδακτορική Ερευνήτρια, Οµάδα Μοριακής Καρκινογένεσης, Εργ/ριο Ιστολογίας-Εµβρυολογίας, Ιατρική Σχολή Αθηνών Σηµασία των πρωτεϊνών Ενζυµική κατάλυση Μεταφορά

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 11. Βιοενεργητική & Μεταβολισµός: Μιτοχόνδρια, Χλωροπλάστες & Υπεροξειδιοσώµατα

ΚΕΦΑΛΑΙΟ 11. Βιοενεργητική & Μεταβολισµός: Μιτοχόνδρια, Χλωροπλάστες & Υπεροξειδιοσώµατα ΚΕΦΑΛΑΙΟ 11 Βιοενεργητική & Μεταβολισµός: Μιτοχόνδρια, Χλωροπλάστες & Υπεροξειδιοσώµατα Τα ΥΠΕΡΟΞΕΙΔΙΟΣΩΜΑΤΑ Μέρος Ε ΤΑ ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΤΩΝ ΥΠΕΡΟΞΕΙΔΙΟΣΩΜΑΤΩΝ - Περιέχουν ένζυµα για ποικίλες µεταβολικές

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΘΕΜΑ 1 ο Α. Ερωτήσεις πολλαπλής επιλογής 1. δ 2. β 3. γ 4. γ 5. β Β. Ερωτήσεις σωστού λάθους 1. Λάθος 2. Σωστό 3. Λάθος 4. Λάθος 5. Σωστό ΘΕΜΑ

Διαβάστε περισσότερα

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΗ 4 (6/3/2013)

Kυτταρική Bιολογία ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ ΔIAΛEΞΗ 4 (6/3/2013) Kυτταρική Bιολογία ΔIAΛEΞΗ 4 (6/3/2013) ΒΙΟΛΟΓΙΚΕΣ ΜΕΜΒΡΑΝΕΣ, ΜΕΜΒΡΑΝΙΚΑ ΔΙΑΜΕΡΙΣΜΑΤΑ & ΔΙΑΛΟΓΗ ΠΡΩΤΕΪΝΩΝ Οι λιπιδικές διπλοστιβάδες ως φραγμοί Νερό Υδρόφιλες φωσφολιπιδικές κεφαλές Φωσφολιπιδική μεμβράνη

Διαβάστε περισσότερα

ΑΡΧΗ 2ΗΣ ΣΕΛΙ ΑΣ. 1.4 Να μεταφέρετε στο τετράδιό σας τις παρακάτω χημικές εξισώσεις, σωστά συμπληρωμένες:

ΑΡΧΗ 2ΗΣ ΣΕΛΙ ΑΣ. 1.4 Να μεταφέρετε στο τετράδιό σας τις παρακάτω χημικές εξισώσεις, σωστά συμπληρωμένες: ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 10 ΙΟΥΛΙΟΥ 2009 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ

Διαβάστε περισσότερα

Οι αζωτούχες βάσεις των νουκλεοτιδίων είναι:

Οι αζωτούχες βάσεις των νουκλεοτιδίων είναι: 1 ΑΣΚΗΣΕΙΣ ΝΟΥΚΛΕΙΚΩΝ ΟΞΕΩΝ ΑΣΚΗΣΗ 1 Ποια είναι η δομή των νουκλεοτιδίων; Τα νουκλεοτίδια προέρχονται από τη σύνδεση με ομοιοπολικό δεσμό, τριών διαφορετικών μορίων. Μιας πεντόζης (σάκχαρο με πέντε άτομα

Διαβάστε περισσότερα

Β. Σελ 60 σχολικού: «Η αποµόνωση του συνολικού έως και σελ 61 από µία cdna βιβλιοθήκη.». Γ. ι ι α α α ι α α ι α α α! " # $ % & ' ( ) ( ) ( * % + α ι α

Β. Σελ 60 σχολικού: «Η αποµόνωση του συνολικού έως και σελ 61 από µία cdna βιβλιοθήκη.». Γ. ι ι α α α ι α α ι α α α!  # $ % & ' ( ) ( ) ( * % + α ι α ! THΛ: 270727 222594 THΛ: 919113 949422 Απαντήσεις: " # $ % & ' 1=γ, 2=β, 3=γ, 4=β, 5=δ. " # $ % ( ' εδοµένα από την ανάλυση του ποσοστού των βάσεων σε µόρια DNA από διαφορετικούς οργανισµούς έδειχναν

Διαβάστε περισσότερα

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ 2015-2016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΧΗΜΕΙΑ 1)Πώς το φαινόμενο Bohr επηρεάζει την πρόσδεση οξυγόνου στην αιμοσφαιρίνη; Που συνδέονται τα ιόντα

Διαβάστε περισσότερα

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση Ασκήσεις 3& 4 Πρωτεϊνική Αρχιτεκτονική Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής Μοριακή Απεικόνιση Πρωτεϊνική Αρχιτεκτονική Πρωτεϊνική Αρχιτεκτονική: Η τρισδιάστατη δομή μιας πρωτεΐνης και πως

Διαβάστε περισσότερα

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων Η επιστήμη της Βιολογίας έχει μετατραπεί τα τελευταία χρόνια σε μια υπερπλούσια σε πληροφορίες επιστήμη.

Διαβάστε περισσότερα

Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ

Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ ΑΝΤΙΓΡΑΦΗ ΜΕΤΑΓΡΑΦΗ Γίνεται σύνθεση DNA. Γίνεται σύνθεση RNA. Εξασφαλίζεται η διαιώνιση της γενετικής

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ)

ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ) ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ) ΘΕΜΑ Α Να γράψετε στο τετράδιο σας τον αριθμό κάθε μιας από τις παρακάτω ημιτελείς προτάσεις 1-5 και δίπλα το γράμμα που αντιστοιχεί στη λέξη

Διαβάστε περισσότερα

Κεφάλαιο 1 ο Το γενετικό υλικό Μεθοδολογία Ασκήσεων

Κεφάλαιο 1 ο Το γενετικό υλικό Μεθοδολογία Ασκήσεων Κεφάλαιο 1 ο Το γενετικό υλικό Μεθοδολογία Ασκήσεων 1. Ένα μόριο νουκλεϊκού οξέος για να χαρακτηρισθεί πλήρως θα πρέπει να γνωρίζουμε αν είναι: i. DNA ή RNA ii. iii. Μονόκλωνο ή δίκλωνο Γραμμικό ή κυκλικό

Διαβάστε περισσότερα

β. [Η 3 Ο + ] > 10-7 Μ γ. [ΟΗ _ ] < [Η 3 Ο + ]

β. [Η 3 Ο + ] > 10-7 Μ γ. [ΟΗ _ ] < [Η 3 Ο + ] ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΤΑΞΗ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 6 ΙΟΥΝΙΟΥ 2003 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΠΑΡΑΓΩΓΗΣ): ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ ΣΥΝΟΛΟ

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ

ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ ΑΠΑΝΤΗΣΕΙΣ ΤΩΝ ΕΡΩΤΗΣΕΩΝ-ΑΣΚΗΣΕΩΝ ΚΑΙ ΠΡΟΒΛΗΜΑΤΩΝ ΤΟΥ ΒΙΒΛΙΟΥ ΤΟΥ ΜΑΘΗΤΗ Υποενότητες 4.1 και 4.2 1. Το αντικωδικόνιο που βρίσκεται στο trna συνδέεται (βάλτε σε κύκλο το σωστό): α. Με το αμινοξύ β. Με το

Διαβάστε περισσότερα

Μικρά αμινοξέα. Βιοχημεία Ι Β-3

Μικρά αμινοξέα. Βιοχημεία Ι Β-3 Βιοχημεία Ι Β-2 Μικρά αμινοξέα Βιοχημεία Ι Β-3 Aλειφατικά αμινοξέα Βιοχημεία Ι Β-4 Ιμινοξύ Βιοχημεία Ι Β-5 Αρωματικά αμινοξέα Βιοχημεία Ι Β-6 Βιοχημεία Ι Β-7 Η Tyr και η Trp απορροφούν στα 280nm-έτσι μετράται

Διαβάστε περισσότερα

Φυσική Στερεών στις Πρωτεΐνες

Φυσική Στερεών στις Πρωτεΐνες Φυσική Στερεών στις Πρωτεΐνες Νίκος Απ. Παπανδρέου Τ.Ε.Ι. Πειραιά Φεβρουάριος 2010 Ένα ελικοϊδές μονοπάτι Χημική δομή μίας πρωτεΐνης Μήκος αλυσίδας ~30 έως ~1000 αµινοξέα Συνολικός αριθµός ατόµων έως ~

Διαβάστε περισσότερα

3. Σε ένα σωματικό κύτταρο ανθρώπου που βρίσκεται στη μεσόφαση πριν την αντιγραφή υπάρχουν:

3. Σε ένα σωματικό κύτταρο ανθρώπου που βρίσκεται στη μεσόφαση πριν την αντιγραφή υπάρχουν: ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: ΘΕΜΑ 1 Ο Α. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: 1. Στο οπερόνιο της λακτόζης: Α. Η πρωτεΐνη καταστολέας

Διαβάστε περισσότερα

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΗΜΕΡΗΣΙΩΝ

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΗΜΕΡΗΣΙΩΝ Δίνονται: Κ a CH 3 COOH = 10 5, Κ b NH 3 = 10 5 Μονάδες 3 ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΗΜΕΡΗΣΙΩΝ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΕΜΠΤΗ 11 ΙΟΥΝΙΟΥ 2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ:

Διαβάστε περισσότερα

ΒΙΟΛΟΓΙΑ Β ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΒΙΟΛΟΓΙΑ Β ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΕΚΠΑΙΔΕΥΤΗΡΙΑ ΣΥΓΧΡΟΝΗ ΠΑΙΔΕΙΑ ΒΙΟΛΟΓΙΑ Β ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΕΠΙΜΕΛΕΙΑ:Ν.ΠΑΠΑΓΙΑΝΝΗΣ 2 Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ 3 1. Ποια είναι τα επίπεδα οργάνωσης της ζωής και ποια τα χημικά χαρακτηριστικά της; Στην

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ ΓΙΑ ΤΗ ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ. 3. Πώς ονομάζεται η βιοχημική αντίδραση της συνένωσης των δύο μορίων; Συμπύκνωση

ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ ΓΙΑ ΤΗ ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ. 3. Πώς ονομάζεται η βιοχημική αντίδραση της συνένωσης των δύο μορίων; Συμπύκνωση ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΟΡΓΑΝΙΚΕΣ ΟΥΣΙΕΣ ΓΙΑ ΤΗ ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ Α ΖΗΤΗΜΑ: 1. Ποιο μόριο απεικονίζεται στο σχεδιάγραμμα; Γλυκόζη 2. Εάν δύο τέτοια μόρια ενωθούν μαζί τι θα προκύψει; Μαλτόζη 3. Πώς ονομάζεται η

Διαβάστε περισσότερα

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Βιοπληροφορική Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου Μαθησιακοί Στόχοι επισκόπηση των βασικών στοιχείων των πρωτεϊνικών δομών. συσχέτιση ακολουθίας δομής λειτουργίας.

Διαβάστε περισσότερα

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Βάσεις δομικών δεδομένων βιολογικών μακρομορίων Vasilis Promponas Bioinformatics Research Laboratory Department of Biological Sciences University of Cyprus Εισαγωγή Βασικές αρχές δομής πρωτεϊνών και νουκλεϊκών

Διαβάστε περισσότερα

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. γ Α2. α Α3. δ Α4. β Α5. α

ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. γ Α2. α Α3. δ Α4. β Α5. α ΘΕΜΑ Α Α1. γ Α2. α Α3. δ Α4. β Α5. α 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 5 ΣΕΠΤΕΜΒΡΙΟΥ 2012 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:

Διαβάστε περισσότερα

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast Ασκήσεις 1 & 2 Βάσεις Δεδομένων Εργαλεία Αναζήτησης ClustalW & Blast Μοριακή Προσομοίωση Εισαγωγή: Δομική Βάση Βιολογικών Φαινομένων Η αξιοποίηση του πλήθους των δομικών στοιχείων για την εξαγωγή βιολογικά

Διαβάστε περισσότερα

Τμήμα Βιολογίας Μάθημα: ΒΙΟΛΟΓΙΑ ΚΥΤΤΑΡΟΥ Γ εξάμηνο 2014-2015 Διαλέξεις κάθε Τρίτη 13-15 μ.μ. και Παρασκευή 11-13

Τμήμα Βιολογίας Μάθημα: ΒΙΟΛΟΓΙΑ ΚΥΤΤΑΡΟΥ Γ εξάμηνο 2014-2015 Διαλέξεις κάθε Τρίτη 13-15 μ.μ. και Παρασκευή 11-13 Τμήμα Βιολογίας Μάθημα: ΒΙΟΛΟΓΙΑ ΚΥΤΤΑΡΟΥ Γ εξάμηνο 2014-2015 Διαλέξεις κάθε Τρίτη 13-15 μ.μ. και Παρασκευή 11-13 Ισιδώρα Παπασιδέρη, Καθηγήτρια...για περισσότερα... http://kyttariki.biol.uoa.gr, ttp://multimedia.biol.uoa.gr

Διαβάστε περισσότερα

BΑΣΙΚΕΣ ΑΡΧΕΣ ΒΙΟΧΗΜΕΙΑΣ ΕΝΕΡΓΕΙΑ ΚΑΙ ΜΕΤΑΒΟΛΙΣΜΟΣ ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΚΥΤΤΑΡΩΝ

BΑΣΙΚΕΣ ΑΡΧΕΣ ΒΙΟΧΗΜΕΙΑΣ ΕΝΕΡΓΕΙΑ ΚΑΙ ΜΕΤΑΒΟΛΙΣΜΟΣ ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΚΥΤΤΑΡΩΝ BΑΣΙΚΕΣ ΑΡΧΕΣ ΒΙΟΧΗΜΕΙΑΣ ΕΝΕΡΓΕΙΑ ΚΑΙ ΜΕΤΑΒΟΛΙΣΜΟΣ ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΚΥΤΤΑΡΩΝ 1. ΧΗΜΙΚΗ ΣΥΣΤΑΣΗ ΤΩΝ ΚΥΤΤΑΡΩΝ 2. BΑΣΙΚΕΣ ΑΡΧΕΣ ΒΙΟΧΗΜΕΙΑΣ Ι. ΑΤΟΜΑ ΚΑΙ ΜΟΡΙΑ ΙΙ. ΧΗΜΙΚΟΙ ΔΕΣΜΟΙ ΙΙΙ. ΜΑΚΡΟΜΟΡΙΑ ΣΤΑ ΚΥΤΤΑΡΑ

Διαβάστε περισσότερα

5.GGACTCAAGTTTACATGCAACGTACGG 3 που περιέχεται σε γονιδιωματική βιβλιοθήκη είναι κατάλληλος ο :

5.GGACTCAAGTTTACATGCAACGTACGG 3 που περιέχεται σε γονιδιωματική βιβλιοθήκη είναι κατάλληλος ο : Μάθημα/Τάξη: Κεφάλαιο: Βιολογία Προσανατολισμού Γ Λυκείου Το γενετικό υλικό (Κεφ.1), Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας (Κεφ.2), Τεχνολογία του Ανασυνδυασμένου DNA (Κεφ.4), Μενδελική

Διαβάστε περισσότερα

ΠΡΩΤΕΪΝΕΣ: Δομή και λειτουργία. (Διδακτική προσέγγιση με πειράματα και αναλογίες)

ΠΡΩΤΕΪΝΕΣ: Δομή και λειτουργία. (Διδακτική προσέγγιση με πειράματα και αναλογίες) ΠΡΩΤΕΪΝΕΣ: Δομή και λειτουργία (Διδακτική προσέγγιση με πειράματα και αναλογίες) Η αλληλεπίδραση δομής-λειτουργίας αποτελεί βασικό θέμα της βιολογίας. Ένα σημαντικό παράδειγμα αυτής της αλληλεπίδρασης

Διαβάστε περισσότερα

Απομόνωση ανθρώπινου DNA γονιδιώματος & ποιοτικός και ποσοτικός προσδιορισμός

Απομόνωση ανθρώπινου DNA γονιδιώματος & ποιοτικός και ποσοτικός προσδιορισμός Απομόνωση ανθρώπινου DNA γονιδιώματος & ποιοτικός και ποσοτικός προσδιορισμός Ευαγγελία - Ειρήνη Τσερμπίνι 1. Σκοπός Σκοπός της παρούσας άσκησης είναι η απομόνωση ανθρώπινου DNA γονιδιώματος από δείγμα

Διαβάστε περισσότερα

Περιήγηση στο εσωτερικό του Κυττάρου. Φώτης Καρβέλης

Περιήγηση στο εσωτερικό του Κυττάρου. Φώτης Καρβέλης Περιήγηση στο εσωτερικό του Κυττάρου Φώτης Καρβέλης Όλα τα κύτταρα οριοθετούνται από την πλασματική μεμβράνη ή το κυτταρικό τοίχωμα που την περιβάλλει. Εσωτερικά της πλασματικής μεμβράνης υπάρχουν τα οργανίδια

Διαβάστε περισσότερα

Ηλίας Ηλιόπουλος Εργαστήριο Γενετικής, Τµήµα Γεωπονικής Βιοτεχνολογίας, Γεωπονικό Πανεπιστήµιο Αθηνών

Ηλίας Ηλιόπουλος Εργαστήριο Γενετικής, Τµήµα Γεωπονικής Βιοτεχνολογίας, Γεωπονικό Πανεπιστήµιο Αθηνών Χηµική Μεταβίβαση Σήµατος Ηλίας Ηλιόπουλος Εργαστήριο Γενετικής, Τµήµα Γεωπονικής Βιοτεχνολογίας, Γεωπονικό Πανεπιστήµιο Αθηνών 1 Η Επικοινωνία στα Ζωϊκά Κύτταρα 1. Δίκτυα εξωκυτταρικών και ενδοκυτταρικών

Διαβάστε περισσότερα

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 5 ΣΕΛΙΔΕΣ

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 5 ΣΕΛΙΔΕΣ ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Δ ΕΣΠΕΡΙΝΩΝ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 IOYNIOΥ 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΠΕΝΤΕ (5) ΘΕΜΑ Α Να γράψετε

Διαβάστε περισσότερα

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ 2014-2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ 2014-2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ 2014-2015 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ Θέματα 1. Ποια είναι η δομή και τα βασικά χαρακτηριστικά των λιπαρών οξέων 2. Πώς απομακρύνονται

Διαβάστε περισσότερα

Θέµατα ιάλεξης ΠΡΩΤΕΪΝΕΣ - ΕΝΖΥΜΑ ΠΡΩΤΕΪΝΕΣ. ιαχωρισµός Αµινοξέων

Θέµατα ιάλεξης ΠΡΩΤΕΪΝΕΣ - ΕΝΖΥΜΑ ΠΡΩΤΕΪΝΕΣ. ιαχωρισµός Αµινοξέων MANAGING AUTHORITY OF THE OPERATIONAL PROGRAMME EDUCATION AND INITIAL VOCATIONAL TRAINING ΠΡΩΤΕΪΝΕΣ - ΕΝΖΥΜΑ Θέµατα ιάλεξης οµή, αριθµός και διαχωρισµός των αµινοξέων Ένωση αµινοξέων µε τον πεπτιδικό δεσµό

Διαβάστε περισσότερα