ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ Παύλος Αντωνίου
Με μια ματιά: Εισαγωγή στη Βιολογία Ευθυγράμμιση Ακολουθιών Αναζήτηση ομοίων ακολουθιών από βάσεις δεδομενων Φυλογενετική πρόβλεψη Πρόβλεψη δομής πρωτεινών Γλώσσα προγραμμτισμού PERL Ανάλυση microarrays ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 2
Βιβλίο μαθήματος Bioinformatics: Sequence and Genome Analysis by David. W. Mount, 2 nd edition ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 3
Υπολογιστική Βιολογία Κλάδος που παρέχει υποστήριξη για οργάνωση και ανάλυση βιολογικών δεδομένων Επικεντρώνεται στην ανάπτυξη καινούργιων και αποτελεσματικών αλγορίθμων που να λύνουν δύσκολα υπολογιστικά προβλήματα όπως η ευθυγράμμιση πολλών ακολουθιών ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 4
Βιοπληροφορική Επικεντρώνεται στην ανάπτυξη πρακτικών εργαλείων για διαχείριση και ανάλυση των δεδομένων Συγχώνευση των κλάδων της πληροφορικής, της βιολογίας, τωνμαθηματικώνκαιτης στατιστικής για την ανάλυση βιολογικών ακολουθιών, όπως για την εύρεση γονιδίων ή των λειτουργιών των πρωτεινών ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 5
Υπολογιστική Βιολογία και Βιοπληροφορική Αλληλοκάλυψη Υπολογιστικής Βιολογίας και Βιοπληροφορικής Θα γνωρίσουμε και θα αναπτύξουμε αποτελεσματικούς αλγορίθμους Θα επικεντρωθούμε επίσης όμως στην σχεδίαση και την πρακτική εφαρμογή μεθόδων για συλλογή, οργάνωση, κατηγοριοποίηση, αποθήκευση και ανάλυση βιολογικών ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 6
Στόχοι μαθήματος Κατανόηση των πληροφοριακών συστημάτων διαχείρισης βιολογικών πληροφοριών Γνωριμία με εργαλεία ανάλυσης των δεδομένων Ανάπτυξη και εφαρμογή αλγορίθμων για την επίλυση βιολογικών προβλημάτων ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 7
Στοιχειώδη Μοριακής βιολογίας ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 8
Στοιχειώδεις γνώσεις Μοριακής Βιολογίας Για την κατανόηση των πληροφοριακών συστημάτων διαχείρισης βιολογικών πληροφοριών πρέπει πρωταρχικά να γίνουν κατανοητές βασικές έννοιες της Μοριακής Βιολογίας. Ακολουθεί μια ανασκόπηση-υπενθύμιση βασικών εννοιών της μοριακής βιολογίας ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 9
Μοριακή βιολογία Δομικό στοιχείο κάθε οργανισμού είναι το κύτταρο. Το κύτταρο πραγματοποιεί τις λειτουργίες του σύμφωνα με μια σειρά πληροφοριών που έχει κληρονομήσει από τους προγόνους του. Οι πληροφορίες αυτές είναι καταγραμμένες στο DNA που βρίσκεται στον πυρήνα του κυττάρου και είναι το γενετικό υλικό. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 10
Το ζωικό κύτταρο ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 11
Μοριακή βιολογία Το συνολικό DNA σε κάθε διπλοειδές κύτταρο του ανθρώπου έχει μήκος περίπου 2 μέτρα και συσπειρώνεται σε τέτοιο βαθμό ώστε να χωράει στον πυρήνα του κυττάρου που έχει διάμετρο δέκα εκατομμυριοστά του μέτρου ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 12
Ποίες οι λειτουργίες του DNA; Το DNA παράγει αντίγραφα του έτσι η πληροφορία μεταβιβάζεται αναλλοίωτη από κύτταρο σε κύτταρο και από γενιά σε γενιά. Το DNA προσδιορίζει την παραγωγή των διαφόρων ειδών RNA και μέσω αυτών των πρωτεϊνών. Οι πρωτεΐνες είναι υπεύθυνες για τα βασικά δομικά και λειτουργικά χαρακτηριστικά των κυττάρων. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 13
Τι ακριβώς είναι το DNA; Το DNA είναι το δε(σ)οξυριβονουκλεϊ(νι)κό οξύ. (Deoxyribonucleic Acid) Είναι δυο πολυνουκλεϊνικές αλυσίδες που σχηματίζουν στο χώρο μια δεξιόστροφη διπλή έλικα. Η ανακάλυψη της διπλής έλικας του DNA έγινε μόλις το 1953 από τους Watson και Crick γεγονός για το οποίο τους απονεμήθηκε βραβείο Νόμπελ. Watson και Crick ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 14
Τι ακριβώς είναι το DNA; Αποτελείται από νουκλεοτίδια. Τα νουκλεοτίδια αποτελούνται από μια πεντόζη,τη δεοξυριβόζη η οποία είναι ενωμένη με μία φωσφορική ομάδα και μία αζωτούχο βάση. Το μόνο που διαφέρει το ένα νουκλεοτίδιο με το άλλο είναι η αζωτούχα βάση με την οποία είναι συνδεδεμένο. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 15
Τι ακριβώς είναι το DNA; Στα νουκλεοτίδια του DNA η αζωτούχος βάση μπορεί να είναι: Α - Αδενίνη (Adenine) G - Γουανίνη (Guanine) T - Θυμίνη (Thymine) C - Κυτοσίνη (Cytosine) ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 16
Νουκλεοτίδιο του DNA ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 17
Τι ακριβώς είναι το DNA; Τα νουκλεοτίδια αυτά συνδέονται μεταξύ τους σχηματίζοντας μια πολυνουκλεοτιδική αλυσίδα. Το DNA αποτελείται από δύο τέτοιες αλυσίδες συνδεδεμένες μεταξύ τους σχηματίζοντας έλικα. Οι αζωτούχες βάσεις της μίας αλυσίδας συνδέονταιμετιςβάσειςτηςάλληςσύμφωνα με τον κανόνα της συμπληρωματικότητας. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 18
Τι ακριβώς είναι το DNA; Η Αδενίνη συνδέεται μόνο με τη Θυμίνη και αντίστροφα(α-τ, Τ-Α) ενώ η κυτοσίνη συνδέεταιμόνομετηγουανίνηκαι αντίστροφα (G-C, C-G) Οι δυο αλυσίδες είναι συμπληρωματικές και αντιπαράλληλες. Η συμπληρωματικότητα έχει μεγάλη σημασία στον αυτοδιπλασιασμό του DNA. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 19
ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 20
Λειτουργίες DNA Το DNA έχει τη δυνατότητα να αυτοδιπλασιάζεται, να αντιγράφεται καθώς και να μεταγράφεται. H αντιγραφή γίνεται με ξετύλιγμα του DNA και απέναντι από τις βάσεις των μητρικών αλυσίδων προσθέτονται νέες συμπληρωματικές τους και έτσι δημιουργούνται δύο θυγατρικές αλυσίδες DNA. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 21
Αντιγραφή DNA ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 22
Κεντρικό δόγμα της μοριακής βιολογίας O F.Crick διατύπωσε το 1958 το κεντρικό δόγμα της μοριακής βιολογίας το οποίο αφορά τη ροή της γενετικής πληροφορίας Το DNA με τη διαδικασία της μεταγραφής μεταγράφει την πληροφορία του στο RNA. To RNA μεταφέρει τη πληροφορία με τη διαδικασία της μετάφρασης στις πρωτεΐνες. DNA RNA πρωτεΐνες ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 23
Τι είναι το RNA; Το RNA είναι το ριβονουκλεϊνικό οξύ (Ribonucleic acid) το οποίο αποτελείται κι αυτό από νουκλεϊνικά οξέα με τη διαφορά ότι οι αζωτούχες βάσεις του περιέχουν την Ουρακίλη U (Uracil) αντί της θυμίνης Τ. Υπάρχει αντιστοιχία ανάμεσα στις βάσεις του DNA και του RNA : A-U,G-C,C-G,T-A To RNA δημιουργείται από τα μόρια DNA κατά τη διαδικασία της μεταγραφής. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 24
Ροή γενετικής πληροφορίας Ηγενετικήπληροφορίαείναιηκαθορισμένη σειρά βάσεων του DNA η οποία σειρά είναι αυτό που διαφοροποιεί τη μια αλυσίδα DNA από την άλλη. Βρίσκεται στα γονίδια. Το κάθε ανθρώπινο κύτταρο περιέχει γύρω στα 40000 γονίδια. Τα γονίδια δια μέσου της μεταγραφής και της μετάφρασης καθορίζουν τη σειρά των αμινοξέων που θα δημιουργήσουν την πρωτεΐνη. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 25
Μετατροπή πληροφορίας DNA σε πρωτεΐνες Γίνεται με τις διαδικασίες Μεταγραφής και Μετάφρασης Κατά τη μεταγραφή παράγονται τρία είδη RNA: 1. m RNA 2. t RNA 3. snrna ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 26
Μετατροπή πληροφορίας DNA σε πρωτεΐνες To m RNA (messenger RNA) περιέχει την πληροφορία του DNA που την αποκτά με την συμπληρωματική αντιστοιχία των βάσεων του DNA με τις δικές του ξετυλίγοντας τη διπλή έλικα του DNA. Αφού πάρει την πληροφορία την μεταφέρει στο ριβόσωμα όπου θα γίνει η πρωτεϊνοσύνθεση. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 27
Μεταγραφή DNA ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 28
Μετατροπή πληροφορίας DNA σε πρωτεΐνες Έτσι με το τέλος της μεταγραφής η αλληλουχία (σειρά) τωνβάσεωντουm RNA είναι ακριβώς η ίδια με την αλληλουχία των βάσεων του DNA με τη μόνη διαφορά ότι στη θέση της Τ (Θυμίνης) υπάρχει η U (Ουρακίλη). ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 29
Πρωτεϊνοσύνθεση Η αντιστοίχιση των νουκλεοτιδίων του m RNA με τα αμινοξέα των πρωτεϊνών γίνεται μέσω του γενετικού κώδικα. Η αλληλουχία των βάσεων του m RNA καθορίζει την αλληλουχία των αμινοξέων στις πρωτεΐνες. Κάθε 3 βάσεις του m RNA κωδικοποιούν ένα αμινοξύ. Για αυτό το λόγο ο γενετικός κώδικας ονομάζεται και κώδικας τριπλέτας. Έχει τρία στάδια. Έναρξη, επιμήκυνση και λήξη. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 30
Πρωτεϊνοσύνθεση ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 31
Πρωτεϊνοσύνθεση Έναρξη: Σύνδεση m RNA με ριβόσωμα. Το t RNA μεταφέρει το πρώτο αμινοξύ στην τριπλέτα (κωδικόνιο) έναρξης. Επιμήκυνση: Τα t RNA μεταφέρουν τα αμινοξέα που αντιστοιχούν στα κωδικόνια τα οποία συνδέονται μεταξύ τους. Λήξη: Στο κωδικόνιο λήξης σταματά η Πρωτεϊνοσύνθεση και ελευθερώνεται η πολυπεπτιδική αλυσίδα. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 32
Γενετικός κώδικας ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 33
Καρυότυπος ανθρώπου Ανθρώπινο γονιδίωμα σε ένα γαμέτη αποτελείται από 3x10^8 ζεύγη βάσεων DNA που είναι οργανωμένα σε 23 χρωματοσώματα. Τα χρωματοσώματα ταξινομούνται σε ζεύγη κατά ελαττούμενο μέγεθος.22 μορφολογικά και το 23ο φυλετικό. ΧΥ στον άντρα και ΧΧ στη γυναίκα. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 34
Καρυότυπος ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 35
Τι θα δούμε στη συνέχεια ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 36
Συλλογή και αποθήκευση ακολουθιών στο εργαστήριο DNA Sequencing, κλωνοποίηση Εισαγωγή ακολουθιών σε βάσεις Δεδομένων Σημαντικές βάσεις Δεδομένων ακολουθιών προσβάσιμες στο Internet. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 37
Ευθυγράμμιση Δύο Ακολουθιών Ευθυγράμμιση δυο ακολουθιών είναι η διαδικασία σύγκρισης δυο ακολουθιών για εύρεση ατομικών χαρακτήρων ή προτύπων χαρακτήρων με την ίδια σειρά στις δύο ακολουθίες. Παράδειγμα: THIS-ISAGLALALIGNMENT THEREISTHEAL- IGN-EDSEQ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 38
Ευθυγράμμιση Δύο Ακολουθιών DNA (4 γράμματα και κενό) T T G A C A C T T T A C A C Πρωτεΐνες (20 γράμματα και κενό) RKVA--GMAKPNM RKIAVAAASKPAV ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 39
Ευθυγράμμιση Πολλών Ακολουθιών Ταυτόχρονη ευθυγράμμιση πολλών ακολουθιών Υπολογιστικά δύσκολη η μέθοδος για πάρα πολλές ακολουθίες. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 40
Αναζήτηση ακολουθιών σε Βασεις Δεδομένων ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 41
Σχέση Ευθυγράμμισης Πολλών Ακολουθιών με Φυλογενετική Ανάλυση Κοινά διατηρημένα στοιχεία Στοιχεία που αντικαταστάθηκαν όπως το Κ που προστέθηκε και το L που αφαιρέθηκε. ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 42
Πρόβλεψη Δομής Πρωτεϊνών Ακολουθία->Δευτερεύουσα Δομή->Τρισδιάστατη Δομή ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 43
Γλώσσα PERL Αυτοματοποίηση ανάλυσης ακολουθιών με PERL modules και μικρά scripts Διαθέσιμα BioPerl modules στο διαδίκτυο ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 44
Microarrays-Array CGH Εισαγωγή στη μέθοδο array -CGH (Comparative Genomics hybridization) ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 45
Τέλος εισαγωγής ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ 46