Εφαρμοσμένη Βιοτεχνολογία Σημειώσεις Νίκος Τσουκιάς Σχολή Χημικών Μηχανικών ΕΜΠ
Γενωμική και Συστημική Βιολογία [Ch 8.5] Genomics is a discipline in genetics that applies recombinant DNA, DNA sequencing methods, and bioinformatics to sequence, assemble, and analyze the function and structure of genomes https://en.wikipedia.org/wiki/genomics Γενωμική είναι ένας διεπιστημονικός κλάδος που χρησιμοποιεί πειραματικά και υπολογιστικά εργαλεία για την ανάγνωση και ανάλυση το γονιδιώματος και το συσχετισμό του με την παθοφυσιολογία του οργανισμού Ο συσχετισμός φυσιολογικής συμπεριφοράς με αλληλουχία νουκλεοτιδίων συνιστά σημαντική πρόκληση στην οποία Εμβιομηχανικοί μπορούν να συνεισφέρουν σημαντικά
Συστημική Βιολογία Η πρόοδος στη Ιατρική και Βιολογία έχει στηριχθεί κυρίως στην αναγωγική/αφαιρετική προσέγγιση (reductionist approach) που εξετάζει την λειτουργία/ιδιότητες ενός συστατικού του συστήματος (ενός γονιδίου, μιας πρωτεΐνης κλπ) Η συμπεριφορά όμως ενός κύτταρου, οργανισμού προκύπτει από πολύπλοκες, μη γραμμικές αλληλεπιδράσεις των πολλών συστατικών του Επαναστατικές πειραματικές τεχνικές (high-throughput) μας επιτρέπουν πλέον την παρακολούθηση πολλαπλών στοιχείων (π.χ. μέτρηση της έκφρασης όλων των γονιδίων με ένα πείραμα) Υπάρχει ανάγκη για μια προσέγγιση της λειτουργιάς των κύτταρων/οργανισμών με μεθοδολογία μηχανικού συστημάτων, που θα αξιοποιήσει τις καινούργιες πειραματικές μεθόδους και θα αναδείξει την λειτουργιά των οργανισμών μέσα από την σύνθεση των ιδιοτήτων των συστατικών τους Υπολογιστικές τεχνικές και μαθηματική μοντελοποίηση χρειάζονται για την ανάλυση και αξιοποίηση των πειραματικών δεδομένων
Systems biology is the computational and mathematical modeling of complex biological systems. An emerging engineering approach applied to biomedical and biological scientific research, systems biology is a biology-based inter-disciplinary field of study that focuses on complex interactions within biological systems, using a holistic approach (holism instead of the more traditional reductionism) to biological and biomedical research. https://en.wikipedia.org/wiki/ Multiscale Systems biology http://physiologyonline.physiology.org/content/20/5/316
Α. ΠΕΙΡΑΜΑΤΙΚΕΣ ΤΕΧΝΙΚΕΣ High throughput πειραματικές τεχνικές χρησιμοποιούν αυτοματισμούς για να πραγματοποιήσουν βιολογικά πειράματα σε μεγάλη κλίμακα large-scale data biology και καινούργια επιστημονικά πεδία με το συνθετικό -omics : Genomics, Transcriptomics, Proteomics, Metabolomics Στα βασικά πειραματικά εργαλεία περιλαμβάνονται: 1. Μέθοδοι προσδιορισμού αλληλουχιών DNA 2. Μέθοδοι σίγασης (silencing) και αφαίρεσης (knockout) γονιδίων 3. Μέθοδοι ανίχνευσης και ποσοτικοποίησης mrna που έχει εκφραστεί 4. Μέθοδοι ανίχνευσης πρωτεϊνών
B. ΥΠΟΛΟΓΙΣΤΙΚΕΣ ΤΕΧΝΙΚΕΣ Β1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ
Building the Tree of Life Επιστήμονες κατασκευάζουν φυλογενετικά δέντρα στην προσπάθεια να αναλύσουν εξελικτικές σχέσεις μεταξύ οργανισμών.
Molecular Evolution Παράλληλα με την μορφολογική εξέλιξη των οργανισμών (Morphological Evolution), εξελίσσονται/μεταβάλλονται και τα γονίδια (Molecular Evolution). Μοριακή φυλογένεση. Χρησιμοποίηση των μοριακών δεδομένων στην εύρεση των φυλογενετικών σχέσεων Τα αποτελέσματα από τη χρήση μοριακών δεδομένων δεν εγγυώνται πάντα την ορθότητα των φυλογενετικών σχέσεων
Μοριακό ρολόι μοριακό ρολόι: συσχέτιση της απόσχισης δύο ειδών και του αριθμού των διαφορών που παρατηρούνται μεταξύ νουκλεοτιδικών ή πρωτεϊνικών μορίων των ειδών αυτών ξεκίνησε στη δεκαετία του 60 με τους Zuckerkandl & Pauling και δύο σημαντικές μελέτες σχετικά με τον εξελικτικό ρυθμό των πρωτεϊνών, σημειώνοντας ότι η γενετική απόσταση δύο αλληλουχιών διαφορετικών ειδών που κωδικοποιούν την ίδια πρωτεΐνη αυξάνει γραμμικά με το χρόνο απόκλισης των δύο ειδών.
Αιμογλοβίνη: Πρωτεΐνη που αποτελείται από τέσσερις πολυπεπτιδικές αλυσίδες (δύο άλφα και δύο βήτα) Σχεδόν πανομοιότυπη σε γορίλα, χιμπαντζή και άνθρωπο Όσο απομακρυνόμαστε από Primates, η ομοιότητα ελαττώνεται. Οι Linus and Pauling παρατήρησαν ότι οι α αλυσίδες μεταξύ ανθρώπου και γορίλα διαφέρουν σε 2 αμινοξέα, και οι β αλυσίδες σε 1. Υπολόγισαν το χρόνο απόκλισης μεταξύ ανθρώπου και γορίλα για τις β αλυσίδες σε 7.3 εκατομμύρια χρόνια. Ancestor Human β Chain β Chain Gorilla β Chain
Human β chain: MVHLTPEEKSAVTALWGKV NVDEVGGEALGRLL Mouse β chain: MVHLTDAEKAAVNGLWGKVNPDDVGGEALGRLL Human β chain: VVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLG Mouse β chain: VVYPWTQRYFDSFGDLSSASAIMGNPKVKAHGKK VIN Human β chain: AFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGN Mouse β chain: AFNDGLKHLDNLKGTFAHLSELHCDKLHVDPENFRLLGN Human β chain: VLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH Mouse β chain: MI VI VLGHHLGKEFTPCAQAAFQKVVAGVASALAHKYH There are a total of 27 mismatches, or (147 27) / 147 = 81.7 % identical Human β chain: MVH L TPEEKSAVTALWGKVNVDEVGGEALGRLL Chicken β chain: MVHWTAEEKQL I TGLWGKVNVAECGAEALARLL Human β chain: VVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLG Chicken β chain: IVYPWTQRFF ASFGNLSSPTA I LGNPMVRAHGKKVLT Human β chain: AFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGN Chicken β chain: SFGDAVKNLDNIK NTFSQLSELHCDKLHVDPENFRLLGD Human β chain: VLVCVLAHHFGKEFTPPVQAAY QKVVAGVANALAHKYH Chicken β chain: I L I I VLAAHFSKDFTPECQAAWQKLVRVVAHALARKYH There are a total of 44 mismatches, or (147 44) / 147 = 70.1 % identical http://jhered.oxfordjournals.org/content/93/3/157.full.pdf
Molecular evolution can be visualized with phylogenetic tree.
Ευθυγράμμιση αλληλουχιών (Sequence Alignment) Ευθυγράμμιση και σύγκριση 1. Αλληλουχίες DNA / mrna / Protein 2. Διαφορές σε μία θέση από : a) Μεταλλάξεις (Mutation) b) Ελλείψεις (Deletion) c) Προσθήκες (Insertion) Gaps 3. Καθορισμός ενός συστήματος σκοραρίσματος που θα: a) ανταμείβει ένα όμοιο ζεύγος b) τιμωρεί μια μετάλλαξη (transitions (A < >G) vs transvertions (A< > C)) c) τιμωρεί ένα κενό (origination vs length penalties) Παράδειγμα: scoring system: [+1 match; 1 mutation; 1 gap] Sequence1: CAAAATG Sequence2: AACAATGGC CAAAATG CAAAATG CAA AATG AACAATGGC AACAA TGGC AA CAATGGC * * && & +3 +3 +5
Needleman Wunsch method for alignment Dynamic Programing Sequence1: PSEEGYCDYEPEA Sequence2:PQEEYCEYEPEA P S E E G Y C D Y E P E A P Q E E Y C 0 Y 0 P 0 A 0 0 0 0 0 1 MATCHING: 1 ELSE: 0
Needleman Wunsch method for alignment Dynamic Programing Sequence1: PSEEGYCDYEPEA Sequence2:PQEEYCEYEPEA P S E E G Y C D Y E P E A P 0 Q 0 Y 0 C 0 Y 0 P 0 E 2 0 A 0 0 0 0 0 0 0 0 0 0 0 0 1 MATCHING +1 από τη μέγιστη τιμή στο τετράγωνο
Needleman Wunsch method for alignment Dynamic Programing Sequence1: PSEEGYCDYEPEA Sequence2:PQEEYCEYEPEA P S E E G Y C D Y E P E A P 0 Q 0 Y 0 C 0 Y 0 P 1 0 E 2 0 A 0 0 0 0 0 0 0 0 0 0 0 0 1 NO MATCH +0 από τη μέγιστη τιμή στο παραλλ/μο
Needleman Wunsch method for alignment Dynamic Programing Sequence1: PSEEGYCDYEPEA Sequence2:PQEEYCEYEPEA P S E E G Y C D Y E P E A P 5 4 3 3 1 0 Q 5 4 3 2 1 0 E 5 4 4 2 2 0 E 5 4 4 2 2 0 Y 5 5 3 2 1 0 C 5 4 3 2 1 0 E 5 5 6 6 5 5 5 5 4 4 2 2 0 Y 4 4 4 4 4 5 4 4 5 3 2 1 0 E 3 3 4 4 3 3 3 3 3 4 2 2 0 P 3 2 2 2 2 2 2 2 2 2 3 1 0 E 2 1 2 2 1 1 1 1 1 2 1 2 0 A 0 0 0 0 0 0 0 0 0 0 0 0 1 NO MATCH +0 από τη μέγιστη τιμή στα παραλλη/μα
Needleman Wunsch method for alignment Dynamic Programing P S E E G Y C D Y E P E A P 10 9 8 7 7 6 5 5 4 3 3 1 0 Q 9 9 8 7 7 6 5 5 4 3 2 1 0 E 8 8 9 8 7 6 5 5 4 4 2 2 0 E 7 7 8 8 7 6 5 5 4 4 2 2 0 Y 7 7 7 6 6 7 6 5 5 3 2 1 0 C 6 6 6 5 5 5 6 5 4 3 2 1 0 E 5 5 6 6 5 5 5 5 4 4 2 2 0 Y 4 4 4 4 4 5 4 4 5 3 2 1 0 E 3 3 4 4 3 3 3 3 3 4 2 2 0 P 3 2 2 2 2 2 2 2 2 2 3 1 0 E 2 1 2 2 1 1 1 1 1 2 1 2 0 A 0 0 0 0 0 0 0 0 0 0 0 0 1 Move down numbers Move diagonal 1 move in ior j directio P S E EG Y C D Y E P E A P Q E E Y C E Y E P E A * & *
Phylogenetic Tree generation using UPGMA Consider the alignment of 5 DNA/Protein sequences that yields from pairwise comparisons the number of miss matches (mutations) Species A B C D B 13 C 3 15 D 8 15 9 E 7 14 4 11 1. Species A and C form the closest pair with only 3 miss matches and will form the first cluster AC 2. Compute pairwise comparisons between AC and B, D, E using the mean value of A and C Species AC B D B (13+15)/2=14 D (8+9)/2=8.5 15 E (7+4)/2=5.5 14 11
Phylogenetic Tree generation using UPGMA 3. Find the closest pair (AC and E) and form a new cluster (AC E) A Species AC E B B (14+14)/2=14 D (8.5+11)/2=9.75 15 C E D B