Εφαρμοσμένη Βιοτεχνολογία Σημειώσεις Νίκος Τσουκιάς Σχολή Χημικών Μηχανικών ΕΜΠ
για την παραγωγή μιας ενεργής πρωτεΐνης υπάρχουν ρυθμιστικοί μηχανισμοί σε πολλαπλά επίπεδα ιδιαίτερα για τα ανώτερα ευκαρυωτικά κύτταρα ένα παράδειγμα ρυθμιστικού μηχανισμού της γονιδιακής έκφρασης είναι το RNAi pathway
Ρυθμιστική περιοχή Προκαρυωτικά: Υποκινητης (Promoter), Χειριστης (Operator) RNA πολυμεράση ; Καταστολέας (Repressor) Ευκαρυωτικά: Υποκινητης (Promoter), Ενισχυτής (Enhancer) RNA πολυμεράση II; µεταγραφικοί παράγοντες (Transcription Factors)
Μετα μεταφραστική διεργασία και μεταφορά
RNA interference pathway and posttranscriptional regulation of gene expression https://mcb.berkeley.edu/seminars/cdb2010symposium/fire_lecture.pdf
micro RNA (mirna) and post transcriptional regulation of gene expression μικρά μόρια non coding RNA (about 22 nucleotides) βρίσκονται σε κύτταρα φυτών, ζώων, αλλά και σε ιούς προέρχονται από την ενδογενή μεταγραφή RNA που διπλώνει σχηματίζοντας φουρκέτα (primary mirna) https://en.wikipedia.org/wiki/microrna
Μία εξωγενής/ενδογενής διπλή αλυσίδα (dsrna) ή ένα ενδογενές προ mirna Το ένζυμο dicer τεμαχίζει τη διπλή αλυσίδα του RNA (dsrna ή pre mirna) Δημιουργεί θραύσματα small interfering RNA ή microrna. Ενσωμάτωση στο σύμπλοκο (RNA induced silencing complex) (RISC), Στόχευση μονής αλυσίδας mrna και καταστολή της μετάφρασης του γονιδίου https://www.youtube.com/watch?v=ck OGB1_ELE http://themedicalbiochemistrypage.org/gene regulation.php
http://principlesofmolecularvirology.blogspot.gr/2013/11/the great rna confusion rnai mirna.html
Γενωμική και Συστημική Βιολογία [Ch 8.5] Genomics is a discipline in genetics that applies recombinant DNA, DNA sequencing methods, and bioinformatics to sequence, assemble, and analyze the function and structure of genomes https://en.wikipedia.org/wiki/genomics Γενωμική είναι ένας διεπιστημονικός κλάδος που χρησιμοποιεί πειραματικά και υπολογιστικά εργαλεία για την ανάγνωση και ανάλυση το γονιδιώματος και το συσχετισμό του με την παθοφυσιολογία του οργανισμού Ο συσχετισμός φυσιολογικής συμπεριφοράς με αλληλουχία νουκλεοτιδίων συνιστά σημαντική πρόκληση στην οποία Εμβιομηχανικοί μπορούν να συνεισφέρουν σημαντικά
Α. ΠΕΙΡΑΜΑΤΙΚΕΣ ΤΕΧΝΙΚΕΣ High throughput πειραματικές τεχνικές χρησιμοποιούν αυτοματισμούς για να πραγματοποιήσουν βιολογικά πειράματα σε μεγάλη κλίμακα large-scale data biology και καινούργια επιστημονικά πεδία με το συνθετικό -omics : Genomics, Transcriptomics, Proteomics, Metabolomics Στα βασικά πειραματικά εργαλεία περιλαμβάνονται: 1. Μέθοδοι προσδιορισμού αλληλουχιών DNA 2. Μέθοδοι σίγασης (silencing) και αφαίρεσης (knockout) γονιδίων 3. Μέθοδοι ανίχνευσης και ποσοτικοποίησης mrna που έχει εκφραστεί 4. Μέθοδοι ανίχνευσης πρωτεϊνών
Α1. DNA SEQUENCING Sanger μέθοδος για DNA sequencing (1977) Next Generation sequencing (Next-Gen) επιτρέπει large-scale, αυτοματοποιημένο προσδιορισμό αλληλουχίας ολόκληρου γονιδιώματος 2014: 1000$ genome
Roche Illumina Life Technologies Pacific Biosciencies
Sanger sequencing single-stranded DNA template (θραύσματα) DNA primer DNA polymerase deoxynucleosidetriphosphates (dntps) όπως και στην PCR σε Thermocycler di-deoxynucleosidetriphosphates (ddntps) σταματούν την αντιγραφή σημαδεύεται ο παραγόμενος κλώνος (radiolabeling/fluorescence) ΑTP dαtp ddαtp
4 αντιδράσεις μία για κάθε ddntp Σε κάθε δοκιμαστικό σωλήνα θα παραχθούν αντίγραφα διαφορετικού μήκους που τελειώνουν στην ίδια βάση Ν Ηλεκτροφόρηση σε gel διαχωρίζει τους παραγόμενους κλώνους Μικρά κομμάτια DNA μέχρι ~ 500bp https://www.youtube.com/watch?v=qr6a4exzows
Παράδειγμα: Για την αλληλούχηση ενός μονόκλωνου τεμαχίου DNA χρησιμοποιήθηκε Sanger sequencing με πριμοδότη 5 -GCAT-3. Ηλεκτροφόρηση πήγματος διαχώρισε τα προϊόντα από 4 αντιδράσεις στις οποίες είχαν προστεθεί κατά σειρά ddτtp, ddctp, ddgtp, ddatp (μαζί με το DNA, τον πριμοδότη, την DNA πολυμεράση και τα τριφωσφορικά δεοξυνουκλεοτίδια). Γράψτε την αλληλουχία των 22 βάσεων του τεμαχίου DNA στην κατεύθυνση 5' 3' 5 - GCAT G -3 Συμπληρωματικός κλώνος 3 - CGTA C -5 Σε κατεύθυνση 5 3 5 -. C ATGC -3
Sanger αυτοματοποίηση DNA fragmentation (10 6 επικαλυπτόμενα θραύσματα, 2000-10000bp) (Cloned to a plasmid vector and PCR amplification) Cyclic sequencing reaction Separation by capillary electrophoresis Readout with fluorescent tags (μία μόνο αντίδραση, 500bp) https://www.youtube.com/watch?v=itbthmhnnbe
Επικάλυψη - Depth (coverage) in DNA sequencing Depth =N x L /G (G): length of the original genome, (μήκος γονιδιώματος) (N): number of reads, (αριθμός αναγνώσεων -θραυσμάτων (L) : average read length, (αριθμός βάσεων-θραυσμάτων) Deep sequencing : Depth >7 παράδειγμα: Για το ανθρώπινο γονιδίωμα G = 3Billion bp L = 500 bp χρειαζόμαστε δηλαδή 70 εκατομμύρια διαφορετικές αναγνώσεις αλληλουχιών για να έχουμε μια ικανοποιητική επικάλυψη, Depth ~12x
Α2. Μέθοδοι ανίχνευσης και ποσοτικοποίησης mrna 1. Real-time Quantitative PCR 2. Μικροσυστοιχίες RNA (RNA microarrays) 3. RNA sequence Evolution of transcriptomics technologies Northern Blot RT-PCR Microarrays (NGS) RNA-seq Single Genes Multiple genes Whole Genomes Populations of genomes
1. Real-time Quantitative PCR Μας επιτρέπει να πολλαπλασιάσουμε ένα κομμάτι DNA
Ποσοτικοποίηση έκφρασης γονιδίων (mrna) Step 1: Cell lysing and mrna isolation Step 2: cdna synthesis from mrna molecules (reverse transcriptase) Step 3: Selection of DNA primer specific for gene of interest Step 4: PCR cycles - DNA polymerase (Taq; Thermus aquaticus; 70-90 C) - Primer - deoxynucleosidetriphosphates (dntps) -Fluorescent probe (παρακολούθηση αριθμού σχηματιζόμενων κλώνων) SYBR Green [φθορισμός με τον σχηματισμό dsdna] TaqMan [φθορισμός κατά την επιμήκυνση του συγκεκριμένου γονιδίου, PacMan] Πολλαπλές αντιδράσεις σε 96 ή 384 well plates, κάθε αντίδραση μπορεί να χρησιμοποιεί primer για διαφορετικό γονίδιο. Επιτυγχάνεται σχετική ποσοτικοποίηση της έκφρασης <384 γονιδίων. Χρησιμοποιούνται Housekeeping γονίδια για κανονικοποίηση https://www.youtube.com/watch?v=figgkkclluo
Log fluorescence Cycle number Επιλογή threshold ώστε να τέμνει μέσα στη εκθετική φάση όλες τις καμπύλες Υπολογισμός του κύκλου (C T ) που χρειάστηκε κάθε αντίδραση για να φτάσει την κρίσιμη τιμή φθορισμού (threshold fluorescence) ιαφορά στις τιμές C T μεταξύ δύο αντιδράσεων (γονιδίων) C T δηλώνει 2 - CT φόρες μεγαλύτερη/μικρότερη έκφραση
Log normalized fluorescence ( Rn) Cycle number
Η σχετική έκφραση μεταξύ δύο καταστάσεων συνήθως ανάγεται ως προς γονίδια που παραμένουν σταθερά (Housekeeping) H ιαφορά της διαφοράς C T δηλώνει μεγαλύτερη/μικρότερη έκφραση (2 - CT ) φορές Παράδειγμα: http://www.ncbi.nlm.nih.gov/pubmed/23525470 Healthy tissue CEACAM19 CT=31.5 Housekeeping CT=26.5 Cancerous tissue CEACAM19 CT=29 Housekeeping CT=26 C T = (29-26)-(31.5-26.5)=-2 (2 - CT ) =4; CEACAM19 cancerous=4xhealthy Relative quantification of the CEACAM19 expression via real-time PCR. A representative amplification plot of CEACAM19 and HPRT1, in a randomly selected pair of matched cancerous (Ca) and non-cancerous (H) breast tissue parts. Τarget (CEACAM19) and the internal control (HPRT1) genes.
2. Μικροσυστοιχίες DNA (DNA microarrays) Φωτολιθογραφία για κατασκευή συστοιχιών ολιγονουκλεοτιδίων Αλληλουχία βάσεων με βάση ένα συγκεκριμένο γονίδιο Τα νουκλεοτίδια υβριδιώνονται με μόριο cdna που προέρχεται από mrna (αντίστροφη μεταγραφάση) Το μόριο cdna σημαδεύεται με χρωστική φθορισμού Υβριδίωση και ξέπλυμα Ανάλυση σήματος φθορισμού για την έκφραση 10 4 γονιδίων
https://www.youtube.com/watch?v=p9e3xfxbxy4
3. RNA-SEQ
Μακριά μόρια RNA μετατρέπονται σε μία βιβλιοθήκη θραυσμάτων cdna (RNA or DNA fragmentation) Sequencing adaptors (blue) προστίθενται σε κάθε cdna θραύσμα και γίνεται ανάγνωση μιάς μικρής αλληλουχίας βάσεων από κάθε κομμάτι cdna με NGS. Οι αλληλουχίες που προσδιορίζονται ευθυγραμμίζονται με τη βάση δεδομένων του συγκεκριμένου γονιδιώματος (reference genome or transcriptome), και προσδιορίζεται από πιο γονίδιο προέρχονται Ο αριθμός των αναγνώσεων (counts) που αντιστοιχούν σε ένα γονίδιο χρησιμοποιείται ως μέτρο της έκφρασης του γονιδίου αυτού. http://www.nature.com/nrg/journal/v10/n1/fig_tab/nrg2484_f1.html
παράδειγμα: Sample 1 mrna A: 1000 bp B: 2000 bp #Reads A: 4 B: 4 other: 5,999,992 Total: 6 Million Sample 2 mrna A: 1000 bp B: 2000 bp #Reads A: 7 B: 10 other: 11,999,983 Total: 12 Million 0.4 4 Reads 1 Kbp x 6 Million Reads 4 Reads 2 Kbp x 6 Million Reads 7 Reads 1 Kbp x 12 Million Reads ο αριθμός των θραυσμάτων cdna άρα και των αναγνώσεων είναι ανάλογος των μορίων mrna δηλαδή της έκφρασης του συγκεκριμένου γονιδίου. ένα μεγάλο γονίδιο, ωστόσο, θα δημιουργήσει πιο πολλά θραύσματα και πιο πολλές αναγνώσεις κανονικοποίηση ως προς το μέγεθος του mrna και ως προς το συνολικό αριθμό αναγνώσεων RPKM : Reads per kb of exon per million mapped reads
RNA sequencing Samples of interest Isolate RNAs Generate cdna, fragment, size select, add linkers Condition 1 (normal colon) Condition 2 (colon tumor) Sequence ends Map to genome, transcriptome, and predicted exon junctions Downstream analysis 100s of millions of paired reads 10s of billions bases of sequence
Microarrays RNA-seq cost ($100-200/sample) simple analysis Higher dynamic range Higher sensitivity Capable of detecting splicing variants Capable of detecting mutations Detection of low-abundance transcripts Does not require species-specific probes Sequence may be unknown RNAseq may soon replace microarrays for many uses
RNA isolation https://www.youtube.com/watch?v=mgnicwbanka Microarrays vs RNA Sequencing https://www.youtube.com/watch?v=2c3t3tdemsu
Α3. Μέθοδοι σίγασης (silencing) και αφαίρεσης (knockout) γονιδίων 1. Knockout transgenic mice 2. sirna
1. Knockout transgenic mice determine a gene's function in relation to human health Method: harvesting embryonic stem (ES) cells insert artificial DNA into the chromosomes genetically altered ES cells are injected into mouse embryos and implanted into uterus mouse pups have some tissues in which a gene has been knocked out are crossbred to produce homozygous knockouts https://en.wikipedia.org/wiki/knockout_mouse
About 15 percent of gene knockouts are developmentally lethal, which means that the genetically altered embryos cannot grow into adult mice. The gene may serve a different function in adults than in developing embryos. Knocking out a gene also may fail to produce an observable change in a mouse or may even produce different characteristics from those observed in humans in which the same gene is inactivated. During development alternative pathways may compensate for the loss of the gene
2. sirna A short (usually 20 to 24-bp) double-stranded RNA (dsrna) with phosphorylated 5' ends and hydroxylated 3' ends with two overhanging nucleotides Design: Search for sequence motif AA(N 19 )TT or NA(N 21 ), or NAR(N 17 )YNN, where N is any nucleotide, R is purine (A, G) and Y is pyrimidine (C, U). http://www.rnaiweb.com/rnai/sirna_design
Delivery expression vector (shrna) to overcome transient effects of sirna transfection