ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΫΛΙΚΩΝ 2 ΜΕΡΟΣ Α Α. ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Η αναζήτηση και εύρεση κατάλληλης επιστημονικής βιβλιογραφίας αποτελεί το πρώτο και κυριότερο στάδιο για την προσέγγιση και επίλυση ερευνητικών προβλημάτων. Η βιβλιογραφική αναζήτηση πραγματοποιείται με πρόσβαση σε βάσεις δεδομένων χρησιμοποιώντας κατάλληλες λέξεις-κλειδιά. Το αποτέλεσμα και η συνάφεια των αποτελεσμάτων εξαρτάται από την επιλογή των λέξεων καθώς και τη θέση τους στο κείμενο (τίτλος, περίληψη, κυρίως σώμα). Στην πλειοψηφία των βάσεων δίνεται η δυνατότητα εφαρμογής φίλτρων ώστε να περιοριστούν τα αποτελέσματα της αναζήτησης (ημερομηνία, ονόματα συγγραφέων κ.ά.). Η PubMed περιλαμβάνει περισσότερες από 21 106 βιβλιογραφικές αναφορές από τη MEDLINE (βιβλιογραφική βάση δεδομένων της U.S. National Library of Medicine, NLM), από περιοδικά επιστημών υγείας, χημείας και βιοτεχνολογίας, καθώς και βιβλία. Δημιουργήθηκε και παρέχεται δωρεάν από το National Center for Biotechnology Information (NCBI). Οι εγγραφές περιλαμβάνουν τις περιλήψεις των άρθρων, αλλά και συνδέσμους στο πλήρες κείμενο των άρθρων, στους ιστότοπους των εκδοτών και σε άλλες βάσεις μοριακών δεδομένων του NCBI. Το περιεχόμενο των άρθρων περιγράφεται από τα MeSH Terms, ένα ελεγχόμενο λεξιλόγιο βιοϊατρικών όρων της NLM. Ο χρήστης της PubMed έχει τη δυνατότητα να επιλέξει τον τρόπο εμφάνισης των αποτελεσμάτων, να εφαρμόσει φίλτρα προκειμένου να περιορίσει τα αποτελέσματα της αναζήτησης και να ανακτήσει σχετικές πληροφορίες από άλλες βάσεις δεδομένων. Παράλληλα, χρησιμοποιώντας την επιλογή Advanced search, μπορεί να συνδυάσει ποικίλα κριτήρια ώστε να προβεί σε σύνθετες αναζητήσεις. Το ScienceDirect είναι μια βάση δεδομένων επιστημονικών άρθρων από 2500 περιοδικά και 11000 βιβλία. Αποτελεί τμήμα του εκδοτικού οίκου Elsevier, που δραστηριοποιείται στους τομείς της επιστήμης, της τεχνολογίας και της ιατρικής. Ο οίκος Elsevier έχει ψηφιοποιήσει πληθώρα περιοδικών που είχαν εκδοθεί πριν το 1995, επιτρέποντας πρόσβαση μέσω του Η/Υ σε άρθρα από το 1823 (The Lancet). Το ScienceDirect παρέχει τη δυνατότητα απλής και σύνθετης αναζήτησης με χρήση λογικών τελεστών, την
εμφάνιση των άρθρων με τις περισσότερες αναφορές, τη μαζική ανάκτηση πολλών άρθρων, την ανάκτηση συμπληρωματικού υλικού όπως αρχείων ήχου και video, καθώς και την πρόσβαση στο πλήρες κείμενο από μη πιστοποιημένες διευθύνσεις με τη χρήση κωδικών πρόσβασης.
ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ Αναζήτηση στην PubMed. Επισκεφθείτε την ιστοσελίδα του NCBI (http://www.ncbi.nlm.nih.gov/). Στο πεδίο All Databases επιλέξτε MeSH, αναζητείστε και καταγράψτε τον ορισμό για τις πρωτεΐνες odorant receptors. Στο Related information, επιλέξτε PubMed ώστε να μεταβείτε στην σελίδα της PubMed που περιλαμβάνει βιβλιογραφία σχετική με τις πρωτεΐνες odorant receptors. Πόσα άρθρα βρήκατε; Χρησιμοποιώντας τις επιλογές Items per page και Sort by από το Display Settings (Σχήμα 1.1) εμφανίστε στην οθόνη 50 αποτελέσματα ταξινομημένα κατά ημερομηνία δημοσίευσης (Pub Date). Περιορίστε τα αποτελέσματα της αναζήτησης σε όσα άρθρα έχουν ελεύθερα προσβάσιμο (text availability) το πλήρες κείμενό τους (Free full text available) κάνοντας χρήση του αντίστοιχου φίλτρου. Πόσα άρθρα βρήκατε; Καταγράψτε τις 5 πρώτες βιβλιογραφικές αναφορές (συγγραφείς, τίτλο, περιοδικό, έτος, σελίδες). Στο πάνω τμήμα της σελίδας επιλέξτε Advanced, ώστε να προβείτε σε μία σύνθετη αναζήτηση. Διαγράψτε τα φίλτρα που έχετε εφαρμόσει (clear all). Αναζητείστε άρθρα που έχουν στον τίτλο ή στην περίληψή τους (Title/Abstract) τις λέξεις - κλειδιά odorant receptors και anopheles και έχουν δημοσιευθεί από το 2000 και μετά (Date - Publication). Πόσα άρθρα βρήκατε; Στο πεδίο Find related data επιλέξτε Nucleotide, ώστε να αναζητήσετε εγγραφές της βάσης δεδομένων GenBank που αναφέρονται στα άρθρα που βρήκατε. Καταγράψτε τα Accession Numbers των 5 πρώτων εγγραφών και αποθηκεύστε τις ακολουθίες τους σε μορφή FASTA. Επιστρέψτε στην προηγούμενη σελίδα και περιορίστε τα αποτελέσματα της αναζήτησης σε όσα άρθρα έχουν ελεύθερα προσβάσιμο το πλήρες κείμενό τους (Free full text available) κάνοντας χρήση του αντίστοιχου φίλτρου. Επιλέξτε ένα από τα άρθρα και ακολουθώντας τους συνδέσμους μεταβείτε στο πλήρες κείμενο. Καταγράψτε τη βιβλιογραφική αναφορά και την πρώτη πρόταση του κυρίως κειμένου.
Β. ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Μια βιολογική βάση δεδομένων χρησιμοποιείται για την οργάνωση, αποθήκευση, επεξεργασία, αναζήτηση και ανάκτηση της βιολογικής πληροφορίας. Τα δεδομένα τα οποία συναντώνται στις βιολογικές βάσεις είναι αυτά που παράγονται από τη βιολογική έρευνα (κυρίως της μοριακής βιολογίας). Ενδεικτικοί τύποι δεδομένων: νουκλεοτιδικές ακολουθίες (DNA και mrna) και ολόκληρα γονιδιώματα πρωτεϊνικές ακολουθίες 3-D δομές πρωτεϊνών και νουκλεϊνικών οξέων δεδομένα γονιδιακής έκφρασης δεδομένα γενετικής ποικιλότητας (πολυμορφισμοί) Πληροφορίες σχετικά με τις διαθέσιμες ΒΒ καθώς και εργαλεία λογισμικού μπορούν να αναζητηθούν σε εξειδικευμένα επιστημονικά περιοδικά ή ιστότοπους, όπως: Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection (http://nar.oxfordjournals.org/) Database: The Journal of Biological Databases and Curation (http://database.oxfordjournals.org/) NCBI Resource Guide (http://www.ncbi.nlm.nih.gov/guide/all/) Υπάρχουν πολλές εξειδικευμένες βάσεις δεδομένων, ωστόσο στο πλαίσιο της συγκεκριμένης άσκησης θα επικεντρωθούμε στις βασικές κατηγορίες και στις πιο αντιπροσωπευτικές κάθε κατηγορίας, που είναι ελεύθερα προσβάσιμες στην επιστημονική κοινότητα. Βάσεις νουκλεοτιδικών δεδομένων Οι βάσεις δεδομένων νουκλεοτιδικών ακολουθιών καθιστούν ελεύθερα διαθέσιμα, στην επιστημονική κοινότητα, ετερογενή στοιχεία που ποικίλλουν όσον αφορά στην προέλευση του υλικού (π.χ. γονιδίωμα έναντι cdna), στην ποιότητά του, στην έκταση του σχολιασμού και στην πληρότητα της ακολουθίας σχετικά με το βιολογικό στόχο (π.χ. πλήρους έναντι μερικής κάλυψης ενός γονιδίου ή ενός γονιδιώματος). Οι τρεις μεγαλύτερες βάσεις νουκλεοτιδικών δεδομένων που είναι ελεύθερα διαθέσιμες είναι οι: DNA Data Bank of Japan (DDBJ) στο Center for Information Biology (CIB) (http://www.ddbj.nig.ac.jp/) GenBank στο National Center for Biotechnology Information (NCBI)
(http://www.ncbi.nlm.nih.gov/genbank/) EMBL_Bank στο European Bioinformatics Institute (EBI) (http://www.ebi.ac.uk/embl/index.html). Οι βάσεις αυτές σε συνεργασία έχουν δημιουργήσει την International Nucleotide Sequence Database Collaboration (http://www.insdc.org/). Η συνεργασία μεταξύ τους περιλαμβάνει τη δημιουργία κοινών κανόνων για την ταξινόμηση και το χαρακτηρισμό των δεδομένων. Μια τυπική εγγραφή στη μορφοποίηση της GenBank αποτελείται από γραμμές. Η πρώτη λέξη κάθε γραμμής υποδηλώνει το είδος της πληροφορίας που ακολουθεί (παράρτημα Α). Κάθε εγγραφή τελειώνει με τους χαρακτήρες //. Η νουκλεοτιδική ακολουθία μπορεί να ανακτηθεί στη μορφοποίηση FASTA (Σχήμα 1). Η πρώτη γραμμή ξεκινά με το χαρακτήρα > και δίνει μια σύντομη περιγραφή της ακολουθίας, η οποία εμφανίζεται στις επόμενες γραμμές. >gi 209751317 gb EU891385.1 Escherichia coli regulator for SOS regulon (ECs5026) gene, complete cds ATGAAAGCGTTAACGGCCAGGCAACAAGAGGTGTTTGATCTCATCCGTGATCACATC AGCCAGACAGGTA TGCCGCCGACGCGTGCGGAAATCGCGCAGCGTTTGGGGTTCCGTTCCCCAAACGCG GCTGAAGAACATCT GAAGGCGCTGGCACGCAAAGGCGTAATTGAAATTGTTTCCGGCGCATCACGCGGGA TTCGTCTGTTGCAG GAAGAGGAAGAAGGGTTGCCACTGGTAGGTCGTGTGGCTGCCGGTGAACCGCTTCT GGCGCAACAGCATA TTGAAGGTCATTATCAGGTCGATCCTTCCTTGTTCAAGCCGAATGCTGATTTCCTGCT GCGCGTCAGCGG GATGTCGATGAAAGATATCGGCATTATGGATGGCGACTTGCTGGCAGTGCATAAAA CTCAGGATGTACGT AACGGTCAGGTCGTTGTCGCACGTATTGATGACGAAGTTACCGTTAAGCGCCTGAAA AAACAGGGCAATA AAGTCGAACTGTTGCCAGAAAATAGCGAGTTTAAACCAATTGTCGTTGACCTTCGTC AGCAGAGCTTCAC CATTGAAGGGCTGGCGGTTGGCGTTATTCGCAACGGCGACTGGCTGTAA Σχήμα 1. Νουκλεοτιδική ακολουθία σε μορφοποίηση FASTA.
Βάσεις πρωτεϊνικών δεδομένων Η UniProt (http://www.uniprot.org/) αποτελεί την περιεκτικότερη παγκόσμια συλλογή πληροφοριών για πρωτεΐνες (ακολουθία και λειτουργία), η οποία προέκυψε από τη συνεργασία των Swiss-Prot, που παρέχει ένα υψηλό επίπεδο σχολιασμού (όπως περιγραφή της λειτουργίας μιας πρωτεΐνης, των μετα-μεταφραστικών τροποποιήσεων, κ.λ.π.), ένα ελάχιστο επίπεδο πλεονασμού και υψηλό επίπεδο ολοκλήρωσης διασύνδεσης με άλλες ΒΒ. TrEMBL, που αποτελεί το συμπλήρωμα της Swiss-Prot. Περιλαμβάνει εγγραφές που δεν έχουν ακόμα ενσωματωθεί στη Swiss-Prot και έχουν προκύψει από τη μετάφραση των καταχωρημένων νουκλεοτιδικών εγγραφών της EMBL. Ο σχολιασμός της γίνεται αυτοματοποιημένα. PIR, που προέκυψε από τον Atlas of Protein Sequence and Structure (1965-1978) της Margaret Dayhoff και εξελίχθηκε σε μια ολοκληρωμένη πηγή δεδομένων και αναλυτικών εργαλείων. Βάσεις πρωτεϊνικών οικογενειών και domains Οι βάσεις πρωτεϊνικών οικογενειών και domains προέκυψαν από την ανάλυση των πρωτογενών βάσεων πρωτεϊνικών ακολουθιών. Παρέχουν πληροφορίες σχετικά με περιοχές των πρωτεϊνών που έχουν καλά συντηρημένη ακολουθία και συγκεκριμένη λειτουργία/δομή, και έχουν εξελιχθεί σε σημαντικά εργαλεία για την εύρεση απομακρυσμένων σχέσεων σε νέες ακολουθίες, καθώς και την εξαγωγή συμπερασμάτων για την πρωτεϊνική λειτουργία. Διαφέρουν μεταξύ τους ως προς τις μεθόδους ανάλυσης των πρωτεϊνικών ακολουθιών, όπως είναι οι κανονικές εκφράσεις (regular expressions), τα προφίλ (profiles) και τα μοντέλα HMMs (Hidden Markov Models). Κάποιες από τις βάσεις αυτές είναι: PROSITE (http://prosite.expasy.org/) PFAM (http://pfam.sanger.ac.uk/) PRINTS (http://www.bioinf.manchester.ac.uk/dbbrowser/prints/) PRODOM (http://prodom.prabi.fr/) SMART (http://smart.embl-heidelberg.de/)
Η InterPro (http://www.ebi.ac.uk/interpro/index.html) είναι το αποτέλεσμα της ολοκλήρωσης των προαναφερθέντων ΒΒ, με στόχο την περιεκτικότερη εποπτεία των διαθέσιμων πόρων. Το πρόγραμμα InterProScan επιτρέπει την αναζήτηση των πρωτεϊνικών μοτίβων σε μια ακολουθία.
ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ Α. Αναζήτηση δεδομένων στην UniProt Μεταβείτε στην ιστοσελίδα της UniProt (http://www.uniprot.org/) και αναζητείστε πληροφορίες σχετικά με την πρωτεΐνη μεταφεράση της φωσφοριβοσυλιωμένης γουανίνης (Hypoxanthineguanine phosphoribosyltransferase ή hprt ή hgprt). Εισάγετε τον όρο hprt στο πεδίο αναζήτησης, πατήστε Advanced Search και στο πεδίο Organism εισάγετε τον όρο homo sapiens (Σχήμα 2). Από τα αποτελέσματα επιλέξτε την εγγραφή με κωδικό P00492. 1. Καταγράψτε το μήκος της αμινοξικής ακολουθίας (Sequence length), τη λειτουργία (Function) και τον ενδοκυττάριο εντοπισμό (Subcellular location) της πρωτεΐνης. 2. Με ποια ασθένεια σχετίζεται η συγκεκριμένη πρωτεΐνη (Involvement in disease); Καταγράψτε μία μετάλλαξη που συνδέεται με την εν λόγω ασθένεια (Natural variations). 3. Ακολουθήστε τον υπερσύνδεσμο στην PROSITE και καταγράψτε το μοτίβο (Consensus pattern) που χαρακτηρίζει την οικογένεια ενζύμων στην οποία ανήκει η hprt. 4. Επιστρέψτε στην σελίδα της UniProt και ακολουθήστε τον υπερσύνδεσμο στην KEGG. Με ποια μεταβολικά μονοπάτια (Pathway) σχετίζεται το συγκεκριμένο ένζυμο; Β. Αναζήτηση δεδομένων στο Entrez Επισκεφθείτε την ιστοσελίδα του NCBI (http://www.ncbi.nlm.nih.gov/ncbisearch/) και εντοπίστε τη γενωμική ακολουθία του γονιδίου cystic fibrosis transmembrane conductance regulator (CFTR). Επιλέξτε τη ΒΒ Nucleotide και στο πεδίο Search χρησιμοποιήστε την αναζήτηση: CFTR[Title]
Με τη βοήθεια των επιλογών στο δεξιό μέρος της οθόνης, περιορίστε τα αποτελέσματά σας στις εγγραφές της RefSeq (Reference Sequence collection), που παρέχει ένα περιεκτικό και καλά σχολιασμένο σύνολο ακολουθιών, και στον οργανισμό Homo Sapiens. Επιλέξτε την εγγραφή με κωδικό Accession: NG_016465.3 Ποιο είναι το μήκος της ακολουθίας (LOCUS); Σε ποιο χρωμόσωμα και σε ποια θέση βρίσκεται το γονίδιο (FEATURES _ source _ /map); Ποιος είναι ο αριθμός των εξονίων και ποιες οι 10 πρώτες βάσεις της γενωμικής ακολουθίας; Επιλέξτε τον υπερσύνδεσμο Reference sequence information _ RefSeq mrna και μεταβείτε στην αντίστοιχη εγγραφή. Ποιος είναι ο κωδικός αριθμός της εγγραφής και ποιο το μήκος της ακολουθίας (LOCUS); Ποιες είναι οι 10 πρώτες βάσεις της mrna ακολουθίας; Χρησιμοποιώντας τον υπερσύνδεσμο Reference sequence information _ RefSeq protein product, καταγράψτε το μήκος της πρωτεΐνης και τα 10 πρώτα αμινοξέα. Στη συνέχεια, μεταβείτε στην ΟΜΙΜ, μελετήστε την εγγραφή για το γονίδιο CFTR με κωδικό *602421 και καταγράψτε τις ασθένειες με τις οποίες συνδέεται το συγκεκριμένο γονίδιο.
ΒΙΒΛΙΟΓΡΑΦΙΑ 1. Bioinformatics A Practical Guide to the Analysis of Genes and Proteins. A. D. Baxevanis, B.F.F. Ouellette, Wiley Interscience, 2001. 2. Advanced Data Mining Technologies in Bioinformatics. H.-H. Hsu, Idea Group Publishing, 2006. 3. Bioinformatics Algorithms Techniques and Applications. I. I. Mǎndoiu, A. Zelikovsky, John Wiley & Sons, Inc., 2001.
ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΫΛΙΚΩΝ 2 ΜΕΡΟΣ Β ΣΧΕΔΙΑΣΜΟΣ ΕΚΚΙΝΗΤΩΝ ΓΙΑ ΑΛΛΗΛΟΥΧΙΣΗ ΚΑΙ ΕΝΙΣΧΥΣΗ ΜΕΣΩ PCR ΕΙΣΑΓΩΓΗ Η αλυσιδωτή αντίδραση της πολυμεράσης (Polymerase Chain Reaction, PCR ) είναι μια in vitro μέθοδος για τον πολλαπλασιασμό μιας συγκεκριμένης αλληλουχίας DNA. Έτσι, ακόμη και ένα μόνο αντίγραφο γονιδίου μπορεί να πολλαπλασιαστεί μέσα σε λίγες ώρες σε εκατομμύρια αντίτυπα με τη αυτή μέθοδο. Κάθε κύκλος στη μέθοδο PCR περιλαμβάνει τα ακόλουθα βήματα: A. Αποδιάταξη της δίκλωνης δομής του DNA σε μονόκλωνο DNA με επώαση σε υψηλή θερμοκρασία. Η θερμοκρασία, όπως και ο χρόνος επώασης, εξαρτάται από το ποσοστό γουανίνης και κυτοσίνης (G:C) του συγκεκριμένου DNA. B. Σύνδεση των εκκινητών (primers) με την αλληλουχία στόχο. Οι εκκινητές είναι μονόκλωνα τμήματα DNΑ, μεγέθους 15 έως και 30 νουκλεοτιδίων, τα οποία είναι συμπληρωματικά ως προς τα 5 άκρα των αλυσίδων της αλληλουχίας στόχου. Οι εκκινητές υβριδίζονται, λόγω της συμπληρωματικότητας στις κατάλληλες περιοχές του DNA στόχου. Η θερμοκρασία, όπως και ο χρόνος επώασης, εξαρτάται από το ποσοστό G:C του συγκεκριμένου DNA. C. Επιμήκυνση του DNA κατά μήκος της αλληλουχίας στόχου από την DNA πολυμεράση με την προσθήκη νουκλεοτιδίων στο 3 άκρο των εκκινητών. Επανάληψη του κύκλου αυτού πολλές φορές οδηγεί σε λογαριθμική αύξηση της ποσότητας του DNA στόχου. Συνεπώς ο αριθμός των κύκλων επηρεάζει ως ένα βαθμό την τελική ποσότητα του DNA. Η DNA πολυμεράση που χρησιμοποιείται είναι θερμοανθεκτική και θερμοενεργή. Απομονώνεται από το θερμόφιλο βακτήριο Thermus aquaticus. Για να έχει η αντίδραση της PCR τη μέγιστη απόδοση θα πρέπει οι προς σχεδιασμό εκκινητές να πληρούν της παρακάτω προϋποθέσεις: 1. Το μήκος τους θα πρέπει να κυμαίνεται από 18-24 νουκλεοτίδια, ώστε να είναι συμπληρωματικοί με μια μόνο περιοχή της αλυσίδας-μήτρας και η υβριδοποίηση να μη γίνεται σε τυχαίο σημείο.
2. Το ποσοστό των αζωτούχων βάσεων GC θα πρέπει να αποτελεί το 40-60% του συνολικού αριθμού νουκλεοτιδίων του εκκινητή, για να επιτευχθεί έτσι ισχυρότερη πρόσδεση με την αλληλουχία στόχο. 3. Στο 3 - άκρο θα πρέπει να περιέχονται οι βάσεις Α, Τ ώστε να διευκολυνθεί η επιμήκυνση της νέας αλυσίδας από την πολυμεράση. 4. Οι θερμοκρασίες υβριδοποίησης των δύο εκκινητών θα πρέπει να είναι παραπλήσιες και να κυμαίνονται από 50 o C -70 o C. Οι θερμοκρασίες αυτές υπολογίζονται με βάση τη θερμοκρασία Τ melting (Τ m ) των εκκινητών. Αυτή ορίζεται ως η θερμοκρασία εκείνη στην οποία το 50% του DNA είναι δίκλωνο και το άλλο 50% μονόκλωνο. Ο τύπος με τον οποίο γίνεται ο υπολογισμός αυτός είναι Τ m =4(G+C)+2(A+T). 5. Οι εκκινητές δε θα πρέπει να φέρουν στην αλληλουχία τους διαδοχικές επαναλήψεις του ίδιου νουκλεοτιδίου. Έτσι αποφεύγεται η πρόσδεσή τους σε επαναλαμβανόμενες αλληλουχίες της μήτρας. 6. Οι αλληλουχίες των δύο εκκινητών δεν πρέπει να είναι συμπληρωματικές μεταξύ τους. Διαφορετικά είναι πιθανό να υβριδοποιηθούν μεταξύ τους και να μην προσδέσουν στο DNA-στόχο. 7. Οι αλληλουχίες των εκκινητών δεν πρέπει να είναι παλινδρομικές, δηλαδή δεν πρέπει να υπάρχει συμπληρωματικότητα μεταξύ των διαφορετικών περιοχών του ίδιου εκκινητή. Αν συμβεί αυτό, είναι πολύ πιθανό ο εκκινητής να εμφανίσει δευτεροταγείς δομές (φουρκέτα ή θηλιά), οι οποίες δεν θα επιτρέψουν την πρόσδεσή του στο DNA-στόχο.
Εικόνα 1: Σχηματική απεικόνιση PCR ΑΠΟΜΟΝΩΣΗ ΓΕΝΕΤΙΚΟY YΛΙΚΟY (EXTRACTION) Το αρχικό γενετικό υλικό του δείγματος μπορεί να ληφθεί από οποιοδήποτε ιστό ή βιολογικό υγρό. Για την απομόνωση του γενετικού υλικού, είτε αυτό είναι DNA είτε είναι RNA υπάρχουν κάποιες βασικές αρχές. To RNA βρίσκεται στην υδάτινη φάση, το DNA βρίσκεται στην ενδιάμεση, ενώ οι πρωτεΐνες, τα λιπίδια και οι υδατάνθρακες στην οργανική. Το υγρό που περιέχει τις πρωτεΐνες απομακρύνεται. Το γενετικό υλικό μετατρέπεται σε ίζημα με τη δράση της ισοπροπανόλης. Ακολουθούν βήματα έκπλυσης με αιθανόλη προκειμένου να ληφθεί αυτό καθαρό. Επιλέγεται το κατάλληλο στρώμα στο σωληνάριο, ανάλογα με το γενετικό υλικό που θέλουμε να απομονώσουμε (DNA ή RNA). Σήμερα, υπάρχουν πρωτόκολλα
για την αποφυγή της χρήσης χλωροφορμίου και φαινόλης, που βασίζονται σε χρήση εναλλακτικών διαλυμάτων και σε στήλες φυγοκέντρισης που χρησιμοποιούν φίλτρα (spin columns). RT-PCR Αν το γενετικό υλικό που αναζητούμε είναι RNA, τότε μεσολαβεί μετατροπή του σε συμπληρωματικό DNA (cdna) με τη μέθοδο της ανάστροφης μεταγραφής (Reverse- Transcription). Το cdna δημιουργείται με βάση την αλληλουχία του RNA που έχει απομονωθεί από το δείγμα. Αυτό γίνεται με τη βοήθεια ενός ενζύμου, της ανάστροφης μεταγραφάσης. Ακολουθεί η PCR. ΑΠΟΤΕΛΕΣΜΑ Μετατροπή του RNA σε cdna με τη βοήθεια της Ανάστροφης Μεταγραφάσης Μετά την περιγραφείσα μετατροπή ακολουθεί η κανονική PCR που εφαρμόζεται και απ ευθείας μετά την απομόνωση του γενετικού υλικού, όταν αυτό είναι DNA. NESTED PCR Για να αυξηθεί η ευαισθησία της PCR όταν τα δείγματά μας βρίσκονται σε πολύ μικρές συγκεντρώσεις, υπάρχει και η nested-pcr. Αυτή η μέθοδος χρησιμοποιεί το προϊόν της πρώτης PCR για να επαναλάβει την αντίδραση με άλλους εσωτερικούς εκκινητές που μεγεθύνουν μικρότερο τμήμα του DNA. Έτσι, αυξάνεται παράλληλα και η εξειδίκευση της PCR. MULTIPLEX PCR Στη Multiplex PCR (mpcr) χρησιμοποιούνται περισσότερα από ένα ζεύγη εκκινητών για τον ταυτόχρονο έλεγχο περισσότερων γονιδίων. REAL-TIME PCR Στα πλαίσια της προόδου της τεχνολογίας και της συνεχούς έρευνας στην μοριακή βιολογία, έχει αρχίσει να επικρατεί μια νέα μοριακή μέθοδος, βασισμένη και αυτή στην αρχή της PCR. Είναι η λεγόμενη PCR πραγματικού χρόνου (Real-time PCR) ή ποσοτική PCR (Quantitative PCR ή qpcr). Η διαφορά με τη συμβατική PCR είναι ότι ενώ σ εκείνη εμφανίζεται μόνο το τελικό προϊόν σε gel αγαρόζης με
ηλεκτροφόρηση, στην Real-time PCR, όπως φανερώνει και η ονομασία της, γίνεται ποσοτικοποίηση του DNA σε κάθε κύκλο ξεχωριστά με τη βοήθεια χρωστικών που φθορίζουν και laser που είναι προσαρμοσμένα στον θερμοκυκλοποιητή. Στο παράδειγμα που ακολουθεί επιλέχτηκε το γονίδιο Ε4 το οποίο ξεκινά από την θέση 3332 και τερματίζει στην θέση 3619 της αλληλουχία του συνολικού γονιδιώματος (γονιδίωμα του HPV (Human papilloma virus, ιός των ανθρωπίνων θηλωμάτων)). Προκειμένου να διασφαλιστεί η ενίσχυση ολόκληρου του επιλεγμένου κομματιού, επιλέγεται ως μήτρα τμήμα τέτοιο που περιλαμβάνει 300 νουκλεοτίδια εκατέρωθεν της αλληλουχίας στόχου. Πιο συγκεκριμένα, επιλέχθηκε ως μήτρα η αλληλουχία του γονιδίου στόχου με την περιοχή 3032-3331 upstream του γονιδίου και 3620-3920 downstream αυτού. Ο σχεδιασμός των εκκινητών πραγματοποιείται με χρήση του προγράμματος Primer-BLAST από την σελίδα του NCBI: http://www.ncbi.nlm.nih.gov (National Center for Biotechnology Information). Εικόνα 2: Primer Blast Για την εύρεση των εκκινητών, αρχικά γίνεται εισαγωγή της αλληλουχίας του οργανισμού σε μορφή FASTA ή εναλλακτικά εισάγεται ο αριθμός με τον οποίο είναι κατατεθειμένη η συγκεκριμένη αλληλουχία και κατόπιν ορίζονται οι περιοχές αναζήτησης των εκκινητών.
Εικόνα 3: Εισαγωγή της αλληλουχίας και ορισμός πεδίου εύρεσης των εκκινητών. Στη συνέχεια γίνεται επιλογή των επιθυμητών παραμέτρων, οι οποίες έχουν ως εξής: Primer length: 18-24 Tm: 55ºC -65ºC GC%: 45%-65% Allowed melting temperature difference: 1.5ºC Όλες οι υπόλοιπες επιλογές αφήνονται ως έχουν, ενώ στην επιλογή organism επιλέγεται το είδος του οργανισμού που χρησιμοποιείται. Στις εικόνες που ακολουθούν φαίνεται η παραμετροποίηση που έγινε προκειμένου να ληφθούν οι κατάλληλοι εκκινητές για την ενίσχυση του γονιδίου Ε4.
Εικόνα 4: Επιλογή παραμέτρων. Εικόνα 5: Επιλογή παραμέτρων.
Εικόνα 6: Επιλογή παραμέτρων. Μετά την ολοκλήρωση της παραμετροποίησης γίνεται αναζήτηση των εκκινητών ( get primers). Τα αποτελέσματα της αναζήτησης παρουσιάζονται παρακάτω. Εικόνα 7: Γραφική απεικόνιση των εκκινητών που προέκυψαν.
Εικόνα 8: Εμφάνιση των χαρακτηριστικών των προτεινόμενων εκκινητών. Ακολούθως, χρησιμοποιήθηκε το πρόγραμμα Oligo Analyser 1.2, το οποίο παρέχεται από το πακέτο ανάλυσης Oligo Software και προσφέρει αυστηρότερο έλεγχο της καταλληλότητας των εκκινητών που πρόκειται να επιλεχθούν. Αρχικά, πραγματοποιήθηκε έλεγχος του κάθε εκκινητή ξεχωριστά και στη συνέχεια και των δυο μαζί προκειμένου να αξιολογηθεί η πιθανότητα σχηματισμού διμερών μεταξύ τους. Για την αξιολόγηση κάθε εκκινητή εισάγεται η αντίστοιχη αλληλουχία του στο πρόγραμμα Oligo Analyzer και επιλέγεται ( properties). Για την αξιολόγηση σχηματισμού διμερών μεταξύ δύο εκκινητών εισάγονται και οι δυο αλληλουχίες και επιλέγεται ( multiplex).
Εικόνα 9: Αξιολόγηση upper primer με το πρόγραμμα Oligo Analyzer.
Εικόνα 10: Αξιολόγηση lower primer με το πρόγραμμα Oligo Analyzer. Εικόνα 11: Αξιολόγηση των δυο εκκινητών προς σχηματισμό διμερών.
Οι εκκινητές που προέκυψαν είναι: Upper primer: AAGTTCATGCGGGTGGTCAG Lower primer: TTGGTCACGTTGCCATTCAC DNA sequencing Η εξακρίβωση της αλληλουχίας των βάσεων ενός τμήματος DNA (DNA sequencing) γίνεται με δυο μεθόδους. Η πρώτη μέθοδος περιγράφηκε από τους W. Maxam και M. Gilbert, ενώ η δεύτερη από τον Sanger. Η μέθοδος που χρησιμοποιείται όλο και περισσότερο τα τελευταία χρόνια είναι η διεξοδική μέθοδος του Sanger. Η μέθοδος αυτή βασίζεται στην χρήση 2,3 - διδεοξυνουκλεοτιδίων, τα οποία είναι ανάλογα των τριφωσφορικών νουκλεοζιτών. Σύμφωνα με την μέθοδο αυτή, η περιοχή του DNA που πρόκειται να αλληλουχηθεί, κλωνοποιείται σε ένα πλασμίδιο. Στη συνέχεια, αφού απομονωθεί πλασμιδιακό DNA αυτό κόβεται με ένζυμο περιορισμού σε σημείο έξω από αυτό που ενδιαφέρει και σε μικρή απόσταση. Η μέθοδος στηρίζεται στην ενζυμική ενσωμάτωση ενός νουκλεοτιδίου στην επιμηκυνόμενη αλυσίδα του DNA. Για να γίνει αυτό είναι απαραίτητη η χρήση ενός συνθετικού εκκινητή, ο οποίος υβριδίζεται στο μονόκλωνο μόριο του DNA, κοντά στη θέση προς ανάλυση. Πραγματοποιούνται λοιπόν τέσσερις αντιδράσεις με DNA πολυμεράση και τέσσερα τριφωσφορικά νουκλεοτίδια (dntps), όπου στην κάθε μια εμπεριέχεται σε μικρή ποσότητα και ένα 2,3 -διδεοξυνουκλεοτίδιο (ddntp). Το χαρακτηριστικό των ddntp είναι ότι όταν αυτά ενσωματωθούν στην επιμηκυνόμενη αλληλουχία δεν επιτρέπουν το σχηματισμό επιπλέον διφωσφορικού δεσμού και συνεπώς η επιμήκυνση της αλυσίδας του DNA σταματά στο συγκεκριμένο σημείο. Χρησιμοποιώντας τέσσερις διαφορετικές ενζυμικές αντιδράσεις και προσθέτοντας σε κάθε μία ένα διαφορετικό διδεοξυνουκλεοτίδιο, δημιουργούνται τέσσερις πληθυσμοί μορίων DNA με μήκος εξαρτώμενο από τη θέση του αντίστοιχου διδεοξυνουκλεοτιδίου στην επιμηκυνόμενη αλυσίδα. Οι αλληλουχίες που μπορούν να αναλυθούν με την μέθοδο αυτή έχουν μέγεθος 500-600 νουκλεοτίδια. Για την αλληλούχιση μεγαλύτερων κομματιών DNA χρησιμοποιούνται άλλες μέθοδοι, όπως είναι η μέθοδος γνωστή ως περπάτημα του εκκινητή (primer walking).
Έστω ότι επιλέγεται προς αλληλούχιση το γονίδιο E4 του οποίου το μήκος επιτρέπει την αλληλούχιση του σε μια αντίδραση. Για το σχεδιασμό των εκκινητών χρησιμοποιήθηκε το πρόγραμμα Oligo Explorer 1.2 και η διαδικασία εύρεσης των εκκινητών έγινε χειροκίνητα. Αρχικά εισάγεται η αλληλουχία- στόχος ενώ από το διάγραμμα Tm που εμφανίζεται μπορεί να γίνει η επιλογή του κατάλληλου εκκινητή. Και σε αυτή την περίπτωση οι επιλεγόμενοι εκκινητές πρέπει να πληρούν τις προϋποθέσεις που αναφέρθηκαν στη περίπτωση διεξαγωγής της αλυσιδωτής αντίδρασης της πολυμεράσης. Εικόνα 12: Εύρεση κατάλληλου εκκινητή για αλληλούχιση με το πρόγραμμα Oligo Explorer. Η επιλογή του εκκινητή επιβεβαιώθηκε και με το πρόγραμμα Oligo Analyzer.
Εικόνα 13: Αξιολόγηση καταλληλότητας εκκινητή για αλληλούχιση με το πρόγραμμα Oligo Analyzer.
ΒΙΒΛΙΟΓΡΑΦΙΑ Bartlett, J. M. S.; Stirling, D. (2003). "A Short History of the Polymerase Chain Reaction". PCR Protocols 226. pp. 3 6. doi:10.1385/1-59259-384-4:3. ISBN 1-59259-384-4. Saiki, R.; Scharf, S.; Faloona, F.; Mullis, K.; Horn, G.; Erlich, H.; Arnheim, N. (1985). "Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia". Science 230 (4732): 1350 1354. doi:10.1126/science.2999980. PMID 2999980. Saiki, R.; Gelfand, D.; Stoffel, S.; Scharf, S.; Higuchi, R.; Horn, G.; Mullis, K.; Erlich, H. (1988). "Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase". Science 239 (4839): 487 491. doi:10.1126/science.2448875. PMID 2448875. Cheng, S.; Fockler, C.; Barnes, W. M.; Higuchi, R. (1994). "Effective Amplification of Long Targets from Cloned Inserts and Human Genomic DNA". Proceedings of the National Academy of Sciences 91 (12): 5695 5699. doi:10.1073/pnas.91.12.5695. PMC 44063. PMID 8202550. Carr, A.C.; Moore, S.D. (2012). "Robust quantification of polymerase chain reactions using global fitting". In Lucia, Alejandro. PloS ONE 7 (5): e37640. doi:10.1371/journal.pone.0037640. PMC 3365123. PMID 22701526. Sambrook, J. and Russel D. W. (2001). Molecular Cloning: A Laboratory Manual (3rd ed.). Cold Spring Harbor, N.Y.: Cold Spring Harbor Laboratory Press. ISBN 0-879-69576-5. Chapter 8: In vitro Amplification of DNA by the Polymerase Chain Reaction. Pavlov, A. R.; Pavlova, N. V.; Kozyavkin, S. A.; Slesarev, A. I. (2004). "Recent developments in the optimization of thermostable DNA polymerases for efficient applications ". Trends in Biotechnology 22 (5): 253 260. doi:10.1016/j.tibtech.2004.02.011. PMID 15109812. Rychlik, W.; Spencer, W.J.; Rhoads, R.E. (1990). "Optimization of the annealing temperature for DNA amplification in vitro". Nucl Acids Res 18 (21): 6409 6412. doi:10.1093/nar/18.21.6409. PMC 332522. PMID 2243783. Kennedy, I. M.; Haddow, J. K.; and Clements, J. B. A negative regulatory element in the human papillomavirus type 16 genome acts at the level of late mrna stability. J. Virol. 65 (4), 2093-2097 (1991).