Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Πρακτική Διαδικασία Βιοπληροφορική Ανάλυση Γονιδιωμάτων ΑΣΚΗΣΗ Ασθενείς που πάσχει απο Μεσογειακή αναιμία προσέρχεται σε εργαστήριο γενετικής για να διαπιστώσει ποιές μεταλλάξεις φέρει στο γονίδιο της β-σφαιρίνης. Ο γενετιστής μετά από αντίδραση PCR και αλληλούχιση του γονίδιο της β-σφαιρίνης του ασθενή σας παραδίδει τις εξής αλληλουχίες: Πειραματική Αλληλουχία Α (.bp) TCATCACTTAGACCTCACCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGG AGCAGGGAGGGCAGGAGCCAGGGCTGGGCATAAAAGTCAGGGCAGAGCCATCTATTGCTT ACATTTGCGTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATC TGACTCCTGAAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTT GGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAAT AGAAACTGGGCATGTGGAGACAGAGAAGACTCTTGGGTTTCTGATAGGCACTGACTCTCT CTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCTTGGACCCAGAG GTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAGGT GAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGCTCACCTGGACAA CCTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCC TGAGAACTTCAGGGTGAGTCTATGGGACGCTTGATGTTTTCTTTCCCCTTCTTTTCTATG GTTAAGTTCATGTCATAGGAAGGGGATAAGTAACAGGGTACAGTTTAGAATGGGAAACAG ACGAATGATTGCATCAGTGTGGAAGTCTCAGGATCGTTTTAGTTTCTTTTATTTGCTG Πειραματική Αλληλουχία Β (.bp) TCATCACTTAGACCTCACCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTACTCCCAGG AGCAGGGAGGGCAGGAGCCAGGGCTGGGCATAAAAGTCAGGGCAGAGCCATCTATTGCTT ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATC TGACTCCTGAGGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAG TTGGTGGTGAGGCCCTGGGCAGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCA ATAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTGGGTTTCTGATAGGCACTGACTCT CTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCTTGGACCCAG AGGTTCTTTGAATCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGGCAACCCTAAG GTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGCTCACCTGGAC AACCTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGAT CCTGAGAACTTCAGGGTGAGTCTATGGGACGCTTGATGTTTTCTTTCCCCTTCTTTTCTA TGGTTAAGTTCATGTCATAGGAAGGGGATAAGTAACAGGGTACAGTTTAGAATGGGAAAC AGACGAATGATTGCATCAGTGTGGAAGTCTCAGGATCGTTTTAGTTTCTTTTATTTGCTG Γιατί ο γενετιστής μας έχει δώσει δυο αλληλουχίες οι οποίες αναφέρονται στην ίδια γενετική περιοχή; Είναι ίδιες σε αλληλουχία και μέγεθος οι αλληλουχίες αυτές; Θα αναμένατε ή πρέπει να είναι ίδιες; Να βρείτε ποιες μεταλλάξεις φέρει ο ασθενείς, σε ποιο σημείο του γονιδίου είναι αυτές. Να τις χαρακτηρίσετε και να αιτιολογήσετε γιατί οι μεταλλάξεις αυτέ προκαλούν παθολογικό φαινότυπο. 1
Βήμα 1: Αναζήτηση και ανάκτηση αλληλουχιών που αφορούν την β-σφαιρίνη του ανθρώπου https://www.ncbi.nlm.nih.gov Ορίζω ότι αναζητώ gene Ορίζω ότι αναζητώ beta-globin Κάνω αναζήτηση Search Επιλέγω το πρώτο αποτέλεσμα της αναζήτησης με περιγραφή hemoglobin subunit beta [Homo sapiens (human]γιατί είναι αυτό που αναζητώ 2
Δίνεται η επιλογή στο χρήστη να δει πληροφορίες που αφορούν το επίπεδο του γονιδιώματος Genomic, το επίπεδο των μεταγράφων mrna και το επίπεδο των πρωτεϊνών Protein(s). Στο Genomic υπάρχει η επιλογή GenBank, FASTA Sequence Viewer Για το επίπεδο του γονιδιώματος Genomic. Επιλέγω GenBank Ο χρήστης μπορεί να δει πληροφορίες όπως: το μέγεθος του γονιδίου gene 1..1606 τις περιοχές που δίνουν ώριμο mrna mrna join(1..142,273..495,1346..1606) τα εξόνια του γονιδίου exon 1..142 number=1 exon 273..495 number=2 exon 1346..1606 number=3 την αλληλουχία όλου του γονιδίου χωρισμένη σε δεκάδες και με αρίθμηση ανά 60bp. Κάνουμε αντιγραφή και επικόλληση σε φύλλο word. beta-globin gene (GenBank) 1606bp 1 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 61 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 121 ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt aaggagacca 181 atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct 241 ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc ttggacccag 301 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 361 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 421 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 481 cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc ttcttttcta 541 tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag aatgggaaac 601 agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt ttatttgctg 661 ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct tctccgcaat 721 ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata tctctgagat 781 acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac tatttggaat 841 atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt atttttaatt 901 gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata tgtgtacaca 961 tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa 1021 tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat 1081 aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg 1141 ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat tgtaactgat 1201 gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg cttttatttt 1261 atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt 1321 catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca 1381 tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg 1441 tgtggctaat gccctggccc acaagtatca ctaagctcgc tttcttgctg tccaatttct 1501 attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt atgaagggcc 1561 ttgagcatct ggattctgcc taataaaaaa catttatttt cattgc Για το επίπεδο του γονιδιώματος Genomic. Επιλέγω FASTA. Ο χρήστης μπορεί να δει την αλληλουχία όλου του γονιδίου, χωρίς κενά, στοιχισμένη με ακρίβεια και χωρίς αρίθμηση. Κάνουμε αντιγραφή και επικόλληση σε φύλλο word. beta-globin gene (FASTA) 1606bp ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACCATGGTGCATCTGACTCCTGA GGAGAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAACGTGGATGAAGTTGGTGGTGAGGCCCTGGGC AGGTTGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCATGTGGAGACAGAGAAG ACTCTTGGGTTTCTGATAGGCACTGACTCTCTCTGCCTATTGGTCTATTTTCCCACCCTTAGGCTGCTGG TGGTCTACCCTTGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTGTCCACTCCTGATGCTGTTATGGG CAACCCTAAGGTGAAGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTGATGGCCTGGCTCACCTGGAC AACCTCAAGGGCACCTTTGCCACACTGAGTGAGCTGCACTGTGACAAGCTGCACGTGGATCCTGAGAACT TCAGGGTGAGTCTATGGGACGCTTGATGTTTTCTTTCCCCTTCTTTTCTATGGTTAAGTTCATGTCATAG GAAGGGGATAAGTAACAGGGTACAGTTTAGAATGGGAAACAGACGAATGATTGCATCAGTGTGGAAGTCT CAGGATCGTTTTAGTTTCTTTTATTTGCTGTTCATAACAATTGTTTTCTTTTGTTTAATTCTTGCTTTCT TTTTTTTTCTTCTCCGCAATTTTTACTATTATACTTAATGCCTTAACATTGTGTATAACAAAAGGAAATA TCTCTGAGATACATTAAGTAACTTAAAAAAAAACTTTACACAGTCTGCCTAGTACATTACTATTTGGAAT ATATGTGTGCTTATTTGCATATTCATAATCTCCCTACTTTATTTTCTTTTATTTTTAATTGATACATAAT CATTATACATATTTATGGGTTAAAGTGTAATGTTTTAATATGTGTACACATATTGACCAAATCAGGGTAA TTTTGCATTTGTAATTTTAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATA CTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAG AATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATCTCTGCATATAAATATTTCTGCATATAAAT TGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTT ATGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCATGTTCATACCTCTT ATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTCA CCCCACCAGTGCAGGCTGCCTATCAGAAAGTGGTGGCTGGTGTGGCTAATGCCCTGGCCCACAAGTATCA 3
CTAAGCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTCCAACTACTAAACT GGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTGCCTAATAAAAAACATTTATTTTCATTGC Για το επίπεδο των μεταγράφων mrna. Επιλέγω NM_000518.5. Ο χρήστης μπορεί να δει την αλληλουχία cdna του μετάγραφου, χωρισμένη σε δεκάδες και με αρίθμηση ανά 60bp. Τις εξωνικές περιοχές exon1 1-142, Ex 2 143-365 και exon3 366-628. Κάνουμε αντιγραφή και επικόλληση σε φύλλο word. beta-globin cdna 626bp 1 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 61 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 121 ttggtggtga ggccctgggc aggctgctgg tggtctaccc ttggacccag aggttctttg 181 agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag gtgaaggctc 241 atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac aacctcaagg 301 gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat cctgagaact 361 tcaggctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattca 421 ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat gccctggccc 481 acaagtatca ctaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 541 ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 601 taataaaaaa catttatttt cattgcaa Για το επίπεδο των πρωτεϊνών Protein(s). Επιλέγω NP_000509.1. Ο χρήστης μπορεί να δει την αλληλουχία αμινοξέων. Κάνουμε αντιγραφή και επικόλληση σε φύλλο word. beta-globin Protein 147αα 1 mvhltpeeks avtalwgkvn vdevggealg rllvvypwtq rffesfgdls tpdavmgnpk 61 vkahgkkvlg afsdglahld nlkgtfatls elhcdklhvd penfrllgnv lvcvlahhfg 121 keftppvqaa yqkvvagvan alahkyh ------------------------------------------------------------------------ 4
Βήμα 2: Επεξεργασία και έλεγχος των αλληλουχιών που έχουμε ανακτήσει Επισήμανση (πράσινο χρώμα) των εξωνικών περιοχών του γονιδίου exon1 (1-142), exon2 (273-495) και exon3 (1346-1606). beta-globin gene (GenBank) 1606bp 1 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 61 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 121 ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt aaggagacca 181 atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct 241 ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc ttggacccag 301 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 361 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 421 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 481 cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc ttcttttcta 541 tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag aatgggaaac 601 agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt ttatttgctg 661 ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct tctccgcaat 721 ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata tctctgagat 781 acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac tatttggaat 841 atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt atttttaatt 901 gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata tgtgtacaca 961 tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa 1021 tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat 1081 aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg 1141 ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat tgtaactgat 1201 gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg cttttatttt 1261 atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt 1321 catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca 1381 tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg 1441 tgtggctaat gccctggccc acaagtatca ctaagctcgc tttcttgctg tccaatttct 1501 attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt atgaagggcc 1561 ttgagcatct ggattctgcc taataaaaaa catttatttt cattgc Εντοπισμός θέσεων συρραφής (πράσινη επισήμανση)και του κωδικονίου έναρξης (ΑΤG) (κίτρινη επισήμανση) στο cdna. Εξωνικές περιοχές exon1 1-142, Ex 2 143-365 και exon3 366-628. beta-globin cdna 626bp 1 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 61 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 121 ttggtggtga ggccctgggc ag-gctgctgg tggtctaccc ttggacccag aggttctttg 181 agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag gtgaaggctc 241 atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac aacctcaagg 301 gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat cctgagaact 361 tcagg-ctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattca 421 ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat gccctggccc 481 acaagtatca ctaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 541 ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 601 taataaaaaa catttatttt cattgc (Προαιρετικό) Μετά το ATG (κωδικόνιο έναρξης) χωρίζουμε ανά 3bp (κωδικόνιο) την αλληλουχία έως το πρώτο κωδικόνιο λήξης (ΤΑΑ) (κόκκινη επισήμανση). Συνολικά 148 κωδικόνια. atg gtg cat ctg act cct gag gag aag tct gcc gtt act gcc ctg tgg ggc aag gtg aac gtg gat gaa gtt ggt ggt gag gcc ctg ggc ag-g ctg ctg gtg gtc tac cct tgg acc cag agg ttc ttt gag tcc ttt ggg gat ctg tcc act cct gat gct gtt atg ggc aac cct aag gtg aag gct cat ggc aag aaa gtg ctc ggt gcc ttt agt gat ggc ctg gct cac ctg gac aac ctc aag ggc acc ttt gcc aca ctg agt gag ctg cac tgt gac aag ctg cac gtg gat cct gag aac ttc agg-ctc ctg ggc aac gtg ctg gtc tgt gtg ctg gcc cat cac ttt ggc aaa gaa ttc acc cca cca gtg cag gct gcc tat cag aaa gtg gtg gct ggt gtg gct aat gcc ctg gcc cac aag tat cac taa 5
Μετάφραση της αλληλουχίας beta-globin cdna (626bp)στο ExPASy SIB Bioinformatics Resource Portal (https://web.expasy.org/translate/). Κάνουμε αντιγραφή και επικόλληση σε φύλλο word. 5'3' Frame 1 Met V H L T P E E K S A V T A L W G K V N V D E V G G E A L G R L L V V Y P W T Q R F F E S F G D L S T P D A V Met G N P K V K A H G K K V L G A F S D G L A H L D N L K G T F A T L S E L H C D K L H V D P E N F R L L G N V L V C V L A H H F G K E F T P P V Q A A Y Q K V V A G V A N A L A H K Y H Stop Συγκριτικός έλεγχος με την αλληλουχία beta-globin Protein (147aa) ---------------------------------------------------------------------------- 6
Βήμα 3: Έλεγχος της αλληλουχίας του ασθενή Ελέγχω την αλληλουχίας που μας έδωσε ο γενετιστής ώστε να πιστοποιήσω ότι αφορά το γονίδιο της β-σφαιρίνης. https://blast.ncbi.nlm.nih.gov/blast.cg. Επιλέγω Nucleotide BLAST. Επιλέγω Align two or more sequences. Εισάγω την άγνωστη αλληλουχία (πειραματική αλληλουχία Α) με αντιγραφή επικόλληση από το αρχείο word στο πλαίσιο εισαγωγής με αναφορά Enter Query Sequence. Εισάγω την γνωστή αλληλουχία του γονιδίου (αλληλουχία αναφοράς) με αντιγραφή επικόλληση από το αρχείο word στο πλαίσιο εισαγωγής με αναφορά Enter Subject Sequence. ΠΡΟΣΟΧΗ! Εισάγω την αλληλουχία beta-globin gene (FASTA)που δεν περιέχει κενά και αριθμούς. Επιλέγω BLAST. 7
Εισάγω την άγνωστη αλληλουχία (αλληλουχία πειραματική Β) και επαναλαμβάνω το ίδιο. Με την επιλογή Align two or more sequences θα γίνει ευθυγράμμιση των αλληλουχίων άρα μπορούμε να εντοπίσουμε το κωδικονίο έναρξης (ΑΤG)και τις εξωνικές περιοχές πιο εύκολα στην πειραματική αλληλουχία. Έλεγχος της ομολογίας των αλληλουχιών και εντοπισμός των διαφορών. Αξιολόγηση των διαφορών και χαρακτηρισμός τους. 8