ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Βιοπληροφορική. Ενότητα 2 η : Ανάλυση ακολουθίας Ηλίας Καππάς Τμήμα Βιολογίας

Σχετικά έγγραφα
Ιστορία της μετάφρασης

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Μηχανολογικό Σχέδιο Ι

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εκκλησιαστικό Δίκαιο

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Ιστορία της μετάφρασης

Εκκλησιαστικό Δίκαιο

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Διοικητική Λογιστική

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Οικονομία των ΜΜΕ. Ενότητα 7: Μορφές αγοράς και συγκέντρωση των ΜΜΕ

Εισαγωγή στους Αλγορίθμους

Παράκτια Τεχνικά Έργα

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Εισαγωγή στους Αλγορίθμους

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Γεωργική Εκπαίδευση Ενότητα 9

Εκκλησιαστικό Δίκαιο

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Οδοποιία IΙ. Ενότητα 14: Υπόδειγμα σύνταξης τευχών θέματος Οδοποιίας. Γεώργιος Μίντσης ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Φ 619 Προβλήματα Βιοηθικής

ΓΕΝΙΚΗ ΚΑΙ ΑΝΟΡΓΑΝΗ ΧΗΜΕΙΑ

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Εργαστήριο Χημείας Ενώσεων Συναρμογής

Συμπεριφορά Καταναλωτή

Γενικά Μαθηματικά Ι. Ενότητα 14: Ολοκλήρωση Κατά Παράγοντες, Ολοκλήρωση Ρητών Συναρτήσεων Λουκάς Βλάχος Τμήμα Φυσικής

Επιμέλεια μεταφράσεων και εκδοτικός χώρος

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Εργαστήριο Χημείας Ενώσεων Συναρμογής

Διπλωματική Ιστορία Ενότητα 2η:

Μάθηση σε νέα τεχνολογικά περιβάλλοντα

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Βέλτιστος Έλεγχος Συστημάτων

Οικονομία των ΜΜΕ. Ενότητα 9: Εταιρική διασπορά και στρατηγικές τιμολόγησης

Εισαγωγή στους Αλγορίθμους

ΑΡΙΣΤΟΤΕΛΕΙΟ ΑΝΟΙΚΤΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΑ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΑΘΗΜΑΤΑ Γενικά Μαθηματικά Ι Ενότητα 11 : Ακολουθίες και Σειρές Λουκάς Βλάχος Τμήμα Φυσικής

Γενικά Μαθηματικά Ι. Ενότητα 1: Συναρτήσεις και Γραφικές Παραστάσεις. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Εκκλησιαστικό Δίκαιο

Αξιολόγηση και ανάλυση της μυϊκής δύναμης και ισχύος

Διοικητική Λογιστική

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Στρατηγικό Μάρκετινγκ

Μηχανολογικό Σχέδιο Ι

Διδακτική της Πληροφορικής

Δομές Δεδομένων Ενότητα 1

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Διδακτική της Περιβαλλοντικής Εκπαίδευσης

Χώρος και Διαδικασίες Αγωγής

Μηχανολογικό Σχέδιο Ι

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Εργαστήριο Χημείας Ενώσεων Συναρμογής

Χώρος και Διαδικασίες Αγωγής

Διαγλωσσική μεταφορά και διαμεσολάβηση

Βάσεις Περιβαλλοντικών Δεδομένων

Γενικά Μαθηματικά Ι. Ενότητα 9: Κίνηση Σε Πολικές Συντεταγμένες. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Διοίκηση Επιχειρήσεων

Ευαγγελικές αφηγήσεις της Ανάστασης

Συμπεριφορά Καταναλωτή

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΓΕΝΕΤΙΚΗΣ

Φ 619 Προβλήματα Βιοηθικής

Τεχνικό Σχέδιο - CAD

Επιμέλεια μεταφράσεων και εκδοτικός χώρος

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Γενικά Μαθηματικά Ι. Ενότητα 16: Ολοκλήρωση Τριγωνομετρικών Συναρτήσεων, Γενικευμένα Ολοκληρώματα Λουκάς Βλάχος Τμήμα Φυσικής

Μάρκετινγκ Εξαγωγών. Ενότητα 3 : Το Περιβάλλον και το Διεθνές Μάρκετινγκ Κοινωνικο-Πολιτιστικό Περιβάλλον

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Χώρος και Διαδικασίες Αγωγής

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού Υπέρθερμου Ατμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στην Διοίκηση Επιχειρήσεων

ΓΕΝΙΚΗ ΚΑΙ ΑΝΟΡΓΑΝΗ ΧΗΜΕΙΑ

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Μάρκετινγκ Αγροτικών Προϊόντων

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Επικοινωνία Ανθρώπου- Υπολογιστή Σχεδίαση Αλληλεπίδρασης

Συγκριτικό Εκκλησιαστικό Δίκαιο

Διαγλωσσική μεταφορά και διαμεσολάβηση

Γενικά Μαθηματικά Ι. Ενότητα 5: Παράγωγος Πεπλεγμένης Συνάρτησης, Κατασκευή Διαφορικής Εξίσωσης. Λουκάς Βλάχος Τμήμα Φυσικής

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Οικονομετρία. Εξειδίκευση του υποδείγματος. Μορφή της συνάρτησης: Πολυωνυμική, αντίστροφη και αλληλεπίδραση μεταβλητών

Συνταγματικό Δίκαιο Ενότητα 11:Εκτελεστική Λειτουργία

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Συγκριτικό Εκκλησιαστικό Δίκαιο

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

Ιστορία της Αρχιτεκτονικής και των Στυλ

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 2 η : Ανάλυση ακολουθίας Ηλίας Καππάς

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Περιεχόμενα ενότητας Ανάλυση ακολουθίας Βασικές αρχές Μορφοποίηση FASTA Εργαλεία ανάλυσης ακολουθιών Καθορισμός μεταγραφικής μονάδας Μετάφραση νουκλεοτιδικών αλληλουχιών 4

Ανάλυση ακολουθίας Ανάλυση ακολουθιών (sequence analysis) είναι η μελέτη βιολογικών αλληλουχιών με σκοπό την πρόβλεψη λειτουργιών, αλληλεπιδράσεων, εξελικτικών σχέσεων, και ίσως και της δομής βιολογικών μορίων. Με άλλα λόγια η διαδικασία με την οποία προσπαθούμε να μάθουμε τι κρύβει μια νουκλεοτιδική ή αμινοξική αλληλουχία, εφαρμόζοντας τεχνικές in silico. 5

Ανάλυση ακολουθίας - Βασικές αρχές Χρησιμοποιείστε προγράμματα από έμπιστα sites (πανεπιστήμια, εταιρίες) Προσπαθήστε να έχετε εναλλακτικές λύσεις για κάθε πρόγραμμα που χρησιμοποιείτε συχνά Διαβάστε τις οδηγίες. Ελέγξτε ποιο είναι το ζητούμενο input για κάθε πρόγραμμα Δε λειτουργούν όλα τα προγράμματα σε όλες τις περιπτώσεις. Κάποια προγράμματα έχουν σχεδιαστεί για συγκεκριμένο οργανισμό ή ομάδα οργανισμών (π.χ. ευκαρυώτες) 6

FASTA Format - Εξήγηση Πρόκειται για τη μορφή ακολουθίας που αναγνωρίζουν και χρησιμοποιούν τα περισσότερα προγράμματα ανάλυσης. Η πρώτη γραμμή αρχίζει πάντα με το σύμβολο ">" και μια σύντομη περιγραφή. Η περιγραφή μπορεί να αφορά οτιδήποτε επιθυμεί ο χρήστης. Ακολουθεί η αλληλουχία με 60-80 χαρακτήρες/στήλη (ΧΩΡΙΣ ΚΕΝΑ ΚΑΙ ΝΟΥΜΕΡΑ) Όταν η ακολουθία λαμβάνεται από μια Βάση Δεδομένων (GenBank ή EMBL), η περιγραφή αντιπροσωπεύει τα παρακάτω : GenBank generated FASTA report: >gb accession locus description EMBL generated FASTA report: >emb accession locus description DDBJ generated FASTA report: >dbj accession locus description SWISS-PROT generated FASTA report: >sp accession entry name nr (non-redundant) database generated FASTA report; sequences derived from other databases: >gi gi_identifier accession of nucleotide sequence from which it was derived description Accession and locus refer to the ACCESSION and LOCUS numbers in the database. 7

FASTA Format >embl U75687 DAU75687 Drosophila auraria heat shock protein 83 (hsp83) gene, complete cds. cgtgtgcttgcgaacgaaaataagcttgtgaatttgcaattcttgcacaaagaaaagtga aaatttataaatttttatctttattctgtgaatagaaagaaaaacatacaaggtgagtaa ttaacttaaagcaattaatcaagcacaaagaaaatttgcaagaaaacgcacacgtctcgg aatgctcttgacccatttgcctgccgaatattgattttaaagttctagaagccaagaatc ggcattcgattaaatattctcttgctttaattgcataaaaaggtttttgcggcgtctcca agggtgattcaacgcacacacacacacacattcattcgcaaaaaatgccggcttttcggc tagatagctttctggaaacttcttttccacgaatcatgaattaaacaatgtgcaaattag gccgattaattagaaaacccttttttttctttagcccacacgtggtttttcttgcatttc gattaccaaacacatttaaacacactttgcacatgtctcacacatacacagacgcatacg catagaagccaatgagcaatgcgggcaaaaatggcgtcagtttgtgaaaaaaaacttaaa cacatttatatattcctttaattaggttttcttttatagttttttggttttttttcgttg ccaaggagatgcgttttctcgactttctagatgtttccaattttcaatgtgcacacatac atacacatgcatgtatacagtggtggttagagaaagagaaaagaagaaaaaaaaagttaa ttttcaactccatgtttaaataaatttaatttaaaattttaatgtaaaaataaaatctaa tagataaatcaaattatttaaatgcatgatgttaaaataatgcaatgggcatagtacaaa tgcggttgctattttttcgactgctagtgtagatgcgtagatgcgcatgtggtggtgaaa aaaaaagagaacaaagccaaacaagcagctgttcagttttccaaatccgaattttactaa tcccgtctaaatcccttacagatgcctgaggaagcagagaccttcgctttccaggctgag atcgctcagctgatgtcgctgatcatcaacacattctactcgaacaaggagatcttcctg cgcgagttgatctcgaacgcctccgatgctctggacaagatccgctacgagtcgctgact gaccccagcaagcttgactctggcaaggagctgtacatcaagctcattcccaacaagacg gccggcacgctgaccatcatcgataccggtatcggcatgaccaagtccgatttggtcaac aacctgggaaccatcgccaagtctggcaccaaggcgttcatggaggctctgcaggccggc gccgacatttccatgatcggtcagttcggtgtgggtttctactccgcctacttggtcgcc gacaaggtgactgtcacctcgaagaacaacgatgacgagcagtacatctgggagtcgtct gccggcggttccttcaccgtgcgcgctgacaactctgagcctcttggccgcggcaccaag atcgttctgtacatcaaggaggatcagaccgattaccttgaggagagcaagatcaaggag atcgtgaacaagcactcgcagttcatcggctatcccatcaagctgctcgtcgagaaggag cgcgagaaggaggtcagcgacgatgaggctgatgatgacaagaaggaggacgagaagaag gagatggacaccgatgagcccaagatcgaggatgttggcgaagatgaggatgcggacaag aaggacaaggatgccaagaagaagaagaccatcaaggagaagtacaccgaggatgaggag ctgaacaagaccaagcccatctggactcgcaaccccgatgatatctcccaggaggaatac ggcgagttctacaagtctctgaccaacgactgggaggaccatttggccgtgaagcacttc tcggtggagggacagttggagttccgcgctctgctcttcatcccccgtcgcacccccttc FASTA format COURIER NEW Η αγαπημένη γραμματοσειρά των αλληλουχιών 8

EMBL File Format ID embl U75687 DAU75687 standard; DNA; UNC; 3313 BP. XX DE embl U75687 DAU75687 Drosophila auraria heat shock protein 83 (hsp83) gene, DE complete cds.... SQ Sequence 2460 BP; CGTGTGCTTG CGAACGAAAA TAAGCTTGTG AATTTGCAAT TCTTGCACAA AGAAAAGTGA 60 AAATTTATAA ATTTTTATCT TTATTCTGTG AATAGAAAGA AAAACATACA AGGTGAGTAA 120 TTAACTTAAA GCAATTAATC AAGCACAAAG AAAATTTGCA AGAAAACGCA CACGTCTCGG 180 AATGCTCTTG ACCCATTTGC CTGCCGAATA TTGATTTTAA AGTTCTAGAA GCCAAGAATC 240 GGCATTCGAT TAAATATTCT CTTGCTTTAA TTGCATAAAA AGGTTTTTGC GGCGTCTCCA 300 AGGGTGATTC AACGCACACA CACACACACA TTCATTCGCA AAAAATGCCG GCTTTTCGGC 360 TAGATAGCTT TCTGGAAACT TCTTTTCCAC GAATCATGAA TTAAACAATG TGCAAATTAG 420 GCCGATTAAT TAGAAAACCC TTTTTTTTCT TTAGCCCACA CGTGGTTTTT CTTGCATTTC 480 GATTACCAAA CACATTTAAA CACACTTTGC ACATGTCTCA CACATACACA GACGCATACG 540 CATAGAAGCC AATGAGCAAT GCGGGCAAAA ATGGCGTCAG TTTGTGAAAA AAAACTTAAA 600 CACATTTATA TATTCCTTTA ATTAGGTTTT CTTTTATAGT TTTTTGGTTT TTTTTCGTTG 660 CCAAGGAGAT GCGTTTTCTC GACTTTCTAG ATGTTTCCAA TTTTCAATGT GCACACATAC 720 ATACACATGC ATGTATACAG TGGTGGTTAG AGAAAGAGAA AAGAAGAAAA AAAAAGTTAA 780 TTTTCAACTC CATGTTTAAA TAAATTTAAT TTAAAATTTT AATGTAAAAA TAAAATCTAA 840 TAGATAAATC AAATTATTTA AATGCATGAT GTTAAAATAA TGCAATGGGC ATAGTACAAA 900 TGCGGTTGCT ATTTTTTCGA CTGCTAGTGT AGATGCGTAG ATGCGCATGT GGTGGTGAAA 960 AAAAAAGAGA ACAAAGCCAA ACAAGCAGCT GTTCAGTTTT CCAAATCCGA ATTTTACTAA 1020 TCCCGTCTAA ATCCCTTACA GATGCCTGAG GAAGCAGAGA CCTTCGCTTT CCAGGCTGAG 1080 ATCGCTCAGC TGATGTCGCT GATCATCAAC ACATTCTACT CGAACAAGGA GATCTTCCTG 1140 CGCGAGTTGA TCTCGAACGC CTCCGATGCT CTGGACAAGA TCCGCTACGA GTCGCTGACT 1200 GACCCCAGCA AGCTTGACTC TGGCAAGGAG CTGTACATCA AGCTCATTCC CAACAAGACG 1260 GCCGGCACGC TGACCATCAT CGATACCGGT ATCGGCATGA CCAAGTCCGA TTTGGTCAAC 1320 AACCTGGGAA CCATCGCCAA GTCTGGCACC AAGGCGTTCA TGGAGGCTCT GCAGGCCGGC 1380 GCCGACATTT CCATGATCGG TCAGTTCGGT GTGGGTTTCT ACTCCGCCTA CTTGGTCGCC 1440 GACAAGGTGA CTGTCACCTC GAAGAACAAC GATGACGAGC AGTACATCTG GGAGTCGTCT 1500 GCCGGCGGTT CCTTCACCGT GCGCGCTGAC AACTCTGAGC CTCTTGGCCG CGGCACCAAG 1560 ATCGTTCTGT ACATCAAGGA GGATCAGACC GATTACCTTG AGGAGAGCAA GATCAAGGAG 1620 ATCGTGAACA AGCACTCGCA GTTCATCGGC TATCCCATCA AGCTGCTCGT CGAGAAGGAG 1680 CGCGAGAAGG AGGTCAGCGA CGATGAGGCT GATGATGACA AGAAGGAGGA CGAGAAGAAG 1740 GAGATGGACA CCGATGAGCC CAAGATCGAG GATGTTGGCG AAGATGAGGA TGCGGACAAG 1800 AAGGACAAGG ATGCCAAGAA GAAGAAGACC ATCAAGGAGA AGTACACCGA GGATGAGGAG 1860 CTGAACAAGA CCAAGCCCAT CTGGACTCGC AACCCCGATG ATATCTCCCA GGAGGAATAC 1920 GGCGAGTTCT ACAAGTCTCT GACCAACGAC TGGGAGGACC ATTTGGCCGT GAAGCACTTC 1980 TCGGTGGAGG GACAGTTGGA GTTCCGCGCT CTGCTCTTCA TCCCCCGTCG CACCCCCTTC 2040 GATCTGTTCG AGAACCAAAA GAAGCGCAAC AACATCAAGC TCTACGTGCG CCGCGTGTTC 2100 ATCATGGACA ACTGCGAGGA TCTCATTCCC GAGTACTTGA ACTTCATCAA GGGCGTGGTC 2160 GACTCTGAGG ATCTGCCTCT GAACATCTCC CGTGAGATGT TGCAGCAGAA CAAGGTGCTG 2220 AAGGTGATCC GCAAGAACTT GGTCAAGAAG ACCATGGAGC TGATCGAGGA GCTGACCGAG 2280 GACAAGGAGA ACTACAAGAA GTTCTACGAC CAGTTCAGCA AGAACCTTAA GCTGGGCGTG 2340 CACGAGGACA GCAACAACCG CGCCAAGCTG GCCGATTTCT TGCGCTTCCA CACCTCCGCC 2400 TCTGGCGACG ATTTCTGCTC CCTGTCCGAC TACGTGTCGC GCATGAAGGA GAACCAGAAG 2460 // Τέλος αλληλουχίας Η πρώτη γραμμή στην καταχώρηση από την οποία προέρχεται η ακολουθία EMBL identifier Γραμμή DE - Περιγραφή ακολουθίας 4η γραμμή Ξεκινά με τα γράμματα SQ, στη συνέχεια το μέγεθος της ακολουθίας σε bp 5η γραμμή Αρχή ακολουθίας 9

Genomatix Genomatix: Αποτελεί ένα εργαλείο για την ανάλυση DNA ακολουθιών (αλλαγή format μιας ακολουθίας, ποσοστά βάσεων, reverse complement κλπ). http://www.genomatix.de/cgi-bin/tools/tools.pl 10

Mobyle@Pasteur Mobyle@Pasteur: Αποτελεί μια διαδικτυακή πύλη ποικίλων βιοπληροφορικών αναλύσεων. http://mobyle.pasteur.fr/cgi-bin/portal.py#welcome Παρέχει τη δυνατότητα για ένα μεγάλο εύρος αναλύσεων: εύρεση μοτίβων, εύρεση θέσεων κοπής ενζύμων περιορισμού, αναζήτηση γονιδίων, αναζήτηση μεταγραφικών παραγόντων, εύρεση αντίστροφης και συμπληρωματικής αλυσίδας. 11

Mobyle@Pasteur - revseq Από την ιστοσελίδα του Mobyle@Pasteur, επιλέγεται το πρόγραμμα revseq (εύρεση αντίστροφης και συμπληρωματικής αλυσίδας) http://mobyle.pasteur.fr/cgi-bin/portal.py#forms::revseq Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγεται το format στο οποίο θα γίνει εξαγωγή των αποτελεσμάτων και στη συνέχεια Run Γίνεται εξαγωγή του αποτελέσματος 12

Restriction Analysis ΠΟΣΟ ΓΡΗΓΟΡΑ ΚΙ ΕΥΚΟΛΑ ΜΠΟΡΕΙΤΕ ΝΑ ΑΝΑΖΗΤΗΣΕΤΕ ΤΟ ΜΟΤΙΒΟ ΜΕΣΑ ΣΕ ΜΙΑ ΑΚΟΛΟΥΘΙΑ 2000 bp? Με άλλα λόγια η ακολουθία που μελετάτε περιέχει θέση αναγνώρισης του ενζύμου περιορισμού EcoRI? 13

Mobyle@Pasteur remap (1/2) Από την ιστοσελίδα του Mobyle@Pasteur, επιλέγεται το πρόγραμμα remap (εμφάνιση ακολουθίας με θέσεις αναγνώρισης ενζύμων περιορισμού) http://mobyle.pasteur.fr/cgibin/portal.py#forms::remap Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγονται οι κατάλληλες ρυθμίσεις και στη συνέχεια Run Γίνεται εξαγωγή του αποτελέσματος 14

Mobyle@Pasteur remap (2/2) Αποτέλεσμα του remap DAU75687 Drosophila auraria heat shock protein 83 (hsp83) gene, complete cds. HindIII AluBI CviRI CviJI TspEI SetI MwoI ApoI BstAPI Cac8I TspEI CviRI \ \ \ \ \ \\ \ \ cgtgtgcttgcgaacgaaaataagcttgtgaatttgcaattcttgcacaaagaaaagtga 10 20 30 40 50 60 ----:---- ----:---- ----:---- ----:---- ----:---- ----:---- gcacacgaacgcttgcttttattcgaacacttaaacgttaagaacgtgtttcttttcact / / / / / / / / / Cac8I HindIII CviRI CviJI TspEI AluBI BstAPI SetI MwoI CviRI TspEI ApoI R V L A N E N K L V N L Q F L H K E K * V C L R T K I S L * I C N S C T K K S E C A C E R K * A C E F A I L A Q R K V K ----:---- ----:---- ----:---- ----:---- ----:---- ----:---- R T S A F S F L S T F K C N K C L S F H X H A Q S R F Y A Q S N A I R A C L F T T H K R V F I L K H I Q L E Q V F F L S PsiI ApoI ApoI SetI TspEI TspEI TspEI \ \ \ \ \ aaatttataaatttttatctttattctgtgaatagaaagaaaaacatacaaggtgagtaa 70 80 90 100 110 120 ----:---- ----:---- ----:---- ----:---- ----:---- ----:---- tttaaatatttaaaaatagaaataagacacttatctttctttttgtatgttccactcatt / / / / PsiI TspEI SetI TspEI ApoI ApoI K F I N F Y L Y S V N R K K N I Q G E * N L * I F I F I L * I E R K T Y K V S N I Y K F L S L F C E * K E K H T R * V I ----:---- ----:---- ----:---- ----:---- ----:---- ----:---- F N I F K * R * E T F L F F F M C P S Y F I * L N K D K N Q S Y F S F C V L H T F K Y I K I K I R H I S L F V Y L T L L 15

Mobyle@Pasteur - fuzznuc Από την ιστοσελίδα του Mobyle@Pasteur, επιλέγεται το πρόγραμμα fuzznuc (εύρεση μοτίβων σε μια νουκλεοτιδική ακολουθία) http://mobyle.pasteur.fr/cgi-bin/portal.py#forms::fuzznuc Εισάγεται η ακολουθία στην κατάλληλη περιοχή Εισάγεται το μοτίβο που αναζητείται (π.χ. taatta) και στη συνέχεια επιλέγεται Run Γίνεται εξαγωγή του αποτελέσματος (αναφέρονται οι θέσεις στις οποίες βρέθηκε το μοτίβο) 16

Καθορισμός μεταγραφικής μονάδας Μεταγραφική μονάδα 17

GENSCAN GENSCAN: Εύρεση γονιδίων http://genes.mit.edu/genscan.html Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγεται ο οργανισμός από τον οποίο προέρχεται η ακολουθία και Run GENSCAN Γίνεται εξαγωγή του αποτελέσματος (θέσεις εξωνίων, προβλεπόμενη πεπτιδική ακολουθία) 18

Berkeley Drosophila Genome Project Παρέχει τη δυνατότητα για πρόβλεψη θέσεων ματίσματος http://www.fruitfly.org/seq_tools/splice.html Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγεται ο οργανισμός από τον οποίο προέρχεται η ακολουθία και Submit Γίνεται εξαγωγή του αποτελέσματος (θέσεις εξωνίων, ιντρονίων) 19

NCBI - ORF Finder Ανάλυση ακολουθίας μπορεί να πραγματοποιηθεί και από την ιστοσελίδα του NCBI http://www.ncbi.nlm.nih.gov/guide/sequence-analysis/ Επιλέγεται το εργαλείο ORF Finder http://www.ncbi.nlm.nih.gov/gorf/gorf.html Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγεται ο κατάλληλος γενετικός κώδικας και OrfFind Γίνεται εξαγωγή του αποτελέσματος (αναγνωστικά πλαίσια) 20

NCBI ORF Finder Επιλέγεται ένα από τα ανοιχτά αναγνωστικά πλαίσια Πραγματοποίηση ανάλυσης με το BLAST Επιλέγεται ο κατάλληλος τύπος του blast και στη συνέχεια BLAST Στο παράθυρο που προκύπτει επιλέγεται View report Γίνεται εξαγωγή των αποτελεσμάτων (εάν υπάρχει ομοιότητα με κάποια κατατεθειμένη ακολουθία την εμφανίζει) Συνήθως ένα από τα αναγνωστικά πλαίσια θα βρεθεί ότι κωδικοποιεί κάποια πρωτεΐνη 21

NCBI - ORF Finder Εικόνα 1: Παράδειγμα αποτελεσμάτων μετά την ανάλυση με το blastp. 22

Μετάφραση ακολουθίας Υπάρχει εναλλακτική λύση πιθανά πιο γρήγορη?

BLASTx Από την ιστοσελίδα του BLAST επιλέγεται το blastx http://blast.ncbi.nlm.nih.gov/blast.cgi?program=blastx &PAGE_TYPE=BlastSearch&LINK_LOC=blasthome Εισάγεται η ακολουθία στην κατάλληλη περιοχή Επιλέγεται ο κατάλληλος γενετικός κώδικας και BLAST Γίνεται εξαγωγή των αποτελεσμάτων (πρωτεΐνη που κωδικοποιεί η συγκεκριμένη νουκλεοτιδική ακολουθία, εφόσον είναι κατατεθειμένη, ή συγγενικές πρωτεΐνες που μοιάζουν με την ακολουθία που αναζητείται) 24

DNA RNA Protein Εικόνα 2: Μετάφραση DNA 25

Μετάφραση νουκλεοτιδικών αλληλουχιών ΠΑΡΑΜΕΤΡΟΙ Μετάφραση και στα 6 πιθανά αναγνωστικά πλαίσια Κάποιοι οργανισμοί δε χρησιμοποιούν τον standard γενετικό κώδικα Εναλλακτικά κωδικόνια έναρξης Αμινοξέα υπό μορφή ενός ή τριών γραμμάτων 26

The Bio-Web Περιλαμβάνει νέα, εργαλεία, βιβλία, πηγές και ανάπτυξη διαδικτυακών εφαρμογών που αφορούν τη Μοριακή και Κυτταρική Βιολογία καθώς και την http://www.cellbiol.com/ Περιλαμβάνει πολλά εργαλεία για την ανάλυση αλληλουχιών 27

Σημείωμα Χρήσης Έργων Τρίτων Εικόνα 2: http://commons.wikimedia.org/wiki/file:0324_dna_translation_and_codons.jpg, by OpenStax College, CC BY 3.0, http://creativecommons.org/licenses/by/3.0/deed.en

Σημείωμα Αναφοράς Copyright, Ηλίας Καππάς, «, Ανάλυση ακολουθίας». Έκδοση: 1.0. Θεσσαλονίκη 2014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://opencourses.auth.gr/eclass_courses.

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά - Παρόμοια Διανομή [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. [1] http://creativecommons.org/licenses/by-sa/4.0/

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Σας ευχαριστώ! Ηλίας Καππάς, Λέκτορας Τμήματος Βιολογίας Α.Π.Θ.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Τέλος ενότητας Επεξεργασία: Στυλιανή Μηνούδη Θεσσαλονίκη, Εαρινό εξάμηνο 2014

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων μαζί με τους συνοδευόμενους υπερσυνδέσμους.