ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST

Σχετικά έγγραφα
ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Πρόβλημα. Σύνολο γνωστών αλληλουχιών

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Κεφάλαιο 5 ο : Αλγόριθµοι Σύγκρισης Ακολουθιών Βιολογικών εδοµένων

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

LALING/PLALING :

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙ: Ευριστικές μέθοδοι αναζήτησης σε βάσεις δεδομένων

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Κατα ζέυγη στοίχιση και στατιστική σημαντικότητα αυτής

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Συγκριτική Γονιδιωματική

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment) Blast

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Πίνακες αντικατάστασης PAM και BLOSUM και εναλλακτικές προσεγγίσεις

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών Μέρος ΙΙΙ: Έλεγχος στατιστικής σημαντικότητας

ΕΠΑΝΑΛΗΨΗ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Εφαρμοσμένη Βιοτεχνολογία Εργαστηριακή Άσκηση Εισαγωγή στην Βιοπληροφορική

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Εργαστήριο Εφαρμοσμένης Πληροφορικής

Μέθοδοι μελέτης εξέλιξης

ΔΗ Μ Ι Ο ΥΡ Γ Ι Α W I K I με τ η χρήση τ η ς υπ ηρεσίας h t t p : / id ot.com /

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πάτρας

Εγχειρίδιο Χρήσης-Οδηγός Εκπαίδευσης Χρηστών. - Δήμος Δέλτα - Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Αλγόριθμοι Εύρεσης Ομοιοτήτων Ακολουθιών

Στοίχιση κατά ζεύγη. Στοίχιση ακολουθιών κατά ζεύγη (Pairwise alignment)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Βιοπληροφορική. Ενότητα 2 η : Ανάλυση ακολουθίας Ηλίας Καππάς Τμήμα Βιολογίας

Οδηγός υποβολής σε αποθετήριο SaaS

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Ο ArcCatalog χρησιμοποιείται για την πλοήγηση / διαχείριση χωρικών δεδοµένων.

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών,(2/2) 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Οδηγίες συγγραφής αναφοράς (ΒΙΟ 230) «12 βήματα προς την επιτυχία» Βασίλης Προμπονάς Λευκωσία, 2018

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Ενότητα 1 η : Εισαγωγή. Ηλίας Καππάς Τμήμα Βιολογίας

ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ ΑΝΑ ΖΕΥΓΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 7: Στοίχιση ακολουθιών ανά ζεύγη Τεχνικές Στοίχισης Ακολουθιών, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΛΗΡΟΦΟΡΙΚΗ Ι Εργαστήριο 1 MATLAB ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave

Ενότητα 06 Δημιουργία Και Χρήση Φόρμουλας

Εγχειρίδιο Εγκατάστασης και Χρήσης Εκπαιδευτικής Εφαρμογής

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Πανεπιστήμιο Θεσσαλίας Λαμία, 2015

Αλλαγή της εμφάνισης κειμένου: μέγεθος γραμματοσειράς, είδος γραμματοσειράς

Οδηγός γρήγορης εκκίνησης

Οδηγίες επεξεργασίας Προσωπικής σελίδας Διδάσκοντα

Δημιουργία η-μαθήματος με τη. 3 ο Μέρος Εισαγωγή πληροφοριών: δημιουργία ιστοσελίδας

Λειτουργική γονιδιωµατική. 6ο εργαστήριο

Οδοντιατρικό Λογισμικό

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Οδηγίες Χρήσης Πλατφόρμας Ασύγχρονης Τηλεκπαίδευσης (Moodle) του Τμήματος ΔΕΤ

Χρήσεις Η/Υ και Βάσεις Βιολογικών Δεδομένων : ΒΙΟ109 [8] Βάσεις Δεδομένων Γονιδιωματικής

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

ΜΕ ΕΠΕΑΕΚ: ΑΝΑΜΟΡΦΩΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΤΟΥ ΤΕΦΑΑ ΠΘ ΑΥΤΕΠΙΣΤΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ

Διαχειριστείτε τις καταθέσεις (Manage deposits)

5o ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑ ΜΕ ΤΟ EXCEL. a) Δημιουργήστε ένα καινούριο βιβλίο του Excel και αποθηκεύστε το στην Επιφάνεια Εργασίας με το όνομα Εργασία5.

WORDPRESS. Εικόνα 1. Πατώντας στη «Σύνδεση» γράψτε το Username (όνομα χρήστη) και το Password (συνθηματικό) (εικόνα 2) που σας έδωσε ο διαχειριστής

Εθνικό Κέντρο Τεκμηρίωσης ΕΙΕ. Copyright 2014 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ

ΒΙΟ Αρχές και Μέθοδοι Βιοπληροφορικής Ι

Ειδικά Θέματα Βιοπληροφορικής

tenderone Σύντομος Οδηγός Συμμετοχής για την Υποβολή Δικαιολογητικών στη ΔΕΠΑ v. 2.2

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

7.Α.1 Παρουσιάσεις. 7.Α.2 Περιγραφή περιεχομένων της εφαρμογής

ΑΣΚΗΣΗ 2η Αναζήτηση πληροφορίας σε βιολογικές βάσεις δεδοµένων

MICROSOFT OFFICE 2003

Σχεδιασμός εκτυπώσεων ERG

tenderone ΣύντομοςΟδηγός Συμμετοχής για την Υποβολή Δικαιολογητικών στη ΔΕΠΑ v. 1.0

Βιοπληροφορική. Πίνακες Αντικατάστασης BLOSUM & Οπτική Σύγκριση Αλληλουχιών. Αλέξανδρος Τζάλλας

ΣΥΝΤΟΜΟΣ ΟΔΗΓΟΣ ΕΝΤΟΠΙΣΜΟΣ ΟΧΗΜΑΤΟΣ. Η οθόνη Εντοπισμός οχήματος είναι η πρώτη οθόνη που βλέπετε μετά τη σύνδεσή σας στο Microcat LIVE.

Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής ΔΕΞΙΟΤΗΤΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ / ΚΟΙΝΩΝΙΚΑ ΔΙΚΤΥΑ (ΕΡΓΑΣΤΗΡΙΟ)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΗ ΑΣΚΗΣΗ 2

Σχεδιασμός εκτυπώσεων ERG

Εγχειρίδιο Φοιτητή. Course Management Platform. Εισαγωγή. for Universities Ομάδα Ασύγχρονης Τηλεκπαίδευσης Παν. Μακεδονίας Σεπτέμβριος 2004

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

Οδηγίες Καταχώρησης Τεκμηρίου

είσοδος στο χαρτοφυλάκιο φοιτητή

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών

Γενικό Τμήμα Παιδαγωγικών Μαθημάτων

1. Άνοιγμα Και Κλείσιμο Της Εφαρμογής Φυλλομετρητή Ιστού (Internet Explorer)

ΠΟΛΛΑΠΛΗ ΣΤΟΙΧΙΣΗ ΑΚΟΛΟΥΘΙΩΝ I

Ας ξεκινήσουμε λοιπόν!

Αναπαραγωγή με αρχεία ήχου

ΕΓΧΕΙΡΙΔΙΟ ΜΑΘΗΤΗ. της Πλατφόρμας Τηλεκατάρτισης

Μέθοδοι Προσπέλασης για την Επεξεργασία Μεγάλων Βιολογικών Βάσεων Δεδομένων. Ανδρουλάκης Ανδρέας

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 7: Σύγκριση αλληλουχιών Part II

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Οδηγίες για την πλατφόρμα EVA - εκπαιδευτές και δάσκαλοι

Transcript:

ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST Στέλλα Ταμανά, Βασίλης Προμπονάς Λευκωσία 2016-2018 Περίληψη (Overview) Κατά τη διάρκεια αυτού του εργαστηρίου θα έχετε την ευκαιρία να εξοικειωθείτε με το βασικό εργαλείο αναζήτησης BLAST και ορισμένες από τις εφαρμογές του στην τρέχουσα βιολογική έρευνα. Επιπλέον, θα εξοικειωθείτε με τους διαφορετικούς πόρους που προσφέρει η Βάση Δεδομένων (ΒΔ) NCBI (http://www.ncbi.nlm.nih.gov/). Μέσα από μια σειρά από διάφορες αλληλουχίες DNA και πρωτεϊνών θα μάθουμε να χρησιμοποιούμε σωστά τα εργαλεία που προσφέρει το BLAST για την διεξαγωγή μιας βιολογικής έρευνας. Πηγές και Χρήσιμα Εργαλεία (Resources) Όλα τα εργαλεία και οι πηγές που θα χρησιμοποιήσουμε σήμερα είναι ελεύθερα διαθέσιμα μέσω διαδύκτιου. Οι κύριες ιστοσελίδες που θα χρησιμοποιήσουμε είναι: National Centre for Biotechnology Information (NCBI) - http://www.ncbi.nlm.nih.gov/ NCBI - Basic Local Alignment Search Tool (blast) pages http://blast.ncbi.nlm.nih.gov/blast.cgi Blast help pages - http://blast.ncbi.nlm.nih.gov/blast.cgi?cmd=web&page_type=blastdocs Σύνολα Δεδομένων και Αρχεία (Datasets and files) Όλες οι αλληλουχίες που θα χρειαστούμε βρίσκονται μέσα στο αρχείο: BIO230_blast_sequences.txt Θα χρειαστεί να ανοίξετε αυτό το αρχείο μέσα από ένα επεξεργαστή κειμένου (π.χ. wordpad) και στην συνέχεια να αντιγράψετε την αντίστοιχη αλληλουχία/ες (copy and paste) μέσα στο BLAST. 1

2

Πρακτικά Παραδείγματα (Worksheet exercises) 1. Ξεκινήστε από την κύρια ιστοσελίδα του NCBI (http://www.ncbi.nlm.nih.gov/) και βρείτε τον σύνδεσμο (link) για το BLAST (μπορείτε να επισκεφθείτε την ιστοσελίδα του BLAST απευθείας στο: https://blast.ncbi.nlm.nih.gov/blast.cgi). Βρείτε το κουμπί «Βοήθεια» ( Help ), πατήστε το και περιηγηθείτε στις σελίδες Βοήθειας. a. Πατήστε πάνω στον σύνδεσμο (link): NCBI Handbook: BLAST και διαβάστε λίγο για μια συνοπτική επισκόπηση του υλικού που καλύπτεται στη διάλεξη. Κάνετε μια σημείωση των άλλων πληροφοριών που περιέχονται σε αυτό το online εγχειρίδιο, το οποίο μπορεί να σας είναι χρήσιμο αργότερα, για τη διενέργεια και την ερμηνεία των αποτελεσμάτων του BLAST. b. Επιστρέψετε πίσω στην αρχική σελίδα Βοήθειας του BLAST και ακολουθήστε τον σύνδεσμο The Statistics of Sequence Similarity Scores, συνοπτικά περιγιηθείτε μέσα σε αυτές τις σελίδες κάνοντας παράλληλα σημειώσεις για τι πληροφορίες μπορείτε να βρείτε χρήσιμες αργότερα. c. Όπως προηγουμένως, επιστρέψετε πίσω στην αρχική σελίδα Βοήθειας και ακολουθήστε τον σύνδεσμο BLAST glossary, συνοπτικά περιηγηθείτε μέσα σε αυτές τις σελίδες κάνοντας παράλληλα σημειώσεις για τι πληροφορίες μπορείτε να βρείτε χρήσιμες αργότερα. Σημειώσεις: ΘΕΩΡΗΤΙΚΟ ΜΕΡΟΣ! Οι περισσότερες πρωτεϊνές είναι από την φύση τους αρθρωτές (modular), με λειτουργικές περιοχές (functional domains) που συχνά επαναλαμβάνονται τόσο μέσα στην ίδια πρωτεϊνη αλλά και σε άλλες πρωτεϊνες από διαφορετικά είδη (species). Ο αλγόριθμος BLAST είναι φτιαγμένος με έτσι τρόπο ώστε να εντοπίζει αυτά τα λειτουργικά domains ή μικρότερα τμήματα ομοιότητας (similarity) στο επίπεδο της αλληλουχίας πραγματοποιώντας τοπικές στοιχίσεις.! Το bit score δίνει μια ένδειξη του πόσο καλή είναι η στοίχιση (alignment). Όσο υψηλότερη είναι η βαθμολογία, τόσο καλύτερη είναι η στοίχιση. Σε γενικές γραμμές, αυτή η βαθμολογία υπολογίζεται λαμβάνοντας υπόψη την στοίχιση παρόμοιων ή ταυτόσημων καταλοίπων (νουκλεοτίδια ή αμινοξέα), καθώς και τυχόν κενά που εισάγονται για να στοιχιστούν οι αλληλουχίες. Ένα βασικό στοιχείο σε 3

αυτόν τον υπολογισμό είναι ο Πίνακας Αντικατάστασης (Π.Α.; Substitution Matrix), ο οποίος αποδίδει τη βαθμολογία για την στοίχιση κάθε δυνατού ζεύγους καταλοίπων. Το bit score είναι μια κανονικοποιημένη βαθμολογία, πράγμα που σημαίνει ότι οι βαθμολογίες από διαφορετικές στοιχίσεις μπορούν να συγκριθούν, ακόμη και εάν έχουν χρησιμοποιηθεί διαφορετικοί Π.Α.! Το E-value δίνει μία ένδειξη της στατιστικής σημαντικότητας της βαθμολογίας (score) μιας δεδομένης κατά ζεύγη στοίχισης (pairwise alignment) και αντανακλά το μέγεθος της βάσης δεδομένων και το σύστημα βαθμονόμησης που χρησιμοποιείται. Όσο χαμηλότερη είναι η τιμή του E-value, τόσο πιο σημαντική είναι η ένδειξη του αποτελέσματος (statistical significant sequence similarity). Προσοχή!!! Μπορεί, όμως, να μην να αντιπροσωπεύει ένα βιολογικά ουσιαστικό αποτέλεσμα.! Βαθμολόγηση Εισαγωγής Κενών (Gap scores): Οι ποινές που αντιστοιχούν για τα κενά αφορούν κυρίως μια μεγάλη ποινή για το άνοιγμα κενών (opening a gap) και μια μικρότερη ποινή για την επέκταση τους (gap extension).! Composition-based statistics: Είναι μεθοδολογίες που εφαρμόζονται κυρίως στις μεθόδους αναζήτησης πρωτεϊνων (BLASTP) όπου προσαρμόζει την σημαντικότητα της βαθμολογίας μιας στοίχισης με το να λαμβάνει υπόψη την συνολική σύσταση των αμινοξέων της query αλληλουχίας και των στοιχισμένων αλληλουχιών της Β.Δ. (περισσότερες πληροφορίες στην επόμενη διάλεξη, μη βιάζεστε!!!)! DUST: Είναι ένα πρόγραμμα για το φιλτράρισμα Περιοχών Χαμηλής Πολυπλοκότητας (Low Complexity Regions) για νουκλεοτιδικές αλληλουχίες.! SEG: Είναι ένα πρόγραμμα για το φιλτράρισμα Περιοχών Χαμηλής Πολυπλοκότητας (Low Complexity Regions) για αμινοξικές αλληλουχίες.! H: Είναι η σχετική εντροπία των συχνοτήτων των καταλοίπων στόχων και υπόβαθρου (target and background residue frequencies) στον πίνακα αντικατάστασης που χρησιμοποιείται στη βαθμονόμηση των στοιχίσεων. Μπορεί να θεωρηθεί σαν μέθοδος μέτρησης του μέσου όρου διαθέσιμης πληροφορίας (σε bits) ανα θέση και τη δυνατότητα του πίνακα να διαχωρίζει την στοίχιση μας από μια τυχαία στοίχιση.! K: Είναι μια παράμετρος που χρησιμοποιείται για τον υπολογισμό βαθμολογίων από το BLAST. Αποτελεί μια παράμετρο κανονικοποίησης για το μέγεθος του χώρου 4

αναζήτησης. Η παράμετρος Κ χρησιμοποιείται για την μετατροπή του raw score (S) σε bit score (S').! Lambda (λ): Είναι μια παράμετρος που χρησιμοποιείται για τον υπολογισμό βαθμολογίων από το BLAST. Αποτελεί μια παράμετρο κανονικοποίησης για το σύστημα βαθμολόγησης. Η παράμετρος λ χρησιμοποιείται για την μετατροπή του raw score (S) σε bit score (S'). ΠΡΑΚΤΙΚΟ ΜΕΡΟΣ 2. Αναζήτηση Νουκλεοτιδικών Αλληλουχίων (BLASTN): a. Επιστρέψτε πίσω στην αρχική σελίδα του BLAST και πατήστε το κουμπί BLASTN. b. Στο πάνω μέρος της σελίδας θα βρείτε ένα σύνδεσμο (ink) όπου σας παραπέμπει σε ένα οδηγό (tutorial) χρήσης των διαφόρων εργαλείων που παρέχει το BLAST (ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/howto_blastguide.pdf). c. Στο αρχείο «BIO230_blast_seqs.txt» θα βρείτε 2 αλληλουχίες, την Sequence 1 και την Sequence 2, οι οποίες είναι αλληλουχίες mrna και πρωτεϊνής αντίστοιχα από τον οργανισμό Plasmodium cynomolgi. Οι αλληλουχίες αυτές προέρχονται από την Β.Δ. του NCBI, έτσι ώστε να μπορείτε να ελέγξετε τα αποτελέσματα σας. 1. Ποία είναι η μορφοποίηση των 2 αλληλουχιών; 2. Πως μπορείτε να ελέγξετε αν η αλληλουχία 1 αντιστοιχεί στην πρωτεϊνική αλληλουχία 2; 3. Είναι αυτές οι 2 αλληλουχίες ισοδύναμες ; (δλδ. Μπορεί να θεωρηθεί ότι το mrna κωδικοποιεί την πρωτεϊνη;) d. Επιλέξετε την αλληλουχία 1 (copy) και αντιγράψτε (paste) την στο άδειο κουτί πάνω αριστερά στην σελίδα του BLASTN (Enter query sequence). Μέσα στο κουτί έχετε την επιλογή να αντιγράψετε μόνο το accession number (ή gi, uniprot id κ.λ.π.) ή την αλληλουχία σε FASTA μορφη. Επίσης αν έχετε ένα αρχείο με μία ή περισσότερες αλήλλουχιες μπορείτε να το «ανεβάσετε» (upload) πατώντας πάνω στο κουμπί «Choose File». e. Μετακινηθείτε προς τα κάτω και σταματήστε στο κουτί «Choose search set». Το κουτί αυτό μας επιτρέπει να επιλέξουμε την Β.Δ. μέσα στην οποία θα γίνει η αναζήτηση της query αλληλουχίας. Επίσης μπορούμε να επιλέξουμε σε ποιο/ποιούς οργανισμό(ους) να γίνει η αναζήτηση μας (ή να αποκλείσουμε από την αναζήτηση), π.χ. τι τύπους οργανισμών (μοντέλα κ.ο.κ). 5

f. Στην συνέχεια πατήστε πάνω στο κουμπί «Algorithm parameters» για να εμφανίσει τις διάφορες παραμέτρους του αλγόριθμου. Στο πρώτο κουτί βλέπουμε παραμέτρους που αφορούν κύριως τα αποτελέσματα. Δηλαδή, πόσα αποτελέσματα θέλουμε να μας εμφανίσει, να καθορίσουμε την τιμή E-value, το word size κ.λ.π. (βλέπε Σημειώσεις πιο πάνω). Το κουτί «Scoring parameters» αφορά τις ποινές για εισαγωγή κενών και το τελευταίο κουτί αφορά παραμέτρους για τις Π.Χ.Π (θα μιλήσετε αναλυτικά σε μεταγενέστερο μάθημα). g. Τέλος, πατήστε το κουμπί BLAST για να ξεκινήσει η αναζήτηση. h. Από τα αποτελέσματα που σας έδωσε το BLASTN βρείτε την αλληλουχία που έχει στατιστικά σημαντική ομοιότητα με την αλληλουχία 1 (θυμηθείτε το κεφάλαιο The Statistics of Sequence Similarity Scores από τις σελίδες Βοήθειας ). Τι οργανισμός είναι το Plasmodium cynomolgi; Τι πληροφορίες μπορείτε να βρείτε για το Plasmodium cynomolgi και τί είδους αλληλουχίας (π.χ. genome, single gene, partial genes κ.λ.π.); i. Μετακινηθείτε προς τα κάτω στο κουτί Graphic Summary. Τι σημαίνει η οθόνη γραφικών; Γιατί κάποιες γραμμές έχουν διαφορετικό χρώμα ή μήκος; j. Μετακινηθείτε προς τα κάτω στο κουτί Descriptions. Ποιό είναι το καλύτερο αποτέλεσμα (top hit) και γιατί; Ποίο είναι το αμέσως επόμενο; Τι σημαίνουν τα ακόλουθα: 1. Max score 2. Query coverage 3. E-value 4. Max identity k. Μετακινηθείτε προς τα κάτω στο κουτί Alignments. Τι σημαίνουν οι κάθετες γραμμές μεταξύ των query και subject νουκλεοτιδίων; Τι σημαίνει όταν δεν υπάρχει κάθετη γραμμή; l. Στην δεύτερη στοίχιση έγινε εισαγωγή κενών τόσο στην query όσο και στην subject αλληλουχία. Τί βιολογική σημασία μπορεί να έχει αυτό το εύρημα; Κάντε κλίκ στο Search Summary και βρείτε ποια είναι η ποινή εισαγωγής κενών που χρησιμοποιήθηκε. Τι δείχνουν/σημαίνουν αυτοί οι αριθμοί; 3. Αναζήτηση Αμινοξικών Αλληλουχίων (BLASTP): a. Σε αυτό το βήμα θα χρησιμοποιήσουμε την δεύτερη αλληλουχία από το αρχείο «BIO230_blast_seqs.txt» για να υλοποιήσουμε μια αναζήτηση μέσα σε πρωτεϊνικές Β.Δ. 6

b. Υπάρχουν 2 τρόποι να αποκτήσουμε πρόσβαση στο εργαλείο BLASTP (και σε οποιοδήποτε άλλο εργαλείο του BLAST): 1. Από την αρχική σελίδα του BLAST πατήστε πάνω στο κουμπί BLASTP. 2. Από την σελίδα των αποτελεσμάτων του BLASTN πατήστε πάνω στον σύνδεσμό «Edit and Resubmit». Στην συνέχεια πατήστε πάνω στην καρτέλα blastp (είναι δίπλα από την ανοικτή καρτέλα του blastn). c. Όπως βλέπετε το γραφικό περιβάλλον είναι το ίδιο όπως προηγουμένως. Οι διαφορές βρίσκονται κυρίως στις παραμέτρους που ρυθμίζουν κάθε εργαλείο του BLAST. d. Μετακινηθείτε προς τα κάτω και εξερευνήστε τις παραμέτρους που έχει το BLASTP. Τι διαφορές παρατηρείτε; e. Εκτελέστε μια αναζήτηση με την αμινοξική αλληλουχία από το αρχείο «BIO230_blast_seqs.txt» χρησιμοποιώντας την Β.Δ. Non-redundant protein sequence (nr). 1. Πηγαίνετε στο κουτί Graphic Summary. Ποιά είναι η πιο αξιοσημείωτη διαφόρα με το Graphic Summary του BLASTN και γιατί; 2. Πηγαίνετε στο κουτί Descriptions. Ποίο είναι το δεύτερο καλύτερο αποτέλεσμα (second hit). Σας θυμίζει κάτι σε σχέση με τα αποτλέσματα του BLASTN; 3. Πηγαίνετε στο κουτί Alignments. Τι σημαίνουν οι ορισμοί Identities, Positives και Gaps ; Ποιές είναι οι τιμές αυτών των παραμέτρων; Ποιό είναι το ποσοστό ομοιότητας (percent similarity) μεταξύ query και subject; 4. Πηγαίνετε στο κουτί Search Summary. Ποιός είναι ο Π.Α. που χρησιμοποιήθηκε για την αναζήτηση; 4. Αναζήτηση Αλληλουχίων χρησιμοποιώντας τα εργαλεία BLASTX, TBLASTN και TBLASTX: a. To εργαλείο BLASTX (translated nucleotide vs. protein) χρησιμοποιείται για τον εντοπισμό πρωτεϊνων που κωδικοποιούνται από την query αλληλουχία νουκλεοτιδίων. b. Το εργαλείο TBLASTN (protein vs. translated nucleotide) χρησιμοποιείται για την αναγνώριση αλληλουχιών Β.Δ. που κωδικοποιούν πρωτεΐνες παρόμοιες (similar) με την query. 7

c. Το εργαλείο TBLASTX (translated nucleotide vs. translated nucleotide) χρησιμοποιείται για τον προσδιορισμό των αλληλουχιών νουκλεοτιδίων παρόμοιων (similar) με την query με βάση την δυνητική κωδικοποίησή τους. 5. Η αλληλουχία 4 μέσα στο αρχείο «BIO230_blast_seqs.txt» είναι μια πρωτεϊνη από το Plasmodium yoelli yoelii (μολύνει τρωκτικά) και χαρακτηρίζεται ως hypothetical protein. Ποίο εργαλείο BLAST θα χρησιμοποιούσατε για να βρείτε αν έχει όμολογες αλληλουχίες σε άλλους οργανισμούς και γιατί; Παρατηρείτε κάτι περίεργο στα αποτελέσματα σας; Τι βήματα θα εκτελούσατε για να επαληθεύσετε την ορθότητα των αποτελεσμάτων; BONUS αλληλουχία Η αλληλουχία 5, είναι μια πρωτεϊνική αλληλουχία που κωδικοποιείται στο γονιδίωμα των Hobbits. α. Μπορείτε να βρείτε αν έχει πιθανές ομόλογες στα θηλαστικά; β. Τί μπορείτε να προβλέψετε για τη λειτουργία της; Σημείωση: Χρησιμοποιήστε τη βιβλιογραφία για να τεκμηριώσετε την απάντησή σας. Εργασία Απαντήστε στα παραπάνω ερωτήματα με μια σύντομη αναφορά (max. 1000 λέξεις), περιγράφοντας συνοπτικά το σκεπτικό με το οποίο εργαστήκατε, τα πειράματα/αποτελέσματα και τα συμπεράσματά σας. Μπορείτε να προσθέσετε πίνακες και εικόνες χωρίς να προσμετρούνται στον αριθμό λέξεων που αναφέρεται παραπάνω. Παράδοση: Αναφορά (σε ένα αρχείο PDF) με email στο διδάσκοντα (η ημερομηνία θα καθορισθεί στην τάξη). 8