ΑΣΚΗΣΗ 2η Αναζήτηση πληροφορίας σε βιολογικές βάσεις δεδοµένων

Σχετικά έγγραφα
ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική. Βάσεις Δεδοµένων 1ο εργαστήριο. Γρηγόρης Αµούτζιας

ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΫΛΙΚΩΝ 2 ΜΕΡΟΣ Α Α. ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

ΑΣΚΗΣΗ 1η Αναζήτηση πληροφορίας σε Βιβλιογραφικές Βάσεις εδοµένων

ΑΣΚΗΣΗ: ΣΧΕΔΙΑΣΜΟΣ ΕΚΚΙΝΗΤΩΝ ΕΥΡΕΣΗ ΘΕΣΕΩΝ ΠΕΡΙΟΡΙΣΜΟΥ

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 3: Βάσεις Δεδομένων (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βάσεις δεδομένων αλληλουχιών

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 2 ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Βιοπληροφορική. Ενότητα 2 η : Ανάλυση ακολουθίας Ηλίας Καππάς Τμήμα Βιολογίας

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Introduction to Bioinformatics

Λειτουργική γονιδιωµατική. 6ο εργαστήριο

ΑΛΛΕΣ ΣΗΜΑΝΤΙΚΕΣ ΒΙΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Τι προσφέρει το NCBI. Πληκτρολογούμε:

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Ενότητα 1 η : Εισαγωγή. Ηλίας Καππάς Τμήμα Βιολογίας

ΔΕΥΤΕΡΟΓΕΝΕΙΣ ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Δευτεροταγείς βάσεις δεδομένων (Secondary databases)

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Γενετική Πληθυσμών και Εξέλιξη 1 η άσκηση

Χρήσεις Η/Υ και Βάσεις Βιολογικών Δεδομένων : ΒΙΟ109 [8] Βάσεις Δεδομένων Γονιδιωματικής

Βιοπληροφορική. Βιολογικές Βάσεις Δεδομένων. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 1: Εισαγωγή στη Βιοπληροφορική

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

Κεφάλαιο 2 Βιολογικές Βάσεις Δεδομένων

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

Εφαρμογές απεικόνισης και εξόρυξης δεδομένων. σε βιολογικές βάσεις δεδομένων ΙΩΑΝΝΗΣ Γ. ΧΑΤΖΗΣ

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

Γονιδιωματική. G. Patrinos

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

Εργαστηριακές Ασκήσεις Υπολογιστικής Βιολογίας και Βιοπληροφορικής. Βασίλης Προμπονάς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Εισαγωγή

Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία)

Εφαρμοσμένη Βιοτεχνολογία Εργαστηριακή Άσκηση Εισαγωγή στην Βιοπληροφορική

Βιοπληροψορική, συσιημική βιολογία και εξατομικευμένη θεραπεία

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Βιοπληροφορική και Πολυµέσα. Ειρήνη Αυδίκου Αθήνα

Τεχνολογίες συλλογής δεδοµένων υψηλής απόδοσης

Εφαρμογές τεχνολογιών Μοριακής Βιολογίας στην Γενετική

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο

Γονιδιωματική Εισαγωγή [2] Τμήμα Γεωπονίας, Ιχθυολογίας και Υδάτινου Περιβάλλοντος. Μεζίτη Αλεξάνδρα

DNA MICROARRAYS. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Δασική Γενετική Εισαγωγή: Βασικές έννοιες

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Πολλαπλή στοίχιση multiple sequence alignment (MSA)

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΙΑΤΡΟΒΙΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ

1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; ΘΩΜΑΣ ΑΠΑΝΤΗΣΗ. 2. Ποιες είναι οι κατηγορίες γονιδίων με κριτήριο το προϊόν της μεταγραφής τους;

ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ Τρίτη 18 Ιουνίου 2019 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ. (Ενδεικτικές Απαντήσεις)

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Παν/μιο Θεσσαλίας Λαμία 2015

Ανάπτυξη ιαδικτυακής Εφαρµογής µε σκοπό τη Βέλτιστη Ταυτοποίηση Πεπτιδίων και Πρωτεϊνών από εδοµένα Πρωτεωµικής Ανάλυσης. Πανεπιστήµιο Πατρών

Φυλογένεση. 5o εργαστήριο

ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΚΕΦΑΛΑΙΑ 1 ΚΑΙ 2

ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

Αλέξης Ν. Πολύδωρος Επ. Καθηγητής Μοριακής Βελτίωσης Εργαστήριο Γενετικής και Βελτίωσης Φυτών ΑΠΘ

Νικόλαος Σιαφάκας Λέκτορας Διαγνωστικής Ιολογίας Εργαστήριο Κλινικής Μικροβιολογίας ΠΓΝ «ΑΤΤΙΚΟΝ»

PSI-Blast: τι είναι. Position specific scoring matrices (PSSMs) (Πίνακες αντικατάστασης θέσης)

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

ΒΙΟΛΟΓΙΑ Ο.Π. ΘΕΣΙΚΩΝ ΠΟΤΔΩΝ

Μελέτη και Υλοποίηση Αλγορίθμων για Βιολογικές Εφαρμογές σε MapReduce Περιβάλλον

1 ο #Κεφάλαιο# 1)#Πειράματα: α)$να#περιγράψεις#το#πείραμα#των#hershey#και#chase.# Υπόδειξη:#σελ#14#σχολ.

Μ.Δ.Ε. ''ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ''

ÁÎÉÁ ÅÊÐÁÉÄÅÕÔÉÊÏÓ ÏÌÉËÏÓ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΡΟΓΡΑΜΜΑ ΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

ΜΕΤΑΛΛΑΞΕΙΣ ΚΑΙ ΚΑΡΚΙΝΟΣ ΕΡΓΑΣΙΑ ΣΤΟ ΜΑΘΗΜΑ ΤΗΣ ΒΙΟΛΟΓΙΑΣ ΟΝΟΜΑ:ΕΥΑΓΓΕΛΙΑ ΕΠΙΘΕΤΟ:ΠΡΙΦΤΗ ΤΑΞΗ:Γ ΤΜΗΜΑ:4

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ΠΑΝΕΛΛΗΝΙΕΣ Απαντήσεις Βιολογίας κατεύθυνσης (ΕΠΑΝΑΛΛΗΠΤΙΚΕΣ ΗΜΕΡΗΣΙΟ)

ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΠΟΥ ΥΠΗΡΕΤΟΥΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΔΕΥΤΕΡΑ 10 ΣΕΠΤΕΜΒΡΙΟΥ 2018

Εισαγωγή στη Γενετική και στη Γονιδιωματική Τι είναι η κληρονομικότητα, και πώς μεταβιβάζεται η πληροφορία από γενιά σε γενιά;

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

γ. δύο φορές δ. τέσσερεις φορές

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Εισαγωγή Ακολουθίες Βιολογικών Μακροµορίων και Στοιχεία Μοριακής Εξέλιξης

ΕΙΣΑΓΩΓΗ Ι. Στοιχεία Μοριακής Βιολογίας Βιολογικά Μακρομόρια ΙΙ. Επισκόπηση του πεδίου της Υπολογιστικής Βιολογίας - Βιοπληροφορικής

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Transcript:

ΑΣΚΗΣΗ 2η Αναζήτηση πληροφορίας σε βιολογικές βάσεις δεδοµένων ΕΙΣΑΓΩΓΗ Μια βιολογική βάση δεδοµένων (ΒΒ ) χρησιµοποιείται για την οργάνωση, αποθήκευση, επεξεργασία, αναζήτηση και ανάκτηση της βιολογικής πληροφορίας. Οι τύποι δεδοµένων που συναντώνται στις βιολογικές βάσεις είναι αυτοί που παράγονται από την βιολογική έρευνα (ιδιαίτερα της µοριακής βιολογίας). Ενδεικτικά: νουκλεοτιδικές ακολουθίες (DNA και mrna) και γονιδιώµατα ακολουθίες πρωτεϊνών 3-D δοµές πρωτεϊνών και νουκλεϊνικών οξέων δεδοµένα γονιδιακής έκφρασης δεδοµένα γενετικής ποικιλότητας (πολυµορφισµοί) Πολλές από τις ΒΒ, αν και χρησιµοποιούν σχεσιακά ή αντικειµενοστρεφή συστήµατα διαχείρισης, παρέχουν όλη τη διαθέσιµη πληροφορία για µια εγγραφή σε ένα µεγάλο δοµηµένο αρχείο κειµένου. Πληροφορίες σχετικά µε τις διαθέσιµες ΒΒ καθώς και εργαλεία λογισµικού µπορούν να αναζητηθούν σε εξειδικευµένα επιστηµονικά περιοδικά ή ιστότοπους, όπως: Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection (http://nar.oxfordjournals.org/) Database: The Journal of Biological Databases and Curation (http://database.oxfordjournals.org/) NCBI Resource Guide (http://www.ncbi.nlm.nih.gov/guide/all/) Υπάρχουν πολλές εξειδικευµένες ΒΒ, ωστόσο στο πλαίσιο της συγκεκριµένης άσκησης θα επικεντρωθούµε στις βασικές κατηγορίες ΒΒ, καθώς και στις κυριότερες αντιπροσώπους κάθε κατηγορίας, που είναι ελεύθερα διαθέσιµες στην επιστηµονική κοινότητα. Βάσεις νουκλεοτιδικών δεδοµένων Οι βάσεις δεδοµένων νουκλεοτιδικών ακολουθιών καθιστούν ελεύθερα διαθέσιµα στην επιστηµονική κοινότητα ετερογενή στοιχεία που ποικίλλουν όσον αφορά στην προέλευση του υλικού (π.χ. γονιδίωµα έναντι cdna), στην ποιότητα του, στην έκταση του σχολιασµού και στην πληρότητα της ακολουθίας σχετικά µε το βιολογικό στόχο (π.χ. πλήρους έναντι µερικής κάλυψης ενός γονιδίου ή ενός γονιδιώµατος). Οι τρεις µεγαλύτερες βάσεις νουκλεοτιδικών δεδοµένων που είναι ελεύθερα διαθέσιµες είναι οι: 1

DNA Data Bank of Japan (DDBJ) στο Center for Information Biology (CIB) (http://www.ddbj.nig.ac.jp/) GenBank στο National Center for Biotechnology Information (NCBI) (http://www.ncbi.nlm.nih.gov/genbank/) European Nucleotide Archive (ENA) στο European Bioinformatics Institute (EBI) (https://www.ebi.ac.uk/ena). Οι βάσεις αυτές σε συνεργασία έχουν δηµιουργήσει την International Nucleotide Sequence Database Collaboration (http://www.insdc.org/). Η συνεργασία µεταξύ τους περιλαµβάνει τη δηµιουργία κοινών κανόνων για την ταξινόµηση και το σχολιασµό των δεδοµένων και την καθηµερινή ανταλλαγή εγγραφών που κατατίθενται ανεξάρτητα σε κάθε βάση δεδοµένων. Μία τυπική εγγραφή στη µορφοποίηση της GenBank αποτελείται από γραµµές. Η πρώτη λέξη κάθε γραµµής υποδηλώνει το είδος της πληροφορίας που ακολουθεί (παράρτηµα Α). Κάθε εγγραφή τελειώνει µε τους χαρακτήρες //. Η νουκλεοτιδική ακολουθία µπορεί να ανακτηθεί στη µορφοποίηση FASTA (σχήµα 1). Η πρώτη γραµµή ξεκινά µε το χαρακτήρα > και δίνει µία σύντοµη περιγραφή της ακολουθίας, η οποία εµφανίζεται στις επόµενες γραµµές. >gi 209751317 gb EU891385.1 Escherichia coli regulator for SOS regulon (ECs5026) gene, complete cds ATGAAAGCGTTAACGGCCAGGCAACAAGAGGTGTTTGATCTCATCCGTGATCACATCAGCCAGACAGGTA TGCCGCCGACGCGTGCGGAAATCGCGCAGCGTTTGGGGTTCCGTTCCCCAAACGCGGCTGAAGAACATCT GAAGGCGCTGGCACGCAAAGGCGTAATTGAAATTGTTTCCGGCGCATCACGCGGGATTCGTCTGTTGCAG GAAGAGGAAGAAGGGTTGCCACTGGTAGGTCGTGTGGCTGCCGGTGAACCGCTTCTGGCGCAACAGCATA TTGAAGGTCATTATCAGGTCGATCCTTCCTTGTTCAAGCCGAATGCTGATTTCCTGCTGCGCGTCAGCGG GATGTCGATGAAAGATATCGGCATTATGGATGGCGACTTGCTGGCAGTGCATAAAACTCAGGATGTACGT AACGGTCAGGTCGTTGTCGCACGTATTGATGACGAAGTTACCGTTAAGCGCCTGAAAAAACAGGGCAATA AAGTCGAACTGTTGCCAGAAAATAGCGAGTTTAAACCAATTGTCGTTGACCTTCGTCAGCAGAGCTTCAC CATTGAAGGGCTGGCGGTTGGCGTTATTCGCAACGGCGACTGGCTGTAA Σχήµα 1. Νουκλεοτιδική ακολουθία σε µορφοποίηση FASTA. Βάσεις πρωτεϊνικών δεδοµένων Η UniProt (http://www.uniprot.org/) αποτελεί την περιεκτικότερη παγκόσµια συλλογή πληροφοριών για πρωτεΐνες (ακολουθία και λειτουργία), η οποία προέκυψε από τη συνεργασία των Β : Swiss-Prot, που παρέχει ένα υψηλό επίπεδο σχολιασµού (όπως περιγραφή της λειτουργίας µιας πρωτεΐνης, των µετα-µεταφραστικών τροποποιήσεων, κ.λ.π.), ένα ελάχιστο επίπεδο πλεονασµού και υψηλό επίπεδο ολοκλήρωσης διασύνδεσης µε άλλες Β. TrEMBL, που αποτελεί το συµπλήρωµα της Swiss-Prot. Περιλαµβάνει εγγραφές που δεν έχουν ακόµα ενσωµατωθεί στη Swiss-Prot και έχουν προκύψει από τη µετάφραση των καταχωρηµένων νουκλεοτιδικών εγγραφών της EMBL. Ο σχολιασµός της γίνεται αυτοµατοποιηµένα. 2

PIR, που προέκυψε από τον Atlas of Protein Sequence and Structure (1965-1978) της Margaret Dayhoff και εξελίχθηκε σε µια ολοκληρωµένη πηγή δεδοµένων και αναλυτικών εργαλείων. Βάσεις πρωτεϊνικών οικογενειών και domains Οι βάσεις πρωτεϊνικών οικογενειών και domains προέκυψαν από την ανάλυση των πρωτογενών βάσεων πρωτεϊνικών ακολουθιών. Παρέχουν πληροφορίες σχετικά µε περιοχές των πρωτεϊνών που έχουν καλά συντηρηµένη ακολουθία και συγκεκριµένη λειτουργία/δοµή, και έχουν εξελιχθεί σε σηµαντικά εργαλεία για την εύρεση αποµακρυσµένων σχέσεων σε νέες ακολουθίες, καθώς και την εξαγωγή συµπερασµάτων για την πρωτεϊνική λειτουργία. ιαφέρουν µεταξύ τους ως προς τις µεθόδους ανάλυσης των πρωτεϊνικών ακολουθιών, όπως είναι οι κανονικές εκφράσεις (regular expressions), τα προφίλ (profiles) και τα µοντέλα HMMs (Hidden Markov Models). Κάποιες από τις βάσεις αυτές είναι: PROSITE (http://prosite.expasy.org/) PFAM (http://xfam.org/) PRINTS (http://www.bioinf.manchester.ac.uk/dbbrowser/prints/) PRODOM (http://prodom.prabi.fr/) SMART (http://smart.embl-heidelberg.de/) Η InterPro (http://www.ebi.ac.uk/interpro/index.html) είναι το αποτέλεσµα της ολοκλήρωσης των προαναφερθέντων Β, µε στόχο την περιεκτικότερη εποπτεία των διαθέσιµων πόρων. Το πρόγραµµα InterProScan επιτρέπει την αναζήτηση των πρωτεϊνικών µοτίβων σε µια ακολουθία. Άλλες βιολογικές βάσεις δεδοµένων Η KEGG: Kyoto Encyclopedia of Genes and Genomes (http://www.kegg.jp/) είναι το αποτέλεσµα της ολοκλήρωσης 17 ΒΒ, που περιέχουν πληροφορίες σχετικά µε µεταβολικά µονοπάτια, ορθόλογα γονίδια, ένζυµα, ασθένειες κ.ο.κ. Η ΟΜΙΜ: Online Mendelian Inheritance in Man (http://www.ncbi.nlm.nih.gov/omim) αποτελεί µια βασική πηγή πληροφόρησης για γονίδια και σχετιζόµενους γενετικούς φαινότυπους στον άνθρωπο, που περιλαµβάνει διασυνδέσεις µε τη MEDLINE και άλλες Β. Η Gene Ontology (http://www.geneontology.org/) παρέχει ένα δοµηµένο ελεγχόµενο λεξιλόγιο (γνωστό ως οντολογία) για την περιγραφή των γονιδιακών προϊόντων σε τρία επίπεδα: cellular component, περιοχή του κυττάρου ή εξωκυττάριος χώρο όπου εντοπίζεται το γονιδιακό προϊόν, molecular function, στοιχειώδης λειτουργία του γονιδιακού προϊόντος σε µοριακό επίπεδο, π.χ. κατάλυση ή δέσµευση, 3

biological process, σύνολο µοριακών λειτουργιών που επιτελούν µία διεργασία µέσα στο κύτταρο ή τον οργανισµό, π.χ. µεταγωγή σήµατος. Για την πρόσβαση στα δεδοµένα έχουν αναπτυχθεί κατάλληλα εργαλεία λογισµικού. Ολοκληρωµένα συστήµατα ανάκτησης πληροφοριών Τα συστήµατα αυτά αξιοποιούν τις προϋπάρχουσες λογικές συσχετίσεις µεταξύ των επιµέρους καταχωρήσεων που βρίσκονται στις πολυάριθµες δηµόσιες Β. Έτσι οι διαθέσιµες πληροφορίες για µια συγκεκριµένη βιολογική οντότητα µπορούν να βρεθούν χωρίς να πρέπει ο χρήστης να επισκεφθεί διαδοχικά και να αναζητήσει πληροφορία σε διάφορες Β. Τα βασικότερα είναι: Entrez (http://www.ncbi.nlm.nih.gov/sites/gquery) Αναπτύχθηκε στο NCBI και παρέχει τη δυνατότητα ταυτόχρονης αναζήτησης σε όλες τις ΒΒ που φιλοξενούνται στο NCBI. EMBL-EBI Services (https://www.ebi.ac.uk/services) Αναπτύχθηκε στο EBI και δίνει τη δυνατότητα αναζήτησης ΒΒ και χρήσης εργαλείων βιοπληροφορικής. ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ Α. Αναζήτηση δεδοµένων στην UniProt Μεταβείτε στην ιστοσελίδα της UniProt (http://www.uniprot.org/) και αναζητείστε πληροφορίες σχετικά µε την πρωτεΐνη µεταφεράση της φωσφοριβοσυλιοµένης γουανίνης (Hypoxanthineguanine phosphoribosyltransferase ή hprt ή hgprt). Εισάγετε τον όρο hprt στο πεδίο αναζήτησης, πατήστε Advanced Search και στο πεδίο Organism εισάγετε τον όρο homo sapiens. Από τα αποτελέσµατα επιλέξτε την εγγραφή µε κωδικό P00492. 1. Καταγράψτε το µήκος της αµινοξικής ακολουθίας (Sequence length), τη λειτουργία (Function) και τον ενδοκυττάριο εντοπισµό (Subcellular location) της πρωτεΐνης. 2. Με ποια ασθένεια σχετίζεται η συγκεκριµένη πρωτεΐνη (Involvement in disease); Καταγράψτε µία µετάλλαξη που συνδέεται µε την εν λόγω ασθένεια (Natural variations). 3. Ακολουθήστε τον υπερσύνδεσµο στην KEGG. Με ποια µεταβολικά µονοπάτια (Pathway) σχετίζεται το συγκεκριµένο ένζυµο; Β. Αναζήτηση δεδοµένων στο Entrez Επισκεφθείτε την ιστοσελίδα του NCBI (http://www.ncbi.nlm.nih.gov/ncbisearch/) και εντοπίστε τη γενοµική ακολουθία του γονιδίου cystic fibrosis transmembrane conductance regulator (CFTR). Επιλέξτε τη Β Nucleotide και στο πεδίο Search χρησιµοποιήστε την αναζήτηση: CFTR[Title] 4

Περιορίστε τα αποτελέσµατά σας στις εγγραφές της RefSeq (Reference Sequence collection), που παρέχει ένα περιεκτικό και καλά σχολιασµένο σύνολο ακολουθιών, και στον οργανισµό Homo Sapiens. Επιλέξτε την εγγραφή µε κωδικό Accession: NG_016465 Ποιο είναι το µήκος της ακολουθίας (LOCUS); Σε ποιο χρωµόσωµα και σε ποια θέση βρίσκεται το γονίδιο (FEATURES source /map); Ποιες οι 10 πρώτες βάσεις της γενοµικής ακολουθίας; Επιλέξτε τον υπερσύνδεσµο Related information RNA και µεταβείτε στην εγγραφή NM_000492. Ποιο είναι το µήκος της ακολουθίας (LOCUS); Ποιες είναι οι 10 πρώτες βάσεις της mrna ακολουθίας; Χρησιµοποιώντας τον υπερσύνδεσµο Reference sequence information RefSeq protein product, καταγράψτε τον κωδικό αριθµό της εγγραφής, το µήκος της πρωτεΐνης και τα 10 πρώτα αµινοξέα. Στη συνέχεια µεταβείτε στην Related information ΟΜΙΜ, µελετήστε την εγγραφή για το γονίδιο CFTR µε κωδικό *602421 και καταγράψτε τις ασθένειες µε τις οποίες συνδέεται το συγκεκριµένο γονίδιο. Γ. Αναζήτηση δεδοµένων στο EMBL-EBI Από την ιστοσελίδα του EMBL-EBI (http://www.ebi.ac.uk/), αναζητείστε την εγγραφή µε κωδικό αριθµό X07479. Καταγράψτε τον οργανισµό (Organism) από τον οποίο προέρχεται το γονίδιο, την σύντοµη περιγραφή του (Sequence: X07479.1 :) και το µήκος της ακολουθίας (Sequence length). Μεταβαίνοντας στην καρτέλα Other Feature(s), καταγράψτε τους κωδικούς των βάσεων δεδοµένων Uniprot, PDB και InterPro που σχετίζονται µε την αντίστοιχη πρωτεΐνη. 5