ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Σχετικά έγγραφα
Βιοπληροφορική. Ενότητα 3: Βάσεις Δεδομένων (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΑΣΚΗΣΗ 2η Αναζήτηση πληροφορίας σε βιολογικές βάσεις δεδοµένων

Βιοπληροφορική. Βάσεις Δεδοµένων 1ο εργαστήριο. Γρηγόρης Αµούτζιας

ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

ΑΣΚΗΣΗ 1η Αναζήτηση πληροφορίας σε Βιβλιογραφικές Βάσεις εδοµένων

Βάσεις δεδομένων αλληλουχιών

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΑΣΚΗΣΗ: ΣΧΕΔΙΑΣΜΟΣ ΕΚΚΙΝΗΤΩΝ ΕΥΡΕΣΗ ΘΕΣΕΩΝ ΠΕΡΙΟΡΙΣΜΟΥ

Introduction to Bioinformatics

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

Δευτεροταγείς βάσεις δεδομένων (Secondary databases)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Βιοπληροφορική. Ενότητα 2 η : Ανάλυση ακολουθίας Ηλίας Καππάς Τμήμα Βιολογίας

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Βιολογικές Βάσεις Δεδομένων. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΔΕΥΤΕΡΟΓΕΝΕΙΣ ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 2 ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Ενότητα 1 η : Εισαγωγή. Ηλίας Καππάς Τμήμα Βιολογίας

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική

ΑΛΛΕΣ ΣΗΜΑΝΤΙΚΕΣ ΒΙΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Βιοπληροφορική. Ενότητα 14: Μοντέλα Πολλαπλής Στοίχισης (2/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Τι προσφέρει το NCBI. Πληκτρολογούμε:

Εφαρμογές απεικόνισης και εξόρυξης δεδομένων. σε βιολογικές βάσεις δεδομένων ΙΩΑΝΝΗΣ Γ. ΧΑΤΖΗΣ

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Κεφάλαιο 2 Βιολογικές Βάσεις Δεδομένων

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 1: Εισαγωγή στη Βιοπληροφορική

Βιοπληροφορική. Εισαγωγή

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Λειτουργική γονιδιωµατική. 6ο εργαστήριο

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

Εργαστηριακές Ασκήσεις Υπολογιστικής Βιολογίας και Βιοπληροφορικής. Βασίλης Προμπονάς

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Χρήσεις Η/Υ και Βάσεις Βιολογικών Δεδομένων : ΒΙΟ109 [8] Βάσεις Δεδομένων Γονιδιωματικής

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Παν/μιο Θεσσαλίας Λαμία 2015

Τεχνολογίες συλλογής δεδοµένων υψηλής απόδοσης

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΒΙΟΫΛΙΚΩΝ 2 ΜΕΡΟΣ Α Α. ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΒΙΒΛΙΟΓΡΑΦΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 13: Μοντέλα Πολλαπλής Στοίχισης (1/2), 1.5ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο

ΒΙΟ230 - Εισαγωγή στην Υπολογιστική Βιολογία Πρακτικό Εργαστήριο: Basic Local Alignment Search Tool BLAST

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ. Η γλ(άσσα πβ^γβαμματισμί^ Jaya για εφαρμογές Βιοίτληροφορικιίςκαι, Βιοιατρικής

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Εισαγωγή στις πρωτεΐνες Δομή πρωτεϊνών Ταξινόμηση βάσει δομής Βάσεις με δομές πρωτεϊνών Ευθυγράμμιση δομών Πρόβλεψη 2D δομής Πρόβλεψη 3D δομής

ΕΙΣΑΓΩΓΗ Ι. Στοιχεία Μοριακής Βιολογίας Βιολογικά Μακρομόρια ΙΙ. Επισκόπηση του πεδίου της Υπολογιστικής Βιολογίας - Βιοπληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ ΣΚΟΥΤΕΛΗ ΑΛΕΞΑΝΔΡΑ

Chalkou I. C. [PROJECT] Ανάθεση εργασιών.

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

Εφαρμοσμένη Βιοτεχνολογία Εργαστηριακή Άσκηση Εισαγωγή στην Βιοπληροφορική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Inferring regulatory subnetworks through the analysis of genome-wide expression profiles

INSPIRED: The National RIs on Integrated Structural Biology, Drug Screening Efforts & Drug target functional characterization

BIOTECH - GO. Μία συνδυασμένη μέθοδος εκπαίδευσης στη Βιοπληροφορική - Το μέσο των μικρομεσαίων επιχειρήσεων για τις βιοτεχνολογικές καινοτομίες

Analysis of Protein Structure in Silico

Genomic Enzymology: Web Tools for Leveraging Protein Family Sequence- Function Space and Genome Context to Discover Novel Functions.

Πανεπιστήμιο Πατρών Τμήμα Ιατρικής. Διατμηματικό Μεταπτυχιακό Πρόγραμμα Πληροφορική Επιστημών Ζωής

Πολλαπλή στοίχιση multiple sequence alignment (MSA)

Αποκτήστε την πλήρη εικόνα του ερευνητικού σας πεδιου με αναζητησεις πέρα από τις λέξεις-κλειδιά

Βιοπληροφορική. Ενότητα 6: Στοίχιση ακολουθιών ανά ζεύγη Σύστημα βαθμολόγησης, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

A sequence alignment algorithm using the transition quantity

Βιοπληροφορική. Ενότητα 8: Αναζήτηση Ομοιοτήτων σε Βάσεις Δεδομένων Ακολουθιών, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Βιοπληροφορική. Ενότητα 9: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Στατιστική Σημαντικότητα, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Περιοχές με ακραία σύσταση / χαμηλή πολυπλοκότητα

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

Splice site recognition between different organisms

Υπερδευτεροταγής Δομή Πρωτεϊνών

Γενετική Πληθυσμών και Εξέλιξη 1 η άσκηση

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Ανάπτυξη οδηγού χρήσης του biojava για την ανάπτυξη εφαρμογών Βιοπληροφορικής. Παπαθεοδοσίου Μερσίνη

Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΞΟΡΥΞΗ ΓΝΩΣΗΣ ΑΠΟ ΙΑΤΡΟΒΙΟΛΟΓΙΚΑ ΔΕΔΟΜΕΝΑ

Supporting Information To. Microhydration of caesium compounds: Journal of Molecular Modeling

Εισαγωγή Ακολουθίες Βιολογικών Μακροµορίων και Στοιχεία Μοριακής Εξέλιξης

CURRICULUM VITAE. NAME: Wang Shijun CURRENT POSITIONS:

Εισαγωγή. 1. Δομή πρωτεϊνών. Βιοπληροφορική ΙΙ «Ανάλυση Δομής Πρωτεϊνών» Παναγούλιας Ιωάννης, MSc,PhD

Ανάπτυξη Υπολογιστικών Εργαλείων για την Προσομο ίωση Μοριακής Δυναμικής Πρωτεϊνών σε Υδατικό Διάλυμα

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

SCIENTIA SILVAE SINICAE. a/ b. oldhamii). The length of cab2bo1 ( GenBank accession

Transcript:

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Σελίδα 1

Βάσεις Δεδομένων (ΒΔ) μεγάλο, οργανωμένο σύστημα δεδομένων συνδέεται με κατάλληλο λογισμικό για την ενημέρωση αναζήτηση ανάκτηση στοιχείων που έχουν αποθηκευθεί στο σύστημα βασική κατεύθυνση της Βιοπληροφορικής 1685 ΒΔ στη Molecular Biology Database Collection Σελίδα 2

Χρησιμότητα ΒΔ Οργάνωση / Αποθήκευση Προστιθέμενη αξία των δεδομένων που ενσωματώνονται σε ΒΔ κοινοποίηση στην επιστημονική κοινότητα επαναληψιμότητα διεργασιών σύγκριση και ανάλυση δεδομένων δημιουργία και έλεγχος υποθέσεων Μετασχηματισμός των δεδομένων σε γνώση Σελίδα 3

Χρησιμότητα ΒΔ Περιοδικά και τεύχη περιοδικών αφιερωμένα στις ΒΔ Database: The Journal of Biological Databases and Curation http://database.oxfordjournals.org/ Nucleic Acids Research (Database issue) http://nar.oxfordjournals.org/ NAR online Molecular Biology Database Collection http://www.oxfordjournals.org/our_journals/nar/database/c/ Σελίδα 4

Χρησιμότητα ΒΔ υποβολή των δεδομένων στην κατάλληλη ΒΔ, πριν την υποβολή της αντίστοιχης εργασίας σε ένα επιστημονικό περιοδικό π.χ. Proteins: Structure, Function, and Bioinformatics: For papers describing structures of biological macromolecules, the atomic coordinates and the related experimental data (structure factor amplitudes/intensities and/or NMR restraints) must be deposited at a member site of the Worldwide Protein Data Bank (www.wwpdb.org): RCSB PDB (www.pdb.org), PDBe (www.ebi.ac.uk/pdbe), PDBj (www.pdbj.org), or BMRB (www.bmrb.wisc.edu). The PDB ID must be included in the manuscript and entered into the designated field in the ScholarOne manuscripts upon submission. Σελίδα 5

Χαρακτηριστικά ΒΔ όγκος δεδομένων NCBI-GenBank (Aug 2013) 154 192 921 011 βάσεις, 167 295 840 ακολουθίες UniProt Σελίδα 6

Χαρακτηριστικά ΒΔ προσβάσιμες μέσω διαδικτύου ελεύθερα διαθέσιμες για όλους εμπορικές Σελίδα 7

σχολιασμός (annotation) Χαρακτηριστικά ΒΔ πληροφορίες απαραίτητες για την περιγραφή και αξιοποίηση των δεδομένων, π.χ. βιβλιογραφικές αναφορές οργανισµός απ όπου προέρχονται τα δεδομένα στοιχεία για την πειραματική μέθοδο χαρακτηριστικά των δεδομένων ετερογένεια ως προς την ποιότητα και την πληρότητα του σχολιασμού Σελίδα 8

Χαρακτηριστικά ΒΔ σύνδεσμοι με άλλες ΒΔ (cross-references) "point-and-click navigation" UniProt μία πρωτεϊνική ακολουθία συνδέεται π.χ. με την εγγραφή του γονιδίου στη GenBank με βιβλιογραφικές αναφορές στη PubMed Σελίδα 9

Χαρακτηριστικά ΒΔ τεχνικές προδιαγραφές ΒΔ επίπεδης οργάνωσης (flat files) απλά αρχεία κειμένου αναγνωριστικά στην αρχή των γραμμών που περιγράφουν το περιεχόμενό τους πολυπλοκότητα των δεδομένων χρησιμοποιούνται από πολλά προγράμματα ανάλυσης Accession number: 1 First Name: Amos Last Name: Bairoch Course: DEA 2000; DEA 2001; Dea 2002; http://www.expasy.org/people/amos.html // Σελίδα 10

Χαρακτηριστικά ΒΔ τεχνικές προδιαγραφές τυποποιημένα συστήματα διαχείρισης ΒΔ μοντέλα σχεσιακά, αντικειμενοστραφή κ.α. ACEDB: ειδικά σχεδιασμένο σύστημα διαχείρισης ΒΔ τεχνικά πλεονεκτήματα γλώσσα ερωτήσεων Σελίδα 11

Αρχειακές / Πρωτογενείς κατάθεση δεδομένων Δευτερογενείς επεξεργασία δεδομένων Εξειδικευμένες Βιβλιογραφικές Κατηγορίες ΒΔ Σελίδα 12

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών DNA Data Bank of Japan (DDBJ) Center for Information Biology (CIB) http://www.ddbj.nig.ac.jp/ GenBank National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/genbank/ European Nucleotide Archive (ENA) European Bioinformatics Institute (EBI) http://www.ebi.ac.uk/ena Σελίδα 13

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών International Nucleotide Sequence Database Collaboration http://www.insdc.org/ συνεργασία των DDBJ, GenBank, ENA κοινοί κανόνες για την ταξινόμηση και το σχολιασμό των δεδομένων καθημερινή ανταλλαγή εγγραφών Σελίδα 14

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών μορφοποίηση GenBank LOCUS X64011 756 bp DNA linear BCT 26-SEP-2006 DEFINITION Listeria ivanovii sod gene for superoxide dismutase. ACCESSION X64011 S78972 VERSION X64011.1 GI:44010 KEYWORDS sod gene; superoxide dismutase. SOURCE Listeria ivanovii ORGANISM Listeria ivanovii Bacteria; Firmicutes; Bacillales; Listeriaceae; Listeria. REFERENCE 1 AUTHORS TITLE Haas,A. and Goebel,W. Cloning of a superoxide dismutase gene from Listeria ivanovii by functional complementation in Escherichia coli and characterization of the gene product JOURNAL Mol. Gen. Genet. 231 (2), 313-322 (1992) PUBMED 1736100 Σελίδα 15

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών μορφοποίηση GenBank FEATURES Location/Qualifiers source 1..756 /organism="listeria ivanovii" /mol_type="genomic DNA" /db_xref="taxon:1638" CDS 109..717 /gene="sod" /EC_number="1.15.1.1" /codon_start=1 /transl_table=11 /product="superoxide dismutase" /protein_id="caa45406.1" /db_xref="interpro:ipr001189" /db_xref="uniprotkb/swiss-prot:p28763" /translation="mtyelpklpytydalepnfdketmeihytkhhniyvtklneavs GHAELASKPGEELVANLDSVPEEIRGAVRNHGGGHANHTLFWSSLSPNGGGAP Σελίδα 16

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών μορφοποίηση GenBank ORIGIN 1 cgttatttaa ggtgttacat agttctatgg aaatagggtc tatacctttc gccttacaat 61 gtaatttctt ttcacataaa taataaacaa tccgaggagg aatttttaat gacttacgaa 121 ttaccaaaat taccttatac ttatgatgct ttggagccga attttgataa agaaacaatg 181 gaaattcact atacaaagca ccacaatatt tatgtaacaa aactaaatga agcagtctca 241 ggacacgcag aacttgcaag taaacctggg gaagaattag ttgctaatct agatagcgtt 301 cctgaagaaa ttcgtggcgc agtacgtaac cacggtggtg gacatgctaa ccatacttta 361 ttctggtcta gtcttagccc aaatggtggt ggtgctccaa ctggtaactt aaaagcagca 421 atcgaaagcg aattcggcac atttgatgaa ttcaaagaaa aattcaatgc ggcagctgcg 481 gctcgttttg gttcaggatg ggcatggcta gtagtgaaca atggtaaact agaaattgtt 541 tccactgcta accaagattc tccacttagc gaaggtaaaa ctccagttct tggcttagat 601 gtttgggaac atgcttatta tcttaaattc caaaaccgtc gtcctgaata cattgacaca 661 ttttggaatg taattaactg ggatgaacga aataaacgct ttgacgcagc aaaataatta 721 tcgaaaggct cacttaggtg ggtcttttta tttcta // Σελίδα 17

Πρωτογενείς ΒΔ ΒΔ Νουκλεοτιδικών ακολουθιών μορφοποίηση FASTA πρώτη γραμμή: > ταυτότητα ακολουθίας (επικεφαλίδα) επόμενες γραμμές: ακολουθία βάσεων ή αμινοξέων (με τους κωδικούς του ενός γράμματος) >gi 44010 emb X64011.1 Listeria ivanovii sod gene for superoxide dismutase CGTTATTTAAGGTGTTACATAGTTCTATGGAAATAGGGTCTATACCTTTCGC CTTACAATGTAATTTCTTTTCACATAAATAATAAACAATCCGAGGAGGAATT TTTAATGACTTACGAATTACCAAAATTACCTTATAC Σελίδα 18

Πρωτογενείς ΒΔ ΒΔ Αμινοξικών ακολουθιών UniProt http://www.uniprot.org/ Swiss-Prot / TrEMBL / PIR-PSD Σελίδα 19

ΒΔ Αμινοξικών ακολουθιών Πρωτογενείς ΒΔ UniProt http://www.uniprot.org/ Σελίδα 20

ΒΔ Αμινοξικών ακολουθιών Πρωτογενείς ΒΔ UniProt http://www.uniprot.org/ Σελίδα 21

Πρωτογενείς ΒΔ ΒΔ Δομών μακρομορίων και μικρών μορίων PDB http://www.rcsb.org/pdb/home/home.do Σελίδα 22

Πρωτογενείς ΒΔ ΒΔ Δομών μακρομορίων και μικρών μορίων PDB http://www.rcsb.org/pdb/home/home.do Σελίδα 23

Πρωτογενείς ΒΔ ΒΔ Δομών μακρομορίων και μικρών μορίων μορφοποίηση PDB HEADER DIHYDROLIPOAMIDE ACETYLTRANSFERASE 16-DEC-92 1EAA TITLE ATOMIC STRUCTURE OF THE CUBIC CORE OF THE PYRUVATE DEHYDROGENASE TITLE 2 MULTIENZYME COMPLEX COMPND MOL_ID: 1; COMPND 2 MOLECULE: DIHYDROLIPOYL-TRANSACETYLASE; COMPND 3 CHAIN: A; COMPND 4 EC: 2.3.1.12; SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: AZOTOBACTER VINELANDII; SOURCE 3 ORGANISM_TAXID: 354 KEYWDS DIHYDROLIPOAMIDE ACETYLTRANSFERASE EXPDTA X-RAY DIFFRACTION AUTHOR A.MATTEVI,W.G.J.HOL REVDAT 4 13-JUL-11 1EAA 1 VERSN REVDAT 3 24-FEB-09 1EAA 1 VERSN REVDAT 2 01-APR-03 1EAA 1 JRNL REVDAT 1 31-OCT-93 1EAA 0 JRNL AUTH A.MATTEVI,G.OBMOLOVA,K.H.KALK,A.TEPLYAKOV,W.G.HOL JRNL TITL CRYSTALLOGRAPHIC ANALYSIS OF SUBSTRATE BINDING AND CATALYSIS JRNL TITL 2 IN DIHYDROLIPOYL TRANSACETYLASE (E2P). JRNL REF BIOCHEMISTRY V. 32 3887 1993 Σελίδα 24

Πρωτογενείς ΒΔ ΒΔ Δομών μακρομορίων και μικρών μορίων μορφοποίηση PDB ATOM 1 N ILE A 395 44.038 49.117 47.927 1.00 38.09 N ATOM 2 CA ILE A 395 42.911 48.771 47.065 1.00 37.62 C ATOM 3 C ILE A 395 41.806 49.715 47.553 1.00 38.16 C ATOM 4 O ILE A 395 41.597 49.893 48.754 1.00 38.35 O ATOM 5 CB ILE A 395 42.420 47.243 47.174 1.00 37.56 C ATOM 6 CG1 ILE A 395 41.141 47.074 47.963 1.00 38.29 C ATOM 7 CG2 ILE A 395 43.486 46.413 47.845 1.00 39.24 C ATOM 8 CD1 ILE A 395 40.674 45.622 47.993 1.00 40.41 C ATOM 9 N PRO A 396 41.197 50.465 46.656 1.00 39.07 N ATOM 10 CA PRO A 396 40.317 51.575 46.973 1.00 38.84 C ATOM 11 C PRO A 396 39.120 50.925 47.584 1.00 38.21 C ATOM 12 O PRO A 396 38.734 49.837 47.193 1.00 39.18 O ATOM 13 CB PRO A 396 39.949 52.236 45.689 1.00 39.42 C ATOM 14 CG PRO A 396 40.778 51.481 44.659 1.00 41.29 C ATOM 15 CD PRO A 396 41.011 50.108 45.262 1.00 40.06 C ATOM 16 N PRO A 397 38.536 51.543 48.551 1.00 37.94 N ATOM 17 CA PRO A 397 37.376 50.997 49.185 1.00 38.05 C ATOM 18 C PRO A 397 36.138 51.535 48.488 1.00 37.27 C ATOM 19 O PRO A 397 36.120 52.568 47.798 1.00 37.03 O ATOM 20 CB PRO A 397 37.570 51.444 50.585 1.00 38.31 C ATOM 21 CG PRO A 397 38.038 52.882 50.351 1.00 38.61 C ATOM 22 CD PRO A 397 39.013 52.751 49.196 1.00 38.71 C Σελίδα 25

Δευτερογενείς ΒΔ ΒΔ Οικογενειών πρωτεϊνών και domains domains: υπομονάδες με καλά συντηρημένη ακολουθία και συγκεκριμένη δομή / λειτουργία ανάλυση των ακολουθιών με διάφορους τρόπους: Patterns (regular expression) Profiles (weighted matrices) Hidden Markov Model (HMM) Σελίδα 26

Δευτερογενείς ΒΔ ΒΔ Οικογενειών πρωτεϊνών και domains InterPro http://www.ebi.ac.uk/interpro/index.html ολοκλήρωση επιμέρους ΒΔ π.χ. PROSITE http://prosite.expasy.org/ PFAM http://pfam.xfam.org/ InterProScan: αναζήτηση των πρωτεϊνικών μοτίβων σε μια ακολουθία εύρεση απομακρυσμένων σχέσεων σε ακολουθίες εξαγωγή συμπερασμάτων για την πρωτεϊνική λειτουργία Σελίδα 27

Δευτερογενείς ΒΔ ΒΔ Ταξινόμησης πρωτεϊνικών δομών CATH http://www.cathdb.info/ Class Architecture Topology (fold family) Homologous superfamily Σελίδα 28

Δευτερογενείς ΒΔ ΒΔ Ταξινόμησης πρωτεϊνικών δομών SCOP2 http://scop2.mrc-lmb.cam.ac.uk/ Σελίδα 29

Εξειδικευμένες ΒΔ KEGG: Kyoto Encyclopedia of Genes and Genomes http://www.genome.jp/kegg/ Σελίδα 30

Εξειδικευμένες ΒΔ ΟΜΙΜ: Online Mendelian Inheritance in Man http://www.ncbi.nlm.nih.gov/omim Gene Ontology http://www.geneontology.org/ δομημένο ελεγχόμενο λεξιλόγιο (γνωστό ως οντολογία) για την περιγραφή των γονιδιακών προϊόντων σε τρία επίπεδα: cellular component molecular function biological process Σελίδα 31

Genome Annotation DB Structural Annotation εξώνια, εσώνια, UTRs κ.α. Functional Annotation μοριακή λειτουργία, βιολογική διεργασία κ.α. (Gene Ontology) Σελίδα 32

Genome Annotation DB UCSC Genome Browser https://genome.ucsc.edu/ Ensembl http://www.ensembl.org/index.html FlyBase http://flybase.org/ WormBase http://www.wormbase.org/#012-34-5 Mouse Genome Informatics http://www.informatics.jax.org/ Σελίδα 33

Βιβλιογραφικές ΒΔ MEDLINE (πρόσβαση μέσω της υπηρεσίας PubMed) http://www.ncbi.nlm.nih.gov/pubmed/ Σελίδα 34

Αναζήτηση στις ΒΔ Διαδραστική αναζήτηση κωδικός εγγραφής στη ΒΔ λέξεις κλειδιά νουκλεοτιδικές ή αμινοξικές ακολουθίες (BLAST κ.α.) Σελίδα 35

Αναζήτηση στις ΒΔ Πρόσβαση μέσω προγραμμάτων σύνθετες αναζητήσεις / μαζική ανάκτηση δεδομένων δημιουργία συστημάτων επιστημονικών ροών εργασίας (scientific workflows) και διαδικτυακών εφαρμογών π.χ. in silico protein engineering web server Entrez Programming Utilities (eutils) http://www.ncbi.nlm.nih.gov/books/nbk25497/ Σελίδα 36

Αναζήτηση στις ΒΔ Ολοκληρωμένα συστήματα ανάκτησης πληροφοριών ταυτόχρονη αναζήτηση σε πολλές ΒΔ απλές ή σύνθετες αναζητήσεις εκκίνηση εφαρμογών επί των αποτελεσμάτων ενσωμάτωση ΒΔ που έχουν δημιουργηθεί από το χρήστη Σελίδα 37

Αναζήτηση στις ΒΔ Ολοκληρωμένα συστήματα ανάκτησης πληροφοριών Entrez http://www.ncbi.nlm.nih.gov/sites/gquery EB-eye http://www.ebi.ac.uk/ebisearch Σελίδα 38

Προοπτικές χειρισμός σφαλμάτων σφάλματα στα δεδομένα ή/και στο σχολιασμό αποδοτική αναζήτηση στοχευμένα αποτελέσματα ταχύτητα αναζήτησης ολοκλήρωση δεδομένων (data integration) ΒΔ πολυάριθμες, αυτόνομες, ετερογενείς και μερικώς επικαλυπτόμενες προτυποποίηση Σελίδα 39