ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Σχετικά έγγραφα
Βάσεις δομικών δεδομένων βιολογικών μακρομορίων

Σύγκριση και κατηγοριοποίηση πρωτεϊνικών δομών

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ II. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

Εισαγωγή στις πρωτεΐνες Δομή πρωτεϊνών Ταξινόμηση βάσει δομής Βάσεις με δομές πρωτεϊνών Ευθυγράμμιση δομών Πρόβλεψη 2D δομής Πρόβλεψη 3D δομής

Βιοπληροφορική. Ενότητα 20: Υπολογιστικός Προσδιορισμός Δομής (2/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Ασκήσεις 3& 4. Πρωτεϊνική Αρχιτεκτονική. Πλατφόρμες Πρόβλεψης & Προσομοίωσης 2ταγούς Δομής. Μοριακή Απεικόνιση

Κεφάλαιο 2 Βιολογικές Βάσεις Δεδομένων

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ

Ασκήσεις 1 & 2. Βάσεις Δεδομένων. Εργαλεία Αναζήτησης ClustalW & Blast

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ

Βιοπληροφορική. Ενότητα 2: Βάσεις Δεδομένων (1/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΑΠΕΙΚΟΝΙΣΗ ΜΟΡΙΑΚΩΝ ΔΟΜΩΝ

Υπερδευτεροταγής Δομή Πρωτεϊνών

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

Βιοπληροφορική. Βάσεις Δεδοµένων 1ο εργαστήριο. Γρηγόρης Αµούτζιας

Ποια είναι κατά τη γνώμη σας τα 30 μικρομόρια που συνιστούν τα πρόδρομα μόρια των βιομακρομορίων; Πώς μπορούν να ταξινομηθούν;

Εισαγωγή στους αλγορίθμους Βιοπληροφορικής. Στοίχιση αλληλουχιών

Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών

Αρχιτεκτονική της τρισδιάστατης δομής πρωτεϊνών

Βιοπληροφορική. Ενότητα 21: Υπολογιστικός Προσδιορισμός Δομής (3/3), 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΑΝΤΙΓΡΑΦΗ ΚΑΙ ΕΚΦΡΑΣΗ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΔΕΥΤΕΡΟΓΕΝΕΙΣ ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ. Δρ. Μαργαρίτα Θεοδωροπούλου

Ζεύγη βάσεων ΓΕΝΕΤΙΚΗ. Γουανίνη Κυτοσίνη. 4α. Λειτουργία γενετικού υλικού. Φωσφοδιεστερικός δεσμός

ΕΙΣΑΓΩΓΗ Ι. Στοιχεία Μοριακής Βιολογίας Βιολογικά Μακρομόρια ΙΙ. Επισκόπηση του πεδίου της Υπολογιστικής Βιολογίας - Βιοπληροφορικής

MAΘΗΜΑ 4 ο AMINOΞΕΑ-ΠΕΠΤΙ ΙΑ-ΠΡΩΤΕΪΝΕΣ

Βιοπληροφορική Ι. Παντελής Μπάγκος Αναπληρωτής Καθηγητής. Παν/μιο Θεσσαλίας Λαμία 2015

Οι πρωτεΐνες δομούνται από ένα σύνολο αμινοξέων. 1/10/2015 Δ.Δ. Λεωνίδας

Malgorzata Korycka-Machala, Marcin Nowosielski, Aneta Kuron, Sebastian Rykowski, Agnieszka Olejniczak, Marcin Hoffmann and Jaroslaw Dziadek

Βιοπληροφορική. Ενότητα 17: Δομή Πρωτεϊνών, 1 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

Δευτεροταγής Δομή Πρωτεϊνών

Δευτεροταγής Δομή Πρωτεϊνών

ΔΟΜΗ ΠΡΩΤΕΪΝΩΝ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

ΦΑΡΜΑΚΩΝ WORKSHOP ΣΧΕ ΙΑΣΜΟΥ

Αρχές οµικής Βιοπληροφορικής. Πρωτεΐνες. Αµινοξέα. (Υδρόφοβα)

ΑΣΚΗΣΗ 2η Αναζήτηση πληροφορίας σε βιολογικές βάσεις δεδοµένων

Τάξη. Γνωστικό αντικείµενο: Ειδικοί διδακτικοί στόχοι

Άσκηση 7. Προσομοίωση 3D Δομών Βιομορίων μέσω. Ομολογίας & Threading

Ταξινόμηση Πρωτεϊνικών Δομών με Χρήση Τοπολογικής, Γεωμετρικής και Βιολογικής Πληροφορίας

The effect of curcumin on the stability of Aβ. dimers

Κεφάλαιο 1. Οι δομικοί λίθοι

ÂÓÈÎ ÁÈ ÙÔ K ÙÙ ÚÔ 1 Ô KÂÊ Ï ÈÔ 1.1 E Ë Î ÙÙ ÚˆÓ ÚÔÎ Ú ˆÙÈÎ Î ÙÙ Ú

4 ο ΚΕΦΑΛΑΙΟ. Γ ε ν ε τ ι κ ή

Αµινοξέα και πεπτίδια Φύλλο εργασίας - αξιολόγησης

Διαλέξεις Χημείας Αγγελική Μαγκλάρα, PhD Εργαστήριο Κλινικής Χημείας Ιατρική Σχολή Πανεπιστημίου Ιωαννίνων

Εξόρυξη Γνώσης από Βιολογικά εδομένα

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ

ηµιουργία ϐάσης δεδοµένων για χαρακτηριστικά µοριακής αναγνώρισης (Molecular Recognition Features, MoRFs) σε µεµβρανικές πρωτεΐνες.

Αυτοματοποιημένη χαρτογραφία

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

Οι πρωτεΐνες συμμετέχουν σε όλες τις κυτταρικές λειτουργίες

Πρόγνωση δομής πρωτεϊνών (Μέρος Ι)

ΑΣΚΗΣΗ 3η Στοίχιση ακολουθιών βιολογικών µακροµορίων

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου

ΑΣΚΗΣΗ: ΣΧΕΔΙΑΣΜΟΣ ΕΚΚΙΝΗΤΩΝ ΕΥΡΕΣΗ ΘΕΣΕΩΝ ΠΕΡΙΟΡΙΣΜΟΥ

Βιοπληροφορική. Blast/PSI-Blast 3o εργαστήριο

Δομή και λειτουργία πρωτεϊνών. Το κύριο δομικό συστατικό των κυττάρων. Το κύριο λειτουργικό μόριο

Εξερευνώντας την Εξέλιξη Κεφάλαιο 7

Βάσεις δεδομένων αλληλουχιών

a 2,5 b 2,5 upplemental Figure 1 IL4 (4h) in Ja18-/- mice IFN-γ (16h) in Ja18-/- mice 1,5 1,5 ng/ml ng/ml 0,5 0,5 4ClPh PyrC 4ClPh PyrC

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ ΣΚΟΥΤΕΛΗ ΑΛΕΞΑΝΔΡΑ


Εισαγωγή Ακολουθίες Βιολογικών Μακροµορίων και Στοιχεία Μοριακής Εξέλιξης

Προγνωστικές μέθοδοι με βάση αμινοξικές αλληλουχίες

Κεφάλαιο 3. Δομές τάξης α

Structural and Physical Basis for Anti-IgE Therapy

Human angiogenin is a potent cytotoxin in the absence of ribonuclease inhibitor

ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΠΡΟΤΕΙΝΟΜΕΝΑ ΘΕΜΑΤΑ

Βιοφυσική. ΦΥΣ 415 Διδάσκων Σ. Σκούρτης (χειμερινό εξάμηνο ) 3 η Διάλεξη

ΤΕΛΟΣ 1ΗΣ ΑΠΟ 6 ΣΕΛΙΔΕΣ


Peptidylarginine deiminase 4

ΑΣΚΗΣΗ 4η Αναζήτηση οµοιοτήτων σε βάσεις δεδοµένων ακολουθιών

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Βιοπληροφορική. Ενότητα 1: Εισαγωγή στη Βιοπληροφορική

Ανάπτυξη Υπολογιστικών Εργαλείων για την Προσομο ίωση Μοριακής Δυναμικής Πρωτεϊνών σε Υδατικό Διάλυμα

Εισαγωγή. 1. Δομή πρωτεϊνών. Βιοπληροφορική ΙΙ «Ανάλυση Δομής Πρωτεϊνών» Παναγούλιας Ιωάννης, MSc,PhD

Βιοπληροφορική. Εισαγωγή. Αλέξανδρος Τζάλλας Σχολή Τεχνολογικών Εφαρμογών Τμήμα Μηχανικών Πληροφορικής ΤΕ.

Μάθημα 16 ο ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ

ΑΣΚΗΣΗ 1η Αναζήτηση πληροφορίας σε Βιβλιογραφικές Βάσεις εδοµένων

Βιοπληροφορική. Ενότητα 5: Στοίχιση ακολουθιών ανά ζεύγη, 2 ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ. Θηραίου

ΒΙΟΤΕΧΝΟΛΟΓΙΑ 1 ο ΓΕΝΙΚΟ ΛΥΚΕΙΟ ΒΟΛΟΥ ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ

ΑΝΑΖΗΤΗΣΗ ΟΜΟΙΟΤΗΤΩΝ ΣΕ ΒΑΣΕΙΣ Ε ΟΜΕΝΩΝ ΑΚΟΛΟΥΘΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Συγκριτική Γονιδιωματική

Κεφάλαιο 2ο. Αντιγραφή, έκφραση και ρύθμιση της γενετικής πληροφορίας

ΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΤΜΗΜΑ ΜΟΡΙΑΚΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΙ ΓΕΝΕΤΙΚΗΣ ΓΟΝΙ ΙΑΚΗ ΕΚΦΡΑΣΗ ΚΑΙ ΣΗΜΑΤΟ ΟΤΗΣΗ

Μέρος 2 ο. Το DNA και η λειτουργία του. Watson & Crick 1953

Πρόβλεψη δομής πρωτεϊνών

Full wwpdb X-ray Structure Validation Report i

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΒΙΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΧΗΜΕΙΑ - ΒΙΟΧΗΜΕΙΑ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ (ΚΥΚΛΟΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΠΑΡΑΓΩΓΗΣ) 24 ΜΑΪΟΥ 2013 ΕΚΦΩΝΗΣΕΙΣ

Διάλεξη 5. Μπράλιου Γεωργία, PhD, Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Πανεπιστήμιο Θεσσαλίας

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΕΣΠΕΡΙΝΩΝ

Study on anti-hyperlipidemia mechanism of high frequency herb pairs by molecular docking method

ΦΥΣΙΚΗ ΑΝΘΡΩΠΟΛΟΓΙΑ. Πρωτεύοντα ΙΙΙ Χρήση µοριακών δεδοµένων

To DNA και η λειτουργία του

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (2/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΓΩΝΙΕΣ φ, ψ ΚΑΙ ΕΠΙΤΡΕΠΤΕΣ ΔΙΑΜΟΡΦΩΣΕΙΣ ΤΗΣ ΠΟΛΥΠΕΠΤΙΔΙΚΗΣ ΑΛΥΣΙΔΑΣ

Advances in the study of to0in in halobios

Transcript:

ΒΑΣΕΙΣ ΠΡΩΤΕΪΝΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Δρ. Μαργαρίτα Θεοδωροπούλου

Βάσεις Βιολογικών Δεδομένων Νουκλεοτιδικές Αλληλουχίες: GENBANK (http://www.ncbi.nlm.nih.gov/genbank/index.html) EMBL ΕΝΑ (http://www.ebi.ac.uk/ena) DDBJ (http://www.ddbj.nig.ac.jp/) Πρωτεϊνικές Ακολουθίες: UniprotKB (Uniprot Knowledgebase, http://www.uniprot.org/) Τρισδιάστατες Βιολογικές Δομές: Protein Data Bank (PDB, http://www.rcsb.org) Γονιδιακή Έκφραση: GeneExpression Omnibus (GEO, http://www.ncbi.nlm.nih.gov/geo/) Array Express (http://www.ebi.ac.uk/arrayexpress/) Stanford Microarray Database (SMD, http://smd.stanford.edu/) Γενετική Ποικιλομορφία: dbsnp (http://www.ncbi.nlm.nih.gov/snp) HapMap (http://hapmap.ncbi.nlm.nih.gov/) Βιβλιογραφία: PubMed (http://www.ncbi.nlm.nih.gov/pubmed)

Τι πληροφορίες μπορούμε να πάρουμε από τις δομές; Δευτεροταγή δομή Λειτουργία, μηχανισμοί Ομοιότητα, εξελικτικές σχέσεις Σχήμα, μέγεθος Δίπλωμα Δομικά μοτίβα Αποστάσεις, γωνίες Επιφάνειες αλληλεπιδράσεων, ιδιότητες επιφάνειας Επιρροή των μεταλλάξεων Διαμεμβρανικά τμήματα κλπ

Πρωτεΐνες

Πρωτεΐνες

worldwide Protein Data Bank (wwpdb)

worldwide Protein Data Bank (wwpdb) Ιδρύθηκε το 1971 στο Brookhaven National Laboratories (BNL). Μεταφέρθηκε στο Research Collaboratory for Structural Bioinformatics (RCSB) το 1998. Τα δεδομένα κατατίθονται από πειραματιστές και είναι ελεύθερα διαθέσιμα.

worldwide Protein Data Bank (wwpdb) Οι δομές μπορούν να κατατεθούν σε οποιοδήποτε από τα 4 κέντρα. Τα δεδομένα είναι σε σταθερά συστήματα αποθηκευμένα και γίνεται και εκκαθάριση αυτών (διπλοεγγραφές, λάθη κλπ). Κάθε κέντρο διαθέτει εφαρμογές που επιτρέπει στους χρήστες πρόσβαση, αναζήτηση και ανάκτηση δεδομένων που σχετίζονται με τις δομές.

PDB data formats Το αρχείο PDB περιλάμβανε αρχικά τις συντεταγμένες και σχετικές πληροφορίες. Το αρχείο ήταν πάντοτε σε μορφή flat-file με προκαθορισμένη μορφοποίηση των γραμμών. Συντεταγμένες ατόμων, πλούσιος σχολιασμός. Επιπλέον πληροφορίες για την περιγραφή των πειραμάτων και υπολογισμού της δομής (macromolecular Crystallographic Information file - mmcif).

PDB data formats Οι εγγραφές στην PDB εκτός από τις συντεταγμένες των ατόμων που απαρτίζουν τη δομή περιλαμβάνουν και επιπρόσθετα στοιχεία βοηθητικά όπως βιβλιογραφικές αναφορές, λεπτομέρειες για τον προσδιορισμό της δομής, πειραματικές μέθοδοι και άλλα στοιχεία που προκύπτουν από τη δομή. Κάθε δομή πριν διατεθεί στο κοινό υφίσταται έλεγχο για την ορθότητά της με τη χρήση ειδικού λογισμικού και στη συνέχεια αποκτά έναν κωδικό χαρακτηριστικό και κατατίθεται στη βάση.

Protein Data Bank (PDB, http://www.rcsb.org)

Protein Data Bank (PDB, http://www.rcsb.org)

Protein Data Bank (PDB, http://www.rcsb.org)

Protein Data Bank (PDB, http://www.rcsb.org)

HEADER MEMBRANE PROTEIN / HYDROLASE 05-OCT-07 2RH1 TITLE HIGH RESOLUTION CRYSTAL STRUCTURE OF HUMAN B2-ADRENERGIC G PROTEIN- TITLE 2 COUPLED RECEPTOR. COMPND MOL_ID: 1; COMPND 2 MOLECULE: BETA-2-ADRENERGIC RECEPTOR/T4-LYSOZYME CHIMERA; COMPND 3 CHAIN: A; COMPND 4 SYNONYM: BETA-2 ADRENERGIC RECEPTOR, BETA-2 ADRENOCEPTOR, BETA-2 COMPND 5 ADRENORECEPTOR / LYSIS PROTEIN, MURAMIDASE, ENDOLYSIN; COMPND 6 ENGINEERED: YES; COMPND 7 MUTATION: YES SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS, ENTEROBACTERIA PHAGE T4; SOURCE 3 ORGANISM_COMMON: HUMAN,; SOURCE 4 ORGANISM_TAXID: 9606,10665; SOURCE 5 STRAIN:,; ------ SOURCE 11 EXPRESSION_SYSTEM_PLASMID: PFASTBAC1; SOURCE 12 OTHER_DETAILS: THE CONSTRUCT HAS BEEN OBTAINED BY OVERLAPPING SOURCE 13 EXTENSION PCR KEYWDS GPCR, 7TM, ADRENERGIC, FUSION, LIPIDIC CUBIC PHASE, LIPIDIC, KEYWDS 2 MESOPHASE, CHOLESTEROL, MEMBRANE PROTEIN, MEMBRANE PROTEIN - KEYWDS 3 HYDROLASE COMPLEX, STRUCTURAL GENOMICS, PSI-2, PROTEIN STRUCTURE KEYWDS 4 INITIATIVE, ACCELERATED TECHNOLOGIES CENTER FOR GENE TO 3D KEYWDS 5 STRUCTURE, ATCG3D EXPDTA X-RAY DIFFRACTION AUTHOR V.CHEREZOV,D.M.ROSENBAUM,M.A.HANSON,S.G.F.RASMUSSEN,F.S.THIAN, AUTHOR 2 T.S.KOBILKA,H.J.CHOI,P.KUHN,W.I.WEIS,B.K.KOBILKA,R.C.STEVENS, AUTHOR 3 ACCELERATED TECHNOLOGIES CENTER FOR GENE TO 3D STRUCTURE (ATCG3D), AUTHOR 4 GPCR NETWORK (GPCR) REVDAT 9 08-AUG-12 2RH1 1 REMARK REVDAT 8 13-JUL-11 2RH1 1 VERSN REVDAT 7 01-SEP-09 2RH1 1 AUTHOR KEYWDS TITLE REMARK ------ REVDAT 2 06-NOV-07 2RH1 1 JRNL HELIX SHEET DREVDAT 1 30-OCT-07 2RH1 0 JRNL AUTH V.CHEREZOV,D.M.ROSENBAUM,M.A.HANSON,S.G.RASMUSSEN,F.S.THIAN, ----- JRNL PMID 17962520 JRNL DOI 10.1126/SCIENCE.1150577 REMARK 1 REMARK 1 REFERENCE 1 REMARK 1 AUTH D.M.ROSENBAUM,V.CHEREZOV,M.A.HANSON,S.G.F.RASMUSSEN, -------

BREF 2RH1 A 1 230 UNP P07550 ADRB2_HUMAN 1 230 DBREF 2RH1 A 1002 1161 UNP P00720 LYS_BPT4 2 161 DBREF 2RH1 A 263 365 UNP P07550 ADRB2_HUMAN 263 365 SEQADV 2RH1 ASP A -6 UNP P07550 EXPRESSION TAG ---- SEQRES 1 A 500 ASP TYR LYS ASP ASP ASP ALA MET GLY GLN PRO GLY ASN SEQRES 2 A 500 GLY SER ALA PHE LEU LEU ALA PRO ASN ARG SER HIS ALA ----- SEQRES 39 A 500 THR GLY GLU GLN SER GLY HET MAL A 401 23 ------- HETNAM MAL MALTOSE ---- FORMUL 2 MAL C12 H22 O11 ------- HELIX 1 1 ASP A 29 LYS A 60 1 32 ---- SHEET 4 1 4 GLY A1056 THR A1059 0 SSBOND 1 CYS A 106 CYS A 191 1555 1555 2.05 SSBOND 2 CYS A 184 CYS A 190 1555 1555 2.06 LINK SG CYS A 265 C2 ACM A 411 1555 1555 1.61 LINK SG CYS A 341 C1 PLM A 415 1555 1555 1.62 SITE 1 AC1 9 GLU A1011 GLY A1030 HIS A1031 LEU A1032 ------ SITE 1 BC6 3 HOH A 538 ASP A1072 VAL A1075 CRYST1 106.318 169.240 40.154 90.00 105.62 90.00 C 1 2 1 4 ORIGX1 1.000000 0.000000 0.000000 0.00000 ORIGX2 0.000000 1.000000 0.000000 0.00000 ORIGX3 0.000000 0.000000 1.000000 0.00000 SCALE1 0.009406 0.000000 0.002630 0.00000 SCALE2 0.000000 0.005909 0.000000 0.00000 SCALE3 0.000000 0.000000 0.025859 0.00000 ATOM 1 N ASP A 29-52.822-1.611 23.137 1.00 98.48 N ATOM 2 CA ASP A 29-51.922-2.262 22.148 1.00 98.06 C -------- HETATM 3804 O HOH A 547-19.199 49.833 44.410 1.00 55.49 O HETATM 3805 O HOH A 548-35.618 21.645 8.827 1.00 61.27 O CONECT 597 1283 CONECT 1229 1277 CONECT 1277 1229 ---- MASTER 493 0 16 19 4 0 23 6 3804 1 219 39 END

Μειονεκτήματα των Flat files Οι δομές των μακρομορίων είναι ιδιαίτερα περίπλοκες. Η υπάρχουσα μορφοποίηση του αρχείου της PDB αδυνατεί να περιγράψει κάποιες δομές. Οι παλιότερες εγγραφές δεν έχουν κρατηθεί σε ομοιόμορφα αρχεία και δεν είναι εύκολα προσβάσιμα και διαθέσιμα. Η αναζήτηση και η εξόρυξη πληροφοριών και δεδομένων δεν είναι ιδιαίτερα εύκολη και ακριβής.

Uniform Data PDBe Relational Database Improved Query Functionality Crystallographers Biologists Time Effort Usefulness Usage Programmers Bioinformaticians

Στατιστικά στοιχεία της PDB Συνολικά πάνω από 120.000 δομές βιομακρομορίων Προσδιορισμένες με κρυσταλλογραφία ακτίνων-χ (~89,5%) και NMR (~9,5%)

Στατιστικά στοιχεία της PDB

Στατιστικά στοιχεία της PDB

SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ Structural Classification of Proteins Ιεραρχική ταξινόμηση που γίνεται με το «μάτι» 38221 PDB Entries 110800 Domains Murzin, et al, 1995 Η SCOP έχει ως βασικό στόχο την ανάλυση των δομικών και εξελικτικών σχέσεων μεταξύ όλων των πρωτεϊνών γνωστής δομής κατατεθειμένων στην PDB. Τα βασικά επίπεδα ταξινόμησης είναι η οικογένεια (Family), υπερ-οικογένεια (Super-family), αναδίπλωση (Fold) και η τάξη (Class). Η βασική οντότητα είναι τα DOMAINS. Η ιεραρχία της κατά κύριο λόγο εκφράζει το περιεχόμενο δευτεροταγούς δομής.

Επίπεδα ταξινόμησης SCOP Family: Ξεκάθαρη εξελικτική σχέση. Καθορίζεται από δύο κριτήρια (πολύ όμοιες δομές και λειτουργίες, >30% ταυτόσημα κατάλοιπα). Super-family: Πιθανή κοινή εξελικτική προέλευση. Χαμηλά επίπεδα ομοιότητας πρωτοταγούς δομής. Κοινά δομικά χαρακτηριστικά. Fold: Σημαντική δομική ομοιότητα (Κοινά στοιχεία δευτεροταγούς δομής, κοινή διευθέτηση, κοινή τοπολογία διασυνδέσεων). Η ομοιότητα οφείλεται στη φυσικοχημική ιδιότητα των πρωτεϊνών και όχι σε εξελικτική συσχέτιση. Class: Η ιεραρχία της κατά κύριο λόγο εκφράζει το περιεχόμενο δευτεροταγούς δομής. a. all-α, η δομή ουσιαστικά σχηματίζεται από α-έλικες b. all-β, η δομή αποτελείται από β-πτυχωτές επιφάνειες c. α/β, α-έλικες και β-πτυχωτές επιφάνειες εναλλάσσονται στην δομή της πρωτεΐνης και d. α+β, α-έλικες και β-πτυχωτές επιφάνειες βρίσκονται σε διακριτές περιοχές της δομής.

SCOP and CATH http://www.cathdb.info/ Classification of protein domain structures 124 folds 226 Superfamily 1148 Sequence family 14473 Domain Homologous superfamilies, Topology, Archtecture, Class Η CATH είναι μία βάση ιεραρχικής ταξινόμησης των πρωτεϊνικών δομών που είναι κατατεθειμένες στην PDB με βάση τις αυτοτελείς δομικές περιοχές (domains) που τις απαρτίζουν και οι πρωτεϊνικές δομές πρέπει να είναι προσδιορισμένες σε διακριτικότητα υψηλότερη των 3 Å.

3HHB - all alpha

1CD8 - all beta

1KFJ - alpha/beta

1AL1 - Amphiphilic Alpha Helix Render: ball and stick Color: hydrophobicity

Προγράμματα Μοριακών Γραφικών - Pymol Η χρήση μοριακών γραφικών με τη βοήθεια υπολογιστή έχει διευκολύνει σημαντικά τη διαδικασία αναπαράστασης δομών βιομορίων στο χώρο. Βέβαια είναι ιδιαίτερα δύσκολο να καταδειχθεί όλη η σημαντική δομική πληροφορία σε μια αναπαράσταση δύο διαστάσεων όπως συμβαίνει στην οθόνη του υπολογιστή. Καμία αναπαράσταση σε 2 διαστάσεις δεν είναι δυνατό να καταδείξει όλες τις λεπτομέρειες μιας πραγματικής τρισδιάστατης αναπαράστασης. Για αυτό το σκοπό έχουν αναπτυχθεί μια σειρά από τρόπους αναπαράστασης με καθένα από αυτούς να παρουσιάζει μια συγκεκριμένη άποψη του μορίου. Ανάλογα λοιπόν με τα χαρακτηριστικά της δομής που επιθυμεί ο χρήστης να μελετήσει μπορεί να επιλέξει και τον κατάλληλο τρόπο αναπαράστασης. Μερικοί από τους τρόπους αναπαράστασης που μπορεί να επιλέξει ο χρήστης είναι: 1. Σκελετικό μοντέλο(wire-frame model). 2. Βall & stick model. 3. Χωροπληρωτικό μοντέλο (space-filling model). 4. Stick model. 5. Cartoons 6. Κορδέλες (Ribbons) 7. Επιφάνειες (Surfaces). 8. Εμφάνιση ιδιοτήτων επιφανειών (Επιφάνειες όπου απεικονίζεται το ηλεκτροστατικό δυναμικό κ.α.). 9. Κινούμενα σχέδια (Animation-Δυναμική διαδικασία). Μέσω της χρήσης του υπολογιστή γίνεται προσπάθεια να δημιουργηθεί μια εικόνα στην οθόνη κατά τέτοιο τρόπο ώστε να δίνει την εντύπωση τρισδιάστατης απεικόνισης των αντικείμενων. Αυτό επιτυγχάνεται με τις κατάλληλες εναλλαγές φωτισμού στα αντικείμενα δίνοντας την εντύπωση του βάθους, προσομοιώνοντας τελικά τη στερεοσκοπική όραση.