Εισαγωγή Ακολουθίες Βιολογικών Μακροµορίων και Στοιχεία Μοριακής Εξέλιξης Βασίλης Προµπονάς, PhD Ερευνητικό Εργαστήριο Βιοπληροφορικής Τµήµα Βιολογικών Επιστηµών Νέα Παν/πολη, Γραφείο B161 Πανεπιστήµιο Κύπρου Ταχ.Κιβ. 20537 1678, Λευκωσία ΚΥΠΡΟΣ τηλ: 00357-22892879 (εσωτ. 2879) emil: vprobon@ucy.c.cy, vprobon@biol.uo.gr
Σύνοψη Εισαγωγή: Βασικές Βιολογικές Έννοιες Η Βιοπληροφορική ως Επιστηµονικό Πεδίο Είδη Δεδοµένων Ακολουθίες και Υπολογιστική Γονιδιωµατική Στοιχεία Μοριακής Εξέλιξης Συζήτηση...
Βασικές Βιολογικές Έννοιες Γονιδίωµα Χρωµόσωµα (τα) Γονίδια Πρωτεΐνες Χρήσιµη Εισαγωγή στη Μοριακή Γενετική ( Primer on Moleculr Genetics, αν και ίσως όχι πλήρως ενηµερωµένη): http://www.ornl.gov/sci/techresources/humn_genome/publict/primer/index.shtml Συµβουλευτείτε επίσης άλλο διδακτικό υλικό και σχετικά συγγράµµατα
Βασικές Βιολογικές Έννοιες (2) Γονιδίωµα: Όλο το DNA (µόνο??) ενός οργανισµού Εµπεριέχει όλη τη γενετική πληροφορία Χρωµόσωµα (τα) Γονίδια Πρωτεΐνες
Βασικές Βιολογικές Έννοιες (3) Γονιδίωµα Χρωµόσωµα (τα) Σφιχτά περιελιγµένα µόρια δίκλωνου DNA Περιέχουν Λειτουργικές Περιοχές (γονίδια) και Περιοχές Άγνωστης (προς το παρόν) Λειτουργίας ( junk DNA???) Γονίδια Πρωτεΐνες
Βασικές Βιολογικές Έννοιες (4) Γονιδίωµα Χρωµόσωµα (τα) Γονίδια Περιοχές του DNA που κωδικοποιούν λειτουργικά προϊόντα (ποιά??) Μεταγραφή (µεταφορά της γενετικής πληροφορίας σε µόρια RNA) Πρωτεΐνες
Βασικές Βιολογικές Έννοιες (5) Γονιδίωµα Χρωµόσωµα (τα) Γονίδια Πρωτεΐνες Οι διεκπεραιωτές των Κυτταρικών Λειτουργιών (Οι µόνοι???) Γραµµικά πολυµερή L-α-αµινοξέων Αλληλεπιδρούν µε Πρωτεΐνες ή/και άλλα Βιοµόρια
Ροή της Γενετικής Πληροφορίας Αντιγραφή DNA Μεταγραφή RNA Μετάφραση PROTEIN
«Ενιαίος» Γενετικός Κώδικας Ο Γενετικός Κώδικας είναι ΕΚΦΥΛΙΣΜΕΝΟΣ!
Σχηµατικά: ΓΟΝΙΔΙΩΜΑ ΧΡΩΜΟΣΩΜΑΤΑ ΑΛΛΗΛΟΥΧΙΑ DNA ORF1 ORF2 E1 ORF3 E2 E3 ORF4 ΔΟΜΗ ΓΟΝΙΔΙΩΝ ΑΜΙΝΟΞΙΚΗ ΑΚΟΛΟΥΘΙΑ
Παράδειγµα: Η ινσουλίνη του χοίρου Pig Insulin Dimer (PDB_ID:4INS) Pig Insulin Precursor MALWTRLLPLLALLALWAPAPAQAFVNQHLCGSHLVEALYLVCGERGFFYTPKARREAEN PQAGAVELGGGLGGLQALALEGPPQKRGIVEQCCTSICSLYQLENYCN S Gly Ile Vl S Glu Gln Cys Cys Thr Phe Vl Asn Gln Ser Ile Chin A Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn S S S S His Leu Cys Gly Ser His Leu Vl Glu Al Leu Tyr Leu Vl Chin B Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Al
Η Συνέχεια του Κεντρικού Δόγµατος... (Σχεδόν) για όλες τις πρωτεΐνες: Sequence 3D-structure Function Determines..VEQCCTSICSLYQL.. Ο Γενετικός Κώδικας είναι ΕΚΦΥΛΙΣΜΕΝΟΣ! Determines Glucose Uptke Pthwy Glycogen Synthesis Pthwy Formtion of triglycerides
Πρωτεϊνική Δοµή και Λειτουργία
Αλλαγή Παραδείγµατος στη Βιολογία!! Μαζική παραγωγή Ανοµοιογενών Πειραµατικών Δεδοµένων Ακολουθίες (DNA-RNA-Protein) Εικόνες (EM, Expression Dt) 3D Δοµές Whole orgnism/cell biology versus Single gene biology Ελεύθερα Διαθέσιµα Δεδοµένα!!
... Βιοπληροφορική... Τεράστιες Ποσότητες Πειραµατικών Δεδοµένων από Genome Projects [και όχι µόνο!!!] Αδύνατη η Πειραµατική Μελέτη [Προσδιορισµός Δοµής και Ταυτοποίηση της Λειτουργίας] Ανάπτυξη Μεθόδων Βιοπληροφορικής Γεφυρώνει το Χάσµα Συστήµατα Διαχείρισης Δεδοµένων Μέθοδοι Εξόρυξης / Ανάλυσης Δεδοµένων
In vivo, In vitro, IN SILICO! Χρήση ή Δηµιουργία νέων Τεχνολογιών Πληροφορικής Υιοθέτηση νέων Προτύπων Προχωρηµένα DBMSs Υψηλής Απόδοσης Συστήµατα SW/HW Ανάπτυξη Εξειδικευµένων Αλγορίθµων Οντολογίες Ονοµατολογίες Ελεύθερα Διαθέσιµο Λογισµικό!!
Ακολουθίες: Οργάνωση Δεδοµένων GeneBnk/EMBL/DDBJ UNIPROT PRIMARY SwissProt-PIR-TREMBL PROSITE/PFAM SECONDARY
SwissProt (http://www.expsy.ch/sprot) ID AC DE GN OS CC CC DR KW FT FT SQ // INS_PIG STANDARD; P01315; Q9TSJ5; PRT; 108 AA. INSULIN PRECURSOR. INS. Sus scrof (Pig). -!- FUNCTION: INSULIN DECREASES BLOOD GLUCOSE CONCENTRATION. IT INCREASES CELL PERMEABILITY TO MONOSACCHARIDES, AMINO ACIDS AND EMBL; AF064555; AAC77920.1; ALT_INIT. [EMBL / GenBnk / DDBJ] Insulin fmily; Hormone; Glucose metbolism; Signl; 3D-structure. SIGNAL 1 24 CHAIN 25 54 INSULIN B CHAIN. SEQUENCE 108 AA; 11671 MW; CB4491B429858EBE CRC64; MALWTRLLPL LALLALWAPA PAQAFVNQHL CGSHLVEALY LVCGERGFFY TPKARREAEN PQAGAVELGG GLGGLQALAL EGPPQKRGIV EQCCTSICSL YQLENYCN
Prosite (http://www.expsy.ch/prosite) ID AC DE PA DO // INSULIN; PATTERN. PS00262; Insulin fmily signture. C-C-{P}-x(2)-C-[STDNEKPI]-x(3)-[LIVMFS]-x(3)-C. PDOC00235; nd Documenttion {PDOC00235} {PS00262; INSULIN} {BEGIN} **************************** * Insulin fmily signture * **************************** The insulin fmily of proteins [1] groups number of ctive peptides which re evolutionry relted. This fmily currently consists of: {END}
PIR (http://pir.georgetown.edu) >P1;IPPG insulin precursor - pig C;Species: Sus scrof domestic (domestic pig) C;Accession: A01583; A94572; S16492; A60835; B60835 C;Keywords: hormone; pncres F;1-30/Domin: insulin chin B #sttus experimentl F;1-30,64-84/Product: insulin #sttus experimentl F;33-63/Domin: connecting peptide #sttus experimentl F;64-84/Domin: insulin chin A #sttus experimentl F;7-70,19-83,69-74/Disulfide bonds: #sttus experimentl >P1;IPPG FVNQHLCGSH LVEALYLVCG ERGFFYTPKA RREAENPQAG AVELGGGLGG LQALALEGPP QKRGIVEQCC TSICSLYQLE NYCN*
Υπολογιστική Ανάλυση Ακολουθιών Μέθοδοι Βασισµένοι στην Ανίχνευση Οµοιότητας Εµπειρικές Μέθοδοι Τεχνικές Μηχανικής Μάθησης Αυτοµατοποιηµένα ή «µε το χέρι??»
Αυτοµατοποιηµένα?? Αυτοµατοποιηµένος Σχολιασµός βασισµένος σε οµοιότητες (σύστηµα GeneQuiz, Μάϊος 2000) για τα ORFs του γονιδιώµατος του Αρχαίου Methnococcus jnnschii. http://jur.ebi.c.uk:8765/ext-genequiz//genomes/mj0005/index.html
Αυτοµατοποιηµένα?? (2) Από Koonin EV nd Glperin M, (2003) Sequence Evolution Function: BIO 650:Computtionl Ειδικά Θέµατα Βιοπληροφορικής, 21/01/2010 Genomics Approches in Comprtive
Στοιχεία Μοριακής Εξέλιξης Η Εξελικτική θεωρία αποτελεί θεµέλειο λίθο της σύγχρονης Βιολογίας Έρευνα σε εντελώς διαφορετικούς τοµείς (π.χ. ανατοµία, γονιδιωµατική) επωφελείται από την κατανόηση των αλλαγών των οργανισµών στην πορεία του χρόνου Είναι δυνατόν να κατανοήσουµε καλύτερα τη συσχέτιση µεταξύ µορίων µελετώντας τις αλλαγές που υπέστησαν στην πορεία του χρόνου Nothing in biology mkes sense except in the light of evolution. Theodosius Dobzhnsky, 1973
Στοιχεία Μοριακής Εξέλιξης (2) Μοριακή? Ποιά µόρια... Εξέλιξη Ποιοί µηχανισµοί/διαδικασίες... Μικρή vs Μεγάλη κλίµακα Σηµειακές µεταλλάξεις (Συνώνυµες, Σιωπηλές, Indels,...) Indels Ανασυνδυασµός (crossing over gene conversion) Αναστροφές
Το µοντέλο 1-παραµέτρου των Jukes-Cntor (1969) ΠΑΡΑΔΟΧΕΣ Οι διαφορετικές σηµειακές µεταλλάξεις (A->C, A->G, A->T, C->A...) είναι ΙΣΟΠΙΘΑΝΕΣ () Οι πιθανότητες µετάλλαξης σε κάθε θέση είναι ΑΝΕΞΑΡΤΗΤΕΣ To: From: A G C T --------------------------------A 1-3 G 1-3 C 1-3 T 1-3 PX(t+1)=(1-3)PX(t)+(1-PX(t))
Το µοντέλο 2-παραµέτρων του Kimur (1980) ΠΑΡΑΔΟΧΕΣ Οι διαφορετικές σηµειακές µεταλλάξεις (A->C, A->G, A->T, C->A...) δεν είναι ΙΣΟΠΙΘΑΝΕΣ Οι µεταπτώσεις (A<->G, C<->T) είναι συχνότερες από τις µεταστροφές Οι πιθανότητες µετάλλαξης σε κάθε θέση είναι ΑΝΕΞΑΡΤΗΤΕΣ
JC Α vs G Kimur Α G b b b b C T C T
Συζήτηση...