ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 1
Αναζήτηση πληροφορίας σε βιολογικές ΒΔ Αναζήτηση δεδομένων στην UniProt Καταγράψτε το μήκος της αμινοξικής ακολουθίας (Sequence length), τη λειτουργία (Function) και τον ενδοκυττάριο εντοπισμό (Subcellular location) της πρωτεΐνης. Με ποια ασθένεια σχετίζεται η συγκεκριμένη πρωτεΐνη (Involvement in disease); Καταγράψτε μία μετάλλαξη που συνδέεται με την εν λόγω ασθένεια (Natural variations). Ακολουθήστε τον υπερσύνδεσμο στην KEGG. Με ποια μεταβολικά μονοπάτια (Pathway) σχετίζεται το συγκεκριμένο ένζυμο; ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 2
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 3
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 5
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 6
Αναζήτηση πληροφορίας σε βιολογικές ΒΔ Αναζήτηση δεδομένων στο Entrez Ποιο είναι το μήκος της ακολουθίας (LOCUS); Σε ποιο χρωμόσωμα και σε ποια θέση βρίσκεται το γονίδιο (FEATURES source /map); Ποιες οι 10 πρώτες βάσεις της γενομικής ακολουθίας; Στη συνέχεια μεταβείτε στην ΟΜΙΜ, μελετήστε την εγγραφή για το γονίδιο CFTR με κωδικό *602421 και καταγράψτε τις ασθένειες με τις οποίες συνδέεται το συγκεκριμένο γονίδιο. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 7
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 8
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 9
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 10
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 11
Αναζήτηση πληροφορίας σε βιολογικές ΒΔ Αναζήτηση δεδομένων στο EMBL-EBI Καταγράψτε τον οργανισμό (Organism) από τον οποίο προέρχεται το γονίδιο, την σύντομη περιγραφή του (Sequence: X07479.1 :) και το μήκος της ακολουθίας (Sequence length). Μεταβαίνοντας στην καρτέλα Other Feature(s), καταγράψτε τους κωδικούς των βάσεων δεδομένων Uniprot, PDB και InterPro που σχετίζονται με την αντίστοιχη πρωτεΐνη. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 12
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 13
Στοίχιση ακολουθιών βιολογικών μακρομορίων Σύγκριση αποτελεσμάτων διαφορετικών προγραμμάτων στοίχισης ακολουθιών EMBOSS Needle EMBOSS Water BLAST (Align two or more sequences.) Παρατηρήστε τις στοιχίσεις και για κάθε μία από αυτές, καταγράψτε το ποσοστό των ταυτόσημων καταλοίπων και τον αριθμό των αμινοξέων που έχουν στοιχιθεί. Υπάρχουν διαφορές; ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 14
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 15
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 17
Στοίχιση ακολουθιών βιολογικών μακρομορίων Στοίχιση αμινοξικών και νουκλεοτιδικών ακολουθιών στοιχίστε τις νουκλεοτιδικές ακολουθίες στοιχίστε τις αντίστοιχες αμινοξικές ακολουθίες Καταγράψτε το ποσοστό των ταυτόσημων καταλοίπων και συγκρίνετε τις δύο στοιχίσεις. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 19
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 21
Στοίχιση ακολουθιών βιολογικών μακρομορίων Σύγκριση αποτελεσμάτων στοίχισης ακολουθιών με διαφορετικές ποινές για τα κενά στοιχίστε τις αμινοξικές ακολουθίες αλλάζοντας τις ποινές για τα κενά καταγράψτε τον αριθμό των ταυτόσημων καταλοίπων και τον αριθμό των κενών στον ακόλουθο πίνακα Συγκρίνετε τις στοιχίσεις με την ευθυγράμμιση που προκύπτει από τη δομική υπέρθεση των πρωτεϊνών. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 22
Στοίχιση ακολουθιών βιολογικών μακρομορίων Σύγκριση αποτελεσμάτων στοίχισης ακολουθιών με διαφορετικές ποινές για τα κενά ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 23
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 24
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 25
Αναζήτηση ομοιοτήτων σε ΒΔ ακολουθιών Μεταβείτε στην ιστοσελίδα του BLAST και αναζητήστε ομόλογες πρωτεΐνες της Signal recognition particle 54 kda protein (SRP54) του ποντικού (αρχείο P14576_Srp54_mouse.fasta) στον οργανισμό Escherichia coli, χρησιμοποιώντας ως Β.Δ. την swissprot. Ποια από τις παραλλαγές του BLAST θα χρησιμοποιήσετε; Αναγνωρίστε τα συντηρημένα domains στην πρωτεΐνη. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 27
Αναζήτηση ομοιοτήτων σε ΒΔ ακολουθιών Για το καλύτερο αποτέλεσμα του BLAST (blast hit): Καταγράψτε το όνομα και τον κωδικό της πρωτεΐνης, το ποσοστό των ταυτόσημων καταλοίπων, το ποσοστό των κενών, το μήκος της στοίχισης καθώς και το E-value. Ανακτήστε την ακολουθία της πρωτεΐνης αυτής και χρησιμοποιήστε την για μία νέα αναζήτηση BLAST, προκειμένου να εντοπίσετε ομόλογες αλληλουχίες στον οργανισμό Mus musculus. Το καλύτερο αποτέλεσμα της νέας αναζήτησης είναι η αρχική ακολουθία SRP54; Σχολιάστε την εξελικτική σχέση μεταξύ των δύο πρωτεϊνών. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 30
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 31
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 32
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 33
Αναζήτηση ομοιοτήτων σε ΒΔ ακολουθιών Αναζητείστε ομόλογες νουκλεοτιδικές ακολουθίες της SRP54 του ποντικού στον οργανισμό Escherichia coli, χρησιμοποιώντας το mrna από το αρχείο X16319_Srp54_mouse.fasta και τη Β.Δ. nr. Συγκρίνετε τα αποτελέσματα του blastn και του blastx και σχολιάστε. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 34
Blastn Blastx ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 35
Αναζήτηση ομοιοτήτων σε ΒΔ ακολουθιών Αναζητείστε ομόλογες ακολουθίες της P09331_eta_staphyl.fasta χρησιμοποιώντας το PSI-BLAST (4 κύκλους / επαναλήψεις) και τη Β.Δ. swissprot, θέτοντας το Max target sequences ίσο με 1000 και το Expect threshold ίσο με 0.005. Για κάθε επανάληψη ακολουθείστε το σύνδεσμο στο Taxonomy reports και συμπληρώστε τον παρακάτω πίνακα με το συνολικό αριθμό των οργανισμών, τα hits ανά βασίλειο και το E-value της πρωτεΐνης με κωδικό P09331. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 36
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 37
iteration organisms bacteria eukaryota viruses P09331 E-value 1 24 68 1 0 0.0 2 82 148 43 0 6e-123 3 127 151 97 18 2e-84 4 263 164 811 22 5e-71 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 38
Αναζήτηση ομοιοτήτων σε ΒΔ ακολουθιών Ανακτήστε από τα αποτελέσματα της 4ης επανάληψης του PSI-BLAST τη στοίχιση της πρωτεΐνης με κωδικό P35031 και καταγράψτε το E-value και το ποσοστό των ταυτόσημων καταλοίπων. Με ποια αμινοξέα της ακολουθίας επερώτησης (Query sequence) στοιχίζονται τα κατάλοιπα του ενεργού κέντρου της P35031 (Sbjct sequence) (H60, D104 και S196); Προχωρήστε σε μία απλή αναζήτηση BLASTp έναντι της Β.Δ. swissprot χρησιμοποιώντας τις προεπιλεγμένες παραμέτρους. Υπάρχει η πρωτεΐνη με κωδικό P35031 στα αποτελέσματά σας; Σχολιάστε. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 39
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 40
Πολλαπλή στοίχιση ακολουθιών Αναζητείστε πληροφορίες σχετικά με τη ακολουθία του αρχείου seqmotifscan.fasta PROSITE Πόσα μοτίβα (hits by patterns) εμφανίζονται στην ακολουθία; Καταγράψτε τους χαρακτηριστικούς κωδικούς τους. Για ένα από αυτά, ακολουθήστε τους υπερσυνδέσμους και καταγράψτε το μοτίβο (Pattern) και τα στατιστικά στοιχεία Precision και Recall. Ανακτήστε το logo του μοτίβου (Retrieve the sequence logo from the alignment). ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 41
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 43
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 44
Πολλαπλή στοίχιση ακολουθιών Αναζητείστε πληροφορίες σχετικά με τη ακολουθία του αρχείου seqmotifscan.fasta PFAM Ποιες εγγραφές της Pfam-A ταιριάζουν στην ακολουθία (Significant Pfam-A Matches) και με ποια τιμή E-value; Καταγράψτε τις αντίστοιχες στοιχίσεις. Μεταβείτε σε μία από αυτές και αναφέρετε μία εγγραφή της PDB της ίδιας οικογένειας. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 45
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 46
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 47
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 48
Πολλαπλή στοίχιση ακολουθιών Αναζητείστε πληροφορίες σχετικά με τη ακολουθία του αρχείου seqmotifscan.fasta INTERPRO Ποιοι κωδικοί της INTERPRO βρέθηκαν στην ακολουθία; Από ποιες βάσεις δεδομένων υποστηρίζονται; Για έναν από τους κωδικούς, ακολουθήστε τους υπερσυνδέσμους και καταγράψτε σε πόσες πρωτεΐνες ανά βασίλειο αντιστοιχεί η συγκεκριμένη εγγραφή. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 49
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 50
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 51
Πολλαπλή στοίχιση ακολουθιών Κατασκευάστε την πολλαπλή τους στοίχιση χρησιμοποιώντας το Clustal Omega και το T-Coffee. Τα μοτίβα P-x-[FH]-P-[AS]-Y-[GIP]-S-G-H-A-[TV]-x-[AGNS]-[AG]-[AI]- x(2)-[egqt]-[imv]-[lv] R-x(2)-[AGL]-G-[IV]-H-[WY]-x(2)-D-[AGQ]-x-[AEQ]-[AGS] βρίσκονται και στις δύο πολλαπλές στοιχίσεις; Σχολιάστε την απάντησή σας. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 52
P-x-[FH]-P-[AS]-Y-[GIP]-S-G-H-A-[TV]-x-[AGNS]-[AG]-[AI]-x(2)-[EGQT]- [IMV]-[LV] R-x(2)-[AGL]-G-[IV]-H-[WY]-x(2)-D-[AGQ]-x-[AEQ]-[AGS] Clustal Omega
P-x-[FH]-P-[AS]-Y-[GIP]-S-G-H-A-[TV]-x-[AGNS]-[AG]-[AI]-x(2)-[EGQT]- [IMV]-[LV] R-x(2)-[AGL]-G-[IV]-H-[WY]-x(2)-D-[AGQ]-x-[AEQ]-[AGS] TCoffee
Φυλογενετική Ανάλυση Στο αρχείο primatesaa.phy δίνεται η πολλαπλή στοίχιση 5 αμινοξικών ακολουθιών πρωτευόντων θηλαστικών, η εξελικτική ιστορία των οποίων περιγράφεται από το δέντρο gibbon(orangutan(gorilla(chimpanzee, man))). Σχεδιάστε το δέντρο. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 55
Φυλογενετική Ανάλυση Ανακατασκευάστε το φυλογενετικό δέντρο των 5 ακολουθιών με τα ακόλουθα προγράμματα: PHYLIP PROTPARS (μέγιστη φειδωλότητα) PhyML (μέγιστη πιθανοφάνεια) (επιλέξτε μόνο τα βήματα Construction of phylogenetic tree και Visualisation of phylogenetic tree από τον υπερσύνδεσμο "A la Carte") Συγκρίνετε τα αποτελέσματα με το αναμενόμενο φυλογενετικό δέντρο και σχολιάστε. ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 56
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 57
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 58
Πρωτεϊνική Δομή Μεταβείτε στην ιστοσελίδα της PDB και αναζητείστε την εγγραφή με κωδικό 1BBP. Ποιος είναι ο προσδέτης της πρωτεΐνης (Ligands); Μεταβαίνοντας στην καρτέλα Annotations, καταγράψτε σε ποια τοπολογία (Topology) της βάσης δεδομένων CATH ανήκει η πρωτεΐνη και ποια GO Terms τη χαρακτηρίζουν. Μεταβαίνοντας στην καρτέλα Sequence, ανακτήστε τη δευτεροταγή δομή της πειραματικά λυμένης πρωτεΐνης (Secondary Structure: DSSP). ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 59
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 60
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 61
Πρωτεϊνική Δομή Κατεβάστε το αρχείο της δομής Download Files / PDB file (text). Καταγράψτε την πειραματική μέθοδο (EXPDTA) και τη διακριτική ικανότητα (REMARK 2 RESOLUTION) στην οποία έχει λυθεί η δομή. Ποιο είναι το 8ο κατάλοιπο της αλυσίδας Β; Ποιες είναι οι συντεταγμένες του κεντρικού ατόμου άνθρακα CA του 8ου καταλοίπου; Ποιες είναι οι συντεταγμένες του πρώτου ατόμου του προσδέτη BLV της αλυσίδας Α (HETATM); ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 62
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 63
ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ Σελίδα 64