Εργαστήριο 6 MEGA Στατιστική ανάλυση αλληλουχιών Στέφανος Λεπτίδης, PhD Τμήμα Βιοτεχνολογίας Γεωπονικό Πανεπιστήμιο Αθηνών
Βιοπληροφορική σουίτα MEGA Στατιστική ανάλυση αλληλουχιών Σε προηγούμενα εργαστήρια είδαμε: Πως να στοιχίζουμε πολλαπλές ακολουθίες DNA Πως η στοίχιση μας διευκολύνει να αναγνωρίσουμε εξελικτικά συντηρημένες αλληλουχικές περιοχές Το ρυθμιστικό ρόλο που μπορεί να έχουν εξελικτικά συντηρημένες αλληλουχίες (π.χ. σίγαση μέσω πρόσδεσης από microrna) Τη σημασία των αλληλουχικών ομοιοτήτων στην αναγνώριση της εξελικτικής τους συγγένειας Σε αυτό το εργαστήριο θα δούμε Μία εναλλακτική βιοπληροφορική εφαρμογή, το MEGA Πως μπορούμε να υπολογίσουμε στατιστικά στοιχεία αλληλουχιών που βοηθούν στην διαλεύκανση των εξελικτικών τους συγγενειών
MEGA Εξελικτικές αναλύσεις με τη βιοπληροφορική σουίτα MEGA Εργαλείο εξελικτικής ανάλυσης. Tρέχει σε όλα τα υπολογιστικά περιβάλλοντα (Windows, MacOS, Linux) Δεν απαιτεί προγραμματιστικές γνώσεις. Εμπεριέχει στοίχιση ακολουθιών, στατιστική ανάλυση αλληλουχιών, φυλογενετική ανάλυση, κατασκευή δέντρων κ.α. Ιστοσελίδα MEGA: https://www.megasoftware.net/
Βήμα 1 Γνωριμία με το MEGA Ανοίγοντας το MEGA βλέπουμε το μενού με την πληθώρα επιλογών του. Εμπεριέχει εργαλεία για στοίχιση, φόρτωση και ανάλυση δεδομένων, μοντέλα, εύρεση αποστάσεων, ποικιλότητα, φυλογένεια, κατασκευή δέντρων και εύρεση προγόνων. Στοίχιση Φόρτωση δεδομένων Μοντέλα Εύρεση αποστάσεων Ποικιλότητα Φυλογένεια Εύρεση προγόνων
Βήμα 2 Στατιστικά στοιχεία 2 διαφορετικών στοιχίσεων αλληλουχιών Θα αναλύσουμε στατιστικά 2 διαφορετικές στοιχίσεις. Το γονίδιο της αλκοολικής αφυδρογονάσης στη Drosophila και της πρωτείνης θερμικού σοκ Hsp20 σε 4 θηλαστικά. Drosophila_Adh Hsp20 Αλληλουχίες της αλκοολικής αφυδρογονάσης, διαφόρων ειδών Drosophila. Αλληλουχίες της Hsp20 πρωτεΐνης θερμικού σοκ, σε άνθρωπο, ποντίκι, αρουραίο και ταύρο.
Βήμα 3 Φόρτωση δεδομένων Αλκοολικής αφυδρογονάσης Δροσόφιλα Από το μενού Data (δεδομένα) επιλέγουμε Open a File/Session για άνοιγμα ενός αρχείου MEGA.
Βήμα 4 Επιλογή αρχείου Από τον φάκελο των παραδειγμάτων επιλέγουμε το αρχείο Drosophila_Adh.meg Παραδείγματα Ο φάκελος παραδειγμάτων βρίσκεται: Windows: C:\Users\UserName\Do cuments\mega7\exam ples\. Mac: $HOME/MEGA/E xamples. ($HOME είναι το όνομα του φακέλου του χρήστη).
Βήμα 5 Άνοιγμα παραθύρου διερεύνησης δεδομένων Από το μενού Data επιλέγουμε Explore Active Data για να δούμε τα δεδομένα που ανοίξαμε.
Βήμα 6 Παράθυρο στοίχισης Στο νέο παράθυρο βλέπουμε τις αλληλουχίες του Γονιδίου Adh για διάφορα είδη της οικογένειας Drosophila, με τη στοίχισή τους. Οι τελείες αντιπροσωπεύουν απόλυτη στοίχιση με την consensus αλληλουχία
Βήμα 7 Εντοπισμός ποικιλόμορφων περιοχών Μπορούμε επίσης να εντοπίσουμε τις περιοχές που παρουσιάζουν ποικιλομορφία πατώντας Highlight variable sites. Ποικιλόμορφες περιοχές
Βήμα 8 Εντοπισμός συντηρημένων περιοχών Μπορούμε να εντοπίσουμε τις περιοχές που είναι πλήρως συντηρημένες πατώντας Highlight conserved sites. Συντηρημένες περιοχές
Βήμα 9 Εντοπισμός singleton Μπορούμε να εντοπίσουμε τις περιοχές που είναι συντηρημένες σε όλα τα είδη πλην ενός, πατώντας Highlight singleton sites. Περιοχές singleton Singleton Τα σημεία διαφοροποίησης ενός νουκλεοτιδίου, ενός είδους μόνο σε μία πολλαπλή στοίχιση, μπορούν να σηματοδοτούν σημεία εξελικτικής διαφοροποίησης μέσω μεμονωμένων μεταλλάξεων (point mutations).
Βήμα 10 Στατιστικές επιλογές Για να αναλύσουμε στατιστικά στοιχεία, από την μπάρα επιλογών του MEGA επιλέγουμε Statistics.
Βήμα 11 Νουκλεοτιδική σύσταση Αρχικά ας δούμε τη νουκλεοτιδική σύσταση των αλληλουχιών. Επιλέγουμε Nucleotide Composition.
Βήμα 12 Αποτελέσματα νουκλεοτιδικής σύστασης Η στατιστική ανάλυση μας δίνει συνολικά στατιστικά για κάθε νουκλεοτίδιο. Επίσης για κωδικές περιοχές DNA μας δίνει στατιστικά στοιχεία εμφάνισης νουκλεοτιδίων για κάθε μία εκ των 3 θέσεων κάθε κωδικονίου. Νουκλεοτιδική σύσταση Στατιστικά για κάθε νουκελοτίδιο Έρευνες έχουν δείξει ότι υπάρχει συσχέτιση μεταξύ εξέλιξης και νουκλεοτιδικής σύστασης αλληλουχιών. Κωδικές, συντηρημένες μεταξύ των ειδών, περιοχές του DNA φαίνονται να έχουν μεγαλύτερο ποσοστό GC σε σχέση με άλλες περιοχές με μεγαλύτερη κινιτικότητα. Στατιστικά θέσεων κωδικονίων
Βήμα 13 Χρήση κωδικονίων Ας αναλύσουμε τώρα τη χρήση συγκεκριμένων κωδικονίων. Για το σκοπό αυτό επιλέγουμε Statistics à Codon Usage.
Βήμα 14 Αποτελέσματα χρήσης κωδικονίων Η νέα στατιστική ανάλυση συμπεριλαμβάνει όλα τα κωδικόνια καθώς και τα ποσοστά εμφάνισής τους. % Κωδικονίων Στατιστικά για κάθε κωδικόνιο Codon usage bias: Το φαινόμενο κατά το οποίο κάποια κωδικόνια παρουσιάζουν μεγαλύτερα ποσοστά εμφάνισης από τα συνώνυμά τους. Έμπλέκεται ως διαδικασία σε στην εξελικτική βελτιστοποίηση της μετάφρασης.
Βήμα 15 Μετάφραση αλληλουχιών Επιστρέφουμε στο παράθυρο της στοίχισης. Μπορούμε ήδη από εδώ να μεταφράσουμε την αλληλουχία. Για το σκοπό αυτό πατάμε Translate Sequences. Μετάφραση
Βήμα 16 Αμινοξική σύσταση Πλέον ο κώδικας έχει αλλάξει σε πρωτεϊνικό κώδικα. Μπορούμε λοιπόν τώρα να διερευνήσουμε την αμινοξική σύσταση των αλληλουχιών. Πατάμε Statistics à Amino Acid Composition.
Βήμα 17 Αποτελέσματα αμινοξικής σύστασης Στη στατιστική ανάλυση μπορούμε πλέον να δούμε στατιστικά εμφάνισης κάθε αμινοξέως ανά είδος, αναφορικά με τη σύσταση του γονιδίου Adh. Στατιστικά για κάθε αμινοξύ
Βήμα 18 Ερωτήσεις 1-3 Δείτε τις ερωτήσεις 1-3 πρoτού προχωρήσετε παρακάτω.
Βήμα 19 Ανάλυση στοίχισης γονιδίκου Hsp20 Επαναλαμβάνουμε τα βήματα 1-17 για της αλληλουχίες του γονιδίου Hsp20. Drosophila_Adh Hsp20 Αλληλουχίες της αλκοολικής αφυδρογονάσης, διαφόρων ειδών Drosophila. Αλληλουχίες της Hsp20 πρωτεΐνης θερμικού σοκ, σε άνθρωπο, ποντίκι, αρουραίο και ταύρο.
Βήμα 20 Ερωτήσεις 4-5 Δείτε τις ερωτήσεις 4-5 για να ολοκληρώσετε το εργαστήριο.
Βήμα 21 Στατιστικά στοιχεία ζευγών νουκλεοτιδίων Για την εύρεση συχνότητας ζευγών εμφάνισης συγκεκριμένων ζευγών νουκλεοτίδίων μπορούμε να χρησιμοποιήσουμε το Nucletoide Pair Frequencies. Επιλέγουμε Directional (16 Pairs)
Ερώτηση bonus Για extra βαθμούς Δείτε την ερώτηση bonus για έξτρα βαθμούς και καλή επιτυχία!