Splice site recognition between different organisms



Σχετικά έγγραφα
NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE FACULTY OF INFORMATICS AND TELECOMMUNICATIONS

Splice Site Prediction Using Transfer Learning

A method for identifying TSS from CAGE data using a Genomic Signal Processing approach

Inferring regulatory subnetworks through the analysis of genome-wide expression profiles

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE DEPARTMENT OF INFORMATICS AND TELECOMMUNICATIONS

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE DEPARTMENT OF INFORMATICS AND TELECOMMUNICATIONS

Προσδιορισμός Σημαντικών Χαρακτηριστικών της Αυθόρμητης Δραστηριότητας Απομονωμένου Εγκεφαλικού Φλοιού in vitro

Radiogenomics methods on the relationship between molecular and imaging characteristics to improve breast cancer classification

Data Analytics in Chronic Disease Self-Management Statistical and Machine Learning Methodologies for Knowledge Discovery based on Quantified Self Data

Πλασμονικές Οργανικές Δίοδοι Εκπομπής Φωτός Υψηλής Απόδοσης

Διπλωματική Εργασία. Μελέτη των μηχανικών ιδιοτήτων των stents που χρησιμοποιούνται στην Ιατρική. Αντωνίου Φάνης

Web-Interface for querying and visualizing Alcoholic Liver Disease Patients data from database using GraphQL

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ

Ανάπτυξη ολοκληρωμένου περιβάλλοντος ανάλυσης και ταξινόμησης μαστογραφικών εικόνων

Current state-of-the-art of the research conducted in mapping protein cavities binding sites of bioactive compounds, peptides or other proteins

Development of a pipeline for secondary and tertiary structural analysis of human mirna targeting

Βιοπληροφορική. Μαργαρίτα Θεοδωροπούλου. Πανεπιστήμιο Θεσσαλίας, Λαμία 2016

Development of data mining tools for identifying structural determinants that dictate protein-ligand interactions

Bacterial image analysis based on time-lapse microscopy

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ

ΑΝΩΤΑΤΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΠΕΙΡΑΙΑ ΤΕΧΝΟΛΟΓΙΚΟΥ ΤΟΜΕΑ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ Τ.Ε.

Automating Free Energy Perturbation Calculations For Drug Design

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΤΙΤΛΟΣ

In silico modeling studies of the immune modulatory mechanisms in Inflammatory Bowel Disease

Characterization of the molecular networks that control pathogenic T-cell driven responses in Multiple Sclerosis using RNA-seq analysis software

ΣΤΥΛΙΑΝΟΥ ΣΟΦΙΑ

Υπολογιστική Ανάλυση παθολογιών γονάτου με την χρήση εικόνων MRI

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

ΑΝΙΧΝΕΥΣΗ ΓΕΓΟΝΟΤΩΝ ΒΗΜΑΤΙΣΜΟΥ ΜΕ ΧΡΗΣΗ ΕΠΙΤΑΧΥΝΣΙΟΜΕΤΡΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Αλγοριθµική και νοηµατική µάθηση της χηµείας: η περίπτωση των πανελλαδικών εξετάσεων γενικής παιδείας 1999

þÿ P u b l i c M a n a g e m e n t ÃÄ ½ ¼ÌÃ

Εκπαίδευση και Πολιτισμός: έρευνα προκαταρκτικής αξιολόγησης μίας εικονικής έκθεσης

Πτυχιακή διατριβή. Η επίδραση της τασιενεργής ουσίας Ακεταλδεΰδης στη δημιουργία πυρήνων συμπύκνωσης νεφών (CCN) στην ατμόσφαιρα

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

Βιοπληροφορική Ι (ΜΕΡΟΣ Α) Βιοπληροφορική Ανάλυση Γονιδιωμάτων. Εισαγωγή στης Βιολογικές Βάσεις Δεδομένων

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ»

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΔΙΔΑΚΤΟΡΙΚΗΣ ΔΙΑΤΡΙΒΗΣ ΤΙΤΛΟΣ Συμπληρώστε τον πρωτότυπο τίτλο της Διδακτορικής διατριβής ΑΡ. ΣΕΛΙΔΩΝ ΕΙΚΟΝΟΓΡΑΦΗΜΕΝΗ

PUBLICATION. Participation of POLYTECH in the 10th Pan-Hellenic Conference on Informatics. April 15, Nafplio

Η συγκρότηση του Εκλεκτορικού Σώματος ορίστηκε από τη Γενική Συνέλευση Ειδικής Σύνθεσης του Τμήματος Βιολογίας στις

ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ

Introduction to Bioinformatics

þÿ ¼ ¼± Ä Â ÆÅùº  ÃÄ ½

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ

Τ.Ε.Ι. ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

Βιοπληροφορική Ι. Παντελής Μπάγκος. Παν/µιο Στερεάς Ελλάδας

þÿ O ÁÌ» Â Ä Å ¹µÅ Å½Ä Ç»¹

þÿ¼ ½ ±Â : ÁÌ» Â Ä Å ÃÄ ²µ þÿä Å ÃÇ»¹º Í Á³ Å

ΕΜΠΕΙΡΙΚΗ ΔΙΕΡΕΥΝΙΣΗ ΚΙΝΔΥΝΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΓΡΑΜΜΑΤΩΝ ΣΕ ΕΠΙΛΕΓΜΕΝΟΥΣ ΤΡΑΠΕΖΙΚΟΥΣ ΟΡΓΑΝΙΣΜΟΥΣ

þÿ ½ Á Å, ˆ»µ½± Neapolis University þÿ Á̳Á±¼¼± ¼Ìù±Â ¹ º à Â, Ç» Ÿ¹º ½ ¼¹ºÎ½ À¹ÃÄ ¼Î½ º±¹ ¹ º à  þÿ ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

Εργαστήριο Ιατρικής Φυσικής

Georgiou, Styliani. Neapolis University. þÿ ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

þÿš ź ÍÄÃ, Éĵ¹½ Neapolis University þÿ Á̳Á±¼¼± ¼Ìù±Â ¹ º à Â, Ç» Ÿ¹º ½ ¼¹ºÎ½ À¹ÃÄ ¼Î½ º±¹ ¹ º à  þÿ ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

þÿ ¹µ ½  ±À±³É³ À±¹ ¹Î½ º±Ä þÿ ͼ²±Ã Ä Â ³ Â Ä Å

Οικονοµετρική ιερεύνηση των Ελλειµµάτων της Ελληνικής Οικονοµίας

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ. «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΝΟΣΟΚΟΜΕΙΑΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: Mετακύλιση τιμών βασικών προϊόντων και τροφίμων στην περίπτωση του Νομού Αιτωλοακαρνανίας

Μεταπτυχιακή Διατριβή

Business English. Ενότητα # 9: Financial Planning. Ευαγγελία Κουτσογιάννη Τμήμα Διοίκησης Επιχειρήσεων

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΦΙΛΟΣΟΦΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΙΤΑΛΙΚΗΣ ΦΙΛΟΛΟΓΙΑΣ ΜΕΤΑΠΤΥΧΙΑΚΟΣ ΚΥΚΛΟΣ ΣΠΟΥΔΩΝ ΚΑΤΕΥΘΥΝΣΗ: ΛΟΓΟΤΕΧΝΙΑ-ΠΟΛΙΤΙΣΜΟΣ

ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ ΕΚΤΑΣΕΩΝ

ΔΘΝΙΚΗ ΥΟΛΗ ΓΗΜΟΙΑ ΓΙΟΙΚΗΗ ΙΗ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ

þÿ ½ ÁÉÀ ºµ½ÄÁ¹º ÀÁ à ³³¹Ã Ä þÿ Á³±½Éù±º  ±»»±³  ¼ ÃÉ þÿà» Á Æ Á¹±º Í ÃÅÃÄ ¼±Ä Â.

Εκδήλωση ενδιαφέροντος για τη χορήγηση υποτροφίας για την εκπόνηση διδακτορικής διατριβής

BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ

ASSURANCE. Οδηγός Σπουδών E-Learning

Η πρώιμη παρέμβαση σε παιδιά με διαταραχές όρασης και πρόσθετες αναπηρίες στην Ελλάδα

Ανάλυση εισοδήματος των μισθωτών και παράγοντες που το επηρεάζουν

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕ ΘΕΜΑ : «ΑΜΦΙΣΒΗΤΗΣΕΙΣ ΟΡΙΩΝ ΓΕΩΤΕΜΑΧΙΩΝ ΔΙΑΔΙΚΑΣΙΑ ΕΠΙΛΥΣΗΣ ΜΕΣΩ ΔΙΚΑΣΤΙΚΩΝ ΠΡΑΓΜΑΤΟΓΝΩΜΟΣΥΝΩΝ.»

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙO ΑΘΗΝΩΝ ΤΜΗΜΑ ΑΞΙΟΠΟΙΗΣΗΣ ΦΥΣΙΚΩΝ ΠΟΡΩΝ & ΓΕΩΡΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Constantinou, Andreas

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Pilloras, Panagiotis. Neapolis University. þÿ À¹ÃÄ ¼Î½, ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

Διερεύνηση χαρτογράφησης Ποσειδωνίας με χρήση επιβλεπόμενης ταξινόμησης οπτικών δορυφορικών εικόνων

þÿ»» ± - ±»» ± - ½É¼ ½ ±Ã»

ΦΩΤΟΓΡΑΜΜΕΤΡΙΚΕΣ ΚΑΙ ΤΗΛΕΠΙΣΚΟΠΙΚΕΣ ΜΕΘΟΔΟΙ ΣΤΗ ΜΕΛΕΤΗ ΘΕΜΑΤΩΝ ΔΑΣΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ :

ΝΑΥΤΙΛΙΑΚΟΙ ΚΥΚΛΟΙ ΚΑΙ ΧΡΗΜΑΤΟΔΟΤΗΣΗ ΝΑΥΤΙΛΙΑΚΩΝ ΕΠΕΝΔΥΣΕΩΝ

Ανάπτυξη διαδικτυακής διαδραστικής εκπαιδευτικής εφαρμογής σε λειτουργικό σύστημα Android

Study of urban housing development projects: The general planning of Alexandria City

IMES DISCUSSION PAPER SERIES

ΑΛΛΗΛΕΠΙ ΡΑΣΗ ΜΟΡΦΩΝ ΛΥΓΙΣΜΟΥ ΣΤΙΣ ΜΕΤΑΛΛΙΚΕΣ ΚΑΤΑΣΚΕΥΕΣ

Βιοπληροφορική. Ενότητα 10: Αναζήτηση Ομοιοτήτων σε ΒΔ Ακολουθιών - Blast, (1/2) 1ΔΩ. Τμήμα: Βιοτεχνολογίας Όνομα καθηγητή: Τ.

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ "ΠΟΛΥΚΡΙΤΗΡΙΑ ΣΥΣΤΗΜΑΤΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ. Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΕΠΙΛΟΓΗΣ ΑΣΦΑΛΙΣΤΗΡΙΟΥ ΣΥΜΒΟΛΑΙΟΥ ΥΓΕΙΑΣ "

Πρόγραμμα εξ Αποστάσεως Εκπαίδευσης E-Learning. Πρόγραμμα εξ Αποστάσεως Εκπαίδευσης E-Learning. E-Learning ASSURANCE. E-learning.

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΠΑΝΔΠΗΣΖΜΗΟ ΠΑΣΡΩΝ ΣΜΖΜΑ ΖΛΔΚΣΡΟΛΟΓΩΝ ΜΖΥΑΝΗΚΩΝ ΚΑΗ ΣΔΥΝΟΛΟΓΗΑ ΤΠΟΛΟΓΗΣΩΝ ΣΟΜΔΑ ΤΣΖΜΑΣΩΝ ΖΛΔΚΣΡΗΚΖ ΔΝΔΡΓΔΗΑ

Δοµή και ιδιότητες του DNA. 09/04/ Μοριακή Βιολογία Κεφ. 1 Καθηγητής Δρ. Κ. Ε. Βοργιάς

Kyriakou, Eupraxia. Neapolis University. þÿ Á̳Á±¼¼± ¼Ìù±Â ¹ º à Â, Ç» Ÿ¹º ½ ¼¹ºÎ½ À¹ÃÄ ¼Î½ º±¹ ¹ º à  þÿ ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

Η ΨΥΧΙΑΤΡΙΚΗ - ΨΥΧΟΛΟΓΙΚΗ ΠΡΑΓΜΑΤΟΓΝΩΜΟΣΥΝΗ ΣΤΗΝ ΠΟΙΝΙΚΗ ΔΙΚΗ

Transcript:

NATIONAL AND KAPODISTRIAN UNIVERSITY OF ATHENS SCHOOL OF SCIENCE DEPARTMENT OF INFORMATICS AND TELECOMMUNICATIONS INTERDEPARTMENTAL POSTGRADUATE PROGRAM "INFORMATION TECHNOLOGIES IN MEDICINE AND BIOLOGY" MASTER THESIS Splice site recognition between different organisms Despoina I. Kalfakakou Supervisors: Stavros Perantonis, Research Director, NCSR Demokritos George Paliouras, Research Director, NCSR Demokritos Anastasia Krithara, Post-Doctoral Researcher, NCSR Demokritos ATHENS OCTOBER 2015

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΑΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ "ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗΝ ΙΑΤΡΙΚΗ ΚΑΙ ΤΗ ΒΙΟΛΟΓΙΑ" ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Αναγνώριση θέσεων ματίσματος μεταξύ διαφορετικών οργανισμών Δέσποινα Η. Καλφακάκου Επιβλέποντες: Σταύρος Περαντώνης, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Γεώργιος Παλιούρας, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Αναστασία Κριθαρά, Μεταδιδακτορική Ερευνήτρια, ΕΚΕΦΕ Δημόκριτος ΑΘΗΝΑ ΟΚΤΩΒΡΙΟΣ 2015

MASTER THESIS Splice site recognition between different organisms Despoina I. Kalfakakou R.N.: PIV0119 SUPERVISORS: Stavros Perantonis, Research Director, NCSR Demokritos George Paliouras, Research Director, NCSR Demokritos Anastasia Krithara, Post-Doctoral Researcher, NCSR Demokritos EXAMINATION COMITTEE: Stavros Perantonis, Research Director, NCSR Demokritos George Paliouras, Research Director, NCSR Demokritos Anastasia Krithara, Post-Doctoral Researcher, NCSR Demokritos October 2015

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Αναγνώριση θέσεων ματίσματος μεταξύ διαφορετικών οργανισμών Δέσποινα Η. Καλφακάκου Α.Μ.: ΠΙΒ0119 ΕΠΙΒΛΕΠΟΝΤΕΣ: Σταύρος Περαντώνης, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Γεώργιος Παλιούρας, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Αναστασία Κριθαρά, Μεταδιδακτορική Ερευνήτρια, ΕΚΕΦΕ Δημόκριτος ΕΞΕΤΑΣΤΙΚΗ ΕΠΙΤΡΟΠΗ: Σταύρος Περαντώνης, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Γεώργιος Παλιούρας, Διευθυντής Ερευνών, ΕΚΕΦΕ Δημόκριτος Αναστασία Κριθαρά, Μεταδιδακτορική Ερευνήτρια, ΕΚΕΦΕ Δημόκριτος Οκτώβριος 2015

ABSTRACT The protein synthesis for most eukaryotic genes consists of different steps including transcription, post-transcriptional modification and translation. In the post-transcriptional modification step, the pre-mrna is transformed into mrna. One necessary step in the process of obtaining mature mrna is called splicing. The latter involves the removal or "splicing out" of certain sequences referred to as intervening sequences, or introns. The final mrna consists of the remaining sequences, called exons, which are connected to one another through the splicing process. Splice sites mark the boundaries (donor and acceptor) between exons and introns. Splice site recognition refers to the task of identifying these boundaries. In this thesis, an investigation of transfer learning approaches for splice site recognition will take place. We apply transfer learning in order to face the problem of poorly annotated genomes and the lack of labeled data for predicting splice sites. The study involves the sequence analysis of the true splice sites of five different organisms, in order to extract the most representative features, and the development of two transfer learning classification models. SUBJECT AREAS: Computational Biology, Genomics, Machine Learning KEYWORDS: splicing, splice sites, transfer learning, DNA sequence analysis, DNA sequence representation

ΠΕΡΙΛΗΨΗ Η πρωτεϊνική σύνθεση στα περισσότερα γονίδια των ευκαρυωτικών οργανισμών αποτελείται από διάφορα βήματα, συμπεριλαμβανομένης της μεταγραφής, της μεταμεταγραφικής τροποποίησης και της μετάφρασης. Κατά τη διάρκεια του βήματος της μετα-μεταγραφικής τροποποίησης συγκεκριμένα, το pre-mrna μετατρέπεται σε mrna. Ένα απαραίτητο βήμα στη διαδικασία της απόκτησης ώριμου mrna είναι η συναρμογή ή μάτισμα. Το μάτισμα περιλαμβάνει την αφαίρεση συγκεκριμένων υποακολουθιών οι οποίες αναφέρονται ως παρεμβαλλόμενες αλληλουχίες (εσώνια). Το τελικό ώριμο mrna αποτελείται από τις εναπομείνασες υποακολουθίες (εξώνια), οι οποίες συνδέονται μεταξύ τους κατά τη διάρκεια του ματίσματος. Οι θέσεις ματίσματος αποτελούν τα σύνορα μεταξύ των εσωνίων και των εξωνίων. Η αναγνώριση των θέσεων ματίσματος αφορά στην ταυτοποίηση αυτών των συνόρων. Στην παρούσα διπλωματική εργασία, λαμβάνει χώρα μια εξερεύνηση των μεθόδων μεταφοράς μάθησης για το πρόβλημα της αναγνώρισης των θέσεων ματίσματος. Οι μέθοδοι μεταφοράς μάθησης εφαρμόζονται ώστε να αντιμετωπιστεί το πρόβλημα των ανεπαρκώς αποκωδικοποιημένων γονιδιωμάτων και της έλλειψης επισημασμένων δεδομένων για την πρόβλεψη θέσεων ματίσματος. Ολόκληρη η μελέτη περιλαμβάνει την ανάλυση των ακολουθιών πραγματικών θέσεων ματίσματος από πέντε διαφορετικούς οργανισμούς, ώστε να εξαχθούν τα πιο αντιπροσωπευτικά χαρακτηριστικά, και την ανάπτυξη δύο μοντέλων ταξινόμησης μεταφοράς μάθησης. ΘΕΜΑΤΙΚΕΣ ΠΕΡΙΟΧΕΣ: Υπολογιστική Βιολογία, Γενομική, Μηχανική Μάθηση ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: συναρμογή, μάτισμα, θέσεις ματίσματος, μεταφορά μάθησης, ανάλυση ακολουθιών DNA, αναπαράσταση ακολουθιών DNA