ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Σχετικά έγγραφα
Τι είναι ο HPV; Μετάδοση Η μετάδοση του HPV μπορεί να γίνει με τους παρακάτω τρόπους:

Επισκεφτήκαμε το ινστιτούτο νευρολογίας και γενετικής όπου μας μίλησε ο κύριος Βάσος Νεοκλέους και η κ. Αλέξια Φαίδωνος για τη μηχανή Polymerase

Εργαλεία Μοριακής Γενετικής

Συχνότητα Human Papilloma Virus (HPV) στη Κύπρο

Θεωρία - Εφαρμογές ΓΕΝΕΤΙΚΗ ΒΕΛΤΙΩΣΗ ΦΥΤΩΝ - ΜΟΡΙΑΚΟΙ ΔΕΙΚΤΕΣ 1

ΓΕΝΕΤΙΚΗ ΒΕΛΤΙΩΣΗ ΦΥΤΩΝ

Η λοίμωξη από τον ιό HPV

POLYMERASE CHAIN REACTION (PCR) ΑΛΥΣΙΔΩΤΗ ΑΝΤΙΔΡΑΣΗ ΤΗΣ ΠΟΛΥΜΕΡΑΣΗΣ

HPV. Τι είναι τα κονδυλώματα?

ΕΘΝΙΚΟ ΣΧΕΔΙΟ ΔΡΑΣΗΣ ΓΙΑ ΤΟΝ ΚΑΡΚΙΝΟ ΕΘΝΙΚΟ ΠΡΟΓΡΑΜΜΑ ΠΡΟΣΥΜΠΤΩΜΑΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑ ΤΟΝ ΚΑΡΚΙΝΟ ΤΟΥ ΤΡΑΧΗΛΟΥ ΤΗΣ ΜΗΤΡΑΣ

Διαδικασία Εξαγωγής Συγκεντρωτικών Καταστάσεων & Αυτόματης Υποβολής μέσω Internet

Διαδικασία Συγκεντρωτικές Καταστάσεις ΚΕΠΥΟ

Διαχείριση Βάσης Δεδομένων (dbadmin)

Διαγραφή Επιλέγετε Διαγραφή για να διαγράψετε μία ήδη υπάρχουσα διαδικασία εισαγωγής ASCII

ΝΕΕΣ MΟΡΙΑΚΕΣ ΤΕΧΝΙΚΕΣ ΓΙΑ ΤΗΝ ΤΥΠΟΠΟΙΗΣΗ ΤΩΝ ΒΑΚΤΗΡΙΩΝ

ΓΕΝΕΤΙΚΗ ΜΗΧΑΝΙΚΗ. Η τεχνολογία του ανασυνδυασμένου DNA και οι εφαρμογές της...

Αξιολόγηση Προσωπικού

Ενσωμάτωση εικόνας BMP σε σχέδιο

Βιολογία. Θετικής Κατεύθυνσης

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Αναγνώριση Προτύπων Ι

ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΑΕΙ ΓΙΑ ΤΗΝ ΕΠΙΚΑΙΡΟΠΟΙΗΣΗ ΓΝΩΣΕΩΝ ΑΠΟΦΟΙΤΩΝ ΑΕΙ (ΠΕΓΑ)

Άλλο κονδυλώματα κι άλλο HPV;

Οδηγίες Χρήσης Εφαρµογής Καταχώρησης Αποδείξεων µε απλά βήµατα

HPV-Εμβόλιο: Νέα εποχή στην πρόληψη του καρκίνου του τραχήλου

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

Μικροβιολογία Τροφίμων Ι Εργαστήριο

Αριθμητική Ανάλυση & Εφαρμογές

Παράµετροι ιαχείρισης Λογιστικής. Τύποι Λογιστικών Άρθρων. Ηµερολόγια Λογιστικής. Στοιχεία Λογαριασµών Λογιστικού Σχεδίου

Κεφάλαιο 4: Λογισμικό Συστήματος

Ο ρόλος και η σημασία των μοριακών τεχνικών στον έλεγχο των. μικροβιολογικών παραμέτρων σε περιβαλλοντικά δείγματα για την προστασία

Βιολογία Ο.Π. Θετικών Σπουδών Γ' Λυκείου

ΒΙΟΛΟΓΙΑ Ο.Π. ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ. Να σημειώσετε το γράμμα που συμπληρώνει κατάλληλα τη φράση:

Ενδυμασίες. Μετονομάζουμε την νέα ενδυμασία του αντικείμενου μας και έχουμε ολοκληρώσει τη δημιουργία της.

MICROSOFT OFFICE 2003 MICROSOFT WORD 2003

Κεφάλαιο 4: Ανασυνδυασμένο DNA

Ευφυές Σύστημα Ανάλυσης Εικόνων Μικροσκοπίου για την Ανίχνευση Παθολογικών Κυττάρων σε Εικόνες Τεστ ΠΑΠ

ΟΙ ΜΟΡΙΑΚΕΣ ΤΕΧΝΙΚΕΣ ΣΤΟΝ ΕΛΕΓΧΟ ΤΟΥ ΑΙΜΑΤΟΣ. Αλεξόπουλος Κώστας Χημικός M.Sc, PhD

ρ. Μάρκος Ν. ενδρινός Καθηγητής Πληροφορικής ΤΕΙ-Α Microsoft Office Power Point 2003

Διαχείριση Έργων- Στόχων

MEDIWARE L.I.S ΟΔΗΓΙΕΣ ΥΠΟΠΡΟΓΡΑΜΜΑΤΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΕΠΙΣΚΕΨΕΩΝ

Αξιολόγηση Προσωπικού

Εκτύπωση Γενικού Ημερολογίου

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ Dcad 1.0

Οδηγός Εξαγωγής Συγκεντρωτικών Καταστάσεων. ΚΕΠΥΟ και Ηλεκτρονικού Ισοζυγίου. στο InnovEra 3 R2 για τον RTC client

Εξαγωγή Οικονοµικών Αναφορών (Ισολογισµός, Αποτελέσµατα Χρήσης, Λογαριασµοί Γενικής Εκµετάλλευσης) στην Εφαρµογή Ms Excel

ΔΙΑΓΩΝΙΣΜΑ 4o BLOG (2) ΖΗΤΗΜΑ Α ΜΟΝΑΔΕΣ 25

ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΙΑΤΡΙΚΗ

HPV DNA, E6, E7, L1, L2, E2, p16, prb, κυκλίνες, κινάσες, Ki67. Τι από όλα αυτά πρέπει να γνωρίζει ο κλινικός γιατρός; Αλέξανδρος Λαµπρόπουλος

Διαχείριση Έργων- Στόχων

Φυσική Απογραφή & Παραστατικά Αποθήκης

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: PowerPoint Κεφάλαιο 2: Εκκίνηση του PowerPoint... 13

ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΗΡΕΣΙΑ ΑΠΟΚΤΗΣΗΣ ΑΚΑΔΗΜΑΪΚΗΣ ΤΑΥΤΟΤΗΤΑΣ

Ευ ομή. Εγχειρίδιο χρήσης του περιβάλλοντος LT125-dp

Σεξουαλικώς Μεταδιδόμενα Νοσήματα. Εργασία: Γιάννης Π.

ΑΙΜΟΠΑΘΟΛΟΓΟΑΝΑΤΟΜΙΑ

Εφαρμογή Ηλεκτρονικής Υποβολής Δηλώσεων Ε9. Οδηγίες Χρήσης

ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΗΡΕΣΙΑ ΑΠΟΚΤΗΣΗΣ ΑΚΑΔΗΜΑΪΚΗΣ ΤΑΥΤΟΤΗΤΑΣ

Ιοί & HPV. Ευστάθιος Α. Ράλλης. Επικ. Καθηγητής Δερματολογίας - Αφροδισιολογίας

Εκπαιδευτικό Εργαλείο Κανονικοποίησης

Η τεχνική της αλυσιδωτής αντίδρασης πολυμεράσης PCR (POLYMERASE CHAIN REACTION)

Έκδοσης 2005 Π. Κεντερλής

ΚΕΦΑΛΑΙΟ 8 ο...2 I. Εφαρµογές της βιοτεχνολογίας στην ιατρική...2 ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ...7 ΝΑ ΣΥΜΠΛΗΡΩΣΕΤΕ ΤΑ ΚΕΝΑ ΜΕ ΤΗΝ ΚΑΤΑΛΛΗΛΗ ΛΕΞΗ...

Μικροβιολογία Τροφίμων Ι Εργαστήριο

1 η Εργαστηριακή Άσκηση MATLAB Εισαγωγή

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εφαρμογές τεχνολογιών Μοριακής Βιολογίας στην Γενετική

Ο Οδηγός γρήγορης εκκίνησης

Εγχειρίδιο Χρήσης Συστήµατος ιαχείρισης Αιτήσεων Υποψηφίων Συνεργατών ΑΤΕΙ Καλαµάτας

Ο ΗΓΙΕΣ DOCUMENT DESIGNER

PCR Εφαρμογές-2. RACE Site directed mutagenesis

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Εισαγωγή στην Αριθμητική Ανάλυση

1 Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

> μεγαλύτερο <= μικρότερο ή ίσο < μικρότερο == ισότητα >= μεγαλύτερο ή ίσο!= διαφορετικό

Σχεδιασμός εκτυπώσεων ERG

Ο Οδηγός γρήγορης εκκίνησης

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Υπολογισμός Φορολογικής Αναμόρφωσης

FROM TESTOTA.REGISTRY

ΨΗΦΙΑΚΑ ΚΥΚΛΩΜΑΤΑ ΜΙΚΡΟΗΛΕΚΤΡΟΝΙΚΗΣ

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών. Εφαρμογή Εκτύπωσης Ταξιθετικών Ετικετών

Παρακάτω προτείνεται μια αλληλουχία ενεργειών την οποία ο χρήστης πρέπει να ακολουθήσει για να αξιοποιήσει τις δυνατότητες της εφαρμογής.

ΚΕΦΑΛΑΙΟ 4 ο... 2 I. Τεχνολογία του ανασυνδυασµένου DNA... 2

5.1.1 Περιγραφή των συστατικών τμημάτων ενός γραφήματος

5 GTG CAC CTG ACT CCT GAG GAG 3 3 CAC GTG GAC TGA GGA CTC CTC 5

Ο καρκίνος του τραχήλου χης μήτρας είναι ο δεύτερος σε συχνότητα καρκίνος στον γυναικείο πληθυσμό κάτω των 45 ετών.

ΠΛΗΡΟΦΟΡΙΚΗ Ι Εργαστήριο 1 MATLAB ΠΛΗΡΟΦΟΡΙΚΗ Ι ΕΡΓΑΣΤΗΡΙΟ 1. Θέμα εργαστηρίου: Εισαγωγή στο MATLAB και στο Octave

Atlantis - Νέο user interface

Οδηγίες Ηλεκτρονικής Υποβολής Προτάσεων

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Επιµέλεια Θοδωρής Πιερράτος

Καταχώρηση Αποδείξεων

Σύγχρονες μεθοδολογίες μοριακής βιολογίας και γενετικής στη γυναικολογία

Σύμβαση 457 ΟΠΣ Πολιτικής Προστασίας. Εγχειρίδιο Χρήσης Εφαρμογής Γεωγραφικής Απεικόνισης (Version: 1.0)

Περιεχόμενα ΓΕΩΠΥΛΗ ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΚΕΝΤΡΙΚΟ SITE

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ & ΥΠΟΛΟΓΙΣΤ ΩΝ ΕΦΑΡΜΟΓΗ ΤΥΠΟΠΟΙΗΣΗΣ ΤΟΥ ΙΟΥ HPV ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ της Ευαγγελίας Μίγγα Επιβλέπων: Αναστάσιος Ντελόπουλος, Επίκουρος Καθηγητής Θεσσαλονίκη, Ιούνιος 2009

Περιεχόµενα Περίληψη 4 1 Εισαγωγή 6 2 Βιολογικό υπόβαθρο 8 2.1 HPV (Human Papillomavirus)......................... 8 2.2 Μέθοδος ταυτοποίησης του ιού και των τύπων του.............. 9 2.3 Προβλήµατα στην εφαρµογή των PCR και RFLP για την τυποποίηση του ιού HPV....................................... 12 3 Σκοπός της εργασίας 15 3.1 Περιγραφή του προβλήµατος.......................... 15 3.2 Αντιµετώπιση.................................. 16 4 Περιγραφή της εφαρµογής 17 4.1 Γενικά...................................... 17 4.2 ηµιουργία νέου project............................ 18 4.3 Εύρεση διαδροµών στην γέλη αγαρόζης................... 19 4.4 Επιλογή επιθυµητών διαδροµών........................ 20 4.5 Επεξεργασία προτύπου (ladder) και δηµιουργία κλίµακας.......... 21 4.6 Επεξεργασία διαδροµών και εµφάνιση αποτελεσµάτων............ 23 5 Περιγραφή ϐασικών αλγορίθµων 25 5.1 Αλγόριθµος εύρεσης των διαδροµών της γέλης αγαρόζης........... 25 5.2 Αλγόριθµος εύρεσης των Ϲωνών (bands) του προτύπου............ 26 5.3 Αλγόριθµος δηµιουργίας κλίµακας...................... 27 5.4 Αλγόριθµος τυποποίησης του ιού....................... 28 1

6 Εργαλεία 30 6.1 Εργαλεία και ϐιβλιοθήκες που χρησιµοποιήθηκαν.............. 30 7 ΠΑΡΑΤΗΡΗΣΕΙΣ 32 7.1 Συµπεράσµατα................................. 32 7.2 Προοπτικές και επεκτάσεις........................... 35 2

Πρόλογος Η παρούσα διπλωµατική εργασία αφορά τη δηµιουργία µιας εφαρµογής για την ανίχνευση και τυποποίηση του ιού HPV σε δείγµατα ασθενών. Η διπλωµατική εργασία διεκπεραιώθηκε στον τοµέα Ηλεκτρονικής και Υπολογιστών του Τµήµατος (ΤΗΜΜΥ), υπό την επίβλεψη του Επίκουρου Καθηγητή Αναστάσιου Ντελόπουλου. Θα ήθελα να εκφράσω τις ευχαριστίες µου στον επιβλέποντα καθηγητή µου κ. Ντελόπουλο, για την καθοδήγησή του και την εµπιστοσύνη που µου έδειξε αναθέτοντας µου την παρούσα εργασία. Ευχαριστώ επίσης τον υποψήφιο διδάκτορα κ.χρήστο Μαραµή, για τη συνεχή καθοδήγησή του, την υποµονετική επίβλεψη και στήριξη καθόλη τη διάρκεια της εργασίας. Επίσης, ευχαριστώ τον κ.μαραµή για τους αλγόριθµους σε MATLAB που δηµιούργησε και µου παρέδωσε, οι οποίοι χρησιµοποιήθηκαν για την εύρεση των διαδροµών στη γέλη αγαρόζης, για την εύρεση των Ϲωνών στο πρότυπο της γέλης καθώς και για την εύρεση των παραµέτρων κίνησης. 3

Περίληψη Η παρούσα εργασία είναι µία εφαρµογή που δηµιουργήθηκε για την τυποποίηση του ιού HPV. Χρησιµοποιεί εικόνες γέλης αγαρόζης, µετά από ηλεκτροφόρηση των δειγµάτων ασθενών, στα οποία ενισχύθηκε τµήµα DNA του ιού µε την τεχνική PCR (Polymerase Chain Reaction) και ακολούθησε ανάλυση µε τη µέθοδο RFLP (Restriction Fragment Length Polymorphism), χρησιµοποιώντας το ένζυµο περιορισµού HpyCH4V. Το πρόγραµµα επεξεργάζεται την εικόνα γέλης που δέχεται ως είσοδο και µετά από επεξεργασία εµφανίζει τους τύπους του ιού που εντοπίζει σε κάθε δείγµα της εικόνας. Ο χρήστης της εφαρµογής ορίζει κάποιες παραµέτρους απαραίτητες για την επεξεργασία του προγράµµατος και επιλέγει κάποιες άλλες, ενώ ταυτόχρονα παρακολουθεί τη διαδικασία της επεξεργασίας αυτής και έχει τη δυνατότητα να παρέµβει σε διάφορα στάδια αν το επιθυµεί και να κάνει τις απαραίτητες διορθώσεις. 4

Abstract The current project is an application which has been created for the typing of virus HPV. It takes as an input images of agarose gels after electrophoresis of DNA samples, amplified with PCR (Polymerase Chain Reaction) method and analyzed with RFLP (Restriction Fragment Length Polymorphism) method for the typing of virus, using the restriction enzyme HpyCH4V. The application processes the input image of the agarose gel electrophoresis and after the end of process it displays the types of virus that have been detected in each lane of the gel. The user of the application defines some necessary parameters and chooses some others as well, while at the same time he monitors the process and he has the ability to interfere into several steps of the process if he wishes to, in order to make necessary corrections, if any. 5

Κεφάλαιο 1 Εισαγωγή Η πληροφορική και, ευρύτερα, η επιστήµη των υπολογιστών εξελίσσονται ϱαγδαία τα τελευταία χρόνια. Παράλληλα αυξάνονται συνεχώς οι απαιτήσεις για ϐελτίωση εφαρµογών και παροχή διευκολύνσεων από άλλους τοµείς επιστηµών, µεταξύ αυτών ο χώρος της Μοριακής Βιολογίας και Βιοτεχνολογίας σε συνδυασµό µε τις ιατρικές επιστήµες, γεγονός που έδωσε τεράστια ώθηση στην ανάπτυξη του κλάδου της Βιοπληροφορικής επιστήµης. Ως προς τις ιατρικές επιστήµες, ολοένα και περισσότερες εφαρµογές απαιτούν τη ϐοήθεια της επιστήµης της πληροφορικής για την τελειοποίησή τους. Ο ιός HPV είναι ένας σεξουαλικά µεταδιδόµενος ιός που εµφανίζει πολύ µεγάλα ποσοστά επιµόλυνσης του παγκόσµιου πληθυσµού, και ϑεωρείται η κύρια αιτία ανάπτυξης του καρκίνου του τραχήλου στις γυναίκες. Υπάρχουν πολλοί τύποι του ιού, κάποιοι από αυτούς προκαλούν τα κονδυλώµατα, ενώ κάποιοι άλλοι ϑεωρούνται πολύ επιβλαβείς για την υγεία, καθώς προκαλούν προ-καρκινικές δυσπλασίες. Επειδή λοιπόν δεν έχουν όλοι οι τύποι του ιού τις ίδιες επιπτώσεις στην υγεία του ανθρώπου, η τυποποίηση του ιού στα δείγµατα των ασθενών έχει στόχο την πρόληψη, την αποτροπή της µετάδοσης αλλά και την καλύτερη ϑεραπευτική προσέγγιση των αντίστοιχων ασθενών. Για τη διάγνωση και την τυποποίησηση του ιού, χρησιµοποιείται αρχικά η τεχνική PCR (αλυσιδωτή αντίδραση πολυµεράσης), η οποία ενισχύει πολλαπλασιάζει τα τµήµατα αλληλουχίας DNA των δειγµάτων των ασθενών µε τη ϐοήθεια του ενζύµου DNA πολυµεράσης (Κεφάλαιο 2.2). Στη συνέχεια, στα ενισχυµένα δείγµατα εφαρµόζεται η µέθοδος RFLP (Restriction fragment length polymorphism), η οποία µε τη ϐοήθεια περιοριστικών ενζύµων αποκόπτει τµήµατα της αλληλουχίας DNA των δειγµάτων, τα οποία στη συνέχεια ηλεκτροφορούνται σε µία γέλη αγαρόζης µε σκοπό να διαχωριστούν ανάλογα 6

µε το µήκος τους σε Ϲεύγη ϐάσεων (bp,base pairs). Με αυτόν τον τρόπο, µε ανάγνωση της γέλης αγαρόζης όπου αναλύονται τα δείγµατα, µπορούν να ταυτοποιηθούν οι αλληλουχίες DNA κάθε δείγµατος. Επειδή µέχρι στιγµής η ανάγνωση της γέλης γίνεται από τον επιστήµονα µε το µάτι, ϑεωρήθηκε ότι µε την αυτοµατοποίηση της ανάγνωσης αυτής, κερδίζεται πολύτιµος χρόνος και αποφεύγονται λάθη, καθοριστικής σηµασίας, που µπορεί να οφείλονται στον ανθρώπινο παράγοντα. Η αυτόµατη τυποποίηση του ιού στα δείγµατα των ασθενών έχει στόχο την έγκυρη και ακριβή διάγνωσή του. Σκοπός της παρούσης εργασίας είναι η δηµιουργία µιας εφαρµογής στον Τοµέα της Βιοπληροφορικής, καθώς αυτοµατοποιεί την ανίχνευση και τυποποίηση του ιού HPV. Η εργασία αυτή επεξεργάζεται την επιλεγµένη εικόνα γέλης αγαρόζης (Κεφάλαιο 4) και τυποποιεί τον ιό HPV, ενώ κατά τη διάρκεια της επεξεργασίας, ο χρήστης δίνει διάφορες παραµέτρους και έχει τη δυνατότητα να παρέµβει σε κάθε στάδιο και να κάνει διορθώσεις. Στο 2ο Κεφάλαιο περιγράφεται αναλυτικά ο ιός, καθώς και οι µέθοδοι που αναφέρθηκαν παραπάνω, ο τρόπος που χρησιµοποιούνται για την τυποποίηση του ιού και ο λόγος που επιλέγονται. Στη συνέχεια, στο 3ο Κεφάλαιο, περιγράφεται το πρόβληµα που προκύπτει από το γεγονός ότι η ανάγνωση της γέλης αγαρόζης γίνεται µε το µάτι και οι λόγοι που δηµιουργήθηκε η εφαρµογή. Στο 4ο Κεφάλαιο, περιγράφεται αναλυτικά η λειτουργία της εφαρµογής, στάδιο προς στάδιο. Στο 5ο Κεφάλαιο, γίνεται ανάλυση των αλγορίθµων που χρησιµοποιήθηκαν για την επεξεργασία της γέλης, την εύρεση των δειγµάτων πάνω στη γέλη, την εξίσωση κίνησης των τµηµάτων DNA και την εξαγωγή των αποτελεσµάτων. Στο 6ο Κεφάλαιο αναφέρονται τα εργαλεία που χρησιµοποιήθηκαν για τη διεκπε- ϱαίωση της εργασίας και οι λόγοι που ϑεωρήθηκαν τα καταλληλότερα για την παρούσα εφαρµογή. Τέλος στο 7ο Κεφάλαιο συνοψίζονται τα συµπεράσµατα και οι παρατηρήσεις που έγιναν καθόλη τη διάρκεια της εργασίας και αφορούν τις εικόνες γέλης αγαρόζης που υπήρχαν για επεξεργασία και τον τρόπο που διεκπεραιώθηκε η εφαρµογή. Επίσης αναφέρονται τα περιθώρια ϐελτίωσης της εφαρµογής και οι τρόποι επέκτασής της για ευρύτερη χρήση της (Κεφάλαιο 7.2). 7

Κεφάλαιο 2 Βιολογικό υπόβαθρο 2.1 HPV (Human Papillomavirus) Ο ιός των ανθρωπίνων ϑηλωµάτων ( HPV ), είναι ένας διπλής έλικας DNA ιός, µεγέθους περίπου 8 kb ( 8000 bp (base pairs, Ϲεύγη ϐάσεων )[1]. Ο HPV µεταδίδεται µε απλή δερµατική επαφή, µε σεξουαλική επαφή αλλά και πιθανόν κατά τη διάρκεια του τοκετού από τη µητέρα στο παιδί. Ο ιός µολύνει τα κύτταρα του δέρµατος και των ϐλεννογόνων. Τα ποσοστά µόλυνσης από τον ιό είναι πολύ µεγάλα. Από έρευνες που έχουν γίνει, ϑεωρείται ότι το 25% των γυναικών ηλικίας από 14 έως 59 έχουν µολυνθεί από τουλάχιστον µία µορφή HPV. Ωστόσο τα µεγαλύτερα ποσοστά αφορούν τον HPV των γεννητικών οργάνων, όπου τα ποσοστά µόλυνσης από κάποιο τύπο του ιού που είναι σεξουαλικά µεταδιδόµενος αυξάνονται δραµατικά [2]. Υπάρχουν πάνω από 100 τύποι αυτού του ιού, ωστόσο χωρίζονται σε κατηγορίες καθώς δεν προκαλούν όλοι ϐλάβες της ίδιας ϐαρύτητας. Υπάρχει η οµάδα χαµηλού κινδύνου, η οποία περιλαµβάνει τύπους που προκαλούν τα κονδυλώµατα, τα οποία είναι επάρµατα του δέρµατος ή του επιθηλίου και είναι καλοήθη. Οι τύποι 6 και 11 ϑεωρούνται χαµηλού κινδύνου. Υπάρχει όµως και η οµάδα υψηλού κινδύνου, η οποία περιλαµβάνει περίπου 15 τύπους (όπως οι 16, 18, 31, 45, 33, 35, 39, 51, 52, 56, 58, 59, και 68), οι οποίοι ϑεωρούνται καρκινογόνοι, καθώς προκαλούν κυτταρικές αλλοιώσεις οι οποίες µπορεί να οδηγήσουν σε προ-καρκινικές δυσπλασίες που µπορεί να εξελιχθούν σε καρκίνο, κυρίως του τραχήλου της µήτρας [3]. Καθίσταται λοιπόν αναγκαίο να γίνεται έγκαιρα η διάγνωση του ιού αλλά και των τύπων του, ώστε να γίνεται η αφαίρεση των κονδυλωµάτων και των κυτταρικών δυσπλασιών προτού µετεξελιχθούν σε καρκίνο. 8

Αξίζει να σηµειωθεί, πως ενώ τα κονδυλώµατα δεν προκαλούν κάποιας µορφής καρκίνο, ωστόσο η εµφανισή τους δεν αποκλείει το γεγονός (αντιθέτως το ενισχύει) ασθενής που έχει εµφανίσει µια τέτοιου είδους µόλυνση, να έχει µολυνθεί και µε κάποιον από τους τύπους του ιού που ανήκουν στην οµάδα υψηλού κινδύνου. Τέλος, µεγίστης σηµασίας είναι το γεγονός ότι για να αναπτυχθεί σε µία γυναίκα ο καρκίνος του τραχήλου της µήτρας, αναγκαία συνθήκη είναι να προϋπάρχει µόλυνση από τον ιό HPV. Το Τεστ Παπανικολάου (Pap Test) µπορεί να εντοπίσει κυτταρικές δυσπλασίες στον τράχηλο, πριν την εξέλιξη τους σε καρκίνο του τράχηλου της µήτρας, και να γίνει χειρουργικός καθαρισµός αυτών αν απαιτείται. Για αυτό το λόγο η εφαρµογή του Pap Test έχει µειώσει το ποσοστό ϑνησιµότητας από αυτό το είδος καρκίνου. 2.2 Μέθοδος ταυτοποίησης του ιού και των τύπων του Η τεχνική PCR (Polymerase Chain Reaction, Αλυσιδωτή αντίδραση πολυµεράσης) χρησιµοποιείται στη Μοριακή Βιολογία και είναι µία τεχνική αποµόνωσης και πολλαπλασιασµού (ενίσχυσης) τµηµάτων αλληλουχίας DNA µε τη ϐοήθεια του ενζύµου DNA πολυµεράσης (ϑερµοάντοχης). Η τεχνική αυτή πραγµατοποιείται µέσα σε δοκιµαστικό σωλήνα (in vitro) και µπορεί να πολλαπλασιάσει εκατοµµύρια ϕορές µία συγκεκριµένη αλληλουχία DNA αρκεί αυτή να είναι γνωστή, καθώς τα συνθετικά DNA ολιγονουκλεοτίδια που χρησιµοποιούνται ως εκκινητές (20-25 bp(base pairs)) είναι συµπληρωµατικά της περιοχής έναρξης και λήξης της προς ενίσχυση αλληλουχίας και καθορίζουν έτσι ποιο τµήµα της αλληλουχίας του DNA ϑα ενισχυθεί. Η PCR χρησιµοποιείται για την ταυτοποίηση παθογόνων παραγόντων και γενετικών ανωµαλιών που χαρακτηρίζουν λοιµώδεις νόσους και γενετικές ασθένειες, αντίστοιχα, και επίσης µπορεί να διαφοροποιηθεί για να χρησιµοποιηθεί σε µεθόδους γενετικών επεµβάσεων. Μία σηµαντική εφαρµογή της PCR είναι η διάγνωση µεταδοτικών ασθενειών που οφείλονται σε ιούς, όπως ο HPV. Ο HPV διαχωρίζεται σε πάνω από 100 τύπους, κάποιους που ϑεωρούνται ακίνδυνοι για την υγεία του ανθρώπου, άλλους που προκαλούν κονδυλώµατα, αλλά και κάποιους που ϑεωρούνται πολύ υψηλού κινδύνου για καρκινογένεση. 9

http://users.ugent.be/ avierstr/principles/pcr.html Σχήµα 2.1: Στάδια της PCR. Σχήµα 2.2: Λειτουργία της PCR. Για τη διάγνωση και την κατηγοριοποίηση των τύπων του ιού, µία από τις διάφορες µεθόδους που υπάρχουν, είναι η RFLP (Restriction Fragment Length Polymorphism analysis) που χρησιµοποιείται σε συνδυασµό µε την PCR και εφαρµόζεται στα τµήµατα DNA που έχουν ενισχυθεί µε την τεχνολογία της PCR. Στην τεχνική αυτή χρησιµοποιούνται ένζυµα περιορισµού (restriction enzymes), τα οποία αναγνωρίζουν συγκεκριµένες αλληλουχίες πάνω σε δίκλωνα µόρια DNA και οδηγούν στη διάσπαση του αντίστοιχου τµήµατος DNA. Τα τµήµατα DNA που προκύπτουν αναλύονται διαχωρίζονται µε ϐάση το µέγεθός τους σε Ϲεύγη ϐάσεων (bp) µε τη µέθοδο της ηλεκτροφόρησης σε γέλη (gel) αγαρόζης, µε τη ϐοήθεια ηλεκτρικού ϱεύµατος για τη µετακίνηση των αρνητικά ϕορτισµένων µορίων DNA προς την άνοδο. Το µέγεθος 10

των παραπάνω τµηµάτων εξαρτάται από το ένζυµο που χρησιµοποιήθηκε. Τα ένζυµα επιλέγονται έτσι ώστε να συµβάλλουν στον καλύτερο διαχωρισµό των τύπων του ιού. Με τη ϐοήθεια της ηλεκτροφόρησης, τα διάφορα τµήµατα DNA µετακινούνται µέσα στην γέλη αντιστρόφως ανάλογα του αριθµού των Ϲευγών ϐάσεων (bp) τους. Με αυτόν τον τρόπο η µέθοδος αυτή µπορεί να ταυτοποιήσει διαφοροποιήσεις στην αλληλουχία του DNA ([4],[5]). Σχήµα 2.3: Λειτουργία ενζύµων περιορισµού. Σχήµα 2.4: RFLP ανάλυση. Σχήµα 2.5: Εικόνα γέλης αγαρόζης. 11

2.3 Προβλήµατα στην εφαρµογή των PCR και RFLP για την τυποποίηση του ιού HPV Η χρήση των µεθόδων PCR και RFLP ϑεωρείται η πιο αποτελεσµατική για την τυποποίηση του ιού HPV. Υπάρχουν όµως κάποια προβλήµατα. Βασικό πρόβληµα είναι ότι στην µέθοδο PCR οι εκκινητές (primers) που χρησιµοποιούνται για την ενίσχυση κάποιας αλληλουχίας των DNA δειγµάτων, εµφανίζουν διαφορετική αποτελεσµατικότητα στους διαφορετικούς τύπους του ιού. Αυτό το γεγονός, σε συνδυασµό µε το οτι η γονιδιακή ενίσχυση µε PCR ενός συγκεκριµένου γενοτύπου επηρεάζεται από την πιθανή παρουσία στο αρχικό δείγµα ενός συνδυασµού γενοτύπων, καθιστά δύσκολη την επιλογή του κατάλληλου ενζύµου περιορισµού. υσκολίες στη διάκριση µεταξύ των γενοτύπων υπάρχουν ακόµη και στη µέθοδο RFLP που αφορούν και την περιοχή που ενισχύεται µε την PCR, γεγονός που επιδεινώνεται στην περίπτωση συνδυασµού διαφορετικών τύπων του ιού. Ακόµη, σηµαντικό ϱόλο στη δυνατότητα διαχωρισµού των διαφορετικών γενοτύπων παίζουν και τα ένζυµα περιορισµού που χρησιµοποιούνται σε αυτή τη µέθοδο για την τµηµατοποίηση του DNA των δειγµάτων. Το Ϲεύγος εκκινητών MY09/11 που χρησιµοποιείται για την ενίσχυση της περιοχής του ιικού DNA, (Enrique Santiago et al, 2006 [6]), επιτρέπει αξιόπιστη ταυτοποίηση των διαφορετικών υποτύπων του ιού. Στη ϐάση δεδοµένων GenBank (http://www.ncbi. nlm.nih.gov/genbank/) έχουν καταχωρηθεί οι αλληλουχίες για 41 τύπους του ιού HPV, οι οποίοι µεταδίδονται µέσω σεξουαλικής επαφής και προσβάλλουν τα γεννητικά όργανα. Οι τύποι αυτοί ταξινοµούνται σε υψηλού, χαµηλού και απροσδιόριστου ϱίσκου. Οι 41 παραπάνω τύποι αντιστοιχούν σε πρότυπα τµηµάτων DNA, τα οποία προκύπτουν µετά από ενίσχυση µε τους PCR εκκινητές MY09/11 και πέψη (digestion) µε το κατάλληλο ένζυµο περιορισµού. Τα πρότυπα αυτά επιδιώκεται να είναι µοναδικά στο σύνολο των τύπων του ιού, αλλά µπορεί και να συµπίπτουν µε το πρότυπο ενός άλλου τύπου του ιού. Η αναλυτική ικανότητα του συστήµατος ηλεκτροφόρησης αναφέρεται στη µικρότερη διαφορά στο µήκος (µέγεθος σε bp ) µεταξύ δύο DNA τµηµάτων, τα οποία µπορεί να διαχωριστούν ως δύο διαφορετικές Ϲώνες (bands). Από αυτή την ικανότητα λοιπόν εξαρτάται και ο ϐαθµός διαχωρισµού των τύπων του ιού HPV. Ο Santiago και οι συνεργάτες του, µετά από πολλά πειράµατα και δοκιµές, δηµιούργησαν ένα πρόγραµµα µε σκοπό τη 12

ϐέλτιστη χρήση των µεθόδων PCR και RFLP στην τυποποίηση του HPV. Το πρόγραµµα του E.Santiago ϑέτει ένα όριο για την ανίχνευση των τµηµάτων DNA µετά από την πέψη µε τα ένζυµα περιορισµού, το οποίο όριο είναι το µικρότερο τµήµα DNA που µπορεί να ταυτοποιηθεί ως τέτοιο και να διακριθεί από την παρουσία πιθανών διµερών (40 50 bp) που µπορεί να προκύψουν από τους εκκινητές. Μετά από πολλές δοκιµές και συγκρίσεις ανάµεσα σε 140 ένζυµα περιορισµού (restriction enzymes) και παρατηρώντας κάθε ϕορά α) την αποτελεσµατικότητά τους ως προς τον διαχωρισµό τύπων που ανήκουν στις οµάδες χαµηλού κινδύνου και υψηλού κινδύνου, προσθέτοντας αρχικά τους τύπους που έχουν ϑεωρηθεί απροσδιόριστου κινδύνου (undetermined, τύποι 23, 53 και 66 ) στην οµάδα υψηλού κινδύνου και ϐ) δοκιµάζοντας ακόµη και συνδυασµούς ενζύµων µε σκοπό τον έλεγχο της πιθανόν καλύτερης αποτελεσµατικότητάς τους σε σύγκριση µε τη δράση του καθενός ενζύµου ξεχωριστά, τα αποτελέσµατα των ερευνών που διεξάχθηκαν από την οµάδα του E.Santiago σε συστήµατα ηλεκτροφόρησης (µε αναλύσεις από 0% έως 5%, όπου 0% σηµαίνει ότι κάθε τµήµα µε διαφορετικό µήκος διαχωρίζεται από οποιοδήποτε άλλο και 5% σηµαίνει ότι δύο τµήµατα που διαφέρουν λιγότερο από αυτό το ποσοστό ϑεωρούνται ως ένα τµήµα) έδειξαν : - Τµήµατα (fragments) του DNA µε µήκη κάτω από 80 bp, δεν ϑεωρείται οτι µπορούν να συνεισφέρουν στο διαχωρισµό των διαφορετικών τύπων του ιού HPV. - Με ϐάση τις παραπάνω επισηµάνσεις, από τα 5 ένζυµα (HpyCH4V, CviJI, T sp509i, MseI kai ApoI) που σύµφωνα µε τα αποτελέσµατα του E.Santiago εµφανίζουν µεγάλη ικανότητα διάκρισης των υψηλού κινδύνου από τους αντίστοιχους χαµηλού κινδύνου ιούς, το HpyCH4V ϐρέθηκε να δίνει τη µεγαλύτερη απόδοση και να διαχωρίζει τους 41 τύπους ακόµη και σε συστήµατα ηλεκτροφόρησης µε ανάλυση 4%. - Με το συγκεκριµένο ένζυµο, ακόµη και ο διαχωρισµός των απροσδιόριστου κινδύνου τύπων του ιού (26, 53, 66) είναι εύκολος, αφού έχουν εντελώς ξεχωριστά πρότυπα. - Χρησιµοποιώντας το ένζυµο αυτό, υπάρχουν µόνο δύο Ϲευγάρια τύπων (11 και 30, 44 και 55) που µοιράζονται τα ίδια πρότυπα ακριβώς, και οι τύποι αυτοί, ανήκουν όλοι στην οµάδα χαµηλού κινδύνου, οπότε αυτό δεν αποτελεί πρόβληµα. 13

- Τέλος το ένζυµο HpyCH4V, για τους 41 γενότυπους, δίνει ένα αρκετά απλό πρότυπο από 2 ή 3 τµήµατα DNA άνω των 80bp. Η απλότητα αυτή διευκολύνει ακόµη και την τυποποίηση σε περίπτωση δείγµατος µολυσµένου µε συνδυασµό τύπων του ιού, αν και µπορεί να υπάρξουν προβλήµατα διαχωρισµού αν η λειτουργικότητα του ενζύµου είναι ατελής, κυρίως σε τύπους που χαρακτηρίζονται από ένα µήκος. Από τα παραπάνω γίνεται ϕανερό ότι από τα 5 ένζυµα περιορισµού που προαναφέρ- ϑηκαν, προτιµάται το ένζυµο HpyCH4V µε δεύτερο καλύτερο το CviJI. 14

Κεφάλαιο 3 Σκοπός της εργασίας 3.1 Περιγραφή του προβλήµατος Παρόλες τις έρευνες για την επιλογή των καταλληλότερων µεθόδων για την αποτελεσµατική ανίχνευση του ιού HPV και την αναγνώριση των υποτύπων του, υπάρχουν κάποια προβλήµατα στη χρήση αυτών των µεθόδων, που αφορούν τον ανθρώπινο παράγοντα. Πιο συγκεκριµένα, το πρόβληµα που δηµιουργείται αναφορικά µε τη διάγνωση και ταυτοποίηση των διαφόρων τύπων του ιού είναι η ανάγνωση µε το µάτι των Ϲωνών που διαχωρίζονται στην γέλη (gel) αγαρόζης. Αυτό προκαλεί αναπόφευκτα, εκτός από πρακτικές δυσκολίες, και κάποια ακόµη προβλήµατα που δυσχεραίνουν την ανάγνωση της εικόνας (ϕωτογραφίας) της γέλης που λαµβάνεται, ψηφιακής ή µη. Το πιο σηµαντικό από αυτά είναι ότι η εξαγωγή των συµπερασµάτων από την προσπάθεια ανάγνωσης της γέλης γίνεται κατά προσέγγιση, κάτι που σηµαίνει ότι µπορεί τα αποτελέσµατα να είναι λανθασµένα. Απαιτείται λοιπόν ιδιαίτερη προσοχή, αλλά ακόµη και στην καλύτερη περίπτωση, η ακρίβεια της ανάγνωσης από τον χρήστη µε το µάτι δεν παύει να είναι προσεγγιστική. Ενα ακόµη πρόβληµα, που έρχεται να επιβαρύνει και το προηγούµενο που αναφέρθηκε, είναι ότι η ανάλυση µε τη µέθοδο RFLP µπορεί να µην είναι ικανοποιητικά καλή ώστε να γίνεται εύκολα η αναγνώριση των τύπων του ιού. Ακόµη, στην περίπτωση που σε ένα δείγµα συνυπάρχουν περισσότεροι του ενός τύποι του ιού, ο διαχωρισµός τους γίνεται µε αρκετή δυσκολία, καθώς περιπλέκονται αρκετά οι Ϲώνες που εµφανίζονται στο δείγµα της γέλης. Τέλος, σηµαντικό εµπόδιο στην αναγνώριση του ιού και ταυτοποίηση των τύπων του αποτελεί το γεγονός οτι στο δείγµα είναι πιθανόν να ϐρεθούν νόθες (ψευδείς) Ϲώνες (bands), οι οποίες δεν αντιστοιχούν σε κάποιο τύπο του 15

ιού, παρα µόνο δυσκολεύουν την ορθή ανάγνωση του δείγµατος. 3.2 Αντιµετώπιση Για την αντιµετώπιση των προβληµάτων που δηµιουργούνται από την προσεγγιστική εξαγωγή συµπερασµάτων όπως προαναφέρθηκε, στην παρούσα εργασία δηµιουργήθηκε µια εφαρµογή που επιχειρεί να εξαλείψει όλες τις παραπάνω δυσχέρειες. Η εφαρµογή αυτή δέχεται ως είσοδο µια εικόνα γέλης αγαρόζης. Αρχικά ο χρήστης της εφαρµογής µπορεί να επεξεργαστεί την εικόνα, ώστε να κρατηθεί το χρήσιµο τµήµα της στην κατάλληλη µορφή. Στη συνέχεια ο χρήστης ορίζει κάποιες παραµέτρους, ενώ ταυτόχρονα η εφαρµογή επεξεργάζεται σε διάφορα στάδια την εικόνα της γέλης. Οι παράµετροι που χρειάζεται να δοθούν αφορούν την εικόνα που εισάγεται (αριθµός των λωρίδων στη γέλη, προσδιορισµός του προτύπου στη γέλη (ladder markers), επιλογή των επιθυµητών λωρίδων για επεξεργασία, επιλογή Ϲωνών στην κάθε λωρίδα), αλλά και κάποια χαρακτηριστικά του προτύπου (ladder) που υπάρχουν στη γέλη, που πρέπει να τα καθορίσει ο χρήστης. Μετά την επιλογή των κατάλληλων παραµέτρων και της επεξεργασίας τους, το πρόγραµµα αυτόµατα ερευνά την αναγνώριση του ιού και την ταυτοποίηση των τύπων του και εµφανίζει τα αποτελέσµατα. Σε όλη τη διάρκεια της εφαρµογής, ο χρήστης αν κρίνει ότι τα αποτελέσµατα από κάποιο στάδιο της επεξεργασίας της εικόνας δεν είναι ικανοποιητικά (πιθανόν εξαιτίας της ανάλυσής της), µπορεί να παρέµβει στο πρόγραµµα και να κάνει όποιες αλλαγές στην επεξεργασία πιστεύει ότι χρειάζονται πριν τη µετάβαση στο επόµενο στάδιο της εφαρµογής. Συνεπώς, η εφαρµογή που δηµιουργήθηκε απαλλάσσει το χρήστη από τη διαδικασία της ανάγνωσης της γέλης, ενώ ταυτόχρονα δίνει την ευχέρεια παρακολούθησης της διαδικασίας για την τυποποίηση του ιού και παρέµβασης του χρήστη, αν αυτό είναι επιθυµητό. 16

Κεφάλαιο 4 Περιγραφή της εφαρµογής 4.1 Γενικά Η εφαρµογή που δηµιουργήθηκε προσπαθεί να ανιχνεύσει τον ιό HPV και να αναγνωρίσει τους τύπους που υπάρχουν σε κάθε δείγµα της εικόνας της γέλης (gel), και στηρίζεται στην ταυτοποίηση των τµηµάτων (fragments) DNA που δηµιουργούνται µετά από πέψη, µε το ένζυµο περιορισµού HpyCH4V, του τµήµατος L1 του DNA του ιού, το οποίο ενισχύθηκε µε την τεχνολογία PCR. Η εφαρµογή αποτελείται από το εισαγωγικό πλαίσιο (frame) και άλλα τέσσερα πλαίσια, τα οποία ακολουθούν το ένα το άλλο. Καθένα από αυτά τα frames αντιστοιχεί και σε ένα στάδιο της εφαρµογής. Τα στάδια αυτά είναι : ιαχωρισµός όλων των διαδροµών που αντιστοιχούν σε δείγµατα ασθενών στην γέλη αγαρόζης Επιλογή επιθυµητών διαδροµών και προτύπου (ladder markers: µάρτυρες µοριακού µεγέθους σε bp) Επεξεργασία προτύπου Επεξεργασία διαδροµών Τα frames επιλέχθηκαν να εµφανίζονται σε µορφή καρτελών (tabs), έτσι ώστε να είναι εύκολη η µετάβαση στα προηγούµενα frames κάθε ϕορά, κάτι που είναι χρήσιµο για την παρακολούθηση των παραµέτρων και της επεξεργασίας που έχει γίνει σε προηγούµενα ϐήµατα, αλλά και της αλλαγής κάποιων απο αυτές τις παραµέτρους ή την προσθήκη 17

κάποιων στοιχείων αν χρειαστεί. ηλαδή µε αυτόν τον τρόπο, ο χρήστης εύκολα ϑα µπορεί να µεταβεί σε προηγούµενο ϐήµα και να κάνει διόρθωση σε κάποια από τις παραµέτρους που καθορίζουν την εξέλιξη της επεξεργασίας. Στο τέλος της επεξεργασίας, εµφανίζονται οι τύποι του ιού που ϐρέθηκαν να υπάρχουν στις επιλεγµένες διαδροµές, µαζί µε τις πιθανότητες ύπαρξης του καθενός από αυτούς στο δείγµα του ασθενούς που αντιστοιχεί στην επιλεγµένη διαδροµή. 4.2 ηµιουργία νέου project Κατά την εκκίνηση της εφαρµογής για να γίνει η δηµιουργία ενός νέου project, χρειάζεται ο χρήστης να εισάγει µια εικόνα γέλης, η οποία ϑα αναφέρεται σε δείγµατα DNA µολυσµένα µε τον ιό HPV και στη χρήση του ενζύµου HpyCH4V για την τµηµατοποίηση του αντίστοιχου DNA. Η εικόνα που ϑα εισαχθεί µπορεί να είναι σε ανοιχτόχρωµο ϕόντο και οι Ϲώνες (bands) να διακρίνονται µε µαύρο χρώµα ή το αντίστροφο. Είναι όµως αρκετά σηµαντικό σε κάθε περίπτωση η εικόνα να είναι καλής ποιότητας, ώστε να µη δυσχεραίνεται η επεξεργασία της και συνεπώς η ορθή έκβαση των αποτελεσµάτων. Σχήµα 4.1: ηµιουργία νέου project µε τη ϐοήθεια ενός File Dialog. Η εικόνα που ϑα εισαχθεί µπορεί να είναι αποθηκευµένη σε οποιαδήποτε µορφή (.tif,.jpg,.bmp κ.λ.π.), και να ϐρίσκεται σε οποιαδήποτε ϑέση του υπολογιστή, καθώς ο χρήστης µπορεί να εντοπίσει και να ανοίξει το επιθυµητό αρχείο µε τη ϐοήθεια ενός File Dialog. Μετά την επιλογή της εικόνας που απεικονίζει τη γέλη που ϑα επεξεργαστεί η εφαρµογή, ένα νέο project έχει δηµιουργηθεί. 18

4.3 Εύρεση διαδροµών στην γέλη αγαρόζης Μετά τη δηµιουργία του project, εµφανίζεται ένα frame, το οποίο απεικονίζει την εικόνα που έχει εισαχθεί και έναν αριθµό από controls και buttons, για την εισαγωγή των ϐασικών παραµέτρων και την αρχική επεξεργασία της εικόνας, ώστε να έρθει στην πιο κατάλληλη µορφή για το πρώτο ϐήµα της εφαρµογής που γίνεται σε αυτό το στάδιο, δηλαδή την εύρεση των διαδροµών (lanes) στη γέλη και την επισήµανσή τους πάνω στην εικόνα. Ο χρήστης αρχικά δίνει ένα όνοµα στο project και επεξεργάζεται, αν υπάρχει λόγος, την εικόνα (διατήρηση µόνο του χρήσιµου τµήµατος, περιστροφή, αντιστροφή χρωµάτων). Τις περισσότερες ϕορές είναι απαραίτητη η περιστροφή της εικόνας κατά λίγες µοίρες (1 2 περίπου) αριστερόστροφα ή δεξιόστροφα, ώστε να είναι κάθετα ευθυγραµµισµένες οι διαδροµές και να είναι πιο εύκολος µετέπειτα ο διαχωρισµός τους από την εφαρµογή. Ακόµη, η αποκοπή ενός τµήµατος της συνολικής εικόνας συµβάλλει σε µεγάλο ϐαθµό στη σωστή επεξεργασία της. Στόχος είναι να κρατηθεί µόνο το χρήσιµο απαραίτητο τµήµα της, ώστε να υπάρχει όσο το δυνατόν λιγότερη περιττή πληροφορία, η οποία ϑα εµποδίσει τη σωστή ανάλυση της εικόνας. Στη συνέχεια και αφού δοθεί ο αριθµός όλων των διαδροµών (lanes) που υπάρχουν στη γέλη, συµπεριλαµβανοµένης και της διαδροµής που αντιστοιχεί στο πρότυπο (ladder) (που µπορεί να µην είναι µόνο µία), µετά από εντολή του χρήστη η εφαρµογή εντοπίζει τα άκρα κάθε διαδροµής και τα επισηµαίνει στην εικόνα µε κάθετες κόκκινες διακεκοµµένες γραµµές για την ένδειξη των αριστερών ορίων των διαδροµών και µε µπλέ γραµµές για τα δεξιά όρια. Σε αυτό το σηµείο ο χρήστης κατά ϐούληση µπορεί να επέµβει χρησιµοποιώντας το ποντίκι (mouse) του υπολογιστή και να µετακινήσει κατάλληλα τα άκρα που έχουν διαγραµµιστεί στην εικόνα, αν κρίνει ότι χρειάζονται κάποια διόρθωση τα σηµεία που έχει επιλέξει η εφαρµογή. Πριν την µετάβαση στο επόµενο frame, Ϲητείται να προσδιοριστεί ο αριθµός των διαδροµών, που αντιστοιχούν στα πρότυπα (ladder markers), που µπορεί να είναι 1 ή 2, και να γίνει η επιλογή τους ανάµεσα στο πλήθος των διαδροµών που διαχωρίστηκαν στην εικόνα. Υπάρχει ακόµη η επιλογή clear για τον µηδενισµό όλων των παραµέτρων και της επεξεργασίας που έχει γίνει, την κάθε στιγµή. Στο τέλος, γίνεται επιβεβαίωση όλων των παραπάνω ϐηµάτων από το χρήστη και µετάβαση στο επόµενο ϐήµα. 19

Σχήµα 4.2: Εµφάνιση του 1ου frame της εφαρµογής µετά τον εντοπισµό των διαδροµών στην εικόνα. 4.4 Επιλογή επιθυµητών διαδροµών Η εµφάνιση του 2ου frame απεικονίζει ξανά την εικόνα µετά την αρχική της επεξεργασία και µε ορατά τα σηµεία διαχωρισµού των διαδροµών, που αντιστοιχούν στα δείγµατα ασθενών στη γέλη, και χωρίζεται σε δύο ϐήµατα. Στο πρώτο ϐήµα, που στην περίπτωση του ενός προτύπου δεν έχει κάποια σηµασία, επιλέγεται ποιο πρότυπο ϑα χρησιµοποιηθεί για την µετέπειτα επεξεργασία των δειγµάτων. Στην περίπτωση που υπάρχουν δύο πρότυπα και επιλεχθούν και τα δύο, η εφαρµογή αντιστοιχεί κάθε δείγµα της γέλης στο πιο κοντινό σε αυτό πρότυπο, αλλά υπάρχει και η δυνατότητα ο χρήστης να αλλάξει οποιαδήποτε από τις επιλογές αυτές, αφού πρέπει κάθε διαδροµή να αναφέρεται στο πρότυπο το οποίο είναι το πιο συγγενές ως προς το µέγεθος των Ϲωνών. Στο δεύτερο ϐήµα, γίνεται η επιλογή των διαδροµών τις οποίες επιθυµεί ο χρήστης, και δίνεται στην καθεµία από αυτές ένα όνοµα που ϑα τη χαρακτηρίζει στη συνέχεια. Από αυτές τις διαδροµές ϑα επιλεχθούν σε πρώτη ϕάση αυτές για τις οποίες υπάρχει ενδιαφέρον να εξεταστούν. Εδώ πρέπει να τονιστεί ότι στις ήδη επιλεγµένες για επεξεργασία διαδροµές ϑα µπορούν να προστεθούν αργότερα µόνο διαδροµές που έχουν ήδη ονοµαστεί σε αυτό το στάδιο. Για αυτό το λόγο στα επόµενα ϐήµατα, για εκείνη την περίπτωση που ο χρήστης αποφασίσει εκ των υστέρων οτι χρειάζεται να εξετάσει και κάποιες από τις διαδροµές που δεν έχει ονοµάσει, υπάρχει η δυνατότητα να γυρίσει πίσω σε αυτό το frame µε τη ϐοήθεια των καρτελών (tabs), να τις ονοµάσει και να τις επιλέξει. 20

Σχήµα 4.3: Το 2ο frame µετά την επιλογή των διαδροµών. 4.5 Επεξεργασία προτύπου (ladder) και δηµιουργία κλίµακας Το 3ο frame αφορά την επεξεργασία του προτύπου (ή των προτύπων αν είναι δύο) της γέλης, µε σκοπό τη διεξαγωγή των παραµέτρων κίνησης, που ϑα καθορίσουν την κλίµακα µε την οποία ϑα εντοπιστούν τα µεγέθη (σε bp) που αντιστοιχούν στις Ϲώνες που έχουν τρέξει σε κάθε διαδροµή και οι οποίες αντιστοιχούν σε καποιο δείγµα ασθενούς. Ταυτόχρονα µε τη µετάβαση στο frame αυτό, απεικονίζεται το πρότυπο (ladder) µε διαγραµµισµένες πάνω σε αυτό τις 10 τελευταίες Ϲώνες (bands), οι οποίες ϑεωρούνται οι πιο αντιπροσωπευτικές και αρκούν για τη εύρεση των παραµέτρων κίνησης. Οι Ϲώνες που ϐρίσκονται στην αρχή του προτύπου και αντιστοιχούν σε πολύ µεγάλα µεγέθη (σε bp), δεν επιλέγονται διότι είναι πολύ πυκνές και η επεξεργασία που γίνεται στην εικόνα δεν καταφέρνει να τις διαχωρίσει. Κάτω από την εικόνα µε το πρότυπο, εµφανίζεται η κυµατοµορφή που προκύπτει από την ανάλυση της ϕωτεινότητας της εικόνας, µε επισήµανση στα σηµεία, που σύµφωνα µε την ανάλυση των ϕωτεινοτήτων που κάνει η εφαρµογή, έχουν ϐρεθεί Ϲώνες στο πρότυπο. Τέλος, κάτω από την κυµατοµορφή εµφανίζεται η κλίµακα που έχει δηµιουργηθεί µε ϐάση τις παραµέτρους κίνησης που έχουν ϐρεθεί. Στην κλίµακα αυτή επισηµαίνονται και οι τιµές σε bp που αντιστοιχούν στις Ϲώνες του προτύπου που χρησιµοποιήθηκαν για τη δηµιουργία της, ώστε να γίνεται αντιληπτή η ακρίβεια εντοπισµού του µεγέθους (σε bp) των Ϲωνών. Ενα πρότυπο (ladder) αναφέρεται σε ένα βήµα (step) σε bp που διαχωρίζει τις Ϲώνες του προτύπου και το οποίο, για τον συγκεκριµένο ιό (HPV), είναι σταθερό και 21

Σχήµα 4.4: Επεξεργασία του προτύπου (ladder) στη γέλη αγαρόζης. συγκεκριµένα παίρνει µία από τις τιµές 20, 50 και 100. Το βήµα αυτό ορίζει τα µεγέθη (σε bp) στα οποία ανήκουν οι Ϲώνες του προτύπου και εποµένως είναι απαραίτητο για την εύρεση των παραµέτρων κίνησης. Ως προεπιλογή υπάρχει το πιο συνηθισµένο βήµα για τον ιό HPV, που είναι το 20. Παρόλα αυτά ο χρήστης µπορεί να επιλέξει το βήµα που ϑα κρίνει ότι αντιστοιχεί στο συγκεκριµένο πρότυπο και κατευθείαν οι παράµετροι και η κλίµακα προσαρµόζονται κατάλληλα. Στο στάδιο αυτό, ο χρήστης µπορεί µέσα από µια λίστα να προσθέσει στις διαδροµές (lanes) που έχει ήδη επιλέξει και κάποια από αυτές που έχει ονοµάσει αλλά δεν είχε επιλέξει προηγουµένως για εξέταση. Επίσης µπορεί κατά ϐούληση να διορθώσει στην εικόνα όποιες από τις διαγραµµισµένες Ϲώνες του προτύπου ϑεωρεί οτι αποκλίνουν από την ακριβή ϑέση τους και να τις µετακινήσει δεξιά ή αριστερά. Ακόµη, µπορεί να προσθέσει κάποιες Ϲώνες σε περίπτωση που η εφαρµογή δεν έχει εντοπίσει κάποιες ενδοιάµεσες Ϲώνες, λόγω της ανάλυσης της εικόνας. Αν όµως το πλήθος των Ϲωνών (µετά την προσθήκη των επιπλέον Ϲωνών) ξεπερνάει τις 10, τότε αυτές µε τα µεγαλύτερα µεγέθη σε bp αφαιρούνται, αφού όπως προαναφέρθηκε για την εύρεση των παραµέτρων χρησιµοποιούνται µόνο οι 10 τελευταίες. Αν υπάρχουν δύο επιλεγµένα πρότυπα για επεξεργασία, εµφανίζονται και τα δύο στο παρών frame, και η µετάβαση στο επόµενο frame που είναι και το τελικό, γίνεται µετά από επιβεβαίωση από τον χρήστη οτι έχει τελειώσει ορθά η επεξεργασία και στα δύο αυτά πρότυπα. 22

Σχήµα 4.5: Επιλογή µίας διαδροµής (lane). 4.6 Επεξεργασία διαδροµών και εµφάνιση αποτελεσµάτων Το 4ο frame είναι και το τελευταίο της εφαρµογής. Αφού ο χρήστης επιλέγει µία-µία τις διαδροµές προς εξέταση µέσα από µια λίστα, αυτή που επιλέγεται κάθε ϕορά εµφανίζεται στην οθόνη, µαζί µε την αντίστοιχη κυµατοµορφή, την κλίµακα που αντιστοιχεί στο πρότυπο (ladder) για αυτή τη συγκεκριµένη διαδροµή, καθώς και το αντίστοιχο πρότυπο. Σε περίπτωση ύπαρξης δύο προτύπων υπάρχει και σε αυτό το ϐήµα η δυνατότητα αλλαγής του επιλεγµένου προτύπου για την εµφανιζόµενη διαδροµή. Σε αυτό το στάδιο ο χρήστης επιλέγει µόνος του τα σηµεία που ϑεωρεί οτι υπάρχουν Ϲώνες στην αντίστοιχη διαδροµή, και στη συνέχεια αφού έχουν επιλεγεί όλες οι επιθυµητές (έντονες) Ϲώνες, δίνει την εντολή για την εξέταση του δείγµατος και την έκβαση του αποτελέσµατος. Για τη ϐοήθεια του χρήστη κατά την επιλογή των Ϲωνών, υπάρχει η δυνατότητα εµφάνισης και απόκρυψης όλων των ϑέσεων πάνω στη διαδροµή, οι οποίες αντιστοιχούν σε κάποιο υπαρκτό µήκος από όλα τα µήκη που υπάρχουν στους τύπους του ιού. Με αυτόν τον τρόπο ο χρήστης µπορεί να διακρίνει, αν υπάρχει, κάποια Ϲώνη στη διαδροµή που µπορεί να είναι ψευδής. Τα αποτελέσµατα εµφανίζονται ένα-ένα στην οθόνη, καθώς ο χρήστης επιλέγει και επεξεργάζεται τη µία διαδροµή µετά την άλλη. Άν ο ιός ανιχνευτεί σε κάποιο δείγµα, τότε εµφανίζονται οι τύποι του ιού που εντοπίστηκαν, που µπορεί να είναι µέχρι και πέντε, µαζί µε τη πιθανότητα (ποσοστό) ύπαρξής τους. Γίνεται ακόµη επισήµανση µε κόκκινο χρωµα αν ανήκουν στους τύπους που έχουν προσδιορισθεί ως οµάδα υψηλού κινδύνου, 23

Σχήµα 4.6: Επιλογή Ϲωνών µε τη ϐοήθεια της ένδειξης των Ϲωνών που υπάρχουν στους τύπους του ιού. και µε µπλε χρώµα αν ανήκουν στην οµάδα χαµηλού κινδύνου. Υπάρχει επίσης η δυνατότητα εµφάνισης στην οθόνη, πάνω στην απεικονιζόµενη διαδροµή, των Ϲωνών που αντιστοιχούν στα µεγέθη (σε bp) που υπάρχουν σε καθέναν από τους τύπους του ιού που ϐρέθηκαν να υπάρχουν στο δείγµα, καθώς και το σύνολο αυτών των Ϲωνών. Στο τέλος ο χρήστης µπορεί να επιλέξει την επιλογή report για την εκτύπωση των αποτελεσµάτων. Η εφαρµογή τερµατίζεται αφού ο χρήστης αποφασίσει αν επιθυµεί να αποθηκεύσει το project ή όχι. Σχήµα 4.7: Εµφάνιση αποτελεσµάτων. 24

Κεφάλαιο 5 Περιγραφή ϐασικών αλγορίθµων 5.1 Αλγόριθµος εύρεσης των διαδροµών της γέλης αγαρόζης Ο πρώτος σηµαντικός αλγόριθµος που χρησιµοποιήθηκε έχει ως σκοπό τον εντοπισµό των διαδροµών στην εικόνα της γέλης αγαρόζης που έχει εισαχθεί στην εφαρµογή µετά την όποια επεξεργασία της από το χρήστη ώστε να είναι στην πιο κατάλληλη µορφή. Η εικόνα µετατρέπεται σε ασπρόµαυρη σε περίπτωση που δεν είναι, γιατί η επεξεργασία ϐασίζεται στη ϕωτεινότητα του κάθε pixel της εικόνας. Αρχικά δηµιουργείται ένα αντίγραφο της εικόνας σε ανεστραµµένη µορφή (ανάστροφες ϕωτεινότητες). Στη συνέχεια υπολογίζονται τα αθροίσµατα των διαφορών (όταν είναι µεγαλύτερες του µηδενός) των ϕωτεινοτήτων των pixels κάθε στήλης της εικόνας µε της διπλανή της, καθώς και η µέση τιµή αυτών και για τις δύο εικόνες, δηλαδή την αρχική και την ανεστραµµένη. Χρησιµοποιώντας τα αθροίσµατα που υπολογίστηκαν, εντοπίζονται τα σηµεία (στήλες) όπου υπάρχει µετάβαση στις τιµές των αθροισµάτων αυτών από τιµή χαµηλότερη της µέσης τιµής που υπολογίστηκε σε τιµή υψηλότερη της µέσης τιµής αυτής και αντίστροφα. Στη συνέχεια, ϐρίσκοντας τις Ν µεγαλύτερες τιµές των αθροισµάτων, όπου Ν ο αριθµός των διαδροµών ο οποίος έχει δοθεί από το χρήστη, και ταυτόχρονα ϐρίσκοντας και τις Ν µεγαλύτερες τιµές για την ανεστραµµένη εικόνα, δηµιουργούνται σε πρώτη ϕάση δύο πίνακες, ένας για κάθε εικόνα, των οποίων οι τιµές αντιστοιχούν στις ϑέσεις στήλες που ϐρέθηκαν οι Ν µέγιστες τιµές για καθεµία από τις δύο εικόνες. Ταυτόχρονα τα σηµεία µετάβασης που υπολογίστηκαν ανάµεσα στις ϑέσεις αυτές εξισώνονται µε τη µέση τιµή 25

που υπολογίστηκε σε κάθε περίπτωση. Συγκρίνοντας τους δύο πίνακες, αυτός ο πίνακας µε τις τιµές που είναι πιο ισαπέχουσες ϑεωρείται ως βάση και ο άλλος πίνακας ϑεωρείται ως προς έλεγχο. Αποφασίζεται επίσης ποιανού από τους δύο πίνακες οι τιµές αντιστοιχούν στα δεξιά άκρα και ποιανού στα αριστερά άκρα των διαδροµών, συγκρίνοντας την απόσταση των αρχικών τιµών των πινάκων από την αρχή της εικόνας. Πριν ϑεωρηθούν σωστές οι ϑέσεις που έχουν ϐρεθεί, ο αλγόριθµος ελέγχει αν οι ϑέσεις των δύο πινάκων διαδέχονται εναλλάξ η µία την άλλη. Αν όχι, τότε επιλέγεται να µετατραπούν οι ϑέσεις του πίνακα που ϑεωρήθηκε προς έλεγχο και αυτό γίνεται µε τη δηµιουργία ενός καινούργιου πίνακα. Υπάρχουν τρεις περιπτώσεις. Η πρώτη είναι ανάµεσα σε δύο διαδοχικές τιµές του πίνακα που ϑεωρείται ως βάση να µην υπάρχει καµία τιµή του πίνακα προς έλεγχο. Τότε υπολογίζεται η µέγιστη τιµή των αθροισµάτων των διαφορών που υπάρχουν ανάµεσα στις δύο τιµές και τοποθετείται στην αντίστοιχη ϑέση του πίνακα προς έλεγχο. Η δεύτερη περίπτωση είναι να υπάρχουν παραπάνω από µία τιµές του πίνακα προς έλεγχο ανάµεσα σε δύο διαδοχικές τιµές του πίνακα ϐάσης. Σε αυτή την περίπτωση επιλέγεται µόνο η µεγαλύτερη από τις τιµές αυτές του πίνακα προς έλεγχο. Τέλος στην περίπτωση που ανάµεσα σε δύο διαδοχικές τιµές του πίνακα ϐάσης υπάρχει µία ακριβώς τιµή του πίνακα προς έλεγχο την κρατάµε ως έχει. Με τον τρόπο αυτό ο αλγόριθµος δηµιουργεί τους δύο παραπάνω πίνακες, των οποίων τα στοιχεία αντιστοιχούν στις ϑέσεις στήλες από pixels που ορίζουν τα άκρα των διαδροµών. 5.2 Αλγόριθµος εύρεσης των Ϲωνών (bands) του προτύπου Ο αλγόριθµος, που εντοπίζει τις Ϲώνες στο πρότυπο (ladder) της γέλης, αρχικά αποµονώνει το τµήµα της εικόνας που αντιστοιχεί στο πρότυπο αυτό σύµφωνα µε τα άκρα που ϐρέθηκαν από τον αλγόριθµο εύρεσης των διαδροµών και αµέσως µετά αποκόπτονται τα ακριανά σηµεία (pixels) τα οποία µπορεί να περιέχουν άχρηστη πληροφορία. Υπολογίζοντας το µέσο όρο των ϕωτεινοτήτων όλων των pixels της εικόνας προτύπου, κρίνεται αν οι Ϲώνες που υπάρχουν είναι πιο σκούρες από το (background) και αν όχι, γίνεται αναστροφή τς εικόνας για να έρθει σε αυτήν την επιθυµητή µορφή. 26

Στη συνέχεια α) υπολογίζεται για κάθε γραµµή (pixels) ο µέσος όρος των ϕωτεινοτήτων, ϐ) ϐρίσκεται η µέση υπαρκτή τιµή κάθε γραµµής, γ) δηµιουργούνται κάποιοι ακόµη πίνακες, ένας για τις αποκλίσεις της µέσης υπαρκτής τιµής σε κάθε γραµµή από το µέσο όρο της και ένας για τις αντίστοιχες διασπορές, δ) γίνεται χρήση των µέσων όρων που υπολογίζονται µε ϐάση ένα ϕίλτρο για µέσες τιµές και τέλος ε) δηµιουργείται µία καµπύλη µε τιµές που αντιστοιχούν σε κάθε γραµµή του προτύπου. Αφού γίνει κάποια επεξεργασία στην καµπύλη αυτή, η οποία είναι ο υπολογισµός της µέσης τιµής της και των σηµείων µετάβασης, τα οποία αντιστοιχούν στα σηµεία όπου γίνεται µετάβαση από τιµή µικρότερη της µέσης τιµής σε τιµή µεγαλύτερη και αντίστροφα, εντοπίζονται οι πιθανές ϑέσεις Ϲωνών. Υπολογίζοντας τις µέγιστες τιµές της καµπύλης, χωρίς το πλήθος τους να ξεπερνάει το 20, ελέγχεται σε πρώτη ϕάση αν οι τιµές αυτές είναι πάνω από ένα κατώφλι όριο. Στη συνέχεια και εφόσον διατηρηθούν µόνο οι τιµές που τηρούν την παραπάνω προϋπόθεση, εντοπίζονται τα σηµεία µετάβασης, που υπολογίστηκαν προηγουµένως και τα οποία ϐρίσκονται ανάµεσα στις ϑέσεις όπου υπάρχουν οι µέγιστες τιµές, και εξισώνονται µε τη µέση τιµή. Τέλος, οι ϑέσεις όπου ϐρέθηκαν οι µέγιστες τιµές ταξινοµούνται από τη µικρότερη στη µεγαλύτερη και οι 10 µεγαλύτερες τοποθετούνται στον πίνακα, ο οποίος τελικά περιέχει τις 10 τελευταίες ϑέσεις των Ϲωνών του προτύπου. 5.3 Αλγόριθµος δηµιουργίας κλίµακας Για τη δηµιουργία της κλίµακας απαιτείται να ϐρεθούν οι παράµετροι κίνησης που υπολογίζονται µε ϐάση το ϐήµα (step) του προτύπου (ladder) και τις Ϲώνες που εντοπίστηκαν στο πρότυπο αυτο. Σε αυτό το σηµείο πρέπει να τονιστεί ότι η κίνηση των τµηµάτων (fragments) σε µία διαδροµή είναι λογαριθµική. Ο αλγόριθµος εύρεσης των παραµέτρων κίνησης δηµιουργεί αρχικά έναν πίνακα Νx2, όπου Ν = 10 ο αριθµός των Ϲωνών που εντοπίστηκαν. Τα στοιχεία της πρώτης στήλης είναι µονάδες. Οσον αφορά τη δεύτερη στήλη, για κάθε στοιχείο i υπολογίζεται η τιµή log 2 (step*(i+1)). Στη συνέχεια χρησιµοποιείται η µέθοδος των ελαχίστων τετραγώνων, η οποία χρησιµοποιεί τον πίνακα που δηµιουργήθηκε και ένα διάνυσµα µε τις ϑέσεις των Ϲωνών που εντοπίστηκαν στο πρότυπο, για να υπολογίσει τις παραµέτρους κίνησης, οι οποίες 27

είναι όσες και οι στήλες του πίνακα, δηλαδή δύο. Οι παράµετροι που υπολογίζονται ( p1, p2 ), χρησιµοποιούνται µε τον εξής τρόπο. Ενα τµήµα σε µία διαδροµή που αντιστοιχεί σε µήκος µεγέθους l (σε bp) αντιστοιχεί στη ϑέση ( σε pixels ) που υπολογίζεται από τη σχέση p1 p2*log(l). Χρησιµοποιώντας ακόµη την αντίστροφη σχέση αυτής, µπορεί εύκολα και για µία ϑέση να ϐρεθεί ποιο µήκος της αντιστοιχεί. Στην παρούσα εφαρµογή, ϑεωρήθηκε σκόπιµο εφόσον, η µέθοδος των ελαχίστων τετραγώνων είναι προσεγγιστική, ο πίνακας που δηµιουργείται αρχικά να χωρίζεται σε 2 υποπίνακες ο καθένας µε 5 σειρές, και να υπολογίζονται στη συνέχεια οι παράµετροι πρώτα για τον ένα πίνακα και µετά για τον άλλο. Με αυτόν τον τρόπο ϑα υπάρχουν δύο κατηγορίες παραµέτρων και ανάλογα µε τη ϑέση που ϑα ανήκει µία Ϲώνη ϑα επιλέγεται η κατηγορία που αντιστοιχεί σε αυτήν και ϑα υπολογίζεται το µήκος l (σε bp) αυτής της ϑέσης. Η εύρεση δύο συνόλων παραµέτρων αποσκοπεί στη µεγαλύτερη ακρίβεια. 5.4 Αλγόριθµος τυποποίησης του ιού Ο αλγόριθµος για την εύρεση των τύπων του ιού που υπάρχουν σε µία διαδροµή πηγάδι κάνει αναζητήσεις σε όλους τους τύπους του ιού και ελέγχει κάθε ϕορά αν ικανοποιούνται διάφορα κριτήρια. Πριν την εφαρµογή του αλγορίθµου, δηµιουργείται ένας πίνακας όπου καταχωρούνται οι πιο κοντινές τιµές στις Ϲώνες που έχει επιλέξει ο χρήστης, οι οποίες τιµές υπάρχουν έστω σε έναν τύπο του ιού. Στον πίνακα επίσης καταχωρούνται και οι πολύ κοντινές Ϲώνες (2 4) σε αυτές που έχουν ήδη επιλεγεί, αρκεί να υπάρχουν και αυτές σε έναν τύπο τουλάχιστον και η απόστασή τους από τη Ϲώνη που επέλεξε ο χρήστης να µη ξεπερνάει κάποιο κατώφλι (7bp για περιοχές άνω των 80bp και 2bp για περιοχές κάτω των 80bp). Το πρώτο ϐήµα του αλγόριθµου είναι να εξετάσει πόσα από τα µεγέθη κάθε τύπου του ιού ταυτίζονται µε κάποια από τα µεγέθη που έχουν καταχωρηθεί στον παραπάνω πίνακα. Το άθροισµα των κοινών µεγεθών αποθηκεύεται για κάθε τύπο και δηµιουργείται έτσι το πρώτο ποσοστό συµβατότητας που είναι το άθροισµα των κοινών µεγεθών που ϐρέθηκαν για κάθε τύπο προς το σύνολο των τµηµάτων DNA που υπάρχουν στο πρότυπο του τύπου αυτού. Στο δεύτερο ϐήµα του αλγορίθµου ελέγχονται µόνο οι τύποι που ϐρέθηκε να έχουν 28

έστω µία κοινή Ϲώνη (σε µήκος bp) µε τις τιµές του πίνακα. Ο έλεγχος που γίνεται είναι να µην υπάρχει καµία Ϲώνη αυτών των τύπων, για την οποία το ύψος της αντίστοιχης ϑέσης στην κυµατοµορφή της διαδροµής να είναι κάτω από µία τιµή. Οσοι τύποι δεν ικανοποιούν αυτό το κριτήριο απορρίπτονται. Για τους τύπους που επικρατούν, υπολογίζεται αρχικά ένα ποσοστό συµβατότητας, το οποίο µοιάζει µε το ποσοστό που αναφέρθηκε προηγουµένως, µε κάποιες όµως σηµαντικές διαφορές. Αυτή τη ϕορά υπολογίζεται ο αριθµός των Ϲωνών καθενός από αυτούς τους τύπους του ιού, των οποίων το µέγεθος είναι κάτω των 20bp, και σε περίπτωση που ο αριθµός αυτός είναι µικρότερος από το µισό του συνόλου των Ϲωνών του τύπου, τους αφαιρούµε από το σύνολο αυτό. Το νέο ποσοστό που υπολογίζεται ισούται µε το άθροισµα πάλι των κοινών Ϲωνών που ϐρέθηκαν προς το νέο σύνολο, όπως υπολογίστηκε παραπάνω. Χρησιµοποιώντας τα ποσοστά που ϐρέθηκαν, αυτή τη ϕορά απορρίπτονται όσοι από τους τύπους, που είχαν επικρατήσει µέχρι στιγµής, έχουν ποσοστό µικρότερο ή ίσο του 50%. Αν τώρα η µέγιστη τιµή αυτών των ποσοστών είναι µεγαλύτερη ή ίση του 75%, τότε κρατάµε µόνο τους τύπους µε ποσοστό µεγαλύτερο ή ίσο του 75%. Αν όµως η µέγιστη τιµή είναι ανάµεσα στο 50% και το 75%, τότε κρατάµε µόνο τους τύπους µε ποσοστό ίσο µε τη µέγιστη τιµή αυτή. Στο τέλος εµφανίζονται οι τύποι που επικράτησαν, ενώ σε περίπτωση που το πλήθος των τύπων του ιού που εµφανίζονται είναι πάνω από 5, εµφανίζονται οι 5 τύποι µε τα µεγαλύτερα ποσοστά. Σε περίπτωση που δεν έχει ϐρεθεί κάποιος τύπος µε ποσοστό συµβατότητας µεγαλύτερο του 50%, ϑεωρείται ότι στη συγκεκριµένη διαδροµή δεν ανιχνεύθηκε ο ιός. 29

Κεφάλαιο 6 Εργαλεία 6.1 Εργαλεία και ϐιβλιοθήκες που χρησιµοποιήθηκαν Η εργασία έγινε µε τη χρήση της γλώσσας προγραµµατισµού C++ και συγκεκριµένα χρησιµοποιήθηκαν τα wxwidgets ( http://www.wxwidgets.org, έκδοση 2.8.7), τα οποία είναι ένα εργαλείο για τη δηµιουργία graphical user interfaces ( GUIs ), που µπορεί να αναπυχθεί και να τρέξει σε πολλές πλατφόρµες [7] [11]. ηλαδή είναι ανεξάρτητο περιβάλλοντος, αφού περιέχει ένα API ( application programming interface ), το οποίο είναι πρακτικά πανοµοιότυπο για κάθε πλατφόρµα που υποστηρίζουν τα wxwidgets. Ετσι, µια εφαρµογή που έχει δηµιουργηθεί για παράδειγµα σε περιβάλλον windows, µπορεί µε ελάχιστες ή και καθόλου αλλαγές στον κώδικα της να τρέξει και στα Linux ή στα Mac OS X. Για την διεκπεραίωση της εργασίας ως περιβάλλον ανάπτυξης του προγράµµατος χρησιµοποιήθηκαν τα Code::Blocks ( έκδοση 8.02 ). Τα Code::Blocks είναι ένα IDE το οποίο λειτουργεί σε Windows, Linux, και Mac OS X. Επιπλέον συνίσταται και για τη χρήση των wxwidgets, αφού δηµιουργήθηκε µε τη χρήση αυτών και δίνει ιδιαίτερη έµφαση και ϐοήθεια στη δηµιουργία εφαρµογών µε τη χρήση των wxwidgets. Τα Code::Blocks υποστηρίζουν πολλούς compilers. Στην παρούσα εργασία για τη µεταγλώτισση του προγράµµατος επιλέχθηκε ο compiler gcc ( έκδοση mingw32\4.2.1- sjlj). Οσον αφορά τις ϐιβλιοθήκες που χρησιµοποιήθηκαν, εκτός από τις ϐασικές ϐιβλιοθήκες της C++ που χρειάστηκαν όπως η math.h, πρέπει να σηµειωθεί ότι τα wxwidgets περιέχουν και κλάσεις των οποίων οι συναρτήσεις καλύπταν όλες τις ανάγκες 30

της εφαρµογής για την επεξεργασία των εικόνων, έτσι δεν χρειάστηκε η ενσωµάτωση πρόσθετης ϐιβλιοθήκης για επεξεργασία εικόνας. Στον αλγόριθµο που ϐρίσκει τις παραµέτρους κίνησης µε ϐάση το πρότυπο, για τη εύρεση των παραµέτρων αυτών, χρησιµοποιείται η µέθοδος των ελαχίστων τετραγώνων. Καταλληλότερη για την κωδικοποίηση της µεθόδου αυτής ϑεωρήθηκε η ϐιβλιοθήκη GSL ( έκδοση gsl-1.8 ), η οποία και χρησιµοποιήθηκε. Τέλος, για τη δηµιουργία και την ανάγνωση των αρχείων xml που χρησιµοποιεί η εφαρµογή χρησιµοποιήθηκε η ϐιβλιοθήκη TinyXml. 31

Κεφάλαιο 7 ΠΑΡΑΤΗΡΗΣΕΙΣ 7.1 Συµπεράσµατα 1. Για την διεκπεραίωση της εργασίας, τα δείγµατα που αντιστοιχούν στις διαδροµές της γέλης αγαρόζης και υπήρχαν για επεξεργασία δεν ήταν τα ιδανικά. Υπήρχαν αρκετοί περιοριστικοί παράγοντες, καθώς δεν προορίζονταν για αυτοµατοποίηση αλλά για τον γιατρό που ϑα εξέταζε τη γέλη προσεγγιστικά µε το µάτι. Αυτοί οι παράγοντες αφορούν το ϕωτισµό των εικόνων, την απόκλιση των διαδροµών από την κάθετη ευθεία και την πεπερασµένη ακρίβεια αλλά και την προχειρότητα στη διεξαγωγή της ηλεκτροφόρησης. Στη δηµιουργία της γέλης που ϑα προορίζεται για τη συγκεκριµένη εφαρµογή, ϑα δίνεται προσοχή στην ευθυγράµµιση των διαδροµών καθώς επίσης και στο ϕωτισµό, αφού χρειάζεται η εικόνα να είναι καλής ποιότητας για να διευκολύνεται η επεξεργασία της. 2. Στο στάδιο της εφαρµογής, όπου επιλέγει ο χρήστης τις Ϲώνες που ϑεωρεί ότι υπάρχουν σε κάθε διαδροµή, πρέπει ο ίδιος να διακρίνει εκείνες τις περιπτώσεις όπου µία έντονη περιοχή της διαδροµής αντιστοιχεί σε παραπάνω από µία Ϲώνες. Στην περίπτωση που υπάρχουν τέτοιες περιοχές µε αρκετά µεγάλο εύρος, όσο περισσότερες Ϲώνες επιλεγούν µέσα στην περιοχή αυτή, τόσο πιο αξιόπιστα ϑα είναι τα αποτελέσµατα. 3. Για τη διεξαγωγή των παραµέτρων κίνησης, µε ϐάση το πρότυπο που έτρεξε στη γέλη αγαρόζης, χρησιµοποιήθηκε αρχικά η µέθοδος των ελαχίστων τετραγώνων πάνω σε πέντε από τα µήκη που ϐρέθηκαν στο πρότυπο, όπως περιγράφηκε σε 32

προηγούµενο κεφάλαιο. Οπως όµως ϕαίνεται και στην κλίµακα που απεικονίζεται στην εφαρµογή, υπάρχει µία απόκλιση από τις ακριβείς τιµές στα σηµεία που εντοπίστηκαν τα µεγέθη (σε bp) του προτύπου. Ωστόσο ϑεωρείται ότι οι αποκλίσεις αυτές είναι πολύ µικρού µεγέθους, (περίπου 1-2bp), για να επηρεάσουν τα αποτελέσµατα. Ενώ όµως µέχρι και την πέµπτη Ϲώνη του προτύπου τα µεγέθη ακολουθούσαν µε µεγάλη ακρίβεια τις πραγµατικές τιµές, σε µεγαλύτερα µεγέθη (σε bp), οι αποκλίσεις ήταν αρκετά µεγάλες και αλλοίωναν τα αποτελέσµατα. Για αυτό το λόγο χρησιµοποιούνται και οι επόµενες πέντε Ϲώνες του προτύπου και µε ϐάση αυτές υπολογίζονται και άλλες παράµετροι. Ετσι υπολογίζονται δύο κατηγορίες παραµέτρων, µε κάθε κατηγορία να αντιστοιχεί στην περιοχή που χρησιµοποιήθηκε για τον υπολογισµό τους. 4. Κάνοντας δοκιµές σε διάφορα gels και στις διαδροµές όπου τρέξαν τα δείγµατα ασθενών και συγκρίνοντας τα αποτελέσµατα µε αυτά που έχουν εξαχθεί µε την ανάγνωση µε το µάτι, διαπιστώθηκε ότι κάποιες από τις ϑέσεις που εντοπίζονται οι Ϲώνες (bands) που αντιστοιχούν σε έναν τύπο του ιού, µπορεί να αποκλίνουν από τις αρχικές τιµές τους µέχρι και 10 bp. Αν οι Ϲώνες αυτές αντιστοιχούν σε τύπους υψηλού κινδύνου (από τους συνηθέστερους), επιλέγονται µε την ταύτιση των υπολοίπων Ϲωνών και µε ϐάση το γεγονός οτι οι αποκλίνουσες Ϲώνες ϐρίσκονται µέσα σε αναµενόµενες περιοχές. Εποµένως η εφαρµογή είχε να αντιµετωπίσει µία επιπλέον δυσκολία, καθώς µε τέτοιες αποκλίσεις µπορεί να συµπεριληφθούν και τύποι οι οποίοι δεν συνυπάρχουν στο δείγµα ή ακόµη και να παραλειφθεί κάποιος τύπος. Για αυτό το λόγο δόθηκε ιδιαίτερη προσοχή στην τυποποίηση και έµφαση στην οµάδα υψηλού κινδύνου, όπου ακόµη και για κάποιον τύπο αυτής της οµάδας µε µικρότερη πιθανότητα, η αναφορά ότι πιθανόν να υπάρχει στο δείγµα είναι σηµαντική. Σε κάθε περίπτωση, αν δεν ϐρεθεί τύπος του ιού µε ποσοστό άνω του 50% ϑεωρείται ότι στο εξεταζόµενο δείγµα δεν υπάρχει ο ιός. 5. Κάνοντας δοκιµές σε διάφορες εικόνες (γέλες αγαρόζης) και συγκρίνοντας τα αποτελέσµατα που εξάγει η εφαρµογή µε αυτά που εξήχθηκαν από γιατρούς µε την ανάγνωση µε το µάτι, η εφαρµογή ϑεωρήθηκε επιτυχής, αφού έβγαλε τους ίδιους τύπους του ιού µε τα µεγαλύτερα ποσοστά (τις περισσότερες ϕορές 100%). Θεωρήθηκε χρήσιµο ωστόσο να αναφέρονται παραπάνω του ενός τύποι, αν ϐρεθούν 33

και άλλοι µε αρκετά µεγάλα ποσοστά. 34

7.2 Προοπτικές και επεκτάσεις Η παρούσα εφαρµογή αναφέρεται στην τυποποίηση του ιού HPV, και χρησιµοποιείται για δείγµατα DNA, τα οποία µετά από ενίσχυση µε PCR υποβλήθηκαν σε πέψη µε το ένζυµο περιορισµού HpyCH4V (RFLP analysis) και ηλεκτροφορήθηκαν σε γέλη αγαρόζης. Παρόλα αυτά, δεν έχει δηµιουργηθεί για τη συγκεκριµένη χρήση µόνο. Η χρήση διαφορετικών ενζύµων περιορισµού διαφοροποιεί τα τµήµατα στα οποία κόβεται το επιθυµητό τµήµα DNA, συνεπώς και τις Ϲώνες (bands) πάνω στη γέλη (gel), οι οποίες χαρακτηρίζουν κάθε τύπο του ιού. Αν επιθυµείται η τυποποίηση να γίνει µε δείγµατα DNA για τα οποία έχει χρησιµοποιηθεί διαφορετικό ένζυµο περιορισµού, τότε αρκεί να γίνει µια διαφοροποίηση στο configuration file της εφαρµογής, ώστε να προσαρµοσθούν τα µεγέθη (σε bp) των αντίστοιχων τµηµάτων των τύπων του ιού, σε αυτά που παράγει το επιλεγµένο ένζυµο. Η εφαρµογή δηµιουργήθηκε µε σκοπό να είναι εύκολα επεκτάσιµη και στην ανίχνευση και άλλων ιών και στην τυποποίησή τους. Στη συγκεκριµένη περίπτωση ϑα πρέπει να αλλάξει και πάλι το configuration file και να πάρει τη µορφή που ϑα ανταποκρίνεται στον ιό που εξετάζεται, στον αριθµό των υποτύπων του, και στα µεγέθη (σε bp) των αντίστοιχων τµηµάτων που αντιστοιχούν σε καθένα από αυτούς. Θα πρέπει όµως να προσαρµοστεί και η λίστα µε τα ϐήµατα (steps), τα οποία χρησιµοποιούνται στα κατάλληλα για κάθε ιό πρότυπα (ladder markers), και να αλλάξει αν είναι διαφορετική. Στην παρούσα εργασία δηµιουργήθηκε µία πρώτη έκδοση της εφαρµογής. Υπάρχουν ϕυσικά πολλά περιθώρια ϐελτίωσης. Αξίζει να σηµειωθούν κάποια από αυτά. Μία προοπτική είναι να δηµιουργηθούν και να χρησιµοποιηθούν αλγόριθµοι που ϑα εντοπίζουν τις Ϲώνες σε κάθε διαδροµή, χωρίς να χρειάζεται να τις εντοπίζει και να τις τοποθετεί ο χρήστης. Με αυτό τον τρόπο, η εφαρµογή ϑα µπορεί αυτόµατα να ϐρίσκει τα αποτελέσµατα για τα δείγµατα που αντιστοιχούν στις διαδροµές που ϑα έχουν επιλεγεί και να τα εµφανίζει ταυτόχρονα. Ακόµη, ϑα µπορούσαν να χρησιµοποιηθούν έξυπνοι αλγόριθµοι για την τυποποίηση του ιού, ώστε να εντοπίζονται οι τύποι που υπάρχουν σε ένα δείγµα χωρίς να απαιτείται να ελέγχονται ένας-ένας οι τύποι του ιού µε ϐάση το κατά πόσο ικανοποιούν διάφορα κριτήρια. 35