ΕΝΤΟΠΙΣΜΟΣ ΘΕΣΗΣ ΥΠΟΜΙΚΡΟΣΥΣΤΟΙΧΙΩΝ ΚΑΙ SPOTS ΣΕ ΨΗΦΙΑΚΕΣ ΕΙΚΟΝΕΣ ΜΙΚΡΟΣΥΣΤΟΙΧΙΩΝ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ
|
|
- Παρασκευή Καρράς
- 8 χρόνια πριν
- Προβολές:
Transcript
1 ΕΝΤΟΠΙΣΜΟΣ ΘΕΣΗΣ ΥΠΟΜΙΚΡΟΣΥΣΤΟΙΧΙΩΝ ΚΑΙ SPOTS ΣΕ ΨΗΦΙΑΚΕΣ ΕΙΚΟΝΕΣ ΜΙΚΡΟΣΥΣΤΟΙΧΙΩΝ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ ΑΙΚΑΤΕΡΙΝΗΣ ΕΥΘΥΜΙΟΥ ΜΑΣΤΡΟΓΙΑΝΝΗ ΙΠΛ. ΗΛΕΚΤΡΟΛΟΓΟΥ ΜΗΧΑΝΙΚΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΑΡΙΘΜΟΣ Ι ΑΚΤΟΡΙΚΗΣ ΙΑΤΡΙΒΗΣ: 249 ΠΑΤΡΑ-ΜΑΪΟΣ 2010
2 2
3 3
4 4
5 Αφιερώνεται στην οικογένεια µου 5
6 6
7 Ευχαριστίες Ευχαριστίες Οφείλω να εκφράσω την βαθειά µου ευγνωµοσύνη προς όλους όσους βοήθησαν στην διεξαγωγή της έρευνας για την ολοκλήρωση της διδακτορικής διατριβής. Ειδικότερα, θα ήθελα να ευχαριστήσω θερµά τον επιβλέποντα της διατριβής, αναπληρωτή καθηγητή κ. Ευάγγελο ερµατά, ο οποίος µε τις ιδέες, τις γνώσεις, την επιστηµονική καθοδήγηση και τις εύστοχες παρεµβάσεις του, συνέβαλε καθοριστικά στην επιτυχή ολοκλήρωση της όλης ερευνητικής προσπάθειας. Θα ήθελα επίσης να ευχαριστήσω τα µέλη της τριµελούς επιτροπής, καθηγητή κ. Αναστάσιο Μπεζεριάνο, η εµπειρία, οι ιδέες και οι συµβουλές του οποίου µε στήριξαν σε όλη την διάρκεια της έρευνας, καθώς και τον καθηγητή κ. Αθανάσιο Στουραΐτη για τις παρατηρήσεις του. Τέλος, ευχαριστώ τον συνάδελφο, µεταπτυχιακό φοιτητή και φίλο Γεώργιο ούκα για την βοήθεια που προσέφερε κατά την διεξαγωγή της έρευνας που αφορά στον αυτόµατο εντοπισµό των υποµικροσυστοιχιών. Η διδακτορική διατριβή αποτέλεσε τµήµα του ερευνητικού έργου 03Ε 013 (ΠΕΝΕ -2003) και συγχρηµατοδοτήθηκε από εθνικά και κοινοτικά κονδύλια. Πάτρα, Μάϊος 2010 Κατερίνα Μαστρογιάννη 7
8 8
9 Περίληψη ιδακτορικής ιατριβής Περίληψη ιδακτορικής ιατριβής Η τεχνολογία των DNA µικροσυστοιχιών είναι µια υψηλής απόδοσης τεχνική που καθορίζει το κατά πόσο ένα κύτταρο µπορεί να ελέγξει, ταυτόχρονα, την έκφραση ενός πολύ µεγάλου αριθµού γονιδίων. Οι DNA µικροσυστοιχίες χρησιµοποιούνται για την παρακολούθηση και τον έλεγχο των αλλαγών που υφίστανται τα επίπεδα της γονιδιακής έκφρασης λόγω περιβαλλοντικών συνθηκών ή των αλλαγών που λαµβάνουν χώρα σε ασθενή κύτταρα σε σχέση µε τα υγιή, χρησιµοποιώντας εξελιγµένες µεθόδους επεξεργασίας πληροφοριών. Εξαιτίας του τρόπου µε τον οποίον παράγονται οι µικροσυστοιχίες, κατά την πειραµατική επεξεργασία τους, εµφανίζεται ένας µεγάλος αριθµός διαδικασιών που εισάγουν σφάλµατα, γεγονός που αναπόφευκτα οδηγεί στην δηµιουργία υψηλού επιπέδου θορύβου και σε κατασκευαστικά προβλήµατα στα προκύπτοντα δεδοµένα. Κατά την διάρκεια των τελευταίων δεκαπέντε ετών, έχουν προταθεί από αρκετούς ερευνητές, πολλές και ικανές µέθοδοι που δίνουν λύσεις στο πρόβληµα της ενίσχυσης και της βελτίωσης των εικόνων µικροσυστοιχίας. Παρά το γεγονός της ευρείας ενασχόλησης των ερευνητών µε τις µεθόδους επεξεργασίας των εικόνων µικροσυστοιχίας, η διαδικασία βελτίωσης τους αποτελεί ακόµη, ένα θέµα που προκαλεί ενδιαφέρον καθώς η ανάγκη για καλύτερα αποτελέσµατα δεν έχει µειωθεί. Στόχος της διδακτορικής διατριβής είναι να συνεισφέρει σηµαντικά στην προσπάθεια βελτίωσης των αποτελεσµάτων προτείνοντας µεθόδους ψηφιακής επεξεργασίας εικόνας που επιφέρουν βελτίωση της ποιότητας των εικόνων µέσω της µείωσης των συνιστωσών του θορύβου και της τεµαχιοποίησης της εικόνας. Πιο συγκεκριµένα, στα πλαίσια εκπόνησης της διατριβής παρουσιάζεται µια νέα αυτόµατη µέθοδος εντοπισµού της θέσης των υποµικροσυστοιχιών σκοπός της οποίας είναι να καλυφθεί εν µέρει το κενό που υπάρχει στην βιβλιογραφία των µικροσυστοιχιών για το βήµα της προεπεξεργασίας που αφορά στην αυτόµατη εύρεση της θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία. Το βήµα αυτό της προεπεξεργασίας, σπανίως, λαµβάνεται υπόψιν καθώς στις περισσότερες εργασίες σχετικές µε τις µικροσυστοιχίες, γίνεται µια αυθαίρετη υπόθεση ότι οι υποµικροσυστοιχίες έχουν µε κάποιον τρόπο ήδη εντοπιστεί. Στα πραγµατικά συστήµατα αυτόµατης ανάλυσης της εικόνας µικροσυστοιχίας, την αρχική εκτίµηση της θέσης των υποµικροσυστοιχιών, συνήθως, ακολουθεί η διόρθωση που πραγµατοποιείται σε κάθε µια από τις θέσεις 9
10 Περίληψη ιδακτορικής ιατριβής αυτές από τους χειριστές των συστηµάτων. Η αυτοµατοποίηση της εύρεσης θέσης των υποµικροσυστοιχιών οδηγεί σε πιο γρήγορους και ακριβείς υπολογισµούς που αφορούν στην πληροφορία που προσδιορίζεται από την εικόνα µικροσυστοιχίας. Στην συνέχεια της διατριβής, παρουσιάζεται µια συγκριτική µελέτη για την αποθορυβοποίηση των εικόνων µικροσυστοιχίας χρησιµοποιώντας τον µετασχηµατισµό κυµατιδίου και τα χωρικά φίλτρα ενώ επιπλέον µε την βοήθεια τεχνικών της µαθηµατικής µορφολογίας πραγµατοποιείται δραστική µείωση του θορύβου που έχει την µορφή «αλάτι και πιπέρι». Τέλος, στα πλαίσια της εκπόνησης της διδακτορικής διατριβής, παρουσιάζεται µια µέθοδος κατάτµησης των περιοχών των spot των µικροσυστοιχιών, βασιζόµενη στον αλγόριθµο Random Walker. Κατά την πειραµατική διαδικασία επιτυγχάνεται επιτυχής κατηγοριοποίηση των spot, ακόµα και στην περίπτωση εικόνων µικροσυστοιχίας µε σοβαρά προβλήµατα (θόρυβος, κατασκευαστικά λάθη, λάθη χειρισµού κατά την διαδικασία κατασκευής της µικροσυστοιχίας κ.α.), απαιτώντας σαν αρχική γνώση µόνο ένα µικρό αριθµό από εικονοστοιχεία προκειµένου να επιτευχθεί υψηλής ποιότητας κατάτµηση εικόνας. Τα πειραµατικά αποτελέσµατα συγκρίνονται ποιοτικά µε αυτά που προκύπτουν µε την εφαρµογή του µοντέλου κατάτµησης Chan-Vese το οποίο χρησιµοποιεί µια αρχική υπόθεση των συνόρων που υπάρχουν µεταξύ των οµάδων προς ταξινόµηση, αποδεικνύοντας ότι η ακρίβεια µε την οποία η προτεινόµενη µέθοδος ταξινοµεί τις περιοχές των spot στην σωστή κατηγορία σε µια µικροσυστοιχία, είναι σαφώς καλύτερη και πιο ακριβής. Λέξεις κλειδιά: ανάλυση εικόνας µικροσυστοιχίας; εντοπισµός υποµικροσυστοιχιών; διευθυνσιοδότηση; αποθορυβοποίηση εικόνας µικροσυστοιχίας; κυµατίδια; χωρικά φίλτρα; µαθηµατική µορφολογία; κατάτµηση εικόνας µικροσυστοιχίας; αλγόριθµος Random-Walker 10
11 Περίληψη ιδακτορικής ιατριβής Abstract of PhD Thesis DNA microarray technology is a high-throughput technique that determines how a cell can control the expression of large numbers of genes simultaneously. Microarrays are used to monitor changes in the expression levels of genes in response to changes in environmental conditions or in healthy versus diseased cells by using advanced information processing methods. Due to the nature of the acquisition process, microarray experiments involve a large number of error-prone procedures that lead to a high level of noise and structural problems in the resulting data. During the last fifteen years, robust methods have been proposed by many researchers resulting in several solutions for the enhancement of the microarray images. Though microarray image analysis has been elaborated quite enough, the enhancement process is still an intriguing issue as the need for even better results has not decreased. The goal of this PhD thesis is to significantly contribute to the above effort by proposing enhancing methods (denoising, segmentation) for the microarray image analysis. More specifically, a novel automated subgrid detection method is presented introducing a pre-processing step of the subgrid detection. This step is rarely taken into consideration as in most microarray enhancing methods it is arbitrarily assumed that the subgrids have been already identified. The automation of the subgrid detection leads to faster and more accurate information extraction from microarray images. Consequently, the PhD thesis presents a comparative denoising framework for microarray image denoising that includes wavelets and spatial filters while on the other hand uses mathematical morphology methods to reduce the salt&pepper -like noise in microarray images. Finally, a method for microarray spot segmentation is proposed, based on the Random Walker algorithm. During the experimental process, accurate spot segmentation is obtained even in case of relatively-high distorted images, using only an initial annotation for a small number of pixels for high-quality image segmentation. The experimental results are qualitatively compared to the Chan-Vese segmentation model, showing that the accuracy of the proposed microarray spot detection method is more accurate than the spot borders defined by the compared method. 11
12 Περίληψη ιδακτορικής ιατριβής Keywords: microarray image analysis; subgrid detection; gridding; microarray image denoising; wavelets; spatial filters; mathematical morphology; microarray image segmentation; Random-Walker algorithm 12
13 Κατάλογος σχηµάτων και πινάκων Κατάλογος σχηµάτων Σχήµα 2.1: Η διπλή έλικα του DNA. Οι δυο αντιπαράλληλοι κλώνοι συγκρατούνται µεταξύ τους µε δεσµούς υδρογόνου που αναπτύσσονται µεταξύ αδενίνης (A) και θυµίνης (T) και µεταξύ κυτοσίνης (C) και γουανίνης (G)...37 Σχήµα 2.2: Το µονόκλωνο RNA και το δίκλωνο DNA...38 Σχήµα 2.3: Το µονόκλωνο RNA και η µορφή του µορίου στον χώρο...38 Σχήµα 2.4: Σχηµατικό διάγραµµα των µετασχηµατισµών της πληροφορίας στο οποίο απεικονίζεται η πηγή της πληροφορίας και η µετασχηµατισµένη της µορφή...40 Σχήµα 2.5: Επιλεκτική αντιγραφή DNA µε Αλυσιδωτή Αντίδραση της Πολυµεράσης...41 Σχήµα 2.6 : (α) Κατασκευή µικροσυστοιχιών ολιγονουκλεοτιδίων (β) Κατασκευή cdna µικροσυστοιχιών...44 Σχήµα 3.1: Σχηµατική διάταξη των διαδικασιών που πραγµατοποιούνται για την ψηφιακή απεικόνιση ενός chip...54 Σχήµα 3.2: Σχηµατικό διάγραµµα ενός τυπικού σαρωτή πειραµάτων µικροσυστοιχιών...56 Σχήµα 3.3: Τυπικό παράδειγµα εικόνας µικροσυστοιχίας αποτελούµενη από 48 υποµικροσυστοιχίες [4]...57 Σχήµα 3.4: Παραδείγµατα εικόνας υποµικροσυστοιχίας µε λάθος τοποθέτηση της µάσκας τόσο στην (α) περίπτωση στις δυο αριστερές στήλες όσο και στην (β) περίπτωση στις δυο δεξιές στήλες...59 Σχήµα 3.5: Παράδειγµα εικόνας υποµικροσυστοιχίας µε περιστρεφόµενο 2D πλέγµα και ανοµοιόµορφα τοποθετηµένα spot...60 Σχήµα 3.6: Μικροσυστοιχία µε τέσσερις υποµικροσυστοιχίες. Η κάτω δεξιά υποµικροσυστοιχία περιέχει, στις δυο τελευταίες γραµµές, spot µε πολύ µικρή ενέργεια φθορισµού...61 Σχήµα 3.7: Τµήµα µικροσυστοιχίας µε θόρυβο υποβάθρου οφειλόµενο στην ελλιπή πλύση του υλικού του συµπαγούς υποστρώµατος...61 Σχήµα 3.8: Χωρικές και µορφολογικές αποκλίσεις των spot από αριστερά προς δεξιά, και από επάνω προς τα κάτω: spot σε κανονικό σχήµα, spot-φάντασµα, spot µετατοπισµένο 13
14 Κατάλογος σχηµάτων και πινάκων χωρικά µέσα στο πλέγµα, σφάλµα στην ακτίνα του spot, spot µε διάµετρος που λεπταίνει σταδιακά- σχήµα κοµήτη, spot µε τρύπα- σχήµα ντόνατ, µερικώς απόν spot και γδαρµένο spot...62 Σχήµα 3.9: Μικροσυστοιχία µε φωτεινό υπόβαθρο και σκοτεινά spot...63 Σχήµα 4.1: Σχήµα ιδανικής εικόνας µικροσυστοιχίας.67 Σχήµα 4.2: Παράδειγµα πραγµατικής εικόνας µικροσυστοιχίας µε δεκαέξι υποµικροσυστοιχίες στο οποίο παρατηρείται η εµφανής απόκλιση από την ιδανική µικροσυστοιχία...68 Σχήµα 4.3: Παράµετροι της εικόνας µικροσυστοιχίας που χρησιµοποιούνται στην προτεινόµενη µέθοδο...71 Σχήµα 4.4: Παράδειγµα διαγράµµατος της συνάρτησης ευθυγράµµισης και της γωνίας περιστροφής για µια προσοµοιωµένη εικόνα µικροσυστοιχίας από την βάση δεδοµένων Sim Σχήµα 4.5: Παράδειγµα διαγράµµατος της ολικής φωτεινότητας στις γραµµές και της θέσης της γραµµής για µια προσοµοιωµένη εικόνα µικροσυστοιχίας από την βάση δεδοµένων Sim Σχήµα 4.6: Παράδειγµα ιστογράµµατος για όλες τις κοντινές αποστάσεις µεταξύ των κέντρων των spot χρησιµοποιώντας την εικόνα µικροσυστοιχίας lc7b060rex2.gif από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project...76 Σχήµα 4.7: Παράδειγµα µιας τεχνητής δυαδικής εικόνας...77 Σχήµα 4.8: Τυπικό γράφηµα εντοπισµού των περιοχών χαµηλής φωτεινότητας σε µια προσοµοιωµένη και ευθυγραµµισµένη εικόνα µικροσυστοιχίας...78 Σχήµα 4.9: ιάγραµµα ροής του αλγορίθµου εντοπισµού των θέσεων των γραµµών πλέγµατος...81 Σχήµα 4.10: Παράδειγµα εικόνας µικροσυστοιχίας µε αρκετά µεγάλο αριθµό σφαλµάτων και µεγάλο αριθµό περιοχών χαµηλής φωτεινότητας (lc7b060rex2.gif) από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project...82 Σχήµα 4.11: Αθροιστική φωτεινότητα των γραµµών της εικόνας του σχήµατος 4.10 σε συνάρτηση µε την θέση των γραµµών του πλέγµατος
15 Κατάλογος σχηµάτων και πινάκων Σχήµα 4.12: Παράδειγµα εύρεσης υποµικροσυστοιχιών σε εικόνα µικροσυστοιχίας (71817.gif) από την Human Sarcomas βάση. ιακρίνεται η αντίστοιχη τεχνητή εικόνα και οι εντοπισµένες υποµικροσυστοιχίες...84 Σχήµα 4.13: (α) Τµήµα εικόνας µικροσυστοιχίας (76168.gif) από την βάση Human Sarcomas, όπου φαίνονται καθαρά τα χαµηλής φωτεινότητας spot, (β) Παράδειγµα µιας πραγµατικά παραµορφωµένης εικόνας (71824.gif) από την βάση Human Sarcomas...86 Σχήµα 4.14: Εικόνα µικροσυστοιχίας (59960.gif) από την βάση δεδοµένων Young vs. Old Transgenic, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές του πλέγµατος...89 Σχήµα 4.15: (α) Εικόνα µικροσυστοιχίας (lc4b035rex2.gif) από την βάση δεδοµένων LLMPP, (β) Ευθυγραµµισµένη εκδοχή της εικόνας αποχρώσεων του γκρι, (γ) Τεχνητή εικόνα µε τις παραγόµενες γραµµές διαχωρισµού των υποµικροσυστοιχιών, (δ) Γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών στην αρχική εικόνα...90 Σχήµα 4.16: Εικόνα µικροσυστοιχίας (72801.gif) από την βάση δεδοµένων Young Transgenic Control, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών της εικόνας...91 Σχήµα 4.17: Εικόνα µικροσυστοιχίας (72813.gif) από την βάση δεδοµένων Old Wildtype TPA_Control, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών της εικόνας...92 Σχήµα 4.18: Τυπικό παράδειγµα εικόνας προσοµοίωσης...93 Σχήµα 4.19: Παράδειγµα σωστού εντοπισµού των γραµµών διαχωρισµού υποµικροσυστοιχιών στην εικόνα (β) σε µια µικροσυστοιχία από την βάση Sim1 στην οποία παρατηρούνται (εικόνα (α)) µεγάλες γωνίες περιστροφής στις υποµικροσυστοιχίες της...93 Σχήµα 5.1: (α) Πραγµατική εικόνα µε έντονη την παρουσία θορύβου, (β) Η ίδια εικόνα στην ιδανική της εκδοχή χωρίς τον θόρυβο, (γ) Ο θόρυβος υποβάθρου αποµονωµένος από την αρχική εικόνα [4] Σχήµα 5.2: (α) Πραγµατική εικόνα µε έντονη την παρουσία θορύβου, (β) Η ίδια εικόνα µετά την διαδικασία αποθορυβοποίησης [4]
16 Κατάλογος σχηµάτων και πινάκων Σχήµα 5.3: Υποµικροσυστοιχία πριν (α) και µετά (β) την εφαρµογή θορύβου τύπου «αλάτι και πιπέρι» µε διασπορά 0.04 όταν η δυναµική περιοχή φωτεινότητας είναι [0,1] Σχήµα 5.4: Υποµικροσυστοιχία πριν (α) και µετά (β) την εφαρµογή Gaussian θορύβου µε διασπορά 0.04 όταν η δυναµική περιοχή φωτεινότητας είναι [0, Σχήµα 5.5: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται φίλτρο ενδιάµεσης τιµής Σχήµα 5.6: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται το φίλτρο Wiener Σχήµα 5.7: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε soft κατώφλι Σχήµα 5.8: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε hard κατώφλι Σχήµα 5.9: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε soft κατώφλι Σχήµα 5.10: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε hard κατώφλι Σχήµα 5.11: Παράδειγµα αποθορυβοποίησης υποµικροσυστοιχίας µε φίλτρο ενδιάµεσης τιµής. Στην υποµικροσυστοιχία προστέθηκε θόρυβος τύπου «αλάτι και πιπέρι» µε διασπορά Σχήµα 5.12: Παράδειγµα αποθορυβοποίησης υποµικροσυστοιχίας µε µετασχηµατισµό κυµατιδίου bior1.1, soft κατώφλι και δυο επίπεδα ανάλυσης. Στην υποµικροσυστοιχία προστέθηκε θόρυβος τύπου «αλάτι και πιπέρι» µε διασπορά Σχήµα 5.13: (α) Υποµικροσυστοιχία διαβαθµίσεων του γκρι από την βάση δεδοµένων Human Sarcomas, (β) Βελτιωµένη έκδοση της εικόνας υποµικροσυστοιχίας
17 Κατάλογος σχηµάτων και πινάκων Σχήµα 5.14: (α) υαδική εικόνα υποµικροσυστοιχίας από την βάση δεδοµένων Human Sarcomas, (β) Αποθορυβοποιηµένη υποµικροσυστοιχία µε χρήση µεθόδου βασιζόµενης στην µαθηµατική µορφολογία Σχήµα 5.15: (α) υαδική εικόνα υποµικροσυστοιχίας από την βάση δεδοµένων LLMPP, (β) Αποθορυβοποιηµένη υποµικροσυστοιχία µε χρήση µεθόδου βασιζόµενης στην µαθηµατική µορφολογία Σχήµα 6.1:. Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει χωρικής πληροφορίας και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης Σχήµα 6.2: Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει µετρήσεων «αφαίρεσης» εικονοστοιχείων και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης Σχήµα 6.3: Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει συνδυασµού χωρικής πληροφορίας και πληροφορίας που παρέχει η ένταση φωτεινότητας και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης.128 Σχήµα 6.4: Αναπαράσταση της βασικής ιδέας του Random-Walker αλγορίθµου [7] Σχήµα 6.5: (α) Αρχική εικόνα µικροσυστοιχίας δυο καναλιών από την LLMPP βάση δεδοµένων, (β) Μονοκαναλική υποµικροσυστοιχία, (γ) Υποµικροσυστοιχία µε ενίσχυση του βαθµού διαφοράς φωτεινότητας, (δ) υαδική υποµικροσυστοιχία, (ε) Υποµικροσυστοιχία µετά την εφαρµογή µεθόδων αποµάκρυνσης µαθηµατικής µορφολογίας για την αφαίρεση θορύβου µε µορφή «αλάτι και πιπέρι» Σχήµα 6.6: (α) Εύρεση των spot-seeds σε δυαδική υποµικροσυστοιχία από την LLMPP βάση δεδοµένων, (β) Κατάτµηση στην αρχική υποµικροσυστοιχία αποχρώσεων του γκρι
18 Κατάλογος σχηµάτων και πινάκων Σχήµα 6.7: Πραγµατικό παράδειγµα εικόνας µικροσυστοιχίας: (α) Στην εικόνα περιλαµβάνονται τέσσερις υποµικροσυστοιχίες παραµορφωµένες από ένα είδος θορύβου γνωστό σαν η ουρά του κοµήτη, (β) Η υποµικροσυστοιχία που βρίσκεται στο κάτω αριστερό τµήµα της εικόνας περιέχει πολλά αδύναµα spot ενώ η παρουσία του θορύβου στο υπόβαθρο είναι έντονη Σχήµα 6.8: (α) Μονοχρωµατική υποµικροσυστοιχία πριν την εφαρµογή του αλγορίθµου ευθυγράµµισης, (β) Η ίδια υποµικροσυστοιχία αφού έχει στραφεί κατά 0.5 ο, τιµή που αντιστοιχεί στην γωνία µέγιστης διασποράς του πλάτους του FFT για το σήµα της αθροιστικής φωτεινότητας των γραµµών της εικόνας 138 Σχήµα 6.9: (α) Παράδειγµα εικόνας υποµικροσυστοιχίας (β) Οι εκτιµώµενες γραµµές του πλέγµατος στην εικόνα υποµικροσυστοιχίας Σχήµα 6.10: (α) Αρχική εικόνα υποµικροσυστοιχίας δυο καναλιών, (β) Εύρεση των πιθανοτήτων τα εικονοστοιχεία της εικόνας να είναι spot εικονοστοιχεία, µετά την εφαρµογή µεθόδου κατάτµησης που βασίζεται στον RWA Σχήµα 6.11: (α) Μια µονοκαναλική υποµικροσυστοιχία από την από την LLMPP βάση δεδοµένων, (β) Εύρεση των spot-seeds, (γ) Μάσκα της µέγιστης spot περιοχής, (δ) Εικόνα πιθανοτήτων των spot της υποµικροσυστοιχίας µετά την εφαρµογή της προτεινόµενης µεθόδου που βασίζεται στον αλγόριθµο Random-Walker Σχήµα 6.12: Πιθανότητα για κάθε εικονοστοιχείο της εικόνας υποµικροσυστοιχίας του σχήµατος 6.12, να είναι spot µε p= Σχήµα 6.13: Κατάτµηση µε το µοντέλο Chan-Vese της εικόνας υποµικροσυστοιχίας του σχήµατος Σχήµα 6.14: Τυπικό παράδειγµα τεχνητής εικόνας µικροσυστοιχίας Σχήµα 6.15: (α) Μια µονοκαναλική υποµικροσυστοιχία από την Simu1 βάση δεδοµένων, (β) Εύρεση των spot-seeds, (γ) Μάσκα της µέγιστης spot περιοχής, (δ) Εικόνα πιθανοτήτων των spot της υποµικροσυστοιχίας µετά την εφαρµογή της προτεινόµενης µεθόδου που βασίζεται στον αλγόριθµο Random-Walker Σχήµα 6.16: Πιθανότητα για κάθε εικονοστοιχείο της τεχνητής εικόνας υποµικροσυστοιχίας του σχήµατος 6.15, να είναι spot µε p=
19 Κατάλογος σχηµάτων και πινάκων Σχήµα 6.17: Κατάτµηση µε το µοντέλο Chan-Vese της τεχνητής εικόνας υποµικροσυστοιχίας του σχήµατος Κατάλογος πινάκων Πίνακας 4.1: Ακρίβεια εντοπισµού θέσης υποµικροσυστοιχιών χωρίς κανένα σφάλµα ανά εικόνα, σε πέντε πραγµατικές βάσεις δεδοµένων...85 Πίνακας 4.2: Ακρίβεια εντοπισµού των υποµικροσυστοιχιών χωρίς σφάλµατα ανά εικόνα σε πέντε προσοµοιωµένες βάσεις δεδοµένων και τα αντίστοιχα χαρακτηριστικά τους...87 Πίνακας 6.1: Τιµές του κατωφλίου πιθανοτήτων p για εννέα τυχαία επιλεγµένες υποµικροσυστοιχίες από την LLMPP βάση δεδοµένων
20 20
21 Περιεχόµενα Περιεχόµενα Κεφάλαιο 1: Εισαγωγή ιδακτορικής ιατριβής Αντικείµενο ιδακτορικής ιατριβής Επιστηµονική Συµβολή Οργάνωση ιδακτορικής ιατριβής Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Εισαγωγή Βασικά στοιχεία βιολογίας DNA RNA Σύγκριση RNA- DNA Η ροή της πληροφορίας από το γονικό κύτταρο στα θυγατρικά PCR -Αλυσιδωτή Αντίδραση της Πολυµεράσης Μικροσυστοιχίες Μέτρηση της γονιδιακής έκφρασης Πείραµα µικροσυστοιχιών cdna µικροσυστοιχίες Μικροσυστοιχίες ολιγονουκλεοτιδίων Μικροσυστοιχίες πρωτεϊνών Μικροσυστοιχίες ιστών Κλινικές εφαρµογές Αναφορές 2 ου κεφαλαίου Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Εισαγωγή Επεξεργασία εικόνων µικροσυστοιχίας
22 Περιεχόµενα 3.2 ηµιουργία cdna εικόνας µικροσυστοιχίας Ιδιότητες ψηφιακής εικόνας µικροσυστοιχίας Σφάλµατα κατά την δηµιουργία εικόνας µικροσυστοιχίας Σφάλµατα που αφορούν στα χρωµατικά κανάλια της εικόνας Σφάλµατα που αφορούν στην γεωµετρία του πλέγµατος της εικόνας Σφάλµατα που αφορούν στο υπόβαθρο της εικόνας Σφάλµατα που αφορούν στην µορφολογία του spot Σφάλµατα που αφορούν στις εντάσεις φωτεινότητας στο υπόβαθρο και το προσκήνιο της εικόνας Αναφορές 3 ου κεφαλαίου Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Εισαγωγή Προϋπάρχουσες σχετικές εργασίες Αυτόµατη εύρεση υποµικροσυστοιχιών Προεπεξεργασία Εύρεση περιοχής µικροσυστοιχίας Ευθυγράµµιση της τεµαχισµένης µικροσυστοιχίας Εντοπισµός των κέντρων των spot και υπολογισµός του διαστήµατος µεταξύ των spot Εύρεση υποµικροσυστοιχιών Πειραµατικά αποτελέσµατα σε πραγµατικές εικόνες µικροσυστοιχίας Πειραµατικά αποτελέσµατα σε προσοµοιωµένες εικόνες µικροσυστοιχίας Αναφορές 4 ου κεφαλαίου Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Εισαγωγή Πηγές θορύβων
23 Περιεχόµενα 5.2 Αποθορυβοποίηση µικροσυστοιχιών Αποθορυβοποίηση µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου Πειραµατική διαδικασία αποθορυβοποίησης µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου Πειραµατικά αποτελέσµατα αποθορυβοποίησης µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίων Αποθορυβοποίηση µε µεθόδους µαθηµατικής µορφολογίας Πειραµατική διαδικασία και αποτελέσµατα αποθορυβοποίησης µε µεθόδους µαθηµατικής µορφολογίας Αναφορές 5 ου κεφαλαίου Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Εισαγωγή Ο αλγόριθµος Random-Walker Προϋπάρχουσες εργασίες πάνω στην κατάτµηση των εικόνων µικροσυστοιχίας Κατάτµηση εικόνας µικροσυστοιχίας µε απευθείας εφαρµογή του αλγορίθµου Random-Walker Πειραµατικά αποτελέσµατα Κατάτµηση εικόνας µικροσυστοιχίας µε εφαρµογή νέας µεθόδου βασιζόµενης στον Random-Walker αλγόριθµο Πειραµατική διαδικασία Πειραµατικά αποτελέσµατα σε πραγµατικές εικόνες µικροσυστοιχίας Πειραµατικά αποτελέσµατα σε τεχνητές εικόνες µικροσυστοιχίας Αναφορές 6 ου κεφαλαίου Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα Συµπεράσµατα ιδακτορικής ιατριβής ηµοσιεύσεις
24 Περιεχόµενα 7.3 Μελλοντικές κατευθύνσεις έρευνας ΠΑΡΑΡΤΗΜΑ Α ΠΑΡΑΡΤΗΜΑ Β
25 Κεφάλαιο 1 Εισαγωγή ιδακτορικής ιατριβής
26 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής 26
27 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής ΤΊΤΛΟΣ Ι ΑΚΤΟΡΙΚΗΣ ΙΑΤΡΙΒΗΣ: Εντοπισµός θέσης υποµικροσυστοιχιών και spots σε ψηφιακές εικόνες µικροσυστοιχιών 1.1 Αντικείµενο ιδακτορικής ιατριβής Η τεχνολογία των µικροσυστοιχιών, λόγω της ικανότητας της να επεξεργάζεται ταυτόχρονα έναν αρκετά µεγάλο αριθµό γονιδίων, συνέβαλε σηµαντικά στην περαιτέρω ανάπτυξη τόσο της βιολογίας όσο και της ιατρικής επιστήµης. Αποτέλεσµα της εφαρµογής της τεχνολογίας των µικροσυστοιχιών είναι η δηµιουργία µιας ψηφιακής εικόνας µικροσυστοιχίας. Καθώς το αποτέλεσµα της µέτρησης της πληροφορίας που εµπεριέχεται στα υπό εξέταση γονίδια βασίζεται αποκλειστικά και µόνο στην ποιότητα της εικόνας µικροσυστοιχίας, η διαδικασία ακριβούς εντοπισµού της περιοχής υβριδισµού και αφαίρεσης του θορύβου ή διαφορετικά η υλοποίηση, όσον το δυνατόν, πιο αξιόπιστων επεξεργασιών για την εξαγωγή της πληροφορίας από τις εικόνες µικροσυστοιχίας, θεωρείται απαραίτητο βήµα προεπεξεργασίας στην ανάλυση µικροσυστοιχιών. Λόγω όµως, της φύσης ενός τέτοιου πειράµατος και της υπάρχουσας τεχνολογίας που επαναχρησιµοποιεί το υλικό, οι εικόνες που προκύπτουν υποβαθµίζονται από την ύπαρξη αµυχών, φαινοµένων φυσαλίδας και από την αµαύρωση του φόντου, προβλήµατα που προέρχονται συνήθως είτε από ηλεκτρονικές και βιολογικές πηγές θορύβου είτε από σφάλµατα χειρισµών κατά την διαδικασία παραγωγής των εικόνων. Το αντικείµενο της διδακτορικής διατριβής έρχεται να αντιµετωπίσει ακριβώς αυτά τα προβλήµατα, προτείνοντας νέες µεθόδους βελτίωσης στην επεξεργασία των εικόνων µικροσυστοιχίας. Η αυτόµατη εύρεση της θέσης υποµικροσυστοιχιών είναι το πρώτο πρόβληµα που προσεγγίζει η παρούσα διδακτορική διατριβή. Η ύπαρξη διαφορετικών ειδών θορύβου στην ίδια εικόνα µικροσυστοιχίας, η οποία διαφοροποιείται ποσοτικά και χωρικά, κάνει εξαιρετικά δύσκολο το πρόβληµα της συνολικής αφαίρεσης θορύβου αλλά και της αυτόµατης εύρεσης της θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία. Στόχος της προτεινόµενης µεθόδου είναι η κατασκευή ενός 27
28 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής αυτόµατου αλγορίθµου εντοπισµού της θέσης κάθε υποµικροσυστοιχίας. Η αυτόµατη εύρεση υποµικροσυστοιχιών οδηγεί σε πιο γρήγορη και αξιόπιστη ανάλυση της εικόνας µικροσυστοιχίας, αφού τα επιµέρους προβλήµατα θορύβου µελετώνται πιο σωστά και διεξοδικά σε κάθε υποµικροσυστοιχία χωριστά. Η αποθορυβοποίηση της εικόνας µικροσυστοιχίας είναι το δεύτερο πρόβληµα που µελετάται στην διατριβή, η σηµασία της οποίας για τα περαιτέρω βήµατα είναι πολύ σηµαντική προκειµένου να επιτευχθεί η σωστή µέτρηση της χρήσιµης πληροφορίας που εµπεριέχεται στα υπό εξέταση γονίδια. Τέλος, η κατάτµηση της εικόνας, δηλαδή ο εντοπισµός των εικονοστοιχείων που αντιστοιχούν σε κάθε spot, αποτελεί ένα ακόµη σηµαντικό πρόβληµα της επεξεργασίας των εικόνων µικροσυστοιχίας, το οποίο µελετάται διεξοδικά στην διατριβή, δίνοντας αρκετά ικανοποιητικά αποτελέσµατα Επιστηµονική Συµβολή Λαµβάνοντας υπόψιν τους στόχους της διδακτορικής διατριβής, όπως αυτοί αναφέρθηκαν στο αντικείµενο της, θα µπορούσαν να αναφερθούν τα ακόλουθα δυο σηµεία επιστηµονικής συµβολής: Ανάπτυξη και αξιολόγηση πρωτότυπης αυτόµατης µεθόδου εύρεσης της θέσης υποµικροσυστοιχιών σε εικόνα µικροσυστοιχίας: Η µέθοδος αυτόµατης εύρεσης της ακριβούς θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία παρουσιάζει πολύ υψηλή ακρίβεια εντοπισµού, απαιτώντας σαν αρχική γνώση µόνο τον αριθµό των υποµικροσυστοιχιών και τον αριθµό γραµµών και στηλών των spot κάθε υποµικροσυστοιχίας. Η επιτυχής εύρεση πραγµατοποιείται ακόµη και σε περιπτώσεις κατά τις οποίες στις εικόνες µικροσυστοιχίας περιέχεται θόρυβος υψηλής στάθµης. 28
29 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής Κατασκευή και αξιολόγηση µια νέας µεθόδου κατάτµησης εικόνων µικροσυστοιχίας για την ακριβή ταξινόµηση των εικονοστοιχείων της µικροσυστοιχίας: Η µη-επαναληπτική φύση της µεθόδου, η ισχυρή ανθεκτικότητα σε διαφορετικά είδη και επίπεδα ισχύος του περιβάλλοντα θορύβου, η µικρή γνώση που χρειάζεται για την γεωµετρία της υποµικροσυστοιχίας και η ικανότητα της να είναι αποτελεσµατική χωρίς µεταβολές στις παραµέτρους και την δοµή της µεθόδου αποτελούν τα σηµαντικότερα πλεονεκτήµατα της. 1.2 Οργάνωση ιδακτορικής ιατριβής Το υπόλοιπο της διδακτορικής διατριβής οργανώνεται σε τρία διαφορετικά µέρη. Στα κεφάλαια 2 και 3 γίνεται µια σύντοµη αναφορά στις βασικές έννοιες που πραγµατεύεται η διδακτορική διατριβή. Στα κεφάλαια 4, 5 και 6 περιγράφονται αναλυτικά, οι προτεινόµενες µέθοδοι και τα πειραµατικά αποτελέσµατα τους, ενώ στο κεφάλαιο 7 καταγράφονται τα γενικά συµπεράσµατα της διατριβής και προτείνονται νέες ερευνητικές κατευθύνσεις. Τέλος, στο τελευταίο τµήµα της διατριβής ενσωµατώνονται δυο παραρτήµατα που περιλαµβάνουν την περιγραφή του συνόλου των εικόνων (τεχνητών και πραγµατικών) που χρησιµοποιήθηκαν στο κυρίως τµήµα της διατριβής και ορισµένα χαρακτηριστικά πειραµατικά αποτελέσµατα, αντίστοιχα. Αναλυτικότερα, στο 2 ο κεφάλαιο γίνεται µια σύντοµη εισαγωγή σε βασικά στοιχεία βιολογίας, απαραίτητα για την κατανόηση όλων των διαδικασιών που συναντώται στην τεχνολογία των µικροσυστοιχιών και την αξιολόγηση της φυσικής τους σηµασίας. Περιγράφονται έννοιες όπως το DNA, το γονίδιο και οι πρωτεΐνες καθώς και ο ρόλος που διαδραµατίζουν, το καθένα χωριστά, σε έναν ζώντα οργανισµό. Στην συνέχεια του κεφαλαίου δίνεται εν συντοµία η έννοια της γονιδιακής έκφρασης, περιγράφεται ένα πείραµα µικροσυστοιχιών και τέλος, παρουσιάζονται οι κατηγορίες αυτών και οι κλινικές εφαρµογές τους. Ακολουθεί η βιβλιογραφία του κεφαλαίου. Το 3 ο κεφάλαιο αναφέρεται στην επεξεργασία των εικόνων µικροσυστοιχίας και στον βασικό στόχο της επεξεργασίας αυτών, που είναι η µέτρηση της έντασης 29
30 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής φωτεινότητας των τοποθετηµένων σε δοµή πλαισίου spot, ποσοτικοποιώντας τα επίπεδα της γονιδιακής τους έκφρασης. Παρουσιάζονται τα συστηµατικά σφάλµατα που υπεισέρχονται στις εικόνες µικροσυστοιχίας µέσω του τρόπου δηµιουργίας τους και περιγράφεται η διαδικασία ανάλυσης των εικόνων µικροσυστοιχίας σε τρία βήµατα: διευθυνσιοδότηση, κατάτµηση, υπολογισµός της έντασης φωτεινότητας. Ακολουθεί η βιβλιογραφία του κεφαλαίου. Στο 4 ο κεφάλαιο προτείνεται και παρουσιάζεται µια πρωτότυπη αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών σε µια εικόνα µικροσυστοιχίας. Περιγράφεται η φύση του προβλήµατος και η αναγκαιότητα ύπαρξης µιας αυτόµατης µεθόδου ακριβούς εντοπισµού της θέσης υποµικροσυστοιχιών ενώ παρουσιάζονται µε αναλυτικό τρόπο τα βήµατα υλοποίησης της προτεινόµενης µεθόδου. Στην συνέχεια, δίνεται µια συνοπτική περιγραφή των βάσεων δεδοµένων που χρησιµοποιήθηκαν για την αξιολόγηση της µεθόδου και παρατίθενται τα πειραµατικά αποτελέσµατα και συµπεράσµατα σε εικόνες και πίνακες. Ακολουθεί η βιβλιογραφία του κεφαλαίου. Το 5 ο κεφάλαιο αναφέρεται στην αποθορυβοποίηση µιας εικόνας µικροσυστοιχίας. Περιγράφονται τρεις σηµαντικοί αλγόριθµοι αφαίρεσης θορύβου που βασίζονται στον µετασχηµατισµό κυµατιδίου, στα χωρικά φίλτρα και την µαθηµατική µορφολογία. Ακολούθως, παρουσιάζεται αναλυτικά η εφαρµογή αυτών των µεθόδων στην ανάλυση της εικόνας µικροσυστοιχίας. Παρατίθενται συγκριτικά αποτελέσµατα και συµπεράσµατα. Ακολουθεί η βιβλιογραφία του κεφαλαίου. Στο 6 ο κεφάλαιο περιγράφεται το πρόβληµα της κατάτµησης µιας εικόνας µικροσυστοιχίας. Αρχικά, στο κεφάλαιο δίδεται µια αναλυτική περιγραφή του αλγορίθµου Random-Walker και παρατίθενται µια σειρά βηµάτων προεπεξεργασίας που προηγούνται της εφαρµογής του, προκειµένου να επιτευχθεί µια σωστή κατάτµηση της εικόνας µικροσυστοιχίας. Ακολουθούν τα πειραµατικά αποτελέσµατα της αξιολόγησης που υλοποιήθηκε. Επιπλέον, προτείνεται και παρουσιάζεται µια νέα µέθοδος κατάτµησης βασιζόµενη στον αλγόριθµο Random-Walker. Πιο συγκεκριµένα, δίνεται η αναλυτική περιγραφή της νέας µεθόδου ενώ παρουσιάζονται 30
31 Κεφάλαιο 1: Εισαγωγή διδακτορικής διατριβής τα πειραµατικά αποτελέσµατα και συµπεράσµατα από την ποιοτική αξιολόγηση της. Ακολουθεί η βιβλιογραφία του κεφαλαίου. Τέλος, στο 7 ο κεφάλαιο αναλύονται τα συµπεράσµατα της πειραµατικής αξιολόγησης των προτεινόµενων µεθόδων επεξεργασίας εικόνας µικροσυστοιχίας, όπως αυτή πραγµατοποίηθηκε στα πλαίσια της παρούσας διδακτορικής διατριβής. Στην συνέχεια, παρουσιάζεται ένας κατάλογος επιστηµονικών εργασιών που δηµοσιεύθηκαν ή είναι υπό κρίση σε διεθνή περιοδικά και συνέδρια στα ερευνητικά αντικείµενα της παρούσας διδακτορικής διατριβής ενώ στο τέλος του κεφαλαίου προτείνονται νέες ερευνητικές κατευθύνσεις στην επιστηµονική περιοχή της διατριβής. Στα παραρτήµατα παρουσιάζονται και περιγράφονται οι τεχνητές και οι πραγµατικές βάσεις δεδοµένων ψηφιακών εικόνων µικροσυστοιχιών που χρησιµοποιήθηκαν για την αξιολόγηση των προτεινόµενων µεθόδων και δίνονται ορισµένα χαρακτηριστικά πειραµατικά αποτελέσµατα από την εφαρµογή των µεθόδων ψηφιακής επεξεργασίας εικόνων µικροσυστοιχίας που προτάθηκαν στα πλαίσια εκπόνησης της παρούσας διδακτορικής διατριβής. 31
32 32
33 Κεφάλαιο 2 Εισαγωγή στην τεχνολογία των µικροσυστοιχιών
34 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών 34
35 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών 2. 1 Εισαγωγή Κατά την διάρκεια των τελευταίων δεκαετιών, η παράλληλη πορεία της εξέλιξης της τεχνολογίας και ιδιαίτερα αυτής των µοριακών τεχνικών, µε την ταυτόχρονη βελτίωση των µεθόδων αυτόµατης επεξεργασίας πληροφορίας και ανάλυσης εικόνων και δεδοµένων, οδήγησε στην ανάπτυξη διαφόρων τεχνολογιών στο πεδίο της βιοπληροφορικής. Οι τεχνολογίες αυτές επέτρεψαν και επιτρέπουν µε επιτυχία τόσο την συγκριτική όσο και την λεπτοµερή ανάλυση της έκφρασης και της αλληλουχίας των γονιδίων, την αναγνώριση πιθανών µετα-µεταφραστικών αλλαγών και την ανάλυση της έκφρασης των πρωτεϊνών σε διάφορες κυτταρικές διαδικασίες. Η τεχνολογία των µικροσυστοιχιών εµφανίστηκε στο επιστηµονικό προσκήνιο, πριν από 20 χρόνια, σαν µια νέα και αποτελεσµατική τεχνική για την µελέτη νουκλεϊκών οξέων (DNA, RNA) και από τότε εφαρµόζεται, επιπρόσθετα, στην µελέτη των πρωτεϊνών, των µεταβολιτών, των τοξινών, των ιών, ολόκληρων κυττάρων, ακόµα και στην µελέτη ιστών. Αν και το διάστηµα της ύπαρξης της τεχνολογίας των µικροσυστοιχιών θεωρείται σχετικά µικρό, όσον αφορά στην εξέλιξη της, έχει καταφέρει να αυξήσει όχι µόνο τον αριθµό των εφαρµογών της αλλά και την ταχύτητα µε την οποία εξελίσσεται. Αξίζει να σηµειωθεί ότι η βιβλιογραφία που σχετίζεται µε την τεχνολογία των µικροσυστοιχιών, από τα µέσα της δεκαετίας του 1990 και µετά, έχει αυξηθεί σηµαντικά. Η επιθυµία για την χαρτογράφηση του ανθρώπινου γονιδιώµατος (The Human Genome Mapping Project - HGMP), µια διεθνής επιστηµονική προσπάθεια που ξεκίνησε το 1990 και επιτυχώς ολοκληρώθηκε το 2003 µε τον εντοπισµό των περίπου γονιδίων του ανθρώπινου γονιδιώµατος, τόσο από φυσική όσο και από λειτουργική άποψη, είχε σαν αποτέλεσµα την ανάπτυξη υψηλής τεχνολογίας [1]. Από την τεχνολογία αυτή προέκυψαν σηµαντικά εργαλεία, χρήσιµα για την ανάλυση των µοριακών γενετικών γεγονότων. Τα εργαλεία αυτά άλλαξαν ριζικά τον τρόπο µε τον οποίο γίνεται κατανοητή πλέον η µοριακή συµπεριφορά και τα αποτελέσµατα της, ενώ συνέβαλαν στο µέγιστο στην δηµιουργία τεχνικών και µεθόδων που ως στόχο τους έχουν τόσο την αναγνώριση, ταυτοποίηση και διάγνωση ασθενειών (π.χ. 35
36 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών νεοπλασίες) όσο και την ανάπτυξη θεραπευτικών εφαρµογών για την αντιµετώπιση τους. 2.2 Βασικά στοιχεία βιολογίας Προκειµένου να γίνουν κατανοητές οι διάφορες διαδικασίες που λαµβάνουν χώρα κατά την διάρκεια ενός πειράµατος µικροσυστοιχιών, ακολουθεί η περιγραφή κάποιων βασικών στοιχείων βιολογίας, τα οποία θα βοηθήσουν στην κατανόηση των αποτελεσµάτων που προκύπτουν σε κάθε επιµέρους βήµα του πειράµατος και στην αξιολόγηση της φυσικής σηµασίας τους DNA Το DNA (δεοξυριβοζονουκλεϊνικό οξύ) είναι ένα νουκλεϊνικό οξύ που περιέχει τις γενετικές οδηγίες που χρησιµοποιούνται για την ανάπτυξη και τη λειτουργία όλων των γνωστών ζώντων οργανισµών και ορισµένων ιών. Ανήκει στα βιοµόρια του κυττάρου που είναι υπεύθυνα για την αποθήκευση και την αποκωδικοποίηση των γενετικών πληροφοριών και είναι εκείνο που φέρει τα γονίδια. Το DNA δοµείται από τέσσερα διαφορετικά µονοµερή, τα νουκλεοτίδια. Ένα νουκλεοτίδιο του DNA αποτελείται από δεοξυριβόζη, φωσφορικό οξύ και µια από τις ακόλουθες βάσεις: αδενίνη (Α), γουανίνη (G), κυτοσίνη (C) ή θυµίνη (Τ) [2]. Το 1953, ο James Watson και ο Francis Crick, βασιζόµενοι σε πειραµατικές διαδικασίες, κατέληξαν στο συµπέρασµα ότι τις περισσότερες φορές το DNA δεν απαντά ως µια πολυνουκλεοτιδική αλυσίδα, αλλά έχει την διαµόρφωση της διπλής έλικας ή του δίκλωνου µορίου [2]. υο πολυνουκλεοτιδικές αλυσίδες σχηµατίζουν µια διπλή έλικα, ενώ για σχηµατισθεί µια σταθερή ελικοειδής δοµή, θα πρέπει η αδενίνη της µιας αλυσίδας να ευθυγραµµίζεται µε τη θυµίνη της άλλης αλυσίδας και η γουανίνη της µιας µε την κυτοσίνη της άλλης (σχ. 2.1). Από όλους τους δυνατούς συνδυασµούς µόνο ο συνδυασµός A-T και G-C δηµιουργεί σταθερούς δεσµούς υδρογόνου, που έχουν τις σωστές διαστάσεις στο χώρο και που είναι κατάλληλοι για ένα δίκλωνο πολυνουκλεοτίδιο. Για αυτό το λόγο οι βάσεις A και T καθώς G και C λέγονται συµπληρωµατικές. 36
37 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Σχήµα 2.1: Η διπλή έλικα του DNA. Οι δυο αντιπαράλληλοι κλώνοι συγκρατούνται µεταξύ τους µε δεσµούς υδρογόνου που αναπτύσσονται µεταξύ αδενίνης (A) και θυµίνης (T) και µεταξύ κυτοσίνης (C) και γουανίνης (G) RNA Όπως το DNA έτσι και το RNA (ριβοζονουκλεϊκό οξύ) είναι εξίσου σηµαντικό για την αύξηση και τη λειτουργικότητα του κυττάρου [2]. Πρόκειται για ένα νουκλεϊκό οξύ, το οποίο επίσης δοµείται από νουκλεοτίδια. Τα νουκλεοτίδια του RNA συγκροτούνται από ριβόζη, φωσφορικό οξύ και τις βάσεις αδενίνη, γουανίνη, κυτοσίνη ή ουρακίλη (U). Η χηµική σύσταση των νουκλεοτιδίων του RNA διαφέρει από αυτή του DNA σε δύο σηµεία: το RNA περιέχει ριβόζη αντί για δεοξυριβόζη και ουρακίλη αντί για θυµίνη Σύγκριση RNA-DNA Εκτός από τις δοµικές διαφορές που παρατηρούνται στην συγκρότηση των νουκλεοτιδίων, υπάρχει µια ακόµη σηµαντική διαφορά [2]. Το RNA απαντά στα κύτταρα κυρίως ως µονόκλωνο, σε αντίθεση µε το DNA, που απαντά κυρίως ως δίκλωνο (σχ.2.2). Εξαίρεση αποτελεί το γονιδίωµα ορισµένων ιών, όπου το RNA απαντά ως δίκλωνο και το DNA ως µονόκλωνο. Το µονόκλωνο RNA, που συνιστά και την πρωτοδιάταξη του µορίου, συνήθως αναδιπλώνεται µερικώς στον χώρο έτσι 37
38 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών ώστε να ζευγαρώνουν οι βάσεις µε ανάλογο τρόπο όπως στο DNA (σχ.2.3). ηλαδή, ένα µόριο RNA µπορεί να έχει µια πολύ συγκεκριµένη δοµή µε πολλαπλές δίκλωνες περιοχές. Σχήµα 2.2: Το µονόκλωνο RNA και το δίκλωνο DNA. Σχήµα 2.3: Το µονόκλωνο RNA και η µορφή του µορίου στον χώρο. 38
39 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Η ροή της πληροφορίας από το γονικό κύτταρο στα θυγατρικά Η σταθερότητα της δοµής, της λειτουργίας και της εξειδίκευσης του κυττάρου υποδηλώνει ότι το κύτταρο διαθέτει προκαθορισµένες διαδικασίες, που επιτελούνται µε έναν ελεγχόµενο, αποδοτικό και κληρονοµούµενο τρόπο [2]. Το κύτταρο, δηλαδή, έχει οδηγίες που εξειδικεύουν τη δοµή και τις λειτουργίες του ενώ ταυτόχρονα ρυθµίζουν τις δραστηριότητες του. Σήµερα, είναι πλήρως κατανοητό ότι οι οδηγίες αυτές είναι αποθηκευµένες στο DNA, το γενετικό υλικό όλων των κυττάρων. Η ροή της πληροφορίας στο κύτταρο εκφράζεται µέσω δυο διακριτών διαδικασιών: α) της µεταγραφής (transcription) της πληροφορίας σε RNA (σύνθεση RNA) και β) της µετάφρασης της (translation) σε πρωτεΐνες (σύνθεση πρωτεϊνών) (σχ.2.4). Το RNA, που µεταφράζεται σε πρωτεΐνες ονοµάζεται RNA-µήνυµα (mrna), αποκωδικοποιείται από συγκεκριµένη αλληλουχία DNA (γονίδιο) ενώ χρησιµεύει για να κατευθύνει την σύνθεση των πρωτεϊνών στα ριβοσώµατα, τα οποία αποτελούν σηµαντικές δοµικές µονάδες του κυττάρου. Εκτός από το mrna, δυο επιπλέον κατηγορίες RNA απαιτούνται για την σύνθεση των πρωτεϊνών. Το ριβοσωµατικό RNA (rrna) που είναι αναπόσπαστο συστατικό των ριβοσωµάτων και το µεταφορικό RNA (trna) που αποκωδικοποιεί-µεταφράζει την αλληλουχία βάσεων του mrna, σε αλληλουχία αµινοξέων στις πρωτεΐνες. Τα βέλη στο σχήµα 2.4 δείχνουν την κατεύθυνση της πληροφορίας, ενώ το βέλος γύρω από το DNA δείχνει πως το ίδιο το DNA είναι το καλούπι για τον αυτοδιπλασιασµό του (replication) [2]. Το RNA, ορισµένες φορές, αντιγράφεται σε DNA αποκτώντας µε αυτή την αντίστροφη µεταγραφή (reverse transcription) ένα συµπληρωµατικό DNA (cdna). Το συµπληρωµατικό DNA, είναι ένα τεχνητό «προϊόν» που χρησιµοποιείται αντί του αυθεντικού DNA (γονιδιακό DNA) στα πειράµατα µικροσυστοιχιών. Αντίθετα, η µετάφραση του RNA σε πρωτεΐνες είναι πάντα µονόδροµη. Οι πρωτεΐνες είναι µεγάλες οργανικές ενώσεις αποτελούµενες από 20 διαφορετικά µονοµερή, τα αµινοξέα. Κάθε πρωτεΐνη έχει την δική της µοναδική αλληλουχία, η οποία καθορίζεται από την αλληλουχία των νουκλεοτιδίων του γονιδίου που κωδικοποιεί την πρωτεΐνη αυτή. Οι πρωτεΐνες παίζουν κυρίαρχο ρόλο µέσα στο κύτταρο, αφού είναι αυτές που φέρουν εις πέρας τις εργασίες που ορίζονται από τη κωδικοποιηµένη πληροφορία που υπάρχει στα γονίδια. 39
40 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Σχήµα 2.4: Σχηµατικό διάγραµµα των µετασχηµατισµών της πληροφορίας στο οποίο απεικονίζεται η πηγή της πληροφορίας και η µετασχηµατισµένη της µορφή PCR -Αλυσιδωτή Αντίδραση της Πολυµεράσης Η Αλυσιδωτή Αντίδραση της Πολυµεράσης PCR είναι µια εναλλακτική µέθοδος πολλαπλασιασµού ενός µορίου DNA. Αναπτύχθηκε το 1988 από τον Kary Mullis και έχει την ικανότητα, µέσα σε λίγες ώρες να πολλαπλασιάζει, επιλεκτικά, µακροµόρια DNA εκατοµµύρια φορές [2]. Βασικό χαρακτηριστικό της µεθόδου είναι το γεγονός ότι όλη διαδικασία γίνεται in-vitro (πείραµα που πραγµατοποιείται σε δοκιµαστικό σωλήνα ή γενικότερα υπό αυστηρά ελεγχόµενες συνθήκες εκτός των ζωντανών οργανισµών). Η πορεία του πολλαπλασιασµού πραγµατοποιείται σε τρία βήµατα (σχ.2.5): Ένα δείγµα DNA αναµειγνύεται µε τέσσερα δεοξυριβονουκλεοτίδια, τα οποία αποτελούν τις εκκινητήριες αλληλουχίες DNA και µια ειδική DNAπολυµεράση που έχει αποµονωθεί από βακτήρια θερµών πηγών και είναι δραστική σε θερµοκρασία µεγαλύτερη των 90 C. Το µίγµα θερµαίνεται στους C, οπότε το δίκλωνο DNA αποζευγαρώνεται (denaturation). Το µονόκλωνο DNA ονοµάζεται primer. Στη συνέχεια ψύχεται, οπότε οι εκκινητήριες αλληλουχίες του DNA υβριδοποιούνται (hybridization) στη 5 θέση και έτσι αρχίζει ο πολυµερισµός που οδηγεί στον σχηµατισµό των συµπληρωµατικών κλώνων του DNA προς τις δυο κατευθύνσεις. Όταν ολοκληρωθεί ο κύκλος, αυξάνεται και πάλι η θερµοκρασία, τα δίκλωνα DNA αποζευγαρώνονται, το µίγµα ψύχεται, υβριδοποιούνται οι εκκινητήριες αλληλουχίες και η DNA πολυµεράση αρχίζει ξανά τον πολυµερισµό κ.ο.κ. Ο κύκλος αυτός επαναλαµβάνεται συνέχεια, διπλασιάζοντας σε κάθε κύκλο την ποσότητα του DNA. 40
41 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Εξαιτίας των µεγάλων ποσοτήτων cdna που απαιτεί ένα πείραµα µικροσυστοιχίας, χρησιµοποιείται η διαδικασία PCR ενίσχυσης για την παραγωγή αυτής της κατάλληλης ποσότητας. Σχήµα 2.5: Επιλεκτική αντιγραφή DNA µε Αλυσιδωτή Αντίδραση της Πολυµεράσης. 2.3 Μικροσυστοιχίες Ένας από τους σηµαντικότερους στόχους της µοριακής βιολογίας, είναι η αποκωδικοποίηση των µηχανισµών που ρυθµίζουν την δραστηριότητα των γονιδίων. Η τεχνολογία των µικροσυστοιχιών λόγω της ικανότητας της να επεξεργάζεται ταυτόχρονα ένα πολύ µεγάλο αριθµό γονιδίων, προσέφερε καινούρια πληροφορία στους βιολόγους, µε την βοήθεια των οποίων µελετάται η συστηµατοποίηση των γονιδίων Μέτρηση της γονιδιακής έκφρασης Οι πληροφορίες που διατίθενται από το HGMP (Human Genome Mapping Project), η ανάπτυξη του µέσου επιλογής της αλληλουχίας των υπό εξέταση γονιδίων από τους βιολόγους (EST-Expressed Sequence Tag), καθώς και µια πληθώρα άλλων 41
42 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών πληροφοριακών γονιδιακών βάσεων και βιοπληροφορικής, βοήθησαν στο να δηµιουργηθούν πολλαπλές, αξιόπιστες και χαµηλού κόστους µέθοδοι ανάλυσης της γονιδιακής έκφρασης (gene expression analysis). Στη Γενετική, µε τον όρο γονιδιακή έκφραση χαρακτηρίζεται η διαδικασία εκείνη που προκαλεί τη µεταφορά κωδικοποιηµένων πληροφοριών του γονιδίου στο λειτουργικό προϊόν του γονιδίου (πρωτεΐνη ή RNA). Γενικά, η γονιδιακή έκφραση χαρακτηρίζει την διαδικασία της µεταγραφής και της µετάφρασης. Στη περίπτωση, όµως, που το προϊόν είναι µόνο RNA τότε εµπλέκεται µόνο η µεταγραφή. Παραδοσιακά, η ανάλυση της γονιδιακής έκφρασης γινόταν σε κάθε γονίδιο χωριστά, χρησιµοποιώντας τεχνικές, όπως η Northern blot ανάλυση ή ο αφαιρετικός υβριδισµός (subtractive hybridization) ο οποίος είναι χρήσιµος για σπάνια γονίδια ή τεχνικές διαφορικής έκθεσης (differential display) ικανές να διακρίνουν αλλαγές στην γονιδιακή έκφραση µε στόχο την αναγνώριση αγνώστων ή µη προσδιορισµένων γονιδίων. Παρά το γεγονός ότι οι τεχνικές αυτές είναι αρκετά ισχυρές, µειονεκτούν λόγω του µικρού αριθµού δειγµάτων που µπορούν να διαχειριστούν. Η ανάπτυξη της τεχνολογίας των µικροσυστοιχιών έφερε λύση στο πρόβληµα της επεξεργασίας µικρού αριθµού δειγµάτων αφού σε ένα και µόνο πείραµα µικροσυστοιχίας µπορεί να µετρηθεί η γονιδιακή έκφραση χιλιάδων διαφορετικών γονιδίων ταυτόχρονα. Οι µικροσυστοιχίες είναι µικροσκοπικές διατεταγµένες σειρές νουκλεϊκών οξέων, αποτελούµενες από διαφορετικά γονίδια τοποθετηµένα σε προκαθορισµένες θέσεις σε ένα στερεό υπόστρωµα. Λόγω του τρόπου κατασκευής των µικροσυστοιχιών, καθίσταται εφικτή η ταυτόχρονη µέτρηση της έκφρασης χιλιάδων γονιδίων. Εφαρµόζοντας την µεθοδολογία του ειδικού υβριδισµού σε κλινικά δείγµατα, µπορεί να ληφθούν συγκεκριµένες πληροφορίες για την παθογένεια µιας ασθένειας, οµαδοποιώντας τες σε λογικές και λειτουργικές κατηγορίες της έκφρασης του γονιδιώµατος. Τα δυο κύρια υποστρώµατα DNA που συναντώνται στην κατασκευή υψηλής πυκνότητας µικροσυστοιχιών, στα οποία συνήθως περιέχονται περισσότεροι από ξεχωριστοί κλώνοι, είναι οι cdna µικροσυστοιχίες και τα gene chips. Οι πρώτες αφορούν στην ροµποτική σήµανση µορίων DNA πάνω σε ένα κατάλληλο συµπαγές υπόστρωµα, όπως είναι το γυαλί ενώ τα gene chips αφορούν στην in-situ 42
43 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών (η µελέτη ενός βιολογικού φαινοµένου ακριβώς στο µέρος όπου εµφανίζεται χωρίς να αποµακρυνθούν οι χηµικές αλληλεπιδρώσες ή οι βιολογικοί οργανισµοί σε κάποιο ειδικό µέσο) σύνθεση οµάδων ολιγονουκλεοτιδίων πάνω σε ένα παρόµοιο υπόστρωµα µέσω µιας φωτολιθογραφικής διαδικασίας (in-situ light directed combinatorial synthesis) ή µέσω συµβατικής σύνθεσης που ακολουθείται από την καθήλωση σε υπόστρωµα. Τόσο το DNA όσο και οι συστοιχίες ολιγονουκλεοτιδίων υπόκεινται υβριδισµό µε φθορίζον-σηµασµένο cdna Πείραµα µικροσυστοιχιών Όπως προαναφέρθηκε, ένα σύστηµα µικροσυστοιχιών αποτελείται από συγκεκριµένες αλληλουχίες γονιδίων τοποθετηµένες σε ένα συµπαγές υπόστρωµα (chip από γυαλί, πλαστικό, σιλικόνη, µεµβράνη χρυσού, γέλη πολυακρυλαµίδης, φιλµ πολυπυρρόλης, chip από κεραµικό, κ.α.). Οι αλληλουχίες αυτές συνδέονται πάνω στο υπόστρωµα είτε απευθείας (ολιγονουκλεοτίδια) είτε χηµικά µετά από ροµποτική σήµανση (π.χ. microspotting, φωτολοθογραφικές τεχνικές, εκτυπωτές έγχυσης µελάνης). Στην συνέχεια, υποβάλλονται σε υβριδισµό µε αντίγραφα νουκλεϊνικών οξέων από βιολογικά δείγµατα. Όσο µεγαλύτερη είναι η έκφραση ενός γονιδίου τόσο περισσότερη είναι η ποσότητα του σηµασµένου στόχου και κατά συνέπεια τόσο πιο έντονη η παρουσία της έκφρασης του γονιδίου [1] cdna µικροσυστοιχίες Οι cdna µικροσυστοιχίες µπορούν να προσδιορίσουν την παρουσία µόνο µιας συγκεκριµένης αλληλουχίας γονιδίων σε ένα δείγµα. Εν τούτοις, χρησιµοποιούνται ευρέως µια και προσφέρουν τη δυνατότητα διάκρισης διαφορών στη γονιδιακή έκφραση µεταξύ δυο διαφορετικών δειγµάτων [1]. Για παράδειγµα, στο σχήµα 2.6(α) δύο δείγµατα σηµαίνονται µε δυο διαφορετικές φθορίζουσες βαφές: πράσινο (Cy3) και κόκκινο (Cy5), ένα δείγµα ελέγχου και ένα δείγµα αναφοράς, αντίστοιχα. Στην συνέχεια, χρησιµοποιείται ένα σχήµα διάκρισης διπλού χρώµατος που επιτρέπει την ταχεία και ταυτόχρονη διαφορική ανάλυση έκφρασης δύο ξεχωριστών βιολογικών δειγµάτων. 43
44 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Μικροσυστοιχίες ολιγονουκλεοτιδίων Αν και αρχικά οι µικροσυστοιχίες ολιγονουκλεοτιδίων αναπτύχθηκαν για ανάλυση µεταλλάξεων κατάφεραν, στην συνέχεια, να τροποποιηθούν έτσι ώστε να πραγµατοποιούνται, µε την χρήση τους, µετρήσεις έκφρασης [1]. Οι µικροσυστοιχίες αυτές, κατασκευάζονται από αλληλουχίες µεταξύ 20 και 60 νουκλεοτιδίων. Συνήθως χρησιµοποιούνται για την ανάλυση ξεχωριστών δειγµάτων και για αυτό γίνεται µονή σήµανση (ραδιενεργός ή φθορίζουσα) των βιολογικών δειγµάτων, όπως σχηµατικά δείχνεται στο σχ.2.6(β). Στη συνέχεια ακολουθεί συγκέντρωση των δεδοµένων, αποκοµιδή, διαχείριση και διαχωρισµός, είτε για να προσδιοριστεί η άµεση ποσοτική έκφραση είτε για να διακριθεί η διαφορετική έκφραση γονιδίων από δύο ξεχωριστά δείγµατα. (α) (β) Σχήµα 2.6 : (α) Κατασκευή µικροσυστοιχιών ολιγονουκλεοτιδίων, (β) Κατασκευή cdna µικροσυστοιχιών Μικροσυστοιχίες πρωτεϊνών Σήµερα, η ανάλυση ολόκληρων βιολογικών συστηµάτων είναι εφικτή χάρις στις αναπτυσσόµενες τεχνολογίες που επιτρέπουν την ευρεία ανάλυση της γονιδιακής έκφρασης [1]. Η πρωτεοµική επιτρέπει την ολική ανάλυση πρωτεϊνικής έκφρασης, συµπεριλαµβανοµένων πιθανών µετα-µεταφραστικών τροποποιήσεων, επιτρέποντας έτσι την συσχέτιση µεταξύ γονιδιακής αλληλουχίας, πρωτεϊνικής έκφρασης, 44
45 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών αλληλεπιδράσεων πρωτεΐνης µε πρωτεΐνη και πρωτεΐνης µε DNA/RNA, καθώς και τον φαινοτυπικό προσδιορισµό κυττάρων και ιστών. Η ταυτοποίηση και ο ποσοτικός προσδιορισµός των λειτουργικά εκφραζόµενων πρωτεϊνών αποτελεί µια σηµαντική πρόκληση στο πεδίο της βιολογίας. Οι µικροσυστοιχίες πρωτεϊνών έχουν εφαρµοστεί σε µελέτες λειτουργικής ανάλυσης πρωτεϊνών, διαχωρισµού αντισωµάτων και επανασυνδυασµένων πρωτεϊνών, ανακάλυψης πρωτεϊνών που εµπλέκονται σε διαδικασίες νόσου ή αποτελούν δυνητικούς φαρµακευτικούς στόχους, καθώς και στην ταχεία διάκριση και διάγνωση ασθενειών. Οι παραδοσιακές µέθοδοι ηλεκτροφόρησης (zymograms, Western blots, 2D ηλεκτροφόρηση και ανοσοϊστοχηµεία) αν και θεωρούνται αργές και πολύπλοκες, χρησιµοποιούνται ακόµη σήµερα, για την επιβεβαίωση των αποτελεσµάτων των µικροσυστοιχιών πρωτεϊνών Μικροσυστοιχίες ιστών Μια επιπλέον εφαρµογή των µικροσυστοιχιών πρωτεϊνών είναι η ανάπτυξη των µικροσυστοιχιών ιστών (tissue microarrays) [1]. Οι µικροσυστοιχίες αυτές αποτελούνται από µερικές εκατοντάδες δείγµατα ιστών, τοποθετηµένα σε ένα µόνο υπόστρωµα. Η µέθοδος χρησιµοποιείται κυρίως σε δείγµατα που προέρχονται από βιοψίες βελόνας Κλινικές εφαρµογές Η τεχνολογία των DNA µικροσυστοιχιών µπορεί να εφαρµοστεί [1]: Στην κατανόηση των γενετικών ανωµαλιών γονιδιακής έκφρασης που οδηγούν ή συµβάλλουν στη διαδικασία της νεοπλασίας. Στην ανακάλυψη νέων διαγνωστικών και προγνωστικών δεικτών. Στην ταυτοποίηση και επιβεβαίωση της εγκυρότητας µοριακών στόχων. Στην ανάπτυξη και παραγωγή νέων φαρµάκων. Στην ταυτοποίηση και τελειοποίηση της δοµικής δραστικότητας καθώς και στην αξιολόγηση πρωτεϊνών. 45
46 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών Στην πρόληψη παρενεργειών και τοξικότητας ουσιών και φαρµάκων. Στην αναγνώριση και ταυτοποίηση γονιδίων που εµπλέκονται στην φαρµακευτική αντίσταση και ευαισθησία. Στην αναγνώριση υπο-οµάδων ασθενών που θα επωφεληθούν από συγκεκριµένες επιλεγµένες θεραπείες. 46
47 Κεφάλαιο 2: Εισαγωγή στην τεχνολογία των µικροσυστοιχιών 2.4 Αναφορές 2 ου κεφαλαίου [1] Samuel Murray, Σελίδες Μοριακής Ογκολογίας/Γενετικής, Η τεχνολογία των «µικροδιατάξεων» (microarrays) και εφαρµογές στην Ογκολογία, [2] Βασίλης Μαρµαράς, Μαρία Λαµπροπούλου-Μαρµαρά, Βιολογία κυττάρου- µοριακή προσέγγιση, εκδόσεις Typorama,
48 48
49 Κεφάλαιο 3 Επεξεργασία εικόνας µικροσυστοιχίας
50 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας 50
51 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας 3.1 Εισαγωγή Οι εικόνες καταγράφουν και αναπαριστούν οπτικές πληροφορίες. Στον χώρο των επιστηµών, ένας ερευνητής επεξεργάζεται µια εικόνα όταν θέλει να εξετάσει τις ιδιότητες των αντικειµένων που απεικονίζονται σε αυτή. Στόχος της ανάλυσης εικόνας είναι η εξαγωγή και η ποσοτικοποίηση των ιδιοτήτων των υπό εξέταση αντικειµένων. Τυπικά παραδείγµατα επεξεργασίας εικόνας εκτελούµενα από υπολογιστικά συστήµατα είναι: η οπτική αναγνώριση χαρακτήρων, ο προσδιορισµός θέσης, η αναγνώριση και η εύρεση χωρικών σχέσεων αντικειµένων, ο ποιοτικός έλεγχος επιφανειών, η βελτίωση της ποιότητας εικόνας, η εξαγωγή σηµασιολογικής πληροφορίας κ.α. [1]. Τα κύρια προβλήµατα που συναντώνται κατά την επεξεργασία της ψηφιακής εικόνας και για τα οποία απαιτείται η κατασκευή µεθόδων ψηφιακής επεξεργασίας των εικόνων αυτών, συνοψίζονται στις εξής κατηγορίες: Αναπαράσταση (representation) της ψηφιακής εικόνας Ενίσχυση (enhancement) της ψηφιακής εικόνας Αποκατάσταση (restoration) της ψηφιακής εικόνας Ανάλυση της ψηφιακής εικόνας Συµπίεση (compression) των δεδοµένων της ψηφιακής εικόνας. Με την διαδικασία της ενίσχυσης επιτυγχάνεται βελτίωση της ποιότητας της εικόνας (π.χ. αυξάνοντας την αντίθεση) ενώ η εφαρµογή της, συνήθως, πραγµατοποιείται στα πρώτα στάδια της επεξεργασίας της εικόνας. Η αποκατάσταση της εικόνας ή διαφορετικά η αποθορυβοποίηση της, συνίσταται από την αφαίρεση ατελειών ή ανεπιθύµητων στοιχείων που ενώ αποτελούν στοιχεία της εικόνας δεν περιέχουν πληροφορία που συσχετίζεται µε το ή τα αντικείµενα που απεικονίζονται σε αυτήν και για το λόγο αυτό θεωρούνται συνιστώσες θορύβου. Η διαδικασία της κατάτµησης χωρίζει την εικόνα σε διαφορετικές και συνήθως µη επικαλυπτόµενες περιοχές ταξινοµώντας το περιεχόµενο της εικόνας σε κατηγορίες, βασιζόµενη σε ορισµένα χαρακτηριστικά, όπως είναι η φωτεινότητα, το χρώµα, κ.α. Η κατάτµηση µιας εικόνας είναι ένα από τα δυσκολότερα προβλήµατα που αντιµετωπίζει, συνήθως, ο 51
52 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας ερευνητής που κατασκευάζει µεθόδους ψηφιακής επεξεργασίας εικόνας. Τέλος, µε την εξαγωγή παραµέτρων προσδιορίζονται και περιγράφονται χαρακτηριστικά της εικόνας, όπως είναι διάφορες περιοχές µέσα στην εικόνα, όρια αντικειµένων, γωνίες, συγκεκριµένα γεωµετρικά σχήµατα, πρόσωπα ανθρώπων, αυτοκίνητα, αεροπλάνα ή οποιοδήποτε άλλο αντικείµενο είναι υπό εξέταση και στο πεδίο ενδιαφέροντος της έρευνας [1]. Κατά την διάρκεια της ανάλυσης της εικόνας, προκειµένου να εξαχθούν συµπεράσµατα και να ποσοτικοποιηθούν οι παράµετροι που χαρακτηρίζουν τα υπό εξέταση αντικείµενα, χρησιµοποιούνται διάφορες στατιστικές µέθοδοι και διαδικασίες που ενισχύουν την εικόνα, την χωρίζουν σε διαφορετικές περιοχές βάσει ορισµένων χαρακτηριστικών και εξάγουν τα χαρακτηριστικά και το υπόβαθρο της. Συνήθως, οι πληροφορίες που σχετίζονται µε τις παραµέτρους που χαρακτηρίζουν τα υπό εξέταση αντικείµενα στην εικόνα, καταγράφονται έµµεσα σε αυτή και οι δυσκολίες στην ποσοτικοποίηση τους οφείλονται ως επί το πλείστον στην παρουσία του θορύβου, την οπτική γωνία καταγραφής του αντικειµένου, την ευκαµψία του υλικού, το είδος του φωτισµού κ.α. Κατά συνέπεια, εκτός από την ποσοτικοποίηση των παραµέτρων, σε πολλές εφαρµογές στην ιατρική, στην µηχανική ή και σε άλλες επιστήµες, θεωρείται απαραίτητο όχι µόνο να µετρώνται οι παράµετροι αλλά επιπλέον να προσδιορίζεται η ορθότητα και η ακρίβεια των µετρήσεων αυτών [1] Επεξεργασία εικόνων µικροσυστοιχίας Ο βασικός στόχος της επεξεργασίας των εικόνων µικροσυστοιχίας είναι η µέτρηση των εντάσεων φωτεινότητας των τοποθετηµένων σε σειρά spot και η αντιστοίχιση τους µε το επίπεδο της γονιδιακής έκφρασης του κάθε spot. Είναι προφανές ότι η σηµασία µιας αξιόπιστης επεξεργασίας εικόνων µικροσυστοιχίας συνίσταται στην µεγάλη επίδραση που έχει αυτή η εργασία στις διαδικασίες που έπονται: στην ταξινόµηση και στην αναγνώριση διαφορικά εκφρασµένων γονιδίων. Σε µια πιο εξεζητηµένη και ολοκληρωµένη προσέγγιση του προβλήµατος, η επεξεργασία των εικόνων µικροσυστοιχίας θα αποτιµήσει την αξιοπιστία των υπολογιζόµενων δεδοµένων και θα προειδοποιήσει για πιθανά προβλήµατα που τυχόν προέκυψαν κατά την διάρκεια του πειράµατος µικροσυστοιχιών [1]. 52
53 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Η επεξεργασία των εικόνων µικροσυστοιχίας είναι µια διαδικασία τριών βηµάτων : της διευθυνσιοδότησης (addressing ή gridding), της κατάτµησης της εικόνας (segmentation) και της εξαγωγής της έντασης των spot (intensity extraction). Κατά το πρώτο βήµα ανατίθενται συντεταγµένες σε κάθε spot. Ο αυτοµατισµός αυτής της υπο-διαδικασίας επιτρέπει µεγάλη απόδοση στην ανάλυση των δεδοµένων. Με την κατάτµηση της εικόνας ταξινοµούνται τα εικονοστοιχεία είτε ως εικονοστοιχεία spot (foreground) τα οποία περιέχουν τις αναζητούµενες πληροφορίες, είτε ως εικονοστοιχεία υποβάθρου (background). Τέλος, στο τρίτο βήµα πραγµατοποιούνται υπολογισµοί για κάθε ένα spot, τόσο για την κόκκινη όσο και για την πράσινη ένταση φθορισµού (R,G), για την ένταση φωτεινότητας του προσκηνίου και πιθανώς κάποιοι υπολογισµοί για την ποιότητα αυτών των µετρήσεων [1]. Η εκτίµηση της έντασης φωτεινότητας του υποβάθρου θεωρείται απαραίτητη όσον αφορά στην διόρθωση της. Το κίνητρο για την εργασία αυτή έγκειται στο γεγονός ότι η ένταση φθορισµού ενός οποιουδήποτε spot περιλαµβάνει επιπλέον και µια συνεισφορά στην τιµή η οποία δεν οφείλεται στον υβριδισµό των mrna δειγµάτων στo συγκεκριµένοo spot. Η διόρθωση φωτεινότητας του υποβάθρου, συνήθως γίνεται µε την αφαίρεση της έντασης φωτεινότητας του τοπικού υποβάθρου από τις τιµές της έντασης του κόκκινου και του πράσινου του αντίστοιχου κάθε φορά spot. Με τον τρόπο αυτό επιτυγχάνεται αύξηση της ακρίβειας και µείωση του σφάλµατος δείγµατος. Τα αποτελέσµατα που αφορούν στην ποιότητα των spot περιλαµβάνουν ακόµη µέτρηση του µεγέθους του spot ή του σχήµατός του ή µέτρηση της έντασης φωτεινότητας του υποβάθρου σε σχέση µε την ένταση φωτεινότητας των εικονοστοιχείων του spot [1]. Το αντικείµενο της παρούσας διδακτορικής διατριβής αφορά στην αντιµετώπιση κάποιων από τα πιο σηµαντικά προβλήµατα που συναντώνται κατά την ψηφιακή επεξεργασία των εικόνων µικροσυστοιχίας (αφαίρεση θορύβου, κατάτµησης των µικροσυστοιχιών) αλλά και σε ένα επιπλέον πρόβληµα που ανήκει στην προεπεξεργασία της ανάλυσης των µικροσυστοιχιών και η επίλυση του οποίου βοηθά 53
54 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας δραστικά στην αποδοτικότερη εφαρµογή των µεθόδων αντιµετώπισης των πιο γνωστών προβληµάτων σε εικόνες µικροσυστοιχίας. 3.2 ηµιουργία cdna εικόνας µικροσυστοιχίας Σε µια τυπική µικροσυστοιχία πάνω από δέκα χιλιάδες διαφορετικές ακολουθίες cdna τοποθετούνται σε συµπαγές υπόστρωµα (π.χ. γυαλί) δηµιουργώντας ένα DNA chip. Όταν ένα διάλυµα από φθορίζουσες προσδιοριζόµενες DNA ακολουθίες προστίθεται στο chip, λαµβάνει χώρα φθορισµός στα spot όπου παρατηρείται γονιδιακή δραστηριότητα. Το τελικό αποτέλεσµα ενός πειράµατος µικροσυστοιχίας είναι η δηµιουργία µιας ψηφιακής εικόνας µικροσυστοιχίας. Οι πληροφορίες που προσδιορίζονται από το πείραµα προέρχονται αποκλειστικά και µόνο από τις µετρούµενες εντάσεις φωτεινότητας στο κάθε spot. Μια σειρά οργάνων, συµπεριλαµβανοµένων ενός σαρωτή και µιας CCD κάµερας, δηµιουργούν τις ψηφιακές εικόνες µικροσυστοιχίας. Ο σαρωτής µικροσυστοιχίας εκτελεί σάρωση της περιοχής ενός DNA chip και παράγει για κάθε χρώµα (κόκκινοπράσινο) ένα ψηφιακό χάρτη, δηλαδή µια εικόνα των εντάσεων φθορισµού. Στο σχήµα 3.1 περιγράφεται σχηµατικά ο τρόπος µε τον οποίο η πληροφορία των φθοριζόντων µορίων µετατρέπεται σε ψηφιακό σήµα [2]. DNA chip φθορίζοντα µόρια Laser Φωτόνια φθορισµού Φωτοπολλαπλασιαστής σωλήνα Ηλεκτρόνια Μετατροπέας σήµατος A/D Ψηφιακό σήµα διέγερση ενίσχυση Σχήµα 3.1: Σχηµατική διάταξη των διαδικασιών που πραγµατοποιούνται για την ψηφιακή απεικόνιση ενός chip. Ένας τυπικός σαρωτής laser (σχ.3.2) µικροσυστοιχιών εφαρµόζει τις ακόλουθες διαδικασίες προκειµένου να παραχθεί η ψηφιακή εικόνα: διέγερση, συλλογή της εκπεµπόµενης ακτινοβολίας, χωρική διευθυνσιοδότηση, διέγερση/εκποµπή διάκρισης και τέλος ανίχνευση. Η περιοχή που σαρώνεται χωρίζεται σε ισοµεγέθη εικονοστοιχεία και το laser παράγει ακτινοβολία διέγερσης εστιάζοντας σε ένα µικρό τµήµα του συµπαγούς υποβάθρου πάνω στο οποίο πραγµατοποιείται η διαδικασία. Τα 54
55 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας φθορίζοντα µόρια αυτής της περιοχής απορροφούν τα προερχόµενα από το laser φωτόνια διέγερσης και εκπέµπουν φωτόνια φθορισµού. Τα φωτόνια αυτά, µη έχοντας συγκεκριµένη κατεύθυνση διαχέονται στο χώρο και κατά συνέπεια ένα µόνο µέρος αυτών συγκεντρώνεται από τους φακούς, όπως φαίνεται στο σχήµα 3.2. Κατά την διάρκεια του πειράµατος, το ενδιαφέρον εστιάζεται µόνο στον αριθµό των εκπεµπόµενων φωτονίων φθορισµού, τα οποία είναι πολύ λιγότερα από αυτά που πραγµατικά εκπέµπονται από την διέγερση των φθοριζόντων µορίων. Με στόχο την αποτροπή της ανίχνευσης ενός µεγάλου ποσοστού ακτινοβολίας διέγερσης, γεγονός που θα αλλοίωνε τα αποτελέσµατα, τοποθετείται µπροστά από τον ανιχνευτή ένας διχρωϊκός διαχωριστής φωτονίων και ένα ζωνοδιαβατό φίλτρο για να επιτευχθεί ο διαχωρισµός των φωτονίων διέγερσης και εκποµπής. Καθώς η ακτινοβολία διέγερσης έχει συνήθως µικρότερο µήκος κύµατος από την ακτινοβολία εκποµπής, ο διαχωρισµός αυτός καθίσταται εφικτός µε την κατάλληλη επιλογή οπτικών φίλτρων [2]. Ο ανιχνευτής του σαρωτή µετατρέπει την ακτινοβολία των εκπεµπόµενων φωτονίων σε ηλεκτρικό ρεύµα. Ένας κοινός τύπος ανιχνευτή είναι ο φωτοπολλαπλασιαστής σωλήνα (PhotoMultiplier Tube PMT). Ο PMT µετατρέπει κάθε φωτόνιο σε έναν αριθµό ηλεκτρονίων (έως και ένα εκατοµµύριο ανά φωτόνιο). Το ποσό της ενίσχυσης ρυθµίζεται µεταβάλλοντας την τάση εισόδου του PMT. Τελικά, µε την χρήση ενός µετατροπέα σήµατος από αναλογικό σε ψηφιακό, τα ηλεκτρόνια µετατρέπονται σε µια ακολουθία ψηφιακών σηµάτων [2] Ιδιότητες ψηφιακής εικόνας µικροσυστοιχίας Η ψηφιακή εικόνα µικροσυστοιχίας συνίσταται από έναν πίνακα οµοιόµορφα τοποθετηµένων οµάδων spot (blocks), όπως φαίνεται στο σχήµα 3.3. Οι οµάδες αυτές, που περιέχουν οµοιόµορφα τοποθετηµένα spot, ονοµάζονται υποµικροσυστοιχίες και αποτελούνται από ένα ορισµένο αριθµό γραµµών και στηλών spot, όχι απαραίτητα τον ίδιο. Τα spot σε κάθε υποµικροσυστοιχία τοποθετούνται σε σχετικά ίσες αποστάσεις το ένα από το άλλο. Κάθε ένα από αυτά τα spot έχει, συνήθως, κυκλικό σχήµα αν και µερικά παρουσιάζουν αποκλίσεις από το ιδανικό κυκλικό σχήµα εξαιτίας πειραµατικών λαθών κατά την διαδικασία τοποθέτησης των 55
56 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας spot. Σε γενικές γραµµές, παρατηρούνται σηµαντικές διακυµάνσεις σε όλη την εικόνα, τόσο στο σχήµα όσο και στο µέγεθος των spot. Σχήµα 3.2: Σχηµατικό διάγραµµα ενός τυπικού σαρωτή πειραµάτων µικροσυστοιχιών. Μια ιδανική εικόνα µικροσυστοιχίας έχει τις ακόλουθες ιδιότητες [3]: 1. το µέγεθος των υποµικροσυστοιχιών είναι το ίδιο, 2. το διάστηµα µεταξύ των υποµικροσυστοιχιών είναι οµοιόµορφο, 3. η τοποθέτηση των spot σε ισαπέχουσες αποστάσεις, στα σηµεία τοµής των ευθειών ενός πλέγµατος δηλαδή των γραµµών της µικροσυστοιχίας, 4. το µέγεθος και το σχήµα των spot είναι κυκλικό και ίδιο για όλα τα spot, 5. η θέση του πλέγµατος είναι σταθερή στις εικόνες µικροσυστοιχίας για δεδοµένο τύπο chip, 6. δεν υπάρχει σκόνη ή κανενός άλλου είδους θόρυβος στο συµπαγές υπόστρωµα όπου πραγµατοποιείται η διαδικασία και 7. η φωτεινότητα του υποστρώµατος είναι ελάχιστη και οµοιόµορφη σε όλη την εικόνα. Για την αξιολόγηση µεθόδων επεξεργασίας και εξαγωγής πληροφορίας από µικροσυστοιχίες πολλές φορές χρησιµοποιούνται προσοµοίωση των εικόνων 56
57 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας µικροσυστοιχίας η οποία µπορεί να οδηγήσει στην παραγωγή µεγάλων ποσοτήτων δεδοµένων µε πολύ χαµηλό κόστος σε αντίθεση µε τις πραγµατικές εικόνες οι οποίες έχουν υψηλότερο κόστος κατασκευής και εξαιρετικά υψηλό κόστος χειροκίνητης κατάτµησης και χαρακτηρισµού, απαιτώντας προσωπικό µε υψηλή εξειδίκευση και εµπειρία. Εν τούτοις, στο διαδίκτυο υπάρχουν διαθέσιµες πραγµατικές βάσεις δεδοµένων που χρησιµοποιούνται ευρύτατα στην αξιολόγηση αλγορίθµων επεξεργασίας µικροσυστοιχιών. Συνεπώς, οι σηµαντικότεροι λόγοι χρήσης εικόνων προσοµοίωσης πηγάζει επιπλέον από τα παρακάτω γεγονότα: (α) δυσκολία απόκτησης µια φυσικής εικόνας µε ταυτοποιηµένες τις θέσεις των spot, λόγω της πολυπλοκότητας της δηµιουργίας µιας µικροσυστοιχίας, ώστε να µπορεί να χρησιµοποιηθεί σαν κριτήριο αξιολόγησης διαφόρων µεθόδων αφαίρεσης θορύβου και κατάτµησης και (β) υψηλό κόστος κατασκευής ενός µεγάλου αριθµού σηµατοδοτηµένων πειραµάτων µε στόχο να παρέχουν ασφαλή στατιστικά κριτήρια για την αξιοπιστία των αλγορίθµων που εφαρµόζονται. Με τις κατάλληλες προσοµοιώσεις, επιπλέον, µπορεί να παρέχεται βαθιά γνώση σχετικά µε την επίδραση που έχουν διάφοροι εξωγενείς παράγοντες στην διαδικασία της απόκτησης µιας εικόνας µικροσυστοιχίας και στην ακρίβεια των τελικών βιολογικών συµπερασµάτων. Ωστόσο, ενώ οι προσοµοιώσεις βοηθούν σηµαντικά στην κατανόηση αρκετών προβληµάτων, πρέπει τα αποτελέσµατα τους να πιστοποιούνται και από πραγµατικές εικόνες [5]. Υποµικροσυστοιχία Εικόνα µικροσυστοιχίας Σχήµα 3.3: Τυπικό παράδειγµα εικόνας µικροσυστοιχίας αποτελούµενη από 48 υποµικροσυστοιχίες [4]. 57
58 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Σε µια πραγµατική εικόνα µικροσυστοιχίας καµία από τις ιδιότητες της ιδανικής εικόνας δεν ικανοποιείται πλήρως, εξαιτίας της φύσης του πειράµατος µικροσυστοιχίας. Κατά την πραγµατοποίηση του, λαµβάνουν χώρα διαδικασίες που αναπόφευκτα οδηγούν στην δηµιουργία θορύβου στα παραγόµενα δεδοµένα. 3.3 Σφάλµατα κατά την δηµιουργία εικόνας µικροσυστοιχίας Η cdna τεχνολογία είναι µια ηλεκτρο-οπτικο-χηµική διαδικασία η οποία επηρεάζεται, συστηµατικά, από ένα µεγάλο και τυχαίο αριθµό παραγόντων. Επειδή είναι δύσκολο να εκτιµηθεί µε ακρίβεια ο αριθµός των παραγόντων και η βαρύτητα των σφαλµάτων που εισάγουν στις τιµές φωτεινότητας φθορισµού, ακολουθεί συνοπτική περιγραφή ορισµένων αλλά σηµαντικών πηγών σφαλµάτων που συναντώνται στην εικόνα µικροσυστοιχίας. Οι µεταβολές αυτές παρατηρούνται τόσο στα spot όσο και στο υπόβαθρο της εικόνας αλλά και στις µετρήσεις των εντάσεων των spot που περιέχουν την χρήσιµη πληροφορία. Είναι σηµαντικό να τονιστεί το γεγονός των διαφορετικών σφαλµάτων που υπεισέρχονται στις υποµικροσυστοιχίες ακόµη και σε υποµικροσυστοιχίες που ανήκουν στην ίδια µικροσυστοιχία. Η ποικιλία των λαθών που συναντώνται στις υποµικροσυστοιχίες οδηγεί αναγκαστικά στην επιµέρους αντιµετώπιση τους και όχι στην συνολική διόρθωση της µικροσυστοιχίας στην οποία ανήκουν Σφάλµατα που αφορούν στα χρωµατικά κανάλια της εικόνας Ένα σφάλµα που υπεισέρχεται στα κανάλια χρώµατος (κόκκινο-πράσινο) της εικόνας µικροσυστοιχίας αφορά στο πρωτόκολλο της αποθήκευσης του αρχείου καθώς επίσης στην συµπίεση και στην ακρίβεια (αριθµός bytes/pixel) των δεδοµένων. Παραδείγµατος χάριν, ένα πρωτόκολλο αποθήκευσης αρχείου µε απώλεια πληροφορίας κατά την συµπίεση εισάγει συνήθως ανεπιθύµητη χωρική «θολούρα» στα spot και η ανάλυση της εικόνας µικροσυστοιχίας γίνεται λιγότερο ακριβής [5]. 58
59 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Σφάλµατα που αφορούν στην γεωµετρία του πλέγµατος της εικόνας Η µη σωστή προετοιµασία του chip µικροσυστοιχίας είναι η βασική αιτία των σφαλµάτων που αφορούν στην γεωµετρία του πλέγµατος. Αν µια µηχανή τοποθέτησης των spot πάνω στο γυαλί (π.χ. ροµπότ) χρησιµοποιηθεί αρκετές φορές θα προκληθεί, αναπόφευκτα µε την παρατεταµένη χρήση, µια απόκλιση στην ευθυγράµµιση της ακίδας εναπόθεσης των spot. Το αποτέλεσµα της προσπάθειας εύρεσης των spot µε χρήση πρότυπης µάσκας θα οδηγήσει στην συνέχεια, (α) σε ανακριβή αποτελέσµατα και (β) σε αύξηση του κόστους του πειράµατος µικροσυστοιχίας προκειµένου να κατασκευαστούν διαφορετικές µάσκες που θα προσαρµόζονται στην κάθε περίπτωση. Ένα παράδειγµα αυτής της ανακολουθίας φαίνεται στο σχήµα 3.4. Κατά τον ίδιο τρόπο, οποιαδήποτε περιστροφική µετακίνηση του chip ή των ακίδων εναπόθεσης των spot θα προκαλέσει αλλαγή στην ευθυγράµµιση του πλέγµατος ως προς τον οριζόντιο και κατακόρυφο άξονα (σχ.3.5). Άλλες πηγές σφαλµάτων που αφορούν στην γεωµετρία του πλέγµατος είναι το υλικό του συµπαγούς υποστρώµατος (π.χ. γυαλί) πάνω στο οποίο τοποθετούνται τα spot και ο τύπος των εξαρτηµάτων της µηχανής που χρησιµοποιούνται για την τοποθέτηση των spot. Στην εικόνα µικροσυστοιχίας του σχήµατος 3.6 φαίνεται καθαρά ότι πολλά spot δεν ξεχωρίζουν από το υπόβαθρο εξαιτίας της χαµηλής έντασης φθορισµού [5]. (α) (β) Σχήµα 3.4: Παραδείγµατα εικόνας υποµικροσυστοιχίας µε λάθος τοποθέτηση της µάσκας τόσο στην (α) περίπτωση στις δυο αριστερές στήλες όσο και στην (β) περίπτωση στις δυο δεξιές στήλες. 59
60 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Σχήµα 3.5: Παράδειγµα εικόνας υποµικροσυστοιχίας µε περιστρεφόµενο 2D πλέγµα και ανοµοιόµορφα τοποθετηµένα spot Σφάλµατα που αφορούν στο υπόβαθρο της εικόνας Τα σφάλµατα του υποβάθρου οφείλονται στην µη σωστή προετοιµασία του chip µικροσυστοιχίας (υβριδισµός, λάθη στα spot), στα λάθη που δηµιουργούνται κατά την διαδικασία απόκτησης της εικόνας µικροσυστοιχίας, όπως η παρουσία σκόνης, και στα εργαλεία/µηχανήµατα που χρησιµοποιούνται κατά την διάρκεια ενός πειράµατος µικροσυστοιχίας. Ενώ οι δυο πρώτες περιπτώσεις δηµιουργίας σφαλµάτων ανιχνεύονται κατά την ανάλυση της ποιότητας της εικόνας µικροσυστοιχίας όπως φαίνεται στο σχήµα 3.7, η τρίτη περίπτωση σφάλµατος δεν µπορεί να διορθωθεί άµεσα από τον χρήστη του συστήµατος [5] Σφάλµατα που αφορούν στην µορφολογία του spot Οι cdna εικόνες µικροσυστοιχίας δηµιουργούνται µε στόχο τα τοποθετηµένα πάνω σε αυτές spot, να έχουν κυκλικό σχήµα. Στην πραγµατικότητα, στις εικόνες µικροσυστοιχίας συναντάται ένας µεγάλος αριθµός σχηµατικών αποκλίσεων σε σχέση µε το ιδανικό κυκλικό σχήµα που θα έπρεπε να έχουν τα spot. Στο σχήµα 3.8 απεικονίζονται ορισµένες από τις αποκλίσεις αυτές, όπως αυτές έχουν παρατηρηθεί σε πραγµατικές εικόνες κατά την διάρκεια της αποτίµησης της ποιότητας των spot. Στόχος της αποτίµησης είναι η εκτίµηση της αξιοπιστίας της µετρούµενης πληροφορίας που εµπεριέχεται στο spot καθώς επίσης και η εµπιστοσύνη που πρέπει 60
61 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας να έχει ο ερευνητής στα συµπεράσµατα που προκύπτουν από την επεξεργασία των εικόνων µικροσυστοιχίας [5]. Σχήµα 3.6: Μικροσυστοιχία µε τέσσερις υποµικροσυστοιχίες. Η κάτω δεξιά υποµικροσυστοιχία περιέχει, στις δύο τελευταίες γραµµές, spot µε πολύ µικρή ενέργεια φθορισµού. Σχήµα 3.7: Τµήµα µικροσυστοιχίας µε θόρυβο υποβάθρου οφειλόµενο στην ελλιπή πλύση του υλικού του συµπαγούς υποστρώµατος. 61
62 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Σχήµα 3.8: Χωρικές και µορφολογικές αποκλίσεις των spot από αριστερά προς δεξιά, και από επάνω προς τα κάτω: spot σε κανονικό σχήµα, spot-φάντασµα, spot µετατοπισµένο χωρικά µέσα στο πλέγµα, σφάλµα στην ακτίνα του spot, spot µε διάµετρο που λεπταίνει σταδιακά- σχήµα κοµήτη, spot µε τρύπα- σχήµα ντόνατ, µερικώς απόν spot, και γδαρµένο spot Σφάλµατα που αφορούν στις εντάσεις φωτεινότητας στο υπόβαθρο και το προσκήνιο της εικόνας Τα σφάλµατα που συναντώνται στις εντάσεις της εικόνας τόσο στο υπόβαθρο όσο και στο προσκήνιο, οφείλονται στο υλικό του συµπαγούς υποστρώµατος και τις τεχνικές σήµανσης των δειγµάτων. Παραδείγµατος χάριν, ενώ ο συνήθης τύπος της φθορίζουσας σήµανσης οδηγεί σε εικόνες µε σκοτεινό υπόβαθρο και φωτεινά spot, υπάρχουν άλλοι τύποι σήµανσης (µε ή χωρίς σήµανση µε ραδιοϊσότοπα) που οδηγούν σε εικόνες µε φωτεινό υπόβαθρο και σκοτεινά spot, όπως φαίνεται στο χαρακτηριστικό παράδειγµα του σχήµατος 3.9. Το υλικό από το οποίο είναι κατασκευασµένο το συµπαγές υπόστρωµα δηµιουργεί και αυτό µε την σειρά του σφάλµατα στην µέτρηση της έντασης. Πρέπει να τονιστεί ότι η διαφορά στις εντάσεις της εικόνας στο υπόβαθρο και το προσκήνιο είναι αυτή που σχετίζεται άµεσα µε την κατανόηση των αναζητούµενων πληροφοριών από πλευράς βιολογίας [5]. 62
63 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας Σχήµα 3.9: Μικροσυστοιχία µε φωτεινό υπόβαθρο και σκοτεινά spot. 63
64 Κεφάλαιο 3: Επεξεργασία εικόνας µικροσυστοιχίας 3.4 Αναφορές 3 ου κεφαλαίου [1] Gerda Kamberova, Shishir Shah, DNA Array, Image Analysis, Nuts & Bolts, DNA Press LLC, [2] Y.H.Yang, M.J. Buckley, S.Duboit, T.P.Speed, Comparison of methods for image analysis on cdna microarray data, Journal of Computational and Graphical Statistics, vol.11, pp , [3] A. Kuklin. Laboratory automation in microarray image processing, American Laboratory, pp , May [4] [5] Peter Bajcsy, An overview of DNA microarray image requirements for automated processing, Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05) Workshops, vol.03, pp.147, June 20-26,
65 Κεφάλαιο 4 Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών
66 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών 66
67 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών 4.1 Εισαγωγή Εξαιτίας του τρόπου που πραγµατοποιείται ένα πείραµα µικροσυστοιχιών και της δυνατότητας επαναχρησιµοποίησης των DNA chip για αρκετές φορές, οι εικόνες µικροσυστοιχίας περιέχουν, αναπόφευκτα, θόρυβο. Ο θόρυβος αυτός επηρεάζει σηµαντικά την επεξεργασία τους και καθιστά την µερική ή ολική αποµάκρυνση του, ανάλογα µε το επίπεδο του και το βαθµό στον οποίο έχει επηρεαστεί η εικόνα, απαραίτητη, πριν αρχίσει οποιαδήποτε διαδικασία ανάλυσης τους. Επιπλέον, η περιστροφή της εικόνας, η λάθος ευθυγράµµιση της και οι τοπικές αλλοιώσεις στο σχήµα της σε σχέση µε το ιδανικό ορθογώνιο πλαίσιο, φαινόµενα που συναντώνται συχνά στις εικόνες µικροσυστοιχίας, επηρεάζουν την ακρίβεια των δεδοµένων της ανάλυσης. Μια εικόνα µικροσυστοιχίας, γνωστή και ως πλέγµα µικροσυστοιχίας, αποτελείται από ένα ορισµένο αριθµό υποµικροσυστοιχιών. Μια υποµικροσυστοιχία συνίσταται από ένα συγκεκριµένο αριθµό spot, συνήθως σχήµατος κυκλικού. Στο σχήµα 4.1 απεικονίζεται ένα παράδειγµα µιας ιδανικής εικόνας µικροσυστοιχίας η οποία αποτελείται από υποµικροσυστοιχίες που περιέχουν spot σε δοµή πλαισίου και παρατηρείται η απόσταση µεταξύ των υποµικροσυστοιχιών και των spot. Στο σχήµα 4.1 ορίζονται, επιπλέον, οι έννοιες του οριζοντίου και του καθέτου διαστήµατος µεταξύ των spot ενώ, όπως φαίνεται στο σχήµα 4.2, την πραγµατικότητα κανένα από αυτά τα διαστήµατα δεν είναι ακριβώς το ίδιο. Οριζόντιο spot διάστηµα Spot Κάθετο spot διάστηµα ιάστηµα µεταξύ υποµικροσυστοιχιών Υποµικροσυστοιχία Σχήµα 4.1: Σχήµα ιδανικής εικόνας µικροσυστοιχίας. 67
68 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.2: Παράδειγµα πραγµατικής εικόνας µικροσυστοιχίας µε δεκαέξι υποµικροσυστοιχίες στο οποίο παρατηρείται η εµφανής απόκλιση από την ιδανική µικροσυστοιχία. Κατά την διάρκεια του πρώτου βήµατος που πραγµατοποιείται κατά την επεξεργασία της εικόνας µικροσυστοιχίας, της διευθυνσιοδότησης, η εκ των προτέρων εύρεση της θέσης των υποµικροσυστοιχιών µέσα σε µια µικροσυστοιχία, βελτιώνει την ακρίβεια αναγνώρισης των κέντρων των spot και την ανάθεση συντεταγµένων σε κάθε ένα από αυτά. Πολλοί αλγόριθµοι διευθυνσιοδότησης, προκειµένου να εφαρµοστούν σωστά, χρειάζονται τον καθορισµό αρκετών παραµέτρων, οριζόµενων από τον χρήστη και εξαρτώµενων από την εκάστοτε βάση δεδοµένων. Επιπλέον, η ανθρώπινη παρέµβαση είναι επιβεβληµένη, προκειµένου να διορθωθούν λάθη που λαµβάνουν χώρα κατά την διαδικασία διευθυνσιοδότησης της εικόνας. Οι παράµετροι αυτές, συνήθως, περιλαµβάνουν την περιγραφή της δοµής της υποµικροσυστοιχίας, το ύψος και το πλάτος κάθε µιας από αυτές και τις αποστάσεις των κέντρων των spot µεταξύ γειτονικών γραµµών και στηλών. Ακόµη και στην περίπτωση που οι παράµετροι είναι γνωστές, η παρέµβαση του χρήστη χρειάζεται για την επαναφορά των κέντρων των spot που έχουν παρεκκλίνει από την κανονική τους θέση. Στην εργασία των Yang s et al [1] παρουσιάζεται ένα τυπικό παράδειγµα διευθυνσιοδότησης όπου απαιτείται η ανθρώπινη παρέµβαση, ενώ στα πιο γνωστά λογισµικά που χρησιµοποιούνται για την ανάλυση της εικόνας µικροσυστοιχίας (ScanAlyze [2], GenePix [3], M.A.G.I.C [4], 68
69 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Koadarray [5]) χρειάζεται εξωτερική παρέµβαση για τον ακριβή εντοπισµό των κέντρων των spot. Εν τούτοις, την τελευταία δεκαετία έχουν γίνει αρκετές προσεγγίσεις για την εύρεση λύσης στο πρόβληµα της διευθυνσιοδότησης, απαιτώντας την, όσο το δυνατόν, µικρότερη παρέµβαση από τον χρήστη. Οι προσεγγίσεις αυτές, λαµβάνοντας υπόψιν και την περιστροφή που τυχόν έχει η υποµικροσυστοιχία, δίνουν λύση στο πρόβληµα που καλούνται να αντιµετωπίσουν αυτόµατα ή χειροκίνητα [6-8]. Ένας καινοτόµος ιεραρχικός αλγόριθµος ακριβούς και πλήρως αυτόµατης διαδικασίας διευθυνσιοδότησης, ακόµα και για εικόνες µε προβλήµατα ευθυγράµµισης και περιστροφής των υποµικροσυστοιχιών, προτείνεται και παρουσιάζεται στην εργασία του Peter Bajcs [9] Προϋπάρχουσες σχετικές εργασίες Οι εργασίες που προτείνουν µεθόδους διευθυνσιοδότησης σπανίως λαµβάνουν υπόψιν το βήµα προεπεξεργασίας της εικόνας, που περιλαµβάνει τον εντοπισµό των υποµικροσυστοιχιών σε µια µικροσυστοιχία [10-13]. Στην πραγµατικότητα, πολλές από αυτές τις µεθόδους, υποθέτουν αυθαίρετα ότι οι υποµικροσυστοιχίες έχουν εκ των προτέρων εντοπιστεί, αυτόµατα ή χειροκίνητα, και ότι η όλη προσέγγιση του προβλήµατος πραγµατοποιείται σε µια υποµικροσυστοιχία επιλεγµένη από τον χρήστη. Ωστόσο, λίγοι ερευνητές [14-20] έχουν προσπαθήσει να ξεπεράσουν την υπόθεση αυτή, δίνοντας λύση στον εκ των προτέρων εντοπισµό των υποµικροσυστοιχιών. Στην εργασία των Morris et al [21] παρουσιάζεται ένας πλήρως αυτόµατος αλγόριθµος για εντοπισµό υποµικροσυστοιχιών, ο οποίος υπολογίζεται σε µετατοπισµένες αλλά όχι ευθυγραµµισµένες εικόνες µικροσυστοιχίας. Ο Luis Rueda στην εργασία του, δηµοσιευµένη στο [22], λαµβάνοντας υπόψιν το πρόβληµα της περιστροφής της εικόνας µικροσυστοιχίας ως προς τους άξονες αναφοράς, προτείνει µιας µαθηµατικής µορφολογίας προσέγγιση για τον εντοπισµό των υποµικροσυστοιχιών. Επιπλέον, στην πατέντα [23] παρουσιάζεται µια µέθοδος αυτόµατου εντοπισµού υποµικροσυστοιχιών εφαρµόζοντας µια διαδικασία που βασίζεται στην αξονική µονοδιάστατη προβολή των τιµών φωτεινότητας των εικονοστοιχείων της εικόνας θεωρώντας όµως αµελητέες τις περιστροφές ως προς τον 69
70 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών κατακόρυφο και οριζόντιο άξονα, τόσο των υποµικροσυστοιχιών όσο και όλης της εικόνας µικροσυστοιχίας. 4.2 Αυτόµατη εύρεση υποµικροσυστοιχιών Στα πλαίσια εκπόνησης της παρούσας διδακτορικής διατριβής αντιµετωπίζεται το πρόβληµα του ακριβούς εντοπισµού της θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία, λαµβάνοντας υπόψιν την σηµασία του συγκεκριµένου βήµατος προεπεξεργασίας για µια πιο γρήγορη και ακριβή ανάλυση των πραγµατικών εικόνων µικροσυστοιχίας. Η υπολογιστικής φύσεως µέθοδος που παρουσιάζεται στην διατριβή, υποθέτοντας µια µικρή αλλά όχι αµελητέα γωνία περιστροφής για την εικόνα µικροσυστοιχίας και τις υποµικροσυστοιχίες της, επιτυγχάνει τον ακριβή εντοπισµό της θέσης των υποµικροσυστοιχιών, απαιτώντας ως γνώση µόνο τέσσερις προδιαγραφές του chip µικροσυστοιχίας. Σύµφωνα µε την προτεινόµενη µέθοδο την ευθυγράµµιση της εικόνας µικροσυστοιχίας, ακολουθεί η κατασκευή της αντίστοιχης τεχνητής εικόνας µικροσυστοιχίας ενώ ένας αλγόριθµος εύρεσης υποµικροσυστοιχιών εντοπίζει τις περιοχές που περιέχουν εικονοστοιχεία µε χαµηλή τιµή φωτεινότητας κατά µήκος της οριζόντιας και καθέτου κατεύθυνσης της τεχνητής εικόνας µέχρι να ικανοποιηθούν συγκεκριµένα κριτήρια σε κάθε άξονα χωριστά. Κατά την εφαρµογή της µεθόδου σε έναν αρκετά µεγάλο αριθµό εικόνων µικροσυστοιχίας, προερχόµενες από πέντε πραγµατικές και τρεις προσοµοιωµένες βάσεις δεδοµένων, παρατηρείται ακριβής εντοπισµός της θέσης των υποµικροσυστοιχιών ακόµα και σε περιπτώσεις εικόνων µε σχετικά υψηλό θόρυβο και spot πολύ χαµηλής φωτεινότητας. Παρά το γεγονός ότι η ύπαρξη εικόνων µικροσυστοιχίας µε σοβαρά προβλήµατα (υψηλός θόρυβος, απουσία ολόκληρων γραµµών από spot) θα µπορούσε να καταλήξει στον εντοπισµό µιας πολύπλοκης οµάδας περιοχών χαµηλής φωτεινότητας εξαιτίας του ότι ο αλγόριθµος εντοπισµού βασίζεται στην αθροιστική φωτεινότητα των γραµµών, εν τούτοις λόγω της υπολογιστικής ικανότητας του αλγορίθµου εντοπίζονται επιτυχώς και µε ακρίβεια οι σωστές περιοχές στις οποίες βρίσκονται οι γραµµές πλέγµατος. Η επιστηµονική συµβολή της προτεινόµενης µεθόδου περιλαµβάνει την πλήρως αυτοµατοποιηµένη διαδικασία εντοπισµού των υποµικροσυστοιχιών, τον ακριβή καθορισµό των γραµµών του πλέγµατος µε την βοήθεια ενός αλγορίθµου εύρεσης 70
71 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών υποµικροσυστοιχιών και την ικανότητα της µεθόδου να δίνει άριστα αποτελέσµατα ακόµα και σε περιπτώσεις εικόνων µικροσυστοιχίας που διαφέρουν κατά πολύ από τις ιδανικές µικροσυστοιχίας λόγω των σοβαρών προβληµάτων που παρουσιάζουν. Η προτεινόµενη µέθοδος διαιρείται σε πέντε βασικά βήµατα επεξεργασίας και για την εφαρµογή της χρειάζεται να ορισθούν τέσσερις παράµετροι: ο αριθµός των γραµµών και στηλών τόσο των υποµικροσυστοιχιών στην µικροσυστοιχία, όσο και ο αριθµός των γραµµών και στηλών των spot στην υποµικροσυστοιχία, πληροφορία που δίνεται από τους κατασκευαστές των chip µικροσυστοιχίας ή που µπορεί, απλά, να µετρηθεί στις εικόνες του chip µικροσυστοιχίας. Όλες οι παράµετροι που χρησιµοποιούνται στην µέθοδο εντοπισµού υποµικροσυστοιχιών, µαζί µε τα σύµβολα και τους ορισµούς τους, απεικονίζονται στο σχήµα 4.3. Παράµετροι Αριθµός στηλών µικροσυστοιχίας Αριθµός γραµµών µικροσυστοιχίας Αριθµός spot στην στήλη υποµικροσυστοιχίας Αριθµός spot στην γραµµή υποµικροσυστοιχίας Αρχική εκτίµηση της ελάχιστης απόστασης των spot Τελική εκτίµηση της ελάχιστης απόστασης των spot Πλάτος υποµικροσυστοιχίας Ύψος υποµικροσυστοιχίας Σύµβολα N col N row n col n row d initial d W sa = n col * d H sa = n row * d Σχήµα 4.3: Παράµετροι της εικόνας µικροσυστοιχίας που χρησιµοποιούνται στην προτεινόµενη µέθοδο Προεπεξεργασία Η αρχική εικόνα µικροσυστοιχίας δύο καναλιών ( ) µετατρέπεται σε εικόνα αποχρώσεων του γκρι, ενώ ένα φίλτρο ενδιάµεσης τιµής (median) εφαρµόζεται για την µείωση του θορύβου που έχει τον τύπο «αλάτι και πιπέρι». Μετά την εφαρµογή του φίλτρου η εικόνα αποχρώσεων του γκρι µετατρέπεται σε δυαδική ( ), χρησιµοποιώντας έναν αυτόµατο εκτιµητή φίλτρου, όπως αυτός προτείνεται από τον Otsu [24]. 71
72 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Αρχικά, µια πρώτη εκτίµηση του οριζοντίου και καθέτου διαστήµατος των spot µπορεί να γίνει µε την διαίρεση του πλάτους της εικόνας σε εικονοστοιχεία ( ) µε τον αναµενόµενο αριθµό των στηλών των spot στον οριζόντιο άξονα: Εύρεση περιοχής µικροσυστοιχίας Η δεύτερη διαδικασία καθορίζει την ορθογώνια περιοχή που περικλείει σε κάθε διάσταση τα spot της εικόνας µικροσυστοιχίας. Η εκτίµηση της περιοχής κάθε µικροσυστοιχίας πραγµατοποιείται µε τον εντοπισµό της πρώτης και τελευταίας γραµµής και στήλης της δυαδικής εικόνας, όπου το άθροισµα της φωτεινότητας υπερβαίνει ένα κατώφλι. Το κατώφλι, µετά από πειραµατική αξιολόγηση σε πέντε πραγµατικές βάσεις δεδοµένων µικροσυστοιχιών τέθηκε ίσο µε 0.5, για τον κατακόρυφο άξονα και ίσο µε 0.5, για τον οριζόντιο άξονα. Η ακρίβεια της αρχικής εκτίµησης του διαστήµατος των spot επηρεάζεται καθοριστικά από την ακρίβεια εκτίµησης του κατωφλίου, την γεωµετρία του πλέγµατος καθώς επίσης και από τον τύπο και το επίπεδο του θορύβου που συναντάται στην εικόνα µικροσυστοιχίας. Εν τούτοις, ο προτεινόµενος εκτιµητής κατωφλίου αποδεικνύεται να είναι µια ικανοποιητική επιλογή για όλες τις εικόνες που περιέχονται στις πέντε πραγµατικές και τις τρεις προσοµοιωµένες βάσεις δεδοµένων που χρησιµοποιήθηκαν για να αξιολογήσουν τις µεθόδους επεξεργασίας εικόνας µικροσυστοιχιών, όπως αυτές προτείνονται στην παρούσα διδακτορική διατριβή. Η διαδικασία τεµαχιοποίησης της εικόνας µικροσυστοιχίας λαµβάνει χώρα σε µια ελαφρώς πιο µεγάλη ορθογώνια περιοχή (η αρχική ορθογώνια περιοχή επεκτείνεται σε µια απόσταση ίση µε το ελάχιστο διάστηµα των spot) από τις οριακές γραµµές και στήλες της µικροσυστοιχίας προς αποφυγή απώλειας σηµαντικών δεδοµένων. Τα τελικά όρια αποκοπής της εικόνας δίνονται από τις παρακάτω σχέσεις: max, 1 min, (2) 72
73 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών max, (3) min, (4) Χρησιµοποιώντας τις τιµές των ορίων που προκύπτουν από τις σχέσεις (1)-(4), τα όρια των δυο εικόνων και µειώνονται ως εξής: :, : 5 :, : Ευθυγράµµιση της τεµαχισµένης µικροσυστοιχίας Στο τρίτο βήµα, πραγµατοποιείται η επεξεργασία της προκύπτουσας από το προηγούµενο βήµα εικόνας :, : και υπολογίζεται η γωνία που χρειάζεται το πλέγµα να περιστραφεί προκειµένου να διορθωθεί η ευθυγράµµιση του ως προς τον οριζόντιο και κατακόρυφο άξονα. Για τον υπολογισµό της σωστής ευθυγράµµισης ενός περιστρεµµένου κατά θ µοίρες αντιγράφου της εικόνας που έχει περικοπεί (, ορίζεται µια συνάρτηση ευθυγράµµισης η οποία υπολογίζει τον αριθµό όλων των spot-γραµµών της εικόνας όπου συναντάται πολύ υψηλές ή πολύ χαµηλές τιµές φωτεινότητας:,,,, 7 όπου u(.) είναι µια βηµατική συνάρτηση και τα T H και T L είναι τιµές κατωφλίων, η τιµή των οποίων καθορίζεται από τα γεωµετρικά στοιχεία των µικροσυστοιχιών. Όσο µεγαλύτερη είναι η τιµή της συνάρτησης τόσο καλύτερη ευθυγράµµιση επιτυγχάνεται. Στην συνέχεια, ο αλγόριθµος ευθυγράµµισης υπολογίζει την συνάρτηση για µια οµάδα εικόνων µε περιστρεµµένο πλέγµα σε ένα περιορισµένο διάστηµα µοιρών [-θ m, θ m ] και εντοπίζει την γωνία για την οποία συναντάται η µέγιστη τιµή της συνάρτησης. Η περιστρεµµένη εικόνα µε την µεγαλύτερη τιµή συνάρτησης καθορίζει την επιθυµητή γωνία ευθυγράµµισης: 73
74 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών max 8 Τα κατώφλια T Η και T L είναι και τα δυο γραµµικές συναρτήσεις του αριθµού των στηλών των spot και του διαστήµατος µεταξύ γειτονικών στηλών: και,,, Οι σταθερές K H και K L εξαρτώνται, αποκλειστικά, από τον τύπο και το επίπεδο του θορύβου στην δυαδική εικόνα. Οι εικόνες και περιστρέφονται και οι δυο κατά την γωνία Θ b και µετατρέπονται στις και, αντίστοιχα. Η ευθυγράµµιση του πλέγµατος στις περιγραφόµενες εικόνες γίνεται κατά τον οριζόντιο άξονα. Στο σχήµα 4.4 δίνεται ένα παράδειγµα διαγράµµατος της συνάρτησης ευθυγράµµισης και της γωνίας περιστροφής για µια εικόνα µικροσυστοιχίας από την βάση δεδοµένων Sim2 ενώ το σχήµα 4.5 παρουσιάζει ένα διάγραµµα της ολικής φωτεινότητας στις γραµµές και της θέσης της γραµµής, στο οποίο διακρίνονται τα κατώφλια T Η και T L Εντοπισµός των κέντρων των spot και υπολογισµός του διαστήµατος µεταξύ των spot Στο τέταρτο βήµα, εντοπίζεται κάθε µεµονωµένο spot στην ευθυγραµµισµένη πλέον εικόνα και αποδίδεται σε αυτό µια ετικέτα, δηµιουργώντας αποµονωµένες άσπρες περιοχές [25]. Το κέντρο κάθε spot εντοπίζεται µε τον υπολογισµό του µέσου εικονοστοιχείου (µέση τιµή των συντεταγµένων των εικονοστοιχείων που απαρτίζουν τα spot) σε κάθε αποµονωµένη περιοχή της εικόνας. Στο βήµα αυτό, το διάστηµα µεταξύ των διαδοχικών spot µπορεί να υπολογιστεί µε ακρίβεια από την µέγιστη τιµή του ιστογράµµατος όλων των διαδοχικών αποστάσεων των κέντρων των spot (σχ. 4.6). Αν N(X) είναι ο αριθµός εµφάνισης των αριθµών που περιλαµβάνονται σε µια οµάδα X, ένας εκτιµητής του διαστήµατος γειτονικών spot δίνεται από την παρακάτω σχέση: 74
75 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών max, 1 (11) όπου C(i) είναι το κέντρο του spot i, και D(x,y) είναι η Ευκλείδεια απόσταση µεταξύ των κέντρων των spot. Σχήµα 4.4: Παράδειγµα διαγράµµατος της συνάρτησης ευθυγράµµισης και της γωνίας περιστροφής για µια προσοµοιωµένη εικόνα µικροσυστοιχίας από την βάση δεδοµένων Sim Εύρεση υποµικροσυστοιχιών Στο τελευταίο βήµα, προκειµένου να εντοπιστούν οι θέσεις των υποµικροσυστοιχιών, κατασκευάζεται µια τεχνητή εικόνα, δηµιουργώντας συµπαγείς κύκλους µε κέντρα τα υπολογιζόµενα κέντρα των spot C(i) και ακτίνα ίση µε το 70% του διαστήµατος µεταξύ των spots. Η συγκεκριµένη τιµή της ακτίνας δεν επιλέγεται τυχαία αφού βάσει της τιµής αυτής παράγονται επικαλυπτόµενα τεχνητά spot µέσα στην περιοχή κάθε υποµικροσυστοιχίας και δηµιουργείται µια σχεδόν συµπαγής ορθογώνια περιοχή για κάθε υποµικροσυστοιχία, ενώ ταυτόχρονα αποφεύγεται η δηµιουργία εκτεταµένων µαύρων περιοχών που θα οδηγούσαν τον αλγόριθµο σε λάθος υπολογισµό των ορίων των πραγµατικών υποµικροσυστοιχιών, όπως φαίνεται στο σχήµα 4.7. Σε όλες τις βάσεις δεδοµένων (πραγµατικές/προσοµοιωµένες), οι γειτονικές τεχνητές υποµικροσυστοιχίες ενώνονται, µερικώς, λόγω της παρουσίας του 75
76 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών θορύβου, παρόλο που το διάστηµα µεταξύ των υποµικροσυστοιχιών είναι το λιγότερο 50% µεγαλύτερο από το διάστηµα µεταξύ των spot. Σχήµα 4.5: Παράδειγµα διαγράµµατος της ολικής φωτεινότητας στις γραµµές και της θέσης της γραµµής για µια προσοµοιωµένη εικόνα µικροσυστοιχίας από την βάση δεδοµένων Sim2. Σχήµα 4.6: Παράδειγµα ιστογράµµατος για όλες τις κοντινές αποστάσεις µεταξύ των κέντρων των spot χρησιµοποιώντας την εικόνα µικροσυστοιχίας lc7b060rex2.gif από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project. 76
77 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.7: Παράδειγµα µιας τεχνητής δυαδικής εικόνας. Στην δυαδική εικόνα ο αλγόριθµος εύρεσης υποµικροσυστοιχιών εντοπίζει τις περιοχές που περιέχουν εικονοστοιχεία µε χαµηλή τιµή φωτεινότητας κατά µήκος της οριζόντιας και καθέτου κατεύθυνσης της εικόνας. Ο αλγόριθµος εντοπισµού βασίζεται στο άθροισµα της φωτεινότητας των εικονοστοιχείων κατά µήκος των γραµµών ή των στηλών. Αν το άθροισµα αυτό είναι µικρότερο από ένα συγκεκριµένο κατώφλι T(k), εντοπίζεται µια πιθανή γραµµή πλέγµατος και τοποθετείται σε έναν διατεταγµένο πίνακα αυξανόµενων τιµών: :,. 12 Οι αντίστοιχες περιοχές χαµηλής φωτεινότητας καθορίζονται εντοπίζοντας µια πλήρη ακολουθία ακεραίων στον διατεταγµένο πίνακα. Το πρώτο και το τελευταίο στοιχείο της m οστης περιοχής χαµηλής φωτεινότητας, δίνεται από τις σχέσεις:, : 1, : Η διαδικασία επαναλαµβάνεται, ξεκινώντας από ένα σχετικά µικρό κατώφλι T(k) και αυξάνοντας την τιµή του µέχρι να ικανοποιηθούν συγκεκριµένα κριτήρια για τα και σε κάθε άξονα χωριστά. Τα κριτήρια αυτά είναι: 77
78 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών 1. Η απόσταση µεταξύ των διαδοχικών γραµµών του πλέγµατος πρέπει να βρίσκεται µέσα σε συγκεκριµένα όρια που σχετίζονται µε το αναµενόµενο µέγεθος της υποµικροσυστοιχίας. 2. Ο αριθµός των εντοπισµένων γραµµών του πλέγµατος πρέπει να είναι ίσος µε τον αριθµό του αναµενόµενου αριθµού γραµµών του πλέγµατος (στηλών) συν ένα. Το σχήµα 4.8 απεικονίζει ένα τυπικό γράφηµα της φωτεινότητας στηλών (άθροισµα της φωτεινότητας των εικονοστοιχείων σε κάθε στήλη) για µια προσοµοιωµένη κα ευθυγραµµισµένη εικόνα µικροσυστοιχίας που προέκυψε από την εφαρµογή των πρώτων τεσσάρων βηµάτων της προτεινόµενης µεθόδου. Στο γράφηµα οι περιοχές χαµηλής φωτεινότητας απεικονίζονται σαν υπερτονισµένες περιοχές στον οριζόντιο άξονα και το τελικό κατώφλι απεικονίζεται µε µια διακεκοµµένη οριζόντια γραµµή. Σχήµα 4.8: Τυπικό γράφηµα εντοπισµού των περιοχών χαµηλής φωτεινότητας σε µια προσοµοιωµένη και ευθυγραµµισµένη εικόνα µικροσυστοιχίας. Τα όρια της απόστασης των γραµµών του πλέγµατος του πρώτου κριτηρίου εξαρτώνται από τα διάφορα γεωµετρικά χαρακτηριστικά που έχει η υπό εξέταση εικόνα µικροσυστοιχίας. Στην πραγµατικότητα, µια ακολουθία από γραµµές πλέγµατος πρέπει να υπάρχει εκεί όπου οι αντίστοιχες αποστάσεις των γραµµών του πλέγµατος πρέπει να βρίσκονται ανάµεσα στην ελάχιστη τιµή του K 1 W sa και στην µέγιστη τιµή του K 2 W sa, οριζοντίως. Τα ίδια κριτήρια χρησιµοποιούνται και στην 78
79 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών κάθετη κατεύθυνση µε τις αποστάσεις των γραµµών πλέγµατος να βρίσκονται στο διάστηµα (K 1 H sa, K 2 H sa ), όπου H sa είναι το ύψος της υποµικροσυστοιχίας. Αν από την ακόλουθη διατεταγµένη οµάδα γραµµών του πλέγµατος: :, 1,, 15 υπάρχει µια οµάδα που αποτελείται από ακριβώς N col +1 (ή N row +1 στην κάθετη κατεύθυνση) διαδοχικές γραµµές, ο αλγόριθµος τερµατίζεται και οι υπολογιζόµενες γραµµές πλέγµατος χρησιµοποιούνται για τον καθορισµό της ορθογώνιας περιοχής που περιλαµβάνει τις υποµικροσυστοιχίες, διαφορετικά το κατώφλι T(k) αυξάνεται κατά k=k+1 και ο αλγόριθµος επαναλαµβάνεται από τους υπολογισµούς που εκτελούνται στην σχέση (9). Στην περίπτωση που το κατώφλι T(k) φτάσει το µέγιστο άθροισµα φωτεινότητας, ο αλγόριθµος αποτυγχάνει να εκτιµήσει τις γραµµές πλέγµατος. Οι σταθερές και ορίζονται σαν το ελάχιστο και το µέγιστο ποσοστό απόκλισης από το αναµενόµενο πλάτος γραµµών ή στηλών κατά τον υπολογισµό των γραµµών της µικροσυστοιχίας στον αντίστοιχο άξονα. Κατά την υλοποίηση του αλγορίθµου, παράγεται ένα διάνυσµα R από τον πίνακα, έχοντας δυο πεδία δεδοµένων (start, width) που αντιπροσωπεύουν, αντίστοιχα, το σηµείο έναρξης και το πλάτος της κάθε περιοχής. Αυτό το διάνυσµα δεδοµένων χρησιµοποιείται από τον αλγόριθµο, που απεικονίζεται στο διάγραµµα ροής του σχήµατος 4.9, προκειµένου να υπολογιστούν οι γραµµές πλέγµατος της µικροσυστοιχίας. Πιο αναλυτικά: Βήµα 1 ο. Ο αλγόριθµος αρχικά επιλέγει την πρώτη περιοχή χαµηλής φωτεινότητας στο διάνυσµα R σαν περιοχή αναφοράς. Βήµα 2 ο. Στην συνέχεια ψάχνει για N col (ή N row ) διαδοχικές περιοχές που περιορίζονται στα αναµενόµενα όρια απόστασης, µειώνοντας µε τον τρόπο αυτό τις περιοχές που δεν ικανοποιούν το πρώτο κριτήριο. Βήµα 3 ο. Αν η διαδικασία εντοπισµού αποτύχει να εξασφαλίσει µια σωστή οµάδα N col +1 ή N row +1 περιοχών, επαναλαµβάνεται, από το πρώτο βήµα, χρησιµοποιώντας την δεύτερη περιοχή χαµηλής φωτεινότητας του αρχικού διανύσµατος σαν περιοχή αναφοράς και ούτω καθεξής. 79
80 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Βήµα 4 ο. Ο αλγόριθµος αποτυγχάνει να εξασφαλίσει την επιθυµητή οµάδα περιοχών στην περίπτωση που δεν έχουν πλέον αποµείνει αρκετές περιοχές στο διάνυσµα R ώστε να ικανοποιείται το δεύτερο κριτήριο. Βήµα 5 ο. Το αποτέλεσµα της παραπάνω διαδικασίας είναι η δηµιουργία ενός διανύσµατος G το οποίο περιέχει τις θέσεις των εντοπισµένων γραµµών πλέγµατος που βρίσκονται στο µέσο της κάθε περιοχής της επιλεγµένης οµάδας περιοχών. Στο σχήµα 4.9, όπου δίνεται το αναλυτικό διάγραµµα ροής του προτεινόµενου αλγορίθµου εντοπισµού των γραµµών µικροσυστοιχίας, το N αντιστοιχεί στον αριθµό των αναµενόµενων γραµµών πλέγµατος (N col +1 ή N row +1) ενώ W είναι το υπολογιζόµενο πλάτος της υποµικροσυστοιχίας στον άξονα όπου πραγµατοποιείται η διαδικασία εντοπισµού των γραµµών (W sa ή H sa ). Οι εκτιµούµενες γραµµές χρησιµοποιούνται για την εξαγωγή των µεµονωµένων υποµικροσυστοιχιών από την αρχική εικόνα µετά την περικοπή. Ο προτεινόµενος αλγόριθµος επιτυγχάνει να εντοπίσει σωστά τις γραµµές πλέγµατος ακόµα και στην περίπτωση εικόνων µικροσυστοιχίας µε σοβαρά προβλήµατα, όπως φαίνεται στο σχήµα 4.10, όπου διακρίνεται καθαρά η απουσία ολόκληρων γραµµών από spot. Παρά το γεγονός ότι ένα τέτοιο πρόβληµα καταλήγει στον εντοπισµό µιας πολύπλοκης οµάδας περιοχών χαµηλής φωτεινότητας λόγω του γεγονότος ότι ο αλγόριθµος εντοπισµού βασίζεται στην αθροιστική φωτεινότητα των γραµµών, όπως φαίνεται στο παράδειγµα του σχήµατος σχήµα 4.11, ο αλγόριθµος εντοπίζει επιτυχώς τις σωστές περιοχές στις οποίες βρίσκονται οι γραµµές πλέγµατος. Ο αλγόριθµος εντοπισµού περιοχών χαµηλής φωτεινότητας περιγράφεται στο διάγραµµα ροής του σχήµατος Πειραµατικά αποτελέσµατα σε πραγµατικές εικόνες µικροσυστοιχίας Η προτεινόµενη µέθοδος υπολογίστηκε σε εικόνες µικροσυστοιχίας πέντε διαφορετικών βάσεων δεδοµένων, κωδικοποιηµένες σε αρχεία.gif. Η Human Sarcomas βάση περιέχει 34 εικόνες µικροσυστοιχίας αποτελούµενες από 32 υποµικροσυστοιχίες, ενώ κάθε µια από αυτές συνίσταται από 6x8 spot [26]. Η 80
81 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Young_vs_Old_Transgenic βάση αποτελείται από 14 εικόνες µικροσυστοιχίας που περιέχουν 48 υποµικροσυστοιχίες των 29x30 spot [27]. Ένας συνολικός αριθµός 36 cdna εικόνων µικροσυστοιχίας από την Lymphoma/Leukemia Molecular Profiling Project (LLMPP) αποτελούν την τρίτη βάση, στην οποία κάθε εικόνα περιέχει 16 υποµικροσυστοιχίες των 24x24 spot [28]. Κάθε µια από τις Young Transgenic Control [29] και Old Wildtype TPA Control [30] βάσεις αποτελείται από 8 εικόνες µικροσυστοιχίας που περιέχουν 48 υποµικροσυστοιχίες των 29x30 spot. Σχήµα 4.9: ιάγραµµα ροής του αλγορίθµου εντοπισµού των θέσεων των γραµµών πλέγµατος. Το διάστηµα εύρεσης γωνιών για την ευθυγράµµιση των εικόνων µικροσυστοιχίας εκτείνεται στο διάστηµα [-3 ο, -3 ο ], µε βήµα 0.01 µοιρών αλλά µόνο στην LLMPP βάση παρατηρήθηκαν σοβαρές αποκλίσεις, µεγαλύτερες από το όριο των τριών µοιρών, ως προς τους δύο άξονες. Επιπλέον, κατά την πειραµατική διαδικασία, χρησιµοποιήθηκαν διαφορετικές τιµές για τις σταθερές και προκειµένου να εντοπιστούν οι πιο αποτελεσµατικές τιµές για αυτές. Το διάστηµα εύρεσης τιµών τους, περιορίστηκε σε 1 4 και 1 4, αντίστοιχα, ενώ οι τιµές των κατωφλίων που δίνουν τον πιο ακριβή εντοπισµό 81
82 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών υποµικροσυστοιχιών, προέκυψαν όταν 2/. Οι τιµές των K 1 και K 2 τέθηκαν ίσες µε 0.95 και 1.05, αντίστοιχα, για όλες τις βάσεις δεδοµένων. Σχήµα 4.10: Παράδειγµα εικόνας µικροσυστοιχίας µε αρκετά µεγάλο αριθµό σφαλµάτων και µεγάλο αριθµό περιοχών χαµηλής φωτεινότητας (lc7b060rex2.gif) από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project.. Σχήµα 4.11: Αθροιστική φωτεινότητα των γραµµών της εικόνας του σχήµατος 4.10 σε συνάρτηση µε την θέση των γραµµών του πλέγµατος. 82
83 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Ο αλγόριθµος, όσον αφορά την Human sarcomas βάση, εντόπισε τις θέσεις όλων των υποµικροσυστοιχιών σε ποσοστό 58.82% των συνολικών εικόνων. Όπως φαίνεται και στο σχήµα 4.12, η προτεινόµενη µέθοδος εντοπίζει, χωρίς λάθη, τις γραµµές πλέγµατος. Η ικανότητα του αλγορίθµου µειώθηκε, αρκετά, όταν εφαρµόστηκε σε έναν αριθµό εικόνων που είχαν παραµορφωθεί σηµαντικά κατά την διάρκεια παραγωγής τους. Στο σχήµα 4.13(α) απεικονίζεται ένα τµήµα µιας εικόνας µικροσυστοιχίας (76168.gif) όπου η ύπαρξη spot πολύ χαµηλής φωτεινότητας και η παρουσία υψηλού επιπέδου θορύβου του τύπου «αλάτι και πιπέρι» έχει σαν αποτέλεσµα την απώλεια πολύτιµης πληροφορίας κατά την παραγωγή της δυαδικής εικόνας, τον λάθος υπολογισµό του διαστήµατος των spot και της ευθυγράµµισης του πλέγµατος της υποµικροσυστοιχίας. Στο σχήµα 4.13(β) φαίνεται το παράδειγµα µιας ακόµη σοβαρά παραµορφωµένης εικόνας (71824.gif), όπου η φωτεινότητα των spot είναι σε ανεκτό επίπεδο και το επίπεδο του θορύβου είναι εξαιρετικά υψηλό. Στην Human Sarcomas βάση, ο συνολικός αριθµός των spot στις υποµικροσυστοιχίες είναι αξιοσηµείωτα µικρός και το διάστηµα µεταξύ γειτονικών spot είναι µεγαλύτερο από τις αντίστοιχες αποστάσεις που συναντώνται στις υπόλοιπες βάσεις. Σε µια τέτοια κατάσταση, αρκετά εικονοστοιχεία που περιέχουν υψηλής στάθµης θόρυβο «αλάτι και πιπέρι» αναγνωρίζονται από τον αλγόριθµο σαν εικονοστοιχεία που ανήκουν σε spot. Στην βάση εικόνων Young vs Old Transgenic πραγµατοποιείται εντοπισµός των υποµικροσυστοιχιών χωρίς λάθη (σχ.4.14) παρά την παρουσία θορύβου. Στην LLMPP, ο επιτυχής εντοπισµός φτάνει στο ποσοστό του 83.33% στο σύνολο των εικόνων που περιέχονται στην βάση. Ένα τυπικό παράδειγµα δίνεται στο σχήµα Παρά το γεγονός ότι οι περισσότερες εικόνες δεν ήταν ευθυγραµµισµένες, ο αλγόριθµος πέτυχε να διορθώσει το πρόβληµα της ευθυγράµµισης σε όλες τις εικόνες και να εντοπίσει σωστά τις υποµικροσυστοιχίες. Σε αντίθεση µε ότι συµβαίνει στην βάση Human Sarcomas, οι εικόνες στην βάση αυτή περιέχουν spot µε ικανοποιητική φωτεινότητα που επιτρέπουν στον αλγόριθµο να κάνει πιο ακριβή υπολογισµό του διαστήµατος µεταξύ των spot. Ο εντοπισµός του πλέγµατος στις µικροσυστοιχίες που περιέχονται στην βάση LLMPP, αποτυγχάνει στην περίπτωση εξαιρετικά παραµορφωµένων και µε παρουσία υψηλού θορύβου εικόνων. 83
84 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.12: Παράδειγµα εύρεσης υποµικροσυστοιχιών σε εικόνα µικροσυστοιχίας (71817.gif) από την Human Sarcomas βάση. ιακρίνεται η αντίστοιχη τεχνητή εικόνα και οι εντοπισµένες υποµικροσυστοιχίες. Όσον αφορά στα αποτελέσµατα για την βάση Old Wildtype TPA Control καθώς επίσης και για την βάση Young Transgenic Control, η προτεινόµενη µέθοδος εντόπισε όλες τις υποµικροσυστοιχίες των υπό εξέταση εικόνων. Στα σχήµατα 4.16 και 4.17 απεικονίζεται ο επιτυχής εντοπισµός της θέσης των υποµικροσυστοιχιών σε δυο αντίστοιχα παραδείγµατα (72801.gif και gif). Στον πίνακα 4.1 παρουσιάζεται συνοπτικά, η ακρίβεια εντοπισµού υποµικροσυστοιχιών για την περίπτωση πραγµατικών εικόνων µικροσυστοιχίας. 4.4 Πειραµατικά αποτελέσµατα σε προσοµοιωµένες εικόνες µικροσυστοιχίας Προκειµένου να επιβεβαιωθεί η ακρίβεια της µεθόδου σε ένα καλά ελεγχόµενο περιβάλλον, πραγµατοποιείται ο υπολογισµός της προτεινόµενης προσέγγισης σε προσοµοιωµένες εικόνες µικροσυστοιχίας. Οι εικόνες αυτές παρουσιάζουν µια αρκετά ικανοποιητική οµοιότητα µε τα πραγµατικά δεδοµένα. Με στόχο να παραχθεί προσοµοιωµένη εικόνα µικροσυστοιχίας που να έχει οµοιάζοντα χαρακτηριστικά µε τις πραγµατικές εικόνες µικροσυστοιχίας, οι ακόλουθες παράµετροι τίθενται ίσες µε τις τιµές που συναντώνται σε πραγµατικά δεδοµένα: 84
85 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών µέγιστη γωνία περιστροφής για την µικροσυστοιχία και κάθε µια από τις υποµικροσυστοιχίες, µέγιστη τιµή της ακτίνας των spot και του διαστήµατος µεταξύ των spot στους άξονες αναφοράς. Βάσεις δεδοµένων Επιτυχής εντοπισµός υποµικροσυστοιχιών Αριθµός εικόνων µικροσυστοιχίας Αριθµός υποµικροσυστοιχιών / (%) µικροσυστοιχία Human Sarcomas Young_vs_Old_Transgenic Lymphoma/Leukemia Molecular Profiling Project Young_Transgenic_Control Old_Wildtype_TPA_Control Πίνακας 4.1: Ακρίβεια εντοπισµού θέσης υποµικροσυστοιχιών χωρίς κανένα σφάλµα ανά εικόνα, σε πέντε πραγµατικές βάσεις δεδοµένων. Ο προσοµοιωτής περιλαµβάνει ακόµα παραµέτρους που αφορούν στην διασπορά (ενέργεια) του προσθετικού θορύβου και στην φωτεινότητα των spot. Κατά την προσοµοίωση χρησιµοποιήθηκαν δύο διαφορετικές γεννήτριες θορύβου, τύπου «αλάτι και πιπέρι» και Gaussian, αντίστοιχα. Οι γεννήτριες αυτές χρησιµοποιούνται πολύ συχνά σε προβλήµατα επεξεργασίας εικόνων γιατί περιγράφουν µε ικανοποιητική ακρίβεια φυσικά φαινόµενα παραµόρφωσης εικόνων. Τυπικές τιµές των ακτινών των spot που συναντώνται σε πραγµατικές εικόνες µικροσυστοιχίας είναι τα 2, 5, 9 και 12 εικονοστοιχεία, ενώ το διάστηµα µεταξύ γραµµών και στηλών ποικίλλει από 17 σε 22 εικονοστοιχεία και από 18 σε 24 εικονοστοιχεία, αντίστοιχα [31]. Η ακρίβεια της προτεινόµενης µεθόδου υπολογίστηκε σε τρεις προσοµοιωµένες βάσεις δεδοµένων. Η πρώτη βάση Sim1, µε προσοµοιωµένα δεδοµένα περιέχει 22 εικόνες των 12 υποµικροσυστοιχιών, ενώ κάθε υποµικροσυστοιχία αποτελείται από 24x24 spot. Κάθε µια από τις υπόλοιπες δυο βάσεις, Sim2 και Sim3, περιέχει 20 εικόνες που αποτελούνται από 12 υποµικροσυστοιχίες και αυτές µε την σειρά τους 85
86 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών περιέχουν 24x24 spot. Σε κάθε µια από τις βάσεις, χρησιµοποιείται µια διαφορετική γωνία περιστροφής για τις υποµικροσυστοιχίες προκειµένου να δηµιουργηθεί µια εικόνα µε πρόβληµα ευθυγράµµισης στις υποµικροσυστοιχίες, ενώ σε όλες τις βάσεις προστίθεται θόρυβος και η ίδια γωνία περιστροφής µικροσυστοιχίας εφαρµόζεται για όλες τις προσοµοιωµένες εικόνες των βάσεων. Στον πίνακα 4.2 παρουσιάζεται περιληπτικά η ακρίβεια εντοπισµού υποµικροσυστοιχιών για την περίπτωση προσοµοιωµένων εικόνων µικροσυστοιχίας. low brightness spot heavily noisy image (α) (β) Σχήµα 4.13: (α) Τµήµα εικόνας µικροσυστοιχίας (76168.gif) από την βάση Human Sarcomas, όπου φαίνονται καθαρά τα χαµηλής φωτεινότητας spot, (β) Παράδειγµα µιας πραγµατικά παραµορφωµένης εικόνας (71824.gif) από την βάση Human Sarcomas. Η µέγιστη τιµή της ακτίνας των spot τέθηκε ίση µε 10 εικονοστοιχεία ενώ το spot διάστηµα στον οριζόντιο και κάθετο άξονα τέθηκε ίσο µε 20 εικονοστοιχεία, σύµφωνα µε τις αντίστοιχες τιµές που συναντώνται σε πραγµατικά δεδοµένα. Η µέγιστη γωνία περιστροφής για τις µικροσυστοιχίες και τις υποµικροσυστοιχίες εντοπίζεται στα διαστήµατα [-3 o, 3 o ] και [-1.5 o, 1.5 o ], αντίστοιχα. Στις πραγµατικές εικόνες µικροσυστοιχίας, σπάνια συναντώνται υποµικροσυστοιχίες µε γωνίες περιστροφής µεγαλύτερες από 1.5 o. Στις προσοµοιωµένες εικόνες µικροσυστοιχίας, κάθε υποµικροσυστοιχία περιστρέφεται τυχαία είτε σύµφωνα µε τους δείκτες του ρολογιού είτε αντίστροφα. Επιπλέον, σε όλες τις προσοµοιωµένες εικόνες προστίθεται ταυτόχρονα τόσο θόρυβος του τύπου «αλάτι και πιπέρι» όσο και Gaussian προσθετικός λευκός θόρυβος προκειµένου να προσοµοιωθεί η επίδραση 86
87 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών των φυσικών φαινοµένων που εµφανίζονται κατά την διαδικασία παραγωγής των εικόνων µικροσυστοιχιών και επηρεάζουν την φωτεινότητα των εικονοστοιχείων. Τέλος, µε στόχο να επιτευχθεί καλύτερη προσοµοίωση, η φωτεινότητα και η περιοχή που καλύπτουν τα spot ορίζονται µε γεννήτρια αριθµών οµοιόµορφης κατανοµής. Ένα τυπικό παράδειγµα προσοµοιωµένης εικόνας δίνεται στο σχήµα Όπως δείχνουν τα πειραµατικά αποτελέσµατα, το βήµα της ευθυγράµµισης του πλέγµατος της µικροσυστοιχίας στην προτεινόµενη µέθοδο (2 ο βήµα), εντοπίζει επιτυχώς την γωνία περιστροφής όλης της µικροσυστοιχίας, ακόµα και σε περιπτώσεις όπου η λάθος ευθυγράµµιση των µεµονωµένων υποµικροσυστοιχιών είναι σηµαντικά µεγαλύτερη από την τυπική τιµή της 1.5 o, όπως συναντάται σε πραγµατικές εικόνες µικροσυστοιχίας. Προσοµοιωµένες Επιτυχής Αριθµός Αριθµός Σφάλµα εντοπισµού Τυπική Βάσεις εντοπισµός εικόνων υποµικροσυ- που αφορά στην Απόκλιση υποµικροσυστοιχιών µικροσυστοιχίας στοιχιών / απόλυτη γωνία (%) µικροσυστοιχία περιστροφής Sim o 0.51 o Sim o 0.27 o Sim o 0.02 o Πίνακας 4.2: Ακρίβεια εντοπισµού των υποµικροσυστοιχιών χωρίς σφάλµατα ανά εικόνα, σε πέντε προσοµοιωµένες βάσεις δεδοµένων και τα αντίστοιχα χαρακτηριστικά τους. Πιο συγκεκριµένα, ο αλγόριθµος ευθυγράµµισης υπολογίζεται σε έναν αριθµό 62 προσοµοιωµένων και µη-ευθυγραµµισµένων εικόνων µικροσυστοιχίας, παραγόµενες µετά την περιστροφή όλου του πλέγµατος της υποµικροσυστοιχίας καθώς επίσης και κάθε µιας υποµικροσυστοιχίας χωριστά. Στις εικόνες όπου παρατηρούνται µικρές γωνίες περιστροφής στις υποµικροσυστοιχίες, ο αλγόριθµος εντοπίζει µε επιτυχία την σωστή γωνία περιστροφής του πλέγµατος της µικροσυστοιχίας, ακόµα και στην περίπτωση που χρησιµοποιούνται µεγάλες γωνίες περιστροφής ολόκληρης της εικόνας. Όπως είναι αναµενόµενο, καθώς η αυθαίρετη τιµή γωνίας περιστροφής αυξάνεται, η ακρίβεια εντοπισµού της γωνίας του πλέγµατος της µικροσυστοιχίας µειώνεται. Αυτή η επίδραση επιβεβαιώνεται όταν ο αλγόριθµος ευθυγράµµισης του 87
88 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών πλέγµατος της µικροσυστοιχίας εφαρµόζεται στην πρώτη προσοµοιωµένη βάση ( Sim1 ), η οποία περιλαµβάνει εικόνες µε υποµικροσυστοιχίες που έχουν περιστραφεί στο διάστηµα [-3 o, 3 o ] και δίνει µέσο απόλυτο σφάλµα της εκτιµώµενης γωνίας περιστροφής του πλέγµατος της µικροσυστοιχίας τις 0.5 o µε τυπική απόκλιση τις 0.51 o (ένα χαρακτηριστικό παράδειγµα δίνεται στην εικόνα του σχήµατος 4.19). Στην δεύτερη προσοµοιωµένη βάση ( Sim2 ), όπου οι υποµικροσυστοιχίες έχουν περιστραφεί στο διάστηµα από -1.5 o µέχρι 1.5 o, το απόλυτο σφάλµα της εκτιµώµενης γωνίας περιστροφής του πλέγµατος της µικροσυστοιχίας έχει µια µέση τιµή τις 0.26 o µε τυπική απόκλιση τις 0.27 o. Στην περίπτωση που οι προσοµοιωµένες εικόνες έχουν δηµιουργηθεί χωρίς οι υποµικροσυστοιχίες τους να έχουν περιστραφεί (βάση δεδοµένων Sim3 ), η ευθυγράµµιση της µικροσυστοιχίας είναι ακριβής, δίνοντας ένα πολύ µικρό µέσο απόλυτο σφάλµα των 0.02 o και τυπική απόκλιση τις 0.02 o. Πρέπει να τονισθεί ότι και για τις τρεις προσοµοιωµένες βάσεις, η αυθαίρετη γωνία περιστροφής ολόκληρου του πλέγµατος της µικροσυστοιχίας βρίσκεται πάντα στο διάστηµα [-3 o, 3 o ]. Η ακρίβεια εκτίµησης της γωνίας περιστροφής της µικροσυστοιχίας και η ακόλουθη διόρθωση της κακής ευθυγράµµισης της, επηρεάζει σηµαντικά την πιστότητα των εκτιµώµενων γραµµών του πλέγµατος. Εν τούτοις, ο εντοπισµός των γραµµών του πλέγµατος µικροσυστοιχίας µπορεί να είναι επιτυχής ακόµα και στην περίπτωση που η ευθυγράµµιση δεν είναι τόσο ακριβής, όπως φαίνεται στο σχήµα Υψηλή ακρίβεια στον εντοπισµό των θέσεων των υποµικροσυστοιχιών συναντάται και σε περιπτώσεις όπου η απόλυτη τιµή της γωνίας περιστροφής των υποµικροσυστοιχιών είναι ίση µε 1.5 o (πίνακας 4.2). 88
89 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.14: Εικόνα µικροσυστοιχίας (59960.gif) από την βάση δεδοµένων Young vs. Old Transgenic, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές του πλέγµατος. 89
90 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών (α) (β) (γ) (δ) Σχήµα 4.15: (α) Εικόνα µικροσυστοιχίας (lc4b035rex2.gif) από την βάση δεδοµένων LLMPP, (β) Ευθυγραµµισµένη εκδοχή της εικόνας αποχρώσεων του γκρι, (γ) Τεχνητή εικόνα µε τις παραγόµενες γραµµές διαχωρισµού των υποµικροσυστοιχιών, (δ) Γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών στην αρχική εικόνα. 90
91 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.16: Εικόνα µικροσυστοιχίας (72801.gif) από την βάση δεδοµένων Young Transgenic Control, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών της εικόνας. 91
92 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.17: Εικόνα µικροσυστοιχίας (72813.gif) από την βάση δεδοµένων Old Wildtype TPA_Control, η αντίστοιχη τεχνητή εικόνα και οι προκύπτουσες γραµµές διαχωρισµού µεταξύ των υποµικροσυστοιχιών της εικόνας. 92
93 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών Σχήµα 4.18: Τυπικό παράδειγµα εικόνας προσοµοίωσης. (α) (β) Σχήµα 4.19: Παράδειγµα σωστού εντοπισµού των γραµµών διαχωρισµού υποµικροσυστοιχιών στην εικόνα (β) σε µια µικροσυστοιχία από την βάση Sim1 στην οποία παρατηρούνται (εικόνα (α)) µεγάλες γωνίες περιστροφής στις υποµικροσυστοιχίες της. 93
94 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών 4.5 Αναφορές 4 ου κεφαλαίου [1] Yang, Y.H., Buckley, M.J., Duboit, S., Speed, T.P., Comparison of methods for image analysis on cdna microarray data, Journal of Computational and Graphical Statistics, vol. 11, pp , [2] [3] [4] Heyer L. J., Moskowitz D. Z., et al, MAGIC tool: integrated microarray data analysis, Bioinformatics, 21(9): , [5] [6] Stefano Lonardi, Yu Luo, Gridding and Compression of Microarray Images, Conference on Computational Systems & Bioinformatics, CSB, [7] Yuan-Kai Wang, Cheng-Wei Huang, DNA Microarray Image Analysis Using Active Contour Model, Proc. Computational Systems Bioinformatics, CSB, [8] Christian Uehara, Ioannis Kakadiaris, Towards Automatic Analysis of DNA Microarrays, sixth Workshop on Applications of Computer Vision, WACV, [9] Peter Bajcs, Gridline: Automatic Grid Alignment in DNA Microarray Scans, IEEE Trans. on Image Processing, vol. 13, no. 1, [10] Yuan-Kai Wang, Cheng-Wei Huang, DNA Microarray Image Analysis Using Active Contour Model, Proc. Computational Systems Bioinformatics, CSB, [11] Jinn Ho, Wen-Liang Hwang, Henry Horn-Shing Lu, and D. T. Lee, Gridding Spot Centers of Smoothly Distorted Microarray Images, IEEE Trans. on Image Processing, vol. 15, no. 2,
95 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών [12] A. Mastrogianni, E. Dermatas, A. Bezerianos, Robust pre-processing and noise reduction in microarray images, Proc. of the 5th IASTED International Conference Biomedical Engineering, [13] Daniel Morris, Blind Microarray Gridding: A New Framework, IEEE Trans. on Systems, Man and Cybernetics- Part C: Applications and Reviews, vol. 38, no. 1, [14] Y. Wang, M. Ma, K. Zhang, and F. Shih., A Hierarchical Refinement Algorithm for Fully Automatic Gridding in Spotted DNA Microarray Image Processing, Information Sciences, 177(4): , [15] Y.Wang, F. Shih, and M. Ma., Precise Gridding of Microarray Images by Detecting and Correcting Rotations in Subgrids, In Proceedings of the 8th Joint Conference on Information Sciences, pages , Salt Lake City, USA, [16] R. Fabbri, L. da F. Costa, J. Barrera, Towards Non-Parametric Gridding of Microarray Images, 14th International Conference on Digital Signal Processing, vol.2, pp , [17] Jinn Ho, Wen-Liang Hwang, Henry Horn-Shing Lu, D.T. Lee, Gridding spot centers of smoothly distorted microarray images, IEEE Trans. on Image Processing, vol. 15, no. 2, [18] Chang-Beom Park, Kwang-Woo Lee, Seong-Whan Lee, Automatic microarray image segmentation based on watershed transformation, ICPR 04, 17th International Conference on Pattern Recognition, vol.3, pp , [19] Nikolaos Giannakeas, Petros S. Karvelis, Dimitrios I. Fotiadis, A classification based segmentation of cdna microarray images using support vector machines, Proceedings of the 30th Annual International IEEE Engineering in Medicine and Biology Society, pp , Vancouver, Canada,
96 Κεφάλαιο 4: Αυτόµατη µέθοδος εύρεσης υποµικροσυστοιχιών [20] Karl Fraser, Zidong Wang, Xiaohu Liu, Microarray image analysis: an algorithmic approach, Chapman & Hall/CRC Computer Science & Data Analysis, [21] Daniel Morris, Zidong Wang, Xiaohui Liu, Microarray subgrid detection: a novel algorithm, International Journal of Computer Mathematics, Vol. 84, No. 5, , [22] Luis Rueda, Sub-grid Detection in DNA Microarray Images, PSIVT, pp , [23] System and method for automatically identifying sub-grids in a microarray, [24] N. Otsu, A threshold selection method from gray-level histograms, IEEE Trans. Sys. Man., Cyber, vol.9, pp , [25] Haralick, Robert M., and Linda G. Shapiro, 'Computer and Robot Vision', V. I, Addison-Wesley, pp , [26] Human Sarcomas database, [27] Young_vs_Old_Transgenic database, [28] The Lymphoma/Leukemia Molecular Profiling Project database, [29] Young_Transgenic_Control, [30] Old_Wildtype_TPA_Control, [31] Peter Bajcsy, 96
97 Κεφάλαιο 5 Αποθορυβοποίηση εικόνας µικροσυστοιχίας
98 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας 98
99 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας 5.1.Εισαγωγή Στόχος της τεχνολογίας των µικροσυστοιχιών είναι τόσο η κατανόηση θεµελιωδών εννοιών που σχετίζονται µε την ανάπτυξη κα την εξέλιξη των έµβιων όντων όσο και η ανακάλυψη κληρονοµικών και άλλων αιτιών εµφάνισης ασθενειών στο ανθρώπινο σώµα. Εξαιτίας της σηµαντικότητας του στόχου αυτού, η αποκατάσταση της πληροφορίας και η αφαίρεση των συνιστωσών που δεν συσχετίζονται µε την βιολογική πληροφορία θεωρείται υψίστης σηµασίας στην διαδικασία επεξεργασίας των µικροσυστοιχιών. Στην ανάλυση της εικόνας µικροσυστοιχίας, τα διάφορα είδη θορύβου που ουσιαστικά αλλοιώνουν την εικόνα και κάνουν δύσκολη την επεξεργασία εντοπισµού της βιολογικής πληροφορίας οφείλονται είτε στον υπολογισµό της έντασης φωτεινότητας του υποβάθρου της εικόνας, είτε στην λάθος ευθυγράµµιση του πλέγµατος της µικροσυστοιχίας ως προς τους άξονες αναφοράς είτε ακόµη σε γρατζουνιές και σκόνη που υπάρχουν πάνω στο συµπαγές υπόστρωµα τοποθέτησης των spot. Ο θόρυβος που συναντάται στις εικόνες µικροσυστοιχίας µπορεί να είναι γεωµετρικός, µε χωρικές αλλοιώσεις στην εικόνα ή ραδιοµετρικός µε επιπτώσεις στις τιµές φωτεινότητας των εικονοστοιχείων. Επιπλέον, ο θόρυβος διακρίνεται σε συστηµατικό και σε τυχαίο επηρεάζοντας και στις δυο περιπτώσεις τις µετρήσεις που προκύπτουν από τις εικόνες, την ακρίβεια υπολογισµών και την αξιοπιστία τους. Ο συστηµατικός και ο τυχαίος θόρυβος συνυπάρχουν στις εικόνες και η αντιµετώπιση τους, προϋποθέτει την κατανόηση των φυσικών φαινοµένων που τις δηµιουργούν. Ο συστηµατικός θόρυβος µπορεί να µειωθεί µε προσεκτική και σωστή χρήση των πειραµατικών διατάξεων ενώ η παρουσία του τυχαίου θορύβου που είναι απρόβλεπτη και παρουσιάζεται σε µεγαλύτερο ή µικρότερο βαθµό σε κάθε εικόνα µικροσυστοιχίας, οφείλεται συνήθως στην λειτουργία του ηλεκτρονικού εξοπλισµού και στην στοχαστική φύση του φωτός. Ο τυχαίος θόρυβος που προκύπτει κάθε φορά που δηµιουργούνται καινούριες εικόνες, δεν έχει την ίδια ένταση µε αποτέλεσµα να υπάρχει διακύµανση στις τιµές φωτεινότητας των εκάστοτε εικονοστοιχείων. Η χρήση υψηλής ποιότητας οργάνων µπορεί να ελαττώσει την ένταση του τυχαίου θορύβου όχι όµως και να την εξαλείψει. Παρά το γεγονός ότι ο τυχαίος θόρυβος δεν παράγεται µε την ίδια ένταση σε κάθε περίπτωση κατασκευής εικόνας 99
100 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας µικροσυστοιχίας, έχει µερικές γενικές ιδιότητες που µπορούν να κωδικοποιηθούν µε την χρήση στατιστικών µεθόδων. Οι µέθοδοι αυτές χρησιµοποιούνται για τον εντοπισµό και τον υπολογισµό του τυχαίου θορύβου µε στόχο τα συµπεράσµατα που προκύπτουν από τις εικόνες µικροσυστοιχίας να συνοδεύονται από ποσοτικές µετρήσεις της ορθότητας και ακρίβειας τους και να εισάγουν τουλάχιστον αµερόληπτα σφάλµατα στις βιολογικές µετρήσεις [1]. (α) (β) (γ) Σχήµα 5.1: (α) Πραγµατική εικόνα µε έντονη την παρουσία θορύβου, (β) Η ίδια εικόνα στην ιδανική της εκδοχή χωρίς τον θόρυβο, (γ) Ο θόρυβος υποβάθρου αποµονωµένος από την αρχική εικόνα [4] Πηγές θορύβων Ένας από τους πιο σηµαντικούς στόχους που πρέπει να επιτευχθεί κατά την διαδικασία ανάλυσης της εικόνας µικροσυστοιχίας, προκειµένου η ποσοτικοποίηση της γονιδιακής έκφρασης να είναι αξιόπιστη, είναι η µεγιστοποίηση του λόγου σήµατος προς θόρυβο (SNR) [1]. Η τιµή του λόγου αυτού δείχνει πόσο καλά µπορεί να διαχωριστεί το πραγµατικό σήµα από τον θόρυβο. Αν η εικόνα που παράγεται από τον σαρωτή του συστήµατος έχει αρκετά χαµηλό σήµα προς θόρυβο, η ακριβής και σωστή ποσοτικοποίηση των µεµονωµένων spot καθίσταται εξαιρετικά δύσκολη. 100
101 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Οι πηγές των θορύβων διακρίνονται σε δυο κατηγορίες, τις εσωτερικές και τις εξωτερικές [1]. Οι εξωτερικές πηγές οφείλονται στην στοχαστική φύση του φωτός, στην σκόνη που υπάρχει στον αέρα και σε γρατζουνιές στα υπό εξέταση αντικείµενα ενώ οι εσωτερικές οφείλονται στην λειτουργία των ηλεκτρονικών οργάνων και στην διαδικασία ψηφιοποίησης των εικόνων µικροσυστοιχίας. Πιο αναλυτικά [1]: Καθώς η εικόνα µικροσυστοιχίας είναι µια συνάρτηση του προσπίπτοντος φωτός, ένας φωτοπολλαπλασιαστής σωλήνα (PhotoMultiplier Tube PMT) χρησιµοποιείται για τον εντοπισµό των φωτονίων και την ποσοτικοποίηση των τιµών τους, σε εντάσεις φωτεινότητας της εικόνας. Εξαιτίας του θερµοηλεκτρικού φαινοµένου και διαρροών ρεύµατος στα ηλεκτρονικά κυκλώµατα, εισάγεται στο σύστηµα µέτρησης ηλεκτρονικός θόρυβος. Ένας τέτοιος θόρυβος µπορεί τυπικά να µοντελοποιηθεί από τον Gaussian λευκό θόρυβο [2]. Η ισχύς αυτού του θορύβου στην εικόνα, συνήθως, µειώνεται ελέγχοντας τον χρόνο έκθεσης της µικροσυστοιχίας στον σαρωτή κατά την διαδικασία της σάρωσης. Ένας δεύτερος τύπος θορύβου που εισάγεται στο σύστηµα σχετίζεται µε τον αριθµό των προσπιπτόντων φωτονίων. Λόγω της Poisson κατανοµής των φωτονίων, καθώς ο αριθµός των προσπιπτόντων φωτονίων αυξάνεται, αυξάνεται και η διακύµανσή στον αριθµό τους. Το γεγονός αυτό οδηγεί σε αύξηση της έντασης φωτεινότητας στην εικόνα και κατά συνέπεια σε αντίστοιχη αύξηση της έντασης του θορύβου. Η τυπική απόκλιση του θορύβου είναι ανάλογη της τετραγωνικής ρίζας του πραγµατικού σήµατος στην εικόνα [3]. Η τρίτη πηγή θορύβου δεν εξαρτάται από το σύστηµα δηµιουργίας της εικόνας. Πρόκειται για το συµπαγές υπόστρωµα πάνω στο οποίο τοποθετούνται τα spot, το οποίο επηρεάζει µε την σειρά του σηµαντικά την ισχύ του θορύβου. Το υλικό κατασκευής του υποστρώµατος µπορεί να µειώσει την ευαισθησία του σήµατος, επηρεάζοντας µε τον τρόπο αυτό τον φθορισµό του υποβάθρου, ενώ η λανθασµένη µεταχείριση της επιφάνειας έχει σαν αποτέλεσµα την αδύναµη επισύναψη του DNA στο υπόστρωµα και την ελάττωση της ισχύος του σήµατος. Τέλος, τα υπολείµµατα υλικών, ο 101
102 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας λανθασµένος χειρισµός του chip και το στέγνωµα του υποστρώµατος οδηγούν και αυτά, σε αυξηµένο φθορισµό υποβάθρου. Η µόλυνση αποτελεί µια ακόµη σηµαντική πηγή προβληµάτων κατά την επεξεργασία της εικόνας µικροσυστοιχίας. Από την διαδικασία τοποθέτησης των spot µέχρι τα πειράµατα υβριδοποίησης, υπάρχει στην ατµόσφαιρα σκόνη που επικάθεται παντού. Η σκόνη που υπάρχει στο συµπαγές υπόστρωµα έχει σαν αποτέλεσµα την αύξηση της φωτεινότητας της σαρωµένης εικόνας. Επιπλέον, ορισµένες διαδικασίες στεγνώµατος µπορούν να δηµιουργήσουν ένα είδος «καρούµπαλου» στην επιφάνεια του spot, προκαλώντας κατοπτρικές ανακλάσεις στις εικόνες. Η µόλυνση µπορεί να προέρχεται ακόµη από τον τρόπο τοποθέτησης του DNA υλικού, αφού η µη σωστή τοποθέτηση του µπορεί να δηµιουργήσει κηλίδες και πιτσιλιές στο υπόστρωµα. Μια λύση στο πρόβληµα της µόλυνσης είναι η αποµάκρυνση της πριν ακόµη αρχίσουν να γίνονται µετρήσεις. 5.2 Αποθορυβοποίηση µικροσυστοιχιών Μετά την απόκτηση της εικόνας µικροσυστοιχίας, για να µειωθεί ο θόρυβος και οι αλλοιώσεις που υπάρχουν σε αυτή, λαµβάνουν χώρα διαδικασίες επεξεργασίας εικόνας, όπως είναι η αποθορυβοποίηση και η βελτίωση της ποιότητας της εικόνας µικροσυστοιχίας. (α) (β) Σχήµα 5.2: (α) Πραγµατική εικόνα µε έντονη την παρουσία θορύβου, (β) Η ίδια εικόνα µετά την διαδικασία αποθορυβοποίησης [4]. Στην αποθορυβοποίηση των ιατρικών εικόνων και των εικόνων µικροσυστοιχίας έχουν εφαρµοστεί αρκετές µέθοδοι και τεχνικές που οδηγούν στην, όσο το δυνατόν, πιο βελτιωµένη µορφή τους. Χαρακτηριστικά αναφέρονται ορισµένες από αυτές τις 102
103 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας µεθόδους, όπως αυτές έχουν παρουσιαστεί τα τελευταία χρόνια στην επεξεργασία των ιατρικών εικόνων και στην ανάλυση των εικόνων µικροσυστοιχίας: µετασχηµατισµός κυµατιδίου, multi-resolution ανάλυση, φιλτράρισµα ασαφών διανυσµάτων, µαθηµατική µορφολογία και τέλος τα χωρικά φίλτρα [5-10] Αποθορυβοποίηση µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου Μια από τις βασικές προσεγγίσεις που αφορούν στην αποθορυβοποίηση της εικόνας µικροσυστοιχίας, και που παρουσιάζεται στο κεφάλαιο αυτό στα πλαίσια σύγκρισης µεθόδων αποθορυβοποίησης, είναι η µέθοδος που βασίζεται στα χωρικά φίλτρα. Τα χωρικά φίλτρα χρησιµοποιούν χωρικές µάσκες για την επεξεργασία των ψηφιακών εικόνων και κατηγοριοποιούνται σε γραµµικά και µη γραµµικά. Το φίλτρο ενδιάµεσης τιµής (median) είναι το πιο απλό µη γραµµικό φίλτρο, µε την βασική του συνάρτηση µεταφοράς να υπολογίζει την µέση τιµή φωτεινότητας των εικονοστοιχείων στην γειτονιά όπου τοποθετείται το φίλτρο, ενώ θεωρείται αρκετά αποτελεσµατικό στην µείωση του κρουστικού θορύβου, χαρακτηριστικότερος των οποίων είναι ο θόρυβος τύπου «αλάτι και πιπέρι». Στην εργασία των Hsin-Cheng Huang και Thomas C. M. Lee [11] παρουσιάζεται µια τέτοια µέθοδος αποθορυβοποίησης σήµατος και εικόνας που βασίζεται στην εφαρµογή του φίλτρου ενδιάµεσης τιµής. Το γραµµικό χωρικό φίλτρο Wiener χρησιµοποιείται για τον υπολογισµό ενός επιθυµητού σήµατος το οποίο προέρχεται από κάποιο άλλο σήµα και στο οποίο αυτό περιλαµβάνεται. Το φίλτρο Wiener είναι η δεύτερη µέθοδος αποθορυβοποίησης εικόνων µικροσυστοιχίας, που παρουσιάζεται στο κεφάλαιο αυτό στα πλαίσια σύγκρισης µεθόδων αποθορυβοποίησης, Κατά την εφαρµογή του, το φίλτρο Wiener χρειάζεται σαν εισαγωγική πληροφορία το αρχικό σήµα µε τον θόρυβο, µε στόχο την ελαχιστοποίηση της επίδρασης του θορύβου στην έξοδο του φίλτρου σύµφωνα µε κάποιες στατιστικές παραµέτρους (π.χ. συναρτήσεις συσχέτισης). Το Wiener φίλτρο είναι το καταλληλότερο φίλτρο για την αποµάκρυνση του προσθετικού Gaussian θορύβου όταν χρησιµοποιείται σαν κριτήριο ελαχιστοποίησης σφάλµατος, το µέσο τετραγωνικό λάθος που αντιστοιχεί στην διαφορά µεταξύ του επιθυµητού αποτελέσµατος και του αποτελέσµατος που προκύπτει στην έξοδο του φίλτρου. 103
104 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Η τρίτη προσέγγιση που αφορά στην σύγκριση των µεθόδων αποθορυβοποίησης των εικόνων µικροσυστοιχίας αναφέρεται στον µετασχηµατισµό κυµατιδίου. Ο µετασχηµατισµός κυµατιδίου χρησιµοποιείται ευρέως στην επεξεργασία των ψηφιακών εικόνων και παρουσιάζει ικανοποιητικά αποτελέσµατα στην τεχνολογία των µικροσυστοιχιών, ενώ χαρακτηριστική είναι η παρουσία του στην αποθορυβοποίηση των εικόνων µικροσυστοιχίας ειδικά στην περίπτωση που υπάρχει προσθετικός Gaussian θόρυβος [12]. Στο πεδίο των ιατρικών εικόνων, ο µετασχηµατισµός κυµατιδίου προτάθηκε αρχικά το 1991 σε επιστηµονικό περιοδικό περιγράφοντας την εφαρµογή του στην µείωση του θορύβου σε εικόνες MRI [13]. Χαρακτηριστικά αναφέρεται ότι το 2003, ο µετασχηµατισµός κυµατιδίου χρησιµοποιήθηκε για την ενίσχυση της ποιότητας των εικόνων µικροσυστοιχίας [14], δείχνοντας εξαιρετική απόδοση σε σχέση µε µεθόδους βασιζόµενες στο φίλτρο Wiener Πειραµατική διαδικασία αποθορυβοποίησης µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου Στο παράγραφο αυτή του κεφαλαίου, η περιγραφή των µεθόδων αποθορυβοποίησης, ακολουθεί τα παρακάτω βήµατα: Επιλογή οµάδας υποµικροσυστοιχιών που περιέχουν τον ελάχιστο δυνατό θόρυβο από µια βάση δεδοµένων που περιέχει εικόνες µικροσυστοιχίας. Χρήση προσθετικού θορύβου τύπου «αλάτι και πιπέρι» και Gaussian θορύβου προκειµένου να παραµορφωθούν οι επιλεγµένες εικόνες µικροσυστοιχίας. Εφαρµογή µεθόδων αποθορυβοποίησης και δηµιουργία νέων βελτιωµένων εικόνων µικροσυστοιχίας. Ποσοτική εκτίµηση της αξιοπιστίας των µεθόδων αποθορυβοποίησης µε χρήση αντικειµενικών κριτηρίων αξιοπιστίας, όπως το PSNR και η βελτίωση του λόγου σήµατος προς θόρυβο (SNR) µετά την αποθορυβοποίηση. Στην περίπτωση των χωρικών φίλτρων για το µεν φίλτρο ενδιάµεσης τιµής το χωρικό παράθυρο επιλέγεται να είναι 3x3 εικονοστοιχεία, για το δε φίλτρο Wiener το µέγεθος του παράθυρου είναι 5x5 εικονοστοιχεία. Στον µετασχηµατισµό κυµατιδίου εφαρµόζονται οι οικογένειες κυµατιδίου haar, db2, sym2, bior1.1, coif και 104
105 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας επιλέγονται οι µέθοδοι αποθορυβοποίησης µε soft και hard κατώφλι και δυο επίπεδα ανάλυσης. Όπως, χαρακτηριστικά, φαίνεται στα σχήµατα 5.3 και 5.4, ο θόρυβος στις υποµικροσυστοιχίες µοντελοποιήθηκε είτε σαν προσθετική συνιστώσα τύπου «αλάτι και πιπέρι» ( impulse ) είτε µε Gaussian, αντίστοιχα, σε τέσσερα διαφορετικά επίπεδα θορύβου. (α) (β) Σχήµα 5.3: Υποµικροσυστοιχία πριν (α) και µετά (β) την εφαρµογή θορύβου τύπου «αλάτι και πιπέρι» µε διασπορά 0.04 όταν η δυναµική περιοχή φωτεινότητας είναι [0,1].. (α) (β) Σχήµα 5.4: Υποµικροσυστοιχία πριν (α) και µετά (β) την εφαρµογή Gaussian θορύβου µε διασπορά 0.04, όταν η δυναµ µική περιοχή φωτεινότητας είναι [0,1]. Για την ποσοτικοποίηση της διαφοράς που δηµιουργείται µεταξύ των υποµικροσυστοιχιών µε θόρυβο και των ανακατασκευασµένων εικόνων µετά την 105
106 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας εφαρµογή των µεθόδων αποθορυβοποίησης, χρησιµοποιούνται δύο κριτήρια, το SNR (εξίσωση 1) και το PSNR (εξίσωση 2). Όσο πιο µεγάλο είναι το PSNR τόσο καλύτερη είναι η ποιότητα των αποθορυβοποιηµένων εικόνων. Psignal SNR ( db) = 10log 10 Pnoise, (1) όπου P signal είναι η ισχύς του σήµατος και P noise είναι η ισχύς του θορύβου. 1 mn 2 MAX I PSNR ( db) = 10log 10 MSE, (2) m 1 n 1 2 είναι το µέσο τετραγωνικό λάθος. Το I i= 0 j= 0 όπου MSE = I( i, j) K( i, j) αντιστοιχεί στην m n αρχική υποµικροσυστοιχία η οποία θεωρείται ότι δεν περιέχει θόρυβο και K είναι η αντίστοιχη ανακατασκευασµένη εικόνα Πειραµατικά αποτελέσµατα αποθορυβοποίησης µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου Οι µέθοδοι αποθορυβοποίησης µε χωρικά φίλτρα και µετασχηµατισµό κυµατιδίου εφαρµόστηκαν στη βάση δεδοµένων Human Sarcomas που περιέχει 34 εικόνες µικροσυστοιχίας κάθε µια των οποίων αποτελείται από 32 υποµικροσυστοιχίες [15]. Η επιλογή των υποµικροσυστοιχιών πραγµατοποιήθηκε µε κριτήριο το επίπεδο του θορύβου που συναντάται σε αυτές. Από το συνολικό αριθµό των 1088 υποµικροσυστοιχιών, που αποτελούν την υπό εξέταση βάση δεδοµένων, επιλέχθηκαν οι υποµικροσυστοιχίες µε τον λιγότερο θόρυβο. Οι περισσότερες εικόνες µικροσυστοιχίας που περιέχονται στην βάση παρουσιάζουν ένα εξαιρετικά υψηλό θόρυβο υποβάθρου και µόνο 150 υποµικροσυστοιχίες από τις εικόνες αυτές θεωρήθηκαν, µε υποκειµενικό τρόπο, ότι έχουν πολύ µικρή ισχύ θορύβου υποβάθρου. Σύµφωνα µε τα πειραµατικά αποτελέσµατα, το φίλτρο ενδιάµεσης τιµής είναι, αναµενόµενα, πιο αποτελεσµατικό στην περίπτωση του θορύβου τύπου «αλάτι και πιπέρι» σε σχέση µε το PSNR που προκύπτει παρουσία προσθετικού Gaussian θορύβου. Το φίλτρο ενδιάµεσης τιµής αποδεικνύεται αποτελεσµατικό ως προς την 106
107 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας αποθορυβοποίηση των εικόνων, για όλα τα επίπεδα θορύβου, δίνοντας παρόµοιες PSNR τιµές στην περίπτωση προσθετικού θορύβου τύπου «αλάτι και πιπέρι». Αντίθετα, χρησιµοποιώντας το φίλτρο Wiener ο ρυθµός µείωσης του θορύβου ελαττώνεται όταν το επίπεδο του θορύβου αυξάνεται και για τα δυο είδη προσθετικού θορύβου. Στα διαγράµµατα των σχηµάτων 5.5 και 5.6 δίνονται τα πειραµατικά αποτελέσµατα µεθόδων αφαίρεσης θορύβου σαν συνάρτηση της ισχύος του θορύβου στα αντικειµενικά κριτήρια αξιοπιστίας PSNR και SNR για το φίλτρο ενδιάµεσης τιµής, παρουσία θορύβου τύπου «αλάτι και πιπέρι» και για το φίλτρο Wiener αντίστοιχα, παρουσία Gaussian προσθετικού θορύβου. ιάγραµµα Φίλτρου Ενδιάµεσης Τιµής Θόρυβος Τύπου "αλάτι και πιπέρι" ,04E-160,01 0,02 0,03 0,04 0,05 ιασπορά PSNR (db) SNR (db) Σχήµα 5.5: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται φίλτρο ενδιάµεσης τιµής. ιάγραµµα Φίλτρου Wiener 35 Gaussian θόρυβος ,01 0,02 0,03 0,04 0,05 PSNR (db) SNR (db) ιασπορά Σχήµα 5.6: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται το φίλτρο Wiener. 107
108 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Τα πειραµατικά αποτελέσµατα δείχνουν ότι οι µέθοδοι αποθορυβοποίησης µε µετασχηµατισµό κυµατιδίου είναι πιο αποτελεσµατικές παρουσία Gaussian προσθετικού θορύβου σε σχέση µε τα αποτελέσµατα που προκύπτουν παρουσία προσθετικού θορύβου τύπου «αλάτι και πιπέρι», γεγονός που ισχύει και για τα δυο είδη κατωφλίωσης. Στα διαγράµµατα των σχηµάτων 5.7, 5.8, 5.9 και 5.10 δίνονται τα πειραµατικά αποτελέσµατα µέτρησης των αντικειµενικών κριτηρίων αξιοπιστίας PSNR και SNR για το µετασχηµατισµό κυµατιδίου coif σαν συνάρτηση της διασποράς του Gaussian προσθετικού θορύβου, παρουσία θορύβου τύπου «αλάτι και πιπέρι» και τα δυο είδη κατωφλίωσης. Θόρυβος Τύπου "αλάτι και πιπέρι" ιάγραµµα Μετασχηµατισµού κυµατιδίου coif (Soft κατώφλι) 0 0,01 0,02 0,03 0,04 0,05 ιασπορά PSNR SNR Σχήµα 5.7: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε soft κατώφλι. Στα σχήµατα 5.11 και 5.12 δίνονται δυο παραδείγµατα αποθορυβοποίησης υποµικροσυστοιχιών χρησιµοποιώντας φίλτρο ενδιάµεσης τιµής και µετασχηµατισµό κυµατιδίου bior1.1, αντίστοιχα. 108
109 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Θόρυβος Τύπου "αλάτι και πιπέρι" ιάγραµµα Μετασχηµατισµού κυµατιδίου coif (Hard κατώφλι) 0 0,01 0,02 0,03 0,04 0,05 ιασπορά PSNR SNR Σχήµα 5.8: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του θορύβου τύπου «αλάτι και πιπέρι» όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε hard κατώφλι. ιάγραµµα Μετασχηµατισµού κυµατιδίου coif (Soft κατώφλι) 35 Gaussian θόρυβος ,01 0,02 0,03 0,04 0,05 PSNR SNR ιασπορά Σχήµα 5.9: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε soft κατώφλι. 109
110 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας ιάγραµµα Μετασχηµατισµού κυµατιδίου coif (Hard κατώφλι) 35 Gaussian θόρυβος ,01 0,02 0,03 0,04 0,05 PSNR SNR ιασπορά Σχήµα 5.10: PSNR και βελτίωση του SNR σαν συνάρτηση της διασποράς του Gaussian θορύβου όταν εφαρµόζεται µετασχηµατισµός κυµατιδίου coif µε hard κατώφλι. Υποµικροσυστοιχία Θόρυβος τύπου Υποµικροσυστοιχία µε θόρυβο Υποµικροσυστοιχία µετά την εφαρµογή του φίλτρου ενδιάµεσης τιµής Σχήµα 5.11: Παράδειγµα αποθορυβοποίησης υποµικροσυστοιχίας µε φίλτρο ενδιάµεσης τιµής. Στην υποµικροσυστοιχία προστέθηκε θόρυβος τύπου «αλάτι και πιπέρι» µε διασπορά
111 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Υποµικροσυστοιχία Gaussian θόρυβος Υποµικροσυστοιχία µε θόρυβο Υποµικροσυστοιχία µετά την εφαρµογή µετασχηµατισµού κυµατιδίου bior1.1 Σχήµα 5.12: Παράδειγµα αποθορυβοποίησης υποµικροσυστοιχίας µε µετασχηµατισµό κυµατιδίου bior1.1, soft κατώφλι και δυο επίπεδα ανάλυσης. Στην υποµικροσυστοιχία προστέθηκε θόρυβος τύπου «αλάτι και πιπέρι» µε διασπορά Αποθορυβοποίηση µε µεθόδους µαθηµατικής µορφολογίας Η µαθηµατική µορφολογία αποτελεί µια αποτελεσµατική µη-γραµµική τεχνική επεξεργασίας δυαδικών εικόνων µε εφαρµογές σε αρκετά πεδία επιστηµών, συµπεριλαµβανοµένης της ιατρικής διάγνωσης, της ιστολογίας, της µηχανικής όρασης και της οπτικής αναγνώρισης χαρακτήρων [16-17]. Υπάρχουν δυο βασικοί µορφολογικοί µετασχηµατισµοί: η συστολή (erosion) και η διαστολή (dilation). Οι µετασχηµατισµοί αυτοί αφορούν στην αλληλεπίδραση µεταξύ µιας εικόνας A (αντικείµενο ενδιαφέροντος) και µιας κατασκευαστικής δοµής B, που καλείται κατασκευαστικό στοιχείο (structuring element). Η µορφολογική συστολή µιας δυαδικής εικόνας A από το κατασκευαστικό στοιχείο B ορίζεται από την ακόλουθη µαθηµατική εξίσωση: Θ = I b. b B A B A 111
112 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας Η µορφολογική διαστολή µιας δυαδικής εικόνας A από το κατασκευαστικό στοιχείο B ορίζεται από την ακόλουθη µαθηµατική εξίσωση: =U b. b B A B A Τόσο η συστολή όσο και η διαστολή µπορούν να χρησιµοποιηθούν µε πολλούς τρόπους, παράλληλα και σε σειρά, για να δώσουν άλλους µετασχηµατισµούς συµπεριλαµβανοµένων της πάχυνσης (thickening), λέπτυνσης (thinning), σκελετοποίησης (skeletonisation) και πολλών άλλων [18] Πειραµατική διαδικασία και αποτελέσµατα αποθορυβοποίησης µε µεθόδους µαθηµατικής µορφολογίας Η πειραµατική διαδικασία που ακολουθείται στην περίπτωση της αποθορυβοποίησης µε µεθόδους µαθηµατικής µορφολογίας αποτελείται από τα παρακάτω βήµατα: Η αρχική εικόνα υποµικροσυστοιχίας δύο καναλιών, µετατρέπεται σε εικόνα διαβαθµίσεων του γκρι. Η µετατροπή της αρχικής εικόνας σε εικόνα διαβαθµίσεων του γκρι ενισχύει τις πραγµατικές περιοχές των spot ενώ ταυτόχρονα µειώνει την ένταση του θορύβου στις περιπτώσεις εκείνες όπου ο θόρυβος επηρεάζει µεµονωµένα το πράσινο και το κόκκινο κανάλι (σχ. 5.13). Ένα φίλτρο ενδιάµεσης τιµής εφαρµόζεται για να µειωθεί ο θόρυβος τύπου «αλάτι και πιπέρι». Μετά την εφαρµογή του φίλτρου, η εικόνα διαβαθµίσεων του γκρι µετατρέπεται σε δυαδική, χρησιµοποιώντας έναν αυτόµατο εκτιµητή φίλτρου όπως αυτός προτείνεται από τον Otsu [19]. Όλες οι αποµονωµένες περιοχές της δυαδικής εικόνας ταυτοποιούνται σαν ανεξάρτητα αντικείµενα. Στην συνέχεια, µία συνάρτηση κατηγοριοποίησης ταξινοµεί τις ανεξάρτητες περιοχές A, µε την χρήση ενός κατωφλίου επιφάνειας S 1. Αν R είναι η spot ακτίνα, τότε το κατώφλι S 1 τίθεται ίσο µε πr 2 εικονοστοιχεία. Όλα τα 112
113 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας αντικείµενα των οποίων η περιοχή A ικανοποιεί το κριτήριο A <= S 1, ταξινοµούνται σαν αντικείµενα θορύβου, πολύ µικρά spot ή εναποµείναντα τµήµατα από spot. Όλες οι υπόλοιπες περιοχές ενδιαφέροντος περιέχουν spot και έναν ελάχιστο αριθµό από αντικείµενα θορύβου που δεν κατηγοριοποιήθηκαν σωστά κατά την διαδικασία ταξινόµησης. Όλα τα αντικείµενα θορύβου αφαιρούνται από την δυαδική εικόνα. Η προκύπτουσα από την διαδικασία της ταξινόµησης εικόνα υποµικροσυστοιχίας περιέχει µόνο τα αρκετά φθορίζοντα spot και είναι σχεδόν αποθορυβοποιηµένη. Η προτεινόµενη µέθοδος αποθορυβοποίησης, βασιζόµενη στις αρχές της µαθηµατικής µορφολογίας, εφαρµόστηκε σε δυο βάσεις δεδοµένων, την Human Sarcomas που περιέχει 34 µικροσυστοιχίες των 32 υποµικροσυστοιχιών [15], και την Lymphoma/Leukemia Molecular Profiling Project (LLMPP) από την οποία επιλέχθηκαν τυχαία 36 cdna µικροσυστοιχίες των 16 υποµικροσυστοιχιών [20]. Κατά την πειραµατική διαδικασία, η spot ακτίνα R τέθηκε ίση µε πέντε εικονοστοιχεία και για τις δυο βάσεις δεδοµένων [21], ενώ όλες οι περιοχές A που περιέχουν S 1 =25 εικονοστοιχεία ή και λιγότερα αποµακρύνθηκαν από την δυαδική εικόνα. Στα σχήµατα 5.14 και 5.15 δίνονται δυο χαρακτηριστικά παραδείγµατα εφαρµογής µεθόδων µαθηµατικής µορφολογίας σε υποµικροσυστοιχίες της Human Sarcomas και της LLMPP βάσης, αντίστοιχα. (α) (β) Σχήµα 5.13: (α) Υποµικροσυστοιχία διαβαθµίσεων του γκρι από την βάση δεδοµένων Human Sarcomas, (β) Βελτιωµένη έκδοση της εικόνας υποµικροσυστοιχίας. 113
114 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας (α) (β) Σχήµα 5.14: (α) υαδική εικόνα υποµικροσυστοιχίας από την βάση δεδοµένων Human Sarcomas, (β) Αποθορυβοποιηµένη υποµικροσυστοιχία µε χρήση µεθόδου βασιζόµενης στην µαθηµατική µορφολογία. (α) (β) Σχήµα 5.15: (α) υαδική εικόνα υποµικροσυστοιχίας από την βάση δεδοµένων LLMPP, (β) Αποθορυβοποιηµένη υποµικροσυστοιχία µε χρήση µεθόδου βασιζόµενης στην µαθηµατική µορφολογία. 114
115 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας 5.3 Αναφορές 5 ου κεφαλαίου [1] Gerda Kamberova, Shishir Shah, DNA Array, Image Analysis, Nuts & Bolts, DNA Press LLC, [2] P. E. Kloeden, E. Platen, Numerical Solution of Stochastic Differential Equations, Application of Mathematics, vol. 23, Springer, Berlin, [3] Latha Ramdas, Wei Zhang, Microarray image scanning, Methods in Molecular Biology, Springer, vol. 319, pp , [4] Ratislav Lukac, Color image processing, [5] M. Mastriani, A. Giraldez, Microarrays denoising via smoothing of coefficients in wavelet domain, WSEAS Transactions on Biology and Biomedicine, [6] Hara Stefanou, Thanasis Margaritis, Dimitris Kafetzopoulos, Konstantinos Marias, Panagiotis Tsakalides, Microarray Image Denoising Using a Two-Stage Multiresolution Technique, IEEE International Conference on Bioinformatics and Biomedicine, California, [7] Rastislav Lukac, Konstantinos N. Plataniotis, Bogdan Smolka, Anastasios N. Venetsanopoulos, cdna Microarray Image Processing using Fuzzy Vector Filtering Framework, Fuzzy sets and systems, vol.152, pp , [8] Felix Meyenhofer, Olivier Schaad, Patrick Descombes, Michel Kocher, Automatic analysis of microrna Microarray images using Mathematical Morphology, Proceedings of the 29th Annual InternationalConference of the IEEE EMBS, Lyon, France,
116 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας [9] Anders Bengtsson, Henrik Bengtsson, Microarray image analysis: background estimation using quantile and morphological filters, BMC Bioinformatics, vol.7, pp.:96, [10] Aydogan Ozcan, Alberto Bilenca, Adrien E. Desjardins, Brett E. Bouma, Guillermo J. Tearney, Speckle reduction in optical coherence tomography images using digital filtering, JOSA A, vol. 24, pp , 2007 [11] Hsin-Cheng Huang, Thomas C. M. Lee, Data Adaptive Median Filters for Signal and Image Denoising Using a Generalized SURE Criterion IEEE Signal Processing Letters, vol. 13, no. 9, September [12] Weaver, J. B., Yansun, X., Healy, D. M., and Cromwell, L. D., Filtering noise from images with wavelet transforms, Magnetic Resonance in Medicine, vol. 21, no. 2, pp , [13] Weaver, J. B., Yansun, X., Healy, D. M., and Cromwell, L. D., Filtering noise from images with wavelet transforms, Magnetic Resonance in Medicine, vol. 21, no. 2, pp , [14] X. H. Wang, Robert S. H. Istepanian, and Yong Hua Song, Microarray Image Enhancement by Denoising Using Stationary Wavelet Transform, IEEE Trans. on Nanobioscience, vol. 2, no. 4, Dec [15] Human Sarcomas database, [16] Felix Meyenhofer, Olivier Schaad, Patrick Descombes, Michel Kocher, Automatic analysis of microrna Microarray images using Mathematical Morphology, Proceedings of the 29th Annual International Conference of the IEEE EMBS Cité Internationale, Lyon, France, (2007). [17] Chiao-Ling Shih, Hung-Wen Chiu, Automatic spot detection of cdna microarray images using mathematical morphology methods, IEEE EMBS Asian- Pacific Conference on Biomedical Engineering, (2003). 116
117 Κεφάλαιο 5: Αποθορυβοποίηση εικόνας µικροσυστοιχίας [18] ode3.html. [19] N. Otsu, A threshold selection method from gray-level histograms, IEEE Trans. Sys. Man., Cyber, vol.9, pp , (1979). [20] The Lymphoma/Leukemia Molecular Profiling Project database, [21] Peter Bajcsy, 117
118 118
119 Κεφάλαιο 6 Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker
120 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker 120
121 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker 6. 1 Εισαγωγή Στην τεχνολογία των µικροσυστοιχιών, στόχος της διαδικασίας κατάτµησης είναι η κατηγοριοποίηση των εικονοστοιχείων της εικόνας είτε σε εικονοστοιχεία των spot που περιέχουν την χρήσιµη πληροφορία για τα υπό εξέταση γονίδια είτε σε εικονοστοιχεία υποβάθρου [1]. Σε αυτό στάδιο της ανάλυσης των εικόνων µικροσυστοιχίας, οποιαδήποτε σφάλµατα που αφορούν στο µέγεθος και στο σχήµα των spot όπως επίσης και τα προβλήµατα µόλυνσης της εικόνας, επηρεάζουν σηµαντικά την διαδικασία κατάτµησης και τον σχεδιασµό των αντίστοιχων αλγορίθµων. Στο πεδίο έρευνας της κατάτµησης των µικροσυστοιχιών, έχουν δηµιουργηθεί διάφορες µέθοδοι για τον εντοπισµό των εικονοστοιχείων των spot, καθεµία από τις οποίες παρουσιάζει τα δικά της πλεονεκτήµατα και µειονεκτήµατα. Οι µέθοδοι αυτές µπορούν να κατηγοριοποιηθούν σε πέντε κατηγορίες βάσει του τρόπου εξαγωγής της χρήσιµης πληροφορίας: 1. Κατάτµηση εικόνας µικροσυστοιχίας χρησιµοποιώντας χωρική πληροφορία Οι µέθοδοι της κατηγορίας αυτής, γνωστές και ως µέθοδοι κατάτµησης σταθερού κύκλου (fixed circle segmentation methods), χρησιµοποιούν αποκλειστικά την χωρική πληροφορία που προκύπτει από το στάδιο της διευθυνσιοδότησης, για τον εντοπισµό των εικονοστοιχείων των spot. Κατά το πρώτο στάδιο της ανάλυσης των εικόνων µικροσυστοιχίας, που αφορά στην διευθυνσιοδότηση των spot, καθορίζεται η θέση και το µέγεθος του κάθε spot των υπό εξέταση µικροσυστοιχιών. Στην συνέχεια, στο στάδιο της κατάτµησης, µια µάσκα κυκλικού σχήµατος και µεγέθους ίσου µε το υπολογισµένο µέγεθος του spot, τοποθετείται πάνω στην προκαθορισµένη θέση και λαµβάνει χώρα ο διαχωρισµός του σήµατος από το υπόβαθρο. Η κατάτµηση πραγµατοποιείται θεωρώντας ως δεδοµένο ότι τα εικονοστοιχεία που βρίσκονται µέσα στον κύκλο αντιστοιχούν στο πραγµατικό σήµα ενώ έξω από τον κύκλο βρίσκονται τα εικονοστοιχεία που ανήκουν στο υπόβαθρο της εικόνας. Έχοντας υπόψιν την προϋπόθεση αυτή, ακολουθεί η πραγµατοποίηση των µετρήσεων στα κατηγοριοποιηµένα πλέον εικονοστοιχεία [1]. Η χρήση των µεθόδων που βασίζονται στην χωρική πληροφορία, είναι αποδοτική 121
122 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker στις περιπτώσεις που η διαδικασία διευθυνσιοδότησης που προηγείται, έχει γίνει µε τέτοιο τρόπο ώστε να δίνει σωστές µετρήσεις για την θέση και το µέγεθος των spot, το σχήµα των spot πλησιάζει αρκετά το ιδανικό κυκλικό σχήµα και δεν υπάρχει ίχνος µόλυνσης πάνω στην εικόνα µικροσυστοιχίας. Όταν είναι γνωστά τα γεωµετρικά χαρακτηριστικά της εικόνας και η απόσταση µεταξύ των spot, µπορεί να πραγµατοποιηθεί και ο εντοπισµός των εικονοστοιχείων που βρίσκονται εκτός του κύκλου του spot. Στην πραγµατικότητα όµως, σχεδόν σε όλες τις εικόνες µικροσυστοιχίας συναντώνται σφάλµατα, γεγονός που οδηγεί στο συµπέρασµα ότι παρά το ότι οι µέθοδοι που βασίζονται στην χωρική πληροφορία έχουν µικρό υπολογιστικό κόστος, θεωρούνται επικίνδυνα ανακριβείς [1]. (α) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα (β) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα Σχήµα 6.1: Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει χωρικής πληροφορίας και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης. 2. Κατάτµηση εικόνας µικροσυστοιχίας χρησιµοποιώντας την ένταση φωτεινότητας των εικονοστοιχείων Οι µέθοδοι της δεύτερης κατηγορίας κατάτµησης εικόνων µικροσυστοιχίας, χρησιµοποιούν αποκλειστικά την πληροφορία που προκύπτει από την µετρούµενη 122
123 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker ένταση φωτεινότητας στην υπό εξέταση εικόνα. Στην περίπτωση αυτή, τίθεται ως προϋπόθεση για την σωστή εφαρµογή των µεθόδων, ότι τα εικονοστοιχεία των spot είναι στατιστικά πιο φωτεινά από τα εικονοστοιχεία που ανήκουν στο υπόβαθρο της εικόνας. Έστω, παραδείγµατος χάριν, µια µικρή τετράγωνη περιοχή της εικόνας µικροσυστοιχίας γύρω από ένα spot µε διάµετρο 20 εικονοστοιχεία, η οποία αποτελείται από 40x40 εικονοστοιχεία. Από τα στοιχεία αυτά, µπορεί να υπολογιστεί εύκολα ότι από τον συνολικό αριθµό των 1600 εικονοστοιχείων της υπό εξέταση περιοχής, περίπου 314 (π10 2 ) εικονοστοιχεία ή διαφορετικά το 20% όλων των εικονοστοιχείων, ανήκουν σε εικονοστοιχεία σήµατος και είναι αυτά για τα οποία η τιµή της έντασης αναµένεται να έχει τιµή µεγαλύτερη από την τιµή της έντασης που συναντάται στα υπόλοιπα εικονοστοιχεία. Προκειµένου να εντοπιστούν τα εικονοστοιχεία που ανήκουν στα spot, όλα τα εικονοστοιχεία της υπό εξέταση περιοχής τοποθετούνται σε ένα µονοδιάστατο πίνακα βάσει της έντασης τους, από την πιο χαµηλή τιµή προς πιο υψηλή, {p 1,p 2,p 3,,p 1600 }, όπου p ν είναι η τιµή της έντασης του ν οστου εικονοστοιχείου µε την χαµηλότερη τιµή έντασης. Αν δεν υπάρχει καθόλου µόλυνση στην συγκεκριµένη περιοχή της εικόνας µικροσυστοιχίας, τότε το 20% των εικονοστοιχείων από τον πίνακα κατάταξης µε την µεγαλύτερη ένταση κατατάσσεται στην κατηγορία των spot. Το πλεονέκτηµα των µεθόδων αυτών έγκειται στην απλότητα τους και την γρήγορη απόκριση τους όταν εφαρµόζονται σε καθαρές εικόνες που παρουσιάζουν µεγάλη αντίθεση ανάµεσα στο σήµα και το υπόβαθρο. Αντιθέτως, παρουσιάζουν αρκετά µειονεκτήµατα στην περίπτωση που έχουν να αντιµετωπίσουν εικόνες µικροσυστοιχίας µε θόρυβο και spot χαµηλής φωτεινότητας [1]. 3. Κατάτµηση εικόνας µικροσυστοιχίας χρησιµοποιώντας την µέθοδο Mann- Whitney Στην τρίτη κατηγορία, η κατηγοριοποίηση των εικονοστοιχείων της εικόνας µικροσυστοιχίας πραγµατοποιείται βάσει ενός κατωφλίου έντασης που ορίζεται από την τεχνική ελέγχου των Mann-Whitney [2]. Πιο αναλυτικά, όπως και στην πρώτη περίπτωση κατάτµησης βάσει χωρικής πληροφορίας, µια κυκλική µάσκα τοποθετείται στην υπό εξέταση περιοχή. Σύµφωνα µε την πρώτη κατηγορία, όλα τα εικονοστοιχεία που βρίσκονται εκτός κύκλου θεωρείται ότι ανήκουν στο υπόβαθρο της εικόνας [1]. 123
124 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Η κατάτµηση της εικόνας µικροσυστοιχίας βάσει της τεχνικής ελέγχου των Mann- Whitney πραγµατοποιείται ακολουθώντας τα παρακάτω βήµατα: Βήµα 1. Επιλέγονται τυχαία κάποια εικονοστοιχεία που ανήκουν στο υπόβαθρο (π.χ. 10 εικονοστοιχεία), η τιµή των οποίων αποτελεί το πρώτο δείγµα. Βήµα 2. Επιλέγεται ο ίδιος αριθµός από τα εικονοστοιχεία σήµατος που βρίσκονται µέσα σε µια κυκλική µάσκα, µε την προϋπόθεση ότι ανήκουν σε αυτά που έχουν τις χαµηλότερες τιµές έντασης και δηµιουργείται το δεύτερο δείγµα. Βήµα 3. Χρησιµοποιώντας την τεχνική ελέγχου των Mann-Whitney ελέγχονται τα δυο δείγµατα ώστε να έχουν την ίδια µέση τιµή. Βήµα 4. Αν τα δείγµατα περάσουν τον έλεγχο, το δεύτερο δείγµα αντικαθίσταται από άλλα εικονοστοιχεία που βρίσκονται µέσα στην κυκλική µάσκα και πάλι µε τις χαµηλότερες τιµές έντασης και δηµιουργείται ένα τρίτο δείγµα. Βήµα 5. Ο έλεγχος συνεχίζεται µέχρι δυο δείγµατα να αποτύχουν να περάσουν τον έλεγχο. Τα εικονοστοιχεία που βρίσκονται µέσα στον κύκλο µε τιµή έντασης υψηλότερη από την ελάχιστη ένταση των εικονοστοιχείων του δείγµατος σήµατος αναγνωρίζονται σαν σήµα [1]. Η µέθοδος επιτυγχάνει µια σωστή κατάτµηση όταν στις εικόνες µικροσυστοιχίας στις οποίες εφαρµόζεται, η θέση των spot έχει βρεθεί µε ακρίβεια και δεν υπάρχει µόλυνση. Εν τούτοις, όταν µέσα στην κυκλική µάσκα υπάρχουν εικονοστοιχεία µόλυνσης, αυτά θα θεωρηθούν ότι είναι εικονοστοιχεία του spot λόγω του ότι η τυπική µόλυνση έχει υψηλότερη ένταση φωτεινότητας από το υπόβαθρο. Αν υπάρχουν εικονοστοιχεία µόλυνσης εκτός κύκλου ή η θέση των spot δεν είναι ακριβής, µε αποτέλεσµα να υπάρχουν εικονοστοιχεία των spot εκτός της κυκλικής µάσκας, τότε η υψηλή ένταση αυτών των εικονοστοιχείων θα αυξήσει την ένταση κατωφλίου. Κατά συνέπεια, τα εικονοστοιχεία του δείγµατος που έχουν ένταση µικρότερη από το κατώφλι θα ταξινοµηθούν λανθασµένα ως εικονοστοιχεία υποβάθρου. Επιπλέον, η µέθοδος µειονεκτεί στην περίπτωση εικόνων µε µεγάλη ισχύ θορύβου και spot χαµηλής φωτεινότητας. Όταν οι συναρτήσεις κατανοµής της έντασης τόσο του σήµατος όσο και του υποβάθρου υπερκαλύπτουν σε µεγάλη έκταση η µια την άλλη, η κατηγοριοποίηση των εικονοστοιχείων βάσει του κατωφλίου έντασης είναι επιρρεπής σε λάθη ταξινόµησης και κατά συνέπεια οδηγεί σε λανθασµένες εκτιµήσεις της συνολικής έντασης φωτεινότητας των spot [1]. 124
125 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker 4. Κατάτµηση εικόνας µικροσυστοιχίας µε µετρήσεις «αφαίρεσης» εικονοστοιχείων Η προσέγγιση του προβλήµατος της κατάτµησης της εικόνας µικροσυστοιχίας µε εφαρµογή µετρήσεων «αφαίρεσης» εικονοστοιχείων συνδυάζει τόσο την χωρική πληροφορία όσο και την πληροφορία που βασίζεται στην µέτρηση της έντασης φωτεινότητας στην εικόνα µικροσυστοιχίας. Στην περίπτωση αυτή, όπως και στην πρώτη και την τρίτη κατηγορία µεθόδων κατάτµησης, παρατηρείται ότι, µετά την τοποθέτηση της κυκλικής µάσκας, τα περισσότερα εικονοστοιχεία που βρίσκονται µέσα σε αυτή, είναι εικονοστοιχεία των spot, ενώ τα περισσότερα που βρίσκονται εκτός κύκλου ανήκουν στο υπόβαθρο. Εξαιτίας σφαλµάτων που παρουσιάζονται στο σχήµα των spot, ορισµένα από τα εικονοστοιχεία των spot µπορεί να βρεθούν εκτός κυκλικής µάσκας και κάποια από τα εικονοστοιχεία υποβάθρου µπορεί να συµπεριληφθούν στον κύκλο. Τα εικονοστοιχεία αυτά αντιµετωπίζονται σαν ακραίες τιµές για το spot δείγµα και το δείγµα υποβάθρου. Κατά τον ίδιο τρόπο, υπάρχουν εικονοστοιχεία µόλυνσης που µπορούν να θεωρούνται ακραίες τιµές στο πεδίο της έντασης. Αναπόφευκτα, οι τιµές αυτές αλλάζουν, σηµαντικά, τις µετρήσεις τόσο της µέσης όσο και της συνολικής έντασης φωτεινότητας του σήµατος. Για να µειωθεί αρκετά η επίδραση των ακραίων τιµών στις µετρήσεις της έντασης, αφαιρείται ένα σταθερό ποσοστό εικονοστοιχείων από την κατανοµή της έντασης των εικονοστοιχείων του σήµατος και των εικονοστοιχείων του υποβάθρου. Ένα χαρακτηριστικό παράδειγµα αυτής της µεθόδου δίνεται στο σχήµα 6.2. Εν τούτοις, η µέθοδος µπορεί να παράγει ανακριβή αποτελέσµατα στην περίπτωση που δεν είναι εκ των προτέρων γνωστό το ποσοστό αφαίρεσης των εικονοστοιχείων από το σύνολο της εικόνας [1]. 5. Κατάτµηση εικόνας µικροσυστοιχίας µε συνδυασµό χωρικής πληροφορίας και πληροφορίας που παρέχει η ένταση φωτεινότητας Οι µέθοδοι που περιγράφονται στην τρίτη και την τέταρτη κατηγορία µεθόδων κατάτµησης, χρησιµοποιούν ελάχιστα την χωρική πληροφορία της εικόνας. Η σχεδιαστική τους προτεραιότητα περιορίζεται στην µέτρηση της έντασης φωτεινότητας των spot µε το ελάχιστο υπολογιστικό κόστος. Οι µέθοδοι αυτές είναι αποδοτικές στην περίπτωση που η επεξεργασία των εικόνων µικροσυστοιχίας γίνεται 125
126 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker ηµι-αυτόµατα αφού στην επεξεργασία των εικόνων παίζει σηµαντικό ρόλο ο χρόνος απόκρισης των εφαρµοζόµενων µεθόδων, ενώ ταυτόχρονα στις ηµι-αυτόµατες µεθόδους ο ερευνητής µπορεί να επιθεωρήσει την ποιότητα των παραγόµενων δεδοµένων [1]. (α) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα (β) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα Σχήµα 6.2: Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει µετρήσεων «αφαίρεσης» εικονοστοιχείων και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης. Σε ένα πλήρως αυτόµατο σύστηµα επεξεργασίας εικόνων µικροσυστοιχίας, η ακρίβεια µε την οποία ταξινοµούνται τα spot εικονοστοιχεία, επηρεάζει καθοριστικά την ακρίβεια την βιολογικής πληροφορίας που προσδιορίζεται από την εικόνα της µικροσυστοιχίας. Στην περίπτωση αυτή, η σωστή ταξινόµηση των εικονοστοιχείων της εικόνας όχι µόνο προσφέρει ακριβή µέτρηση της έντασης του σήµατος αλλά επιτρέπει και τον υπολογισµό άλλων µετρήσεων που αφορούν στην ποιότητα της εικόνας και που βασίζονται στις γεωµετρικές ιδιότητες των spot. Μια σωστή ταξινόµηση των εικονοστοιχείων της εικόνας µπορεί να πραγµατοποιηθεί χρησιµοποιώντας υβριδικές µεθόδους που συνδυάζουν την χωρική πληροφορία και την πληροφορία από το πεδίο των εντάσεων φωτεινότητας (σχ.6.3). Οι υβριδικές µέθοδοι, κατά την εφαρµογή τους, ακολουθούν τα παρακάτω τρία βήµατα [1] : 126
127 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Βήµα 1. Αρχικά, χρησιµοποιείται η χωρική πληροφορία (θέση spot, διάµετρος) για µια καθαρή χωρική (κυκλική) κατάτµηση. Βήµα 2. Ακολούθως, οι ακραίες τιµές των εικονοστοιχείων εκτός και εντός κύκλου ορίζονται σαν «απροσδιόριστα» εικονοστοιχεία. Συνήθως, για τον εντοπισµό αυτών των εικονοστοιχείων χρησιµοποιείται ένα Gaussian µοντέλο για την κατανοµή της έντασης. Βήµα 3. Κατά το τελικό στάδιο, λαµβάνει χώρα η ταξινόµηση των «απροσδιόριστων» εικονοστοιχείων σε «σήµα», «υπόβαθρο» ή «µόλυνση». Η µετονοµασία αυτή των «απροσδιόριστων» εικονοστοιχείων σε µια από τις τρεις οµάδες, πραγµατοποιείται µε την βοήθεια µιας διαδικασίας µορφολογικού µετασχηµατισµού [3]. Σύµφωνα µε την διαδικασία αυτή, η ταξινόµηση των «απροσδιόριστων» εικονοστοιχείων βασίζεται στην επιλογή κάποιων αρχικών εικονοστοιχείων, στα οποία κάθε φορά που επαναλαµβάνεται η διαδικασία επιλογής και µε την βοήθεια στατιστικών µετρήσεων, να ταξινοµείται ένα ακόµη εικονοστοιχείο σε µια από τις τρεις οµάδες κατηγοριοποίησης µέχρις ότου να µην µπορεί να πραγµατοποιηθεί περαιτέρω µετονοµασία των «απροσδιόριστων» εικονοστοιχείων. Μέχρι σήµερα, στο πεδίο έρευνας που αφορά στην κατάτµηση των εικόνων µικροσυστοιχίας, έχει παρουσιαστεί ένας σηµαντικός αριθµός µεθόδων κατάτµησης µικροσυστοιχιών όλων των παραπάνω κατηγοριών, προτείνοντας αρκετές λύσεις για την βελτίωση και την ενίσχυση των εικόνων µικροσυστοιχίας. Παρά το γεγονός ότι η ανάλυση των εικόνων µικροσυστοιχίας έχει µελετηθεί εκτεταµένα, η διαδικασία της ταξινόµησης των εικονοστοιχείων µιας εικόνας αποτελεί ακόµη, ένα ενδιαφέρον θέµα προς έρευνα, καθώς η ανάγκη για αποτελέσµατα µεγαλύτερης ακρίβειας δεν έχει µειωθεί Ο αλγόριθµος Random-Walker Το µοντέλο Random-Walk (RWM) αναπαριστά µια στοχαστική διαδικασία κατά την οποία προσδιορίζεται η πιθανή θέση ενός σηµείου/αντικειµένου σύµφωνα µε µια κατανοµή πιθανοτήτων. Τις τελευταίες δεκαετίες, το RWM εφαρµόζεται συχνά για την επίλυση πολλών επιστηµονικών προβληµάτων σε διαφορετικά πεδία έρευνας, µε την επεξεργασία των ψηφιακών εικόνων να είναι ανάµεσα στις πιο δηµοφιλείς 127
128 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker εφαρµογές του. Το 1979, το RWM πρωτοεµφανίστηκε σε προβλήµατα µηχανικής όρασης από τους Wechsler και Kidode [4] στο πεδίο της διάκρισης υφής (texture discrimination) ενώ στις πιο πρόσφατες εφαρµογές του, το µοντέλο RWM συναντάται σε κάποια από τα πιο απαιτητικά θέµατα της επεξεργασίας εικόνων, όπως είναι η ενίσχυση [5] και το φιλτράρισµα [6] των ψηφιακών εικόνων. (α) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα (β) Αρχική εικόνα Μετά την κατάτµηση Επικαλυπτόµενη εικόνα Σχήµα 6.3: Στα δυο διαφορετικά παραδείγµατα, (α) και (β), του σχήµατος απεικονίζονται, αντίστοιχα, µε την σειρά που φαίνονται, η αρχική εικόνα προς επεξεργασία, η εικόνα που προκύπτει µετά την εφαρµογή των µεθόδων κατάτµησης βάσει συνδυασµού χωρικής πληροφορίας και πληροφορίας που παρέχει η ένταση φωτεινότητας και ο συνδυασµός των δυο πρώτων εικόνων µε την επικάλυψη της αρχικής εικόνας από την εικόνα της κατάτµησης. Ο αλγόριθµος Random-Walker (RWA), µια παραλλαγή του RWM, εισήχθη στο πεδίο των εφαρµογών της ψηφιακής επεξεργασίας εικόνων αρκετά πρόσφατα, σαν µια τεχνική κατάτµησης εικόνας που δίνει τα αποτελέσµατά της σε κλειστή µορφή [7]. Σύµφωνα µε τον RWA, για την επίτευξη µιας υψηλής ποιότητας κατάτµησης εικόνας, απαιτείται σαν αρχική γνώση µόνο ο αριθµός κάποιων εικονοστοιχείων ή απλά ένα εικονοστοιχείο (seed) για κάθε κατηγορία αντικειµένων, σε αντίθεση µε τους πολύ γνωστούς και δηµοφιλείς αλγορίθµους κατάτµησης, Active Contour [8] και Level Set [9], που βασίζονται σε µια αρχική υπόθεση γνώσης των συνόρων των υπό ταξινόµηση κατηγοριών. Ένα από τα πιο σηµαντικά πλεονεκτήµατα του RWA είναι η ικανότητα του να ταξινοµεί αυτόµατα περιοχές εικονοστοιχείων που 128
129 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker διαθέτουν παρεµφερείς ιδιότητες. Όπως φαίνεται στο παράδειγµα του σχήµατος 6.4, τρία σηµεία seed ή τρεις διαφορετικές κατηγορίες εικονοστοιχείων (αντικείµενα µε την ένδειξη L1, L2, L3, αντίστοιχα), χρησιµοποιούνται για την εκτίµηση της ταυτότητας των υπολοίπων εικονοστοιχείων (αντικείµενα µε την ένδειξη?). Η ταξινόµηση των άγνωστης ταυτότητας εικονοστοιχείων στις τρεις κατηγορίες L1, L2, L3, πραγµατοποιείται µε τον υπολογισµό των πιθανοτήτων προσέγγισης των εικονοστοιχείων, όταν αυτά κινούνται τυχαία, σε κάποιο από τα εικονοστοιχεία µε γνωστή ταυτότητα, δηλαδή τα σηµεία seed [7]. Σχήµα 6.4: Αναπαράσταση της βασικής ιδέας του Random-Walker αλγορίθµου [7] Προϋπάρχουσες εργασίες πάνω στην κατάτµηση των εικόνων µικροσυστοιχίας Στην ανάλυση της εικόνας µικροσυστοιχίας, όπως προαναφέρθηκε στην εισαγωγή του κεφαλαίου, έχουν παρουσιαστεί αρκετές µέθοδοι που προτείνουν λύσεις στο πρόβληµα της κατάτµησης των εικόνων µικροσυστοιχίας. Πιο αναλυτικά, σε µια πρόσφατη συγκριτική επιστηµονική εργασία [10] εισάγονται δυο γνωστές µέθοδοι κατηγοριοποίησης στην κατάτµηση των εικόνων µικροσυστοιχίας µε ικανοποιητικά αποτελέσµατα κατάτµησης ενώ µια δεύτερη επιστηµονική εργασία [11] παρουσιάζει µια µέθοδο συµπίεσης εικόνας χωρίς απώλειες, χωρίζοντας τα εικονοστοιχεία της σε τρεις κατηγορίες, εικονοστοιχεία υποβάθρου, προσκηνίου και spot εικονοστοιχεία. Επιπρόσθετα, εργασίες που βασίζονται στον µετασχηµατισµό watershed [12] και σε 129
130 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker µια κυµατιδιακή τροποποίηση του µοντέλου του τυχαίου πεδίου Markov [13] έχουν παρουσιάσει καλά πειραµατικά αποτελέσµατα, κατά την αξιολόγηση τους, στην κατάτµηση των εικόνων µικροσυστοιχίας. Στην παρούσα διδακτορική διατριβή, λαµβάνοντας υπόψιν το γεγονός της άριστης απόδοσης του αλγορίθµου Random-Walker σε θέµατα κατάτµησης, παρουσιάζεται η εφαρµογή του σε εικόνες µικροσυστοιχίας, µε την ακρίβεια του αλγορίθµου να επιβεβαιώνεται από τα πειραµατικά αποτελέσµατα που ακολουθούν της εφαρµογής. Στο δεύτερο µέρος του κεφαλαίου, προτείνεται και παρουσιάζεται µια πρωτότυπη µέθοδος κατάτµησης εικόνων µικροσυστοιχίας βασιζόµενη στον RWA, τα πειραµατικά αποτελέσµατα της οποίας αξιολογούνται τόσο σε πραγµατικές όσο και σε τεχνητές εικόνες µικροσυστοιχίας. Στην νέα προτεινόµενη µέθοδο, η εισαγωγή του βήµατος της διευθυνσιοδότησης των µικροσυστοιχιών στα βήµατα της µεθόδου επιτρέπει τον καθορισµό ενός µεγάλου αριθµού seed υποβάθρου, γεγονός που µειώνει σηµαντικά την υπολογιστική πολυπλοκότητα της µεθόδου ενώ ταυτόχρονα ελαττώνει την επιρροή του θορύβου στα seed υποβάθρου λόγω των ιδιοτήτων που παρουσιάζει η RWA λύση του προβλήµατος. Κατά την πειραµατική διαδικασία, εντοπίζεται και ευθυγραµµίζεται κάθε µια από τις υποµικροσυστοιχίες των βάσεων δεδοµένων. Στην συνέχεια, κατασκευάζεται το πλέγµα της κάθε υποµικροσυστοιχίας ενώ τα εικονοστοιχεία της υποµικροσυστοιχίας που βρίσκονται στα σηµεία διατοµής των γραµµών του πλέγµατος χρησιµοποιούνται από τον RWA σαν spot-seed. Το µέγιστο µέγεθος των spot χρησιµοποιείται από την µέθοδο για τον εντοπισµό των seed υποβάθρου στο διάστηµα που υπάρχει µεταξύ των spot-seed. Λαµβάνοντας υπόψιν τις ιδιότητες των seed στον RWA, αν τα spot-seed εντοπίζονται πάνω σε πραγµατικά spot εικονοστοιχεία, η διαδικασία εντοπισµού των seed εξασφαλίζει µια κατάτµηση εικόνας χωρίς λάθη, ανεξάρτητα από τον τύπο και το επίπεδο του θορύβου που παρουσιάζεται στην υποµικροσυστοιχία. Για τα εναποµείναντα εικονοστοιχεία που δεν έχουν κατηγοριοποιηθεί, εφαρµόζεται ένας πρωτότυπος κανόνας κατηγοριοποίησης στον υπολογισµό των RWA πιθανοτήτων για τον εντοπισµό των περιοχών που υπάρχουν spot εικονοστοιχεία, χρησιµοποιώντας τόσο την χωρική πληροφορία όσο και την πληροφορία που προκύπτει από την ένταση της φωτεινότητας. Τα πειραµατικά αποτελέσµατα αξιολογούνται σε δυο κατηγορίες εικόνων µικροσυστοιχίας ενώ παρατηρείται ο ακριβής εντοπισµός των spot εικονοστοιχείων ακόµα και στην περίπτωση εικόνων που παρουσιάζουν σοβαρά 130
131 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker προβλήµατα (υψηλός θόρυβος, spot πολύ χαµηλής φωτεινότητας). Η επιστηµονική συµβολή της προτεινόµενης µεθόδου περιλαµβάνει την καινοτοµία της χρήσης του RWA αλγορίθµου στην κατάτµηση των εικόνων µικροσυστοιχίας και την την ικανότητα της µεθόδου να δίνει άριστα αποτελέσµατα ακόµα και σε περιπτώσεις εικόνων µικροσυστοιχίας που διαφέρουν κατά πολύ από τις ιδανικές µικροσυστοιχίας λόγω των σιβαρών προβληµάτων που παρουσιάζουν. 6.2 Κατάτµηση εικόνας µικροσυστοιχίας µε απευθείας εφαρµογή του αλγορίθµου Random-Walker Προκειµένου να επιτευχθεί µεγαλύτερη ακρίβεια στην κατάτµηση της εικόνας, υλοποιείται µια σειρά από βήµατα προεπεξεργασίας στην εικόνα µικροσυστοιχίας, πριν την εφαρµογή του RWA: Βήµα 1. Αρχικά, µε µια αυτόµατη µέθοδο εύρεσης υποµικροσυστοιχιών [14], εντοπίζονται οι υποµικροσυστοιχίες των υπό εξέταση µικροσυστοιχιών. Βήµα 2. Οι υποµικροσυστοιχίας δύο καναλιών µετατρέπονται σε εικόνες αποχρώσεων του γκρι, ενισχύοντας µε αυτόν τον τρόπο τις πραγµατικές spot περιοχές και µειώνοντας την ένταση του θορύβου στις περιπτώσεις εκείνες που ο θόρυβος διαταράσσει µεµονωµένα το κόκκινο ή το πράσινο χρωµατικό κανάλι. Βήµα 3. Οι µονοκαναλικές υποµικροσυστοιχίες υποβάλλονται σε ενίσχυση του βαθµού διαφοράς φωτεινότητας και µετατρέπονται σε δυαδικές εικόνες χρησιµοποιώντας έναν αυτόµατο εκτιµητή κατωφλίου όπως αυτός προτείνεται από τον Otsu [15]. Βήµα 4. Τέλος, οι δυαδικές υποµικροσυστοιχίες υπόκεινται σε αποθορυβοποίηση, µε χρήση µεθόδων που βασίζονται στην µαθηµατική µορφολογία, όπως περιγράφεται στην παράγραφο του 5 ου κεφαλαίου της διατριβής, προκειµένου να αφαιρεθεί ο θόρυβος τύπου «αλάτι και πιπέρι». Μετά την αφαίρεση του θορύβου οι εναποµείναντες περιοχές ενδιαφέροντος (σχ.6.5(ε)) περιέχουν spot και έναν ελάχιστο αριθµό από αντικείµενα θορύβου που δεν κατηγοριοποιήθηκαν σωστά κατά την διαδικασία ταξινόµησης. Η προκύπτουσα από την διαδικασία της ταξινόµησης εικόνα υποµικροσυστοιχίας περιέχει µόνο τα 131
132 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker αρκετά φθορίζοντα spot ενώ έχει αφαιρεθεί πολύ µεγάλο µέρος του θορύβου. Η αποµάκρυνση των αντικειµένων θορύβου είναι υψίστης σηµασίας για την µετέπειτα εφαρµογή του RWA στις υποµικροσυστοιχίες. Σύµφωνα µε τον RWA, η κατάτµηση των δυαδικών υποµικροσυστοιχιών επιτυγχάνεται υπολογίζοντας την µεγαλύτερη πιθανότητα που προκύπτει όταν ένας διαβάτης (random walker) µετακινείται τυχαία στο χώρο και φτάνει πρώτα σε εικονοστοιχείο µε γνωστή ταυτότητα, δηλαδή ο RWA εκτιµά τις πιθανότητες κάθε εικονοστοιχείου µε άγνωστη ταυτότητα, κάνοντας τυχαίες κινήσεις προς γειτονικά εικονοστοιχεία, να φτάνει σε εικονοστοιχεία γνωστής ταυτότητας (seedεικονοστοιχεία) µε σηµείο εκκίνησης το εικονοστοιχείο, τις πιθανότητες του οποίου θέλουµε να υπολογίσουµε. Ο υπολογισµός των spot πιθανοτήτων του RWA πραγµατοποιείται µε την επίλυση του Dirichlet προβλήµατος, που οδηγεί σε ένα σύστηµα γραµµικών εξισώσεων για κάθε εικόνα υποµικροσυστοιχίας. Προκειµένου να εξετασθεί η κάθε υποµικροσυστοιχία ως προς την µεροληψία ενός τυχαίου διαβάτη, ορίζεται µια συνάρτηση F rwa η οποία θα καταγράφει οποιαδήποτε αλλαγή στις εντάσεις φωτεινότητας των εικονοστοιχείων της εικόνας µετατρέποντας τες σε συντελεστές βαρύτητας του γραµµικού συστήµατος εξισώσεων. Στην συνέχεια, σε κάθε περιοχή ενδιαφέροντος υπολογίζεται το κοντινότερο εικονοστοιχείο στο κέντρο µάζας της περιοχής το οποίο θεωρείται ότι είναι ένα spotseed. Ο όρος spot-seed αντιστοιχεί σε γειτονικά εικονοστοιχεία ή ακόµη και σε ένα µοναδικό εικονοστοιχείο που ανήκει σε ένα spot. Στην κατάτµηση της εικόνας µε εφαρµογή του Random-Walker αλγορίθµου, ο RWA χρησιµοποιείται για την ταξινόµηση περιοχών που βρίσκονται κοντά στα κέντρα µάζας. Κατά συνέπεια, ένα µοναδικό εικονοστοιχείο που ανήκει σε κάθε περιοχή ενδιαφέροντος µπορεί να θεωρηθεί spot-seed. Λαµβάνοντας υπόψιν, ότι η αποτελεσµατικότητα του RWA επηρεάζεται σηµαντικά από τον αριθµό των spot-seed και των seed υποβάθρου, η παρακάτω µεθοδολογία εφαρµόζεται για την σωστή κατάτµηση των εικόνων µικροσυστοιχίας: 132
133 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker (α) (β) (γ) (δ) (ε) Σχήµα 6.5: (α) Αρχική εικόνα µικροσυστοιχίας δυο καναλιών από την LLMPP βάση δεδοµένων, (β) Μονοκαναλική υποµικροσυστοιχία, (γ) Υποµικροσυστοιχία µε ενίσχυση του βαθµού διαφοράς φωτεινότητας, (δ) υαδική υποµικροσυστοιχία, (ε) Υποµικροσυστοιχία µετά την εφαρµογή µεθόδων αποµάκρυνσης µαθηµατικής µορφολογίας για την αφαίρεση θορύβου µε µορφή «αλάτι και πιπέρι». Τα spot-seed ορίζονται από τα εικονοστοιχεία των κέντρων µάζας, Τα seed υποβάθρου αντιστοιχούν σε εικονοστοιχεία χαµηλής φωτεινότητας και ορίζονται να είναι τα εικονοστοιχεία εκείνα των οποίων η ένταση φωτεινότητας είναι µικρότερη από µια τιµή κατωφλίου T int, Η συνάρτηση F rwa αναπαρίσταται από την τυπική Gaussian συνάρτηση βαρύτητας: w ij = exp (-β (g i -g j ) 2 ), όπου g i είναι η ένταση του εικονοστοιχείου i. Η τιµή της σταθεράς β είναι η µόνη παράµετρος του RWA που πρέπει να καθοριστεί από τον χρήστη του αλγορίθµου. 133
134 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Πειραµατικά αποτελέσµατα Η προτεινόµενη µέθοδος εφαρµόστηκε σε δύο βάσεις δεδοµένων, την Human Sarcomas που περιέχει 34 εικόνες µικροσυστοιχίας των 32 υποµικροσυστοιχιών [16], και την Lymphoma/Leukemia Molecular Profiling Project (LLMPP) βάση δεδοµένων. Από την δεύτερη βάση επιλέχθηκαν τυχαία 36 cdna εικόνες µικροσυστοιχίας των 16 υποµικροσυστοιχιών [17]. Η τιµή του κατωφλίου T int, που χρησιµοποιείται για τον ορισµό των seed υποβάθρου, τέθηκε ίση µε T int = Όλα τα εικονοστοιχεία των οποίων η ένταση φωτεινότητας (περιορισµένη στο διάστηµα [0,1]) είναι µικρότερη από την τιµή T int κατηγοριοποιούνται σαν seed υποβάθρου. Στο σχήµα 6.6 απεικονίζεται ένα χαρακτηριστικό παράδειγµα κατάτµησης εικόνας υποµικροσυστοιχίας από την βάση LLMP, µε απ ευθείας εφαρµογή του αλγορίθµου Random-Walker. (α) (β) Σχήµα 6.6: (α) Εύρεση των spot-seeds σε δυαδική υποµικροσυστοιχία από την LLMPP βάση δεδοµένων, (β) Κατάτµηση στην αρχική υποµικροσυστοιχία αποχρώσεων του γκρι. 134
135 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker 6.3 Κατάτµηση εικόνας µικροσυστοιχίας µε εφαρµογή νέας µεθόδου βασιζόµενης στον Random-Walker αλγόριθµο Στην παράγραφο αυτή, περιγράφεται αναλυτικά η κατάτµηση εικόνων µικροσυστοιχίας όταν σε αυτές εφαρµόζεται µια νέα µέθοδος που αποτελεί βελτίωση της µεθόδου που παρουσιάστηκε στην ενότητα 6.3 του κεφαλαίου και που βασίζεται στον αλγόριθµο Random-Walker. Συνοπτικά, Στο πρώτο στάδιο της πειραµατικής διαδικασίας, µε την χρήση µιας αυτόµατης µεθόδου εύρεσης υποµικροσυστοιχιών [14], εντοπίζονται και ευθυγραµµίζονται ως προς τον οριζόντιο άξονα οι υποµικροσυστοιχίες των υπό εξέταση µικροσυστοιχιών. Στην συνέχεια, κατασκευάζεται το ιδανικό πλέγµα της κάθε υποµικροσυστοιχίας και τα εικονοστοιχεία που βρίσκονται στα σηµεία διατοµής των γραµµών του πλέγµατος χρησιµοποιούνται από τον RWA σαν spot-seed. Στο τελευταίο στάδιο της πειραµατικής διαδικασίας, προκειµένου να εντοπιστούν τα seed υποβάθρου, χρησιµοποιείται σαν βασική πληροφορία το µέγιστο µέγεθος των spot. Τα εικονοστοιχεία των οποίων η ελάχιστη απόσταση από τα spot-seed είναι µεγαλύτερη από την µέγιστη ακτίνα των spot, θεωρούνται ότι είναι τα εικονοστοιχεία-seed του υποβάθρου. Εξ ορισµού, αν τα spot-seed καταλαµβάνουν την θέση εικονοστοιχείων που ανήκουν σε πραγµατικά spot, τότε επιτυγχάνεται µια ακριβής κατάτµηση χωρίς λάθη στην εκτίµηση των seed εικονοστοιχείων, ανεξάρτητα από το επίπεδο και το είδος του θορύβου που υπάρχει στην υπό εξέταση εικόνα. Για τα εναποµείναντα εικονοστοιχεία της εικόνας που δεν έχουν κατηγοριοποιηθεί, εισάγεται ένας καινούριος κανόνας ταξινόµησης, κατά την διαδικασία υπολογισµού των πιθανοτήτων µέσω του RWA, για την εύρεση των περιοχών των spot, χρησιµοποιώντας τόσο χωρική πληροφορία όσο και πληροφορία που προέρχεται από την µέτρηση της φωτεινότητας των εικονοστοιχείων. Κατά την διάρκεια της πειραµατικής διαδικασίας, όπου χρησιµοποιούνται δυο βάσεις δεδοµένων για την εφαρµογή της προτεινόµενης µεθόδου, επιτυγχάνεται ακριβής κατηγοριοποίηση των εικονοστοιχείων της εικόνας ακόµα και στην περίπτωση αρκετά παραµορφωµένων µικροσυστοιχιών. Όπως χαρακτηριστικά αναφέρεται στον αλγόριθµο Random-Walker [7], αν είναι διαθέσιµος ένας µεγάλος αριθµός επακριβώς ορισµένων seed, µπορεί να 135
136 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker εξασφαλιστεί υψηλή ακρίβεια κατάτµησης της εικόνας,. Η προτεινόµενη µέθοδος, βασιζόµενη στην υπόθεση ότι τα κέντρα των spot κάθε υποµικροσυστοιχίας είναι τοποθετηµένα σε ίσες αποστάσεις στο πλέγµα της υποµικροσυστοιχίας, βρίσκει ένα ιδανικό πλέγµα, χρησιµοποιώντας πληροφορία από την υπό εξέταση υποµικροσυστοιχία και στην συνέχεια ορίζει έναν µικρό αριθµό από spot-seed και µεγάλο αριθµό seed υποβάθρου. Αν το πλέγµα υποµικροσυστοιχίας έχει υπολογιστεί σωστά, τουλάχιστον ένα εικονοστοιχείο από κάθε spot έχει εντοπιστεί πάνω στα σηµεία τοµής των γραµµών του πλέγµατος, διαφορετικά ο αριθµός των λανθασµένα ταξινοµηµένων spot-seed είναι ελάχιστος: ένα εικονοστοιχείο ανά spot. Η προσέγγιση του προβλήµατος της τεµαχιοποίησης των περιοχών των υποµικροσυστοιχιών, όπως αυτή παρουσιάζεται στην παράγραφο του κεφαλαίου, επιταχύνει την υπολογιστική ικανότητα του RWA ενώ ταυτόχρονα βελτιώνει την ακρίβεια κατάτµησης των περιοχών της εικόνας Πειραµατικά διαδικασία Η προτεινόµενη µέθοδος αποτελείται από πέντε διαδοχικά βήµατα: Εντοπισµός υποµικροσυστοιχιών. Εξαιτίας του γεγονότος ότι σε κάθε υποµικροσυστοιχία, υπάρχουν διαφορετικοί τύποι θορύβου και διαφορετικές γωνίες περιστροφής ως προς τον οριζόντιο άξονα, σε σχέση µε τις υπόλοιπες υποµικροσυστοιχίες της ίδιας µικροσυστοιχίας, ο εντοπισµός τους στην εικόνα µικροσυστοιχίας και η διόρθωση της γωνίας περιστροφής σε κάθε µια από αυτές χωριστά, θεωρείται άκρως απαραίτητη και σηµαντική διαδικασία (σχ. 6.7). Ο εντοπισµός των υποµικροσυστοιχιών σε µια µικροσυστοιχία πραγµατοποιείται µε µία αυτόµατη µέθοδο εύρεσης της θέσης των υποµικροσυστοιχιών που έχει παρουσιαστεί πρόσφατα στην επιστηµονική εργασία [14]. Ευθυγράµµιση υποµικροσυστοιχιών. Κάθε υποµικροσυστοιχία δυο καναλιών µετατρέπεται σε εικόνα διαβαθµίσεων του γκρι, ενισχύοντας µε τον τρόπο αυτό τις πραγµατικές περιοχές των spot και µειώνοντας την ένταση του θορύβου σε περιπτώσεις που ο θόρυβος παραµορφώνει χωριστά το κόκκινο ή το πράσινο κανάλι. Στην συνέχεια, σε κάθε µια από τις µονοχρωµατικές υποµικροσυστοιχίες εφαρµόζεται µια µέθοδος ευθυγράµµισης που βασίζεται στο φάσµα ισχύος της 136
137 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker εικόνας [18]. Η αθροιστική φωτεινότητα στις γραµµές που σχηµατίζουν τα εικονοστοιχεία, µετασχηµατίζεται κατά Fourier και υπολογίζεται το φάσµα ισχύος της εικόνας. Λαµβάνοντας υπόψιν ότι η διασπορά του φάσµατος µεγιστοποιείται στην διεύθυνση των γραµµών του πλέγµατος της υποµικροσυστοιχίας, εντοπίζεται εκείνη η γωνία περιστροφής στην τιµή της οποίας η διασπορά του φάσµατος µεγιστοποιείται. Καθώς, οι πραγµατικές υποµικροσυστοιχίες είναι σχεδόν ευθυγραµµισµένες, είναι ασφαλές να υποτεθεί ότι οι γωνίες περιστροφής παίρνουν τιµές κοντά στο µηδέν. Η διαδικασία ευθυγράµµισης εφαρµόζεται σε όλες τις υπό εξέταση υποµικροσυστοιχίες. Ένα τυπικό παράδειγµα απεικονίζεται στο σχήµα 6.8. (α) (β) Σχήµα 6.7: Πραγµατικό παράδειγµα εικόνας µικροσυστοιχίας: (α) Στην εικόνα περιλαµβάνονται τέσσερις υποµικροσυστοιχίες παραµορφωµένες από ένα είδος θορύβου γνωστό σαν η ουρά του κοµήτη, (β) Η υποµικροσυστοιχία που βρίσκεται στο κάτω αριστερό τµήµα της εικόνας περιέχει πολλά αδύναµα spot ενώ η παρουσία του θορύβου στο υπόβαθρο είναι έντονη. Εντοπισµός των γραµµών του πλέγµατος και των συντεταγµένων των spot της υπό εξέταση υποµικροσυστοιχίας. Κατά την διαρκεια του βήµατος αυτού, λαµβάνει χώρα ο εντοπισµός των γραµµών του πλέγµατος της υπό εξέταση υποµικροσυστοιχίας και των συντεταγµένων των spot. Αρχικά, προκειµένου να επιτευχθεί η εύρεση των κάθετων γραµµών, υπολογίζεται µια κανονικοποιηµένη κάθετη κατανοµή, χρησιµοποιώντας το φάσµα ισχύος της εικόνας και την απόσταση µεταξύ των spot. Η ίδια διαδικασία εφαρµόζεται και στον οριζόντιο άξονα για τον εντοπισµό των οριζοντίων γραµµών του πλέγµατος. Στην συνέχεια, τα κέντρα των spot εντοπίζονται στην διατοµή των καθέτων και οριζοντίων γραµµών του πλέγµατος. 137
138 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Πιο αναλυτικά, ο αλγόριθµος διευθυνσιοδότησης περιγράφεται από τις παρακάτω διαδικασίες [19]: (α) (β) Σχήµα 6.8: (α) Μονοχρωµ µατική υποµικροσυστοιχία πριν την εφαρµογή του αλγορίθµου ευθυγράµµισης, (β) Η ίδια υποµικροσυστοιχία αφού έχει στραφεί κατά 0.5 ο, τιµή που αντιστοιχεί στην γωνία µέγιστης διασποράς του πλάτους του FFT για το σήµα της αθροιστικής φωτεινότητας των γραµµών της εικόνας. Υπολογισµός κανονικοποιηµένης κάθετης κατανοµής: Η µέση τιµή της φωτεινότητας των εικονοστοιχείων σε κάθε γραµµή της υποµ µικροσυστοιχίας αντιστοιχεί στην κάθετη κατανοµή. Τον υπολογισµό της κάθετης κατανοµής ακολουθεί η κανονικοποίηση της µε την αφαίρεση της έντασης του υποβάθρου, δηλαδή µε την αφαίρεση της µέσης τιµής της φωτεινότητας των εικονοστοιχείων που δεν περιλαµβάνονται στην περιοχή των spot. Υπολογισµός του διαστήµατος µεταξύ των spot βάσει του φάσµατος ισχύος της εικόνας: Προκειµένου να εκτιµηθεί το διάστηµα µεταξύ των spot, χρησιµοποιείται η κατανοµή της αθροιστικής φωτεινότητας στις στήλες για τον υπολογισµό του φάσµατος µε την βοήθεια του FFT. Η απόσταση των εικονοστοιχείων που αντιστοιχεί στην επικρατούσα πιο υψηλή τιµή της συχνότητας του φάσµατος αποτελεί και το διάστηµα µεταξύ των spot στην κάθετη διεύθυνση. Εντοπισµός των κέντρων των spot: Στην συνέχεια του βήµατος, χρησιµοποιώντας έναν αυτόµατο εκτιµ µητή κατωφλίωσης µονοχρωµατικής εικόνας, όπως αυτός προτείνεται από τον Otsu [15], κατασκευάζεται µια δυαδική εικόνα. Σε κάθε 138
139 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker υποµικροσυστοιχία, µε εφαρµογή µεθόδων µαθηµατικής µορφολογίας, εντοπίζονται όλα τα εικονοστοιχεία που αντιστοιχούν σε µοναδικό spot και υπολογίζεται το κέντρο µάζας σε κάθε ένα από τα spot. Εύρεση των κάθετων γραµµών του πλέγµατος χρησιµοποιώντας τα κέντρα των spot: Οι κάθετες γραµµές του πλέγµατος καθορίζονται από τα σηµεία που αντιστοιχούν στην µέση της απόστασης µεταξύ διαδοχικών spot κέντρων. Ο εντοπισµός των οριζόντιων γραµµών του πλέγµατος επιτυγχάνεται µε την εφαρµογή της ίδιας διαδικασίας στην εικόνα υποµικροσυστοιχίας στην οριζόντια κατεύθυνση. Εντοπισµός των spot-seed: Τα σηµεία τοµής των εκτιµώµενων γραµµών του πλέγµατος (οριζόντιες-κάθετες) ορίζουν τα spot-seed. Ένα τυπικό παράδειγµα της διαδικασίας απεικονίζεται στο σχήµα 6.9. Από τα υπολογιζόµενα spot-seed, τα οποία βρίσκονται πολύ κοντά στα κέντρα των spot, ο αλγόριθµος RWA υπολογίζει τα εικονοστοιχεία που περιέχονται στις πραγµατικές περιοχές των spot (σχ. 6.9(β)). Αν και στις περισσότερες περιπτώσεις, τα spot-seed δεν βρίσκονται ακριβώς επάνω στα πραγµατικά κέντρα των spot, το γεγονόςαυτό δεν θεωρείται κρίσιµης σηµασίας για την διαδικασία κατάτµησης µε τον αλγόριθµο RWA. Κατάτµηση των spot µε RWA. Ο RWA αλγόριθµος χρησιµοποιείται για την εκτέλεση µιας διαδικασίας ταξινόµησης δυο κατηγοριών: κάθε εικονοστοιχείο της εικόνας ταξινοµείται είτε ως spot είτε ως υπόβαθρο. Σύµφωνα µε τον RWA, σε κάθε εικονοστοιχείο που δεν ανήκει στα εκτιµώµενα seed, αντιστοιχούν δυο πιθανότητες, οι οποίες υπολογίζονται σε κλειστή µορφή από ένα σύστηµα γραµµικών εξισώσεων για κάθε υπό εξέταση υποµικροσυστοιχία. Όπως αναφέρθηκε και στην παράγραφο 6.3 του κεφαλαίου, προκειµένου να εκτιµηθούν οι αντίστοιχες πιθανότητες ορίζεται µια συνάρτηση F rwa η οποία θα ενσωµατώνει την πληροφορία που µεταφέρουν οι τιµές φωτεινότητας των εικονοστοιχείων και θα τις µετατρέπει σε συντελεστές βαρύτητας στο αντίστοιχο γραµµικό πρόβληµα. Ο όρος spot-seed δηλώνει ένα εικονοστοιχείο που ανήκει σε ένα spot έχοντας πιθανότητα ίση µε την µονάδα, ενώ το ίδιο εικονοστοιχείο έχει µηδενική πιθανότητα να ανήκει στο υπόβαθρο. Οι αντίστροφοι ορισµοί ισχύουν για τα seed υποβάθρου. 139
140 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker (α) (β) Σχήµα 6.9: (α) Παράδειγµαα εικόνας υποµικροσυστοιχίας (β) Οι εκτιµώµενες γραµµές του πλέγµατος στην εικόνα υποµ µικροσυστοιχίας. Στο σχήµα 6.10(β), οι εκτιµώµενες spot πιθανότητες (φωτεινές περιοχές γύρω από τα spot-seed) απεικονίζονται σαν τιµές φωτεινότητας των εικονοστοιχείων της υποµικροσυστοιχίας. Λαµ µβάνοντας υπόψιν ότι η αποτελεσµατικότητα του RWA επηρεάζεται σηµαντικά από τον αριθµό των spot-seed και των seed υποβάθρου, για την σωστή κατάτµηση των εικόνων µικροσυστοιχίας εφαρµόζεται η παρακάτω µεθοδολογία: Για κάθε αναµενόµενη περιοχή των spot δηλώνεται ένα spot εικονοστοιχείο σαν spot-seed στα σηµεία διατοµής των κάθετων και οριζοντίων γραµµών του πλέγµατος. Τα seed υποβάθρου αντιστοιχούν στα εικονοστοιχεία της εικόνας για τα οποία η κοντινότερη γειτονική απόσταση από τα spot-seed είναι µεγαλύτερη από την µέγιστη τιµή της ακτίνας του spot. Η εκτίµηση των συντελεστών βαρύτητας του γραµµικού προβλήµατος εκτίµησης των πιθανοτήτων των spot, πραγµατοποιείται µε την βοήθεια της ακόλουθης συνάρτησης βαρύτητας: F rwa (i,j)= exp (-γ ((x i -x j ) 2 +(y i -y j ) 2 )+β (g i -g j ) 2 ), όπου, g i είναι η ένταση στο εικονοστοιχείο i ενώ οι συντεταγµένες x i, y i αντιστοιχούν στην θέση που βρίσκεται το εικονοστοιχείο i. Οι τιµές των 140
141 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker σταθερών γ και β είναι οι µόνες παράµετροι του RWA που καθορίζονται από τον χρήστη της µεθόδου. ιαδικασία κατάτµησης. Ένα εικονοστοιχείο θεωρείται ότι ανήκει στην περιοχή ενός spot αν η αντίστοιχη πιθανότητα του είναι p φορές µεγαλύτερη από την πιθανότητα να ανήκει στο υπόβαθρο. Η τιµή του κατωφλίου p είναι σταθερή και εκτιµάται πειραµατικά. (α) (β) Σχήµα 6.10: (α) Αρχική εικόνα υποµικροσυστοιχίας δυο καναλιών, (β) Εύρεση των πιθανοτήτων τα εικονοστοιχεία της εικόνας να είναι spot εικονοστοιχεία, µετά την εφαρµογή µεθόδου κατάτµησης που βασίζεται στον RWA Πειραµατικά αποτελέσµατα σε πραγµατικές εικόνες µικροσυστοιχίας Η προτεινόµενη µέθοδος εφαρµόστηκε στην βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project (LLMPP) [17]. Η βάση LLMPP περιέχει 47 εικόνες µικροσυστοιχίας των 16 υποµικροσυστοιχιών και 52 εικόνες µικροσυστοιχίας των 32 υποµικροσυστοιχιών. Τυπικές τιµές των ακτινών των spot, που συναντώνται σε πραγµατικές εικόνες µικροσυστοιχίας είναι οι εξής: 2 (spot χαµηλής έντασης), 5, 9 και 12 (spot υψηλής έντασης) εικονοστοιχεία, ενώ οι τιµές για το διάστηµα µεταξύ γραµµών και στηλών της υποµικροσυστοιχίας ποικίλλει από 17 σε 22 εικονοστοιχεία και από 18 σε 24 εικονοστοιχεία αντίστοιχα [20]. Κατά την πειραµατική διαδικασία της προτεινόµενης 141
142 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker µεθόδου, η ακτίνα του spot επιλέχθηκε να είναι ίση µε πέντε εικονοστοιχεία, ικανοποιώντας όλες τις τυπικές και χαµηλού θορύβου περιοχές των spot στην LLMPP βάση δεδοµένων. Οι περισσότερες εικόνες µικροσυστοιχίας που περιέχονται στην LLMPP βάση δεδοµένων έχουν µικρή γωνία περιστροφής. Η εφαρµογή του βήµατος ευθυγράµµισης, στο διάστηµα των [-3 ο, 3 ο ], καλύπτει όλες τις περιπτώσεις γωνιών περιστροφής και επιφέρει διόρθωση µε περιστροφή της εικόνας, των εικόνων υποµικροσυστοιχίας που δεν ευθυγραµµίζονται σωστά ως προς τους άξονες αναφοράς. Η µέγιστη τιµή της ακτίνας που χρησιµοποιείται για τον ορισµό των seed υποβάθρου τέθηκε ίση µε πέντε εικονοστοιχεία. Μετά από ένα µεγάλο αριθµό πειραµατικών δοκιµών, οι παράµετροι γ and β επιλέχθηκαν να έχουν τις τιµές γ=1 και β=15 αντίστοιχα, δίνοντας σχεδόν την ίδια σηµασία στην πληροφορία που προέρχεται από την ένταση των εικονοστοιχείων και την πληροφορία από την χωρική απόσταση των εικονοστοιχείων, µε το διάστηµα ορισµού των εντάσεων να περιορίζεται στο διάστηµα [0,1]. Το κατώφλι πιθανοτήτων p επηρεάζεται σηµαντικά από την ποιότητα της κατάτµησης που πραγµατοποιείται από τον RWA. Η βέλτιστη τιµή υπολογίζεται πειραµατικά σε ένα εύρος περιοχής [2, 8] µε βήµα 0.5. Τα πειραµατικά αποτελέσµατα για την εκτίµηση του κατωφλίου p, µετά από εφαρµογή της µεθόδου σε όλες τις υπό εξέταση υποµικροσυστοιχίες, αποδεικνύουν ότι ο αριθµός των υπολογιζόµενων εικονοστοιχείων των spot της υποµικροσυστοιχίας, µετά την κατάτµηση, επηρεάζει σηµαντικά την τιµή του κατωφλίου p, όπως φαίνεται στον πίνακα 6.1. Η προτεινόµενη µέθοδος κατηγοριοποιεί µε ακρίβεια τα εικονοστοιχεία των spot των υποµικροσυστοιχιών της βάσης δεδοµένων, όπως φαίνεται στο παράδειγµα του σχήµατος 6.11, ακόµα και σε περιπτώσεις υποµικροσυστοιχιών ισχυρά παραµορφωµένων από τον θόρυβο. Η µέθοδος χρησιµοποιεί την υπόθεση ότι τα spot στις υποµικροσυστοιχίες είναι οµοιόµορφα τοποθετηµένα και ότι στα εικονοστοιχεία που ανήκουν εν δυνάµει σε spot, δεν συναντώνται προβλήµατα στην ένταση φθορισµού, π.χ. αλλαγές στο σχήµα των spot της συστοιχίας κ.τ.λ. Η υπόθεση αυτή ικανοποιεί τις περισσότερες πραγµατικές εικόνες υποµικροσυστοιχίας. Σε λίγες 142
143 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker υποµικροσυστοιχίες στις οποίες τα κέντρα των διαδοχικών spot δεν είναι σταθερά τοποθετηµένα, παρατηρείται µια ελαφρώς λανθασµένη εκτίµηση των περιοχών των spot. Υποµικρο -συστοιχία Spotεικονοστοιχεία Κατώφλι p Πίνακας 6.1: Τιµές του κατωφλίου πιθανοτήτων p για εννέα τυχαία επιλεγµένες υποµικροσυστοιχίες από την LLMPP βάση δεδοµένων. Η απόσταση µεταξύ των γραµµών και των στηλών στην ίδια υποµικροσυστοιχία, µεταβάλλεται συνήθως κατά λίγα εικονοστοιχεία. Σε πραγµατικές, όµως, εικόνες µικροσυστοιχίας υπάρχουν περιπτώσεις όπου η διαφορά της απόστασης µεταξύ των spot υπερβαίνει ή είναι πολύ µικρότερη από την µέση τιµή τους, εξαιτίας του τρόπου δηµιουργίας των εικόνων µικροσυστοιχίας. Το γεγονός αυτό έχει σαν συνέπεια την λανθασµένη ευθυγράµµιση των κέντρων των spot µε αποτέλεσµα να προκαλείται µια µικρή µείωση στην ακρίβεια της µεθόδου, καθώς ο RWA εντοπίζει τα εικονοστοιχεία που ανήκουν στις περιοχές των spot µόνο στην περίπτωση που το spot-seed περιλαµβάνεται στην πραγµατική περιοχή των spot. Στο σχήµα 6.12 απεικονίζεται, η πιθανότητα κάθε εικονοστοιχείο της υπό εξέταση εικόνας υποµικροσυστοιχίας, να είναι spot εικονοστοιχείο. Η ακρίβεια της προτεινόµενης µεθόδου συγκρίνεται ποιοτικά µε το µοντέλο κατάτµησης Chan-Vese [8]. Το µοντέλο Chan-Vese είναι µια τυπική περίπτωση µοντέλου Active Contour και βασίζεται στην Mumford-Shah τεχνική κατάτµησης [21] και την Level Set µέθοδο [22] και υλοποιείται χωρίζοντας την εικόνα σε περιοχές βάσει της φωτεινότητας των εικονοστοιχείων. Σύµφωνα µε το παράδειγµα του σχήµατος 6.13, η κατάτµηση που πραγµατοποιείται µε το µοντέλο Chan-Vese επιτυγχάνει την εύρεση µόνο των έντονα φθοριζόντων περιοχών των spot καθώς και διαφόρων αντικειµένων θορύβου που υπάρχουν στην υπό εξέταση 143
144 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker υποµικροσυστοιχία ενώ η εφαρµογή της προτεινόµενης µεθόδου που βασίζεται στον RWA (σχ ), έχει σαν αποτέλεσµα υψηλής ποιότητας κατάτµηση εικόνας. (α) (β) (γ) (δ) Σχήµα 6.11: (α) Μια µονοκαναλική υποµικροσυστοιχία από την LLMPP βάση δεδοµένων, (β) Εύρεση των spot-seeds, (γ) Μάσκα της µέγιστης spot περιοχής, (δ) Εικόνα πιθανοτήτων των spot της υποµικροσυστοιχίας µετά την εφαρµογή της προτεινόµενης µεθόδου που βασίζεται στον αλγόριθµο Random-Walker. 144
145 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Σχήµα 6.12: Πιθανότητα για κάθε εικονοστοιχείο της εικόνας υποµικροσυστοιχίας του σχήµατος 6.12, να είναι spott µε p=5.3. Σχήµα 6.13: Κατάτµηση µε το µοντέλο Chan-Vese της εικόνας υποµικροσυστοιχίας του σχήµατος Πειραµατικά αποτελέσµατα σε τεχνητές εικόνες µικροσυστοιχίας Προκειµένου να επιβεβαιωθεί η ακρίβεια της µεθόδου σε ένα καλά ελεγχόµενο περιβάλλον, πραγµατοποιείται ο υπολογισµός της προτεινόµενης προσέγγισης σε προσοµοιωµένες εικόνες µικροσυστοιχίας. Οι εικόνες αυτές παρουσιάζουν µια αρκετά ικανοποιητική οµ οιότητα µε τα πραγµατικά δεδοµένα. Με στόχο να παραχθεί προσοµοιωµένη εικόνα µικροσυστοιχίας που να έχει χαρακτηριστικά παρόµοια µε εκείνα των πραγµατικών εικόνων µικροσυστοιχίας, οι ακόλουθες παράµετροι τίθενται ίσες µε τις τιµές που συναντώνται σε πραγµατικά δεδοµένα: µέγιστη γωνία 145
146 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker περιστροφής για την µικροσυστοιχία και κάθε µια από τις υποµικροσυστοιχίες, µέγιστη τιµή της ακτίνας των spot και του διαστήµατος µεταξύ των spot στους άξονες αναφοράς. Ο προσοµοιωτής περιλαµβάνει ακόµα παραµέτρους που αφορούν στην διασπορά του προσθετικού θορύβου («αλάτι και πιπέρι» και Gaussian) και στην φωτεινότητα των spot. Η ακρίβεια της προτεινόµενης µεθόδου υπολογίστηκε σε µια προσοµοιωµένη βάση δεδοµένων Simu1, που περιέχει 22 εικόνες των 12 υποµικροσυστοιχιών, µε κάθε υποµικροσυστοιχία να αποτελείται από 24x24 spot. Η µέγιστη τιµή της ακτίνας των spot τέθηκε ίση µε 10 εικονοστοιχεία ενώ το spot διάστηµα στον οριζόντιο και κάθετο άξονα τέθηκε ίσο µε 20 εικονοστοιχεία, σύµφωνα µε τις αντίστοιχες τιµές που συναντώνται σε πραγµατικά δεδοµένα [20]. Η µέγιστη γωνία περιστροφής για τις µικροσυστοιχίες και τις υποµικροσυστοιχίες εντοπίζεται στο διαστήµα [-1.5 o, 1.5 o ], και για τις δυο περιπτώσεις αντίστοιχα, αφού είναι γεγονός ότι στις πραγµατικές εικόνες µικροσυστοιχίας, σπάνια συναντώνται υποµικροσυστοιχίες µε γωνίες περιστροφής µεγαλύτερες από 1.5 o. Στις προσοµοιωµένες εικόνες µικροσυστοιχίας, κάθε υποµικροσυστοιχία περιστρέφεται τυχαία είτε σύµφωνα µε τους δείκτες του ρολογιού είτε αντίστροφα. Επιπλέον, σε όλες τις προσοµοιωµένες εικόνες προστίθεται ταυτόχρονα τόσο θόρυβος τύπου «αλάτι και πιπέρι» όσο και Gaussian προσθετικός λευκός θόρυβος προκειµένου να προσοµοιωθεί η επίδραση των φυσικών φαινοµένων που εµφανίζονται κατά την διαδικασία παραγωγής των εικόνων µικροσυστοιχιών και επηρεάζουν την φωτεινότητα των εικονοστοιχείων. Τέλος, προκειµένου να επιτευχθεί καλύτερη προσοµοίωση, η φωτεινότητα και η περιοχή που καλύπτουν τα spot στην τεχνητή εικόνα µικροσυστοιχίας ορίζονται από µια γεννήτρια αριθµών οµοιόµορφης κατανοµής. Ένα τυπικό παράδειγµα προσοµοιωµένης εικόνας δίνεται στο σχήµα Όπως φαίνεται στο σχήµα 6.15 η προτεινόµενη µέθοδος εντοπίζει µε ακρίβεια τα εικονοστοιχεία που αντιστοιχούν σε spot, σε όλες τις υποµικροσυστοιχές της τεχνητής βάσης δεδοµένων ακόµα σε περιπτώσεις που η τεχνητή µικροσυστοιχία παρουσιάζει πολλά στοιχεία παρµόρφωσης. Στο σχήµα 6.16 απεικονίζεται η πιθανότητα κάθε εικονοστοιχείο της τεχνητής υποµικροσυστοιχίας να είναι spot 146
147 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker εικονοστοιχείο ενώ στο σχήµα 6.17 συγκρίνεται η ικανότητα της µεθόδου να κατηγοριοποιεί µε ακρίβεια τα εικονοστοιχεία της εικόνας σε σχέση µε την κατάτµηση που πραγµατοποιείται µε το µοντέλο Chan-Vese [8]. Σχήµα 6.14: Τυπικό παράδειγµα τεχνητής εικόνας µικροσυστοιχίας. 147
148 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker (α) (β) (γ) (δ) Σχήµα 6.15: (α) Μια µονοκαναλική υποµικροσυστοιχία από την Simu1 βάση δεδοµένων, (β) Εύρεση των spot-seeds, (γ) Μάσκα της µέγιστης spot περιοχής, (δ) Εικόνα πιθανοτήτων των spot της υποµικροσυστοιχίας µετά την εφαρµογή της προτεινόµενης µεθόδου που βασίζεται στον αλγόριθµο Random-Walker. 148
149 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker Σχήµα 6.16: Πιθανότητα για κάθε εικονοστοιχείο της τεχνητής εικόνας υποµικροσυστοιχίας του σχήµατος 6.15, να είναι spot µε p=8. Σχήµα 6.17: Κατάτµησηη µε το µοντέλο Chan-Vese της τεχνητής υποµικροσυστοιχίας του σχήµατος εικόνας 149
150 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker 6.4 Αναφορές 6 ου κεφαλαίου [1] Gerda Kamberova, Shishir Shah, DNA Array, Image Analysis, Nuts & Bolts, DNA Press LLC, [2] [3] [4] H. Wechsler, M. Kidode, A random walk procedure for texture discrimination, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. PAMI-1 pp , [5] Noura Azzabou, Nikos Paragios, Frederic Guichard, Random Walks- Constrained multiple hypothesis testing and image enhancement, ECCV 2006, Part1, LNCS 3951, pp , [6] US Patent , Digital phase-locked loop with random walk filter, [7] Grady, L., Random walks for image segmentation, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 28, pp , [8] Tony F. Chan, Luminita A. Vese, Active contours without edges, IEEE Transactions on Image Processing, vol.10, pp.1-31, [9] Andrew I. Hanna, Minimizing functional: A level set approach, Available at: nimizingfunctionals-alevelsetapproach_hanna.pdf, [10] Volkan Uslan and Dhsan Ömür Bucak: Microarray image segmentation using clustering methods, Mathematical and Computational Applications, 2010, 15,
151 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker [11] A. Neekabadi, Shadrokh Samavi, S. A. Razavi, Nader Karimi and Shahram Shirani: Lossless Microarray Image Compression using Region Based Predictors, IEEE International Conference on Image Processing, ICIP, San Antonio, TX, [12] Chang-Beom Park, Kwang-Woo Lee and Seong-Whan Lee: Automatic Microarray Image Segmentation Based on Watershed Transformation, 17th International Conference on Pattern Recognition, ICPR, Vol. 3, pp , [13] Emmanouil Athanasiadis, Dionisis Cavouras, Dimitris Glotsos, Pantelis Georgiadis, Ioannis Kalatzis and George Nikiforidis: Segmentation of complementary DNA microarray images by wavelet-based Markov random field model, IEEE Transactions on Information Technology in Biomedicine, 2009, 13, [14] A. Mastrogianni, G. Doukas, E. Dermatas, A. Bezerianos, Automatic subarray detection in microarray images, 4th IAPR International Conference on Pattern Recognition in Bioinformatics, Sheffield, United Kingdom, [15] N. Otsu, A threshold selection method from gray-level histograms, IEEE Transactions on Systems, Man and Cybernetics, vol.9, pp , [16] Human Sarcomas database, [17] The Lymphoma/Leukemia Molecular Profiling Project database, [18] A. Mastrogianni, E. Dermatas, A. Bezerianos, Robust pre-processing and noise reduction in microarray images, 5th IASTED International Conference on Biomedical Engineering, Innsbruck, Austria, [19] Microarray Spot Finding Example. Available at: 151
152 Κεφάλαιο 6: Κατάτµηση µικροσυστοιχίας µε τον αλγόριθµο Random-Walker [20] Peter Bajcsy, [21] Jianhong (Jackie) Shen, A stochastic-variational model for soft Mumford-Shah segmentation, International Journal of Biomedical Imaging, Vol. 2006, Article ID 92329, pp. 1 14, 2006,. [22] Li-jun Zhang, Xiao-juan Wu, Zan Sheng, A fast image segmentation approach based on Level Set method, IEEE 8th International Conference on Signal Processing, Beijing, China,
153 Κεφάλαιο 7 Συµπεράσµατα και Μελλοντική Έρευνα
154 Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα 154
155 Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα 7.1 Συµπεράσµατα ιδακτορικής ιατριβής Στην τεχνολογία των µικροσυστοιχιών, λόγω της φύσης των πειραµάτων που λαµβάνουν χώρα, η ύπαρξη προβληµάτων στις προκύπτουσες ψηφιακές εικόνες µικροσυστοιχίας είναι σχεδόν αναπόφευκτη. Η παρούσα διδακτορική διατριβή προτείνει νέες µεθόδους βελτίωσης που αφορούν στην επεξεργασία των εικόνων µικροσυστοιχίας µε στόχο την επίτευξη µιας πιο αξιόπιστης επεξεργασίας των µικροσυστοιχιών και κατά συνέπεια µιας πιο φερέγγυας µέτρησης της πληροφορίας που εµπεριέχεται στα υπό εξέταση γονίδια. Πιο συγκεκριµένα, στο 4 ο κεφάλαιο προτείνεται και παρουσιάζεται µια αυτόµατη µέθοδος εύρεσης της ακριβούς θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία. Στόχος της µεθόδου είναι η πιο γρήγορη και ακριβής ανάλυση των πραγµατικών εικόνων µικροσυστοιχίας. Στην πλειοψηφία των εργασιών που αφορούν στην επεξεργασία εικόνων µικροσυστοιχίας, το βήµα προεπεξεργασίας της εικόνας που περιλαµβάνει τον εντοπισµό των υποµικροσυστοιχιών σε µια µικροσυστοιχία, δεν πραγµατοποιείται αυτόµατα αλλά απαιτείται η παρέµβαση του χειριστή, διαδικασία που θεωρείται υποκειµενική, χρονοβόρα και ιδιαίτερα υψηλού κόστους. Η εφαρµογή της προτεινόµενης αυτόµατης µεθόδου επιτυγχάνει τόσο την ακριβή ευθυγράµµιση όσο και την επιτυχή εύρεση των γραµµών του πλέγµατος της µικροσυστοιχίας, απαιτώντας ως αρχική γνώση µόνο τις βασικές προδιαγραφές µιας µικροσυστοιχίας. Κατά την πειραµατική διαδικασία, η µέθοδος εντοπίζει µε ακρίβεια έναν αρκετά µεγάλο αριθµό υποµικροσυστοιχιών σε πέντε διαφορετικές πραγµατικές βάσεις δεδοµένων, κάθε µια από τις οποίες περιέχει ψηφιοποιηµένες εικόνες µικροσυστοιχίας διαφόρων τύπων, όσον αφορά στο είδος και το επίπεδο του θορύβου, τον αριθµό των υποµικροσυστοιχιών ανά µικροσυστοιχία, τον αριθµό των γραµµών και στηλών σε κάθε υποµικροσυστοιχία, το πλέγµα και το διάστηµα µεταξύ των spot. Ανάµεσα στα πιο σηµαντικά πλεονεκτήµατα της προτεινόµενης µεθόδου είναι ο ακριβής εντοπισµός των υποµικροσυστοιχιών ακόµα και στην περίπτωση εικόνων µικροσυστοιχίας µε υψηλό επίπεδο θορύβου και λανθασµένη ευθυγράµµιση του πλέγµατος. Επιπρόσθετα πειράµατα σε προσοµοιωµένες εικόνες τριών διαφορετικών τεχνητών βάσεων δεδοµένων, αναδεικνύουν την αλληλεπίδραση που έχει η γωνία περιστροφής µιας υποµικροσυστοιχίας µε την ακρίβεια εντοπισµού των γραµµών του πλέγµατος ενώ ταυτόχρονα µέσω των πειραµάτων επιβεβαιώνεται η 155
156 Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα ικανότητα της µεθόδου να εντοπίζει υποµικροσυστοιχίες ακόµη και σε δύσκολες συνθήκες όπως είναι το υψηλό επίπεδο θορύβου και οι µεγάλες γωνίες περιστροφής υποµικροσυστοιχιών και µικροσυστοιχιών. Στο 5 ο κεφάλαιο, λαµβάνοντας υπόψιν πόσο σηµαντικό θεωρείται στην επεξεργασία των εικόνων µικροσυστοιχίας το στάδιο της αποθορυβοποίησης των εικόνων, παρατίθεται µια πειραµατική σύγκριση γνωστών µεθόδων αποθορυβοποίησης εικόνων µικροσυστοιχίας που βασίζεται στα κυµατίδια και τα χωρικά φίλτρα µε στόχο την υλοποίηση τους σε υποµικροσυστοιχίες µε διαφορετικό τύπο και επίπεδο θορύβου. Επιπλέον στο κεφάλαιο, εφαρµόζονται τεχνικές µαθηµατικής µορφολογίας για την αποθορυβοποίηση των εικόνων µικροσυστοιχίας. Στα πειραµατικά αποτελέσµατα, όσον αφορά στην σύγκριση των µεθόδων αποθορυβοποίησης, γίνεται αξιολόγηση των µεθόδων αποθορυβοποίησης ως προς το είδος του θορύβου που αλλοιώνει την πληροφορία της εικόνας, ενώ στην περίπτωση της µαθηµατικής µορφολογίας δείχνεται ότι επιτυγχάνεται σηµαντική µείωση του θορύβου όταν αυτός έχει την µορφή «αλάτι και πιπέρι». Η κατάτµηση των εικόνων µικροσυστοιχίας κατέχει σηµαντική θέση στην επεξεργασία των µικροσυστοιχιών µε πολλές και διαφορετικές εργασίες να έχουν προτείνει λύσεις στην ταξινόµηση των εικονοστοιχείων της εικόνας, τα τελευταία χρόνια. Για τον λόγο αυτό, στο 6 ο κεφάλαιο περιγράφεται και αξιολογείται µια νέα µέθοδος κατάτµησης που βασίζεται στον αλγόριθµο Random-Walker. Η προτεινόµενη µέθοδος επιτυγχάνει υψηλή ακρίβεια κατάτµησης σε εικόνες µικροσυστοιχίας. Η πειραµατική αξιολόγηση αποδεικνύει ότι η προτεινόµενη µέθοδος ταξινοµεί µε επιτυχία τα spot σε όλες τις υποµικροσυστοιχίες της πραγµατικής και της τεχνητής βάσης δεδοµένων, µε µια µικρή απόκλιση στην ακρίβεια στην περίπτωση που διαδικασίες που έλαβαν χώρα κατά την δηµιουργία των εικόνων οδήγησαν σε εξαιρετικά υψηλό επίπεδο θορύβου και σε άνισες αποστάσεις είτε µεταξύ των γραµµών είτε µεταξύ των στηλών στην ίδια υποµικροσυστοιχία. Ένα σηµαντικό πλεονέκτηµα της προτεινόµενης µεθόδου είναι η σωστή κατηγοριοποίηση των εικονοστοιχείων της εικόνας ακόµα και στην περίπτωση όπου συναντώνται, ταυτόχρονα, αδύναµα ως προς την φωτεινότητα τους spot και αρκετά υψηλό επίπεδο πολλαπλών και ταυτόχρονων τύπων θορύβου. Μια ποιοτική σύγκριση της προτεινόµενης µεθόδου µε το γνωστό µοντέλο κατάτµησης εικόνων Chan-Vese στις ίδιες υποµικροσυστοιχίες (τεχνητές και πραγµατικές) αποδεικνύει, όπως παρατηρείται 156
157 Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα από τα πειραµατικά αποτελέσµατα στις αντίστοιχες εικόνες υποµικροσυστοιχίας, ότι η ακρίβεια ταξινόµησης των spot είναι σαφώς καλύτερη και πιο λεπτοµερής. 7.2 ηµοσιεύσεις σε διεθνή περιοδικά και συνέδρια ΗΜΟΣΙΕΥΣΕΙΣ ΣΕ ΙΕΘΝΗ ΠΕΡΙΟ ΙΚΑ 1. A. Mastrogianni, G. Doukas, E. Dermatas, A. Bezerianos, Automatic subgrid detection in microarray images, International Journal of Pattern Recognition and Artificial Intelligence, (υπό κρίση). 2. A. Mastrogianni, E. Dermatas, A. Bezerianos, Spot segmentation in Microarray images using the Random-Walker Algorithm, The Imaging Science Journal, (υπό κρίση). ΗΜΟΣΙΕΥΣΕΙΣ ΣΕ ΙΕΘΝΗ ΣΥΝΕ ΡΙΑ 1. A. Mastrogianni, E. Dermatas, A. Bezerianos, Robust pre-processing and noise reduction in microarray images, Proceedings of the 5th IASTED International Conference on Biomedical Engineering, Innsbruck, Austria, (2007). 2. A. Mastrogianni, E. Dermatas, A. Bezerianos, Microarray Image Denoising using Spatial Filtering and Wavelet Transformation, IFMBE Proceedings of the ICBME 3th International Conference on Biomedical Engineering, Singapore, (2008). 3. A. Mastrogianni, G. Doukas, E. Dermatas, A. Bezerianos, Automatic subarray detection in microarray images, Supplementary Proceedings of the 4th IAPR International Conference on Pattern Recognition in Bioinformatics, Sheffield, United Kingdom, (2009). 4. A. Mastrogianni, E. Dermatas, A. Bezerianos, Morphological Image Denoising and Random-Walks Spot Detection in Microarray Images, Proceedings of the 9th International Workshop on Mathematical Methods in Scattering Theory and Biomedical Engineering, Patras, Greece, (2009). 157
158 Κεφάλαιο 7: Συµπεράσµατα και Μελλοντική Έρευνα 7.3 Μελλοντικές κατευθύνσεις έρευνας Η µελλοντική έρευνα προς την οποία µπορούν να κινηθούν οι προτεινόµενες µέθοδοι περιλαµβάνουν δυο βασικές κατευθύνσεις. Επέκταση της µεθόδου αυτόµατης εύρεσης υποµικροσυστοιχιών: Η πρώτη κατεύθυνση µελλοντικής έρευνας περιλαµβάνει την επέκταση της µεθόδου αυτόµατου εντοπισµού της θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία, στην επεξεργασία των υποµικροσυστοιχιών. Πιο αναλυτικά, ενδεχόµενη επέκταση της µεθόδου θα αφορά στην εφαρµογή του αλγορίθµου ευθυγράµµισης του πλέγµατος στις µεµονωµένες υποµικροσυστοιχίες, όπως αυτές έχουν προκύψει από την εφαρµογή της προτεινόµενης µεθόδου. Επιπλέον τροποποιήσεις στην µέθοδο θα µπορούσαν να έχουν σαν αποτέλεσµα την εφαρµογή της στο πρόβληµα της διευθυνσιοδότησης των υποµικροσυστοιχιών, εντοπίζοντας τις γραµµές και τις στήλες των µεµονωµένων υποµικροσυστοιχιών. Επέκταση και βελτίωση της µεθόδου κατάτµησης των υποµικροσυστοιχιών, βασιζόµενη στον Random-Walker αλγόριθµο: Η δεύτερη κατεύθυνση µελλοντικής έρευνας περιλαµβάνει την επέκταση της προτεινόµενης µεθόδου στην αποθορυβοποίηση των υποµικροσυστοιχιών. Σύµφωνα µε την προτεινόµενη µέθοδο κατάτµησης της εικόνας µικροσυστοιχίας, λαµβάνοντας υπόψιν το γεγονός ότι ο περιβάλλον χώρος που βρίσκεται µακριά από τα κέντρα των spot δεν περιέχει χρήσιµη πληροφορία, ο,τιδήποτε βρίσκεται εκτός µιας αποδεκτής ακτίνας από το κέντρο των spot θεωρείται θόρυβος και κατά συνέπεια αποµακρύνεται από την εικόνα µικροσυστοιχίας χρησιµοποιώντας υπάρχουσες µεθόδους από την επεξεργασία των ψηφιακών εικόνων, επανεκτιµώντας ταυτόχρονα τα κέντρα των spot. Με αυτό τον τρόπο θα αποφεύγονται τα σφάλµατα που παρουσιάζονται στην µέθοδο κατάτµησης της εικόνας µικροσυστοιχίας λόγω κακής τοποθέτησης των γονιδίων πάνω στην µικροσυστοιχία. Επίσης, είναι σηµαντικό να µελετηθεί λεπτοµερέστερα η εγγενής δυνατότητα του αλγόριθµού να επεξεργάζεται χωρικά δεδοµένα. 158
159 Παράρτηµα Α Βάσεις δεδοµένων
160 Παράρτηµα Α 160
161 Παράρτηµα Α Α. 1 Εισαγωγή Στο Παράρτηµα Α παρουσιάζονται και περιγράφονται οι τεχνητές και οι πραγµατικές βάσεις δεδοµένων των ψηφιακών εικόνων µικροσυστοιχίας που χρησιµοποιήθηκαν για την αξιολόγηση των προτεινόµενων µεθόδων. Α. 2 Πραγµατικές βάσεις δεδοµένων Α.2.1 Lymphoma/Leukemia Molecular Profiling Project (LLMPP) βάση δεδοµένων Οι εικόνες της Lymphoma/Leukemia Molecular Profiling Project (LLMPP) µπορούν να κατηγοριοποιηθούν σε δύο οµάδες µικροσυστοιχιών. Στην πρώτη κατηγορία περιλαµβάνονται 47 µικροσυστοιχίες, αποτελούµενες από 16 υποµικροσυστοιχίες των 24x24 spot, ενώ στην δεύτερη κατηγορία περιέχονται 52 µικροσυστοιχίες αποτελούµενες από 32 υποµικροσυστοιχίες των 24x24 spot. Χαρακτηριστικά παραδείγµατα των δυο κατηγοριών απεικονίζονται στα σχήµατα Α- 1 και Α-2. Η βάση είναι διαθέσιµη στο διαδίκτυο στην διεύθυνση Σχήµα Α-1: Μικροσυστοιχία (lc7b047rex2.gif) της πρώτης κατηγορίας από την βάση Lymphoma/Leukemia Molecular Profiling Project. 161
162 Παράρτηµα Α Σχήµα Α-2: Μικροσυστοιχία (lc8n101rex2.gif) της δεύτερης κατηγορίας από την βάση Lymphoma/Leukemia Molecular Profiling Project. Α.2.2 Human Sarcomas βάση δεδοµένων Η Human Sarcomas βάση περιέχει 34 εικόνες µικροσυστοιχίας αποτελούµενες από 32 υποµικροσυστοιχίες, ενώ κάθε µια από αυτές συνίσταται από 6x8 spot. Η βάση αυτή αποτελεί τµήµα της έρευνας που έγινε από τους S. Subramanian, WO Lui, CH Lee, I. Espinosa, TO Nielsen, MC Heinrich, CL Corless, AZ Fire και M. van de Rijn για την εργασία MicroRNA expression signature of human sarcomas που δηµοσιεύτηκε στο περιοδικό Ocnogene - Nature (vol.14, pp ) το Η βάση είναι διαθέσιµη στο διαδίκτυο στην διεύθυνση Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
163 Παράρτηµα Α Σχήµα Α-3: Μικροσυστοιχία (71059.gif) από την βάση Human Sarcomas. Α.2.3 Young_vs_Old_Transgenic βάση δεδοµένων Η βάση δεδοµένων Young_vs_Old_Transgenic αποτελείται από 14 εικόνες µικροσυστοιχίας που περιέχουν 48 υποµικροσυστοιχίες των 29x30 spot. Οι εικόνες είναι διαθέσιµες στο διαδίκτυο στην διεύθυνση Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
164 Παράρτηµα Α Σχήµα Α-4: Μικροσυστοιχία (59978.gif) από την βάση Young_vs_Old_Transgenic. Α.2.4 Young Transgenic Control βάση δεδοµένων Η βάση δεδοµένων Young Transgenic Control αποτελείται από 8 εικόνες µικροσυστοιχίας που περιέχουν 48 υποµικροσυστοιχίες των 29x30 spot. Οι εικόνες είναι διαθέσιµες στο διαδίκτυο στην διεύθυνση Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
165 Παράρτηµα Α Σχήµα Α-5: Μικροσυστοιχία (72806.gif) από την βάση Young Transgenic Control. Α.2.5 Old Wildtype TPA Control βάση δεδοµένων Η βάση δεδοµένων Old Wildtype TPA Control αποτελείται από 8 εικόνες µικροσυστοιχίας που περιέχουν 48 υποµικροσυστοιχίες των 29x30 spot. Οι εικόνες είναι διαθέσιµες στο διαδίκτυο στην διεύθυνση Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
166 Παράρτηµα Α Σχήµα Α-6: Μικροσυστοιχία (72823.gif) από την βάση Old Wildtype TPA Control. Α. 3 Τεχνητές βάσεις δεδοµένων Α.3.1 Sim1 τεχνητή βάση δεδοµένων Η πρώτη βάση δεδοµένων Sim1 περιλαµβάνει 22 εικόνες προσοµοίωσης µικροσυστοιχίας, κάθε µία των οποίων περιέχει 12 υποµικροσυστοιχίες των 24x24 spot. Οι υποµικροσυστοιχίες έχουν περιστραφεί τυχαία στο διάστηµα [-3 o, 3 o ], ενώ η αυθαίρετη γωνία περιστροφής ολόκληρου του πλέγµατος της µικροσυστοιχίας 166
167 Παράρτηµα Α βρίσκεται στο διάστηµ µα [-3 o, 3 o ]. Χαρακτηριστικό παράδειγµα µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α-6. εικόνας Σχήµα Α-6: Μικροσυστοιχία από την τεχνητή βάση Sim1. Α.3.2 Sim2 τεχνητή βάση δεδοµένων Η δεύτερη βάση δεδοµ µένων Sim2 περιλαµβάνει 20 εικόνες προσοµοίωσης µικροσυστοιχίας, κάθε µια των οποίων περιέχει 12 υποµικροσυστοιχίες των 24x24 spot. Οι υποµικροσυστοιχίες έχουν περιστραφεί τυχαία στο διάστηµ µα [-1.5 o, 1.5 o ], ενώ η αυθαίρετη γωνία περιστροφής ολόκληρου του πλέγµατος της µικροσυστοιχίας βρίσκεται στο διάστηµ µα [-3 o, 3 o ]. Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
168 Παράρτηµα Α Σχήµα Α-7: Μικροσυστοιχία από την τεχνητή βάση Sim2. Α.3.3 Sim3 τεχνητή βάση δεδοµένων Η τρίτη βάση δεδοµένων Sim3 περιλαµβάνει 20 εικόνες προσοµοίωσης µικροσυστοιχίας κάθε µια των οποίων περιέχει 12 υποµικροσυστοιχίες των 24x24 spot. Οι υποµικροσυστοιχίες δεν έχουν περιστραφεί καθόλου, ενώ η αυθαίρετη γωνία περιστροφής ολόκληρου του πλέγµατος της µικροσυστοιχίας βρίσκεται στο διάστηµα [-3 o, 3 o ]. Χαρακτηριστικό παράδειγµα εικόνας µικροσυστοιχίας της βάσης απεικονίζεται στο σχήµα Α
169 Παράρτηµα Α Σχήµα Α-8: Μικροσυστοιχία από την τεχνητή βάση Sim3. Σε όλες τις βάσεις προσoµοίωσης των µικροσυστοιχιών, η µέγιστη τιµή της ακτίνας των spot τέθηκε ίση µε 10 εικονοστοιχεία ενώ το spot διάστηµα στον οριζόντιο και κάθετο άξονα τέθηκε ίσο µε 20 εικονοστοιχεία, σύµφωνα µε τις αντίστοιχες τιµές που συναντώνται σε πραγµατικά δεδοµένα. Στις προσοµοιωµένες εικόνες µικροσυστοιχίας των δυο πρώτων βάσεων, κάθε υποµικροσυστοιχία περιστράφηκε τυχαία είτε σύµφωνα µε τους δείκτες του ρολογιού είτε αντίστροφα,, στα διαστήµατα που αναφέρονται στις αντίστοιχες παραγράφους του παραρτήµατος Α. Επιπλέον, σε όλες τις προσοµοιωµένες εικόνες προστέθηκε ταυτόχρονα τόσο θόρυβος του τύπου «αλάτι και πιπέρι» όσο και Gaussian προσθετικός λευκός θόρυβος προκειµένου να προσοµοιωθεί η επίδραση των φυσικών φαινοµένων που εµφανίζονται κατά την 169
170 Παράρτηµα Α διαδικασία παραγωγής των εικόνων µικροσυστοιχιών και επηρεάζουν την φωτεινότητα των εικονοστοιχείων. Τέλος, µε στόχο να επιτευχθεί καλύτερη προσοµοίωση, η φωτεινότητα και η περιοχή που καλύπτουν τα spot ορίζονται µε γεννήτρια αριθµών οµοιόµορφης κατανοµής. 170
171 Παράρτηµα Β Πειραµατικά αποτελέσµατα
172 Παράρτηµα Β 172
173 Παράρτηµα Β Β. 1 Εισαγωγή Στο Παράρτηµα Β δίνονται ορισµένα επιπλέον χαρακτηριστικά πειραµατικά αποτελέσµατα, όπως αυτά προέκυψαν από την εφαρµογή της αυτόµατης µεθόδου εύρεσης υποµικροσυστοιχιών, των µεθόδων αποθορυβοποίησης και της µεθόδου κατάτµησης µικροσυστοιχιών µε επέκταση του αλγορίθµου Random-Walker. Β. 2 Χαρακτηριστικά πειραµατικά αποτελέσµατα 4 ου κεφαλαίου Στα σχήµατα Β-4.1, Β-4.2, Β-4.3 και Β-4.4 που ακολουθούν παρουσιάζονται χαρακτηριστικά παραδείγµατα εφαρµογής της µεθόδου αυτόµατου εντοπισµού της θέσης των υποµικροσυστοιχιών σε µια µικροσυστοιχία. Τα δυο πρώτα σχήµατα απεικονίζουν µικροσυστοιχίες που προέρχονται από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project, ενώ τα επόµενα δυο αντιστοιχούν σε τεχνητές µικροσυστοιχίες κατασκευασµένες από έναν προσοµοιωτή εικόνων µικροσυστοιχίας. (α) (β) Σχήµα Β-4.1: (α) Μικροσυστοιχία (lc4b027rex2.gif) από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project, (β) Αποτέλεσµα εφαρµογής της αυτόµατης µεθόδου εύρεσης της θέσης των υποµικροσυστοιχιών στην lc4b027rex2.gif µικροσυστοιχία. 173
174 Παράρτηµα Β (α) (β) Σχήµα Β-4.2: (α) Μικροσυστοιχία (lc4b068rex2.gif) από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project, (β) Αποτέλεσµα εφαρµογής της αυτόµατης µεθόδου εύρεσης της θέσης των υποµικροσυστοιχιών στην lc4b068rex2.gif µικροσυστοιχία. (α) (β) Σχήµα Β-4.3: (α) Τεχνητή µικροσυστοιχία µε τέσσερις υποµικροσυστοιχίες περιστρεµµένες τυχαία ως προς τους άξονες αναφοράς στο διάστηµα [-1.5 o, 1.5 o ], (β) Αποτέλεσµα εφαρµογής της αυτόµατης µεθόδου εύρεσης της θέσης των υποµικροσυστοιχιών στην τεχνητή µικροσυστοιχία. Τυχόν λάθη που παρουσιάζονται στην εικόνα (β) οφείλονται στην µεγάλη γωνία περιστροφής των µεµονωµένων υποµικροσυστοιχιών ενώ ο αλγόριθµος ευθυγράµµισης της µεθόδουπεριέστρεψε την µικροσυστοιχία κατά 0.5 o. 174
175 Παράρτηµα Β (α) (β) Σχήµα Β-4.4: (α) Τεχνητή µικροσυστοιχία µε εννέα υποµικροσυστοιχίες περιστρεµµένες τυχαία ως προς τους άξονες αναφοράς στο διάστηµα [-1.5 o, 1.5 o ], (β) Αποτέλεσµα εφαρµογής της αυτόµατης µεθόδου εύρεσης της θέσης των υποµικροσυστοιχιών στην τεχνητή µικροσυστοιχία. Τυχόν λάθη που παρουσιάζονται στην εικόνα (β) οφείλονται στην µεγάλη γωνία περιστροφής των µεµονωµένων υποµικροσυστοιχιών ενώ ο αλγόριθµος ευθυγράµµισης της µεθόδουπεριέστρεψε την µικροσυστοιχία κατά 1 o. 175
176 Παράρτηµα Β Β. 3 Πειραµατικά αποτελέσµατα 5 ου κεφαλαίου Στους πίνακες Β-5.1 και Β-5.2 παρουσιάζονται η µέση τιµή του PSNR και του SNR των δυο µεθόδων αποθορυβοποίησης που βασίζονται στο φίλτρο ενδιάµεσης τιµής (median) και το φίλτρο Wiener αντίστοιχα, για 150 επιλεγµένες υποµικροσυστοιχίες από την βάση δεδοµένων Human Sarcomas. Στους πίνακες Β-5.3, Β-5.4, Β-5.5, Β- 5.6 και Β-5.7 παρουσιάζονται τα πειραµατικά αποτελέσµατα για τα PSNR και SNR σε τέσσερα επίπεδα θορύβου, όπως αυτά προκύπτουν όταν η αποθορυβοποίηση πραγµατοποιείται µε χρήση πέντε οικογενειών µετασχηµατισµού κυµατιδίου (haar, db2, sym2, bior1.1 και coif) µε soft και hard κατώφλι και δυο επίπεδα ανάλυσης. Ο µετασχηµατισµός κυµατιδίου εφαρµόζεται σε 150 επιλεγµένες υποµικροσυστοιχίες από την βάση δεδοµένων Human Sarcomas. Φίλτρο ενδιάµεσης τιµής ιασπορά Θόρυβος τύπου «αλάτι και πιπέρι» PSNR (db) SNR (db) Gaussian θόρυβος PSNR (db) SNR (db) Πίνακας Β-5.1: Τιµές των PSNR και βελτίωσης του SNR σε db για το φίλτρο ενδιάµεσης τιµής σε τέσσερα επίπεδα και δυο κατηγορίες θορύβου. Φίλτρο Wiener ιασπορά Θόρυβος τύπου «αλάτι και πιπέρι» PSNR (db) SNR (db) Gaussian θόρυβος PSNR (db) SNR (db) Πίνακας Β-5.2: Τιµές των PSNR και SNR σε db για το φίλτρο Wiener σε τέσσερα επίπεδα και δυο κατηγορίες θορύβου. 176
177 Παράρτηµα Β Μετασχηµατισµός κυµατιδίου haar ιασπορά Soft κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Hard κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Πίνακας Β-5.3: Τιµές των PSNR και SNR σε db για το µετασχηµατισµό κυµατιδίου haar (τέσσερα επίπεδα θορύβου -δυο κατηγορίες θορύβου). Μετασχηµατισµός κυµατιδίου db2 ιασπορά Soft κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Hard κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Πίνακας Β-5.4: Τιµές των PSNR και SNR σε db για το µετασχηµατισµό κυµατιδίου db2 (τέσσερα επίπεδα θορύβου -δυο κατηγορίες θορύβου). 177
178 Παράρτηµα Β Μετασχηµατισµός κυµατιδίου sym2 ιασπορά Soft κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Hard κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Πίνακας Β-5.5: Τιµές των PSNR και SNR σε db για το µετασχηµατισµό κυµατιδίου sym2 (τέσσερα επίπεδα θορύβου -δυο κατηγορίες θορύβου). Μετασχηµατισµός κυµατιδίου bior1.1 ιασπορά Soft κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Hard κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Πίνακας Β-5.6: Τιµές των PSNR και SNR σε db για το µετασχηµατισµό κυµατιδίου bior1.1 (τέσσερα επίπεδα θορύβου -δυο κατηγορίες θορύβου). 178
179 Παράρτηµα Β Μετασχηµατισµός κυµατιδίου coif ιασπορά Soft κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Hard κατώφλι Θόρυβος τύπου «αλάτι και πιπέρι» PSNR SNR Gaussian θόρυβος PSNR SNR Πίνακας Β-5.7: Τιµές των PSNR και SNR σε db για το µετασχηµατισµό κυµατιδίου coif (τέσσερα επίπεδα θορύβου -δυο κατηγορίες θορύβου). 179
180 Παράρτηµα Β Β. 4 Χαρακτηριστικά πειραµατικά αποτελέσµατα 6 ου κεφαλαίου Στο σχήµα Β-6.1 δίνεται ένα χαρακτηριστικό παράδειγµα εφαρµογής του αλγορίθµου Random-Walker σε υποµικροσυστοιχία από την βάση δεδοµένων Human Sarcomas. (α) (β) (γ) (δ) Σχήµα Β-6.1: (α) υαδική υποµικροσυστοιχία, (β) Υποµικροσυστοιχία µετά την αποθορυβοποίηση µε µεθόδους µαθηµατικής µορφολογίας, (γ) Εύρεση των spot-seeds, (δ) Κατάτµηση στην αρχική µονοκαναλική υποµικροσυστοιχία. Τα σχήµατα Β-6.2 και Β-6.3 παρουσιάζουν παραδείγµατα µεγάλων σφαλµάτων στην κατάτµηση των εικόνων κατά την εφαρµογή της εφαρµογής του Random-Walker αλγορίθµου σε δυο υποµικροσυστοιχίες από τις βάσεις δεδοµένων Human Sarcomas και Lymphoma/Leukemia Molecular Profiling Project, αντίστοιχα. Το 180
181 Παράρτηµα Β υψηλό σφάλµα κατάτµησης οφείλεται στην εξαιρετικά υψηλή παρουσία θορύβου, όπως χαρακτηριστικά φαίνεται στα σχήµατα που ακολουθούν. (α) (β) Σχήµα Β-6.2: (α) Υποµικροσυστοιχία µε υψηλό επίπεδο θορύβου από την βάση δεδοµένων Human Sarcomas, (β) Αποτυχηµένη κατάτµηση της υποµικροσυστοιχίας µετά την µερική αποθορυβοποίηση της µε µεθόδους µαθηµατικής µορφολογίας. (α) (β) Σχήµα Β-6.3: (α) Υποµικροσυστοιχία µε υψηλό επίπεδο θορύβου από την βάση δεδοµένων Lymphoma/Leukemia Molecular Profiling Project, (β) Αποτυχηµένη κατάτµηση της υποµικροσυστοιχίας µετά την µερική αποθορυβοποίηση της µε µεθόδους µαθηµατικής µορφολογίας. 181
Νουκλεϊκά οξέα: νήµατα και αγγελιαφόροι της ζωής
Νουκλεϊκά οξέα: νήµατα και αγγελιαφόροι της ζωής Αριστοτέλης Κωτίτσας Οι λειτουργίες των οργανισµών πραγµατοποιούνται χάρη στις πρωτεΐνες. Ο βιολογικός ρόλος των πρωτεϊνών καθορίζεται από τη µορφή τους.
ΤΟ DNA ΚΑΙ RNA. Θανος Εξαρχου Γ1
ΤΟ DNA ΚΑΙ RNA Θανος Εξαρχου Γ1 ΤΟ DNA Το δε(σ)οξυριβο(ζο)νουκλεϊ(νι)κό οξu είναι νουκλεϊκό οξύ που περιέχει τις γενετικές πληροφορίες που καθορίζουν τη βιολογική ανάπτυξη όλων των κυτταρικών μορφών ζωής
Γονιδιωματική. G. Patrinos
Γονιδιωματική Η μεταγονιδιωματική εποχή... Σημαντικότερα επιτεύγματα POST GENOME ERA Ολοκλήρωση της αποκρυπτογράφησης της αλληλουχίας των γονιδιωμάτων πολλών οργανισμών. Προτύπωση μεθοδολογιών για προσδιορισμό
ΚΕΦΑΛΑΙΟ 5. Διατήρηση και συνέχεια της ζωής
ΚΕΑΛΑΙΟ 5 ιατήρηση και συνέχεια της ζωής 5.2 H ροή της γενετικής πληροφορίας 3 Πώς βρέθηκε η δομή του DNA στο χώρο; Η ανακάλυψη της δομής του DNA πραγματοποιήθηκε το 1953 από τους Watson και Crick. Από
KΕΦΑΛΑΙΟ 1ο Χημική σύσταση του κυττάρου. Να απαντήσετε σε καθεμιά από τις παρακάτω ερωτήσεις με μια πρόταση:
KΕΦΑΛΑΙΟ 1ο Χημική σύσταση του κυττάρου Ενότητα 1.1: Χημεία της ζωής Ενότητα 2.1: Μακρομόρια Να απαντήσετε σε καθεμιά από τις παρακάτω ερωτήσεις με μια πρόταση: 1. Για ποιο λόγο θεωρείται αναγκαία η σταθερότητα
ΘΕΜΑ Α Α1. γ Α2. γ Α3. α Α4. β Α5. β ΘΕΜΑ B B1. B2.
ΘΕΜΑ Α Α1. γ (το πριμόσωμα) Α2. γ (οι υποκινητές και οι μεταγραφικοί παράγοντες κάθε γονιδίου) Α3. α (μεταφέρει ένα συγκεκριμένο αμινοξύ στο ριβόσωμα) Α4. β (αποδιάταξη των δύο συμπληρωματικών αλυσίδων)
Βιολογία Γ Γενικού Λυκείου Θετικής κατεύθυνσης. Κεφάλαιο 1α Το Γενετικό Υλικό
Βιολογία Γ Γενικού Λυκείου Θετικής κατεύθυνσης Κεφάλαιο 1α Το Γενετικό Υλικό Το DNA είναι το γενετικό υλικό Αρχικά οι επιστήμονες θεωρούσαν ότι οι πρωτεΐνες αποτελούσαν το γενετικό υλικό των οργανισμών.
Εφαρμογές τεχνολογιών Μοριακής Βιολογίας στην Γενετική
Εφαρμογές τεχνολογιών Μοριακής Βιολογίας στην Γενετική Πεφάνη Δάφνη 06.03.2019 Επίκουρη καθηγήτρια Εργαστήριο Βιολογίας Τεχνικές μοριακής βιολογίας Επιτρέπουν την μελέτη της δομής του DNA και της έκφρασης
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ. Παύλος Αντωνίου
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΕΠΛ 450 ΥΠΟΛΟΓΙΣΤΙΚΗ ΒΙΟΛΟΓΙΑ Παύλος Αντωνίου Με μια ματιά: Εισαγωγή στη Βιολογία Ευθυγράμμιση Ακολουθιών Αναζήτηση ομοίων ακολουθιών από βάσεις δεδομενων Φυλογενετική πρόβλεψη Πρόβλεψη
Μόρια-κλειδιά των ζωντανών οργανισμών καθώς περιέχουν την γενετική πληροφορία Νουκλεϊκά οξέα:
Μόρια-κλειδιά των ζωντανών οργανισμών καθώς περιέχουν την γενετική πληροφορία 1. Δεοξυριβονουκλεϊκό οξύ (DNA) Νουκλεϊκά οξέα: Φορέας της γενετικής πληροφορίας 2. Ριβονουκλεϊκό οξύ (RNA) Συμμετοχή στην
ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ_ Β ΛΥΚΕΙΟΥ
Θα πρέπει να γνωρίζετε: Τη χημική σύσταση και τη δομή των νουκλεοτιδίων Πώς σχηματίζεται μια πολυνουκλεοτιδική αλυσίδα Πώς σταθεροποιείται η διπλή έλικα του DNA Τι υποδηλώνει ο όρος συμπληρωματικές αλυσίδες
ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ ΒΙΒΛΙΟ ΜΟΥ (YΠΟ ΕΚ ΟΣΗ): ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ
ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ ΒΙΒΛΙΟ ΜΟΥ (YΠΟ ΕΚ ΟΣΗ): ΒΙΟΛΟΓΙΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Β ΛΥΚΕΙΟΥ (Περιέχει 67 ερωτήσεις θεωρίας µε απαντήσεις, 116 ασκήσεις ανοικτού- κλειστού τύπου µε µ
Β. Σελ 60 σχολικού: «Η αποµόνωση του συνολικού έως και σελ 61 από µία cdna βιβλιοθήκη.». Γ. ι ι α α α ι α α ι α α α! " # $ % & ' ( ) ( ) ( * % + α ι α
! THΛ: 270727 222594 THΛ: 919113 949422 Απαντήσεις: " # $ % & ' 1=γ, 2=β, 3=γ, 4=β, 5=δ. " # $ % ( ' εδοµένα από την ανάλυση του ποσοστού των βάσεων σε µόρια DNA από διαφορετικούς οργανισµούς έδειχναν
5 GTG CAC CTG ACT CCT GAG GAG 3 3 CAC GTG GAC TGA GGA CTC CTC 5
Βιολογία Κατεύθυνσης Γ Λυκείου Απαντήσεις διαγωνίσματος στο Κεφάλαιο 4 ο ΘΕΜΑ Α Α1. β Α2. β Α3. γ Α4. β Α5. β ΘΕΜΑ B B1. Ο κλώνος είναι μια ομάδα πανομοιότυπων μορίων, κυττάρων, ή οργανισμών. B2. Η υβριδοποίηση
ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ
ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ ΚΕΦΑΛΑΙΟ 2 ο 1. Με ποιο μηχανισμό αντιγράφεται το DNA σύμφωνα με τους Watson και Crick; 2. Ένα κύτταρο που περιέχει ένα μόνο χρωμόσωμα τοποθετείται σε θρεπτικό υλικό που περιέχει ραδιενεργό
Νικόλαος Σιαφάκας Λέκτορας Διαγνωστικής Ιολογίας Εργαστήριο Κλινικής Μικροβιολογίας ΠΓΝ «ΑΤΤΙΚΟΝ»
Νικόλαος Σιαφάκας Λέκτορας Διαγνωστικής Ιολογίας Εργαστήριο Κλινικής Μικροβιολογίας ΠΓΝ «ΑΤΤΙΚΟΝ» DNA RNA: ΑΝΤΙΓΡΑΦΗ, ΜΕΤΑΓΡΑΦΗ, ΜΕΤΑΦΡΑΣΗ DNA RNA: Βασικά Χαρακτηριστικά Ρόλος Κεντικό Δόγμα της Βιολογίας:
POLYMERASE CHAIN REACTION (PCR) ΑΛΥΣΙΔΩΤΗ ΑΝΤΙΔΡΑΣΗ ΤΗΣ ΠΟΛΥΜΕΡΑΣΗΣ
POLYMERASE CHAIN REACTION (PCR) ΑΛΥΣΙΔΩΤΗ ΑΝΤΙΔΡΑΣΗ ΤΗΣ ΠΟΛΥΜΕΡΑΣΗΣ Kary Mullis (Nobel Χημείας, 1993) in vitro τεχνική ( molecular photocopying ) Εφαρμογή σε όλους τους τομείς της Βιολογίας Στις περισσότερες
Κεφάλαιο 4: Ανασυνδυασμένο DNA
Κεφάλαιο 4: Ανασυνδυασμένο DNA 1. Η ανάπτυξη της γενετικής μηχανικής επέτρεψε: α. την κατανόηση των μηχανισμών αντιγραφής του γενετικού υλικού β. την απομόνωση των πλασμιδίων από τα βακτήρια γ. την πραγματοποίηση
ΓΕΝΕΤΙΚΗ ΜΗΧΑΝΙΚΗ. Η τεχνολογία του ανασυνδυασμένου DNA και οι εφαρμογές της...
ΓΕΝΕΤΙΚΗ ΜΗΧΑΝΙΚΗ Η τεχνολογία του ανασυνδυασμένου DNA και οι εφαρμογές της... Γενετική Μηχανική o Περιλαμβάνει όλες τις τεχνικές με τις οποίες μπορούμε να επεμβαίνουμε στο γενετικό υλικό των οργανισμών.
ΣΥΜΠΥΚΝΩΣΗ: αφαίρεση ενός μορίου νερού - σύνθεση ενός διμερούς ΥΔΡΟΛΥΣΗ : προσθήκη ενός μορίου νερού - διάσπαση του διμερούς στα συστατικά του
ΣΥΜΠΥΚΝΩΣΗ: αφαίρεση ενός μορίου νερού - σύνθεση ενός διμερούς ΥΔΡΟΛΥΣΗ : προσθήκη ενός μορίου νερού - διάσπαση του διμερούς στα συστατικά του ΤΑ ΜΟΝΟΜΕΡΗ ΣΥΝΔΕΟΝΤΑΙ ΜΕ ΟΜΟΙΟΠΟΛΙΚΟ ΔΕΣΜΟ. 1. ΠΡΩΤΕΪΝΕΣ
Κεφ. 4 DNA, RNA και η ροή των γενετικών πληροφοριών
Κεφ. 4 DNA, RNA και η ροή των γενετικών πληροφοριών Η οικογενειακή ομοιότητα, οφείλεται στα κοινά γονίδια. Τα γονίδια πρέπει να εκφραστούν για να έχουν αποτέλεσμα, και η έκφραση αυτή ρυθμίζεται από πρωτεΐνες.
Τα χημικά στοιχεία που είναι επικρατέστερα στους οργανισμούς είναι: i..
ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ «XHMIKH ΣΥΣΤΑΣΗ ΤΟΥ ΚΥΤΤΑΡΟΥ» ΕΙΣΑΓΩΓΗ ΚΑΙ Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ Α. ΔΡΑΣΤΗΡΙΟΤΗΤΕΣ ΜΕΣΑ ΣΤΗΝ ΤΑΞΗ 1. Όταν αναφερόμαστε στον όρο «Χημική Σύσταση του Κυττάρου», τί νομίζετε ότι
Βιοτεχνολογία Φυτών. Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία)
Βιοτεχνολογία Φυτών ΔΠΘ / Τμήμα Αγροτικής Ανάπτυξης ΠΜΣ Αειφορικά Συστήματα Παραγωγής και Περιβάλλον στη Γεωργία Μοριακοί Δείκτες (Εισαγωγή στη Μοριακή Βιολογία) Αριστοτέλης Χ. Παπαγεωργίου Εργαστήριο
Απομόνωση ανθρώπινου DNA γονιδιώματος & ποιοτικός και ποσοτικός προσδιορισμός
Απομόνωση ανθρώπινου DNA γονιδιώματος & ποιοτικός και ποσοτικός προσδιορισμός Ευαγγελία - Ειρήνη Τσερμπίνι 1. Σκοπός Σκοπός της παρούσας άσκησης είναι η απομόνωση ανθρώπινου DNA γονιδιώματος από δείγμα
Κεφάλαιο 1: Το Γενετικό Υλικό 1.
Κεφάλαιο 1: Το Γενετικό Υλικό 1. Ο πνευμονιόκοκκος είναι: α. μύκητας β. βακτήριο γ. ιός δ. πρωτόζωο 2. Στο πείραμα του Griffith τι αποτελέσματα είχε ο εμβολιασμός με βακτήρια, θάνατο(θ) ή επιβίωση (Ε),
Πανεπιστήμιο Θεσσαλίας Τμήμα βιοχημείας και βιοτεχνολογίας
Πανεπιστήμιο Θεσσαλίας Τμήμα βιοχημείας και βιοτεχνολογίας Διδακτική με έμφαση στις βιοεπιστήμες Μαρία Ευαγγελία Βασιλογιάννη Στοιχεία Μαθήματος 1. Μάθημα : Βιολογία 2. Τίτλος ενότητας: Η ροή της γενετικής
ΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ
ΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΚΕΦΑΛΑΙΟ 1: Το γενετικό υλικό ΘΕΜΑ: 1 ο (Μονάδες 25 ) Να επιλέξετε τη σωστή απάντηση στις παρακάτω ερωτήσεις. 1. Το πείραµα των Hershey και Chase ήταν:
Οργά νωση Γενετικού Υλικού
Βιολογία Γ Γυμνασίου: Διατήρηση και Συνέχεια της Ζωής Οργά νωση Γενετικού Υλικού Γονίδιο: Η μονάδα της κληρονομικότητας. Ουσιαστικά είναι ένα κομμάτι από το DNA που αποθηκεύει πληροφορίες για κάποιο συγκεκριμένο
Βιολογία Θετικής Κατεύθυνσης. 4 ο Κεφάλαιο - Τεχνολογία του ανασυνδυασμένου DNA
Βιολογία Θετικής Κατεύθυνσης 4 ο Κεφάλαιο - Τεχνολογία του ανασυνδυασμένου DNA Τεχνολογία ανασυνδυασμένου DNA Αναπτύχθηκε λόγω της ανακάλυψης: i. Περιοριστικών ενδονουκλεασών ii. Ειδικών φορέων DNA Έδωσε
ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA
ΓΥΜΝΑΣΙΟ ΚΕΡΑΤΕΑΣ ΕΡΓΑΣΙΑ ΒΙΟΛΟΓΙΑΣ Β ΤΡΙΜΗΝΟΥ Γ 4 23.1.12 ΜΕΤΑΓΡΑΦΗ ΤΟΥ DNA ΣΕ RNA ΕΡΓΑΣΤΗΚΑΝ: ΑΛΕΞΑΝΔΡΟΣ ΔΕΛΗΜΙΧΑΛΗΣ ΑΡΤΕΜΗΣ ΑΝΑΣΤΑΣΙΑΔΗΣ 1 ΕΙΣΑΓΩΓΗ Το δεοξυριβονουκλεϊκό οξύ (Deoxyribonucleic acid -
3. Σε ένα σωματικό κύτταρο ανθρώπου που βρίσκεται στη μεσόφαση πριν την αντιγραφή υπάρχουν:
ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΚΑΤΕΥΘΥΝΣΗΣ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: ΘΕΜΑ 1 Ο Α. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: 1. Στο οπερόνιο της λακτόζης: Α. Η πρωτεΐνη καταστολέας
ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. β Α3. δ Α4. γ Α5. γ. ΘΕΜΑ Β Β1. Στήλη Ι Στήλη ΙΙ 1 Α 2 Γ 3 Α 4 Β 5 Α 6 Α 7 Γ
ΘΕΜΑ Α Α1. β Α2. β Α3. δ Α4. γ Α5. γ 1 ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β) ΠΑΡΑΣΚΕΥΗ 27 ΜΑΪΟΥ 2016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (ΝΕΟ ΣΥΣΤΗΜΑ) ΒΙΟΛΟΓΙΑ
ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΙΑΤΡΙΚΗ
ΕΦΑΡΜΟΓΕΣ ΤΗΣ ΒΙΟΤΕΧΝΟΛΟΓΙΑΣ ΣΤΗΝ ΙΑΤΡΙΚΗ Καθώς η επιστημονική γνώση και κατανόηση αναπτύσσονται, ο μελλοντικός σχεδιασμός βιοτεχνολογικών προϊόντων περιορίζεται μόνο από τη φαντασία μας Βιοτεχνολογία
Βιολογία Γενικής Παιδείας Β Λυκείου
Απρίλιος Μάιος 12 Βιολογία Γενικής Παιδείας Β Λυκείου Βιολογία Γενικής Παιδείας Β Λυκείου (Ερωτήσεις που παρουσιάζουν ενδιαφέρον) 1. Τι είναι τα βιομόρια και ποια είναι τα βασικά χαρακτηριστικά τους; Βιομόρια
ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ / Γ ΛΥΚΕΙΟΥ ΑΠΑΝΤΗΣΕΙΣ
ΜΑΘΗΜΑ / ΤΑΞΗ : ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ / Γ ΛΥΚΕΙΟΥ ΗΜΕΡΟΜΗΝΙΑ: 04/09/2016 ΘΕΜΑ Α Α.1. β. Α.2. β. Α.3. γ. Α.4. δ. ΑΠΑΝΤΗΣΕΙΣ Α.5. β. Μονάδες 25 ΘΕΜΑ Β Β. 1. Ιχνηθέτηση. είναι η σήμανση χημικών
8. Σε στέλεχος του βακτηρίου E.coli δε λειτουργεί το γονίδιο που παράγει τον καταστολέα του οπερόνιου της λακτόζης. Ποιο είναι το αποτέλεσμα σε σχέση
Γονιδιακή ρύθμιοη 1. Εντοπίστε δύο διαφορές στον έλεγχο της γονιδιακής έκφρασης ανάμεσα στους προκαρυωτικούς και στους ευκαρυωτικούς οργανισμούς. Α. Η ρύθμιση της γσνιδιακής έκφρασης στους προκαρυωτικούς
Βιολογία Κατεύθυνσης Γ Λυκείου
Βιολογία Κατεύθυνσης Γ Λυκείου 2013-2014 ΓΕ.Λ. ΣΟΡΩΝΗΣ ΜΑΣΤΗ ΧΡΙΣΤΙΝΑ Κεφάλαιο 1 ΤΟ ΓΕΝΕΤΙΚΟ ΥΛΙΚΟ Ταξίδι στο χρόνο 1869 Απομονώνεται DNA από τον κυτταρικό πυρήνα 1903 Αποδεικνύεται ότι τα χρωμοσώματα
Με την ανάπτυξη αυτής της τεχνολογίας το DNA που ήταν τόσο δύσκολο να µελετηθεί έγινε «παιχνίδι» στα ανθρώπινα χέρια
ΚΕΦΑΛΑΙΟ 4ο: Η τεχνολογία του ανασυνδυασµένου DNA έδωσε στον άνθρωπο την ικανότητα όχι µόνο να ερευνά αλλά και να τροποποιεί το γενετικό υλικό των οργανισµών ΤΕΧΝΟΛΟΓΙΑ ΤΟΥ ΑΝΑΣΥΝ ΥΑΣΜΕΝΟΥ DNA Η τεχνολογία
ΑΠΑΝΤΗΣΕΙΣ. Α. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:
ΘΕΜΑ 1 Ο ΑΠΑΝΤΗΣΕΙΣ Α. Να επιλέξετε τη φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: 1. Στο οπερόνιο της λακτόζης: Α. Η πρωτεΐνη καταστολέας συνδέεται με το ρυθμιστικό γονίδιο Β. Το
Διαγώνισμα Βιολογίας στα Κεφάλαια 1 έως 4 ΚΥΡΙΑΚΗ 7 ΔΕΚΕΜΒΡΙΟΥ 2014
Διαγώνισμα Βιολογίας στα Κεφάλαια 1 έως 4 ΚΥΡΙΑΚΗ 7 ΔΕΚΕΜΒΡΙΟΥ 2014 ΘΕΜΑ Α Α1. β Α2. β Α3. β Α4. β Α5. β ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ B B1. Ο όρος γονιδιακή έκφραση αναφέρεται συνήθως σε όλη τη διαδικασία με την οποία
Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ
Ι. ΘΕΩΡΙΑ ΠΙΝΑΚΑΣ 2.1: ΣΥΓΚΡΙΤΙΚΟΣ ΠΙΝΑΚΑΣ ΑΝΤΙΓΡΑΦΗΣ-ΜΕΤΑΓΡΑΦΗΣ ΣΤΟΝ ΠΥΡΗΝΑ ΤΩΝ ΕΥΚΑΡΥΩΤΙΚΩΝ ΚΥΤΤΑΡΩΝ ΑΝΤΙΓΡΑΦΗ ΜΕΤΑΓΡΑΦΗ Γίνεται σύνθεση DNA. Γίνεται σύνθεση RNA. Εξασφαλίζεται η διαιώνιση της γενετικής
ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ)
ΑΠΑΝΤΗΣΕΙΣ ΔΙΑΓΩΝΙΣΜΑΤΟΣ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (Β ΛΥΚΕΙΟΥ) ΘΕΜΑ Α Να γράψετε στο τετράδιο σας τον αριθμό κάθε μιας από τις παρακάτω ημιτελείς προτάσεις 1-5 και δίπλα το γράμμα που αντιστοιχεί στη λέξη
Οι δευτερογενείς µεταβολίτες
Οι δευτερογενείς µεταβολίτες Είναιταπροϊόνταδευτερογενούςµεταβολισµού. Μερικοί γνωστοί δευτερογενείς µεταβολίτες είναι η µορφίνη, ήκαφεΐνη, το καουτσούκ κ.ά. Ο ρόλος τους φαίνεται να είναι οικολογικής
ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ_ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
ΕΙΚΟΝΑ_1.1 In vivo πειράματα απόδειξης της έννοιας του μετασχηματισμού και in vitro απόδειξη ότι το DNA είναι αυτό που προκαλεί το μετασχηματισμό. ΕΡΩΤΗΣΕΙΣ 1. Γιατί πιστεύετε ότι θανατώνονται τα βακτήρια
Θέματα πριν τις εξετάσεις. Καλό διάβασμα Καλή επιτυχία
Θέματα πριν τις εξετάσεις Καλό διάβασμα Καλή επιτυχία 2013-2014 Θέματα πολλαπλής επιλογής Μετουσίωση είναι το φαινόμενο α. κατά το οποίο συνδέονται δύο αμινοξέα για τον σχηματισμό μιας πρωτεΐνης β. κατά
ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΔΙΑΓΩΝΙΣΜΑ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ 12-9-2015
ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΔΙΑΓΩΝΙΣΜΑ ΣΤΟ 1 ο ΚΕΦΑΛΑΙΟ 12-9-2015 ΘΕΜΑ Α Α1. α. in vitro β. in vivo γ. in vitro δ. in vitro Α2. γ Μεταξύ των δύο δεοξυριβονουκλεοτιδίων έχουμε συμπληρωματικότητα (Α=Τ)
ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
ΑΠΑΝΤΗΣΕΙΣ ΣΤΟ 1 ο ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΘΕΜΑ 1 ο Α. Ερωτήσεις πολλαπλής επιλογής 1. δ 2. β 3. γ 4. γ 5. β Β. Ερωτήσεις σωστού λάθους 1. Λάθος 2. Σωστό 3. Λάθος 4. Λάθος 5. Σωστό ΘΕΜΑ
ΔΙΑΚΡΙΣΗ ΣΤΟΙΧΕΙΩΝ ΜΑΚΡΟΘΡΕΠΤΙΚΑ (C, H, N, O) 96% ΜΙΚΡΟΘΡΕΠΤΙΚΑ (πχ. Na, K, P, Ca, Mg) 4% ΙΧΝΟΣΤΟΙΧΕΙΑ (Fe, I) 0,01%
ΔΙΑΚΡΙΣΗ ΣΤΟΙΧΕΙΩΝ ΜΑΚΡΟΘΡΕΠΤΙΚΑ (C, H, N, O) 96% ΜΙΚΡΟΘΡΕΠΤΙΚΑ (πχ. Na, K, P, Ca, Mg) 4% ΙΧΝΟΣΤΟΙΧΕΙΑ (Fe, I) 0,01% Ο άνθρακας, το υδρογόνο, το οξυγόνο και το άζωτο συμμετέχουν, σε σημαντικό βαθμό, στη
Δασική Γενετική Εισαγωγή: Βασικές έννοιες
Δασική Γενετική Εισαγωγή: Βασικές έννοιες Χειμερινό εξάμηνο 2014-2015 Γενετική Πειραματική επιστήμη της κληρονομικότητας Προέκυψε από την ανάγκη κατανόησης της κληρονόμησης οικονομικά σημαντικών χαρακτηριστικών
σύγχρονο προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. & Group µαθητικό φροντιστήριο Γραβιάς 85 ΚΗΠΟΥΠΟΛΗ
σύγχρονο Φάσµα & Group προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. µαθητικό φροντιστήριο Γραβιάς 85 ΚΗΠΟΥΠΟΛΗ 210 50 51 557 210 50 56 296 25ης Μαρτίου 111 ΠΕΤΡΟΥΠΟΛΗ 210 50 20 990 210 50 27 990 25ης Μαρτίου 74 ΠΕΤΡΟΥΠΟΛΗ
ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. γ Α2. α Α3. δ Α4. β Α5. α
ΘΕΜΑ Α Α1. γ Α2. α Α3. δ Α4. β Α5. α 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 5 ΣΕΠΤΕΜΒΡΙΟΥ 2012 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:
ΑΠΑΝΤΗΣΕΙΣ. Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις:
ΜΑΘΗΜΑ / ΤΑΞΗ : ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ / Γ ΛΥΚΕΙΟΥ ΗΜΕΡΟΜΗΝΙΑ: 21/09/2015 ΕΠΙΜΕΛΕΙΑ: ΝΟΤΑ ΛΑΖΑΡΑΚΗ ΘΕΜΑ 1 Ο ΑΠΑΝΤΗΣΕΙΣ Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες
1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; ΘΩΜΑΣ ΑΠΑΝΤΗΣΗ. 2. Ποιες είναι οι κατηγορίες γονιδίων με κριτήριο το προϊόν της μεταγραφής τους;
Βιολογία Γ Ενιαίου Λυκείου / Θετική Κατεύθυνση κεφαλαιο 2ο: αντιγραφη, εκφραση και ρυθμιση τησ ΓενετικηΣ ΠληροφοριαΣ 1. Πού πραγματοποιούνται η αντιγραφή και η μεταγραφή; Ευκαρυωτικά κύτταρα: στον πυρήνα,
ΚΕΦΑΛΑΙΟ 1 ο... 2 I. Το γενετικό υλικό... 2 ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ... 5 ΝΑ ΣΥΜΠΛΗΡΩΣΕΤΕ ΤΑ ΚΕΝΑ ΜΕ ΤΗΝ ΚΑΤΑΛΛΗΛΗ ΛΕΞΗ... 8 ΠΡΟΒΛΗΜΑΤΑ...
ΚΕΦΑΛΑΙΟ 1 ο ΚΕΦΑΛΑΙΟ 1 ο... 2 I. Το γενετικό υλικό... 2 ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ... 5 ΝΑ ΣΥΜΠΛΗΡΩΣΕΤΕ ΤΑ ΚΕΝΑ ΜΕ ΤΗΝ ΚΑΤΑΛΛΗΛΗ ΛΕΞΗ.... 8 ΠΡΟΒΛΗΜΑΤΑ... 9 ΙΑΓΩΝΙΣΜΑ...12 ΚΕΦΑΛΑΙΟ 1 ο I. Το γενετικό
Το πλεονέκτημα της χρήσης του DNA των φάγων λ, ως φορέα κλωνοποίησης είναι ότι μπορούμε να ενσωματώσουμε σε αυτόν μεγαλύτερα κομμάτια DNA.
ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ 2 ο,4 ο ΚΕΦ. ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ Θέμα Α: Α1.β, Α2.δ, Α3.β, Α4.γ, Α5.γ Θέμα Β: Β1. Οι υποκινητές και οι μεταγραφικοί παράγοντες αποτελούν τα ρυθμιστικά στοιχεία της μεταγραφής
Βιοπληροφορική και Πολυµέσα. Ειρήνη Αυδίκου Αθήνα
Βιοπληροφορική και Πολυµέσα Αθήνα 1.2.2009 ΠΕΡΙΕΧΟΜΕΝΑ 1. Πως σχετίζεται µε τα Πολυµέσα 2. Τι είναι η Βιοπληροφορική 3. Χρήσεις 4. Συµπεράσµατα 5. Βιβλιογραφία Βιοπληροφορική και Πολυµέσα 2 1. Τι είναι
Επισκεφτήκαμε το ινστιτούτο νευρολογίας και γενετικής όπου μας μίλησε ο κύριος Βάσος Νεοκλέους και η κ. Αλέξια Φαίδωνος για τη μηχανή Polymerase
Επισκεφτήκαμε το ινστιτούτο νευρολογίας και γενετικής όπου μας μίλησε ο κύριος Βάσος Νεοκλέους και η κ. Αλέξια Φαίδωνος για τη μηχανή Polymerase Chain Reaction (pcr)- Αλυσιδωτή αντίδραση πολυμεράσης.η
Βιοπληροψορική, συσιημική βιολογία και εξατομικευμένη θεραπεία
Βιοπληροψορική, συσιημική βιολογία και εξατομικευμένη θεραπεία Φραγκίσκος Κολίσης Καθηγητής Βιοτεχνολογίας, Σχολή Χημικών Μηχανικών ΕΜΠ, Διευθυντής Ινστιτούτου Βιολογικών Ερευνών και Βιοτεχνολογίας, EIE
Βιολογία. Θετικής Κατεύθυνσης
Βιολογία Θετικής Κατεύθυνσης Κεφάλαιο 4ο ΤΕΧΝΟΛΟΓΊΑ ΤΟΥ ΑΝΑΣΥΝΔΥΑΣΜΈΝΟΥ DNA Γενετική Μηχανική 3 Είναι ο κλάδος της Βιολογίας που περιλαμβάνει τις τεχνικές με τις οποίες ο άνθρωπος επεμβαίνει στο γενετικό
ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ
1 ΕΝΟΤΗΤΑ 14: Ο ΦΟΡΕΑΣ ΤΗΣ ΓΕΝΕΤΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (DNA) 14.1 ΕΙΣΑΓΩΓΗ Οι δύο πολυνουκλεοτιδικές αλυσίδες του DNA αποτελούνται από νουκλεοτίδια τα οποία ενώνονται με φωσφοδιεστερικούς δεσμούς. Πιο συγκεκριμένα
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΣΤΑ ΘΕΜΑΤΑ ΕΞΕΤΑΣΕΩΝ 2014
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΑΠΑΝΤΗΣΕΙΣ ΣΤΑ ΘΕΜΑΤΑ ΕΞΕΤΑΣΕΩΝ 2014 ΘΕΜΑ Α Α1. δ Α2. γ Α3. β Α4. γ Α5. β ΘΕΜΑ Β Β1. Η σειρά των βημάτων που οδηγούν στην κατασκευή καρυότυπου είναι: 4, 2, 1, 6, 3, 5 Β2. α.
Θέματα Πανελλαδικών 2000-2013
Θέματα Πανελλαδικών 2000-2013 ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΗΜΕΡΗΣΙΩΝ ΛΥΚΕΙΩΝ ΕΣΠΕΡΙΝΩΝ ΛΥΚΕΙΩΝ ΕΠΑΝΑΛΗΠΤΙΚΕΣ Κεφάλαιο 1 ΚΕΦΑΛΑΙΟ 1 ΘΕΜΑ 1 ο Γράψτε τον αριθμό καθεμιάς από τις παρακάτω προτάσεις και δίπλα το γράμμα
ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
EIKONA 2.1 Ημισυντηρητικός μηχανισμός αντιγραφής του DNA 1. Να γράψετε τα ένζυμα που (α) προκαλούν ξετύλιγμα των αλυσίδων του αρχικού (μητρικού μορίου) DNA και (β) συνθέτουν τις νέες αλυσίδες του DNA.
DNA MICROARRAYS. Σελίδα 1 ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ. Τ. Θηραίου
DNA MICROARRAYS Σελίδα 1 Μελέτη του γονιδιώματος Ποια είναι τα γονίδια και που βρίσκονται; Ποιοι μηχανισμοί ρυθμίζουν την έκφραση κάθε γονιδίου; Σε τι επίπεδα εκφράζονται τα γονίδια υπό διαφορετικές συνθήκες;
Ποιος είναι ο ρόλος των πρωτεϊνών στα κύτταρα και ποιες είναι οι δομικές τους μονάδες;
Ποιος είναι ο ρόλος των πρωτεϊνών στα κύτταρα και ποιες είναι οι δομικές τους μονάδες; Οι πρωτεΐνες αποτελούν δομικά ή λειτουργικά συστατικά των κυττάρων και δομούνται από απλούστερες ενώσεις, τα αμινοξέα.
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΤΜΗΜΑ: ΘΕΜΑ 1 Ο. 3. Το DNA των μιτοχονδρίων έχει μεγαλύτερο μήκος από αυτό των χλωροπλαστών.
ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΤΜΗΜΑ: ΘΕΜΑ 1 Ο Α. Να γράψετε τον αριθμό της καθεμιάς από τις παρακάτω προτάσεις 1-5 και δίπλα του τη λέξη Σωστό, αν η πρόταση είναι σωστή, ή Λάθος, αν η πρόταση
ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΤΑΞΗ
ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Σ ΕΣΠΕΡΙΝΟΥ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 2 ΙΟΥΝΙΟΥ 2006 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΒΙΟΛΟΓΙΑ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΠΕΝΤΕ (5) ΘΕΜΑ 1ο Α. Για τις ημιτελείς προτάσεις
ΚεφάΠαιο 4 ΤεχνοΠογία ίου ανασυνουασμένου DNA
ΚεφάΠαιο 4 ΤεχνοΠογία ίου ανασυνουασμένου DNA 1. Γιατί οι περιοριστικές ενδονουκλεάσες και οι φορείς κλωνοποίησης είναι απαραίτητα εργαλεία για τη Γενετική Μηχανική; Οι περιοριστικές ενδονουκλεάσες είναι
Εξόρυξη Γνώσης από Βιολογικά εδομένα
Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά
Δοµή και ιδιότητες του DNA. 09/04/ Μοριακή Βιολογία Κεφ. 1 Καθηγητής Δρ. Κ. Ε. Βοργιάς
Δοµή και ιδιότητες του DNA 09/04/2014 1 09/04/2014 2 Τόσο τα νεκρά (µε θερµική επεξεργασία) βακτήρια S όσο και τα ζωντανά βακτήρια R δεν µπορούν να θανατώσουν ποντικούς. Όµως, η ταυτόχρονη µόλυνση µε αυτά
Οι αζωτούχες βάσεις των νουκλεοτιδίων είναι:
1 ΑΣΚΗΣΕΙΣ ΝΟΥΚΛΕΙΚΩΝ ΟΞΕΩΝ ΑΣΚΗΣΗ 1 Ποια είναι η δομή των νουκλεοτιδίων; Τα νουκλεοτίδια προέρχονται από τη σύνδεση με ομοιοπολικό δεσμό, τριών διαφορετικών μορίων. Μιας πεντόζης (σάκχαρο με πέντε άτομα
ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΚΕΦΑΛΑΙΑ 1 ΚΑΙ 2
ΔΙΑΓΩΝΙΣΜΑ ΒΙΟΛΟΓΙΑΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΚΕΦΑΛΑΙΑ 1 ΚΑΙ 2 ΘΕΜΑ 1 ο Α. Στις ερωτήσεις 1-5 να γράψετε στο τετράδιό σας τον αριθμό της ερώτησης και δίπλα του το γράμμα που αντιστοιχεί στη σωστή απάντηση. 1. Το
θετικής κατεύθυνσης Παραδόσεις του μαθήματος Επιμέλεια: ΑΡΓΥΡΗΣ ΓΙΑΝΝΗΣ
Βιολογία θετικής κατεύθυνσης Παραδόσεις του μαθήματος Επιμέλεια: ΑΡΓΥΡΗΣ ΓΙΑΝΝΗΣ 1ο κεφάλαιο Το γενετικό υλικό Τι αποτελεί το γενετικό υλικό; Από το 1869, που το DNA εντοπίστηκε στον πυρήνα των κυττάρων,
Η τεχνική της αλυσιδωτής αντίδρασης πολυμεράσης PCR (POLYMERASE CHAIN REACTION)
Η τεχνική της αλυσιδωτής αντίδρασης πολυμεράσης PCR (POLYMERASE CHAIN REACTION) 1 PCR: -βραβείο Nobel χημείας 1993 Η τεχνική της αλυσιδωτής αντίδρασης πολυμεράσης (PCR, Polymerase Chain Reaction) επινοήθηκε
Νέα Οπτικά Μικροσκόπια
Νέα Οπτικά Μικροσκόπια Αντίθεση εικόνας (contrast) Αντίθεση πλάτους Αντίθεση φάσης Αντίθεση εικόνας =100 x (Ι υποβ -Ι δειγμα )/ Ι υποβ Μικροσκοπία φθορισμού (Χρησιμοποιεί φθορίζουσες χρωστικές για το
ΑΠΑΝΤΗΣΕΙΣ ΣΤΗ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ
ΘΕΜΑ Α ΑΠΑΝΤΗΣΕΙΣ ΣΤΗ ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ 27 5 2016 Α1. β Α2. β Α3. δ Α4. γ Α5. γ ΘΕΜΑ Β Β1. 1 Α 2 Γ 3 Α 4 Β 5 Α 6 Α 7 Γ Β2. Σχολ. βιβλίο σελ. 20 με την παλιά έκδοση ή σελ. 24 με τη νέα έκδοση : «Τα
ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 ΙΟΥΝΙΟΥ 2017 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ
ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Δ ΤΑΞΗΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΠΑΡΑΣΚΕΥΗ 16 ΙΟΥΝΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ ΘΕΜΑ Α Α1. δ Α2. δ Α3. β Α4. γ Α5. α ΘΕΜΑ B B1. I Α II Ε III
BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ
BIOXHMEIA, TOMOΣ I ΠANEΠIΣTHMIAKEΣ EKΔOΣEIΣ KPHTHΣ ΜΕΡΟΣ ΠΡΩΤΟ - ΠΕΡΙΓΡΑΜΜΑ 5.1 ΈΝΑ ΝΟΥΚΛΕΙΝΙΚΟ ΟΞΥ ΑΠΟΤΕΛΕΙΤΑΙ ΑΠΌ ΤΕΣΣΕΡΑ ΕΙΔΗ ΒΑΣΕΩΝ, ΠΟΥ ΠΡΟΣΔΕΝΟΝΤΑΙ ΣΕ ΈΝΑ ΚΟΡΜΟ ΣΑΚΧΑΡΩΝ ΦΩΣΦΟΡΙΚΩΝ 5.2 ΈΝΑ ΖΕΥΓΟΣ
ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α Α1. β Α2. γ Α3. γ Α4. α Α5. δ
ΘΕΜΑ Α Α1. β Α2. γ Α3. γ Α4. α Α5. δ 1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΤΕΤΑΡΤΗ 15 ΣΕΠΤΕΜΒΡΙΟΥ 2010 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ:
Μεθοδολογία Ασκήσεων ΚΕΦ. 2ο
Μεθοδολογία Ασκήσεων ΚΕΦ. 2ο 1. Ασκήσεις με βάση το μηχανισμό αντιγραφής του DΝΑ. Το DΝΑ αντιγράφεται με ημισυντηρητικό τρόπο. Η κατεύθυνση της αντιγραφής είναι πάντα 5 3. Στο αρχικό μόριο δεν περιέχονται
ΘΕΜΑ 1 Ο ΜΑΘΗΜΑ / ΤΑΞΗ : ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΘΕΡΙΝΑ ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013
ΜΑΘΗΜΑ / ΤΑΞΗ : ΑΠΑΝΤΗΣΕΙΣ ΒΙΟΛΟΓΙΑΣ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΣΕΙΡΑ: ΘΕΡΙΝΑ ΗΜΕΡΟΜΗΝΙΑ: 01/12/2013 ΘΕΜΑ 1 Ο Να επιλέξετε την φράση που συμπληρώνει ορθά κάθε μία από τις ακόλουθες προτάσεις: 1. Τα
Tρίτη, 3 Ιουνίου 2003 ΘΕΤΙΚΗ ΚΑΤΕΥΘΥΝΣΗ Γ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ
Tρίτη, 3 Ιουνίου 2003 ΘΕΤΙΚΗ ΚΑΤΕΥΘΥΝΣΗ Γ ΛΥΚΕΙΟΥ ΒΙΟΛΟΓΙΑ ΘΕΜΑ 1 1Α. Να γράψετε τον αριθµό της καθεµιάς από τις παρακάτω προτάσεις 1-5 και δίπλα του τη λέξη Σωστό, αν η πρόταση είναι σωστή, ή Λάθος, αν
ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ
ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ & ΕΠΑΛ (ΟΜΑΔΑ Β ) ΝΕΟ & ΠΑΛΑΙΟ ΣΥΣΤΗΜΑ ΗΜΕΡΟΜΗΝΙΑ ΕΞΕΤΑΣΗΣ: 27/05/2016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΠ ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑΤΩΝ Θέμα Α Α1:
ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε. 2004 ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ Ο.Ε.Φ.Ε. 2004 ΘΕΜΑ 1 Ο Α. Να επιλέξετε την ορθή πρόταση: ΘΕΜΑΤΑ ΒΙΟΛΟΓΙΑΣ Γ ΛΥΚΕΙΟΥ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 1. Το κωδικόνιο του mrna που κωδικοποιεί το αµινοξύ µεθειονίνη είναι α. 5 GUA
Βιολογία Β Λυκείου θέματα
Ι. Οι υδατάνθρακες διακρίνονται σε μονοσακχαρίτες, δισακχαρίτες και πολυσακχαρίτες. α) Να αναφέρετε από δύο παραδείγματα μονοσακχαριτών, δισακχαριτών και πολυσακχαριτών. (6μ) β) Σε ένα κύτταρο συναντώνται
Αθήνα, 18/5/2011 ΠΑΝΕΛΛΗΝΙΑ ΕΝΩΣΗ ΒΙΟΕΠΙΣΤΗΜΟΝΩΝ
Αθήνα, 18/5/2011 ΠΑΝΕΛΛΗΝΙΑ ΕΝΩΣΗ ΒΙΟΕΠΙΣΤΗΜΟΝΩΝ Σας αποστέλλουμε τις προτεινόμενες απαντήσεις που αφορούν τα θέματα της Βιολογίας Θετικής Κατεύθυνσης των Ημερησίων Γενικών Λυκείων. Η Επιτροπή Παιδείας
Οργανική Χηµεία. Κεφάλαιο 29: Βιοµόρια: ετεροκυκλικές ενώσεις και νουκλεϊκά οξέα
Οργανική Χηµεία Κεφάλαιο 29: Βιοµόρια: ετεροκυκλικές ενώσεις και νουκλεϊκά οξέα 1. Γενικά-ιδιότητες Κυκλικές οργανικές ενώσεις: καρβοκυκλικές (δακτύλιος περιέχει µόνο άτοµα C) και ετεροκυκλικές (δακτύλιος
ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΤΕΤΑΡΤΗ 4 ΙΟΥΛΙΟΥ 2007 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΒΙΟΛΟΓΙΑ ΑΠΑΝΤΗΣΕΙΣ
ΘΕΜΑ 1ο 1. α 2. γ 3. δ 4. γ 5. β 1 ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΤΕΤΑΡΤΗ 4 ΙΟΥΛΙΟΥ 2007 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΒΙΟΛΟΓΙΑ ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ 2ο 1. Σχολικό βιβλίο,
Το κεντρικό δόγμα (The central dogma)
Οι βασικές μοριακές γενετικές διαδικασίες Αντιγραφή Μεταγραφή Μετάφραση ΠΡΩΤΕΪΝΗ Το κεντρικό δόγμα (The central dogma) Σύσταση νουκλεοτιδίων του DNA και του RNA Α 5 -άκρο Θυμίνη (Θ) Β 5 άκρο Αδενίνη (Α)
Β1. Β2. ΘΕΜΑ 2ο 1. 2.
1 ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΤΟΥ ΕΞΩΤΕΡΙΚΟΥ ΚΑΙ ΤΕΚΝΩΝ ΕΛΛΗΝΩΝ ΥΠΑΛΛΗΛΩΝ ΣΤΟ ΕΞΩΤΕΡΙΚΟ ΠΑΡΑΣΚΕΥΗ 20 ΣΕΠΤΕΜΒΡΙΟΥ 2002 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: BΙΟΛΟΓΙΑ (ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ) ΑΠΑΝΤΗΣΕΙΣ ΘΕΜΑ 1ο Α1.
ΑΠΑΝΤΗΣΕΙΣ. ΘΕΜΑ Α A1. β Α2. γ Α3. γ Α4. α Α5. δ
ΘΕΜΑ Α A1. β Α2. γ Α3. γ Α4. α Α5. δ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΠΑΝΕΛΛΑΔΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΚΑΙ ΕΠΑΛ (ΟΜΑΔΑ Β ) ΤΕΤΑΡΤΗ 15 ΙΟΥΝΙΟΥ 2016 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ (ΝΕΟ
ΛΥΣΗ ΤΗΣ ΑΣΚΗΣΗΣ ΕΠΑΝΑΛΗΨΗΣ
ΛΥΣΗ ΤΗΣ ΑΣΚΗΣΗΣ ΕΠΑΝΑΛΗΨΗΣ 1. Ο γενετικός κώδικας είναι ένας κώδικας αντιστοίχισης των κωδικονίων του mrna με αμινοξέα στην πολυπεπτιδική αλυσίδα. Σύμφωνα με αυτόν η 3 μετάφραση όλων των mrna αρχίζει
ΕΞΕΤΑΣΕΙΣ 2013 ΑΠΑΝΤΗΣΕΙΣ στα ΘΕΜΑΤΑ ΤΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ
ΕΞΕΤΑΣΕΙΣ 2013 ΑΠΑΝΤΗΣΕΙΣ στα ΘΕΜΑΤΑ ΤΗΣ ΒΙΟΛΟΓΙΑΣ ΚΑΤΕΥΘΥΝΣΗΣ ΘΕΜΑ Α Α1: γ Α2: β Α3: α Α4: δ Α5: α ΘΕΜΑ Β Β1: σελ. 123 από: «Η διαδικασία που ακολουθείται. Εισάγονται πάλι σ αυτόν». Β2: σελ. 133 από:
Οργανική Χημεία. Κεφάλαιο 29: Βιομόρια: ετεροκυκλικές ενώσεις και νουκλεϊκά οξέα
Οργανική Χημεία Κεφάλαιο 29: Βιομόρια: ετεροκυκλικές ενώσεις και νουκλεϊκά οξέα 1. Γενικά-ιδιότητες Κυκλικές οργανικές ενώσεις: καρβοκυκλικές (δακτύλιος περιέχει μόνο άτομα C) και ετεροκυκλικές (δακτύλιος
Θέματα Πανελλαδικών
Θέματα Πανελλαδικών 2000-2015 ΒΙΟΛΟΓΙΑ ΘΕΤΙΚΗΣ ΗΜΕΡΗΣΙΩΝ ΛΥΚΕΙΩΝ ΕΣΠΕΡΙΝΩΝ ΛΥΚΕΙΩΝ ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΟΜΟΓΕΝΩΝ Κεφάλαιο 1 Περιεχόμενα Περιεχόμενα 1 Κεφάλαιο 1 ο Το γενετικό υλικό Θέμα 1 ο 2 Θέμα 2 ο 8 Θέμα
Φάσμα. προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι.
σύγχρονο Φάσμα προπαρασκευή για Α.Ε.Ι. & Τ.Ε.Ι. μαθητικό φροντιστήριο 25ης Μαρτίου 111 - ΠΕΤΡΟΥΠΟΛΗ - 210 50 20 990-210 50 27 990 25ης Μαρτίου 74 - ΠΕΤΡΟΥΠΟΛΗ - 210 50 50 658-210 50 60 845 Γραβιάς 85 -
γ. δύο φορές δ. τέσσερεις φορές
1 ο Διαγώνισμα Βιολογίας Γ Λυκείου Θέμα Α Να επιλέξετε τη σωστή απάντηση Α1. Σε ένα ανασυνδυασμένο πλασμίδιο που σχηματίστηκε με την επίδραση της EcoRI, η αλληλουχία που αναγνωρίζει η συγκεκριμένη περιοριστική
ΒΙΟΛΟΓΙΑ Β ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ
ΕΚΠΑΙΔΕΥΤΗΡΙΑ ΣΥΓΧΡΟΝΗ ΠΑΙΔΕΙΑ ΒΙΟΛΟΓΙΑ Β ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΕΠΙΜΕΛΕΙΑ:Ν.ΠΑΠΑΓΙΑΝΝΗΣ 2 Η ΧΗΜΕΙΑ ΤΗΣ ΖΩΗΣ 3 1. Ποια είναι τα επίπεδα οργάνωσης της ζωής και ποια τα χημικά χαρακτηριστικά της; Στην
ΒΙΟΛΟΓΙΑ Γ ΛΥΚΕΙΟΥ, ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ
ΕΙΚΟΝΑ 2.4 ΣΤΑΔΙΑ ΜΕΤΑΦΡΑΣΗΣ σ ε λ ί δ α 1 ΕΙΚΟΝΑ 4.2β ΕΡΩΤΗΣΕΙΣ 1. Να συμπληρώσετε τα κενά πλαίσια της εικόνας με την κατάλληλη λέξη ή φράση 2. Να γράψετε τον προσανατολισμό της μετακίνησης του ριβοσώματος
ΔΟΜΗ ΚΑΙ ΑΝΑΛΥΣΗ ΒΙΟΜΟΡΙΩΝ
ΔΟΜΗ ΚΑΙ ΑΝΑΛΥΣΗ ΒΙΟΜΟΡΙΩΝ Διδάσκοντες: Δ.Δ. Λεωνίδας, Α.-Μ. Ψαρρά Κωδικός e-class: SEYC194 28/9/2015 Δ.Δ. Λεωνίδας 28/9/2015 Δ.Δ. Λεωνίδας Βιοχημεία είναι η Χημεία που εμφανίζεται μέσα στους ζώντες οργανισμούς