ΜΕΘΟ ΟΙ ΙΑΓΝΩΣΗΣ ΜΕ ΒΑΣΗ ΠΡΟΗΓΜΕΝΕΣ ΤΕΧΝΙΚΕΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗΣ Ε ΟΜΕΝΩΝ. ΕΦΑΡΜ ΟΓΕΣ ΣΤΗ ΜΑΙΕΥΤΙΚΗ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ ΤΟΥ ΓΕΩΡΓΙΟΥ Κ. ΓΕΩΡΓΟΥΛΑ ΙΠΛΩΜΑΤΟΥΧΟΥ ΗΛΕΚΤΡΟΛΟΓΟΥ ΜΗΧΑΝΙΚΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΑΡΙΘΜΟΣ ΙΑΤΡΙΒΗΣ 175 ΜΑΪΟΣ 2006
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Πρόλογος Η παρούσα διατριβή εκπονήθηκε στον Τοµέα Συστηµάτων και Αυτοµάτου Ελέγχου, του τµήµατος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών του Πανεπιστηµίου Πατρών και το αντικείµενο που πραγµατεύεται είναι η ανάπτυξη και χρήση προηγµένων µεθόδων για την επεξεργασία δεδοµένων και ειδικότερα δεδοµένα προερχόµενα από έµβρυα κατά την περίοδο του τοκετού. Προτάθηκαν νέες µεθοδολογίες για την ανάλυση και ταξινόµηση πραγµατικών σηµάτων προερχόµενων από το έµβρυο κατά το τελευταίο στάδιο του τοκετού µε πολύ ενθαρρυντικά αποτελέσµατα. Τα ερευνητικά αποτελέσµατα που προέκυψαν, από την εκπόνηση της παρούσας διδακτορικής διατριβής, παρουσιάστηκαν σε ένα αριθµό επιστηµονικών συνεδρίων και περιοδικών τα οποία παρουσιάζονται στο τέλος της. 1
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Ευχαριστίες Θα ήθελα να ευχαριστήσω τον Επιβλέποντα Καθηγητή µου κ. Πέτρο Π. Γρουµπό, για την ανάθεση του θέµατος, την ηθική ενθάρρυνση και την ποικιλότροπη βοήθεια που µου παρείχε όλα αυτά τα χρόνια, κατά τα οποία εκπονήθηκε η διατριβή αυτή. Θα ήθελα επίσης να ευχαριστήσω τον Καθηγητή Νικόλαο Κούσουλα, µέλος της τριµελούς συµβουλευτικής επιτροπής, για τα σχόλια και τις ουσιαστικές παρατηρήσεις του, που σκοπό είχαν την αρτιότερη παρουσίαση και θεµελίωση της παρούσας διατριβής. Ευχαριστώ τον Καθηγητή Αθανάσιο Στουραΐτη, τον Καθηγητή Γεώργιο Νικηφορίδη, τον Αναπληρωτή Καθηγητή Ιωάννη Λυγερό και τον Επίκουρο Καθηγητή Ευάγγελο ερµατά, για την τιµή που µου έκαναν να πλαισιώσουν την Επταµελή Εξεταστική Επιτροπή µου, καθώς και για τις σηµαντικές παρατηρήσεις τους, που βοήθησαν για την τελειοποίηση του παρόντος κειµένου. Επίσης ευχαριστώ θερµά τον ρ. Χρυσόστοµο Στύλιο για την πολύτιµη βοήθεια του και για όλες αυτές τις ώρες που µου αφιέρωσε όλα αυτά τα χρόνια σε συζητήσεις πάνω σε επιστηµονικά και όχι µόνο θέµατα. Ένα πολύ µεγάλο ευχαριστώ στον Καθηγητή Αντώνη Τζε που πέραν των συµβουλών του ως µέλους της Τριµελούς Συµβουλευτικής Επιτροπής, µου αφιέρωσε χρόνο όποτε χρειάστηκε και µου άνοιξε και το δρόµο για τη συνέχιση των ερευνητικών µου δραστηριοτήτων στην Εσπερία. Ευχαριστώ επίσης τους φίλους µου Γιώργο Νικολακόπουλο, Μιχάλη Κουνδουράκη, Φώτη Κουρτζή, Αντώνη Ορφανό και Γρηγόρη αβράζο για όλα αυτά τα χρόνια που περάσαµε µαζί εντός και εκτός πανεπιστηµίου. Ειδικά µε το Γιώργο και το Γρηγόρη µας συνδέει επιπλέον το «κουπί που τραβήξαµε» παρέα όλα αυτά τα χρόνια αναζητώντας την Ιθάκη. Τέλος ευχαριστώ τον αδερφό µου και όλους τους συνεργάτες και φίλους, εντός και εκτός του εργαστηρίου που είναι τόσοι πολύ που από φόβο µην ξεχάσω κανέναν δεν θα τολµήσω να τους αναφέρω ονοµαστικά και ας µε συγχωρέσουν. Θα ήταν µεγάλη παράλειψη να µην ευχαριστήσω τον καθηγητή Joao Bernardes, αν και είναι αµφίβολο αν θα µπορέσει να καταλάβει αυτή τη γραµµένη στα ελληνικά ευχαριστία, γιατί χωρίς την παραχώρηση των ιατρικών του αρχείων η παρούσα διατριβή δεν θα είχε προχωρήσει πέρα από τον πρόλογο. 2
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Περιεχόµενα ΠΕΡΙΕΧΟΜΕΝΑ... 3 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ... 8 ΚΕΦΑΛΑΙΟ 1 Ο ΕΙΣΑΓΩΓΗ... 11 1.1 ΓΕΝΙΚΑ...11 1.2 ΑΝΤΙΚΕΙΜΕΝΟ ΤΗΣ ΙΑΤΡΙΒΗΣ...12 1.3 ΣΥΝΕΙΣΦΟΡΑ ΤΗΣ ΙΑΤΡΙΒΗΣ...13 1.4 ΙΑΡΘΡΩΣΗ ΤΗΣ ΙΑΤΡΙΒΗΣ...16 1.5 ΣΥΝΟΨΗ...17 ΚΕΦΑΛΑΙΟ 2 Ο ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΙΑ... 19 2.1 ΕΙΣΑΓΩΓΗ...19 2.2 ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΙΑ...20 2.3 ΦΥΣΙΟΛΟΓΙΑ ΚΑΤΑ ΤΟΝ ΤΟΚΕΤΟ...21 2.4 ΣΥΝΤΟΜΗ ΙΣΤΟΡΙΚΗ ΑΝΑ ΡΟΜΗ...24 2.5 ΛΗΨΗ ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΗΜΑΤΟΣ...25 2.5.1 ΕΜΒΡΥΪΚΗ ΚΑΡ ΙΑΚΗ ΣΥΧΝΟΤΗΤΑ...26 2.5.1.1 Άµεση εµβρυϊκή ηλεκτροκαρδιογραφία...26 2.5.1.2 Υπερηχοκαρδιογραφία...27 2.5.1.3 Σφάλµατα κατά την καταγραφή της ΕΚΣ...28 2.5.2 ΤΟΚΟΓΡΑΦΙΑ...29 2.5.2.1 Εσωτερική τοκογραφία...29 2.5.2.2 Εξωτερική τοκογραφία...29 2.5.3 ΟΡΟΛΟΓΙΑ ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΙΑΣ...30 2.5.4 ΕΡΕΥΝΗΤΙΚΕΣ ΚΑΤΕΥΘΥΝΣΕΙΣ ΣΤΟΝ ΠΕ ΙΟ ΤΗΣ ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΙΑΣ...33 2.6 ΥΠΟΛΟΓΙΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ ΣΤΗ ΜΑΙΕΥΤΙΚΗ...35 2.6.1 ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ...36 2.6.2 ΥΠΑΡΧΟΝΤΑ ΥΠΟΛΟΓΙΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ...37 2.7 ΣΥΝΟΨΗ...39 3
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική ΚΕΦΑΛΑΙΟ 3 Ο ΤΟ ΣΗΜΑ ΤΗΣ ΕΚΣ. Ι ΙΟΤΗΤΕΣ, ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΚΑΙ ΜΕΘΟ ΟΙ ΠΡΟΕΠΕΞΕΡΓΑΣΙΑΣ... 41 3.1 ΕΙΣΑΓΩΓΗ...41 3.2 ΣΥΝΟΛΙΚΗ ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΕΦΑΡΜΟΖΟΜΕΝΗ ΠΡΟΣΕΓΓΙΣΗΣ...44 3.3 ΤΟ ΘΟΡΥΒΩ ΕΣ ΣΗΜΑ ΤΗΣ ΕΚΣ...46 3.4 ΜΕΘΟ ΟΣ ΠΡΟΒΛΕΨΗΣ ΣΕ ΣΗΜΑΤΑ ΕΚΣ ΜΕ ΕΛΛΙΠΗ Ε ΟΜΕΝΑ ΧΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΣΥΝ ΥΑΣΜΟ ΚΑΝΟΝΙΚΩΝ ΚΑΤΑΝΟΜΩΝ...47 3.4.1 Ο ΑΛΓΟΡΙΘΜΟΣ : «EXPECTATION-MAXIMIZATION» (ΕΜ)...48 3.4.2 ΕΦΑΡΜΟΓΗ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ EM...49 3.5 ΠΡΟΒΛΕΨΗ ΕΝΟΣ ΕΜΠΡΟΣΘΙΟΥ ΒΗΜΑΤΟΣ ΣΕ ΣΗΜΑΤΑ ΕΚΣ (ONE STEP AHEAD PREDICTION)...53 3.5.1 ΤΟ ΑΥΤΟΤΡΟΦΟ ΟΤΟΥΜΕΝΟ ΜΟΝΤΕΛΟ (AR MODEL)...54 3.5.2 ΜΗ ΓΡΑΜΜΙΚΗ ΠΡΟΒΛΕΨΗ ΜΕ ΤΗΝ ΒΟΗΘΕΙΑ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ...55 3.5.2.1 Πολυεπίπεδα ίκτυα Perceptron...55 3.5.2.2 ίκτυα ακτινικών συναρτήσεων βάσης...56 3.5.2.3 Το νευρωνικό δίκτυο τύπου Elman...56 3.5.2.4 Πειράµατα και Αποτελέσµατα...57 Γραµµικό Αυτοτροφοδοτούµενο...58 3.6 ΑΦΑΙΡΕΣΗ ΘΟΡΥΒΟΥ ΜΕ ΓΡΑΜΜΙΚΗ ΠΑΡΕΜΒΟΛΗ...59 3.7 ΣΥΝΟΨΗ...60 ΚΕΦΑΛΑΙΟ 4 Ο ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΤΟΥ ΣΗΜΑΤΟΣ ΤΗΣ ΕΚΣ... 63 4.1 ΕΙΣΑΓΩΓΗ...63 4.2 ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΣΥΜΒΑΤΙΚΕΣ ΜΕΘΟ ΟΥΣ...64 4.2.1 ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΤΟ ΠΕ ΙΟ ΤΟΥ ΧΡΟΝΟΥ...65 4.2.2 ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΤΟ ΠΕ ΙΟ ΤΗΣ ΣΥΧΝΟΤΗΤΑΣ...66 4.2.3 ΜΟΡΦΟΛΟΓΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ...69 4.3 ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΚΥΜΑΤΙ ΙΩΝ (WAVELETS)...71 4.3.1 ΣΥΝΤΟΜΗ ΜΑΘΗΜΑΤΙΚΗ ΕΙΣΑΓΩΓΗ...71 4.3.2 ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ...77 4.3.2.1 Χαρακτηριστικά που εξαρτώνται µόνο από την κλίµακα...77 4.3.2.2 Χαρακτηριστικά που εξαρτώνται τόσο από την κλίµακα όσο και από το χρόνο...78 4.4 ΑΝΑΛΥΣΗ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ - INDEPENDENT COMPONENT ANALYSIS (ICA)...81 4.4.1 ΣΥΝΤΟΜΗ ΜΑΘΗΜΑΤΙΚΗ ΕΙΣΑΓΩΓΗ...81 4.4.2 ΑΛΓΟΡΙΘΜΟΣ ΜΕΓΙΣΤΟΠΟΙΗΣΗΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (INFOMAX ALGORITHM)...83 4
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική 4.4.3 Ο ΑΛΓΟΡΙΘΜΟΣ FASTICA...83 4.4.4 ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΧΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΑΝΑΛΥΣΗ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ...84 4.5 ΜΕΙΩΣΗ ΤΗΣ ΙΑΣΤΑΣΗΣ ΤΟΥ ΙΑΝΥΣΜΑΤΟΣ ΤΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ / ΚΑΤΑΣΚΕΥΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΑΠΟ Η Η ΥΠΑΡΧΟΝΤΑ...87 4.5.1 ΑΝΑΛΥΣΗ ΣΕ ΠΡΩΤΑΡΧΙΚΕΣ ΣΥΝΙΣΤΩΣΕΣ (PRINCIPLE COMPONENT ANALYSIS PCA)...88 4.5.2 ΕΞΕΛΙΚΤΙΚΗ ΓΡΑΜΜΑΤΙΚΗ (GRAMMATICAL EVOLUTION)...89 4.6 ΗΜΙΟΥΡΓΙΑ ΣΥΝΘΕΤΙΚΩΝ ΠΑΡΑ ΕΙΓΜΑΤΩΝ ΜΕ ΥΠΕΡ ΕΙΓΜΑΤΟ- ΛΗΨΙΑ ΤΗΣ ΜΕΙΟΨΗΦΟΥΣΑΣ ΚΑΤΗΓΟΡΙΑΣ (SMOTE: SYNTHETIC MINORITY OVER-SAMPLING TΕCHNIQUE)...90 4.7 ΣΥΝΟΨΗ...92 ΚΕΦΑΛΑΙΟ 5 Ο ΜΕΘΟ ΟΙ ΤΑΞΙΝΟΜΗΣΗΣ... 95 5.1 ΕΙΣΑΓΩΓΗ...95 5.2 ΣΥΜΒΑΤΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ...96 5.2.1 ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΒΑΣΗ ΤΟΥΣ K ΠΙΟ ΚΟΝΤΙΝΟΥΣ ΓΕΙΤΟΝΕΣ (K-NEAREST NEIGHBOR RULE (KNN))...96 5.2.2 ΓΡΑΜΜΙΚΟΙ ΚΑΙ ΤΕΤΡΑΓΩΝΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ (LINEAR AND QUADRATIC CLASSIFIERS)...96 5.3 ΤΕΧΝΗΤΑ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ (ARTIFICIAL NEURAL NETWORKS)...99 5.3.1 ΠΟΛΥΕΠΙΠΕ Ο ΙΚΤΥΟ PERCEPTRON (MULTILAYER PERCEPTRON (MLP))...100 5.3.2 ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΑΚΤΙΝΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΒΑΣΗΣ (RADIAL BASIS FUNCTION NETWORKS)...104 5.3.3 ΙΑΦΟΡΕΣ ΜΕΤΑΞΥ ΤΩΝ ΙΚΤΥΩΝ ΑΚΤΙΝΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΒΑΣΗΣ ΚΑΙ ΠΟΛΥΕΠΙΠΕ ΩΝ ΙΚΤΥΩΝ PERCEPTRON...105 5.4 ΜΗΧΑΝΕΣ ΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ (SUPPORT VECTOR MACHINES (SVMS)...106 5.4.1 ΜΗ ΙΣΟΡΡΟΠΗΜΕΝΗ ΚΑΤΑΝΟΜΗ ΠΑΡΑ ΕΙΓΜΑΤΩΝ...110 5.5 ΚΡΥΦΑ ΜΟΝΤΕΛΑ MARKOV (HIDDEN MARKOV MODELS (HMMS))...111 5.6 ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΚΥΜΑΤΙ ΙΟΥ (WAVELET NEURAL NETWORKS)..113 5.7 ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΜΕ ΣΜΗΝΟΣ ΣΩΜΑΤΙ ΙΩΝ (PARTICLE SWARM OPTIMIZATION PSO)...115 5.8 ΓΕΝΕΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ (GENETIC ALGORITHMS (GA))...117 5.9 ΣΥΝΟΨΗ...118 ΚΕΦΑΛΑΙΟ 6 Ο ΠΡΟΤΕΙΝΟΜΕΝΕΣ ΜΕΘΟ ΟΛΟΓΙΕΣ-ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ... 119 6.1 ΕΙΣΑΓΩΓΗ...119 6.2 Ε ΟΜΕΝΑ ΚΑΙ ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ ΕΚΣ...120 5
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική 6.3 ΑΝΑΛΥΣΗ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ...122 6.3.1 ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΠΟΛΥΕΠΙΠΕ Α ΙΚΤΥΑ PERCEPTRON...125 6.3.2 ΣΥΓΚΡΙΣΗ ΤΑΞΙΝΟΜΗΣΗΣ ΜΕ ΙΚΤΥΑ ΑΚΤΙΝΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΒΑΣΗΣ...127 6.3.3 ΤΑΞΙΝΟΜΗΣΗ ΜΕ ΒΑΣΗ ΤΗΝ ΤΙΜΗ ΤΟΥ PH...128 6.3.3.1 Ταξινόµηση µε πολυεπίπεδα δίκτυα perceptron...129 6.3.3.2 Ταξινόµηση µε µηχανές διανυσµάτων υποστήριξης...130 6.4 ΜΕΘΟ ΟΛΟΓΙΑ ΒΑΣΙΣΜΕΝΗ ΣΕ ΣΥΜΒΑΤΙΚΗ ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ...131 6.4.1 ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΑΠΟ ΤΟ ΠΕ ΙΟ ΤΟΥ ΧΡΟΝΟΥ ΚΑΙ ΤΗΣ ΣΥΧΝΟΤΗΤΑΣ ΜΕ ΜΗΧΑΝΕΣ ΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ...133 6.4.2 ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΑΠΟ ΤΟ ΠΕ ΙΟ ΤΟΥ ΧΡΟΝΟΥ, ΤΗΣ ΣΥΧΝΟΤΗΤΑΣ ΚΑΙ Η ΒΑΣΙΚΗ ΓΡΑΜΜΗ ΤΟΥ ΣΗΜΑΤΟΣ ΜΕ ΚΡΥΜΜΕΝΑ ΜΟΝΤΕΛΑ MARKOV...134 6.4.3 ΣΥΝ ΥΑΣΜΟΣ ΟΛΩΝ ΤΩΝ ΣΥΜΒΑΤΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ...136 6.5. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΕΞΑΓΟΜΕΝΑ ΜΕ ΙΑΚΡΙΤΟ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟ ΚΥΜΑΤΙ ΙΟΥ...145 6.5.1 ΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΚΥΜΑΤΙ ΙΟΥ Ι...147 6.5.2 ΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΚΥΜΑΤΙ ΙΟΥ ΙΙ...148 6.5.3 ΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΚΥΜΑΤΙ ΙΟΥ ΙΙI...150 6.6 ΗΜΙΟΥΡΓΙΑ ΝΕΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΕΞΕΛΙΚΤΙΚΗ ΓΡΑΜΜΑΤΙΚΗ...155 6.6.1 ΣΥΝ ΥΑΣΜΟΣ ΕΞΕΛΙΚΤΙΚΗΣ ΓΡΑΜΜΑΤΙΚΗΣ ΜΕ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΑΚΤΙΝΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΒΑΣΗΣ...156 6.6.2 ΕΞΕΛΙΚΤΙΚΗ ΓΡΑΜΜΑΤΙΚΗ ΚΑΙ ΠΟΛΥΕΠΙΠΕ Α ΙΚΤΥΑ PERCEPTRON...158 6.7 ΣΥΝ ΥΑΣΜΟΣ ΝΕΥΡΩΝΙΚΩΝ ΙΚΤΥΩΝ ΚΥΜΑΤΙ ΙΟΥ ΚΑΙ ΤΗΣ ΜΕΘΟ ΟΥ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ ΜΕ ΣΜΗΝΟΣ ΣΩΜΑΤΙ ΙΟΥ ΣΕ ΕΝΑ ΟΛΟΚΛΗΡΩΜΕΝΟ ΜΟΝΤΕΛΟ ΤΑΞΙΝΟΜΗΣΗΣ ΤΗΣ ΕΚΣ...161 6.8 ΕΠΙΛΟΓΗ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΤΩΝ ΜΗΧΑΝΩΝ ΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ ΜΕ ΤΗ ΧΡΗΣΗ ΤΗΣ ΜΕΘΟ ΟΥ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ ΜΕ ΣΜΗΝΟΣ ΣΩΜΑΤΙ ΙΩΝ...164 6.9 ΣΥΝΟΨΗ...165 ΚΕΦΑΛΑΙΟ 7 Ο ΣΥΜΠΕΡΑΣΜΑΤΑ... 167 7.1 ΕΙΣΑΓΩΓΗ...167 7.2 ΚΑΤΕΥΘΥΝΣΕΙΣ ΓΙΑ ΜΕΛΛΟΝΤΙΚΗ ΕΡΕΥΝΑ...169 ΠΑΡΑΡΤΗΜΑ ΣΥΣΤΗΜΑ ΓΙΑ ΤΗΝ ΛΗΨΗ ΚΑΙ ΑΠΟΘΗΚΕΥΣΗ ΚΑΡ ΙΟΤΟΚΟΓΡΑΦΗΜΑΤΩΝ... 173 Π.1 ΕΙΣΑΓΩΓΗ...173 6
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Π.2 ΛΗΨΗ Ε ΟΜΕΝΩΝ...173 Π.3 Η ΙΕΠΑΦΗ ΕΡΓΑΛΕΙΟΥ ΧΡΗΣΤΗ...175 Π.4 ΜΕΛΛΟΝΤΙΚΗ ΠΡΟΟΠΤΙΚΗ...178 ΒΙΒΛΙΟΓΡΑΦΙΑ... 179 ΗΜΟΣΙΕΥΣΕΙΣ... 191 Α. ΕΠΙΣΤΗΜΟΝΙΚΑ ΠΕΡΙΟ ΙΚΑ...191 Β. ΣΥΝΕ ΡΙΑ ΜΕ ΚΡΙΣΗ ΣΕ ΟΛΟ ΤΟ ΚΕΙΜΕΝΟ...191 C. ΣΥΝΕ ΡΙΑ ΜΕ ΚΡΙΣΗ ΣΕ ΕΚΤΕΤΑΜΕΝΗ ΠΕΡΙΛΗΨΗ...192 7
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Κατάλογος Σχηµάτων Σχήµα 2.1: Λήψη καρδιοτοκογραφήµατος...26 Σχήµα 3.1: Μετατροπή των καρδιακών «συµβάντων» σε ΕΚΣ...42 Σχήµα 3.2: Ένα τυπικό καρδιοτοκογράφηµα...42 Σχήµα 3.3: Τα βασικά στάδια που περιλαµβάνονται στη σχεδίαση ενός συστήµατος ταξινόµησης/κατηγοριοποίησης...44 Σχήµα 3.4: Σήµα ελέγχου µε τεχνητή ασυνέχεια....49 Σχήµα 3.5: Συνάρτηση πυκνότητας πιθανότητας του αρχικού σήµατος (2000 δείγµατα)....50 Σχήµα 3.6: Απεικόνιση αρχικού και εκτιµούµενου σήµατος...50 Σχήµα 3.7: ΕΚΣ µε ελλιπή δεδοµένα....52 Σχήµα 3.8: ΕΚΣ σήµα µηδενίζοντας τις ασυνέχειες....52 Σχήµα 3.9: Ανακατασκευή του σήµατος µε χρήση συνδυασµού κανονικών κατανοµών....52 Σχήµα 3.10: Πρόβλεψη επόµενης τιµής µέσω του αυτοτροφοδοτούµενου µοντέλου...54 Σχήµα 3.11: Το νευρωνικό δίκτυο τύπου Elman...57 Σχήµα 3.12: Απεικόνιση ενός πραγµατικού και του εκτιµούµενου σήµατος της ΕΚΣ (Με έντονο το πραγµατικό και µε διακεκοµµένο το εκτιµούµενο)...59 Σχήµα 3.13: Σήµα ΕΚΣ πριν και µετά την αφαίρεση του θορύβου....60 Σχήµα 4.1: Το µοντέλο ταξινόµησης γενικού σκοπού...63 Σχήµα 4.2: Συνεισφορά των διαφορετικών ζωνών συχνοτήτων του σήµατος της ΕΚΣ...68 Σχήµα 4.3: Μορφολογική ανάλυση του σήµατος της ΕΚΣ µε χρήση του αλγορίθµου του Taylor....70 Σχήµα 4.4: Πρωταρχική συνάρτηση symmlet µε 13 εξαφανιζόµενες ροπές....72 Σχήµα 4.5: ιαφορετικά κυµατίδια µε 2 εξαφανιζόµενες ροπές...75 Σχήµα 4.6: Το αρχικό σήµα της ΕΚΣ στο πάνω µέρος και η ανάλυση του σε συντελεστές κυµατιδίου για m=1,2,3,4,5,6....75 Σχήµα 4.7: Τρεις περιπτώσεις σηµάτων (κατανοµών) µε διαφορετική εντροπία (µέγιστη, ελάχιστη και µια µεταξύ των δύο αυτών ακραίων καταστάσεων)...77 Σχήµα 4.8: Χρήση ολισθαίνοντος παραθύρου για την εξαγωγή χαρακτηριστικών από συντελεστές κυµατιδίου....80 Σχήµα 4.9: Γραφική απεικόνιση της µίξης και την ανάλυσης σε ανεξάρτητες συνιστώσες...82 Σχήµα 4.10: Εξαγωγή χαρακτηριστικών µε τη χρήση των ανεξάρτητων συνιστωσών...85 Σχήµα 4.11: Τα στάδια µετάβασης από τα αρχικά σήµατα της ΕΚΣ έως την ανάκτηση των πηγών...86 Σχήµα 4.12: SMOTE µε 200% υπερδειγµατοληψία και 5 γείτονες...92 Σχήµα 5.1: Ένα γενικό σύστηµα ταξινόµησης...95 Σχήµα 5.2: Τετραγωνικός ταξινοµητής για την περίπτωση ενός δισδιάστατου διανύσµατος χαρακτηριστικών....97 Σχήµα 5.3: Γραµµικός ταξινοµητής για την περίπτωση ενός δισδιάστατου διανύσµατος χαρακτηριστικών....98 Σχήµα 5.4: Το πολυεπίπεδο δίκτυο perceptron...100 Σχήµα 5.5: Στα αριστερά η γραφική απεικόνιση της υπερβολικής εφαπτοµένης και στα δεξιά της λογιστικής συνάρτησης...101 Σχήµα 5.6: Η διαχωριστική επιφάνεια που δηµιουργείται από ένα πολυεπίπεδο δίκτυο perceptron µε 3 (αριστερά) και 8 (δεξιά) νευρώνες στο κρυφό επίπεδο...103 Σχήµα 5.7: Ένα δίκτυο ακτινικών συναρτήσεων βάσης...104 8
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική Σχήµα 5.8: Απεικόνιση της δηµιουργίας ενός γραµµικού ταξινοµητή µε µεγιστοποίηση του περιθωρίου...107 Σχήµα 5.9: Απεικόνιση της δηµιουργία ενός µη γραµµικού ταξινοµητή µε τη χρήση µηχανής διανυσµάτων υποστήριξης....109 Σχήµα 5.10: Μία µηχανή διανυσµάτων υποστήριξης....110 Σχήµα 5.11: Ένα Κρυφό Μοντέλο Markov µε µετάβαση από αριστερά προς τα δεξιά...112 Σχήµα 5.12: Ενοποιηµένο µοντέλο ταξινόµησης...113 Σχήµα 5.13: Ένα απλό νευρωνικό δίκτυο κυµατιδίου....114 Σχήµα 6.1: Ψευδοδειγµατοληψία...121 Σχήµα 6.2: Τα στάδια της προεπεξεργασίας των σηµάτων της ΕΚΣ...122 Σχήµα 6.3: Σχηµατικά η µεθοδολογία που χρησιµοποιεί χαρακτηριστικά που εξήχθησαν µε τη χρήση της ανάλυσης σε ανεξάρτητες συνιστώσες....123 Σχήµα 6.4: Ταξινόµηση του σήµατος της ΕΚΣ µε βάση του συντελεστές που προκύπτουν από την εφαρµογή της ανάλυσης σε ανεξάρτητες συνιστώσες...126 Σχήµα 6.5: Συνολική απόδοση της µεθοδολογίας για διαφορετικό αριθµό ανεξαρτήτων πηγών και διαφορετικό αριθµό νευρώνων στο κρυφό επίπεδο....126 Σχήµα 6.6: Αποτελέσµατα για 3 συνιστώσες και διαφορετικό αριθµό κρυφών νευρώνων ενός πολυεπίπεδου δικτύου perceptron...127 Σχήµα 6.8: Επιµέρους και συνολική ακρίβεια για 8 χαρακτηριστικά εισόδου και µεταβλητό αριθµό νευρώνων στο κρυφό επίπεδο....130 Σχήµα 6.9: Σχηµατικά η µεθοδολογία µε τη χρήση χαρακτηριστικών που εξήχθησαν από το πεδίο του χρόνου, το πεδίο της συχνότητας και από «µορφολογική» ανάλυση του σήµατος της ΕΚΣ....132 Σχήµα 6.10: Επικαλυπτόµενα παράθυρα για την εξαγωγή «διαδοχικών» διανυσµάτων χαρακτηριστικών....135 Σχήµα 6.11: Ποσοστά ταξινόµησης για διαφορετικούς αριθµούς κρυφών καταστάσεων....136 Σχήµα 6.12: Η συνολική µεθοδολογία....137 Σχήµα 6.13: Πίνακας σύγχυσης (Confusion Matrix)....139 Σχήµα 6.14: Η απόδοση για τα 11 διαφορετικά σύνολα χαρακτηριστικών µε τη χρήση µηχανών διανυσµάτων υποστήριξης....144 Σχήµα 6.16: Τα καλύτερα αποτελέσµατα για τα 3 διαφορετικά χαρακτηριστικά και για χρονική διάρκεια a) 10 λεπτών και b) 5 λεπτών....148 Σχήµα 6.17: Απόδοση ταξινόµησης για διαφορετικά µήκη παραθύρων....149 Σχήµα 6.18: Απόδοση του ταξινοµητή για ένα ολισθαίνον παράθυρο 3 λεπτών....150 Σχήµα 6.19: Η διαδικασία κατασκευής νέων χαρακτηριστικών και ταξινόµησης µε δίκτυο ακτινικών συναρτήσεων βάσης...157 Σχήµα 6.20: Απόδοση της µεθόδου για διαφορετικό αριθµό κατασκευασµένων χαρακτηριστικών...157 Σχήµα 6.21: Εκπαίδευση νευρωνικού δικτύου κυµατιδίου µε τη µέθοδο βελτιστοποίησης µε σµήνος σωµατιδίων (PSO)....162 Σχήµα Π.1: ιάγραµµα ροής της εφαρµογής....175 Σχήµα Π.2: Κύριο παράθυρο της εφαρµογής...176 Σχήµα Π.3: Το παράθυρο επιλογής της θύρας επικοινωνίας...176 Σχήµα Π.4: Παράθυρο επιπλέον ρυθµίσεων....177 Σχήµα Π.5: «Καρτέλα» ασθενή...177 Σχήµα Π.6: Παράθυρο εισαγωγής σχολίων του επιβλέποντα ιατρού....178 9
Μέθοδοι διάγνωσης µε βάση προηγµένες τεχνικές επεξεργασίας και ταξινόµησης δεδοµένων. Εφαρµογές στη µαιευτική 10
Εισαγωγή Κεφάλαιο 1 ο Εισαγωγή 1.1 Γενικά Η συγκεκριµένη διατριβή αποτελεί την κατάληξη µιας ολοκληρωµένης ερευνητικής προσπάθειας για την εύρεση υπολογιστικών µεθόδων διάγνωσης και εκτίµησης της κατάστασης της υγείας του εµβρύου. Η ακολουθούµενη βιοϊατρική ερευνητική προσέγγιση βασίστηκε στην εύρεση µεθόδων για την ανάλυση, επεξεργασία, εξαγωγή χαρακτηριστικών και την κατηγοριοποίηση του σήµατος της Εµβρυϊκής Καρδιακής Συχνότητας (ΕΚΣ, Fetal Heart Rate (FHR)). Όπως θα παρουσιαστεί στη συνέχεια, αποδείχτηκε ότι το σήµα της ΕΚΣ αντανακλά την κατάσταση της υγείας του εµβρύου. Οι προτεινόµενες µεθοδολογίες αναλύουν και εξάγουν πληροφορίες από το σήµα της ΕΚΣ προκειµένου να εκτιµήσουν την κατάσταση της υγείας του εµβρύου [Geijn, 1996]. Ο τοκετός αποτελεί µια φυσιολογική διαδικασία η οποία χαρακτηρίζεται από έντονη πίεση τόσο για τη µητέρα όσο και για το έµβρυο. Η πίεση η οποία ασκείται κατά τη διάρκεια του τοκετού είναι έντονα εµφανής στη µητέρα και επηρεάζει σηµαντικά την υγεία της. Πέρα όµως από τη µητέρα ο τοκετός αποτελεί µία πολύ επίπονη διαδικασία και για το έµβρυο το οποίο είναι αναγκασµένο να αναπτύξει περίπλοκους µηχανισµούς για να αντεπεξέλθει στην ασκούµενη πίεση. Το όργανο που συνδέει το έµβρυο µε τη ζωή µέχρι αυτό να έρθει στον κόσµο είναι ο οµφάλιος λώρος µέσω του οποίου µεταφέρεται στο έµβρυο, αίµα εµπλουτισµένο σε οξυγόνο ενώ παράλληλα αποµακρύνεται από αυτό διοξείδιο του άνθρακα και άλλα υπο-προϊόντα του µεταβολισµού. Κατά τη διάρκεια του τοκετού και πιο συγκεκριµένα κατά τη διάρκεια των συσπάσεων της µήτρας, αποτρέπεται η ροή του αίµατος στον πλακούντα και η κυκλοφορία στον οµφάλιο λώρο µπορεί να «µπλοκαριστεί». Αυτό αποτρέπει νέο οξυγονωµένο αίµα να φτάσει στο έµβρυο προκαλώντας µικρές περιόδους υποξαιµίας (έλλειψη οξυγόνου στο αίµα του εµβρύου) και µειώνοντας την αποκοµιδή του διοξειδίου του άνθρακα [Parer, 1997]. Εάν τα χρονικά διαστήµατα έλλειψης οξυγόνου παραταθούν για αρκετό χρόνο (τα όρια είναι δυσδιάκριτα) τότε το έµβρυο θα µεταπέσει σε υποξική κατάσταση (έλλειψη οξυγόνου στα όργανα). Ο βαθµός της υποξίας του εµβρύου παρακολουθείται από εµβρυϊκούς αισθητήρες (chemoreceptors) οι οποίοι βρίσκονται στις κύριες βαλβίδες αίµατος οι οποίες στέλνουν το κατάλληλο ερέθισµα στο εµβρυϊκό συµπαθητικό νευρικό σύστηµα για επιλεκτική διανοµή του αίµατος (και συνεπώς του οξυγόνου) στα ζωτικά όργανα του εµβρύου. Συνεχιζόµενη κατάσταση υποξίας οδηγεί σε αναερόβια µεταβολή η οποία αν συνεχιστεί για αρκετό χρόνο µπορεί να οδηγήσει σε εγκεφαλικές βλάβες, 11
Κεφάλαιο 1 ο εγκεφαλική παράλυση ακόµα και ενδοµήτριο θάνατο του εµβρύου [Parer, 1997; King and Parer, 2000]. Η εκτίµηση της κατάστασης του εµβρύου κατά την διάρκεια του τοκετού (αλλά και κατά τη διάρκεια της εγκυµοσύνης) βασίζεται στο καρδιοτοκογράφηµα το οποίο αξιολογεί ο/η γυναικολόγος- µαιευτήρας [Geijn, 1996]. Το καρδιοτοκογράφηµα καταγράφει και εκτυπώνει σε µία λουρίδα χαρτιού την ΕΚΣ και τις συσπάσεις της µήτρας στο χρόνο. Πιο συγκεκριµένα η ερµηνεία του καρδιοτοκογραφήµατος (κυρίως των µεταβολών και «αλλοιώσεων» της ΕΚΣ) αποτελεί ένα από τα λιγοστά διαθέσιµα εργαλεία για την εκτίµηση της οξυγόνωσης του εµβρύου και της αξιολόγησης της κατάστασης της υγείας του κατά τη διάρκεια του τοκετού. Η εκτεταµένη χρήση της παρακολούθησης της ΕΚΣ του εµβρύου κατά τη διάρκεια του τοκετού, από την εισαγωγή της στην κλινική πραγµατικότητα τη δεκαετία του 60 µέχρι σήµερα, έχει δείξει ότι η συγκεκριµένη µέθοδος παρουσιάζει µεν σχεδόν τέλεια διακριτική ικανότητα όσον αφορά τον χαρακτηρισµό εµβρύων που δεν έχουν υποστεί υποξία (µείωση της ποσότητας του οξυγόνου στους ιστούς), αλλά πολύ µικρή ικανότητα σωστής πρόβλεψης για τον εντοπισµό εµβρύων µε υποξία. [Geijn 1996, King and Parer 2000]. Βέβαια για την ερµηνεία του σήµατος της ΕΚΣ, την αξιολόγησή του και το διαχωρισµό των εµβρύων σε εκείνα που αντεπεξέρχονται στην πίεση του τοκετού από εκείνα που βρίσκονται πραγµατικά σε κίνδυνο και θα πρέπει ο µαιευτήρας να επέµβει άµεσα (λαµβάνοντας επιπρόσθετες µετρήσεις ή πραγµατοποιώντας καισαρική τοµή), απαιτείται υψηλός βαθµός εµπειρίας από τον µαιευτήρα, ενώ οι υπάρχουσες τεχνικές για την αυτοµατοποιηµένη διάγνωση είχαν µέχρι σήµερα περιορισµένη απόδοση και αποδοχή. 1.2 Αντικείµενο της διατριβής Η ερευνητική προσπάθεια στα πλαίσια της συγκεκριµένης διδακτορικής διατριβής επικεντρώθηκε στην εκτίµηση της κατάστασης της υγείας του εµβρύου προτείνοντας και χρησιµοποιώντας νέες µεθοδολογίες και αξιοποιώντας σύγχρονες τεχνικές για την επεξεργασία και ανάλυση της ΕΚΣ. Για την αξιολόγηση των µεθόδων εξετάστηκε η συσχέτιση της ΕΚΣ µε βραχυπρόθεσµες αξιόπιστες ενδείξεις για την κατάσταση του εµβρύου και πιο συγκεκριµένα χρησιµοποιήθηκε η συσχέτιση της τιµής του ph του αίµατος του εµβρύου το οποίο λαµβάνεται παίρνοντας δείγµα από τον οµφάλιο λώρο αµέσως µετά από τον τοκετό. Η τιµή του ph του αίµατος αποτελεί µια έµµεση ένδειξη για την ανάπτυξη υποξίας κατά τη διάρκεια του τοκετού, όπου χαµηλή τιµή του ph υποδηλώνει ότι το έµβρυο εκτέθηκε σε παρατεταµένη πίεση µε συνέπεια να µειωθούν τα επίπεδα οξυγόνου στο αίµα του. Όπως αναφέρθηκε στην προηγούµενη ενότητα, η ανάπτυξη υποξίας µπορεί να έχει µακροπρόθεσµες 12
Εισαγωγή συνέπειες στην υγεία του εµβρύου. Επειδή όµως η εγκεφαλική παράλυση, επί παραδείγµατι, µπορεί να διαγνωστεί ακόµα και δύο χρόνια µετά τη γέννηση του µωρού, «αντικειµενικός» σκοπός της συνεχούς παρακολούθησης της ΕΚΣ δεν είναι η εύρεση των εµβρύων που µπορεί να αναπτύξουν εντέλει εγκεφαλική παράλυση ή κάποια άλλη δυσλειτουργία, αλλά η δυνατότητα πρώιµης/έγκαιρης διάγνωσης (παρακολουθώντας κάποιο δείκτη, την ΕΚΣ εν προκειµένω) εµβρύων τα οποία δέχονται σηµαντική πίεση η οποία πιθανόν να δηµιουργήσει συνθήκες υποξίας. Επίσης στα πρώτα στάδια της ερευνητικής µας προσπάθειας, επιχειρήσαµε να συσχετίσουµε την ΕΚΣ µε την διάγνωση του µαιευτήρα που επέβλεπε τον τοκετό σε µια προσπάθεια να αναπαράγουµε την ιατρική γνώση χωρίς όµως τη χρησιµοποίηση λογικών κανόνων και συλλογισµών αλλά αντιµετωπίζοντάς το από την οπτική γωνία της αναγνώρισης προτύπων. Αυτό το τµήµα της διατριβής δεν επεκτάθηκε σε βάθος για τρεις λόγους. Ο πρώτος ήταν πρακτικής φύσεως και έχει να κάνει µε το γεγονός ότι είχαµε στη διάθεσή µας µόνο ένα περιορισµένο αριθµό από καταγραφές στις οποίες υπήρχε καταγεγραµµένη και η γνώµη του µαιευτήρα-γυναικολόγου. Ο δεύτερος σχετίζεται µε το γεγονός ότι αν και η γνώµη του µαιευτήρα-γυναικολόγου έχει βαρύνουσα σηµασία, εν τούτοις δεν µπορεί να αποτελέσει ένα «χρυσό κανόνα» (golden standard) γιατί όπως έχει αποδειχτεί στην πράξη είναι υποκειµενική. Ο τρίτος λόγος έχει να κάνει µε το γεγονός ότι ο µαιευτήρας-γυναικολόγος µπορούσε να έχει στη διάθεσή του και άλλες ιατρικές πληροφορίες και µετρήσεις τις οποίες δεν είχαµε στη διάθεσή µας και δεν µπορούσαµε να συµπεριλάβουµε. Τέλος θα πρέπει να αναφερθεί ότι αν και το µεγαλύτερο µέρος της ερευνητικής προσπάθειας επικεντρωθήκαµε στην κατηγοριοποίηση του σήµατος της ΕΚΣ (και εποµένως στη διάγνωση της κατάστασης του εµβρύου), στην αρχή της έγινε και µία προσπάθεια µελετώντας το συγκεκριµένο σήµα, να βρεθεί ένας τρόπος για την επεξεργασία και «επιδιόρθωσή» του µια και όπως θα εξηγηθεί στη συνέχεια, πρόκειται για ένα σήµα το οποίο εµφανίζει έντονο πρόβληµα «θορύβου». Στο κεφάλαιο 3 θα παρουσιαστούν 2 αλγόριθµοι οι οποίοι προτάθηκαν σε αυτή την κατεύθυνση. 1.3 Συνεισφορά της διατριβής Στα πλαίσια της διατριβής, πραγµατοποιήθηκε µια σε βάθος µελέτη και ανάλυση του σήµατος της ΕΚΣ, προτάθηκαν νέες ολοκληρωµένες µεθοδολογίες βασισµένες σε συµβατικές αλλά και προχωρηµένες τεχνικές επεξεργασίας και ανάλυσης δεδοµένων για την εξαγωγή χαρακτηριστικών. Εξετάσθηκε ποια χαρακτηριστικά περιέχουν αρκετή πληροφορία έτσι ώστε στη συνέχεια χρησιµοποιώντας προχωρηµένες τεχνικές από το πεδίο της αναγνώρισης προτύπων να επιτευχθεί η διάγνωση µιας «επικίνδυνης» κατάστασης για τη ζωή του εµβρύου. 13
Κεφάλαιο 1 ο Μέσα από τα πειράµατα τα οποία διεξήγαµε καταφέραµε να δείξουµε ότι τα δεδοµένα της ΕΚΣ διαθέτουν σηµαντική πληροφορία η οποία µπορεί να συσχετιστεί µε την τιµή του ph του οµφάλιου λώρου, το οποίο αποτελεί µια σηµαντική ένδειξη του βαθµού οξυγόνωσης του εµβρύου, κάτι το οποίο θεωρούνταν ουτοπικό στη δεκαετία του 90 [Dawes 1994]. Αρχικά εξετάσθηκαν και προτάθηκαν 2 µέθοδοι για τη βελτίωση των δεδοµένων του σήµατος της ΕΚΣ και για την αντιµετώπιση του προβλήµατος της ύπαρξης θορύβου και διαστηµάτων χωρίς καταγραφές της ΕΚΣ. Η πρώτη µέθοδος που προτάθηκε χρησιµοποιεί τον Expectation Maximization (ΕΜ) αλγόριθµο για την µοντελοποίηση του σήµατος της ΕΚΣ µε τη χρήση συνδυασµού κανονικών κατανοµών [Nokas et al. 2001]. Η δεύτερη µέθοδος χρησιµοποιεί νευρωνικά δίκτυα για την πρόβλεψη µελλοντικών τιµών της ΕΚΣ βασιζόµενη σε προηγούµενες καταγραφές [Koutras et al. 2001]. Προτάθηκε και χρησιµοποιήθηκε για πρώτη φορά η µέθοδος της ανάλυσης σε ανεξάρτητες συνιστώσες (Independent Component Analysis (ICA)) ως µία µέθοδος για την εξαγωγή χαρακτηριστικών από το σήµα της ΕΚΣ. Πειραµατιστήκαµε µε διαφορετικά µήκη σηµάτων και µε διαφορετικούς τύπους τεχνητών νευρωνικών δικτύων και επιπλέον εισάγαµε για πρώτη φορά σε αυτή την περιοχή τη χρήση των µηχανών διανυσµάτων υποστήριξης (Support Vector Machines (SVMs)), προκειµένου να ταξινοµηθούν τα σήµατα. Επίσης για πρώτη φορά προτάθηκαν και χρησιµοποιήθηκαν Κρυφά Μοντέλα Markov (Hidden Markov Models (HMMs)) σε µια προσπάθεια να «συλληφθεί» η χρονική εξέλιξη του φαινοµένου. Στη συγκεκριµένη προσέγγιση χρησιµοποιήθηκαν «συµβατικά» χαρακτηριστικά του σήµατος της ΕΚΣ, τα οποία υπολογίσθηκαν µε τη χρήση ενός ολισθαίνοντος παραθύρου, παρέχοντας πληροφορία για τη χρονική εξέλιξη του φαινοµένου [Georgoulas et al. 2004b]. Σηµαντική είναι η συνεισφορά της διατριβής, µε την εισαγωγή και χρήση του ιακριτού Μετασχηµατισµού Κυµατιδίου (Discrete Wavelet Transform) για την εξαγωγή χαρακτηριστικών [Georgoulas et al. 2005a, Georgoulas et al. 2005b]. Τα περισσότερα από τα χαρακτηριστικά του σήµατος της ΕΚΣ που προέκυψαν από την εφαρµογή του ιακριτού Μετασχηµατισµού Κυµατιδίου, χρησιµοποιήθηκαν για πρώτη φορά ως δείκτες για τον χαρακτηρισµό της κατάστασης του εµβρύου και µάλιστα µε αρκετά µεγάλη επιτυχία [Georgoulas et al. 2006b]. Επιπρόσθετα, για πρώτη φορά όσον αφορά το πεδίο της ανάλυσης βιοιατρικών σηµάτων, χρησιµοποιήθηκε µια υβριδική µέθοδος, που βασίζεται στη χρήση εξελικτικής γραµµατικής (Grammatical Evolution), προκειµένου να «κατασκευαστούν» νέα χαρακτηριστικά 14
Εισαγωγή παραγόµενα από τα χαρακτηριστικά που είχαν ήδη εξαχθεί µε συµβατικές µεθόδους. Τα «κατασκευασµένα» χαρακτηριστικά εµπεριέχουν και χρησιµοποιούν τα πιο ουσιώδη από τα αρχικά χαρακτηριστικά οπότε ο συνδυασµός τους µε µια προηγµένη µέθοδο ταξινόµησης δίνει πολύ καλά αποτελέσµατα εκτίµησης της κατάστασης της υγείας του εµβρύου [Georgoulas et al. 2006c, Tsoulos et al. 2005c]. Στα πλαίσια της διατριβής είναι η πρώτη φορά (και η µόνη µέχρι στιγµής) που χρησιµοποιήθηκαν µηχανές διανυσµάτων υποστήριξης για την ταξινόµηση των χαρακτηριστικών από τα δεδοµένα της ΕΚΣ. Η συγκεκριµένη µέθοδος ταξινόµησης λόγω της πολύ καλής ικανότητας γενίκευσης χρησιµοποιήθηκε σε συνδυασµό µε όλες τις οικογένειες χαρακτηριστικών που προτάθηκαν στα πλαίσια της συγκεκριµένης διδακτορικής διατριβής. Χρησιµοποιήθηκε σε συνδυασµό α) µε χαρακτηριστικά εξαγόµενα µε τη χρήση της µεθόδου ανάλυσης σε ανεξάρτητες συνιστώσες [Georgoulas et al. 2004a], β) µε «συµβατικά» χαρακτηριστικά [Georgoulas et al. 2003a, Georgoulas et al. 2006a] και γ) µε χαρακτηριστικά τα οποία εξήχθησαν χρησιµοποιώντας το διακριτό µετασχηµατισµό κυµατιδίου [Georgoulas et al. 2005a, Georgoulas et al. 2005b, Georgoulas et al. 2006b]. Επίσης προτάθηκε και χρησιµοποιήθηκε για πρώτη φορά η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων (Particle Swarm Optimization (PSO)) για τη ρύθµιση των παραµέτρων της µηχανής διανυσµάτων υποστήριξης [Georgoulas et al. 2006e]. Μια καινοτόµος µεθοδολογία που προτάθηκε στα πλαίσια της διατριβής, ενοποιεί τα στάδια εξαγωγής χαρακτηριστικών από δεδοµένα και της ταξινόµησής τους. Πιο συγκεκριµένα, προτάθηκε και χρησιµοποιήθηκε για πρώτη φορά η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων για την εκπαίδευση µιας νέας οικογένειας νευρωνικών δικτύων των νευρωνικών δικτύων κυµατιδίου (Wavelet Neural Networks (WNN)). Οι κόµβοι εισόδου του συγκεκριµένου δικτύου είναι «εφοδιασµένοι» µε κυµατίδια και δέχονται ως είσοδο απευθείας τα δεδοµένα, χωρίς να προηγηθεί επεξεργασία για την εξαγωγή χαρακτηριστικών, και στο επόµενο επίπεδο του δικτύου πραγµατοποιείται η ταξινόµηση. Με την προτεινόµενη µεθοδολογία επιτράπηκε η ενσωµάτωση του σταδίου εξαγωγής χαρακτηριστικών από χρονοσειρές και της ταξινόµησής τους σε ένα υβριδικό εργαλείο. Η συγκεκριµένη µεθοδολογία µπορεί να χρησιµοποιηθεί σε µια οποιαδήποτε εφαρµογή που περιλαµβάνει ταξινόµηση χρονοσειρών [Georgoulas et al. 2005d]. Συνοπτικά µπορούµε να πούµε ότι στην ερευνητική προσπάθεια προτάθηκαν και εξετάσθηκαν µια σειρά από διαφορετικές προσεγγίσεις τόσο για την ανάλυση δεδοµένων, και την εξαγωγή χαρακτηριστικών όσο και την ταξινόµηση τους. Οι προτεινόµενες µεθοδολογίες επικεντρώθηκαν και εφαρµόσθηκαν στην επεξεργασία και ταξινόµηση του σήµατος της ΕΚΣ προκειµένου να επιτευχθεί διάγνωση της κατάστασης της υγείας του εµβρύου κατά τη διάρκεια του τοκετού. Η αποδοχή των 15
Κεφάλαιο 1 ο άρθρων και οι παρουσιάσεις των αποτελεσµάτων σε διεθνή συνέδρια και περιοδικά απλά έρχονται να πιστοποιήσουν τα παραπάνω και τη συνεισφορά της συγκεκριµένης διατριβής. 1.4 ιάρθρωση της διατριβής Η παρούσα διατριβή διαρθρώνεται ως εξής: Στο κεφάλαιο 2 παρουσιάζεται συνοπτικά το ιατρικό πρόβληµα και το αντίστοιχο υπόβαθρο όσον αφορά τη µέχρι σήµερα χρήση και ερµηνεία του καρδιοτοκογραφήµατος και της ΕΚΣ ειδικότερα. Στο κεφάλαιο 3 παρουσιάζονται τα τεχνικά χαρακτηριστικά του σήµατος της ΕΚΣ, τα προβλήµατα κατά τη λήψη του και προτείνονται 3 µέθοδοι προεπεξεργασίας για την αφαίρεση του θορύβου από τις καταγραφές της ΕΚΣ. Στο κεφάλαιο 4 αναπτύσσονται οι µέθοδοι που χρησιµοποιήθηκαν για την εξαγωγή χαρακτηριστικών κατάλληλων για να περιγράψουν την κατάσταση του εµβρύου κατά τα τελευταία λεπτά του τοκετού. Στο κεφάλαιο 5 δίνεται µία σύντοµή µαθηµατική περιγραφή όλων των ταξινοµητών που χρησιµοποιήθηκαν στα πλαίσια της παρούσας διατριβής. Στο κεφάλαιο 6 παρουσιάζονται συνοπτικά οι προτεινόµενες µεθοδολογίες οι οποίες συνδυάζουν εργαλεία και µεθόδους που προτάθηκαν και παρουσιάσθηκαν στα κεφάλαια 4 και 5. Οι ολοκληρωµένες αυτές µεθοδολογίες δίνουν λύση στο πρόβληµα του διαχωρισµού των εµβρύων σε υγιή και ύποπτα µε βάση την επεξεργασία της ΕΚΣ όπως αυτή καταγράφεται στα τελευταία λεπτά του τοκετού. Τα αποτελέσµατα εφαρµογής καθεµιάς µεθοδολογίας σε ένα σύνολο πειραµατικών δεδοµένων παρατίθονται και συγκρίνονται. Στο κεφάλαιο 7 αναπτύσσουµε τα συµπεράσµατα που προέκυψαν ύστερα από την ενδελεχή ενασχόλησή µας µε την ανάλυση του σήµατος της ΕΚΣ και προτείνουµε κατευθύνσεις για µελλοντική έρευνα Στο ΠΑΡΑΡΤΗΜΑ παραθέτουµε ένα σύστηµα το οποίο υλοποιήθηκε στα πλαίσια της παρούσας διατριβής αρχικά, για τη λήψη και αποθήκευση του καρδιοτοκογραφήµατος σε έναν προσωπικό υπολογιστή, στο οποίο µε την προσθήκη των προτεινόµενων µεθοδολογιών θα είναι ικανό να πραγµατοποιεί και περαιτέρω ανάλυση, επεξεργασία και ταξινόµηση της ΕΚΣ [Nikitaris et al. 2001]. 16
Εισαγωγή 1.5 Σύνοψη Σε αυτό το εισαγωγικό κεφάλαιο παρουσιάστηκε εν συντοµία το πρόβληµα µε το οποίο ασχοληθήκαµε στα πλαίσια της παρούσας διατριβής καθώς και οι διαφορετικές προσεγγίσεις που προτάθηκαν και υλοποιήθηκαν. Επίσης δόθηκε το περίγραµµα της διατριβής και ο τρόπος µε τον οποίο είναι δοµηµένη σε κεφάλαια. Στο επόµενο κεφάλαιο θα προχωρήσουµε στην πιο ενδελεχή παρουσίαση του προβλήµατος. 17
Κεφάλαιο 1 ο 18
Καρδιοτοκογραφία Κεφάλαιο 2 ο Καρδιοτοκογραφία «Η κλινική παρακολούθηση της Εµβρυϊκής Καρδιακής Συχνότητας είναι στην πραγµατικότητα µια συνεχής παρακολούθηση της φυσιολογίας του εµβρύου» R.K. Freeman, 1991 2.1 Εισαγωγή Η σχέση της µητέρας µε το παιδί δεν αρχίζει µόνο τη στιγµή της γέννησής του. Είναι δεδοµένο ότι ξεκινά από την ενδοµήτρια ζωή, µε τα διάφορα στάδια που το έµβρυο εξελίσσεται. Ο ιατρός αφού πραγµατοποιήσει γρήγορα τη διάγνωση της κυήσεως µε όλα τα µέσα που έχει στη διάθεσή του θα πρέπει στη συνέχεια να παρακολουθεί συστηµατική την έγκυο µέχρι τον τοκετό και να την καθοδηγεί ώστε να προχωρήσει µε ασφάλεια η ίδια και το έµβρυο µέχρι το τέλος. Μία γενική αρχή στην ιατρική είναι ότι η πρόληψη είναι πάντα καλύτερη και αποτελεσµατικότερη από τη θεραπεία η οποία εφαρµόζεται όταν εµφανιστεί το πρόβληµα. Στη περίπτωση της µαιευτικής το κεντρικό ζήτηµα είναι να διαπιστωθούν και να προβλεφθούν ποιες εγκυµοσύνες ενδέχεται να εµφανίσουν πρόβληµα έτσι ώστε να ληφθούνε µέτρα για την αποφυγή τους. Στην Ευρωπαϊκή Ένωση έχουµε καθηµερινά 5 εκατοµµύρια γεννήσεις κάθε χρόνο από τις οποίες περίπου 50.000 σχετίζονται µε περιγεννητική θνησιµότητα. Πολύ περισσότερες σχετίζονται µε άλλες δυσµενείς καταλήξεις οι οποίες ποικίλουν, από απλή επέµβαση µε πραγµατοποίηση καισαρικής τοµής µέχρι µόνιµες εγκεφαλικές βλάβες. Το ένα τρίτο αυτών των περιπτώσεων πιστεύεται ότι θα µπορούσε να αποφευχθεί εάν είχαν ληφθεί τα απαραίτητα µέτρα [Dalton, 1994]. Mε την ανάπτυξη γρήγορων, αξιόπιστων και οικονοµικών προσωπικών υπολογιστών, άρχισαν να αναπτύσσονται συστήµατα τα οποία προορίζονταν/νται να παίξουν συµβουλευτικό ρόλο στη λήψη αποφάσεων σε διάφροα ιατρικά πεδία ένα εκ των οποίων είναι αυτό της µαιευτικής-γυναικολογίας. Πιο συγκεκριµένα έχουν αναπτυχθεί συστήµατα για: Την παρακολούθηση εκ γενετής ανωµαλιών Βιοχηµικά συστήµατα παρακολούθησης έχουν αναπτυχθεί για την νόσο του Ντάουν και άλλες γονιδιακές ανωµαλίες [Wald et al. 1988]. 19
Κεφάλαιο 2 ο Εκτίµηση του βάρους του εµβρύου Με βάση µετρήσεις παρµένες από υπέρηχο έχουν αναπτυχθεί συστήµατα για την εκτίµηση του βάρους του εµβρύου τόσο µε στατιστικές µεθόδους [Hadlock et al. 1985] όσο και µε νευρωνικά δίκτυα [Farmer et al. 1992]. Εκτίµηση του Βιοφυσικού προφίλ Έµπειρα συστήµατα για την εκτίµηση του Βιοφυσικού προφίλ συναντώνται επίσης στη διεθνή βιβλιογραφία [Devoe et al. 1992]. Το πεδίο στο οποίο έχει επικεντρωθεί η έρευνα για την ανάπτυξη αυτοµατοποιηµένων µεθόδων είναι αυτό της καρδιοτοκογραφίας η οποία αποτελεί και την πιο ευρέως χρησιµοποιούµενη µέθοδο (τουλάχιστον στις προηγµένες δυτικές κοινωνίες) για την παρακολούθηση της υγείας του εµβρύου. Μερικά τέτοια συστήµατα παρουσιάζονται στο τέλος του κεφαλαίου. 2.2 Καρδιοτοκογραφία Η καρδιοτοκογραφία (cardiotocography) αποτελεί την πιο διαδεδοµένη µέθοδο για την παρακολούθηση της κατάστασης του εµβρύου. Με την εισαγωγή της στη κλινική πραγµατικότητα παρατηρήθηκε µια ραγδαία αύξηση της χρήσης της. Η προσδοκία ήταν ότι θα καταφέρει να µειώσει την περιγεννητική θνησιµότητα που οφείλεται κυρίως στην ανάπτυξη υποξίας (hypoxia) [King and Parer, 2000]. Τον αρχικό ενθουσιασµό από την εισαγωγή της µεθόδου σε όλες τις µαιευτικές κλινικές των αναπτυγµένων χωρών, διαδέχτηκε έντονος σκεπτικισµός λόγω των αντικρουόµενων αποτελεσµάτων που αφορούσαν την αποτελεσµατικότητά της καθώς και της αδυναµίας να φανεί αντάξια των προσδοκιών, ιδιαίτερα για την έγκαιρη αναγνώριση της εµφάνισης υποξίας. Επιπλέον κάποιες µελέτες υπογράµµισαν προβλήµατα σχετιζόµενα µε τη χρήση και την ερµηνεία του καρδιοτοκογραφήµατος [CESDI 1997, 1998 και 2000]. Στη συνέχεια αρκετές προσπάθειες πραγµατοποιήθηκαν για να αυξήσουν την αποτελεσµατικότητα της µεθόδου και να µειώσουν τις αποκλίσεις κατά την αξιολόγηση και την ερµηνεία του καρδιοτοκογραφήµατος. Ο όρος καρδιοτοκογραφία είναι συνυφασµένος µε την ηλεκτρονική παρακολούθηση του εµβρύου αν και η παρακολούθηση του εµβρύου µπορεί να γίνει και µε άλλα ηλεκτρονικά µέσα πέραν της καρδιοτοκογραφίας. Ένας ορισµός για την ηλεκτρονική παρακολούθηση του εµβρύου (electronic fetal monitoring) είναι «η χρήση ηλεκτρονικής παρακολούθησης της ΕΚΣ για την εκτίµηση της κατάστασης του εµβρύου κατά τη διάρκεια του τοκετού». Αυτό τον ορισµό θα υιοθετήσουµε 20
Καρδιοτοκογραφία βασιζόµενοι στις οδηγίες που εκδόθηκαν από το Βασιλικό Συµβούλιο της Μαιευτικής και Γυναικολογίας [RCOG 2001]. Η βελτίωση των ιατρικών, κοινωνικών και οικονοµικών δεδοµένων είχαν θετική επίδραση στην επιτυχή κατάληξη των κυήσεων στον 19 ο και 20 ο αιώνα. Ο σκοπός της ηλεκτρονικής παρακολούθησης του εµβρύου ενδοµητρίως ήταν και είναι να αποτρέψει την πρόκληση βλαβών, και έγινε διαθέσιµο σε ευρεία κλίµακα στη δεκαετία του 60, όπου έµφαση δίνεται στην επιτυχή κατάληξη του τοκετού µε την έγκαιρη διάγνωση της εµβρυακής υποξίας πριν οδηγήσει σε περιγεννητική θνησιµότητα η εγκεφαλική παράλυση. Επιδηµιολογικά δεδοµένα δείχνουν ότι µόνο το 10% των περιπτώσεων µε εγκεφαλική παράλυση οφείλονται σε γεγονότα που συµβαίνουν κατά τη διάρκεια του τοκετού, αλλά ακόµα και σε αυτές τις περιπτώσεις, τα σηµάδια που υποδηλώνουν σοβαρή υποξία µπορεί να έχουν την αφετηρία τους σε παράγοντες πριν από τον τοκετό [Nelson, 1988] Η αρχική αντίδραση του εµβρύου σε χρόνια ή αργά εξελισσόµενη υποξία είναι να αυξήσει την καρδιακή λειτουργία για την ενίσχυση της υποστήριξης του εγκεφάλου και της καρδιάς. Η αύξηση της καρδιακής λειτουργίας του εµβρύου επιτυγχάνεται µε µια αύξηση της ΕΚΣ. Αυτό µπορεί να ακολουθηθεί από µία µείωση της µεταβλητότητας της καρδιακής συχνότητας εξαιτίας υποξίας του εγκεφάλου. Συνεχιζόµενη και επιδεινούµενη υποξία θα οδηγήσει εντέλει σε µυοκαρδιακή βλάβη και επιβραδύνσεις στην καρδιακή συχνότητα. Η οξεία υποξία, εν αντιθέσει, οδηγεί σε µια µείωση της ΕΚΣ (επιβραδύνσεις ή βραδυκαρδία) η οποία προέρχεται αρχικά από χηµική διέγερση αλλά τελικά από µυοκαρδιακή ισχαιµία. Όσον αφορά επιπτώσεις στο µεταβολισµό, η προοδευτική εµβρυϊκή υποξία οδηγεί αρχικά σε µια αναπνευστική οξυαιµία και κατόπιν σε µεταβολική οξυαιµία µε πρόκληση βλάβης στους ιστούς. Συνεπώς η βασική αρχή της παρακολούθησης κατά τον τοκετό είναι να αναγνωρίσει την εµφάνιση και ανάπτυξη εµβρυϊκής υποξίας µε σκοπό την αποτροπή επακόλουθης οξυαιµίας και της καταστροφής των κυττάρων. 2.3 Φυσιολογία κατά τον τοκετό Κατά τη διάρκεια της κύησης, το έµβρυο παίρνει όλα τα απαραίτητα συστατικά για την ανάπτυξή του από τον πλακούντα. Πριν από τη γέννηση, η ανταλλαγή οξυγόνου και διοξειδίου του άνθρακα από το έµβρυο γίνεται µέσω του πλακούντα ενώ αµέσως µετά τη γέννηση το νεογέννητο είναι σε θέση πλέον να χρησιµοποιήσει τους πνεύµονές του. Σε αντίθεση µε τα νεογνά, τα παιδιά και τους ενήλικες, το έµβρυο αναπτύσσεται σε ένα σχετικά υποόξινο περιβάλλον. Στην περίπτωση εµφάνισης µιας παθολογικής εξέλιξης στον πλακούντα είτε από τη µεριά της µητέρας είτε από τη µεριά του εµβρύου 21
Κεφάλαιο 2 ο αυτή επιδρά στην ανταλλαγή αερίων µεταξύ πλακούντα-εµβρύου, και µπορεί να επέλθει εµβρυϊκή ασφυξία ή ανεπάρκεια στα αποθέµατα οξυγόνου. Εάν η ασφυξία είναι παρατεταµένη, τότε µπορεί να οδηγήσει σε υποξία, µια κατάσταση κατά την οποία η παροχή οξυγονωµένου αίµατος στους ιστούς είναι µειωµένη. Η αναδιανοµή της ροής του αίµατος προς όργανα τα οποία είναι ευαίσθητα στην απουσία οξυγόνου, όπως ο εγκέφαλος και η καρδιά, επιτρέπουν στο έµβρυο να αντεπεξέρχεται και να επιβιώνει για µικρές περιόδους µε «ανεπαρκή» ροή οξυγόνο. Παρόλα αυτά, νευρολογικό τραύµα, ή ακόµα και θάνατος µπορεί να επέλθουν στην περίπτωση που η εµβρυϊκή υποξία συνεχιστεί για µεγάλα χρονικά διαστήµατα. Η ασφυξία µπορεί να οδηγήσει σε µια συσσώρευση διοξειδίου του άνθρακα στο αίµα και στους ιστούς οδηγώντας σε εµβρυϊκή οξέωση, µια κατάσταση η οποία χαρακτηρίζεται από αύξηση στην οξύτητα η οποία αντικατοπτρίζεται σε µια µείωση του ph (αύξηση της συγκέντρωσης των ιόντων υδρογόνου). Η ΕΚΣ ελέγχεται-ρυθµίζεται από το αυτόνοµο νευρικό σύστηµα. Στα πρώτα στάδια της εγκυµοσύνης, το συµπαθητικό νευρικό σύστηµα, που αποτελεί µέρος του αυτόνοµου νευρικού συστήµατος του εµβρύου, ελέγχει την ΕΚΣ. Καθώς προχωράει η κύηση, το παρασυµπαθητικό κοµµάτι του εµβρυϊκού νευρικού συστήµατος αποκτά µεγαλύτερο έλεγχο πάνω στην ΕΚΣ έχοντας σαν αποτέλεσµα µια µείωση στο επίπεδο την βασικής γραµµής της ΕΚΣ µε την πάροδο του χρόνου. Αισθητήρες στον εγκέφαλο αντιλαµβάνονται τη µείωση των επιπέδων οξυγόνου κατά τη διάρκεια υποξικών επεισοδίων και ενεργοποιούν µια νευρολογική αντίδραση σε αυτά τα επεισόδια αυξάνοντας την ΕΚΣ ώστε να σταλεί στον εγκέφαλο περισσότερο οξυγονωµένο αίµα. Όταν αυξηθεί η πίεση του αίµατος του εµβρύου, σήµατα στέλνονται µέσω των υποδοχέων προκαλώντας τη µείωση της ΕΚΣ. Συνεπώς η συνεχής ηλεκτρονική παρακολούθηση του εµβρύου παρέχει καρδιαγγειακή ένδειξη για την οξυγόνωση του εµβρύου, την οξεοβασική κατάσταση του και ενδείξεις για εµβρυϊκή δυσπραγία (distress). Αν και υπάρχει διένεξη όσον αφορά τον ορισµό της, η εµβρυϊκή δυσπραγία αποτελεί ένα σύµπλεγµα ενδείξεων που «απεικονίζουν» την αντίδραση του εµβρύου σε στρεσογόνες καταστάσεις όπως η υποξία και η οξέωση. Κατά τη διάρκεια του τοκετού, η ανταλλαγή αερίων ανάµεσα στον πλακούντα και το έµβρυο είναι κάπως µειωµένη λόγω µείωσης στη ροή του αίµατος από τη µητέρα, ανάλογη µε την ένταση, τη διάρκεια και τη συχνότητα των συσπάσεων της µήτρας. Όταν τόσο η µητέρα όσο και το έµβρυο είναι υγιή, αυτή η µείωση στην ανταλλαγή αερίων µέσω του πλακούντα είναι ανεκτή. Στην περίπτωση όµως που έχουµε µια προβληµατική εγκυµοσύνη, πλακουντικές ανωµαλίες, υπερδιέγερση την µήτρας, ή ένα χρόνια καταπονηµένο έµβρυο, όπως στην περίπτωση εµβρύων µε ενδοµήτρια καθυστέρηση ανάπτυξης, το έµβρυο ίσως να µη διαθέτει την ικανότητα να προσαρµοστεί στην πίεση του τοκετού. Η καρδιακή αντίδραση του εµβρύου σε περίπτωση υποξίας ποικίλει και εξαρτάται από την ταχύτητα και 22
Καρδιοτοκογραφία την ένταση µε την οποία εκδηλώθηκε η έλλειψη οξυγώνου καθώς και από τη συχνότητα και την ένταση των συσπάσεων της µήτρας. Η εµβρυϊκή υποξία µπορεί να µειώσει το «Apgar score» (µια ένδειξη της καλής κατάστασης του εµβρύου) ή να οδηγήσει σε νευρολογικές ενδείξεις και συµπτώµατα και αν παραταθεί µπορεί να οδηγήσει σε µόνιµη νευρολογική βλάβη ή θάνατο. Η συνεχής εµβρυϊκή παρακολούθηση κατά τη διάρκεια του τοκετού χρησιµοποιείται για την αναγνώριση αλλαγών στη µορφή του γραφήµατος της ΕΚΣ κατά τη διάρκεια των συσπάσεων της µήτρας, η οποία είναι µια περίοδος µειωµένης ροής αίµατος διαµέσου του πλακούντα. Οι αλλαγές αυτές πιστεύεται ότι µπορεί και να αντικατοπτρίζουν την εµβρυϊκή υποξία και πιθανό αυξηµένο κίνδυνο για επικείµενο θάνατο ή νευρολογική βλάβη. Ο στόχος της συνεχούς εµβρυϊκής παρακολούθησης µέσω του καρδιοτοκογραφήµατος είναι να αναγνωρίσει αλλοιώσεις στην ΕΚΣ σε συνδυασµό µε τις συσπάσεις της µήτρας έτσι ώστε να επιτραπεί µια έγκαιρη επέµβαση για την αποφυγή ενός άσχηµου αποτελέσµατος. Κλινικές αποφάσεις για επέµβαση µε θεραπευτικά µέσα ή/και µε χειρουργική επέµβαση βασίζονται εν µέρει ακριβώς στην παρατήρηση του καρδιοτοκογραφήµατος [Αγοραστός, 1991]. Η συνεχής παρακολούθηση της κατάστασης του εµβρύου µέσω της ΕΚΣ δεν καθορίζει το αίτιο της εµφάνισης ενός υπόπτου γραφήµατος και δεν µπορεί να δώσει µια τελεσίδικη διάγνωση, αποτελεί όµως µία ισχυρή ένδειξη της κατάστασης της υγείας του. Η διάγνωση της εµβρυϊκής δυσπραγίας δεν µπορεί να βασιστεί µόνο σε µία εργαστηριακή ή κλινική µέτρηση. Συνεπώς η κλινική απόφαση για επέµβαση βασίζεται σε µια εξέταση όλων των δεδοµένων που µπορούν να καταδείξουν εµβρυϊκή δυσπραγία συµπεριλαµβανοµένων και άλλων κλινικών και εργαστηριακών ευρηµάτων, και συµπεριλαµβανοµένης της λήψης αίµατος από την κεφαλή του εµβρύου για µέτρηση του ph. Ανεξάρτητα από τον τρόπο που λαµβάνεται, µία καθησυχαστική ΕΚΣ είναι σχεδόν πάντα συνυφασµένη µε ένα σφριγηλό νεογέννητο. Από την άλλη ένα γράφηµα µε ύποπτη ΕΚΣ δεν είναι απαραίτητα ένα συγκεκριµένο και αξιόπιστο προγνωστικό µέσο για εµβρυϊκά προβλήµατα όπως περιορισµένη οξυγόνωση ή οξέωση. Και αυτό γιατί υπάρχουν και άλλοι παράγοντες πέρα από την έλλειψη οξυγόνου που µπορεί να οδηγήσουν στην αποτύπωση µη καθησυχαστικών µορφών της ΕΚΣ. Επιπλέον η κρατούσα άποψη είναι ότι, ανωµαλίες στην ΕΚΣ µπορεί και να µην αντικατοπτρίζουν τη σοβαρότητα της µείωσης του οξυγόνου καθώς και την τελική έκβαση του τοκετού εάν επιτραπεί να προχωρήσει χωρίς κλινική παρέµβαση. 23
Κεφάλαιο 2 ο 2.4 Σύντοµη Ιστορική αναδροµή Η πρώτη αναφορά στην ακρόαση των εµβρυϊκών παλµών ανάγεται στο έτος 1766 όταν ο Wrisberg πρόσθεσε µία σηµείωση στη δεύτερη έκδοση του έργου του Roedere και αφορούσε την χρήση της ακοής για την διαπίστωση µια εγκυµοσύνης. Χρειάστηκε να περάσει σχεδόν ένας αιώνας ως τη στιγµή που ο Killian (1848) διατύπωσε την άποψη ότι η συχνότητα των εµβρυϊκών καρδιακών παλµών θα πρέπει να ληφθεί υπόψη για τη διάγνωση της εµβρυϊκής δυσπραγίας. Η εσωτερική (ενδοµητριακή) τοκογραφία και τα πρώτα τοκογράµµατα παρουσιάζονται για πρώτη φορά από τον Schatz το 1872. Η πρώτη προσπάθεια εξωτερικής καταγραφής των συσπάσεων της µήτρας θα γίνει λίγο αργότερα το 1896 από τον Schaffer και η πρώτη πολύωρη συνεχής καταγραφή οδυνών αναφέρεται στις εργασίες του Rech (1934) [Αγοραστός, 1991]. Η καθιέρωση του καρδιοτοκογράφου, δηλαδή της συσκευής που καταγράφει ταυτόχρονα και συνεχώς την ΕΚΣ και τη συσταλτότητα του µυοµητρίου, αποδίδεται σε τρεις κυρίως ερευνητές οι έρευνες των οποίων είχαν σαν αποτέλεσµα τη δηµιουργία του καρδιοτκογραφήµατος (ΚΤΓ) όπως το ξέρουµε στις µέρες µας. Οι τρεις αυτοί ερευνητές ήταν [Αγοραστός, 1991]: Α) ο Caldeyro-Barcia στην Ουρουγουάη στις αρχές της δεκαετίας του 50, µε την οµάδα του, εξέτασε τις φυσιολογικές και παθοφυσιολογικές παραµέτρους των ωδινών της µήτρας, καθώς και τη δυνατότητα επηρεασµού τους και ήταν ο πρώτος που χρησιµοποίησε διακοιλιακή εισαγωγή καθετήρα στην αµνιακή κοιλότητα [Caldeyro-Barcia et al. 1950, Alvarez and Caldeyro-Barcia, 1954] Β) ο Hon στις ΗΠΑ, την ίδια περίπου περίοδο µε τον Caldeyro-Barcia, τοποθετούσε για πρώτη φορά ηλεκτρόδιο στο δέρµα της κεφαλής του εµβρύου για τη συνεχή και απευθείας καταγραφή της ΕΚΣ. Τα ευρήµατα και οι αξιολογήσεις του, σχετικά µε τις διάφορες παραλλαγές της ΕΚΣ ισχύουν κατά το µεγαλύτερο µέρος µέχρι και σήµερα στην ιατρική κοινότητα [Hon 1958, 1959, 1953; Chung and Hon, 1959, Hon and Wohlgemuth, 1961, Hon and Huang, 1962] Γ) και τέλος ο Hammacher, λίγο αργότερα στη Γερµανία χρησιµοποίησε την φωνοκαρδιογραφική συνεχή παρακολούθηση των εµβρυϊκών καρδιακών παλµών, σε συνδυασµό µε την εξωτερική τοκογραφία, για πρώτη φορά ως κλινική µέθοδο ρουτίνας, χρησιµοποιώντας συσκευή της εταιρίας Hewlett-Packard [Hammacher 1962, 1965, 1966, 1966, 1967, 1969] Στις αρχές της δεκαετίας του 70 εφαρµόζονται τρεις µέθοδοι (ηλεκτροκαρδιογραφία, φωνοκαρδιογραφία, υπερηχογραφία) για τη συνεχή καταγραφή των εµβρυϊκών παλµών και µάλιστα µε ταυτόχρονη καταγραφή των συσπάσεων της µήτρας. Αυτή η µέθοδος της συνδυασµένης 24
Καρδιοτοκογραφία απεικόνισης της ΕΚΣ και της συσταλτότητας του µυοµητρίου ονοµάστηκε καρδιοτοκογραφία (καρδιά-τόκος-γραφή). Μέχρι σήµερα επικρατεί η άποψη ότι το καρδιοτοκογράφηµα (cardiotocogram) και πιο συγκεκριµένα οι διακυµάνσεις της ΕΚΣ σε σχέση µε το τοκόγραµµα µπορούν να δώσουν σηµαντικές πληροφορίες σχετικά µε την αιµάτωση και οξυγόνωση του εµβρύου πάντα βέβαια λαµβάνοντας υπόψη το ιατρικό ιστορικό της εκάστοτε κύησης. Η ευκολία στην εφαρµογή της (αλλά, όπως αποδείχτηκε εκ των υστέρων, όχι και στη χρήση της) και η πίστη ότι µπορεί να δώσει στο µαιευτήρα τη δυνατότητα να αναγνωρίσει έγκαιρα επαπειλούµενες καταστάσεις ανοξίας του εµβρύου και κατά συνέπεια να επέµβει ώστε να τις αποφύγει οδήγησαν στη ραγδαία εξάπλωσή της καρδιοτοκογραφία στον «δυτικό» κόσµο. Στις αρχές της δεκαετίας του 90 στη Μεγάλη Βρετανία το ένα τρίτο των γυναικών υποβάλλονταν σε συνεχή παρακολούθηση ενώ το αντίστοιχο ποσοστό ανέρχονταν στο 50% στις ΗΠΑ [Westgate et al. 1993] 2.5 Λήψη καρδιοτοκογραφήµατος Ο καρδιοτοκογράφος (cardiotocograph) είναι µία συσκευή που απαρτίζεται από δύο υποσυστήµατα: ένα για να αναγνωρίζει να επεξεργάζεται και να καταγράφει την καρδιακή συχνότητα και ένα για να παρακολουθεί τις συσπάσεις της µήτρας. Για την παρακολούθηση της ΕΚΣ, η συσκευή µπορεί να χρησιµοποιεί την R συνιστώσα του εµβρυϊκού ηλεκτροκαρδιογράµµατος (electrocardiogram ECG), του σήµατος δηλαδή που παράγεται από την κίνηση του καρδιαγγειακού συστήµατος, µε τη χρήση ηλεκτροδίων τοποθετηµένων στο έµβρυο (κυρίως στο τριχωτό της κεφαλή ή στο γλουτό στην περίπτωση ισχιακής προβολής), ή µε τη χρήση για υπερήχων και της αρχής Doppler. Οι συσπάσεις της µήτρας ανιχνεύονται είτε µε τη χρήση καθετήρα τοποθετηµένου εντός του αµνιακού υγρού και τη χρήση ενός πιεζοηλεκτρικού µετατροπέα, είτε µε µία εξωτερική συσκευή, η οποία ονοµάζεται τοκοδυναµόµετρο (tokodynamometer), η οποία τοποθετείται πάνω στην κοιλιά (υπογάστριο) της εγκυµονούσας και ανιχνεύει τη σφίξη της κοιλιακής χώρας κατά τη διάρκεια της σύσπασης. [Carter 1993a]. Η παρακολούθηση µε συσκευές οι οποίες έρχονται σε επαφή µε το έµβρυο ή τοποθετούνται στο εσωτερικό της µήτρας καλούνται άµεσες, ή εσωτερικές µέθοδοι παρακολούθησης. Σε αυτή την κατηγορία ανήκουν η χρήση ηλεκτροδίου (fetal electrode) το οποίο εφαρµόζεται στο δέρµα του τριχωτού της εµβρυϊκής κεφαλής, καθώς και η χρήση καθετήρα εντός της αµνιακής κοιλότητας. Από την άλλη µεριά όταν έχουµε συσκευές που δεν απαιτούν άµεση επαφή µε το έµβρυο, µιλάµε για εξωτερική ή µη επεµβατική παρακολούθηση. Σε αυτή την κατηγορία ανήκουν µεταξύ άλλων 25
Κεφάλαιο 2 ο συσκευές που χρησιµοποιούν το φαινόµενο Doppler, το φωνοκαρδιόγραµµα (φωνοκαρδιοτοκογρφία), η κοιλιακή ηλεκτροκαρδιογραφία για την καταγραφή της καρδιακής συχνότητας και η χρήση του τοκοδυναµοµέτρου για την καταγραφή των συσπάσεων της µήτρας. Στις µέρες µας για εξωτερική παρακολούθηση χρησιµοποιείται σχεδόν αποκλειστικά συσκευές Doppler για την παρακολούθηση της ΕΚΣ. Στο Σχήµα 2.1 φαίνονται σχηµατικά οι διαφορετικοί τρόποι λήψης του καρδιοτοκογραφήµατος Σχήµα 2.1: Λήψη καρδιοτοκογραφήµατος Η πιο ακριβής συσκευή για την παρακολούθηση της καρδιακή συχνότητας είναι αυτή η οποία έχει τις λιγότερες εξωγενείς παρεµβολές. Η παρακολούθηση της R συνιστώσας του εµβρυϊκού ηλεκτρογαρδιογραφήµατος αποτελεί την πιο ακριβή µέθοδο κατά την περίοδο του τοκετού, αν και µε την πρόοδο της τεχνολογίας και η ποιότητα των καταγραφών που προέρχονται από συσκευές Doppler έχει βελτιωθεί σηµαντικά [Carter 1993a]. 2.5.1 Εµβρυϊκή καρδιακή συχνότητα 2.5.1.1 Άµεση εµβρυϊκή ηλεκτροκαρδιογραφία Η µέθοδος στηρίζεται στην απευθείας απαγωγή του εµβρυϊκού ηλεκτροκαρδιογραφήµατος (ΗΚΓ) µε ηλεκτρόδιο που εφαρµόζεται στο δέρµα του τριχωτού της κεφαλής ή του γλουτού σε περίπτωση ισχιακής προβολής. Προϋπόθεση αποτελεί η προϋπάρχουσα ρήξη των εµβρυϊκών υµένων ή η τεχνητή ρήξη τους για την εφαρµογή του ηλεκτροδίου και αφού έχουµε ήδη διαστολή του τραχήλου περίπου 2 εκατοστών. Η µέθοδος αυτή δίνει τις πιο ακριβείς καταγραφές της ΕΚΣ [Carter 1993a]. Αν και σε άλλες χώρες χρησιµοποιείται ευρέως µιας και δίνει στην ασθενή µια κάποια ελευθερία κινήσεων και 26
Καρδιοτοκογραφία επιλογής θέσης καθώς και αποφυγής της χρήσης ζωνών στην κοιλιακή χώρα, στην Ελλάδα η χρήση της είναι περιορισµένη. Συνήθως παράλληλα µε την εσωτερική καρδιογραφία, εισάγεται στην ενδοαµνιακή κοιλότητα και ο ειδικός καθετήρας για τη λήψη του τοκογράµµατος. 2.5.1.2 Υπερηχοκαρδιογραφία Η µέθοδος αυτή στηρίζεται σε µια συσκευή η οποία τοποθετείται στο υπογάστριο της µητέρας και εκπέµπει υπέρηχους περίπου στα 2.5 MHz. Η πρόσκρουσή τους σε κινούµενες επιφάνειες (καρδιακές γλωχίνες) επιφέρει ανάκλασή τους µε συχνότητα ανάλογη µε τη φορά κίνησης της κινούµενης επιφάνειας (φαινόµενο Doppler). Αυτή η αλλαγή στη συχνότητα µε κάθε συστολή αναγνωρίζεται ως ένα καρδιακό επεισόδιο και επεξεργάζεται από τη συσκευή. Αν και η συσκευή είναι απλή στην τοποθέτηση και εφαρµογή της και µπορεί να χρησιµοποιηθεί και πριν από τη ρήξη των εµβρυϊκών υµένων, εντούτοις µερικές φορές είναι αναξιόπιστη κατά τη διάρκεια του τοκετού λόγω της κίνησης τόσο της µητέρας όσο και του εµβρύου. Όταν κατά το παρελθόν είχαν χρησιµοποιηθεί ανιχνευτές κορυφής ή ανιχνευτές µε κατώφλι για τον προσδιορισµό της καρδιακής συχνότητας η αβεβαιότητα στον ακριβή χρονικό προσδιορισµό του καρδιακού γεγονότος που λειτουργούσε ως σηµείο αναφοράς οδηγούσε σε λάθη στον υπολογισµό της ΕΚΣ της τάξης των ± 2. 5 bpm [Carter 1993b]. Το λάθος που εισαγόταν µε αυτό τον τρόπο γνωστό και ως "jitter" παραµόρφωνε την πραγµατική µεταβλητότητα της βασικής γραµµής της ΕΚΣ και για την µείωση του χρησιµοποιούνταν τεχνικές λήψης του µέσου όρου και µέθοδοι αυτοσυσχέτισης. Η συνάρτηση αυτοσυσχέτισης µιας κυµατοµορφής είναι το γράφηµα το οποίο απεικονίζει την οµοιότητα µεταξύ της κυµατοµορφής και µιας µετατοπισµένης εκδοχής της. Η συνάρτηση αυτοσυσχέτισης παίρνει τη µέγιστη τιµή της όταν οι δύο κυµατοµορφές είναι όµοιες και σε φάση. Συνεπώς η συνάρτηση αυτοσυσχέτισης µιας περιοδικής κυµατοµορφής είναι µε τη σειρά της περιοδική και µάλιστα έχει την ίδια περίοδο µε την αρχική κυµατοµορφή. Το πλεονέκτηµα που παρέχει η χρήση της συνάρτησης αυτοσυσχέτισης είναι ότι πιο ακριβείς υπολογισµοί µπορούν να πραγµατοποιηθούν γιατί ο θόρυβος που είναι ένα τυχαίο σήµα δεν παρουσιάζει σηµαντική συσχέτιση µε µετατοπισµένες εκδοχές του και έτσι αποκαλύπτεται η περιοδικότητα του προς παρακολούθηση σήµατος. Ένα µεγαλύτερο πρόβληµα είναι ότι η συγκεκριµένη µέθοδος δεν δίνει πάντα έγκυρη καταγραφή της διακύµανσης της ΕΚΣ (έχει αναφερθεί µείωση έως και 30% της διακύµανση συγκρινόµενη µε αυτή που υπολογίζεται χρησιµοποιώντας το εµβρυϊκό ΗΚΓ [Carter 1993b]. Επίσης έχει αναφερθεί ότι η συχνότητα µπορεί να υποδιπλασιαστεί ή να µεταβληθεί απότοµα πάνω από 35 bpm. Αν και συνήθως τέτοιες αλλαγές γίνονται αµέσως αντιληπτές τις περισσότερες φορές, υπάρχουν όµως περιπτώσεις κατά τις οποίες τέτοιες αλλαγές µπορεί να εκληφθούν εσφαλµένα ως επιταχύνσεις ή 27
Κεφάλαιο 2 ο επιβραδύνσεις της ΕΚΣ. Τέτοια λάθη είναι πιο πιθανόν να συµβούν όταν ο πραγµατικός καρδιακός ρυθµός πέφτει κάτω των 100 bpm. Tέλος µερικές φορές µπορεί εσφαλµένα να µετράται η καρδιακή συχνότητα της µητέρας αντί του εµβρύου. Συνεπώς οι καρδιοτοκογράφοι που χρησιµοποιούν υπέρηχους δεν µπορούν να παρουσιάσουν τις πραγµατικές µεταβολές στην ΕΚΣ µεταξύ διαδοχικών χτύπων της καρδιάς του εµβρύου (το σχετικά αργό Doppler σήµα παρουσιάζει περισσότερες µεταβολές και δεν έχει κάποιο εύκολα εντοπίσιµο σηµείο έναυσης για τον ακριβή προσδιορισµό µεταξύ των καρδιακών παλµών) [Carter 1993b]. Η εξωτερική υπερηχοκαρδιοτοκογραφία έχει ως ιδιαίτερο πλεονέκτηµα το ότι επιτρέπει την ανεύρεση και ακρόαση των εµβρυϊκών καρδιακών παλµών ήδη από την 9 η -10 η βδοµάδα της κύησης (συνήθως η καταγραφή της ΕΚΣ για διαγνωστικούς σκοπούς πραγµατοποιείται µετά από την 24 η εβδοµάδα της κύησης). 2.5.1.3 Σφάλµατα κατά την καταγραφή της ΕΚΣ Τεχνικά λανθασµένες καταγραφές παρατηρούνται όταν Α) η ηλεκτροδιακή κεφαλή (transducer) δεν είναι σωστά τοποθετηµένη στα κοιλιακά τοιχώµατα, ώστε να υπάρχει σωστή υποδοχή των ερεθισµάτων της καρδιάς Β) το ηλεκτρόδιο του τριχωτού της κεφαλής στην εσωτερική καρδιογραφία έχει χάσει την επαφή µε το δέρµα Γ) καταγράφονται ταυτόχρονα η εµβρυϊκή και η µητρική καρδιακή συχνότητα ) στην περίπτωση της απεικόνισης σε χαρτί, όταν υπάρχουν καθαρά τεχνικά σφάλµατα όπως λανθασµένη τοποθέτηση χαρτιού καταγραφής, λανθασµένος µηχανισµός προώθησης του χαρτιού, υπερθέρµανση του καταγραφέα σε µηχανήµατα θερµογραφίας, µηχανικό κώλυµα της ακίδας καταγραφής κ.ά. [Αγοραστός, 1991]. Όπως γίνεται αντιληπτό η 4 η πηγή σφαλµάτων µπορεί να εξαλειφθεί µε τη χρήση υπολογιστικών συστηµάτων και αποσύνδεση της όλης διαδικασίας από την µέχρι τώρα απεικόνιση πάνω στο χαρτί και αντικατάστασή του πιθανόν µε τη χρήση κάποιας οθόνης και ηλεκτρονικής καταγραφής σε αρχείο. 28
Καρδιοτοκογραφία 2.5.2 Τοκογραφία 2.5.2.1 Εσωτερική τοκογραφία Η µέθοδος αυτή στηρίζεται στην αρχή µετάδοσης της πίεσης διαµέσου των υγρών. Η πίεση που αναπτύσσεται στο µυοµήτριο κατά τη διάρκεια µιας σύσπασης µεταδίδεται, στο κοίλο της µήτρας και µέσω του αµνιακού υγρού στο άκρο ενός καθετήρα που έχουµε εισάγει σε αυτή την κοιλότητα και το οποίο είτε είναι ανοικτό και ο καθετήρας είναι γεµάτος µε υγρό (φυσιολογικό ορό), είτε φέρει ειδικό ευαίσθητο πιεζοηλεκτρόδιο. Οι αλλαγές στην πίεση µετατρέπονται σε ηλεκτρικό σήµα, το οποίο απεικονίζεται απευθείας σε χιλιοστά της κλίµακας υδραργύρου (µε την προϋπόθεση ότι έχει προηγηθεί έλεγχος µηδενισµού του οργάνου calibration). Οι αναγραφόµενες τιµές εκφράζουν συνεπώς τις πραγµατικές τιµές πιέσεων που αναπτύσσονται µέσα στη µήτρα και είναι η µόνη µέθοδος η οποία µπορεί να µετρήσει τα πραγµατικά (και όχι τα σχετικά όπως στην περίπτωση του τοκοδυναµοµέτρου) µεγέθη της συσταλτικής δραστηριότητας. Η εφαρµογή της µεθόδου περιορίζεται προφανώς µόνο κατά τη διάρκεια του τοκετού και εφόσον έχει προϋπάρξει ρήξη των εµβρυϊκών υµένων και πραγµατοποιείται µε την προώθηση ενός ειδικού πλαστικού καθετήρα στην ενδοαµνιακή κοιλότητα. Η εφαρµογή της εσωτερικής τοκογραφίας έχει ελαττωθεί τα τελευταία χρόνια και περιορίζεται µόνο σε ορισµένες κυήσεις υψηλού κινδύνου [Αγοραστός 1991] 2.5.2.2 Εξωτερική τοκογραφία Η εξωτερική τοκογραφία πραγµατοποιείται µε τη χρήση µιας συσκευής η οποία καλείται τοκοδυναµόµετρο και η οποία αποτελείται από µια ευαίσθητη µεµβράνη ή ακίδα η οποία είναι ενσωµατωµένη σε ειδική κεφαλή και η οποία τοποθετείται-δένεται πάνω στα κοιλιακά τοιχώµατα της εγκύου. Αύξηση του τόνου του µυοµητρίου και ελαφρά ανύψωση του πυθµένα της µήτρας κατά την ωδίνη µετατοπίζουν την µεµβράνη και η µετατόπιση αυτή µετατρέπεται σε ηλεκτρικό σήµα το οποίο επεξεργάζεται από τη συσκευή και απεικονίζεται στο καρδιοτοκόγραµµα. Το τοκοδυναµόµετρο ανιχνεύει τη συχνότητα και συχνά και τη διάρκεια των συσπάσεων της µήτρας αλλά συνήθως δεν µπορεί να αποδώσει την ακριβή ένταση της σύσπασης όπως συµβαίνει στην περίπτωση του ενδοαµνιακού καθετήρα και αυτό το οποίο τελικά απεικονίζεται είναι µία σχετική µεταβολή (και όχι απόλυτα µεγέθη πίεσης). Επίσης η γυναίκα θα πρέπει να είναι ξαπλωµένη ανάσκελα και θα πρέπει να κινείται όσο το δυνατόν λιγότερο, κάτι το οποίο καµιά φορά δηµιουργεί αίσθηµα δυσφορίας σε συνδυασµό µε το σφίξιµο που προκαλείται από τη ζώνη που συγκρατεί τη συσκευή επάνω στην 29
Κεφάλαιο 2 ο κοιλιακή της χώρα. Από την άλλη µεριά είναι πολύ απλή στην εφαρµογή της και απόλυτα ασφαλής µέθοδος και για αυτό προτιµάται στις περισσότερες των περιπτώσεων έναντι της τοποθέτησης ενδοαµνιακού καθετήρα. 2.5.3 Ορολογία καρδιοτοκογραφίας Αν και η καρδιοτοκογραφία χρησιµοποιούνταν από τη δεκαετία του 70, η πρώτη συστηµατική προσπάθεια για µια προτυποποίηση στην ορολογία και την έκδοση οδηγιών για τη χρήση της καρδιοτοκογραφίας πραγµατοποιήθηκε το 1987 από την Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων (International Federation of Obstetrics and Gynecologists FIGO) [Rooth et al. 1987]. Σύµφωνα µε αυτές τις οδηγίες έχουµε τους παρακάτω ορισµούς: Βασική γραµµή (baseline): βασική γραµµή της ΕΚΣ ορίζεται ως η µέση τιµή της ΕΚΣ όταν αυτή είναι σταθερή και κατά την απουσία επιταχύνσεων και επιβραδύνσεων. Υπολογίζεται εντός διαστηµάτων 5 ή 10 λεπτών και εκφράζεται σε παλµούς ανά λεπτό (beats/min bpm). ιακύµανση (variability): Κάτω από φυσιολογικές συνθήκες, τα µεσοδιαστήµατα µεταξύ διαδοχικών παλµών υπόκεινται σε µικρές διακυµάνσεις. Αυτό καλείται µικροδιακύµανση (short term variability). Λόγω της ύπαρξης µιας συγκεκριµένης περιοδικότητας όσον αφορά τη διεύθυνση και το µέγεθος αυτών των αλλαγών οδηγούν σε µία ταλάντωση της ΕΚΣ γύρω από τη µέση της τιµή. Αυτές οι ταλαντώσεις ονοµάζονται µακροδιακύµανση (long term variability). Στις καταγραφές της ΕΚΣ η µικροδιακύµανση υπερτίθεται στην µακροδιακύµανση µε τη µορφή µικρών αποκλίσεων. Εντούτοις αυτή δεν µπορεί να ερµηνευθεί αξιόπιστα µε γυµνό µάτι χρησιµοποιώντας τις συνηθισµένες συσκευές. Για αυτό στην κλινική πράξη ο όρος διακύµανση αναφέρεται στη µακροδιακύµανση (και µε βάση αυτή τη διαπίστωση χρησιµοποιήθηκε και στις οδηγίες που ακολουθούν µετά την διατύπωση της ορολογίας). Η µακροδιακύµανση χαρακτηρίζεται από τη συχνότητα (frequency) και το εύρος (amplitude) των ταλαντώσεων. Αν και η συχνότητα µπορεί να είναι σηµαντική, είναι δύσκολο να υπολογιστεί σωστά. Για αυτό η διακύµανση συνήθως ποσοτικοποιείται περιγράφοντας το εύρος των ταλαντώσεων γύρω από τη βασική γραµµή. Επιταχύνσεις (accelerations): παροδική αύξηση της ΕΚΣ κατά 15 bpm ή µεγαλύτερη και διάρκειας 15 δευτερολέπτων ή παραπάνω. Επιβραδύνσεις (decelerations): παροδική µείωση της ΕΚΣ κατά 15 bpm ή παραπάνω και διάρκειας 10 δευτερολέπτων ή παραπάνω. 30
Καρδιοτοκογραφία Με βάση τους παραπάνω ορισµούς η Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων προχώρησε και σε οδηγίες για την κατηγοριοποίηση της ΕΚΣ ανάλογα µε τη µορφή του γραφήµατος της σε 3 κατηγορίες: α) κανονική β) ύποπτη και γ) παθολογική. Τόσο για την περίοδο πριν τον τοκετό όσο και για την περίοδο κατά τον τοκετό η κατηγοριοποίηση ενός καρδιοτοκογραφήµατος είναι η ίδια στα περισσότερα σηµεία µε µικρές µόνο διαφοροποιήσεις. Όσον αφορά την περίοδο του τοκετού η ΕΚΣ ορίζεται ως: α) κανονική Βασική γραµµή µεταξύ 110 και 150 bpm. Εύρος διακύµανσης ΕΚΣ µεταξύ 5 και 25 bpm. β) ύποπτη Βασική γραµµή µεταξύ 150 και 170 bpm ή µεταξύ 100 και 110 bpm. Εύρος διακύµανσης ΕΚΣ µεταξύ 5 και 10 bpm για χρονικό διάστηµα µεγαλύτερο των 40 λεπτών. ιακύµανση µεγαλύτερη των 25 bpm. Ύπαρξη µεταβλητών επιβραδύνσεων. γ) παθολογική Βασική γραµµή πάνω από 170 bpm ή κάτω από 100 bpm. ιακύµανση µικρότερη των 5 bpm για χρονικό διάστηµα µεγαλύτερο των 40 λεπτών. Ύπαρξη βαρέων µεταβλητών επιβραδύνσεων ή βαρέων επαναλαµβανόµενων πρώιµων επιβραδύνσεων. Ύπαρξη παρατεινόµενων επιβραδύνσεων Ύπαρξη όψιµων επιβραδύνσεων η βαρύτερη µορφή χαρακτηρίζεται από µια σταθερή βασική γραµµή χωρίς διακύµανση σε συνδυασµό µε την ύπαρξη όψιµων επιβραδύνσεων µικρού εύρους µετά από κάθε σύσπαση. Κολπική κυµατοειδής µορφή της ΕΚΣ (συχνότητα µικρότερη από 6 κύκλους το λεπτό, εύρος τουλάχιστον 10 bpm και διάρκεια πάνω από 20 λεπτά). Επιπλέον θα πρέπει να δώσουµε και ορισµένους άλλους ορισµούς και πιο συγκεκριµένα: Ως παρατεινόµενη επιβράδυνση αναφέρεται η µεµονωµένη και έντονη ελάττωση της ΕΚΣ διάρκειας τουλάχιστον 2 λεπτών αλλά µικρότερη των 10 λεπτών. 31
Κεφάλαιο 2 ο Περιοδικές επιβραδύνσεις, παρατηρούνται πάντα σε συνδυασµό µε τις συσπάσεις της µήτρας και διακρίνονται σε: Πρώιµες: Η πτώση της ΕΚΣ, που συνήθως είναι φυσιολογική, αρχίζει ταυτόχρονα ή µε ελάχιστη καθυστέρηση από την έναρξη της ωδίνης. Το χαµηλότερο σηµείο συµπίπτει σχεδόν χρονικά µε την κορύφωση της ωδίνης. Η ΕΚΣ επανέρχεται στην αρχική της τιµή µετά το πέρας της ωδίνης. Το εύρος της επιβράδυνσης συνήθως δεν υπερβαίνει τα 30 bpm και κατά συνέπεια η ΕΚΣ σπάνια πέφτει κάτω των 100 bpm. Όψιµες: Η πτώση της ΕΚΣ αρχίζει καθυστερηµένα σε σχέση µε την ωδίνη (συνήθως µετά την κορύφωση της ωδίνης) και η χρονική διαφορά µεταξύ κορύφωσης της ωδίνης και χαµηλότερου σηµείου της επιβράδυνσης είναι 30-60 δευτερόλεπτα. Η ΕΚΣ επανέρχεται στα πριν την ωδίνη επίπεδα συνήθως αρκετά λεπτά µετά το πέρας της ωδίνης µερικές φορές δεν επανέρχεται πλήρως µε αποτέλεσµα την εµφάνιση µιας µικρής φάσης βραδυκαρδίας. Το εύρος της επιβράδυνσης συνήθως δεν υπερβαίνει τα 30-40 bpm. Η διάρκεια της επιβράδυνσης δεν υπερβαίνει τα 90 δευτερόλεπτα Μεταβλητές: Η επιβράδυνση της ΕΚΣ δεν ακολουθεί κάποιο συγκεκριµένο πρότυπο, είναι συνεπώς άτυπη/περίεργη, µε παραλλαγές και µπορεί τόσο από πλευράς µορφής όσο και από πλευράς χρονικού συσχετισµού να µεταβάλλεται σε σχέση µε τις διάφορες ωδίνες. Συνήθως πρόκειται για απότοµα «βυθίσµατα» από τη βασική γραµµή (η διάρκεια από την αρχή της επιβράδυνσης µέχρι το κατώτατο σηµείο της είναι µικρότερη από 30 δευτερόλεπτα). Η µείωση της ΕΚΣ κάτω από την βασική γραµµή είναι τουλάχιστον 15 bpm, διάρκειας τουλάχιστον 15 δευτερολέπτων (από βασική γραµµή σε βασική γραµµή) και όχι περισσότερο των 2 λεπτών [Αγοραστός 1991]. Μια δεκαετία µετά από τις οδηγίες της Παγκόσµιας Ένωσης Γυναικολόγων και Μαιευτήρων, το Αµερικανικό Συµβούλιο Μαιευτήρων και Γυναικολόγων (American College of Obstetricians and Gynecologists (ACOG)), προχώρησε µε τη σειρά του στην έκδοση µιας σειράς οδηγιών όσον αφορά την προτυποποίηση των ορισµών και των χαρακτηρισµό των διαφόρων µεγεθών της ΕΚΣ καθώς και τη χάραξη µιας σειράς κατευθύνσεων για την περαιτέρω έρευνα πάνω στο συγκεκριµένο πεδίο της παρακολούθησης της υγείας του εµβρύου µέσω της ηλεκτρονικής παρακολούθησης της ΕΚΣ [National Institute of Child Health and Human Development Research Planning Workshop, 1997]. Η τελευταία σειρά ορισµών αλλά και οδηγιών για την ερµηνεία και χρήση της ηλεκτρονικής παρακολούθησης του εµβρύου προέρχεται από το Βασιλικό Συµβούλιο των Μαιευτήρων και Γυναικολόγων [RCOG 2001] οι οποίοι και πάλι διαφοροποιούνται ελαφρώς σε σχέση µε αυτούς που 32
Καρδιοτοκογραφία προέρχονται από την Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων σχεδόν 15 χρόνια µετά την διατύπωσή τους. Γίνεται φανερό ότι µε την πάροδο των χρόνων και την απόκτηση όλο και περισσότερης γνώσης και εµπειρία στην ερµηνεία της ΕΚΣ, τόσο οι ορισµοί όσο και η αξιολόγηση των διαφόρων ευρηµάτων µεταβάλλονται. Ακόµα και σήµερα δεν υπάρχει απόλυτη ταύτιση όλων των απόψεων και είναι συνεχής η προσπάθεια τόσο για τυποποίηση όσο και για πλήρη διερεύνηση των δυνατοτήτων που παρέχει η παρακολούθηση της ΕΚΣ. Σε αυτά τα πλαίσια το Αµερικανικό Συµβούλιο Μαιευτήρων και Γυναικολόγων [National Institute of Child Health and Human Development Research Planning Workshop 1997] πέρα από τις οδηγίες σχετικά µε το χαρακτηρισµό των διάφορων «µορφολογικών» χαρακτηριστικών που ερµηνεύονται σε ένα γράφηµα ΕΚΣ προχώρησε και σε µια σειρά από οδηγίες σχετικά µε τις κατευθύνσεις στις οποίες θα έπρεπε να κινηθεί η µελλοντική έρευνα στο πεδίο της µελέτης της ΕΚΣ. 2.5.4 Ερευνητικές κατευθύνσεις στον πεδίο της καρδιοτοκογραφίας Πιο συγκεκριµένα σύµφωνα µε το Αµερικανικό Συµβούλιο Μαιευτήρων και Γυναικολόγων οι έρευνες για την ανάπτυξη συστηµάτων βασισµένων σε υπολογιστή θα πρέπει να κινηθούν, µεταξύ άλλων, και προς τις ακόλουθες κατευθύνσεις: 1) Ανάπτυξη υπολογιστικών συστηµάτων για την ανάλυση του σήµατος της ΕΚΣ µε βάση την ιατρική ορολογία (βασική γραµµή, επιβραδύνσεις κτλ), τα οποία προσδοκάται ότι θα βοηθήσουν στην τυποποίηση της (καθιέρωση ενός ενιαίου τρόπου) ερµηνείας τους. 2) ιερεύνηση διαφορετικών τρόπων απεικόνισης της ΕΚΣ (για παράδειγµα τρισδιάστατες ή τετραδιάστατες απεικονίσεις) οι οποίες να επιτρέπουν ευκολότερη αξιολόγηση της κατάστασης του εµβρύου 3) Ανάπτυξη υπολογιστικών συστηµάτων τα οποία να λειτουργούν επικουρικά παρέχοντας συµβουλές-υποδείξεις µε βάση κοινά αποδεκτές ερµηνείες της ανάλυσης της ΕΚΣ, εκπληρώνοντας εκπαιδευτικούς σκοπούς σε µια προσπάθεια δια-βίου εκπαίδευσης ειδικευοµένων γιατρών και όχι µόνο. Πρέπει να σηµειωθεί ότι στις συγκεκριµένες οδηγίες δεν υπάρχει η διατύπωση ενός κοινά αποδεκτού πρωτοκόλλου για την αντιµετώπιση του τοκετού βασιζόµενο στα «µορφολογικά» χαρακτηριστικά της ΕΚΣ. Αυτό αποδεικνύει για άλλη µια φορά πόσο δύσκολη είναι η ερµηνεία του καθώς ακόµα και οι ειδικοί δεν µπορούν να καταλήξουν σε µια κοινή γραµµή. 33
Κεφάλαιο 2 ο Επίσης το Αµερικανικό Συµβούλιο Μαιευτήρων και Γυναικολόγων προτείνει µεταξύ άλλων η προσπάθεια εύρεσης συσχετίσεων «µορφολογικών» χαρακτηριστικών µε το αποτέλεσµα του τοκετού όπως αυτό αποτιµάται τόσο µε ευρήµατα ευθύς αµέσως µετά τον τοκετό όσο και σε βάθος χρόνου [National Institute of Child Health and Human Development Research Planning Workshop, 1997]. Όσον αφορά τα ευρήµατα ευθύς αµέσως µετά τον τοκετό αυτά σχετίζονται µε το «βαθµό» της ασφυξίας κατά τη διάρκεια του τοκετού και είναι: 1) Οξεοβασική κατάσταση (κυρίως µεταβολική οξέωση). 2) Apgar score. 3) Νευρολογική εξέταση, για την παρουσία σπασµών, ανωµαλιών µυϊκού τόνου κτλ. 4) Άλλες ανωµαλίες οργάνων (καρδιά, κυκλοφοριακό, αναπνευστικό, νεφρά, συκώτι κτλ). 5) Θάνατος. Όσον αφορά τη συσχέτιση µορφολογικών χαρακτηριστικών µε µακρυπρόθεσµες συνέπειες (ανάπτυξη του νευρικού συστήµατος) αυτές θα πρέπει να πραγµατοποιούνται µετά το δεύτερο έτος της ηλικίας του παιδιού και αφορούν: 1) Εγκεφαλική παράλυση. 2) Ψυχοκινητική εξέλιξη. 3) Άλλες ανωµαλίες οργάνων. Επίσης η διεξαγωγή µελετών θα πρέπει να στοχεύει και στην εύρεση συσχετίσεων των µορφολογικών χαρακτηριστικών του σήµατος της ΕΚΣ µε πιθανούς κινδύνους και µε την εξέλιξη του τοκετού: 1) Καισαρική τοµή (ποσοστά). 2) Φυσιολογικός τοκετός (ποσοστά). 2) Τραύµα (από επέµβαση). Τέλος χρήσιµη είναι και η διερεύνηση της χρήσης συµπληρωµατικών µεθόδων και τεστ σε συνδυασµό µε την ανάλυση της ΕΚΣ για την αύξησης τόσο της ικανότητας να διακρίνονται παθολογικές καταστάσεις όσο και της ικανότητας να διακρίνονται υγιείς καταστάσεις έναντι της απλής ερµηνείας της ΕΚΣ. Σε αυτή την κατηγορία έχουµε: 1) Λήψη δείγµατος αίµατος από το έµβρυο. 2) ιέγερση. 34
Καρδιοτοκογραφία 3) Οξύµετρο. 4) Ανάλυση του ηλεκτροκαρδιογραφήµατος (και πιο συγκεκριµένα του ST τµήµατος του) 5) Άλλων πιθανών µεθόδων και µεγεθών (ροή αίµατος και µεταβολισµός, τοµογραφία µε εκποµπή ποζιτρονίων). 2.6 Υπολογιστικά συστήµατα στη µαιευτική Όπως αναφέρθηκε η εµπειρία που απαιτείται από τον γυναικολόγο/µαιευτήρα και χρήστη του καρδιοτοκογράφου είναι ιδιαίτερα µεγάλη για να µπορέσει να ερµηνεύσει και να εκτιµήσει τις πολύπλοκες αλλαγές που παρατηρεί στο σήµα που καταγράφεται και να προσδιορίσει µε ακρίβεια εάν το έµβρυο µπορεί να ανταπεξέλθει στην πίεση του τοκετού ή όχι και αναλόγως να αποφασίσει για το τι πρέπει να γίνει στη συνέχεια. Τα τελευταία χρόνια έχει ξεσπάσει δηµόσια αντιπαράθεση σε σχέση µε την αποτελεσµατικότητα της χρήσης της καρδιοτοκογραφίας [Geijn, 1996] και της συνέπειας στον τρόπο µε τον οποίο γίνεται η αξιολόγηση του καρδιοτοκογραφήµατος, ειδικά όταν έχουµε µόνο την δια γυµνού οφθαλµού αξιολόγησή του από γυναικολόγους και µαιευτήρες. Για αυτή την περίπτωση, µελέτες για την αξιοπιστία της αξιολόγησης της ΕΚΣ έδειξαν ότι η ερµηνεία ενός καρδιοτοκογραφήµατος διαφέρει από γυναικολόγο σε γυναικολόγο ενώ ακόµα και ο ίδιος γυναικολόγος µπορεί να αξιολογήσει διαφορετικά το ίδιο σήµα [MacDonald et al. 1985], [Bernardes et al. 1997], [Ayres-de-Campo et al 1999]. Είναι λοιπόν φανερό ότι αν και συγκεκριµένες οδηγίες έχουν εκδοθεί σχετικά µε τον τρόπο µε τον οποίο πρέπει να ερµηνεύεται το καρδιοτοκογράφηµα [Rooth et al. 1987], [National Institute of Child Health and Human Development Research Planning Workshop 1997], καταλυτική σηµασίας για την τελική διάγνωση παραµένει η εµπειρία του εκάστοτε γυναικολόγου. Οι δυσκολίες στην ερµηνεία και την εκτίµηση του καρδιοτοκογραφήµατος οδηγεί αρκετές φορές είτε στο να γίνονται παρεµβάσεις από το γιατρό που δεν ήταν απαραίτητες είτε στο να µην γίνεται καµία απολύτως ενέργεια ακόµη και όταν αυτό ήταν αναγκαίο. Πέρα από τις επιπτώσεις που αυτό µπορεί να έχει στην υγεία της εγκύου και του εµβρύου, οι οικονοµικές συνέπειες είναι επίσης σηµαντικές (από τις Καισαρικές τοµές που πραγµατοποιήθηκαν σε ένα πανεπιστηµιακό νοσοκοµείο, το 1/3 εξ αυτών δεν θα έπρεπε να έχουν γίνει). Σε άλλες µελέτες αναφέρεται ότι σηµαντικές είναι και οι δαπάνες για την αντιµετώπιση ασφυξίας του εµβρύου κατά τον τοκετό. 35
Κεφάλαιο 2 ο Εν γένει η αναπαραγωγή στην ερµηνεία προφανών και πιο σταθερών καρδιοτοκογραφικών συµβάντων µπορεί να θεωρηθεί ικανοποιητική. Από την άλλη µεριά η ανίχνευση λιγότερο εµφανών χαρακτηριστικών δεν παρουσιάζει ικανοποιητική δυνατότητα αναπαραγωγής. Οι παραπάνω ασυµφωνίες οφείλονται κυρίως στους παρακάτω λόγους: Ασαφείς ορισµοί των καρδιοτοκογραφικών συµβάντων υπάρχουν ακόµη και στις οδηγίες που έχουν δοθεί από την Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων. Η δυνατότητα αναπαραγωγής της εκτίµησης δια γυµνού οφθαλµού των πιο "λεπτών" καρδιοτοκογραφικών διαφοροποιήσεων όπως η µειωµένη µακροδιακύµανση, ίσως να είναι πολύ δύσκολη αν όχι αδύνατη. Η συστηµατική ερµηνεία των πολύπλοκων καρδιοτοκογραφικών συµβάντων από τους πολυάσχολους µαιευτήρες µπορεί επίσης να είναι ανέφικτη. Αυτά τα ευρήµατα κατέστησαν σαφές ότι είναι αναγκαία η ανάπτυξη αυτοµατοποιηµένων τεχνικών για την αξιόπιστη ερµηνεία της ΕΚΣ, που να παρέχουν έγκαιρες και έγκυρες προειδοποιήσεις για την κατάσταση του εµβρύου. Είναι σηµαντικό να επισηµανθεί ότι ο καρδιοτοκογράφος είναι απλά ένας καταγραφέας της ΕΚΣ και δεν µπορεί ούτε να συγκρίνει µεταξύ τους σήµατα που λήφθηκαν σε διαφορετικές χρονικές στιγµές του τοκετού, ούτε να ερµηνεύσει αλλαγές στις κυµατοµορφές αυτών των σηµάτων, ούτε να αποφασίσει για τις ενέργειες που πρέπει να γίνουν στην κάθε περίπτωση. Συνεπώς παρά τις όποιες αρνητικές απόψεις σχετικά µε την χρησιµοποίηση της καρδιοτοκογραφίας, πιστεύεται ότι το σήµα της ΕΚΣ µεταφέρει πολύ περισσότερη πληροφορία από ότι ερµηνεύεται τελικά από τον γυναικολόγο [Signorini et al 2003]. Σε µια προσπάθεια να διερευνηθούν όσο το δυνατόν καλύτερα, οι δυνατότητες που παρέχει η σύγχρονη τεχνολογία στο πεδίο της µαιευτικής, αναπτύχθηκαν αρκετά συστήµατα βασισµένα στη χρήση προσωπικών υπολογιστών που αποτελούν πλέον µια πολύ οικονοµική και αποδοτική λύση για την υλοποίηση πολύπλοκων συστηµάτων µε µικρό σχετικά κόστος. 2.6.1 Πλεονεκτήµατα υπολογιστικών συστηµάτων Σε γενικές γραµµές τα πλεονεκτήµατα που προκύπτουν από την χρήση των υπολογιστών µπορούν να συνοψιστούν στα παρακάτω: 36
Καρδιοτοκογραφία Α) Προκαθορισµένα κριτήρια τα οποία πρέπει να ικανοποιούνται, ερµηνεύονται πάντα κατά τον ίδιο τρόπο, µε αποτέλεσµα να έχουµε µια αντικειµενική "ανάγνωση" του καρδιοτοκογραφήµατος, εξαλείφοντας µε αυτό τον τρόπο τις διαφορές µεταξύ των παρατηρητών. Β) Αριθµητικά δεδοµένα/µετρήσεις της ΕΚΣ είναι διαθέσιµα και µπορούν να αποθηκευτούν σε µεγάλες βάσεις δεδοµένων. Αυτό επιτρέπει την στατιστική εκτίµηση των διαφορετικών παραµέτρων της ΕΚΣ και µια πιο εµπεριστατωµένη προσέγγιση για τον καθορισµό του τι είναι φυσιολογικό και τι όχι. Γ) Η ποιότητα των εγγραφών βελτιώνεται (ο περιορισµός που εισήγαγε η συσκευή καταγραφής πάνω στο χαρτί παύει να υφίσταται) ενώ παράλληλα µε την αύξηση της ποιότητας της καταγραφής επιτρέπεται και η ανίχνευση µικρών αλλαγών στην ΕΚΣ έτσι ώστε όταν εµφανιστούν τα πρώτα ανησυχητικά σηµάδια να µπορεί να υπάρξει µια πιο στενή παρακολούθηση του εµβρύου. ) Ο χρόνος που απαιτείται για την εξέταση του γραφήµατος µειώνεται. Ε) Μια πιο ακριβής σύγκριση και συσχέτιση ανάµεσα στο καρδιοτοκογράφηµα και σε άλλες βιολογικές µετρήσεις είναι δυνατή. ΣΤ) Τέλος τα υπολογιστικά συστήµατα µπορούν να προγραµµατιστούν έτσι ώστε να αλληλεπιδρούν µε τον µαιευτήρα και να παράγουν ένα προειδοποιητικό σήµα όταν αυτό είναι απαραίτητο. Τα περισσότερα από τα συστήµατα που έχουν αναπτυχθεί για την επεξεργασία της ΕΚΣ µερικά από οποία διατίθονται και ως εµπορικά προϊόντα- χρησιµοποιούν µεθόδους από το πεδίο της επεξεργασίας σηµάτων και ενσωµατώνουν και την γνώση που παρέχεται από κάποιο πρωτόκολλο ή από κάποιον έµπειρο γυναικολόγο/µαιευτήρα σε µια προσπάθεια να επιτύχουν ένα ικανοποιητικό επίπεδο αξιοπιστίας ώστε να λειτουργήσουν ως συστήµατα λήψης απόφασης στην µαιευτική. 2.6.2 Υπάρχοντα υπολογιστικά συστήµατα Ειδικότερα τα υπολογιστικά συστήµατα που έχουν αναπτυχθεί µέχρι σήµερα διαφέρουν σηµαντικά µεταξύ τους και έχουν δεχτεί διαφορετικές κριτικές αποδοχής από την επιστηµονική κοινότητα. Τα συστήµατα στηρίζονται σε χαµηλού κόστους προσωπικούς υπολογιστές και µπορούν να χωριστούν σε δύο βασικές κατηγορίες: σε αυτά τα οποία είναι προγραµµατισµένα ώστε να αναλύουν το σήµα της ΕΚΣ στα βασικά χαρακτηριστικά του, δηλαδή στη βασική γραµµή, σε επιβραδύνσεις και επιταχύνσεις κ.τ.λ., και τα οποία αφήνουν στον µαιευτήρα την ερµηνεία και την κατηγοριοποίηση του γραφήµατος, και σε αυτά τα οποία πραγµατοποιούν µόνα τους την κατηγοριοποίηση και την ερµηνεία χωρίς να 37
Κεφάλαιο 2 ο παρέχουν στον µαιευτήρα την πληροφορία για την ανάλυση της ΕΚΣ σε µεγέθη µε τα οποία είναι εξοικειωµένος. Πιο συγκεκριµένα κατά τις τελευταίες δύο δεκαετίες προτάθηκαν µέθοδοι και συστήµατα τα οποία ξεκινούνε από την «απλή» εξαγωγή µορφολογικών χαρακτηριστικών χρησιµοποιώντας συµβατικές προγραµµατιστικές τεχνικές [Signorini et al. 2003, Arduini et al. 1993, Mantel et al. 1990a, Mantel et al. 1990b, Mongelli et al. 1997, Taylor et al. 2000, Dawes et al. 1995, Jezewiski et al. 1993, Maeda 1990] αλλά και τεχνητά νευρωνικά δίκτυα [Ulbricht et al. 1998, Fontenla-Romero et al. 2001], µέχρι την ανάπτυξη συστηµάτων ικανών να πραγµατοποιούν διάγνωση (σε πειραµατικό ακόµα επίπεδο) [Bernardes et al. 1991, Bernardes et al. 1994, Ayres-de-Campos et al. 2000, Magenes et al. 2000, Magenes et al. 2001, Kol and Thaler 1995, Chung et al. 1995, Slamalekis et al. 2002, Struzik, and Wijngaarden 2001, Skinner et al. 1999, Ifeachor et al. 1991, Alonso-Betanzos et al. 1992, Alonso- Betanzos et al. 1995, Guijarro-Berdinas et al. 2002]. Ο καθηγητής Berrnardes και η οµάδα του [Bernardes et al. 1991, Bernardes et al. 1994, Ayres-de- Campos et al. 2000] ανέπτυξαν ένα υπολογιστικό σύστηµα το οποίο βασίζεται σε µια αλγοριθµική υλοποίηση των οδηγιών που είχε εκδώσει η Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων [Rooth et al. 1987]. Ο καθηγητής Magenes και οι συνεργάτες του [Magenes et al. 2000; Magenes et al. 2001] χρησιµοποίησαν τεχνητά νευρωνικά δίκτυα για να διαχωρίσουν παθολογικές από φυσιολογικές καταστάσεις κατά την περίοδο πριν από τον τοκετό (antepartum). Οι Kol και Thaler [Kol and Thaler 1995] επίσης χρησιµοποίησαν τεχνητά νευρωνικά δίκτυα για την ερµηνεία του λεγόµενου nonstress tests (NST). O Chung µε τους συνεργάτες του [Chung et al. 1995] ανέπτυξαν έναν αλγόριθµο για την πρόβλεψη εµβρύων µε οξέωση. Ο Σαλαµαλέκης και οι συνεργάτες του [Slamalekis et al. 2002] χρησιµοποίησαν χαρακτηριστικά που εξήγαγαν από την ΕΚΣ µε τη χρήση του διακριτού µετασχηµατισµού κυµατιδίου καθώς και πληροφορία εξαγόµενη µε την οξυµετρία σε συνδυασµό µε αυτοοργανούµενα νευρωνικά δίκτυα για τη διάγνωση της εµβρυϊκής υποξίας. Οι Struzik και Wijngaarden [Struzik and Wijngaarden, 2001] πρότειναν µια µέθοδο βασιζόµενη στην συνεχή καταγραφή του cumulative effective Hölder εκθέτη για την παρακολούθηση της κατάστασης του εµβρύου κατά τη διάρκεια του τοκετού. Ο καθηγητής Ifeachor και η οµάδα του ανάπτυξαν αρχικά ένα έµπειρο σύστηµα [Ifeachor et al. 1991], το οποίο στη συνέχεια µετέτρεψαν σε ασαφές έµπειρο σύστηµα [Skinner et al. 1999] έτσι ώστε να αντιµετωπίσουν τις εγγενείς ασάφειες που εµπεριέχονται στην ερµηνεία του σήµατος της ΕΚΣ. Τέλος στην πιο ολοκληρωµένη προσπάθεια για την ανάπτυξη ενός συστήµατος για την παρακολούθηση της κύησης η καθηγητής Alonso-Betanzos και η οµάδα της ανέπτυξαν και εξέλιξαν ένα έµπειρο σύστηµα, το NST-EXPERT [Alonso-Betanzos et al. 1992, Alonso-Betanzos et al. 1995,] έτσι ώστε να δηµιουργήσουν τελικά το CAFE (Computer Aided Foetal 38
Καρδιοτοκογραφία Evaluator) [Guijarro-Berdinas et al. 2002], το οποίο ενσωµατώνει αλγόριθµους και νευρωνικά δίκτυα χρησιµοποιώντας πληροφορίες εξαγόµενες από το σήµα της ΕΚΣ µαζί µε άλλα ιατρικά δεδοµένα προερχόµενα από άλλα ιατρικά τεστ και από τους επιβλέποντες γυναικολόγους/µαιευτήρες 2.7 Σύνοψη Σε αυτό το κεφάλαιο παρουσιάστηκε εν συντοµία το πρόβληµα την παρακολούθησης της υγείας του εµβρύου κατά τη διάρκεια της κύησης και κυρίως κατά τη διάρκεια του τοκετού. Έγινε µία σύντοµη ιστορική αναδροµή της εξέλιξης της καρδιοτοκογραφίας από την αρχική απλή ακρόαση των χτύπων τις καρδιάς µέχρι τη δηµιουργία των σύγχρονων συσκευών συνεχούς παρακολούθησης της ΕΚΣ. Παρουσιάστηκαν τα υποσυστήµατα από τα οποία αποτελείται ο σηµερινός καρδιοτοκογράφος και οι διαφορετικοί τρόποι µε τους οποίους λαµβάνεται τόσο το σήµα της ΕΚΣ όσο και το σήµα που απεικονίζει τις συσπάσεις της µήτρα. όθηκε η ιατρική ορολογία καθώς και ο τρόπος µε τον οποίο αντιµετωπίζεται το πρόβληµα της παρακολούθησης της ΕΚΣ από τον επιβλέποντα γυναικολόγο µαιευτήρα. Τέλος αναφέρθηκαν οι λόγοι οι οποίοι συνηγορούν στην προσπάθεια ανάπτυξης υπολογιστικών συστηµάτων για την ανάλυση και επεξεργασία του σήµατος της ΕΚΣ και παρουσιάστηκαν εν συντοµία, οι προσπάθειες των πρωτοπόρων στην ανάπτυξη υπολογιστικών συστηµάτων τις τελευταίες δύο δεκαετίες. 39
Κεφάλαιο 2 ο 40
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας Κεφάλαιο 3 ο Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας 3.1 Εισαγωγή O καρδιοτοκογράφος αποτελείται από δύο υποσυστήµατα. Το υποσύστηµα µε την µεγαλύτερη βαρύτητα είναι αυτό το οποίο είναι υπεύθυνο για την παρακολούθηση της ΕΚΣ και το οποίο καλείται και καρδιοταχόµετρο. Το καρδιοταχόµετρο µε τη σειρά του απαρτίζεται από 3 υποσυστήµατα. Το πρώτο σύστηµα είναι υπεύθυνο για την αναγνώριση των καρδιακών γεγονότων (cardiac events), το δεύτερο µετράει το χρονικό διάστηµα µεταξύ διαδοχικών γεγονότων και το τρίτο διαιρεί τα χρονικά διαστήµατα (µετρηµένα σε δευτερόλεπτα) δια του 60 για να δώσει µία (στιγµιαία) συχνότητα για κάθε µεσοδιάστηµα µεταξύ διαδοχικών χτύπων της καρδιάς του εµβρύου. Ο παραπάνω υπολογισµός της ΕΚΣ µπορεί να εκφραστεί από την παρακάτω µαθηµατική σχέση FHR 60 = R () t R () t 2 1 (3.1) Όπου τα R () t και 1 R () 2 t αντιστοιχούν στις χρονικές στιγµές δύο διαδοχικών R συνιστωσών. Στο Σχήµα 3.1 απεικονίζεται γραφικά η διαδικασία «µετάβασης» από το ηλεκτροκαρδιογράφηµα στην αντίστοιχη ΕΚΣ η οποία πραγµατοποιείται εντός του καρδιοτοκογράφου. Όπως φαίνεται από την εξίσωση 3.1 η ΕΚΣ συνδέεται µε µια µη γραµµική, αντίστροφη σχέση µε τη µεταβλητή από την οποία προέρχεται. Οι λόγοι για τους οποίους υιοθετήθηκε το συγκεκριµένο µέγεθος αντί της πραγµατικής µέτρησης (του χρονικού µεσοδιαστήµατος) είναι πιθανότατα ιστορικοί και αντανακλούν την απροθυµία των γιατρών να αλλάξουν από τη µονάδα µέτρησης µε την οποία είχαν εξοικειωθεί (χτύποι ανά λεπτό beats per minutes bpm) σε µία εντελώς νέα, και διαφορετική µε την έως τότε φιλοσοφία τους, όπως αυτή των δευτερόλεπτων. εν πρέπει να ξεχνάµε ότι όλες οι οδηγίες για την προτυποποίηση της ορολογίας και για την αξιολόγηση του σήµατος της ΕΚΣ που έχουν εκδοθεί µέχρι σήµερα (Παγκόσµια Ένωση Γυναικολόγων και Μαιευτήρων, Αµερικανικό Συµβούλιο Μαιευτήρων και Γυναικολόγων) χρησιµοποιούν τη σύµβαση των χτύπων ανά λεπτό (bpm) και είναι πλέον φανερό ότι σε «ιατρικό» επίπεδο αυτό είναι πολύ δύσκολο να αλλάξει. 41
Κεφάλαιο 3 ο Σχήµα 3.1: Μετατροπή των καρδιακών «συµβάντων» σε ΕΚΣ Αυτές οι µεµονωµένες καρδιακές συχνότητες κατόπιν απεικονίζονται σε µία βαθµονοµηµένη λωρίδα χαρτιού το οποίο κινείται µε σταθερή, προκαθορισµένη ταχύτητα (η συνήθης πρακτική για την Ευρώπη είναι 1 εκατοστόµετρο ανά λεπτό) όπως αυτή που φαίνεται στο Σχήµα 3.2. Σχήµα 3.2: Ένα τυπικό καρδιοτοκογράφηµα. 42
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας Παρατηρώντας την εξίσωση (3.1) θα πρέπει να σηµειωθεί ότι ο όρος «καρδιακή συχνότητα» είναι κάπως παραπλανητικός καθώς δεν πρόκειται για τον αριθµό των χτύπων που εµφανίζονται σε διάρκεια ενός λεπτού, αλλά απλά δηλώνει τον αριθµό των χτύπων ο οποίος θα παρατηρούνταν σε διάρκεια ενός λεπτού εάν το µεσοδιάστηµα R-R ήταν περιοδικό, κάτι το οποίο δεν συµβαίνει. Εποµένως ίσως µια πιο δόκιµη ορολογία θα ήταν στιγµιαία ΕΚΣ ή στιγµιαίος εµβρυϊκός καρδιακός ρυθµός. Στη διεθνή βιβλιογραφία έχει επικρατήσει ο όρος Fetal Heart Rate και στην ελληνική [Αγοραστός 1991] αντίστοιχα ο όρος εµβρυϊκή καρδιακή συχνότητα και είµαστε αναγκασµένοι να συµµορφωθούµε µε τον ευρέως αποδεκτό αυτό ορισµό. Αρκετοί ερευνητές [Signorini et al. 2003, Chaffin and Goldberg 1991] έχουν προσπαθήσει να προσδιορίσουν τις ιδιότητες και τα χαρακτηριστικά του σήµατος της ΕΚΣ και να εξετάσουν εάν είναι χαοτικό ή εάν πρόκειται για µια στοχαστική διαδικασία. Αντίστοιχα αποτελέσµατα ερευνών για την ρύθµιση της καρδιακής συχνότητας ενηλίκων έχουν καταλήξει σε αντικρουόµενα αποτελέσµατα. Από τη µια µεριά η πρώτη φορά που διατυπώθηκε η πεποίθηση ότι η χρονοσειρά των καρδιακών χτύπων είναι χαοτική ήταν από τους Goldberger και West [Goldberger and West, 1987] και στη συνέχεια άλλοι ερευνητές ακολούθησαν είτε για να την υποστηρίξουν [Poon and Merrill, 1997, Chaffin and Goldberg, 1991] είτε να την αντικρούσουν [Kanters et al. 1994, Roach and Sheldon, 1998, Teich et al. 2001]. Το ερώτηµα συνεπώς αν µπορούν να χρησιµοποιηθούν για την ανάλυση της διακύµανσης της ΕΚΣ εργαλεία τα οποία χρησιµοποιούνται για την ανάλυση µη γραµµικών συστηµάτων όπως γράφοι στο χώρο φάσεων (phase space graphs) και ανάλυση της ενσωµατωµένης διάστασης (embedding dimension), είναι ακόµα υπό έρευνα. Σε κάθε περίπτωση χρειάζεται ακόµη αρκετή προσπάθεια και εµβάθυνση πριν καταλήξουµε σε ασφαλή συµπεράσµατα. Αυτό το οποίο είναι σχεδόν βέβαιο είναι ότι, ο χρονισµός µεταξύ των χτύπων της καρδιάς συνεχώς επηρεάζεται από ένα πολύ περίπλοκο µηχανισµό ελέγχου, που έχει να κάνει τόσο µε τον συµπαθητικό τµήµα του νευρικού συστήµατος το οποίο προσπαθεί να µειώσει το διάστηµα µεταξύ των χτύπων (αύξηση της ΕΚΣ) όσο και µε το παρασυµπαθητικό τµήµα του νευρικού συστήµατος το οποίο τείνει να αυξήσει το διάστηµα µεταξύ των χτύπων (µείωση της ΕΚΣ) [Parer 1997]. 43
Κεφάλαιο 3 ο 3.2 Συνολική περιγραφή της εφαρµοζόµενη προσέγγισης Όπως αναφέρθηκε στην εισαγωγή (κεφάλαιο 1) η έρευνα που πραγµατοποιήθηκε στα πλαίσια της συγκεκριµένης διδακτορικής διατριβής αντιµετωπίζει το πρόβληµα της εκτίµησης της κατάστασης της υγείας του εµβρύου από την οπτική γωνία της αναγνώρισης προτύπων (ή ταξινόµησης προτύπων). Στα πλαίσια αυτά προχωρούµε σε µια σύντοµη επαναδιατύπωση του προβλήµατος ώστε να περιγραφεί από τη σκοπιά του µηχανικού «ξεφεύγοντας» για λίγο από την οπτική γωνία του γιατρού. Στη γενική περίπτωση το πρόβληµα της κατηγοριοποίησης/ταξινόµησης µπορεί να περιγραφεί ως εξής: Έχουµε µια σειρά από κατηγορίες/καταστάσεις (classes) στις οποίες ανήκουν τα υπό µελέτη «αντικείµενα». Τα αντικείµενα αυτά χαρακτηρίζονται από µια συγκεκριµένη αναπαράσταση (για παράδειγµα ένα σήµα ή µια εικόνα), ένα πρότυπο. Η αναπαράσταση αυτή λαµβάνεται συνήθως µε κάποια συσκευή µέτρησης (συνήθως έναν αισθητήρα) και η διάσταση της είναι στις περισσότερες περιπτώσεις αρκετά µεγάλη. Από κάθε αναπαράσταση, και αφού έχουµε αφαιρέσει, εάν και εφόσον υπάρχει το θόρυβο, εξάγουµε πληροφορία η οποία «περιγράφει» µε τη µορφή χαρακτηριστικών (features), την αρχική αναπαράσταση (συνήθως κάποιο σήµα). Αυτά τα χαρακτηριστικά τα χρησιµοποιούµε είτε αυτούσια είτε κατόπιν επεξεργασίας προκειµένου να µειώσουµε ακόµα περισσότερο τη διάστασή του διανύσµατος εισόδου έτσι ώστε εντέλει να προβούµε στην ταξινόµηση του αντικειµένου, στο οποίο αντιστοιχούν, σε µία από τις προκαθορισµένες κατηγορίες. Ένα σύστηµα επεξεργασίας, εξαγωγής χαρακτηριστικών και ταξινόµησης γενικού σκοπού φαίνεται στο Σχήµα 3.3. Σχήµα 3.3: Τα βασικά στάδια που περιλαµβάνονται στη σχεδίαση ενός συστήµατος ταξινόµησης/κατηγοριοποίησης Στην περίπτωση µας το «αντικείµενο» που εξετάζουµε είναι το έµβρυο και οι κατηγορίες αναφέρονται στην κατάσταση της υγείας του. Η συσκευή µέτρησης είναι ο καρδιοτοκογράφος και το αρχικό πρότυπο είναι το σήµα της ΕΚΣ. Από αυτό εξάγουµε µια σειρά από χαρακτηριστικά όπως η βασική γραµµή, ο αριθµός των επιβραδύνσεων, µαθηµατικά εξαγόµενα χαρακτηριστικά, κτλ. τα οποία 44
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας τα χρησιµοποιούµε για να τροφοδοτήσουµε κάποιον κατάλληλο ταξινοµητή που «αποφαίνεται» για την κατάσταση της υγείας του εµβρύου. Κατά τη διάρκεια του τοκετού η εκτίµηση της κατάστασης του εµβρύου (και της εγκύου) αποτελεί ευθύνη του γιατρού. Με βάση αυτή την εκτίµηση ο επιβλέπων γιατρός καθορίζει εάν θα επιτρέψει την κατάληξη σε φυσιολογικό τοκετό ή εάν θα επιλέξει να επέµβει (συνήθως πραγµατοποιώντας καισαρική τοµή) για την αποφυγή τυχόν επιπλοκών. Μετά το πέρας του τοκετού µία ακριβής µέτρηση η οποία απεικονίζει το µέγεθος της πίεσης που ασκήθηκε κατά τη διάρκεια του τοκετού στο έµβρυο είναι η τιµή του ph του αίµατος του εµβρύου όπως αυτή µετράται παίρνοντας δείγµα από τον οµφάλιο λώρο του. Μειωµένη τιµή του ph υποδηλώνει µειωµένη ροή οξυγόνου προς το έµβρυο κατά τη διάρκεια του τοκετού [Parer 1997]. Επανερχόµενοι στο Σχηµα 3.3, τα διάφορα στάδια που απαρτίζουν ένα σύστηµα ταξινόµησης δεν είναι εν γένει ανεξάρτητα. Τουναντίον είναι άµεσα συνδεδεµένα και ανάλογα µε τα αποτελέσµατα µπορεί να χρειαστεί να γυρίσουµε πίσω και να ξανασχεδιάσουµε τη µέθοδο που εφαρµόστηκε σε κάποιο στάδιο έτσι ώστε να αυξήσουµε την απόδοση (όπως αυτή µετράται µε κάποιο κατάλληλο κριτήριο όπως για παράδειγµα το ποσοστό σωστών ταξινοµήσεων). Επιπλέον υπάρχουν ορισµένες µέθοδοι οι οποίες συνδυάζουν κάποια στάδια όπως για παράδειγµα το στάδιο της επιλογής χαρακτηριστικών και του σχεδιασµού του ταξινοµητή µε ταυτόχρονη βελτιστοποίηση και των δύο (παράδειγµα wavelet neural network τα οποία εκπαιδεύονται µε τη χρήση του αλγορίθµου βελτιστοποίησης µε σµήνος σωµατιδίων [Georgoulas et al. 2005c]). Ένας από τους λόγους που συνήθως δεν χρησιµοποιούµε το αρχικό πρότυπο (την µέτρηση όπως τη λαµβάνουµε από τον αισθητήρα) είναι λόγω του γνωστού προβλήµατος που ονοµάζεται curse of dimensionality (η κατάρα της διάστασης) [Duda et al. 2001]. Όσο αυξάνεται η διάσταση τόσο περισσότερα παραδείγµατα χρειάζονται για να µπορούµε να εκπαιδεύσουµε τον ταξινοµητή µας ώστε να γενικεύει καλά σε παραδείγµατα που δεν χρησιµοποιήθηκαν στην εκπαίδευση. Για παράδειγµα στην περίπτωση της ΕΚΣ µια καταγραφή 5 µόνο λεπτών µε συχνότητα δειγµατοληψίας 4 Hz αντιστοιχεί σε ένα διάνυσµα µε διάσταση 1200. Εάν υπάρχει κάποια γνώση για το συγκεκριµένο πρόβληµα µπορεί να µας καθοδηγήσει στο να διαλέξουµε τα κατάλληλα χαρακτηριστικά που να είναι αντιπροσωπευτικά του προβλήµατος. Σε διαφορετική περίπτωση µια πληθώρα χαρακτηριστικών εξάγονται (που όµως σε κάθε περίπτωση είναι πολύ λιγότερα από τη διάσταση του αρχικού προτύπου) και από αυτά είτε µε κάποια µέθοδο επιλέγεται µόνο ένα µικρό µέρος, είτε µε κάποια άλλη µέθοδο χρησιµοποιούνται συνδυασµοί τους για να µειωθεί η διάσταση του διανύσµατος που θα χρησιµοποιηθεί εντέλει από τον ταξινοµητή. 45
Κεφάλαιο 3 ο Αν και η µετάβαση από τον αρχικό χώρο του προτύπου σε ένα µικρότερο χώρο των χαρακτηριστικών γίνεται µε κάποια απώλεια πληροφορίας, εντούτοις αυτό µπορεί να µην έχει αρνητική επίδραση στη διαδικασία ταξινόµησης. Αυτό οφείλεται στο γεγονός ότι συνήθως η πληροφορία που µεταφέρεται µέσω του αρχικού προτύπου µπορεί να επαναλαµβάνεται ή και ακόµα να είναι άσχετη και τελείως άχρηστη µε το συγκεκριµένο πρόβληµα ταξινόµησης µε αποτέλεσµα να δηµιουργεί ψευδείς συσχετίσεις (Heijden et al. 2004). Στα επόµενα δύο κεφάλαια θα παρουσιαστούν µε συντοµία οι µαθηµατικές περιγραφές των µεθόδων που προτάθηκαν, χρησιµοποιήθηκαν και υλοποιήθηκαν κατά τη διάρκεια της διδακτορικής διατριβής. Για την ακρίβεια θα περιγραφούν οι διάφοροι τρόποι που χρησιµοποιήθηκαν για την εξαγωγή χαρακτηριστικών, οι διαδικασίες που ακολουθήθηκαν για την επιλογή χαρακτηριστικών και µείωση της διάστασης του διανύσµατος µε το οποίο τροφοδοτείται ο ταξινοµητής και εν τέλει η δοµή των ταξινοµητών που υλοποιήθηκαν. Πριν περάσουµε όµως στην εξαγωγή των χαρακτηριστικών και στην κατηγοριοποίηση θα παραθέσουµε και ένα άλλο πρόβληµα το οποίο προσπαθήσαµε να αντιµετωπίσουµε στα πρώτα στάδια της διδακτορικής διατριβής και για το οποίο µελλοντικά ίσως θα πρέπει να το επανατοποθετήσουµε στα πλαίσια ενός ευρύτερου σχεδιασµού. Το πρόβληµα αυτό δεν είναι άλλο από την αντιµετώπιση του «θορύβου» που περιέχεται σχεδόν σε όλες τις καταγραφές της ΕΚΣ. 3.3 Το θορυβώδες σήµα της ΕΚΣ Όπως αναφέρθηκε σχεδόν σε όλες τις καταγραφές της ΕΚΣ υπάρχει θόρυβος ο οποίος εµφανίζεται µε την µορφή ακίδων, είτε µε αφύσικα απότοµες µεταβολές. Επιπλέον υπάρχει και το πρόβληµα µε ολόκληρα διαστήµατα στα οποία το σήµα µηδενίζεται. Τα προβλήµατα αυτά οφείλονται κυρίως στη µετατόπιση του δέκτη του σήµατος, η οποία δηµιουργεί αυτές τις λανθασµένες καταγραφές. Τα προβλήµατα αυτά είναι εντονότερα στην περίπτωση της υπερηχοκαρδιογραφίας αλλά είναι υπαρκτά και στην περίπτωση της ηλεκτροκαρδιογραφίας. Τα φαινόµενα αυτά γίνονται ακόµα πιο σοβαρά κατά το δεύτερο στάδιο του τοκετού όπου η ένταση της πίεσης γίνεται µεγαλύτερη τόσο για τη µητέρα όσο και για το έµβρυο. Έχει µάλιστα αναφερθεί ότι σε αυτή την περίοδο τα «χαµένα» δεδοµένα να ανέρχονται σε ένα ποσοστό της τάξης του 20% µε 40% της συνολικής καταγραφής [Struzik and Wijngaarden 2001]. Προφανώς αυτή η κατάσταση η οποία τις περισσότερες φορές δεν δηµιουργεί προβλήµατα στην ερµηνεία της ΕΚΣ από το έµπειρο προσωπικό µιας µαιευτικής κλινικής, θα µπορούσε να οδηγήσει σε λανθασµένο υπολογισµό των χαρακτηριστικών από ένα αυτοµατοποιηµένο σύστηµα. Για το λόγο 46
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας αυτό απαιτείται κάποια µέθοδος για την αφαίρεση αυτού του θορύβου. Η εξάλειψη του θορύβου και η αποµάκρυνση λανθασµένων καταγραφών σε ένα σήµα ΕΚΣ κάθε άλλο παρά εύκολη είναι. Παραδοσιακές τεχνικές κάνουν χρήση γραµµικών φίλτρων αλλά και άλλες εξελιγµένες τεχνικές και αλγόριθµοι έχουν προταθεί [Papadimitriou et al. 1997; Papadimitriou and Bezerianos 1999], οι οποίες συνδυάζουν το µετασχηµατισµό κυµατιδίου και νευρωνικά δίκτυα για το διαχωρισµό του σήµατος από το θόρυβο. Πιο συγκεκριµένα στην περίπτωση των νευρωνικών δικτύων για την εύρεση των εσφαλµένων καταγραφών η επόµενη τιµή που αντιστοιχεί στην χρονοσειρά µπορεί να προβλεφθεί και να συγκριθεί µε την πραγµατικά καταγεγραµµένη τιµή. Τιµές που αποκλίνουν σηµαντικά από την προβλεφθείσα είναι πιθανότερο να προέρχονται από εσφαλµένη µέτρηση σε σχέση µε αυτές που δεν διαφέρουν σηµαντικά από τις προβλεφθείσες. Ένα τέτοιο σύστηµα πρόβλεψης θα µπορούσε να χρησιµοποιηθεί για τη διόρθωση του σήµατος εισόδου. Αντί συνεπώς να χρησιµοποιηθούν µέσοι όροι για την αναπλήρωση των χαµένων τιµών, µπορούν να χρησιµοποιηθούν οι τιµές που προκύπτουν από την πρόβλεψη, οι οποίες είναι πιο πιθανό να ανταποκρίνονται στις πραγµατικές τιµές [Ulbricht and Dorffner 1996]. Σηµείωση: Για το σήµα που καταγράφει τις συσπάσεις της µήτρας µπορούν να χρησιµοποιηθούν πιο απλές τεχνικές όπως η χρήση κατωδιαβατών φίλτρων έτσι ώστε να αποµακρυνθεί ο υψηλής συχνότητας θόρυβος (µια και έχουµε να κάνουµε µε ένα αργά µεταβαλλόµενο σήµα). Στη συνέχεια θα παρουσιάσουµε 3 διαφορετικές προσεγγίσεις όσον αφορά το θέµα της εξάλειψης του θορύβου. Η πρώτη µπορεί να εφαρµοστεί για την «συµπλήρωση» των κενών του σήµατος. Η δεύτερη µπορεί να εφαρµοστεί µε επιτυχία µόνο στην περίπτωση που έχουµε µεµονωµένα εσφαλµένα δείγµατα (κρουστικός θόρυβος) και η τρίτη είναι γενικού σκοπού και βασίζεται σε απλή γραµµική παρεµβολή. 3.4 Μέθοδος Πρόβλεψης Σε σήµατα ΕΚΣ Με Ελλιπή εδοµένα Χρησιµοποιώντας Συνδυασµό Κανονικών Κατανοµών Όπως αναφέρθηκε στα σήµατα της ΕΚΣ υπάρχει τόσο «κρουστικός» θόρυβος όσο και διαστήµατα µε ελλιπή δεδοµένα. Για την αντιµετώπιση αυτού του προβλήµατος προτείναµε µία τεχνική βασιζόµενη στη χρήση συνδυασµού κανονικών κατανοµών [Nokas et al. 2001], ώστε να προβλέψουµε τα δείγµατα που είτε είναι προϊόν θορύβου είτε δεν είναι καν καταγεγραµµένα. Συγκεκριµένα, θεωρούµε ότι η συνάρτηση πυκνότητας πιθανότητας (probability density functionpdf) του σήµατος της ΕΚΣ είναι συνδυασµός κανονικών κατανοµών (mixture of Gaussians). Οι παράµετροι της κατανοµής (c,m,σ εξίσωση 3.2) προσδιορίζονται µε χρήση του Expectation 47
Κεφάλαιο 3 ο Maximization αλγορίθµου [Dempster et al. 1977]. Μοντέλα που χρησιµοποιούν µίξη κατανοµών έχουν χρησιµοποιηθεί µε επιτυχία στην µοντελοποίηση µη γραµµικών συστηµάτων (νευρωνικών δικτύων διανυσµάτων υποστήριξης βάσης). Γνωρίζοντας τη στατιστική του σήµατος της ΕΚΣ προβλέπουµε τα ελλιπή δεδοµένα µε τον περιορισµό ότι γειτονικά δείγµατα δεν απέχουν περισσότερο από ένα κατώφλι. 3.4.1 Ο αλγόριθµος : «Expectation-Maximization» (ΕΜ) Έστω ότι έχουµε ένα σύνολο N παρατηρήσεων από το σήµα της ΕΚΣ X={x 1,x 2, x N }. Μοντελοποιούµε την υποκείµενη πυκνότητα πιθανότητας αυτών των παρατηρήσεων µε ένα συνδυασµό κανονικών κατανοµών. Η πιθανότητα της παρατήρησης x δίδεται: όπου N είναι η κανονική κατανοµή: M p(x ) c N(x,m, σ ) Θ = (3.2) i= 1 i i i 1 1 (x m) N(x m, σ ) = exp 2 σ 2. π 2 σ 2 (3.3) Ένας πρακτικός και αποτελεσµατικός τρόπος υπολογισµού του συνόλου Θ= {c i,σ i,m i, i=1..m}, γίνεται µε τη χρήση του αλγορίθµου ΕΜ. Θεωρούµε ότι έχουµε ένα σύνολο από στοχαστικά ανεξάρτητα και οµοιόµορφα κατανεµηµένα δεδοµένα (independently and identically distributed (i.i.d.)) που υπακούουν την κατανοµή p. H πυκνότητα πιθανότητας είναι ίση µε: Ν px ( Θ ) = p(x Θ ) = L( Θ X). i= 1 i (3.4) Η συνάρτηση L(Θ X) ονοµάζεται συνάρτηση πιθανοφάνειας των παραµέτρων δοσµένων των δεδοµένων. Σκοπός είναι να βρούµε τις παραµέτρους Θ πού µεγιστοποιούν την συνάρτηση L: * Θ = arg maxl (Θ X ) Θ (3.5) Στην περίπτωση όπου η κατανοµή είναι συνδυασµός κανονικών κατανοµών, η επίλυση της παραπάνω εξίσωσης, θέτοντας την παράγωγο ίση µε το µηδέν, οδηγεί σε µη γραµµικό σύστηµα εξισώσεων. Ένας τρόπος να λυθεί η ζητούµενη εξίσωση είναι ο ΕΜ αλγόριθµος που εξασφαλίζει την 48
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας σύγκλιση σε ένα τοπικό µέγιστο. Ο αλγόριθµος είναι επαναληπτικός και οδηγεί στις εξής εξισώσεις [Kehtarnavaz and Nakamura, 1998] για τον υπολογισµό των παραµέτρων Θ={c i,σ i,m i,i=1..m}: m = N ( t + 1) k = 1 i N () t π ( θ x ) x k = 1 i k k () t π ( θ x ) i k (3.6) σ N () t 1/2 π ( θi xk)( xk mi) = N () t π ( θi xk) k = 1 ( t + 1) k = 1 i c 1 N ( t+ 1) ( t) i = π θi xk N k = 1 ( ) 2 (3.7) (3.8) όπου, π ( θ x) = cn( x θ ) () t i i i M i= 1 cn( x θ ) i i, είναι οι εκ των υστέρων πιθανότητες. Θέτοντας αρχικές τιµές από το πεδίο τιµών των δεδοµένων ο αλγόριθµος συγκλίνει µετά από λίγες επαναλήψεις. 3.4.2 Εφαρµογή του αλγορίθµου EM Ο προτεινόµενος αλγόριθµος εκτιµήθηκε χρησιµοποιώντας διαφορετικά σήµατα. Αρχικά από ένα πλήρες σήµα (2200 δείγµατα) αφαιρέσαµε ένα τµήµα 200 δειγµάτων ώστε να δηµιουργήσουµε µια τεχνητή ασυνέχεια (Σχήµα 3.4). 180 170 160 Heart Rate 150 140 130 120 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 Samples Σχήµα 3.4: Σήµα ελέγχου µε τεχνητή ασυνέχεια. 49
Κεφάλαιο 3 ο Εφαρµόσαµε στην συνέχεια τον προτεινόµενο αλγόριθµο ως εξής: Από τα 2000 δείγµατα µε χρήση του αλγορίθµου ΕΜ υπολογίζουµε τις παραµέτρους του συνδυασµού τριών κανονικών κατανοµών όπως φαίνεται στο Σχήµα 3.5. Σχήµα 3.5: Συνάρτηση πυκνότητας πιθανότητας του αρχικού σήµατος (2000 δείγµατα). Ο αλγόριθµος συγκλίνει µετά από 8 επαναλήψεις, χρησιµοποιώντας ως κριτήριο για τον τερµατισµό του την ελάχιστη µεταβολή των παραµέτρων. Στην συνέχεια δηµιουργήσαµε νέα δείγµατα, ακολουθώντας την γνωστή πλέον στατιστική του σήµατος, θέτοντας σαν περιορισµό τα γειτονικά δείγµατα να µην απέχουν περισσότερο από 3 bpm, τιµή που καθορίστηκε πειραµατικά. Σχήµα 3.6: Απεικόνιση αρχικού και εκτιµούµενου σήµατος. Στο Σχήµα 3.6 παρουσιάζεται το αρχικό σήµα µε συνεχή γραµµή, το εκτιµώµενο σήµα µε διακεκοµµένη γραµµή και το σήµα µετά από γραµµική παρεµβολή. Από το σχήµα φαίνεται ότι το εκτιµώµενο σήµα παρουσιάζει αρκετή οµοιότητα µε το αρχικό, κάτι που δεν συµβαίνει όταν απλά εφαρµόζουµε γραµµική παρεµβολή. Η µέση απόσταση (µέσο απόλυτο σφάλµα) µεταξύ του εκτιµώµενου και του πραγµατικού σήµατος βρέθηκε ίση µε 7,023 για την περίπτωση της γραµµικής 50
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας παρεµβολής και 6,772 στην περίπτωση του προτεινόµενου αλγορίθµου. Λόγω του στοχαστικού χαρακτήρα της συγκεκριµένης προσέγγισης το ίδιο πείραµα επαναλήφθηκε 20 φορές και υπολογίστηκε ο µέσος όρος της απόστασης αρχικού-εκτιµώµενου σήµατος. Το ίδιο πείραµα επαναλήφθηκε χρησιµοποιώντας αυτή την φορά την οµοιόµορφη κατανοµή όπου κάθε δείγµα είναι ισοπίθανο να συµβεί. Τα αποτελέσµατα παρουσιάζονται στον Πίνακα 3.1. Παρατηρούµε ότι ο προτεινόµενος εκτιµητής παρουσιάζει τα καλύτερα αποτελέσµατα. Αν και η γραµµική παρεµβολή δεν δίνει πολύ χειρότερα αποτελέσµατα, το σήµα που εξάγει δεν έχει οµοιότητες µε το αρχικό. Τέλος η οµοιόµορφη κατανοµή δίνει τα χειρότερα αποτελέσµατα όπως ήταν αναµενόµενο. Πίνακας 3.1. Μέσος όρος απόστασης µεταξύ εκτιµούµενου- αρχικού σήµατος για 20 επαναλήψεις. Μέθοδος Εκτίµησης Μ.Ο µέσης απόστασης Γραµµική παρεµβολή 7,023 Οµοιόµορφη Κατανοµή 9,371 Συνδυασµός κανονικών κατανοµών 6,772 Έχοντας ελέγξει την συµπεριφορά του αλγορίθµου σε µία τεχνητή ασυνέχεια, παρουσιάζουµε στην συνέχεια την εφαρµογή του αλγορίθµου σε ένα σήµα µε πραγµατικές ασυνέχειες. Το πραγµατικά ασυνεχές σήµα της ΕΚΣ εξερχόµενο από τον καρδιοτοκογράφο, παρουσιάζεται στο Σχήµα 3.7. Η συχνότητα δειγµατοληψίας ήταν 4 Hz και το σήµα περιέχει αρκετές ασυνέχειες µε τυχαίες τιµές λόγω θορύβου. Η προτεινόµενη προεπεξεργασία αποτελείται από δύο στάδια: Αρχικά εντοπίζουµε τις ασυνέχειες και απορρίπτουµε τις µη αποδεκτές τιµές χρησιµοποιώντας ένα πειραµατικά εξαγόµενο κατώφλι των 25 bpm [Bernardes et al. 1991]. Στην συνέχεια θέτουµε τις απορριπτέες τιµές µε µηδέν όπως φαίνεται στο Σχήµα 3.8. Το ανακατασκευασµένο σήµα παρουσιάζεται στο Σχήµα 3.9. Τα πειράµατα έδειξαν ότι αν και η προσέγγιση δεν χρησιµοποιεί µνήµη κατά τη δηµιουργία του µοντέλου, είναι αρκετά αποτελεσµατική και γρήγορη. Πρέπει όµως να σηµειωθεί ότι η ύπαρξη µνήµης υπεισέρχεται έµµεσα µε τη χρήση του κατωφλίου των 3 bpm µεταξύ γειτονικών δειγµάτων 51
Κεφάλαιο 3 ο Heart Rate 180 170 160 150 140 130 120 110 100 0 1000 2000 3000 4000 5000 6000 7000 8000 Samples Σχήµα 3.7: ΕΚΣ µε ελλιπή δεδοµένα. Heart Rate 180 175 170 165 160 155 150 145 140 135 130 0 1000 2000 3000 4000 5000 6000 7000 8000 Samples Σχήµα 3.8: ΕΚΣ σήµα µηδενίζοντας τις ασυνέχειες. 175 170 165 160 Heart Rate 155 150 145 140 135 130 0 1000 2000 3000 4000 5000 6000 7000 8000 Samples Σχήµα 3.9: Ανακατασκευή του σήµατος µε χρήση συνδυασµού κανονικών κατανοµών. 52
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας 3.5 Πρόβλεψη ενός εµπρόσθιου βήµατος σε σήµατα ΕΚΣ (one step ahead prediction) Το πρόβληµα της πρόβλεψης µελλοντικών τιµών µε τη χρήση τιµών από το παρελθόν εµφανίζεται σε πολλές εφαρµογές της περιοχής της ψηφιακής επεξεργασίας σήµατος και της επεξεργασίας ιατρικών δεδοµένων. Το ιδανικό σενάριο της επίλυσης του προβλήµατος είναι να βρεθεί ο ακριβής νόµος που περιγράφει το φαινόµενο ή την κρυφή διεργασία που παράγει τα δεδοµένα. Αν µπορέσει να βρεθεί αυτός ο νόµος και να µοντελοποιηθεί µε ικανοποιητικό τρόπο, π.χ. µε χρήση ενός συνόλου από διαφορικές εξισώσεις, τότε µε την επίλυση του µπορεί να επιτευχθεί πρόβλεψη των µελλοντικών τιµών χρησιµοποιώντας µόνο τιµές από το παρελθόν και µε γνώση των αρχικών συνθηκών. Παρόλα αυτά όµως η πληροφορία της δυναµικής διεργασίας που εξετάζεται συνήθως δεν είναι καλώς ορισµένη, και έτσι η πρόβλεψη δεν µπορεί να βασιστεί σε ένα αναλυτικό µοντέλο. Σε αυτές τις περιπτώσεις δοκιµάζουµε µια πιο «δυναµική» προσέγγιση και προσπαθούµε να ανακαλύψουµε µερικές ισχυρές συνθήκες κατά την παρακολούθηση της υπό εξέταση χρονοσειράς. Μια άγνωστη δυναµική διαδικασία µπορεί να περιγραφτεί από µια µη γραµµική συνάρτηση πολλών µεταβλητών: [ ] yk ( ) = F yk ( 1), yk ( 2), yk ( n) όπου y(k) (k=n, N-1,, n) µε n<<n, είναι τα δεδοµένα δείγµατα της χρονοσειράς και F είναι µια άγνωστη µη γραµµική συνάρτηση. Αυτό σηµαίνει ότι οι παρούσες και οι µελλοντικές τιµές υποτίθεται ότι ακολουθούν µια µη γραµµική συνάρτηση των n προηγούµενων τιµών. Σε µια πιο συµπαγή µορφή η πιο πάνω εξίσωση µπορεί να γραφτεί σαν: [ ] yk ( ) = F xk ( ) (3.9) (3.10) Για την πρόβλεψη των τιµών των χρονοσειρών της ΕΚΣ δοκιµάστηκαν, γραµµικές και µη γραµµικές τεχνικές που συνίστανται από απλά Αυτοτροφοδοτούµενα (auto-regressive) µοντέλα (AR), µέχρι τρεις τύπους νευρωνικών δικτύων που µπορούν να χρησιµοποιηθούν σαν προσοµοιωτές µη γραµµικών συναρτήσεων, και συγκεκριµένα το Πολυεπίπεδο ίκτυο Perceptron (Multilayer perceptron), το νευρωνικό δίκτυο Ακτινικών Συναρτήσεων Βάσης (Radial Basis Function neural network) και το Ανατροφοδοτούµενο ίκτυο τύπου Elman [Haykin 1999, Elman 1990]. 53
Κεφάλαιο 3 ο 3.5.1 Το αυτοτροφοδοτούµενο µοντέλο (AR model) Στην πιο απλή περίπτωση, η άγνωστη συνάρτηση F (εξίσωση 3.9) µπορεί να θεωρηθεί γραµµική. Σε αυτή την περίπτωση µπορεί να χρησιµοποιηθεί το AR µοντέλο στο οποίο η προβλεπόµενη τιµή του επόµενου βήµατος µπορεί να υπολογιστεί από τον γραµµικό συνδυασµό ενός σταθερού αριθµού n προηγούµενων τιµών της χρονοσειράς [Haykin 2002]: n yk ( ) = ayk ( i) i= 1 i (3.11) Για το αυτοτροφοδοτούµενο γραµµικό µοντέλο το πρόβληµα της πρόβλεψης απλοποιείται στην εκτίµηση των παραµέτρων α i του µοντέλου. Αυτό το µοντέλο δίνει πολύ καλά αποτελέσµατα µόνο στην περίπτωση που η δυναµική διαδικασία είναι γραµµική ή µερικώς γραµµική (κατά τµήµατα). Στο Σχήµα 3.10 παρουσιάζεται ένα δίκτυο εµπρόσθιας πρόβλεψης που αποτελείται από ένα φίλτρο µε M όρους w f,1,w f,2,,w f,m και µε εισόδους u(n-1), u(n-2),,u(n-m). Η τιµή που υπολογίζεται από την πρόβλεψη δίνεται από την εξίσωση 3.12: M un ( ) = w un ( k) k = 1 f, k (3.12) Σχήµα 3.10: Πρόβλεψη επόµενης τιµής µέσω του αυτοτροφοδοτούµενου µοντέλου Για αυτή την περίπτωση, η επιθυµητή έξοδος d(n) ισούται µε u(n), και αντιπροσωπεύει το πραγµατικό δείγµα της διαδικασίας την χρονική στιγµή n. 54
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας Το σφάλµα εµπρόσθιας διάδοσης ισούται µε την διαφορά µεταξύ του δείγµατος εισόδου u(n) και της προβλεπόµενης τιµής un ( ). Αν θεωρήσουµε το σφάλµα αυτό ως f M (n) µπορεί να γραφεί ότι: f ( n) = u( n) u ( n) M (3.13) Ο δείκτης M στο σύµβολο του σφάλµατος δηλώνει την τάξη του µοντέλου, και ορίζεται σαν ο αριθµός των στοιχείων καθυστέρησης (taps) που απαιτούνται για την αποθήκευση των δειγµάτων εισόδου που χρειάζονται για την πρόβλεψη. Το ελάχιστο τετραγωνικό σφάλµα δίνεται από την: 2 P ( ) M = E fm n (3.14) Οι εξισώσεις εκτίµησης των w f,1,w f,2,,w f,m υπολογίζονται µε ελαχιστοποίηση του σφάλµατος πρόβλεψης µε χρήση της µεθόδου ελαχίστων τετραγώνων. 3.5.2 Μη Γραµµική Πρόβλεψη Με Την Βοήθεια Νευρωνικών ικτύων Το κύριο πλεονέκτηµα των νευρωνικών δικτύων είναι ότι επιτρέπουν την προσέγγιση οποιασδήποτε µη γραµµικής συνεχούς συνάρτησης (Haykin 1999). Το νευρωνικό δίκτυο εκπαιδεύεται χρησιµοποιώντας όλα τα διαθέσιµα δείγµατα (παραδείγµατα) από προηγούµενες τιµές για να βρεθούν οι µη γραµµικές συναρτήσεις που περιγράφουν το µοντέλο. Στις περιπτώσεις που είναι διαθέσιµα πολλά δεδοµένα, αυτά µπορούν να χωριστούν σε δύο οµάδες, µία για την εκπαίδευση και µία για την αξιολόγηση του δικτύου. Στη συνέχεια δίνεται µία σύντοµη περιγραφή των τριών τύπων νευρωνικών δικτύων που χρησιµοποιήθηκαν. Περισσότερες πληροφορίες όσον αφορά το πολιεπίπεδο δίκτυο perceptron και τα δίκτυα ακτινικών συναρτήσεων βάσης παρέχονται στο κεφάλαιο 5. 3.5.2.1 Πολυεπίπεδα ίκτυα Perceptron Το Πολυεπίπεδο ίκτυο Perceptron είναι το πιο συχνά χρησιµοποιούµενο νευρωνικό δίκτυο για την πρόβλεψη µελλοντικών τιµών. Τα δείγµατα της χρονοσειράς εισάγονται στο δίκτυο στο επίπεδο εισόδου. Οι νευρώνες του κρυφού επιπέδου έχουν ως ρόλο να υπολογίζουν το σταθµισµένο άθροισµα των εισόδων και των µη γραµµικών µετασχηµατισµών που γίνονται από τις σιγµοειδής συναρτήσεις. Το επίπεδο εξόδου υπολογίζει την εκτιµούµενη τιµή της χρονοσειράς y ως: h n yk ( ) = w+ wψ w yk ( i) + w 0 j j ji j0 j= 1 i= 1 (3.15) 55
Κεφάλαιο 3 ο όπου Ψ είναι η σιγµοειδής συνάρτηση των νευρώνων του κρυφού επιπέδου. 3.5.2.2 ίκτυα ακτινικών συναρτήσεων βάσης Ένα διαφορετικό µοντέλο για την πρόβλεψη χρονοσειρών που εξετάστηκε και εφαρµόστηκε είναι αυτό που στηρίζεται στα νευρωνικά δίκτυα Ακτινικών Συναρτήσεων Βάσης (Radial Basis Function Neural Network). Ένα τέτοιο δίκτυο µπορεί να προσεγγίσει µια πολυδιάστατη συνάρτηση χρησιµοποιώντας γραµµικό συνδυασµό συναρτήσεων οι οποίες παίρνουν σαν είσοδο την απόσταση r = i x c i µεταξύ του διανύσµατος εισόδου x και κατάλληλα επιλεγµένων κέντρων i c. Για την προσέγγιση της µη γραµµικής συνάρτησης χρησιµοποιήθηκε ένα άθροισµα µη γραµµικών συναρτήσεων βάσης {f i (x)}: h F( x) = wi fi( x) i= 1 (3.16) Τα δίκτυα αυτά παρέχουν ένα πολύ αποδοτικό τρόπο για την προσέγγιση πολυδιάστατων συναρτήσεων. Στην προσέγγιση µας η ακτινική συνάρτηση που χρησιµοποιήθηκε ήταν τύπου γκαουσιανής συνάρτησης, που δίνεται από την σχέση: r f() r exp σ 2 = 2 (3.17) 3.5.2.3 Το νευρωνικό δίκτυο τύπου Elman Γενικά, το νευρωνικό δίκτυο θα πρέπει να έχει µνήµη για να µπορέσει να χρησιµοποιήσει µε αποδοτικό τρόπο όλη την πληροφορία που περιέχει µια χρονοσειρά. Προς αυτή την κατεύθυνση υπάρχουν δύο τρόποι για να µπει η µνήµη σε νευρωνικά δίκτυα [Haykin 1999]. Ο πρώτος είναι να εισάγουµε χρονικές καθυστερήσεις στο δίκτυο και να υπολογίσουµε τις παραµέτρους κατά την διάρκεια της εκπαίδευσης ενώ οι τιµές εξόδου δεν επανεισάγονται στο δίκτυο. Ο δεύτερος τρόπος είναι να χρησιµοποιηθεί ανάδραση και έτσι να µετατραπεί το δίκτυο σε ανατροφοδοτούµενο δίκτυο. Σε µια τέτοια κατηγορία δικτύων ανήκει και το δίκτυο τύπου Elman [Elman 1990]. Η διαφορά του µε τους προηγούµενους τύπους δικτύων συνίσταται στο ότι η µνήµη του δεν έχει κάποιο όριο και έτσι η πληροφορία που αφορά στα δεδοµένα των προηγούµενων χρονικών στιγµών διατηρείται. Η δοµή του δικτύου αυτού που χρησιµοποιήθηκε παρουσιάζεται στο Σχήµα 3.11. 56
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας Output Layer Hidden Layer... z -1... z -1 z -1 Input Layer... Σχήµα 3.11: Το νευρωνικό δίκτυο τύπου Elman 3.5.2.4 Πειράµατα και Αποτελέσµατα Για την εκτέλεση των πειραµάτων χρησιµοποιήθηκαν 20 σήµατα ΕΚΣ µε διάφορα µήκη. Τα σήµατα αυτά προήρθαν από την Γυναικολογική και Μαιευτική κλινική του Πανεπιστηµιακού Νοσοκοµείου του Ρίου µε τη χρήση ενός συστήµατος λήψης δεδοµένων που αναπτύξαµε (ΠΑΡΑΡΤΗΜΑ). Ο καρδιοτοκογράφος από τον οποίο συλλέχθηκαν τα δεδοµένα ήταν ο BD 4000 της Huntleigh και χρησιµοποιούσε την υπερηχοκαρδιογραφία για την καταγραφή της ΕΚΣ. Όλα τα δείγµατα προέρχονταν από την περίοδο πριν τον τοκετού. Για την διαδικασία της εκπαίδευσης επιλέχθηκαν τα µισά δείγµατα από όλα τα σήµατα ΕΚΣ, ενώ για την διαδικασία της εκτίµησης του σφάλµατος χρησιµοποιήθηκαν τα υπόλοιπα. Οι τιµές των σηµάτων της ΕΚΣ βρίσκονται στο εύρος από 0-180 και προκειµένου να εισαχθούν στο νευρωνικό δίκτυο µετασχηµατίστηκαν έτσι ώστε να βρίσκονται στο εύρος 0-1. Πειράµατα εξοµοίωσης πραγµατοποιήθηκαν: α) µε ένα Πολυεπίπεδο ίκτυο Perceptron το οποίο είχε ένα κρυφό επίπεδο που περιλαµβάνει προοδευτικά από 5 µέχρι 20 νευρώνες και µια µη γραµµική έξοδο, b) ένα νευρωνικό δίκτυο Ακτινικών Συναρτήσεων Βάσης για το οποίο εξετάστηκαν διάφορες τοπολογίες επίσης από 5 µέχρι 20 κρυφούς νευρώνες c) ένα δίκτυο Elman µε µια γραµµική έξοδο και από 5 µέχρι 20 κρυφούς νευρώνες και d) ένα γραµµικό αυτοτροφοδοτούµενο µοντέλο του οποίου ο αριθµός M των όρων επιλέχθηκε και δοκιµάστηκε προοδευτικά από 5 µέχρι 20. Για όλες τις παραπάνω περιπτώσεις ο αριθµός των δειγµάτων που εισάγονται στα νευρωνικά δίκτυα επιλέχθηκε από 1 µέχρι 10 µε σκοπό την εύρεση της καταλληλότερης τοπολογίας. Έτσι είναι 57
Κεφάλαιο 3 ο προφανές ότι δοκιµάστηκαν εκτενώς πολλές και διαφορετικές τοπολογίες δικτύων πρόβλεψης µε διαφορετικό αριθµό νευρώνων τόσο στο επίπεδο εισόδου, όσο και στο κρυφό επίπεδο για να βρεθεί η καταλληλότερη που ταιριάζει στο µοντέλο των δεδοµένων. Για την αξιολόγηση των παραπάνω δικτύων χρησιµοποιήθηκε το κανονικοποιηµένο µέσο τετραγωνικό σφάλµα που δηλώνει την απόδοση κάθε δικτύου (Normalised Mean Square Error (NMSE)). Στην εξίσωση 3.18 σ 2 είναι η διασπορά των επιθυµητών τιµών της εξόδου d i και N είναι ο αριθµός των παραδειγµάτων. N 1 2 Nσ i = 1 NMSE = x d ( ) 2 (3.18) i i Στον πίνακα 3.2 παρουσιάζουµε τις αρχιτεκτονικές που έδωσαν τα καλύτερα αποτελέσµατα στην πρόβλεψη για όλους τους τύπους δικτύων και εµφάνισαν το µικρότερο σφάλµα (NMSE) για τα δεδοµένα της αξιολόγησης (και το αντίστοιχο σφάλµα εκπαίδευσης). Πίνακας 3.2 Τα αποτελέσµατα της πρόβλεψης των σηµάτων της ΕΚΣ ΜΟΝΤΕΛΟ ΕΙΣΟ ΟΙ ΚΡΥΦΟΙ NMSE (ΕΚΠΑΙ ΕΥΣΗΣ) NMSE (ΑΞΙΟΛΟΓΗΣΗΣ) Γραµµικό Αυτοτροφοδοτούµενο 8-0.012 0.017 Πολυεπίπεδο Perceptron 5 8 0.0085 0.0094 Ακτινικών Συναρτήσεων 5 5 0.0071 0.0078 Elman 5 6 0.0072 0.0075 Μια απεικόνιση ενός πραγµατικού και ενός προβλεπόµενου σήµατος ΕΚΣ παρουσιάζεται στο Σχήµα 3.12 58
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας 175 170 165 160 155 150 145 140 135 130 1 101 201 301 401 501 601 701 801 901 1001 1101 1201 1301 1401 1501 Σχήµα 3.12: Απεικόνιση ενός πραγµατικού και του εκτιµούµενου σήµατος της ΕΚΣ (Με έντονο το πραγµατικό και µε διακεκοµµένο το εκτιµούµενο) Η παραπάνω προσέγγιση είναι χρήσιµη στην περίπτωση που έχουµε µεµονωµένες λανθασµένες καταγραφές. ηλαδή µεµονωµένες «ακίδες» (spikes) µια και η όλη διαδικασία πραγµατοποιεί πρόβλεψη ενός βήµατος. Σε περίπτωση που έχουµε περισσότερα «αλλοιωµένα» δείγµατα ή περιοχές µε αρκετά ελλιπή δεδοµένα, η απόδοση πέφτει δραµατικά. Συνεπώς απαιτείται µια πιο εκτεταµένη έρευνα για να γίνει πιο αποδοτική η πιο πάνω προσέγγιση. 3.6 Αφαίρεση θορύβου µε γραµµική παρεµβολή Οι προαναφερθέντες µέθοδοι «διόρθωσης» του σήµατος της ΕΚΣ, αν και αρκετά υποσχόµενες δεν έχουν βρει ακόµα ευρεία αποδοχή και για την ώρα είναι σε ερευνητικό στάδιο. Η µέθοδος η οποία έχει επικρατήσει µέχρι στιγµής, προβλέπει την αφαίρεση του τµήµατος που προέρχεται από την επίδραση θορύβου, και τη χρήση γραµµικής παρεµβολής για την «αποκατάσταση» του συγκεκριµένου τµήµατος. Η ίδια λογική εφαρµόζεται και στην περίπτωση τµηµάτων που το σήµα «χάνεται-µηδενίζεται». Σύµφωνα µε αυτό τον αλγόριθµο, αρχικά ανιχνεύεται ένα «σταθερό» κοµµάτι της ΕΚΣ το οποίο ορίζεται ως ένα τµήµα στο οποίο η διαφορά µεταξύ 5 γειτονικών δειγµάτων είναι µικρότερη από 10. Κατόπιν όταν ανιχνευθεί διαφορά µεγαλύτερη των 25 bpm ανάµεσα σε δύο γειτονικά δείγµατα, τότε πραγµατοποιείται γραµµική παρεµβολή ανάµεσα στο πρώτο από τα 2 αυτά δείγµατα και το πρώτο δείγµα ενός νέου «σταθερού» τµήµατος της ΕΚΣ. Ο αλγόριθµος αυτός προτάθηκε αρχικά από τον καθηγητή Bernardes [Bernardes et al. 1991]. Το συγκεκριµένο αλγόριθµο χρησιµοποιήσαµε ως 59
Κεφάλαιο 3 ο στάδιο προεπεξεργασίας σε όλα τα πειράµατά που παρουσιάζονται στο κεφάλαιο 6. Ένα παράδειγµα της εφαρµογής αυτού του αλγορίθµου φαίνεται στο Σχήµα 3.13. Σχήµα 3.13: Σήµα ΕΚΣ πριν και µετά την αφαίρεση του θορύβου. Αν και ο αλγόριθµος αυτός που χρησιµοποιεί γραµµική παρεµβολή δεν είναι τόσο αποδοτικός συγκρινόµενος µε τον αλγόριθµο που χρησιµοποιεί την µοντελοποίηση µε συνδυασµό κανονικών κατανοµών (που παρουσιάσαµε σε προηγούµενη ενότητα), εντούτοις προτιµάται λόγω της απλότητάς του και της ευκολίας στην εφαρµογή του. Αποτελεί όπως αναφέρθηκε τον πιο συχνά απαντόµενο αλγόριθµο στη βιβλιογραφία. Επίσης πολλοί ερευνητές δεν λαµβάνουν καν µέριµνα για την αντιµετώπιση αλγοριθµικά της ύπαρξης θορύβου στις καταγραφές της ΕΚΣ και προβαίνουν σε ολική αφαίρεση «µε το χέρι» των σηµάτων που παρουσιάζουν καταγραφές µε θόρυβο. 3.7 Σύνοψη Σε αυτό το κεφάλαιο αναλύσαµε και παρουσιάσαµε το σήµα της ΕΚΣ µε µια προσέγγιση πιο κοντά σε αυτή του µηχανικού. ιατυπώσαµε τη γενική προσέγγιση µε την οποία αντιµετωπίσαµε το πρόβληµα της ανάλυσης και επεξεργασίας της ΕΚΣ υιοθετώντας την οπτική της ανάλυσης προτύπων. Παρουσιάσαµε τρεις µεθόδους για την αντιµετώπιση του θορύβου που συναντάµε σχεδόν σε όλες τις καταγραφές της ΕΚΣ. Πιο συγκεκριµένα παρουσιάσαµε µία µέθοδο η οποία κάνει χρήση συνδυασµού κανονικών κατανοµών για την µοντελοποίηση του σήµατος της ΕΚΣ και η οποία µπορεί να χρησιµοποιηθεί για την πλήρωση κενών διαστηµάτων κατά την καταγραφή του σήµατος καθώς και µία µέθοδο βασιζόµενη σε νευρωνικά δίκτυα για την πρόβλεψη της επόµενης τιµής του σήµατος της 60
Το σήµα της ΕΚΣ. Ιδιότητες, χαρακτηριστικά και µέθοδοι προεπεξεργασίας ΕΚΣ βασιζόµενοι σε παλιότερες τιµές. Οι δύο αυτές µέθοδοι είναι ακόµα σε πειραµατικό στάδιο. Η τρίτη µέθοδος που περιγράφτηκε κάνει χρήση ενός απλού αλγορίθµου που βασίζεται σε γραµµική παρεµβολή και αποτελεί τη µέθοδο που χρησιµοποιήσαµε σε όλα τα πειράµατα τα οποία παρουσιάζονται στο 6 ο κεφάλαιο της παρούσας διατριβής ως αναπόσπαστο κοµµάτι της προεπεξεργασίας του σήµατος της ΕΚΣ. 61
Κεφάλαιο 3 ο 62
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Κεφάλαιο 4 ο Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ 4.1 Εισαγωγή Στο κεφάλαιο αυτό θα περιγραφούν οι µέθοδοι και οι τεχνικές που χρησιµοποιήθηκαν για την εύρεση και εξαγωγή αντιπροσωπευτικών χαρακτηριστικών της ΕΚΣ, προκειµένου να επιτευχθεί η ταξινόµηση της ανάλογα µε τον βαθµό οξυγόνωσης του εµβρύου. Τα εξαγόµενα χαρακτηριστικά της ΕΚΣ χρησιµοποιούνται σε συνδυασµό µε κάποιον από τους ταξινοµητές που περιγράφονται στο επόµενο κεφάλαιο (κεφάλαιο 5) για την επίτευξη της διάγνωσης. Σε αυτό το κεφάλαιο θα επικεντρωθούµε δηλαδή στο δεύτερο και τρίτο µπλοκ του γενικού µοντέλου ταξινόµησης που περιγράφτηκε στο κεφάλαιο 3 (Σχήµα 4.1). Σχήµα 4.1: Το µοντέλο ταξινόµησης γενικού σκοπού Εκτός από την εξαγωγή των χαρακτηριστικών σε ένα σύστηµα ταξινόµησης σηµαντικό ρόλο έχει το µέγεθος του διανύσµατος των χαρακτηριστικών (δηλαδή ο συνολικός αριθµός χαρακτηριστικών/παραµέτρων) το οποίο συνήθως απαιτείται να είναι σχετικά µικρό. Προκειµένου να να επέµβουµε στη διάσταση του διανύσµατος των χαρακτηριστικών χρησιµοποιήσαµε 2 προσεγγίσεις a) την ανάλυση σε πρωταρχικές συνιστώσες (Principal Component Analysis (PCA)) και b) τη χρήση εξελικτικής γραµµατικής (Grammatical evolution), τις οποίες επίσης παρουσιάζουµε στο παρόν κεφάλαιο. Το κεφάλαιο κλείνει µε τη περιγραφή της µεθόδου δηµιουργίας συνθετικών παραδειγµάτων µε υπερδειγµατοληψία της µειοψηφούσας κατηγορίας (Synthetic Minority Over-sampling Technique (SMOTE)) που χρησιµοποιήσαµε στις τελευταίες µεθοδολογίες για την αντιµετώπιση του προβλήµατος που προκύπτει εξαιτίας της ανισοµερούς κατανοµής των δεδοµένων µεταξύ των 2 κατηγοριών (υγιή - σε κίνδυνο). 63
Κεφάλαιο 4 ο Αξίζει πάντως να σηµειωθεί ότι η επιλογή των χαρακτηριστικών τα οποία περιέχουν αντιπροσωπευτική πληροφορία για ένα σήµα ή σύστηµα, µπορεί να λογιστεί περισσότερο ως τέχνη παρά ως επιστήµη και ως εκ τούτου βελτιώνεται µε τον πειραµατισµό και την εµπειρία [Sa 2001]. 4.2 Εξαγωγή χαρακτηριστικών µε συµβατικές µεθόδους Για το πρόβληµα κατηγοριοποίησης που εξετάζουµε η µέτρηση/πρότυπο την οποία διαθέτουµε είναι ένα σήµα στο χρόνο (µια χρονοσειρά) και συγκεκριµένα το σήµα της ΕΚΣ. Εποµένως µπορούµε να χρησιµοποιήσουµε «εργαλεία» από την περιοχή της ανάλυσης σήµατος για την εξαγωγή χαρακτηριστικών τόσο στο πεδίο του χρόνου όσο και στο πεδίο της συχνότητας. Βέβαια όπως αναφέρθηκε προηγουµένως, η αρχική επιλογή των χαρακτηριστικών είναι περισσότερο «τέχνη» η οποία βελτιώνεται µε την εµπειρία και τον πειραµατισµό. Για το λόγο αυτό προσπαθήσαµε να συνδυάσουµε τόσο την εµπειρία όσο και την πειραµατική διαίσθηση για την εξαγωγή ενός συνόλου χαρακτηριστικών/παραµέτρων ικανών να διαχωρίσουν τα αντικείµενα (έµβρυα) στις ζητούµενες δύο κατηγορίες. Θα πρέπει να αναφερθεί ότι όταν µιλάµε για εµπειρία εννοούµε τη γνώση που προέρχεται από τις προγενέστερες έρευνες άλλων οµάδων που ασχολήθηκαν µε το συγκεκριµένο ή παραπλήσια θέµατα που αφορούν την υγεία και την κατάσταση του εµβρύου (τα αποτελέσµατα των οποίων έχουν δηµοσιευθεί σε διεθνή περιοδικά και συνέδρια) καθώς και την ιατρική εµπειρία όπως αυτή αποτυπώνεται µέσω των διαφόρων οδηγιών που έχουν εκδοθεί κατά καιρούς [Rooth et al. 1987, [National Institute of Child Health and Human Development Research Planning Workshop, 1997] και απαντώνται στα εγχειρίδια καρδιοτοκογραφίας [Αγοραστός 1991; Parer 1997). Επιπρόσθετα στη διεθνή βιβλιογραφία έχουν προταθεί µια σειρά µεθόδων οι οποίες χρησιµοποιούνται για να ποσοτικοποιήσουν τις µεταβολές στην καρδιακή συχνότητα ενηλίκων [Task Force of the European Society of Cardiology and the North American Society of Pacing and Electrophysiology, 1996]. Με βάση τα παραπάνω προτείναµε νέες µεθόδους για την εξαγωγή διαφορετικών τύπων και οµάδων χαρακτηριστικών, χρησιµοποιώντας διάφορες προσεγγίσεις και διαφορετικές µεθόδους ανάλυσης του σήµατος της ΕΚΣ. Στις υποενότητες που ακολουθούν θα παρουσιασθούν συστηµατικά όλες οι µέθοδοι που προτάθηκαν και χρησιµοποιήθηκαν για να εξαχθούν τα χαρακτηριστικά µε τα οποία πειραµατιστήκαµε στα πλαίσια αυτής της διδακτορικής διατριβής καθώς και µια µικρή µαθηµατική εισαγωγή της κάθε µεθόδου που υλοποιεί την αντίστοιχη ανάλυση. 64
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ 4.2.1 Χαρακτηριστικά στο πεδίο του χρόνου Τα χαρακτηριστικά/δείκτες που εξαγάγαµε στο πεδίο του χρόνου έχουν ήδη χρησιµοποιηθεί µε αρκετή επιτυχία για να χαρακτηρίσουν την κατάσταση του εµβρύου κατά την περίοδο πριν από τον τοκετό [Magenes et al. 2000, 2001] και ως εκ τούτου ήταν φυσικό να πειραµατιστούµε και για τη χρήση και εφαρµογή τους για την περίοδο κατά τον τοκετό. Θα πρέπει να επισηµάνουµε ότι για τον υπολογισµό των παρακάτω µαθηµατικών µεγεθών τα οποία χρησιµοποιήσαµε ως χαρακτηριστικά αναφερόµαστε σε ένα σήµα το οποίο δειγµατοληπτείται ανά 0.25 δευτερόλεπτα (συχνότητα δειγµατοληψίας 4 Hz). Πιο συγκεκριµένα τα χαρακτηριστικά τα οποία υπολογίσαµε και χρησιµοποιήσαµε είναι τα παρακάτω (µε FHR ( i ) το i-οστό δείγµα του σήµατος της ΕΚΣ): 1 N Μέση τιµή του σήµατος της ΕΚΣ mean = FHR() i, N i = 1 N 1 Τυπική απόκλιση του σήµατος της ΕΚΣ std = FHR() i mean, 1 N i= 1 ( ) 2 Ο δείκτης Delta= m max ( FHR() i ) min ( FHR() i ) i ( k 1) 240+ 1, k 240 i ( k 1) 240+ 1, k 240 k=1 m όπου m είναι η χρονική διάρκεια του υπό εξέταση τµήµατος (σε λεπτά). Ο δείκτης αυτός δείχνει κατά κάποιο τρόπο τη µέση τιµή της µακροδιακύµανσης της ΕΚΣ. Ο δείκτης, 24 = STV = i 1 sfhr i ( + 1) sfhr( i) 24 (ο οποίος προέρχεται από τα αρχικά των λέξεων Short Term Variability (µικροδιακύµανση)) όπου sfhr( i ) είναι µία νέα χρονοσειρά η οποία προκύπτει από το σήµα της ΕΚΣ δειγµατοληπτώντας το κάθε 2.5 δευτερόλεπτα (δηλαδή παίρνοντας ένα δείγµα κάθε 10 δείγµατα του αρχικού σήµατος ( 10 1 1) ( ) ( ) sfhr i = FHR i + ), (στην ουσία πρόκειται για µείωση της συχνότητας δειγµατοληψίας κατά ένα παράγοντα 10) STV Ο δείκτης, II =, std sfhr() i [ ] από τα αρχικά των λέξεων Interval Index είκτης διαστήµατος 65
Κεφάλαιο 4 ο Ο δείκτης µακροχρόνιας µη-κανονικότητας (Long Term Irregularity) ( LTI ) ο οποίος ορίζεται ως το διάστηµα µεταξύ των τεταρτηµορίων (interquartile range) µε m() i FHR 2 () i FHR 2 ( i 1) 1 3, 4 4 της κατανοµής mi () = + + και οποίος αποτελεί ένα µέσο εκτίµησης της µακροδιακύµασνης [Arduini et al. 1993], Ο δείκτης Delta_total=max FHR ( i) ( ) min ( FHR ( i) ) i [1, N] i [1, N] ο οποίος υπολογίζει το εύρος τιµών εντός του οποίου κινείται η ΕΚΣ. Συγκεντρωτικά µπορούµε να γράψουµε το σύνολο των χαρακτηριστικών που εξάγουµε στο πεδίο του χρόνου ως εξής: Tdset :{ mean, std, Delta, STV, II, LTI, Delta _ total } 4.2.2 Χαρακτηριστικά στο πεδίο της συχνότητας Αρκετές µέθοδοι και προσεγγίσεις έχουν εφαρµοστεί στο πεδίο της συχνότητας για την ανάλυση της καρδιακής συχνότητας ενηλίκων [Task Force of the European Society of Cardiology and the North American Society of Pacing and Electrophysiology 1996]. Παρόλα αυτά στην περίπτωση της ΕΚΣ, δεν υπάρχει µια καθολικά αποδεκτή και προτυποποιηµένη χρήση των διάφορων περιοχών συχνοτήτων του σήµατος. Σε αυτή τη διδακτορική διατριβή χρησιµοποιήσαµε 3 διαφορετικούς διαχωρισµούς του εύρους συχνοτήτων. Οι 3 διαφορετικοί διαχωρισµοί (τα 3 διαφορετικά «µοιράσµατα» του εύρους/µπάντας των συχνοτήτων) και τα αντίστοιχα χαρακτηριστικά περιγράφονται παρακάτω. ΙΑΧΩΡΙΣΜΟΣ Ι: Χωρίσαµε το εύρος των συχνοτήτων σε 3 διαστήµατα [Sibony et al. 1994] και υπολογίσαµε την ενέργεια που περιέχεται σε κάθε ένα από αυτά. Τα (3) τρία χαρακτηριστικά που προκύπτουν είναι τα ακόλουθα: η ενέργεια στο τµήµα που περιλαµβάνει τις πολύ χαµηλές συχνότητες (Very Low Frequency band (VLF)) 0-0.05 Hz, η ενέργεια στο τµήµα χαµηλών συχνοτήτων (Low Frequency band (LF)) 0.05-0.15 Hz (σε αυτό το τµήµα περιλαµβάνονται σχηµατισµοί οι οποίοι αναφέρονται και ως κύµατα Mayer [Sibony et al. 1994] - και 66
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ η ενέργεια στο τµήµα υψηλών συχνοτήτων (High Frequency band (HF)) 0.15-0.5 Hz, το οποίο αντικατοπτρίζει στις κινήσεις του εµβρύου [Sibony et al. 1994]. Με βάση τον παραπάνω διαχωρισµό υπολογίσαµε και ένα τέταρτο χαρακτηριστικό το λόγο των ενεργειών των ζωνών LF, HF LF / HF που αποτελεί µία τυπική ποσότητα η οποία χρησιµοποιείται στην περίπτωση ενηλίκων και η οποία πιστεύεται ότι εκφράζει την ισορροπία µεταξύ των δύο τµηµάτων του αυτόνοµου νευρικού συστήµατος (συµπαθητικό-παρασυµπαθητικό) [Task Force of the European Society of Cardiology and the North American Society of Pacing and Electrophysiology 1996]. Συγκεντρωτικά µπορούµε για το πρώτο σύνολο χαρακτηριστικών από το πεδίο της συχνότητας να γράψουµε Fdset1: { VLFLFHFLF,,, / HF }. ΙΑΧΩΡΙΣΜΟΣ ΙΙ: Ο δεύτερος διαχωρισµός που χρησιµοποιήθηκε διαµοιράζει το εύρος των συχνοτήτων σε 4 τµήµατα σε καθένα από τα οποία υπολογίσαµε την ενέργεια την οποία χρησιµοποιήσαµε ως χαρακτηριστικό. Συνεπώς τα τέσσερα αυτά χαρακτηριστικά είναι τα ακόλουθα: η ενέργεια στο τµήµα που περιλαµβάνει τις πολύ χαµηλές συχνότητες (Very Low Frequency (VLF)) 0-0.03 Hz «το οποίο αντιστοιχεί σε µακροχρόνιες και µη γραµµικές επιδράσεις» [Signorini et al. 2003], η ενέργεια στο τµήµα που περιλαµβάνει τις χαµηλές συχνότητες (Low Frequency (LF)) 0.03-0.15 Hz «το τµήµα αυτό σχετίζεται κυρίως µε τη λειτουργία του παρασυµπαθητικού νευρικού συστήµατος» [Signorini et al. 2003], η ενέργεια στο τµήµα που περιλαµβάνει τις συχνότητες «κίνησης» (Movement Frequency (MF)) 0.15-0.5 Hz το οποίο «εξαρτάται από τις κινήσεις του εµβρύου και από την αναπνοή της µητέρας» [Signorini et al. 2003] και η ενέργεια στο τµήµα που περιλαµβάνει τις υψηλές συχνότητες (High Frequency (HF)) 0.5-1 Hz η οποία «υποδηλώνει την αναπνευστική λειτουργία του εµβρύου» [Signorini et al. 2003]. Με βάση τον παραπάνω διαχωρισµό υπολογίσαµε και ένα πέµπτο χαρακτηριστικό τον παρακάτω λόγο των ενεργειών: 67
Κεφάλαιο 4 ο LF /( HF + MF) (ο οποίος ποσοτικοποιεί την ισορροπία µεταξύ των νευρικών µηχανισµών από διαφορετικές πηγές (σε αναλογία µε το λόγο LF/HF ο οποίος υπολογίζεται στους ενήλικες) [Signorini et al. 2003] Συγκεντρωτικά µπορούµε για το δεύτερο σύνολο χαρακτηριστικών από το πεδίο της συχνότητας να γράψουµε Fdset2 :{ VLF2, LF2, MFHFLF,, /( HF+ MF) } Στο Σχήµα 4.2 απεικονίζεται η διαφοροποίηση στη σχετική συνεισφορά των διαφόρων ζωνών για τους δύο παραπάνω διαχωρισµούς, a) σε 3 ζώνες [Sibony et al. 1994] και b) σε 4 ζώνες συχνοτήτων [Signorini et al. 2003]. Σχήµα 4.2: Συνεισφορά των διαφορετικών ζωνών συχνοτήτων του σήµατος της ΕΚΣ ΙΑΧΩΡΙΣΜΟΣ ΙΙΙ Στον 3 ο και πιο απλό διαχωρισµό, χωρίσαµε το συνολικό εύρος ζώνης σε 4 τµήµατα µε το ίδιο εύρος και υπολογίσαµε την ενέργεια σε κάθε ένα από αυτά. ηλαδή: την ενέργεια στη ζώνη 0-0.5 Hz, την ενέργεια στη ζώνη 0.5-1 Hz, την ενέργεια στη ζώνη 1-1.5 Hz και την ενέργεια στη ζώνη 1.5-2 Hz. 68
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Θα πρέπει να αναφερθεί ότι οι παραπάνω διαχωρισµοί της ζώνης συχνοτήτων δεν είναι οι µοναδικοί που απαντώνται στη διεθνή βιβλιογραφία [Chung et al. 1995]. 4.2.3 Μορφολογικά χαρακτηριστικά Όπως αναφέραµε στην εισαγωγή της διατριβής η συµβατική «αποκωδικοποίηση» και ο έλεγχος της ΕΚΣ βασίζεται στην αξιολόγηση της µορφής του από τον γυναικολόγο-µαιευτήρα, σύµφωνα µε ένα σύνολο οδηγιών και υποδείξεων [Rooth et al. 1987; National Institute of Child Health and Human Development Research Planning Workshop 1997]. Συνεπώς αυτά τα «µορφολογικά» χαρακτηριστικά είναι πολύ πιθανόν να είναι όντως χρήσιµα για την αξιολόγηση της ΕΚΣ και κατ επέκταση της κατάστασης του εµβρύου. Ως εκ τούτου χρησιµοποιήσαµε 2 σύνολα από χαρακτηριστικά αυτού του είδους, αποκλίνοντας ελαφρώς από τους τυπικούς ορισµούς των συγκεκριµένων «ποσοτήτων» ΙΑΧΩΡΙΣΜΟΣ Ι Το πρώτο σύνολο µορφολογικών χαρακτηριστικών αποτελείται από 4 τιµές (οι ορισµοί των µορφολογικών χαρακτηριστικών έχουν περιγραφεί στο κεφάλαιο 2): τη βασική γραµµή ([Rooth et al. 1987]), τον αριθµό των επιταχύνσεων ([Rooth et al. 1987]), τον αριθµό των επιβραδύνσεων ([Rooth et al. 1987]) και το ποσοστό του χρόνου που καταλαµβάνεται από τις επιβραδύνσεις Συγκεντρωτικά το πρώτο σύνολο µορφολογικών χαρακτηριστικών είναι το ακόλουθο Mset1={Baseline, Number of accelerations, Number of decelerations, Total Duration of decelerations}. ΙΑΧΩΡΙΣΜΟΣ ΙΙ Το δεύτερο σύνολο αποτελείται από τα 4 προαναφερθέντα χαρακτηριστικά διαχωρίζοντας όµως τις επιβραδύνσεις σε 3 τύπους (καταλήγοντας να έχουµε 6 χαρακτηριστικά): ήπιες (mild) επιβραδύνσεις, εάν η διάρκεια τους δεν ξεπερνά τα 120 δευτερόλεπτα [Ayres-de- Campos et al. 2000], παρατεινόµενες (prolonged) επιβραδύνσεις, εάν διαρκούν 120-300 δευτερόλεπτα [Ayres-de- Campos et al. 2000] και 69
Κεφάλαιο 4 ο βαριάς µορφής (severe) επιβραδύνσεις, εάν διαρκούν πάνω από 300 δευτερόλεπτα [Ayres-de- Campos et al. 2000]. Συγκεντρωτικά µπορούµε για το δεύτερο σύνολο µορφολογικών χαρακτηριστικών να γράψουµε Mset2={Baseline, Number of accelerations, Number of mild decelerations, Number of prolonged decelerations, Number of severe decelerations, Total Duration of decelerations (mild, prolonged, severe)} Για τον υπολογισµό της βασικής γραµµής υλοποιήσαµε τον αλγόριθµο ο οποίος προτάθηκε από τον Taylor [Taylor et al. 2000], ο οποίος βασίζεται σε µια επαναληπτική διαδικασία η οποία είναι εύκολα υλοποιήσιµη. Αποτελείται από τα ακόλουθα βήµατα: αφαίρεση των τµηµάτων του σήµατος της ΕΚΣ τα οποία σχετίζονται µε επιταχύνσεις και επιβραδύνσεις και γραµµική παρεµβολή ανάµεσα στα κενά που δηµιουργούνται και φιλτράρισµα µε ένα κατωδιαβατό φίλτρο. Η παραπάνω διαδικασία επαναλαµβάνεται 3 φορές και η βασική γραµµή υπολογίζεται τελικά ως η µέση τιµή του σήµατος που προκύπτει µετά από τη διαδοχική εφαρµογή των προαναφερθέντων σταδίων. Στο Σχήµα 4.3 απεικονίζεται το αποτέλεσµα από της εφαρµογή των αλγορίθµων για την µορφολογική ανάλυση της ΕΚΣ και τον εντοπισµό της βασικής γραµµής, των επιταχύνσεων και των επιβραδύνσεων. Η συνεχής γραµµή είναι η εκτιµηθείσα βασική γραµµή. Τα δύο ευθύγραµµα τµήµατα κάτω από το σήµα της ΕΚΣ σηµειώνουν την ύπαρξη επιβραδύνσεων ενώ το ευθύγραµµο τµήµα πάνω από το σήµα της ΕΚΣ σηµειώνει µία επιτάχυνση Σχήµα 4.3: Μορφολογική ανάλυση του σήµατος της ΕΚΣ µε χρήση του αλγορίθµου του Taylor. Θα πρέπει να αναφερθεί ότι δεν λάβαµε υπόψη το σήµα των συσπάσεων της µήτρας και για αυτό το λόγο δεν προχωρήσαµε σε περαιτέρω χαρακτηρισµό των επιβραδύνσεων (όψιµες, πρώιµες κτλ). 70
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Ένας από τους λόγους που δεν επεκταθήκαµε τόσο στην ανάλυση των επιβραδύνσεων είναι ότι αν και θεωρείται ότι έχουν µεγάλη προγνωστική σηµασία, έχει παρατηρηθεί ότι υπάρχει µεγάλη δυσκολία στο «σωστό» χαρακτηρισµό τους και στην ανάπτυξη µιας ενιαίας και οµόφωνης προσέγγισης µεταξύ των ειδικών [Bernardes et al. 1997]. Θα πρέπει τέλος να σηµειωθεί ότι µερικά από τα χαρακτηριστικά τα οποία συµπεριλάβαµε στην κατηγορία αυτών που εξάγονται στο πεδίο του χρόνου (τυπική απόκλιση της ΕΚΣ, LTI και STV) χρησιµοποιούνται και σε καθηµερινή βάση από τους γυναικολόγους µαιευτήρες. Ως εκ τούτου θα µπορούσε κάποιος να τα συµπεριλάβει στα «µορφολογικά» χαρακτηριστικά. Παρόλα αυτά υιοθετώντας την προσέγγιση του Magenes [Magenes et al. 2000, 2001] προχωρήσαµε στον παραπάνω χωρισµό σε αυτές τις κατηγορίες. 4.3 Εξαγωγή χαρακτηριστικών µε τη χρήση κυµατιδίων (wavelets) Πέρα από τα χαρακτηριστικά ενός σήµατος που εξετάζονται στο πεδίο της συχνότητας ή στο πεδίο του χρόνου υπάρχουν και σύγχρονες προσεγγίσεις που εξετάζουν και το κοινό πεδίο χρόνουσυχνότητας (time-frequency domain) και εξάγουν χαρακτηριστικά σε αυτό το πεδίο. Ένας τρόπος για να γίνει αυτό είναι µε τη χρήση του µετασχηµατισµού κυµατιδίου. 4.3.1 Σύντοµη µαθηµατική εισαγωγή Τα κυµατίδια είναι ένα σχετικά νέο «εργαλείο» το οποίο αποτελεί µια νέα µέθοδο για τον µετασχηµατισµό στο πεδίο του χρόνου-συχνότητας (χρόνου-κλίµακας ίσως αποτελεί έναν πιο δόκιµο όρο (time-scale)) η οποία είναι διαφορετική από την κλασσική θεώρηση της ανάλυσης Fourier. Με απλοϊκούς όρους ένα κυµατίδιο είναι αυτό ακριβώς που υποδηλώνει το όνοµά του, ένα κύµα µικρής χρονικής διάρκειας (Σχήµα 4.4). 71
Κεφάλαιο 4 ο Σχήµα 4.4: Πρωταρχική συνάρτηση symmlet µε 13 µηδενικές ροπές. Τα κυµατίδια έχουν την ικανότητα να χειρίζονται την ανάλυση ενός σήµατος και στα δύο πεδία (του χρόνου και της συχνότητας) γεγονός που τα καθιστά ιδιαίτερα χρήσιµα για την ανάλυση «προβληµατικών», µη στάσιµων και µεταβατικών σηµάτων. Το πιο ελκυστικό χαρακτηριστικό των κυµατιδίων είναι ότι αποσυνθέτουν ένα σήµα σε µία σειρά από κλίµακες, µε κάθε κλίµακα να αναπαριστά µία διαφορετική τραχύτητα (coarseness) του υπό εξέταση σήµατος [Mallat 1989]. Τα κυµατίδια έχουν βρει µεγάλη εφαρµογή στην επεξεργασία ιατρικών σηµάτων [Unser, and Aldrubi 1996, Aldrubi and Unser 1996] και έχουν ήδη χρησιµοποιηθεί µε επιτυχία στην ανάλυση των µεσοδιαστηµάτων µεταξύ των χτύπων της καρδιάς ενηλίκων ασθενών [Thuner et al., 1998; Ivanov et al., 1996]. Επίσης έχουν γίνει κάποιες αρχικές προσπάθειες γα τη χρησιµοποίηση τους κατά το δεύτερο στάδιο του τοκετού [Salamalekis et al., 2002, Struzik and Wijngaarden 2001]. Οι περισσότερες από αυτές τις προσεγγίσεις, δεν χρησιµοποιούν την χρονική πληροφορία που εµπεριέχεται στους συντελεστές του µετασχηµατισµού κυµατιδίου και κατά µία έννοια υποθέτουν ότι το υπό εξέταση σήµα είναι στάσιµο. Ο µετασχηµατισµός κυµατιδίου ενός χρονικού σήµατος δεν είναι τίποτε άλλο από την ανάπτυξη του σήµατος πάνω σε µια οικογένεια συναρτήσεων οι οποίες είναι «συγκεντρωµένες» τόσο στο χρόνο όσο και στη συχνότητα. Τα µέλη της οικογένειας συναρτήσεων παράγονται από µία πρωταρχική/βασική συνάρτηση η οποία καλείται και κυµατίδιο γεννήτορας (mother wavelet) ψ ( t), µέσω µιας σειράς από αλλαγές κλίµακας και µετατοπίσεις: 1 t b ψab, () t = ψ a a (4.1) + όπου a, b. 72
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Για τις περισσότερες πρακτικές εφαρµογές, που περιλαµβάνουν δεδοµένα µετρήσεων, οι παράµετροι αλλαγής κλίµακας και µετατόπισης a, b περιορίζονται µόνο σε διακριτές τιµές οδηγώντας στην παρακάτω έκφραση: ψ 1 ψ t nb a = m 0 0 mn, () t m m a a 0 0 (4.2) Για πρακτικούς λόγους, η πιο απλή και πιο αποδοτική διακριτοποίηση είναι αυτή για την οποία a 0 = 2 and b 0 = 1 (δηµιουργώντας ένα δυαδικό δικτύωµα): 1 t n2 ψ mn, ψ ψ m m 2 2 m m 2 m () t = = 2 ( 2 t n) (4.3) όπου 2 ( mn, ). Η παράµετρος µετατόπισης καθορίζει τη θέση του κυµατιδίου στο πεδίο του χρόνου, ενώ η παράµετρος αλλαγής κλίµακας καθορίζει τη θέση του στο πεδίο των συχνοτήτων καθώς και το τρόπο µε τον οποίο είναι συγκεντρωµένη η ενέργεια του στο πεδίο χρόνου-συχνότητας. Εποµένως χρησιµοποιώντας το µετασχηµατισµό κυµατιδίου, κάθε σήµα µπορεί να «αποσυντεθεί» ανάλογα µε τη συνεισφορά που έχει στις διάφορες περιοχές στο πεδίο χρόνου-συχνότητας προβάλλοντας το σε µια σειρά από βασικές συναρτήσεις. Έτσι για ένα συνεχές σήµα x( t ), οι συντελεστές κυµατιδίου, οι οποίοι αναπαριστούν το σήµα στο πεδίο χρόνου-κλίµακας δίνονται από το δυαδικό µετασχηµατισµό κυµατιδίου: Tmn, = x() t ψ mn, () t dt (4.4) όπου ψ mn, η συζυγής συνάρτηση. Οι συντελεστές αυτοί «ποσοτικοποιούν» την οµοιότητα ανάµεσα στο σήµα και τη συνάρτηση βάσης. Εάν τα κυµατίδια τα οποία κείτονται σε αυτό το δυαδικό πλέγµα επιλεγούν έτσι ώστε να είναι ορθογώνια, τότε η πληροφορία που εµπεριέχεται σε ένα συντελεστή κυµατιδίου T mn, δεν επαναλαµβάνεται σε κανέναν άλλο συντελεστή. Συνεπώς η πληροφορία η οποία εµπεριέχεται σε µία συγκεκριµένη κλίµακα m είναι «ασυσχέτιστη» µε την πληροφορία σε οποιαδήποτε άλλη κλίµακα. Μικρότερες κλίµακες αντιστοιχούν σε υψηλότερες συχνοτικά συνιστώσες (µε ορολογία Fourier). Επιπλέον κάθε συντελεστής κυµατιδίου περιέχει πληροφορία η οποία δεν αφορά µόνο την κλίµακα αλλά και το χρονικό παράθυρο που παρήγαγε αυτή την πληροφορία. 73
Κεφάλαιο 4 ο Για ένα διακριτό σήµα xi [], i= 0,..., M 1 και για ένα πραγµατικό (όχι µιγαδικό) κυµατίδιο οι συντελεστές δίνονται από την εξίσωση 4.5: M 1 m 2 Tmn, = 2 x i 2 i n (4.5) i= 0 m [] ψ ( ) Αν και η παραπάνω σχέση δεν είναι απόλυτα «σωστή», είναι αυτή η οποία εφαρµόζεται ως επί το πλείστον στην πράξη [Addison 2002]. Προφανώς διαφορετικά κυµατίδια γεννήτορες παράγουν διαφορετικές οικογένειες κυµατιδίων, και συνεπώς η ανάλυση του σήµατος στο πεδίο χρόνουκλίµακας όπως αυτό περιγράφεται από τους συντελεστές του µπορεί να είναι αρκετά διαφορετική ανάλογα µε το κυµατίδιο που χρησιµοποιήθηκε. Παρόλα αυτά σύµφωνα µε τον Thuner [Thuner et al., 1998] στην εργασία τους η οποία σχετιζόταν µε την ανάλυση των µεσοδιαστηµάτων µεταξύ των κτύπων της καρδιάς ενηλίκων, τα αποτελέσµατα ήταν παρόµοια χρησιµοποιώντας διαφορετικούς τύπους από κυµατίδια γεννήτορες. Σε αυτή τη διδακτορική διατριβή πειραµατιστήκαµε µε µια πληθώρα από κυµατιδίων για την επίτευξη του καλύτερου δυνατού αποτελέσµατος. Στην ερευνητική αυτή προσπάθεια πειραµατιστήκαµε χρησιµοποιώντας τρεις διαφορετικές οικογένειες (Daubechies, Symmlets και Coiflets), µε διαφορετικό αριθµό από µηδενικές ροπές (vanishing moments). Κυµατίδια µε p µηδενικές ροπές µπορούν να συµπιέσουν τµήµατα σηµάτων, τα οποία είναι πολυώνυµα (µπορούν να περιγραφούν µε πολυώνυµα) µέχρι βαθµού p 1. Τα κυµατίδια που χρησιµοποιήσαµε αναπτύχθηκαν από την Daubechies [Daubechies 1992] και έχουν την πολύ ελκυστική ιδιότητα ότι έχουν συµπαγές/πεπερασµένο πεδίο ορισµού (compact support) και ο µετασχηµατισµός κυµατιδίου µπορεί να υπολογιστεί χρησιµοποιώντας πεπερασµένης κρουστικής απόκρισης συζυγή φίλτρα (conjugate mirror filters) µε ένα γρήγορο αλγόριθµο χρησιµοποιώντας «τράπεζες» φίλτρων (filter banks). Τα Daubechies κυµατίδια έχουν τον ελάχιστο αριθµό συντελεστών δοσµένου του αριθµού των µηδενικών ροπών. Τα Symmlets είναι επίσης κυµατίδια µε ελάχιστο αριθµό συντελεστών αλλά είναι πιο συµµετρικά συγκρινόµενα µε τα Daubechies. Τα Coiflets δεν έχουν τον ελάχιστο αριθµό συντελεστών για δεδοµένο αριθµό από µηδενικές ροπές, αλλά τόσο η συνάρτηση κλίµακας (scaling function) όσο και η συνάρτηση κυµατιδίου έχουν τον ίδιο αριθµό από µηδενικές ροπές. Στο Σχήµα 4.5 απεικονίζεται ένα κυµατίδιο γεννήτορας για κάθε µία από τις παραπάνω τρεις οικογένειες. Για περισσότερες πληροφορίες ο αναγνώστης µπορεί να ανατρέξει σε κάποιο από τα πολλά βιβλία που υπάρχουν στη διεθνή βιβλιογραφία [Mallat 1999; Daubechies 1992]. 74
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Σχήµα 4.5: ιαφορετικά κυµατίδια µε 2 µηδενικές ροπές. Ο µετασχηµατισµός κυµατιδίου έχει πολλές εφαρµογές (συµπίεση, αποθορυβοποίηση, ανίχνευση ακµών σε εικόνες κτλ). Στην προκειµένη περίπτωση χρησιµοποιήθηκε για την εξαγωγή χαρακτηριστικών. Η βασική ιδέα προϋποθέτει το µετασχηµατισµό του σήµατος της ΕΚΣ σε συντελεστές κυµατιδίου και η επεξεργασία αυτών για την παραγωγή κατάλληλων χαρακτηριστικών. Συνεπώς εφαρµόζοντας τον διακριτό µετασχηµατισµό κυµατιδίου αποσυνθέτουµε το σήµα της ΕΚΣ µέχρι ένα προκαθορισµένο επίπεδο m. Το αποτέλεσµα της ανάλυσης µέχρι το επίπεδο m=5 ενός σήµατος ΕΚΣ φαίνεται στην Εικόνα 4.6. Ανάλογα µε το κυµατίδιο που χρησιµοποιούµε (Daubechies, Symmlets, Coiflets) καταλήγουµε σε διαφορετική αναπαράσταση του σήµατος της ΕΚΣ. Σχήµα 4.6: Το αρχικό σήµα της ΕΚΣ στο πάνω µέρος και η ανάλυση του σε συντελεστές κυµατιδίου για m=1,2,3,4,5,6. 75
Κεφάλαιο 4 ο Κατά το στάδιο της εξαγωγής των χαρακτηριστικών/παραµέτρων επενεργούµε στους συντελεστές κυµατιδίου στις διάφορες κλίµακες. Ο µετασχηµατισµό κυµατιδίου έχει την ικανότητα να απεικονίζει τα ντετερµινιστικά χαρακτηριστικά των σηµάτων συνήθως σε µικρό αριθµό από συντελεστές σε ορισµένες κλίµακες µε σχετικά µεγάλες τιµές. Από την άλλη στην περίπτωση που έχουµε και την ύπαρξη στοχαστικών διεργασιών σε ένα σήµα, κατά το µετασχηµατισµό του σήµατος, αυτές συνεισφέρουν σχεδόν σε όλους τους συντελεστές χωρίς την ύπαρξη κάποιας εµφανούς συσχέτισης µεταξύ τους. Εάν η εφαρµογή του δυαδικού µετασχηµατισµού κυµατιδίου παράγει λίγους συντελεστές µε µεγάλο µέτρο, τότε αυτοί οι συντελεστές µπορούν να αναπαραστήσουν το αρχικό σήµα, αγνοώντας τους υπόλοιπους συντελεστές και χωρίς η παραπάνω διαδικασία να εισάγει µεγάλο σφάλµα. Εποµένως αυτοί οι συντελεστές µπορούν να παράσχουν χρήσιµη πληροφορία στην περίπτωση που θα χρησιµοποιηθούν για ταξινόµηση [Zhang et al. 2004]. Συνεπώς, µία καλή προσέγγιση για την χρησιµοποίηση των συντελεστών που παράγονται από το µετασχηµατισµό κυµατιδίου για προβλήµατα ταξινόµησης, προϋποθέτει την εύρεση µιας συνάρτησης η οποία να ποσοτικοποιεί την ύπαρξη περιοχών όπου υπάρχουν λίγοι συντελεστές µε µεγάλο µέτρο. Το πιο κοινό µέτρο για αυτό το σκοπό είναι η εντροπία κατά Shannon την οποία προτείναµε για πρώτη φορά για το πρόβληµα της ανάλυσης της ΕΚΣ. Η εντροπία κατά Shannon για µια διακριτή κατανοµή p, i= 1,2,..., N δίνεται: i N S = p log p µε i= 1 i ( ) i N pi = 1 και pilog( p i) = 0, εάν p i = 0 (4.6) i= 1 Η µέγιστη εντροπία για µια κατανοµή εµφανίζεται όταν η πληροφορία είναι οµοιόµορφα κατανεµηµένη. Όσο πιο ανοµοιογενενής είναι µια κατανοµή τόσο µικρότερη είναι η εντροπία. Στην περίπτωση ενός (διακριτού) σήµατος η ελάχιστη εντροπία εµφανίζεται όταν όλη η πληροφορία είναι συγκεντρωµένη σε µία µόνο θέση. Εποµένως η εντροπία κατά Shannon µπορεί να χρησιµοποιηθεί στην περίπτωση των συντελεστών κυµατιδίου (για την ακρίβεια στην κατανοµή των κανονικοποιηµένων ενεργειών των συντελεστών) ώστε να βρεθούν εκείνα τα σύνολα συντελεστών που περιέχουν µια υψηλή «συγκέντρωση» πληροφορίας. Το Σχήµα 4.7 απεικονίζει ένα σήµα µε µέγιστη, µεσαία και ελάχιστη εντροπία. Το σήµα το οποίο έχει µόνο ένα µη µηδενικό συντελεστή είναι και αυτό µε την ελάχιστη εντροπία, ενώ αυτό µε την οµοιόµορφη κατανοµή έχει τη µέγιστη τιµή εντροπίας. 76
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Σχήµα 4.7: Τρεις περιπτώσεις σηµάτων (κατανοµών) µε διαφορετική εντροπία (µέγιστη, ελάχιστη και µια µεταξύ των δύο αυτών ακραίων καταστάσεων). 4.3.2 Εξαγωγή χαρακτηριστικών Μετά από τη σύντοµη µαθηµατική εισαγωγή µπορούµε να περάσουµε και στην περιγραφή των διαφορετικών χαρακτηριστικών που εξαγάγαµε από το σήµα της ΕΚΣ, χρησιµοποιώντας τους συντελεστές που προκύπτουν από την εφαρµογή του δυαδικού µετασχηµατισµού κυµατιδίου πάνω του. Τα παραγόµενα χαρακτηριστικά του σήµατος της ΕΚΣ µπορούν να χωριστούν σε δύο µεγάλες κατηγορίες ανάλογα µε το αν κατά τον υπολογισµό τους χρησιµοποιούνται α) όλοι οι συντελεστές που περιλαµβάνονται σε µία ορισµένη κλίµακα και β) τµήµα µόνο των συντελεστών που περιλαµβάνονται σε µία ορισµένη κλίµακα, λαµβάνοντας κατά κάποιο τρόπο υπόψη και τη χρονική πληροφορία που εµπεριέχεται σε αυτούς τους συντελεστές. 4.3.2.1 Χαρακτηριστικά που εξαρτώνται µόνο από την κλίµακα Στην πρώτη κατηγορία, µετά από το µετασχηµατισµό του σήµατος της ΕΚΣ και την ανάλυση του σε µια σειρά από κλίµακες υπολογίζουµε επενεργώντας σε κάθε κλίµακα ξεχωριστά τα παρακάτω χαρακτηριστικά 77
Κεφάλαιο 4 ο α) Χαρακτηριστικό 1 ο - Τυπική απόκλιση των συντελεστών ανά κλίµακα σ 1 N 1 2 2 1 m ( m) = Tmn, T mn, N 1 0 m m (4.7) όπου N m είναι ο αριθµός των συντελεστών στην αντίστοιχη κλίµακα m και Tmn, m είναι η µέση τιµή των συντελεστών στη συγκεκριµένη κλίµακα m (η οποία πρακτικά είναι πολύ κοντά στο 0). β) Χαρακτηριστικό 2 ο - Εντροπία κατά Shannon ανά κλίµακα. Υπολογίζεται από την κατανοµή των κανονικοποιηµένων ενεργειών των συντελεστών κυµατιδίου σε κάθε κλίµακα () S i 2 2 N 1 ( Tmi, + j) ( Tmi, + j) = log N 1 N 1 2 2 (4.8) j= 0 ( Tmi, + j) ( Tmi, + j) j= 0 j= 0 Το συγκεκριµένο χαρακτηριστικό χρησιµοποιήθηκε από την οµάδα µας για πρώτη φορά για την ανάλυση του σήµατος της ΕΚΣ. 4.3.2.2 Χαρακτηριστικά που εξαρτώνται τόσο από την κλίµακα όσο και από το χρόνο Στη δεύτερη κατηγορία χαρακτηριστικών δεν χρησιµοποιήσαµε όλους τους συντελεστές κυµατιδίου του σήµατος της ΕΚΣ σε κάθε κλίµακα αλλά επιχειρήσαµε να «διαλέξουµε» τους πιο κατάλληλους α) Χαρακτηριστικό 1 ο - Συντελεστές µε τη µεγαλύτερη απόλυτη τιµή Εύρεση του συντελεστή µε τη µεγαλύτερη απόλυτη τιµή και χρησιµοποίηση του ως χαρακτηριστικό. Επιπρόσθετα χρησιµοποίηση και του δείκτη αυτού του συντελεστή καθώς η θέση ενός συντελεστή έχει άµεση σχέση µε το χρονικό παράθυρο το οποίο τον παρήγαγε. Μαθηµατικοποιηµένα και για την κλίµακα m έχουµε: όπου ( ) max ( ) fm,1 = sign Tm, n Tm, n για n= 1,..., N (4.9) m Nm είναι ο αριθµός των συντελεστών στη συγκεκριµένη κλίµακα m: f ( Tm n ) = arg max για n= 1,..., N (4.10) m m,2, n 78
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ β) Χαρακτηριστικό 2 ο - Ελάχιστη εντροπία Προκειµένου να υπολογίσουµε αυτό το χαρακτηριστικό εισάγαµε ένα ολισθαίνον παράθυρο και υπολογίσαµε την εντροπία των κανονικοποιηµένων ενεργειών των συντελεστών κυµατιδίου εντός του παραθύρου, αναζητώντας τη θέση εκείνη που ελαχιστοποιεί την εντροπία (Σχήµα 4.8). Η ελάχιστη εντροπία καθώς και το κέντρο της θέσης του παραθύρου για το οποίο έχουµε την ελάχιστη εντροπία στη συγκεκριµένη κλίµακα αποτελούν ένα ακόµη ζεύγος χαρακτηριστικών. Πρέπει να σηµειωθεί ότι το µήκος του παραθύρου προσαρµόζεται ανάλογα µε την κλίµακα στην οποία εφαρµόζεται (υποδιπλασιάζεται καθώς κινούµαστε από το επίπεδο m στο επίπεδο m+1). Το συγκεκριµένο ζεύγος χαρακτηριστικών εισήχθει και χρησιµοποιήθηκε για πρώτη φορά από την οµάδα µας για την ανάλυση του σήµατος της ΕΚΣ. Μαθητικοποιηµένα η διαδικασία υπολογισµού του ζεύγους των χαρακτηριστικών είναι η παρακάτω f m,3 min ( S( i) ) = για i= 1,..., N W + 1 (4.11) m m όπου S() i 2 2 Wm 1 ( Tmi, + j) ( Tmi, + j) = log για i= 1,..., N Wm 1 Wm 1 m Wm + 1 j= 0 2 2 ( Tmi, + j) ( Tmi, + j) j= 0 j= 0 (4.12) όπου Wm είναι το µήκος (σε δείγµατα) του ολισθαίνοντος παραθύρου στην κλίµακα m Wm και fm,4 = arg min ( S() i ) 1+ for n= 1,... Nm (4.13) i 2 79
Κεφάλαιο 4 ο Σχήµα 4.8: Χρήση ολισθαίνοντος παραθύρου για την εξαγωγή χαρακτηριστικών από συντελεστές κυµατιδίου. γ) Χαρακτηριστικό 3 ο - Μέγιστη τυπική απόκλιση Με την ίδια λογική όπως παραπάνω και µε τη χρήση ενός ολισθαίνοντος παραθύρου, αλλά ελέγχοντας διαφορετική ποσότητα προκύπτει και το επόµενο ζεύγος χαρακτηριστικών. Αυτή τη φορά αναζητούµε τη θέση του παραθύρου στην οποία µεγιστοποιείται η τυπική απόκλιση των συντελεστών και αυτή την ποσότητα µαζί µε το κέντρο του παραθύρου τα χρησιµοποιούµε ως χαρακτηριστικά της συγκεκριµένης κλίµακας. Με µαθηµατική διατύπωση έχουµε m,5 max ( m( )) f = s i για i= 1,..., N W + 1 (4.14) m m όπου σ 1 W 1 2 2 1 m () i = m Tmn, T mn, W 1 0 m m για i= 1,..., N 1 m Wm + (4.15) όπου Wm είναι το µήκος (σε δείγµατα) του ολισθαίνοντος παραθύρου στην κλίµακα m Wm και fm,6 = arg min ( S() i ) 1+ για n= 1,... Nm (4.16) i 2 80
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ 4.4 Ανάλυση σε ανεξάρτητες συνιστώσες - Independent Component Analysis (ICA) 4.4.1 Σύντοµη µαθηµατική εισαγωγή Η ανάλυση σε ανεξάρτητες συνιστώσες (Independent Component Analysis (ICA)) µπορεί να θεωρηθεί σαν µια γενίκευση της γνωστής µεθόδου ανάλυσης σε πρωταρχικές συνιστώσες (Principle Component Analysis (PCA)) [Bishop 1995]. Η ανάλυση σε ανεξάρτητες συνιστώσες έχει συνδέσει το όνοµά της κυρίως µε τον τυφλό διαχωρισµό σηµάτων (Blind Signal Separation (BSS)) [Haykin 1999] αλλά έχει χρησιµοποιηθεί και για διάφορες άλλες εφαρµογές όπως τυφλή αποσυνέλιξη, εξαγωγή χαρακτηριστικών και πολλές άλλες [Hyvarinen 1999a, Hyvarinen and Oja 2000]. Ο όρος τυφλός διαχωρισµός σηµάτων υπονοεί ότι τόσο οι πηγές όσο και ο τρόπος µε τον οποίο έχουν συνδυαστεί είναι άγνωστος. Παρόλα αυτά υπάρχει διαφορά ανάµεσα στην ανάλυση σε ανεξάρτητες συνιστώσες, η οποία είναι µια θεωρητική µέθοδος µε αρκετές διαφορετικές εφαρµογές και της τυφλής αποσυνέλιξης, η οποία είναι µια συγκεκριµένη κατηγορία προβληµάτων η οποία µπορεί να λυθεί µε διάφορους τρόπους ένας από τους οποίους είναι µε τη χρήση της ανάλυση σε ανεξάρτητες συνιστώσες. Η ανάλυση σε ανεξάρτητες συνιστώσες είναι µια µέθοδος η οποία επιχειρεί να βρει στατιστικά ανεξάρτητες συνιστώσες έχοντας ως δεδοµένο µόνο ένα σύνολο από γραµµικούς συνδυασµούς τους. Η υπόθεση πάνω στην οποία στηρίζεται, είναι ότι υπάρχει ένα σύνολο από στατιστικά ανεξάρτητες πηγές οι οποίες συνδυάζονται γραµµικά έτσι ώστε να παραχθεί το υπό παρατήρηση σήµα (ή σήµατα). Τόσο οι ανεξάρτητες πηγές όσο και ο γραµµικός τους συνδυασµός είναι άγνωστοι. Χρησιµοποιώντας µαθηµατική σηµειολογία, υποθέτουµε ότι έχουµε ένα διάνυσµα U το οποίο αποτελείται από m ανεξάρτητες πηγές U i : T U = [ U 1, U 2,..., U m ] (4.17) Το διάνυσµα U µετασχηµατίζεται γραµµικά, εφαρµόζοντας έναν µη ιδιόµορφο (non-singular) m επί m πίνακα A. Υποθέτουµε χωρίς απώλεια της γενικότητας ότι ο αριθµός των παρατηρήσεων είναι ίσος µε τον αριθµό των ανεξάρτητων συνιστωσών A. Το αποτέλεσµα του πολλαπλασιασµού AU είναι το διάνυσµα των παρατηρήσεων X όπου X = AU : T X = [ X 1, X 2,..., X m ] (4.18) 81
Κεφάλαιο 4 ο Υποτίθεται ότι µόνο το διάνυσµα των παρατηρήσεων X είναι γνωστό, το οποίο µπορεί να µετρηθεί-παρατηρηθεί, και τόσο το διάνυσµα των πηγών U όσο και ο πίνακας ανάµιξης A είναι άγνωστα. Συνεπώς σκοπός της εφαρµογής της ICA είναι να βρεθεί ένας πίνακας διαχωρισµού W, ο οποίος µετά από τον πολλαπλασιασµό µε το διάνυσµα των παρατηρήσεων θα µας δώσει ένα διάνυσµα Y από το οποίο το αρχικό διάνυσµα των πηγών µπορεί να ανακτηθεί: όπου Y = WX (4.19) T Y = [ Y 1, Y2,..., Y m ] (4.20) Οι προαναφερθέντες µαθηµατικοί µετασχηµατισµοί απεικονίζονται στο Σχήµα 4.9. Σχήµα 4.9: Γραφική απεικόνιση της µίξης και την ανάλυσης σε ανεξάρτητες συνιστώσες. Το πρόβληµα της εύρεσης του πίνακα διαχωρισµού διευκολύνεται εφαρµόζοντας προηγουµένως ένα γραµµικό µετασχηµατισµό ώστε τα αρχικά δεδοµένα X να µετατραπούν σε ασυσχέτιστα και έχοντας όλα µοναδιαία διασπορά (sphering ή whitening): V= TX µε Ε { VV T } = I (4.21) Αυτός ο µετασχηµατισµός µπορεί να πραγµατοποιηθεί χρησιµοποιώντας την κλασσική θεωρία της ανάλυσης σε πρωταρχικές συνιστώσες. Ο πίνακας T της εξίσωσης 4.21 δίνεται από τη σχέση [Haykin 1999]: όπου = diag [ λ λ λ ] = 12 T T Λ E (4.22) Λ 1, 2,... n είναι ένας διαγώνιος πίνακας που έχει ως στοιχεία στη διαγώνιο τις ιδιοτιµές του πίνακα ετεροσυσχέτισης (covariance matrix) των δεδοµένων Ε{ XX T } και E είναι ο πίνακας που έχει ως στήλες τα αντίστοιχα ιδιοδιανύσµατα. Υπάρχουν διάφορες προσεγγίσεις για να πραγµατοποιήσει κανείς ανάλυση ενός σήµατος σε ανεξάρτητες συνιστώσες. Μια επισκόπηση αυτών των µεθόδων µπορεί να βρεθεί στο [Hyvarinen 82
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ 1999a]. Στη συνέχεια θα παρουσιαστούν µόνο οι δύο µέθοδοι οι οποίες χρησιµοποιήθηκαν στα πλαίσια της παρούσας διδακτορικής διατριβής. 4.4.2 Αλγόριθµος µεγιστοποίησης της πληροφορίας (Infomax algorithm) Ο αλγόριθµος µεγιστοποίησης της πληροφορίας προτάθηκε από τους Bell και Sejnowski, [Bell and Sejnowski 1995]. Η ιδέα πίσω από αυτή την προσέγγιση είναι να µεγιστοποιηθεί η από κοινού εντροπία της εξόδου (joint entropy), το οποίο έχει σαν αποτέλεσµα να ωθεί τις εξόδους να «γίνουν» όσο το δυνατόν «πιο ανεξάρτητες». Ο κανόνας για την ανανέωση του πίνακα διαχωρισµού W είναι: W = η I f ( u ) u T W (4.23) όπου f ( ) = tanh( ) και η είναι ένας παράµετρος µάθησης (learning rate parameter). Η µη γραµµική συνάρτηση f ( u i ) αποτελεί µια εκτίµηση της αθροιστικής συνάρτησης πυκνότητας πιθανότητας της εκτιµηθείσας πηγής u i. 4.4.3 Ο αλγόριθµος FastICA Ο αλγόριθµος FastICA υπολογίζει τον πίνακα διαχωρισµού W ο οποίος για την περίπτωση µίας µόνο ανεξάρτητης συνιστώσας, πρόκειται µόνο για µία γραµµή w (µία γραµµή του πίνακα W ), η οποία υπολογίζεται µε βάση την παρακάτω εξίσωση [Hyvarinen 1999b]: { ( T T )} { ( )} w + = w µ E xg w x βw E g w x β (4.24) + + w = w w (4.25) όπου g είναι η παράγωγος της συνάρτησης G, µε G στην πράξη µια οποιαδήποτε µη T T τετραγωνική συνάρτηση, { g( )} β = wx wx και µ είναι µία παράµετρος βήµατος η οποία δεν χρειάζεται να είναι σταθερή σε όλη τη διάρκεια της επαναληπτικής διαδικασίας αλλά µπορεί να µεταβάλλεται (συνήθως µειώνεται σταδιακά), κάθε επανάληψη και + w είναι το νέο διάνυσµα (πίνακας γραµµή) µετά από w είναι ο νέος πίνακας (πίνακας γραµµή) µετά από την κανονικοποίηση. Μια γενικού σκοπού συνάρτηση G είναι η [Hyvarinen 1999b]: 1 G = logcosh( α 1 u) α 1 (4.26) 83
Κεφάλαιο 4 ο µε dg g tanh( au ) 1 du = = (4.27) και 1 a1 2 Όταν περισσότερες από µία ανεξάρτητες συνιστώσες πρόκειται να υπολογιστούν χρησιµοποιείται µία διαδικασία βασισµένη σε µία µέθοδο που προσοµοιάζει την Grant-Schmidt διαδικασία [Hyvarinen 1999b]. Σύµφωνα µε αυτή τη µέθοδο οι γραµµές του πίνακα διαχωρισµού W υπολογίζονται µία µία. Με άλλα λόγια εάν έχουν ήδη υπολογιστεί p γραµµές του πίνακα διαχωρισµού, δηλαδή p διανύσµατα w,..., 1 wp για να υπολογιστεί το w p+ 1 διάνυσµα, το οποίο είναι η p+1 γραµµή του πίνακα T διαχωρισµού, εφαρµόζουµε τον αλγόριθµο και µετά από κάθε επανάληψη οι «προβολές» wp+ 1w jw j, j = 1,..., p αφαιρούνται από το τρέχον διάνυσµα w p+ 1 το οποίο στη συνέχεια κανονικοποιείται: = p T p+ 1 p+ 1 j = 1 p+ 1 j j w w w w w (4.28) w = w w w (4.29) T p+ 1 p+ 1 p+ 1 p+ 1 Για µια πιο ουσιαστική και εκ βαθέων ανάλυση του Fast ICA algorithm ο αναγνώστης µπορεί να ανατρέξει στο άρθρο του Hyvärinen [Hyvarinen 1999b]. 4.4.4 Εξαγωγή χαρακτηριστικών χρησιµοποιώντας ανάλυση σε ανεξάρτητες συνιστώσες Η ιδέα πίσω από την εφαρµογή της ανάλυσης σε ανεξάρτητες συνιστώσες είναι να «ανακτήσουµε» τις πηγές εκείνες από το γραµµικό συνδυασµό των οποίων προέκυψε το κάθε σήµα της ΕΚΣ. Η ιδέα αυτή προέκυψε από το γεγονός ότι η ΕΚΣ ρυθµίζεται από την αλληλεπίδραση διάφορων παραγόντων και µηχανισµών οι οποίοι δεν είναι µέχρι σήµερα απόλυτα κατανοητοί. Κάθε ένας από αυτούς του παράγοντες µπορεί να θεωρηθεί ότι είναι υπεύθυνος για µία από τις «πηγές» που δηµιουργούν το σήµα της ΕΚΣ. Η επιτυχηµένη εφαρµογή της ίδιας προσέγγισης στην περίπτωση επεξεργασίας εικόνας αποτέλεσε κίνητρο για την εφαρµογή της στη περίπτωση της ΕΚΣ. Έχοντας στη διάθεσή µας ένα σύνολο από σήµατα ΕΚΣ τα αναλύουµε σε ανεξάρτητες συνιστώσες οπότε προκύπτει ένα σύνολο των πηγών. Αυτές τις πηγές τις χρησιµοποιούµε για την εύρεση εκείνων των συντελεστών που πολλαπλασιαζόµενοι µε τις ανεξάρτητες πηγές θα µας «έδιναν» το αρχικό 84
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ σήµα. Αυτοί οι συντελεστές αποτελούν το διάνυσµα των χαρακτηριστικών για το συγκεκριµένο σήµα της ΕΚΣ (Σχήµα 4.10). Σχήµα 4.10: Εξαγωγή χαρακτηριστικών µε τη χρήση των ανεξάρτητων συνιστωσών. Όπως είναι φανερό ο αριθµός των χαρακτηριστικών είναι ίσoς µε τον αριθµό των υποτιθέµενων πηγών. Συνεπώς η απευθείας εφαρµογή της ανάλυσης σε ανεξάρτητες συνιστώσες δηµιουργεί ένα µεγάλης διάστασης διάνυσµα χαρακτηριστικών σε σχέση µε τον αριθµό των διαθέσιµων παραδειγµάτων. Για αυτό το λόγο στα πλαίσια της συγκεκριµένης εφαρµογής παρεµβάλαµε ένα στάδιο µείωσης της διάστασης µε τη χρήση της ανάλυσης σε πρωταρχικές συνιστώσες. Στα σήµατα αυτά πρώτα αφαιρέσαµε τη µέση τιµή και τα κανονικοποιήσαµε ώστε να έχουν µοναδιαία διασπορά, όπως περιγράφεται στην προηγούµενη ενότητα, και στην έξοδο του σταδίου αυτού πραγµατοποιήσαµε ανάλυση σε ανεξάρτητες συνιστώσες. Αυτά τα στάδια φαίνονται στο Σχήµα 4.11. Οι πηγές αυτές αποτελούν την «βάση» για την περιγραφή κάθε σήµατος της ΕΚΣ όπως δείξαµε στο Σχήµα 4.10. 85
Κεφάλαιο 4 ο 200 150 100 50 0 500 1000 1500 2000 2500 3000 3500 4000 150 100 50 0 500 1000 1500 2000 2500 3000 3500 4000 Σήµατα ΕΚΣ (µετά από προεπεξεργασία) 100 0-100 0 500 1000 1500 2000 2500 3000 3500 4000 50 0-50 -100 0 500 1000 1500 2000 2500 3000 3500 4000 50 0-50 -100 0 500 1000 1500 2000 2500 3000 3500 4000 Τα σήµατα µετά από ανάλυση σε πρωταρχικές συνιστώσες και µείωση της αρχικής διάστασης 5 0-5 5 0 500 1000 1500 2000 2500 3000 3500 4000 0-5 5 0 500 1000 1500 2000 2500 3000 3500 4000 0-5 0 500 1000 1500 2000 2500 3000 3500 4000 Τα σήµατα µετά από το στάδιο του whitening 5 0-5 5 0 500 1000 1500 2000 2500 3000 3500 4000 0-5 0 500 1000 1500 2000 2500 3000 3500 4000 5 0-5 -10 0 500 1000 1500 2000 2500 3000 3500 4000 Τα σήµατα (πηγές) µετά από το στάδιο της ανάλυσης σε ανεξάρτητες συνιστώσες Σχήµα 4.11: Τα στάδια µετάβασης από τα αρχικά σήµατα της ΕΚΣ έως την ανάκτηση των πηγών 86
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ 4.5 Μείωση της διάστασης του διανύσµατος των χαρακτηριστικών / κατασκευή χαρακτηριστικών από ήδη υπάρχοντα Όταν πρόκειται να χρησιµοποιηθεί για ταξινόµηση ένα διάνυσµα χαρακτηριστικών µεγάλης διάστασης και όταν µάλιστα ο αριθµός των διαθέσιµων δειγµάτων που θα χρησιµοποιηθούν για το σχεδιασµό του ταξινοµητή είναι µικρός (ειδικά αν η διάσταση και το πλήθος των δειγµάτων είναι της ίδιας τάξης µεγέθους) τότε η σχεδίαση είναι πολύ πιθανόν να «αποτύχει». Αυτό είναι το γνωστό πρόβληµα της «κατάρας της διάστασης» [Duda et al. 2001]. Αυτό ισχύει στη συγκεκριµένη περίπτωση και για το λόγο αυτό στα περισσότερα από τα πειράµατά µας παρεµβάλαµε ένα στάδιο για τη µείωση της διάστασης του αρχικού διανύσµατος. Αυτή η µείωση στη διάσταση µπορεί να γίνει κυρίως µε δύο τρόπους. Η πρώτη είναι να βρεθούν εκείνα τα χαρακτηριστικά/µεταβλητές τα οποία δεν συµβάλουν στο συγκεκριµένο πρόβληµα κατηγοριοποίησης. Συνεπώς ο σκοπός είναι εάν αρχικά έχουµε Ν χαρακτηριστικά να «κρατήσουµε» τα M (ο αριθµός αυτός πρέπει να έχει προκαθοριστεί) τα οποία περιέχουν τη σηµαντικότερη πληροφορία. Αυτή η διαδικασία ονοµάζεται επιλογή χαρακτηριστικών (feature selection). Η επιλογή χαρακτηριστικών είναι ιδιαίτερα χρήσιµη όταν µερικά από τα χαρακτηριστικά µεταφέρουν ελάχιστη χρήσιµη πληροφορία για την επίλυση του προβλήµατος ή όταν υπάρχουν ισχυρές συσχετίσεις µεταξύ συνόλων χαρακτηριστικών έτσι ώστε η ίδια πληροφορία να επαναλαµβάνεται σε αρκετά διαφορετικά χαρακτηριστικά. Η διαδικασία για την επιλογή των χαρακτηριστικών πρέπει να βασίζεται σε 2 συνιστώσες: 1) Να υπάρχει ένα κριτήριο ώστε να µπορεί να καθοριστεί εάν ένα σύνολο χαρακτηριστικών είναι καλύτερο από ένα άλλο (αυτό το κριτήριο θα πρέπει να είναι το ίδιο µε αυτό που θα χρησιµοποιηθεί για την αποτίµηση του τελικού συστήµατος που θα αναπτυχθεί). 2) Μια συστηµατική προσέγγιση για αναζήτηση µεταξύ διάφορων υποψήφιων συνόλων χαρακτηριστικών. Η µόνη µέθοδος η οποία εγγυάται ότι θα βρεθεί ένα υποσύνολο χαρακτηριστικών το οποίο θα είναι βέλτιστο για το συγκεκριµένο πρόβληµα προϋποθέτει την εξαντλητική αναζήτηση όλων των δυνατών συνδυασµών των χαρακτηριστικών, και στην πράξη δεν εφαρµόζεται µια και είναι πολύ χρονοβόρα. Πρακτικά αναζητούµε ένα καλό-υποβέλτιστο σύνολο από χαρακτηριστικά µε σκοπό να µειώσουµε την υπολογιστική πολυπλοκότητα. Συνεπώς σε πρακτικές εφαρµογές µπορεί να χρησιµοποιηθεί ενδεικτικά µία από τις παρακάτω µεθόδους α) τα Μ καλύτερα µεµονωµένα χαρακτηριστικά, β) η διαδοχική εµπρόσθια επιλογή 87
Κεφάλαιο 4 ο (sequential forward selection (SFS)), γ) η γενικευµένη διαδοχική εµπρόσθια επιλογή (generalized SFS (GSFS)), δ) η διαδοχική προς τα πίσω επιλογή (sequential backward selection (SBS)), ε) η γενικευµένη διαδοχική προς τα πίσω επιλογή (generalized SBS (GSBS)) [Bishop 1995, Duda et al. 2001]. Η δεύτερη προσέγγιση είναι αν βρεθεί ένας µετασχηµατισµός έτσι ώστε από το χώρο των Ν χαρακτηριστικών, να µεταβούµε σε ένα χώρο µικρότερης διάστασης M. Αυτός ο µετασχηµατισµός µπορεί να είναι γραµµικός ή µη γραµµικός ως προς τα αρχικά χαρακτηριστικά και µπορεί να πραγµατοποιηθεί είτε µε τη χρήση επίβλεψης (supervised) είτε χωρίς (unsupervised) Η πιο συχνά χρησιµοποιούµενη µέθοδος που ανήκει στη δεύτερη κατηγορία είναι η ανάλυση σε πρωταρχικές συνιστώσες η οποία θα παρουσιαστεί εν συντοµία στη συνέχεια. 4.5.1 Ανάλυση σε Πρωταρχικές Συνιστώσες (Principle Component Analysis PCA) Η ανάλυση σε πρωταρχικές συνιστώσες ή ο µετασχηµατισµός Karhunen-Loeve όπως είναι περισσότερο γνωστός σε όσους ασχολούνται µε τηλεπικοινωνίες, αποτελεί τον πιο συνήθη τρόπο µείωσης της διάστασης του διανύσµατος των χαρακτηριστικών. Αν και υπάρχει και µία µη γραµµική εκδοχή του αλγορίθµου (non-linear PCA) [Bishop 1995], καθώς και µία νέα προσέγγιση µε τη χρήση πυρήνων (kernel PCA) [Shawe-Taylor and Christianini 2004], στην παρούσα διατριβή χρησιµοποιήθηκε η κλασσική του µορφή, η οποία συνδυάζει γραµµικά τα αρχικά χαρακτηριστικά για να δηµιουργήσει ένα µικρότερο σύνολο χαρακτηριστικών µε τέτοιο τρόπο ώστε να διατηρήσει όσο το δυνατόν περισσότερη από την αρχική πληροφορία [Bishop 1995, Duda et al. 2001]. Πιο συγκεκριµένα η ανάλυση σε πρωταρχικές συνιστώσες απεικονίζει ένα διάνυσµα n x (όπου ο δείκτης n αναφέρεται στο n-ιοστό παράδειγµα) από ένα Ν-διάστατο χώρο ( x,..., 1 x N ) (όπου Ν είναι ο αρχικός αριθµός των χαρακτηριστικών) σε ένα διάνυσµα z,..., 1 z M, n z σε ένα M-διάστατο χώρο ( ) όπου M<Ν. Προφανώς µε αυτό το µετασχηµατισµό έχουµε απώλεια κάποιας πληροφορίας. Αλγοριθµικά ο µετασχηµατισµός αυτός πραγµατοποιείται ακολουθώντας τα παρακάτω βήµατα: Βήµα 1. Υπολογίζουµε τη µέση τιµή των διανυσµάτων Βήµα 2. Υπολογίζουµε τον πίνακα συσχέτισης: n n ( )( ) n x και την αφαιρούµε από αυτά. n T x x x x (4.30) i= 1 Cov = 88
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Βήµα 3. Υπολογίζουµε τα ιδιοδιανύσµτα και τις ιδιοτιµές του πίνακα συσχέτισης. Βήµα 4. Τα ιδιοδιανύσµατα που αντιστοιχούν στις M µεγαλύτερες ιδιοτιµές διατηρούνται και πάνω τους προβάλλονται τα διανύσµατα n x δίνοντας τα νέα διανύσµατα Πρέπει να επισηµανθεί ότι και αν ακόµα διατηρηθούν όλα τα ιδιοδιανύσµατα (δηλαδή δεν προβούµε καν σε µείωση της διάστασης) ο παραπάνω µετασχηµατισµός µπορεί να επιφέρει βελτίωση στην απόδοση του ταξινοµητή, επειδή µε το µετασχηµατισµό αυτό τα χαρακτηριστικά που προκύπτουν είναι µεταξύ τους ασυσχέτιστα και αυτό γενικά αυξάνει την απόδοση ενός ταξινοµητή. (Άλλωστε κάτι τέτοιο συνιστάται εν γένει ως ένα στάδιο προεπεξεργασίας των δεδοµένων πριν χρησιµοποιηθούν ως είσοδοι σε κάποιο ταξινοµητή [Haykin 1999]). n z. 4.5.2 Εξελικτική Γραµµατική (Grammatical Evolution) Η εξελικτική γραµµατική είναι µια µέθοδος που χρησιµοποιεί γενετικό προγραµµατισµό (genetic programming) και µία Backus Naur form (BNF) περιγραφή για τη δηµιουργία προγραµµάτων σε µία αυθαίρετη γλώσσα. Στην εξελικτική γραµµατική τα χρωµοσώµατα είναι µία σειρά από παραγωγικούς κανόνες (production rules) του κατάλληλου BNF συντακτικού. Κάθε bit από το χρωµόσωµα δηλώνει έναν παραγωγικό κανόνα από την BNF γραµµατική. Ο αλγόριθµος ξεκινάει µε το αρχικό σύµβολο της γραµµατικής και διαδοχικά δηµιουργεί την συµβολοσειρά του προγράµµατος αντικαθιστώντας µη τερµατικά σύµβολα µε το δεξιό µέρος του παραγωγικού κανόνα [O'Neill and Ryan 2001, Tsoulos et al 2005]. Η επιλογή του κατάλληλου κανόνα πραγµατοποιείται χρησιµοποιώντας τον παρακάτω σχέση: Rule=Bmod(RN) (4.31) όπου B είναι το συγκεκριµένο στοιχείο του χρωµοσώµατος και RN είναι ο αριθµός των κανόνων για το συγκεκριµένο µη τερµατικό σύµβολο. Αυτή η διαδικασία επιλογής επαναλαµβάνεται µέχρι να φτάσουµε στο τέλος του χρωµοσώµατος. Στην περίπτωση µας που αντικειµενικός σκοπός είναι η «κατασκευή» νέων χαρακτηριστικών, η έκφραση που αναπαριστάται σε ένα χρωµόσωµα είναι µία έκφραση που συνδυάζει τα αρχικά χαρακτηριστικά που «περιγράφουν» τα αντικείµενά µας. Με βάση αυτή την έκφραση, στα αντικείµενα µας αντιστοιχίζονται καινούρια διανύσµατα χαρακτηριστικών που το κάθε ένα από αυτά είναι µια µαθηµατική έκφραση των αρχικών χαρακτηριστικών. Σε αυτά τα καινούρια χαρακτηριστικά αντιστοιχίζεται µια τιµή καταλληλότητας, η οποία στην περίπτωση που έχουµε να κάνουµε µε κατηγοριοποίηση, πρόκειται για το σφάλµα του ταξινοµητή που χρησιµοποιείται. Με βάση αυτή την 89
Κεφάλαιο 4 ο τιµή τα νέα χαρακτηριστικά είτε θα γίνουν αποδεκτά είτε θα απορριφθούν σε κάποια από τις επόµενες γενεές. Η γραµµατική που χρησιµοποιήθηκε στα πλαίσια της διατριβής χρησιµοποιεί µαθηµατικές συναρτήσεις και τελεστές για µη-τερµατικά σύµβολα καθώς και ένα σύνολο από αρχικά χαρακτηριστικά ( ) γραµµατικής φαίνεται παρακάτω: x1, x2,..., x n και τα ψηφία (0-9) ως τερµατικά σύµβολα. Ένα παράδειγµα αυτής της S ::= <expr> <expr> ::= <expr> <op> <expr> <func> ( <expr> ) <op> ::= + - * / <digit> x 1 x 2... x n <func> ::= sin cos exp log <digit> ::= 0 1 2... 9 Αυτή η µέθοδος επιτρέπει, τον καθορισµό του αριθµού των νέων χαρακτηριστικών που θα κατασκευαστούν. Με αυτό τον τρόπο και επιλέγοντας ένα µικρό αριθµό από χαρακτηριστικά (π.χ 2 ή 3) εξαλείφεται κατά κάποιο τρόπο το γνωστό πρόβληµα που σχετίζεται µε τη µεγάλη διάσταση του διανύσµατος των χαρακτηριστικών (curse of dimensionality). Στην προτεινόµενη γραµµατική (όπως φαίνεται πιο πάνω) αν και χρησιµοποιήθηκαν οι συναρτήσεις sin, cos, exp, log, οποιαδήποτε άλλη συνάρτηση µπορεί επίσης να χρησιµοποιηθεί. Για περισσότερες λεπτοµέρειες για την εν λόγω µέθοδο ο αναγνώστης µπορεί να ανατρέξει στη σχετική βιβλιογραφία [O'Neill and Ryan 2001, Tsoylos et al. 2005]. 4.6 ηµιουργία συνθετικών παραδειγµάτων µε υπερδειγµατοληψία της µειοψηφούσας κατηγορίας (SMOTE: Synthetic Minority Over-sampling TΕchnique) Τα τελευταία χρόνια όλο και περισσότεροι ερευνητές από το πεδίο της µηχανικής µάθησης ασχολούνται µε το πρόβληµα της ανισοκατανοµής των παραδειγµάτων εκπαίδευσης ανάµεσα στις δύο (συνήθως) κατηγορίες ενός προβλήµατος ταξινόµησης (Chawla et al. 2004). Αυτό το πρόβληµα είναι ιδιαίτερα σοβαρό σε περιπτώσεις ιατρικών εφαρµογών, στις οποίες η κατηγορία η οποία περιλαµβάνει τους «ασθενείς» είναι πολύ µικρότερη από την κατηγορία των υγιών. 90
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ Για την αντιµετώπιση αυτού του «προβλήµατος» έχουν προταθεί διάφορες µέθοδοι. Μερικές από αυτές επιδρούν απευθείας κατά τη σχεδίαση του ταξινοµητή (π.χ. διαφορετικοί παράγοντες κόστους στην περίπτωση των διανυσµατικών µηχανών υποστήριξης). Άλλοι ερευνητές επεµβαίνουν µε συστηµατικό τρόπο και αλλάζουν τον ίδιο τον πληθυσµό των παραδειγµάτων είτε µειώνοντας τα παραδείγµατα τα οποία είναι σε περίσσια [Kubat and Matwin 1999] είτε αυξάνοντας τα παραδείγµατα για τα οποία αρχικά δεν έχουµε «επαρκή» δεδοµένα [Ling and Li 1998]. Στην δεύτερη κατηγορία των µεθόδων που επεµβαίνουν στον πληθυσµό των παραδειγµάτων εκπαίδευσης µε την αύξηση της κατηγορίας που περιέχει τα λιγότερα παραδείγµατα ανήκει και η µέθοδος η οποία δηµιουργεί συνθετικά παραδειγµάτα µε υπερδειγµατοληψία της µειοψηφούσας κατηγορίας [Chawla et al. 2002], Πιο συγκεκριµένα η τάξη-κατηγορία µε τα λιγότερα παραδείγµατα υπερ-δειγµατοληπτείται (oversampled) δηµιουργώντας «συνθετικά» (τεχνητά) δεδοµένα αντί της απλής υπερδειγµατοληψίας µε επανατοποθέτηση. Η προσέγγιση αυτή είναι εµπνευσµένη από µια τεχνική η οποία εφαρµόστηκε στην περίπτωση χειρόγραφων χαρακτήρων [Ha and Bunke 1997]. Η κατηγορία µε τα λιγότερα παραδείγµατα υπερ-δειγµατοληπτείται παίρνοντας κάθε παράδειγµα της κατηγορίας και δηµιουργώντας/εισάγοντας συνθετικά παραδείγµατα κατά µήκος των ευθυγράµµων τµηµάτων που ενώνουν το συγκεκριµένο παράδειγµα µε κάποια ή και όλα τα k πιο κοντινά του παραδείγµατα (της ίδιας κατηγορίας). Ανάλογα µε το ποσοστό της υπερδειγµατοληψίας που απαιτείται, γειτονικά δείγµατα από τα k πιο κοντινά επιλέγονται τυχαία. Για παράδειγµα αν απαιτείται υπερδειγµατοληψία 200% και χρησιµοποιούµε τους 5 κοντινότερους γείτονες τότε από τα 5 αυτά δείγµατα επιλέγονται 2 και από ένα νέο δείγµα δηµιουργείται πάνω στα τµήµατα που ενώνουν το αρχικό δείγµα µε κάθε ένα από τα δύο που επιλέχθηκαν τυχαία (µεταξύ των 5 πιο κοντινών). Αυτό πραγµατοποιείται υπολογίζοντας τη διαφορά ανάµεσα στα δύο διανύσµατα (παραδείγµατα), του διανύσµατος υπό εξέταση και του κοντινού γείτονα, και στη συνέχεια µε πολλαπλασιασµό της διαφοράς µε ένα τυχαίο αριθµό ανάµεσα στο 0, 1 (κανονική κατανοµή) και τέλος πρόσθεση της στο αρχικό δείγµα. Στο Σχήµα 4.12. µε κύκλους αναπαριστώνται τα παραδείγµατα που ανήκουν στην κατηγορία µε τα «λίγα» παραδείγµατα. Με τετράγωνα τα παραδείγµατα που «πλεονάζουν» και µε κύκλους µε γκρι χρώµα τα συνθετικά παραδείγµατα που αντιστοιχούν στο «κεντρικό» παράδειγµα. 91
Κεφάλαιο 4 ο Σχήµα 4.12: SMOTE µε 200% υπερδειγµατοληψία και 5 γείτονες. 4.7 Σύνοψη Αυτό το κεφάλαιο µπορεί να χωριστεί σε 2 ενότητες. Στην πρώτη ενότητα αναπτύχθηκαν οι τεχνικές που χρησιµοποιήθηκαν για την εξαγωγή κατάλληλων χαρακτηριστικών από το σήµα της ΕΚΣ έτσι ώστε να χρησιµοποιηθούν ως είσοδοι σε κάποιον από τους ταξινοµητές που περιγράφονται στο επόµενο κεφάλαιο. Αρχικά παρουσιάστηκαν τα χαρακτηριστικά που εξάγονται στο πεδίο του χρόνου καθώς και στο πεδίο της συχνότητας και στη συνέχεια παρουσιάστηκαν τα «µορφολογικά» χαρακτηριστικά και οι αλγόριθµοι που χρησιµοποιήθηκαν για την εξαγωγή τους. Κατόπιν έγινε µία σύντοµη παρουσίαση του διακριτού µετασχηµατισµού κυµατιδίου καθώς και του τρόπου µε τον οποίο οι συντελεστές που προκύπτουν από το διακριτό µετασχηµατισµό κυµατιδίου της ΕΚΣ επεξεργάστηκαν ώστε να δώσουν κατάλληλα χαρακτηριστικά. Επίσης παρουσιάστηκε και η µέθοδος ανάλυσης σε ανεξάρτητες συνιστώσες η οποία χρησιµοποιήθηκε για πρώτη φορά για την εξαγωγή χαρακτηριστικών από σήµατα ΕΚΣ. Στη δεύτερη ενότητα αρχικά παρουσιάστηκε εν συντοµία η µέθοδος ανάλυσης σε πρωταρχικές συνιστώσες για τη µείωση της διάστασης του διανύσµατος των χαρακτηριστικών. Στη συνέχεια αναλύθηκε ο τρόπος µε τον οποίο µπορεί να χρησιµοποιηθεί η εξελικτική γραµµατική για την «κατασκευή» νέων χαρακτηριστικών από ήδη υπάρχοντα. Στο τέλος παρουσιάστηκε η τεχνική δηµιουργίας συνθετικών παραδειγµάτων µε υπερδειγµατοληψία της µειοψηφούσας κατηγορίας. Η τελευταία αυτή µέθοδος χρησιµοποιήθηκε για 92
Εξαγωγή χαρακτηριστικών Προεπεξεργασία του σήµατος της ΕΚΣ να δώσει λύση στο πρόβληµα της ανισοκατανοµής που παρατηρείται λόγω του µειωµένου αριθµού εµβρύων που γεννιούνται µε χαµηλό ph. 93
Κεφάλαιο 4 ο 94
Μέθοδοι Ταξινόµησης Κεφάλαιο 5 ο Μέθοδοι Ταξινόµησης 5.1 Εισαγωγή Μετά από το στάδιο της εξαγωγής χαρακτηριστικών από το σήµα της ΕΚΣ και µετά από το στάδιο της επιλογής (ή και µείωσης της διάστασης του διανύσµατος των χαρακτηριστικών) πρέπει να επιλεγεί ένας κατάλληλος ταξινοµητής (classifier) ο οποίος να είναι σε θέση να ταξινοµεί σωστά τα αντικείµενα/έµβρυα (τα οποία αντιπροσωπεύονται από το διάνυσµα των χαρακτηριστικών τους) «όσο το δυνατόν καλύτερα». Σε αυτή την ενότητα θα επικεντρωθούµε δηλαδή στο τέταρτο µπλοκ της συνολικής προσέγγισης ταξινόµησης (Σχήµα 5.1). Σχήµα 5.1: Ένα γενικό σύστηµα ταξινόµησης Πρέπει να επισηµανθεί ότι για κάθε πραγµατικό πρόβληµα αναγνώρισης προτύπων ή πιο απλά σε κάθε πρόβληµα ταξινόµησης (κατηγοριοποίησης) συνήθως δεν είναι δυνατόν να δηµιουργηθεί ένα αλάνθαστο σύστηµα και ως εκ τούτου περιµένουµε σχεδόν πάντα ένα ποσοστό από λανθασµένες κατηγοριοποιήσεις. Αυτό µπορεί να συµβαίνει για διάφορους λόγους [Sa 2001]: Α) Τα χαρακτηριστικά τα οποία χρησιµοποιούνται είναι ανεπαρκή ή ακατάλληλα Β) Τα δείγµατα τα οποία χρησιµοποιήθηκαν για να εκπαιδευτεί και να κατασκευαστεί ο ταξινοµητής δεν είναι αντιπροσωπευτικά Γ) Ο ταξινοµητής δεν είναι επαρκής για να διαχωρίσει τις διαφορετικές κατηγορίες ) Υπάρχει ενδογενής επικάλυψη µεταξύ των διαφορετικών κατηγοριών Συνεπώς αυτό το οποίο αναζητούµε είναι έναν ταξινοµητή που να πετυχαίνει «αρκετά καλά» ή αποδεκτά αποτελέσµατα. Στα πλαίσια της συγκεκριµένης ερευνητικής προσπάθειας εξετάστηκαν αρκετοί διαφορετικοί ταξινοµητές µε ποικίλα αποτελέσµατα. Στη συνέχεια θα τους παραθέσουµε µε αρκετή συντοµία προσπαθώντας όµως για χάρη της συντοµίας να µη θυσιάσουµε τη σαφήνεια. Η παρουσίαση θα γίνει ξεκινώντας από τους πιο απλούς και καταλήγοντας σε πιο «περίπλοκους». Στο 95
i i Κεφάλαιο 5 ο τέλος αυτού του κεφαλαίου θα παρουσιάσουµε και ένα υβριδικό µοντέλο το οποίο αντιµετωπίζει ενιαία το πρόβληµα της εξαγωγής χαρακτηριστικών και της κατηγοριοποίησης. 5.2 Συµβατικοί Ταξινοµητές 5.2.1 Ταξινόµηση µε βάση τους k πιο κοντινούς γείτονες (k-nearest Neighbor rule (knn)) O ταξινοµητής που βασίζεται στους k πιο κοντινούς γείτονες, λειτουργεί µε βάση την παρακάτω αρχή: δοσµένου ενός συνόλου παραδειγµάτων εκπαίδευσης (µε τις «ετικέτες» τους) και έναν τρόπο µέτρηση απόστασης, κατηγοριοποιεί κάθε νέο δείγµα µε βάση τους πιο k κοντινούς του γείτονες. ηλαδή από τα N παραδείγµατα εκπαίδευσης, ο ταξινοµητής βρίσκει τα k πιο κοντινά παραδείγµατα (χρησιµοποιώντας κάποιο συγκεκριµένο τρόπο υπολογισµού της απόστασης), ανεξάρτητα από την κατηγορία στην οποία ανήκουν. Στην περίπτωση που έχουµε 2 µόνο κατηγορίες ο αριθµός k των κοντινότερων γειτόνων επιλέγεται περιττός, και στη γενική περίπτωση επιλέγεται τέτοιος ώστε να µην είναι πολλαπλάσιος του αριθµού των κατηγοριών Μ. Από τα k αυτά δείγµατα, βρίσκουµε των αριθµό M i= 1 k i = k k των δειγµάτων που ανήκουν στην κατηγορία ω, = 1,2,... M (προφανώς i ) και κατηγοριοποιούµε το νέο δείγµα στην τάξη ω i µε τον µέγιστο αριθµό δειγµάτων k i. Η πιο απλή µορφή του αλγορίθµου είναι για k=1 η οποία είναι γνωστή ως ο κανόνας του πιο κοντινού γείτονα (Nearest Neighbor (ΝΝ) rule) [Duda et al. 2001]. 5.2.2 Γραµµικοί και Τετραγωνικοί ταξινοµητές (Linear and quadratic classifiers) Για τους γραµµικούς και τετραγωνικούς ταξινοµητές θεωρούµε ότι έχουµε κατηγορίες οι οποίες χαρακτηρίζονται από κανονικές κατανοµές. ηλαδή θεωρούµε ότι τα διανύσµατα µε τις µετρήσεις/χαρακτηριστικά τα οποία προέρχονται από ένα αντικείµενο που ανήκει στην κατηγορία είναι κανονικά κατανεµηµένα µε µέση τιµή µ k και πίνακα συσχέτισης C k : ω k p ( x ω ) ( 2 p) T 1 ( x µ ) C ( x µ ) 1 k k k k = exp N 2 C k (5.1) όπου Ν είναι το πλήθος των µετρήσεων-χαρακτηριστικών. Τότε ο ταξινοµητής ελαχίστου σφάλµατος (minimum error rate classifier) δίνεται από την παρακάτω εξίσωση 5.2: 96
k k k k k k k k k k 1 1 k Τ Μέθοδοι Ταξινόµησης ˆ ω ( x ) = ω T T µε i= arg max{ wk + xwk + xwx k } k i (5.2) όπου ( ) 1 w = ln C + 2ln P ω µcµ w = 2Cµ W = C Ο παραπάνω ταξινοµητής καλείται τετραγωνικός ταξινοµητής (quadratic classifier) και η συνάρτηση απόφασης είναι µια τετραγωνική συνάρτηση. ηλαδή τα όρια µεταξύ των κατηγοριών αποτελούνται από τετραγωνικές υπερεπιφάνειες στον Ν-διάστατο χώρο των µετρήσεωνχαρακτηριστικών (όπως φαίνεται στο Σχήµα 5.2 για την περίπτωση των 2 διαστάσεων) [Duda et al. 2001]. 10 8 6 4 2 0-2 -2 0 2 4 6 8 10 Σχήµα 5.2: Τετραγωνικός ταξινοµητής για την περίπτωση ενός δισδιάστατου διανύσµατος χαρακτηριστικών. 97
Κεφάλαιο 5 ο Στην περίπτωση που οι πίνακες συσχέτισης δεν εξαρτώνται από την κατηγορία, δηλαδή C = C k για όλες τις τάξεις ωk Ω, η προηγούµενη τετραγωνική συνάρτηση απόφασης εκφυλλίζεται σε γραµµική (υπερεπίπεδα αντί για τετραγωνικές υπερεπιφάνειες). Οπότε για αυτή την περίπτωση ο ταξινοµητής ελαχίστου σφάλµατος (minimum error rate classification) δίνεται από την παρακάτω εξίσωση 5.3: ˆ ω ( x ) = ω T µε i= arg max{ wk +xw k} k i (5.3) όπου w = 2C µ 1 k k k Τ 1 ( ) w = 2lnP ω µc µ k k k k k Καθώς η παραπάνω συνάρτηση είναι γραµµική, ο αντίστοιχος ταξινοµητής καλείται γραµµικός (linear classifier) Σχήµα 5.3 [Duda et al. 2001]. 10 8 6 4 2 0-2 -2 0 2 4 6 8 10 Σχήµα 5.3: Γραµµικός ταξινοµητής για την περίπτωση ενός δισδιάστατου διανύσµατος χαρακτηριστικών. 98
Μέθοδοι Ταξινόµησης Οι παραπάνω ταξινοµητές έχουν χρησιµοποιηθεί σε αρκετές περιπτώσεις ως µέτρο σύγκρισης για πιο «ισχυρούς» ταξινοµητές οι οποίοι είναι σε θέση να δηµιουργούν πιο πολύπλοκες διαχωριστικές επιφάνειες. 5.3 Τεχνητά Νευρωνικά ίκτυα (Artificial Neural Networks) Ο ανθρώπινος εγκέφαλος αποτελεί ένα πολύπλοκο, µη γραµµικό και µε παράλληλη δοµή σύστηµα επεξεργασίας πληροφοριών. Με αυτή τη διαπίστωση ο άνθρωπος προσπάθησε να δηµιουργήσει µία αντιγραφή του ανθρωπίνου εγκεφάλου δηµιουργώντας τα Τεχνητά Νευρωνικά ίκτυα (ΤΝ ) (artificial neural networks (ANN)). Στην πορεία (και µέχρι σήµερα) διαπιστώθηκε ότι κάτι τέτοιο είναι πολύ δύσκολο να γίνει (αγγίζοντας τα όρια της επιστηµονικής φαντασίας) αλλά παρόλα αυτά τα νευρωνικά δίκτυα όπως αυτά διαµορφώθηκαν τις τελευταίες 3 δεκαετίες εξακολουθούν να χρησιµοποιούνται σε πάρα πολλές εφαρµογές. Εάν όµως ένα νευρωνικό δίκτυο δεν αποτελεί µια µικρογραφία του εγκεφάλου τότε τι ακριβώς είναι; Αντιγράφοντας από τον Haykin [Haykin 1999]: «Νευρωνικό δίκτυο είναι ένας µαζικά παράλληλος, κατανεµηµένος επεξεργαστής ο οποίος απαρτίζεται από απλές µονάδες επεξεργασίας οι οποίες έχουν µια φυσική ροπή να αποθηκεύουν εµπειρική γνώση την οποία µπορούν να «ανασύρουν» για χρήση στο µέλλον. Μοιάζουν µε τον εγκέφαλο σε δύο σηµεία: Α) Η γνώση λαµβάνεται µε την αλληλεπίδραση του δικτύου µε το περιβάλλον µέσω µίας διαδικασίας µάθησης. Β) Η ισχύς των συνδέσεων ανάµεσα στους νευρώνες, τα οποία ονοµάζονται συναπτικά βάρη, χρησιµοποιούνται για την αποθήκευση της γνώσης που έχει αποκτηθεί, µέσω της διαδικασίας της µάθησης». Πρέπει να τονισθεί ότι οι νευρώνες που χρησιµοποιούµε για να κατασκευάσουµε ένα νευρωνικό δίκτυο είναι «πρωτόγονοι» συγκρινόµενοι µε αυτούς που συναντάµε στον ανθρώπινο εγκέφαλο. Η διαδικασία µάθησης η οποία καλείται αλγόριθµος εκπαίδευσης, τροποποιεί τα συναπτικά βάρη του δικτύου για να επιτύχει κάποιο επιθυµητό αποτέλεσµα. Στην περίπτωση της αναγνώρισης προτύπων το επιθυµητό αποτέλεσµα είναι η ταξινόµηση αντικειµένων στη σωστή κατηγορία µε βάση το διάνυσµα των µετρήσεων-χαρακτηριστικών. Ανάλογα µε τον τρόπο που πραγµατοποιείται η εκπαίδευση οι αλγόριθµοι µπορούν να χωριστούν σε 2 µεγάλες κατηγορίες: 1) αλγόριθµοι εκπαίδευσης µε επίβλεψη (supervised learning) και 2) αλγόριθµοι εκπαίδευσης χωρίς επίβλεψη (unsupervised learning). 99
Κεφάλαιο 5 ο Επίσης τα νευρωνικά δίκτυα χωρίζονται επιπλέον σε 2 βασικές κατηγορίες ανάλογα µε τη δοµή τους: 1) δίκτυα εµπρόσθιας διάδοσης (feedforward networks) και 2) ανατροφοδοτούµενα δίκτυα (recurrent networks ) Στο πεδίο της αναγνώρισης προτύπων τα πιο συχνά χρησιµοποιηµένα δίκτυα είναι τα δίκτυα εµπρόσθιας διάδοσης και ανάµεσα στα διαφορετικά δίκτυα εµπρόσθιας διάδοσης το πολυεπίπεδο δίκτυο perceptron (multilayer perceptron (MLP)) και το δίκτυο ακτινικών συναρτήσεων βάσης (Radial Basis Function network (RBF)) έχουν την πιο διαδεδοµένη χρήση [Bishop 1995, Haykin 1999]. 5.3.1 Πολυεπίπεδο ίκτυο Perceptron (Multilayer Perceptron (MLP)) Το πολυεπίπεδο δίκτυο perceptron είναι ένα νευρωνικό δίκτυο εµπρόσθιας διάδοσης το οποίο εκπαιδεύεται µε τη χρήση επίβλεψης. Σχηµατικά µπορεί να παρασταθεί όπως φαίνεται στο Σχήµα 5.4. Σχήµα 5.4: Το πολυεπίπεδο δίκτυο perceptron Ένα πολυεπίπεδο δίκτυο perceptron όπως υποδηλώνει και η ονοµασία του απαρτίζεται από πολλαπλά επίπεδα (τουλάχιστον τρία): Α) το επίπεδο εισόδου το οποίο δέχεται είσοδο από το «περιβάλλον», 100
Μέθοδοι Ταξινόµησης Β) το επίπεδο εξόδου το οποίο επίσης αλληλεπιδρά µε το «περιβάλλον» (εξαγωγή των αποτελεσµάτων) και Γ) ένα ή περισσότερα επίπεδα µεταξύ των επιπέδων εισόδου και εξόδου τα οποία καλούνται για ευνόητους λόγους κρυφά επίπεδα. Τα κρυφά επίπεδα παίζουν τον πιο καθοριστικό ρόλο στο νευρωνικό δίκτυο εξάγοντας χρήσιµα χαρακτηριστικά που περιέχονται στα αρχικά δεδοµένα. Το επίπεδο εισόδου από µερικούς ερευνητές δεν θεωρείται «κανονικό» επίπεδο, και δεν προσµετράτε ως τέτοιο, επειδή δεν είναι εφοδιασµένο µε νευρώνες. Οι νευρώνες αποτελούν τα πρωταρχικά δοµικά συστατικά του νευρωνικού δικτύου και χαρακτηρίζονται από τη συνάρτηση ενεργοποίησης που εµπεριέχουν. Στην περίπτωση του πολυεπίπεδου perceptron η συνάρτηση αυτή είναι κάποια σιγµοειδής συνάρτηση. Μπορεί να είναι είτε 1 exp( x) συµµετρική όπως η υπερβολική εφαπτοµένη f( x) =, είτε µη συµµετρική όπως η λογιστική 1 + exp( x) συνάρτηση 1 f( x) =. Στο Σχήµα 5.5 απεικονίζονται οι δύο πιο συνήθεις συναρτήσεις 1 + exp( x) ενεργοποίησης. 1.5 1 0.5 0-0.5-1 -1.5-5 0 5 1.5 1 0.5 0-0.5-1 -1.5-5 0 5 Σχήµα 5.5: Στα αριστερά η γραφική απεικόνιση της υπερβολικής εφαπτοµένης και στα δεξιά της λογιστικής συνάρτησης. Στα µέσα της δεκαετίας του 80 προτάθηκε ο αλγόριθµος οπισθόδροµης διάδοσης του σφάλµατος (back propagation of error) ο οποίος εκπαιδεύει τα πολυεπίπεδα δίκτυα perceptron χρησιµοποιώντας ένα σύνολο από παραδείγµατα εκπαίδευσης. Παρόλο που ο αλγόριθµος οπισθόδροµης διάδοσης του 101
Κεφάλαιο 5 ο σφάλµατος λόγω κάποιον ενδογενών προβληµάτων έχει αντικατασταθεί από άλλους πιο γρήγορους και πιο «αποτελεσµατικούς» [Bishop 1995] η βασική φιλοσοφία εκπαίδευσης όµως παραµένει η ίδια. Συνεχίζει να στηρίζεται στην εποπτεία, δηλαδή στην ύπαρξη ενός συνόλου παραδειγµάτων τα οποία θεωρείται δεδοµένο ότι είναι σωστά ταξινοµηµένα, και στην προσαρµογή των συναπτικών βαρών ώστε να ελαχιστοποιείται κάποιο κριτήριο συνάρτηση σφάλµατος. Η πιο συνήθης συνάρτηση σφάλµατος (αν και ίσως όχι η καταλληλότερη στην περίπτωση που το ζητούµενο είναι η αναγνώριση προτύπων) είναι το µέσο τετραγωνικό σφάλµα [Haykin 1999, Bishop 1995]. Ο λόγος για τον οποίο το πολυεπίπεδο δίκτυο perceptron έχει βρει ευρεία εφαρµογή στο πεδίο της αναγνώρισης προτύπων οφείλεται στο γεγονός ότι µπορεί να κατασκευάσει πολύπλοκες µη γραµµικές επιφάνειες διαχωρισµού (Σχήµα 5.6) µεταξύ των διαφορετικών κατηγοριών και µάλιστα χωρίς την ανάγκη για διατύπωση κάποιων παραδοχών (π.χ. πιθανοτικών κατανοµών των παραδειγµάτων), εντοπίζοντας τυχόν συσχετίσεις σε έναν πολυδιάστατο χώρο µεταξύ των χαρακτηριστικών, κάτι που µε µια πρώτη µατιά φαίνεται αδύνατο. Αυτή τους η δυνατότητα αποτελεί από την άλλη µεριά και το µεγαλύτερο µειονέκτηµά τους γιατί η δυνατότητα τους για δηµιουργία πολύ πολύπλοκων διαχωριστικών επιφανειών µπορεί να οδηγήσει σε υπερεκπαίδευση και απώλεια της δυνατότητας να γενικεύουν µε επιτυχία [Haykin 1999]. Χρησιµοποιώντας ένα δίκτυο µε πάρα πολλές ελεύθερες παραµέτρους µπορούµε να επιτύχουµε µηδενικό σφάλµα στο σύνολο εκπαίδευσης, χωρίς όµως να εξασφαλίζουµε και µικρό σφάλµα στην περίπτωση που δοκιµάσουµε τον ταξινοµητή σε ένα δεύτερο σύνολο (σύνολο ελέγχου) το οποίο δεν χρησιµοποιήθηκε κατά τη διάρκεια της φάσης της εκπαίδευσης [Haykin 1999]. 102
Μέθοδοι Ταξινόµησης 10 10 8 8 6 6 4 4 2 2 0 0-2 -2 0 5 10 0 5 10 Σχήµα 5.6: Η διαχωριστική επιφάνεια που δηµιουργείται από ένα πολυεπίπεδο δίκτυο perceptron µε 3 (αριστερά) και 8 (δεξιά) νευρώνες στο κρυφό επίπεδο. Ένα άλλο ζήτηµα όσον αφορά τη χρήση των νευρωνικών δικτύων γενικότερα είναι αυτό της επιλογής της κατάλληλης τοπολογίας. ηλαδή: Α) του αριθµού των κρυφών επιπέδων, Β) του αριθµού των νευρώνων ανά επίπεδο και Γ) τον τύπο της συνάρτησης ενεργοποίησης. Όλα τα παραπάνω σε συνδυασµό µε την ανάγκη καθορισµού ορισµένων παραµέτρων κατά τη διάρκεια της εκπαίδευσης συνηγορούν στη διαπίστωση ότι η χρήση των νευρωνικών δικτύων θα πρέπει να γίνεται µε προσοχή για την αποφυγή των προαναφερθέντων προβληµάτων και την όσο το δυνατόν καλύτερη εκµετάλλευση των δυνατοτήτων τους. Για περισσότερες πληροφορίες ο ενδιαφερόµενος αναγνώστης µπορεί να ανατρέξει στη σχετική βιβλιογραφία [Haykin 1999, Bishop 1995, Ripley 1996]. 103
Κεφάλαιο 5 ο 5.3.2 Νευρωνικά δίκτυα ακτινικών συναρτήσεων βάσης (Radial Basis Function (RBF) networks) Ένα άλλο επίσης πολύ επιτυχηµένο δίκτυο εµπρόσθιας διάδοσης, είναι το δίκτυο ακτινικών συναρτήσεων βάσης, η γενική δοµή του οποίου απεικονίζεται στο Σχήµα 5.7. Τα δίκτυα ακτινικών συναρτήσεων βάσης χρησιµοποιούν για την εκπαίδευσή τους µια διαδικασία η οποία βασίζεται κατά ένα τρόπο στη λειτουργία της µνήµης (memory-based learning) [Haykin 1999]. Πιο συγκεκριµένα η εκπαίδευση αντιµετωπίζεται ως ένα πρόβληµα παρεµβολής καµπύλης (curve-fitting) σε ένα πολυδιάστατο χώρο [Poggio and F. Girrosi 1999]: Η εκπαίδευση αντιστοιχεί στην εύρεση µια επιφάνειας σε ένα πολυδιάστατο χώρο η οποία προσαρµόζεται βέλτιστα ανάλογα µε το σύνολο παραδειγµάτων εκπαίδευσης. Η γενίκευση (δηλαδή η απόκριση του δικτύου σε δεδοµένα εισόδου που δεν έχουν χρησιµοποιηθεί κατά την εκπαίδευση) αντιστοιχεί στη χρήση αυτή της πολυδιάστατης επιφάνειας για την παρεµβολή των δεδοµένων ελέγχου (test data) w 1 w0 = b n i= 0 ( i ) h( x) = wφ x x i w n Σχήµα 5.7: Ένα δίκτυο ακτινικών συναρτήσεων βάσης Στο Σχήµα 5.7 απεικονίζεται ένα δίκτυο ακτινικών συναρτήσεων βάσης και η έξοδος του (στη γενική περίπτωση έχουµε περισσότερες από µία εξόδους αλλά η αντιµετώπιση είναι η ίδια) είναι το 104
Μέθοδοι Ταξινόµησης σταθµισµένο άθροισµα µιας σειράς συναρτήσεων φ(d) όπου d η απόσταση µεταξύ εισόδου και ενός πρωτοτύπου (τα πρωτότυπα αυτά αποτελούν παραµέτρους του δικτύου). Η πιο συχνά χρησιµοποιούµενη συνάρτηση είναι η γκαουσιανή συνάρτηση 1 2σ x x 2. φ i = exp 2 i Η χρήση ενός γραµµικού επιπέδου εξόδου στην περίπτωση του δικτύου ακτινικών συναρτήσεων βάσης µπορεί να δικαιολογηθεί υπό το πρίσµα του θεωρήµατος του Cover για τη διαχωρισιµότητα των προτύπων [Haykin 1999]. Σύµφωνα µε αυτό το θεώρηµα, µε την προϋπόθεση ότι ο µετασχηµατισµός από το επίπεδο εισόδου στο (κρυφό) επίπεδο των χαρακτηριστικών είναι µη γραµµικός και η διάσταση του χώρου των χαρακτηριστικών είναι αρκετά µεγαλύτερη από τη διάσταση του διανύσµατος εισόδου (χώρου εισόδου), τότε υπάρχει µεγάλη πιθανότητα ένα πρόβληµα που ήταν µη (γραµµικά) διαχωρίσιµο στο χώρο εισόδου να είναι γραµµικά διαχωρίσιµο στο χώρο των χαρακτηριστικών. Υπάρχουν διάφορες µέθοδοι για την σχεδίαση δικτύων ακτινικών συναρτήσεων βάσης (επιλογή αριθµού και κέντρων των συναρτήσεων βάσης): Επιλογή των κέντρων µε τυχαίο τρόπο [D. S. Broomhead and D. Low 1988]. Επιλογή των κέντρων ύστερα από µια διαδικασία αυτοργάνωσης [Moody and Darken 1989]. Επιλογή των κέντρων µε εποπτεία [Poggio and Girrosi 1990]. Συνήθως τα κέντρα των συναρτήσεων βάσης έχει επικρατήσει να επιλέγονται µε κάποιο αλγόριθµο χωρίς επίβλεψη ενώ τα βάρη ανάµεσα στο κρυφό επίπεδο και το επίπεδο εξόδου καθορίζονται µε τη µέθοδο των ελαχίστων τετραγώνων. Συνεπώς οι παράµετροι των δύο επιπέδων ενός δικτύου ακτινικών συναρτήσεων βάσης εκπαιδεύονται (ως επί το πλείστων) ανεξάρτητα και αυτό έχει σαν αποτέλεσµα τον µικρό χρόνο εκπαίδευσης. 5.3.3 ιαφορές µεταξύ των δικτύων ακτινικών συναρτήσεων βάσης και πολυεπίπεδων δικτύων perceptron Τα δίκτυα ακτινικών συναρτήσεων βάσης και τα πολυεπίπεδα δίκτυα perceptron διαφέρουν σε ορισµένα βασικά σηµεία: 105
Κεφάλαιο 5 ο Τα δίκτυα ακτινικών συναρτήσεων βάσης πραγµατοποιούν τοπική προσέγγιση (local approximators) ενώ τα πολυεπίπεδα δίκτυα perceptron πραγµατοποιούν ολική προσέγγιση (global approximators). Τα δίκτυα ακτινικών συναρτήσεων βάσης έχουν µόνο ένα κρυφό επίπεδο νευρώνων, ενώ τα πολυεπίπεδα δίκτυα perceptron µπορεί να έχουν ένα οποιοδήποτε αριθµό κρυφών επιπέδων Το επίπεδο εξόδου σε ένα δίκτυο ακτινικών συναρτήσεων βάσης είναι πάντα γραµµικό, ενώ σε ένα πολυεπίπεδο δίκτυο perceptron µπορεί να είναι είτε γραµµικό είτε µη γραµµικό. Η συνάρτηση ενεργοποίησης στο κρυφό επίπεδο ενός δικτύου ακτινικών συναρτήσεων βάσης συνήθως υπολογίζει την ευκλείδεια απόσταση ανάµεσα στο διάνυσµα εισόδου και ενός διανύσµατος παραµέτρων του δικτύου, ενώ η συνάρτηση ενεργοποίησης ενός πολυεπίπεδου δικτύου perceptron υπολογίζει το εσωτερικό γινόµενο ανάµεσα στο διάνυσµα εισόδου και του αντίστοιχου διανύσµατος παραµέτρων (το διάνυσµα των συναπτικών βαρών). 5.4 Μηχανές διανυσµάτων υποστήριξης (Support Vector Machines (SVMs)) Οι Μηχανές ιανυσµάτων Υποστήριξης είναι συστήµατα τα οποία «µαθαίνουν» χρησιµοποιώντας µια αλγοριθµική προσέγγιση που βασίζεται στη θεωρία βελτιστοποίησης [Burges 1998, Shawe- Taylor and. Cristianini, 2004, Vapnik 1995, Muller et al. 2001]. Είναι κατάλληλα ακόµα και για προβλήµατα µε µικρό αριθµό δεδοµένων και δεν βασίζονται σε εκ των πρότερων γνώση σχετικά µε το υπό εξέταση πρόβληµα. Στόχος ενός ταξινοµητή βασιζόµενου σε διανύσµατα υποστήριξης είναι να «κατασκευάσει» το βέλτιστο διαχωριστικό υπερεπίπεδο σε ένα πολυδιάστατο χώρο χαρακτηριστικών (feature space). Με τον όρο «βέλτιστο» εννοούµε ότι στην περίπτωση γραµµικά διαχωρίσιµων κατηγοριών το υπερεπίπεδο που θα κατασκευαστεί ( w,b) θα είναι αυτό µε το µέγιστο περιθώριο (ή απόσταση) από τα πιο κοντινά παραδείγµατα σε αυτό τον πολυδιάστατο χώρο των χαρακτηριστικών. Στο Σχήµα 5.8 απεικονίζεται ο διαχωρισµός ενός δισδιάστατου χώρου όπου µε έντονο κύκλο φαίνονται τα διανύσµατα υποστήριξης. 106
Μέθοδοι Ταξινόµησης 3 2.5 2 1.5 1 2 1 0 0.5 0-0.5-1 -1-0.5 0 0.5 1 1.5 2 2.5 3-1 -2-3 Σχήµα 5.8: Απεικόνιση της δηµιουργίας ενός γραµµικού ταξινοµητή µε µεγιστοποίηση του περιθωρίου. ιαισθητικά η µεγιστοποίηση του περιθωρίου οδηγεί σε πιο σθεναρούς ταξινοµητές οι οποίοι δεν εµφανίζουν το γνωστό πρόβληµα της υπερεκπαίδευσης (overtraining) ή καλύτερα της υπερπροσαρµογής (overfitting) στα δεδοµένα εκπαίδευσης. Στην περίπτωση που στα δεδοµένα υπάρχει και µια ποσότητα θορύβου (δηλαδή στην περίπτωση που ή έχουµε λανθασµένες µετρήσεις ή που οι παράµετροι που έχουν επιλεγεί δεν είναι οι κατάλληλες ή δεν υπάρχουν τέτοιες παράµετροι ή και όλα τα παραπάνω) τότε ως επί τω πλείστον δεν είναι δυνατή η γραµµική διαχωρισιµότητα στο χώρο των χαρακτηριστικών. Οπότε σε αυτή την περίπτωση ο ταξινοµητής µε το µέγιστο περιθώριο πρέπει να τροποποιηθεί για να αντιµετωπιστεί το πρόβληµα. Σε αυτή την περίπτωση έχουµε τον λεγόµενο ταξινοµητή εύκαµπτου περιθωρίου (soft margin) ο οποίος προκύπτει από το παρακάτω τετραγωνικό πρόβληµα βελτιστοποίησης l { } = 1 Έχοντας l παρατηρήσεις - D= ( x, y ) i i i Ελαχιστοποιούµε την ποσότητα µε την προϋπόθεση να ισχύει ( ) i 1 2 ( i ) 1 l 2 T w + C ξi µε i= arg max{ wk +xw k} i= 1 k y w φ x + b ξ και ξ 0, i= 1,2,..., l i i (5.4) 107
Κεφάλαιο 5 ο όπου ξ i είναι µεταβλητές οι οποίες εισάγονται έτσι ώστε να επιτρέψουν παραβίαση των περιορισµών του περιθωρίου (slack variables) (των περιορισµών που σχετίζονται µε το περιθώριο). Η παράµετρος C ελέγχει τις αλληλοσυγκρουόµενες απαιτήσεις για µεγιστοποίηση του περιθωρίου και για ελαχιστοποίηση του σφάλµατος ταξινόµησης. Στην πράξη αυτή η παράµετρος µεταβάλλεται εντός ενός ευρέου φάσµατος και η βέλτιστη απόδοση εκτιµάται χρησιµοποιώντας ένα ξεχωριστό σετ δεδοµένων το οποίο δεν έχει χρησιµοποιηθεί κατά την εκπαίδευση (validation set) [Muller et al. 2001, Cristianini and Shawe-Taylor 2000, Haykin 1999]. Η συνάρτηση φ ( ) αναπαριστά τη µη γραµµική απεικόνιση από το χώρο εισόδου (input space) στον χώρο των χαρακτηριστικών. Η συνάρτηση που χρησιµοποιείται για το διαχωρισµό δίνεται από τη σχέση: l f ( x) = sign yiai φ( xi) φ( x i) + b, i= 1,2,..., l (5.5) i= 1 όπου οι συντελεστές a i βρίσκονται από τη µεγιστοποίηση της Lagrangian συνάρτησης: l 1 ai aiajyiyj φ( xi) φ( x j) i= 1 l 2 i, j = 1 (5.6) υπό την προϋπόθεση ότι l yiαi = 0 και 0 αi C για i = 1, 2,..., l i= 1 Τα σηµεία (παραδείγµατα) για τα οποία ισχύει a i >0, ονοµάζονται διανύσµατα υποστήριξης και πρόκειται για τα σηµεία τα οποία βρίσκονται πιο κοντά στο διαχωριστικό υπερεπίπεδο. Στο Σχήµα 5.9 απεικονίζονται µε έντονο κύκλο τα διανύσµατα υποστήριξης και µε τετράγωνο τα παραδείγµατα για οποία έχουµε ξ i > 0. 108
Μέθοδοι Ταξινόµησης 4 3 2 2 1 0-1 -2-3 1.5 1 0.5 0-0.5-4 -1-5 -6-4 -2 0 2 4 Σχήµα 5.9: Απεικόνιση της δηµιουργία ενός µη γραµµικού ταξινοµητή µε τη χρήση µηχανής διανυσµάτων υποστήριξης. Εάν η µη γραµµική συνάρτηση επιλεγεί «προσεκτικά», τότε το εσωτερικό γινόµενο στο χώρο των χαρακτηριστικών µπορεί να γραφεί στην ακόλουθη µορφή: ( ) ( ) = K(, ) φ x φ x x x (5.7) i j i j όπου το K καλείται πυρήνας εσωτερικού γινοµένου (inner-product kernel) [Burges 1998; Shawe- Taylor and Cristianini, 2004; Vapnik 1995; Muller et al. 2001]. ιαφορετικοί ταξινοµητές µε διαφορετικές υπερεπιφάνειες µπορούν να κατασκευαστούν ανάλογα µε την επιλογή της συνάρτησης του πυρήνα (kernel function). Ανάµεσα σε πολλές επιλογές οι πιο δηµοφιλείς και πιο συχνά χρησιµοποιηµένοι πυρήνες είναι οι πολυωνυµικοί (, i) = ( i 1) d K xx xx (5.8) + όπου d είναι ο βαθµός της πολυωνυµικής συνάρτησης και ορίζεται από το χρήστη οι πυρήνες ακτινικών συναρτήσεων βάσης (Radial Basis Function) 109
Κεφάλαιο 5 ο K 1 2 xx, i = exp x x 2 i 2σ (5.9) ( ) όπου η παράµετρος σ καθορίζεται από το χρήστη και είναι κοινή για όλα τα σηµεία και οι πυρήνες δικτύων perceptron 2 επιπέδων Τ (, i) = tanh( 0 i 1) K xx β xx β (5.10) για ορισµένες τιµές των παραµέτρων β0, β 1 [Haykin 1999]. Στο Σχήµα 5.10 παρουσιάζεται η γραφική απεικόνιση µίας µηχανής διανυσµάτων υποστήριξης για ταξινόµηση από την οποία είναι εµφανής η οµοιότητά τους µε τα τεχνητά νευρωνικά δίκτυα. Σχήµα 5.10: Μία µηχανή διανυσµάτων υποστήριξης. 5.4.1 Μη ισορροπηµένη κατανοµή παραδειγµάτων Η πιο πάνω διατύπωση του προβλήµατος δεν είναι η καταλληλότερη στην περίπτωση που έχουµε µη ισορροπηµένη κατανοµή των παραδειγµάτων εκπαίδευσης ανάµεσα στις 2 κατηγορίες και απαιτείται µια διαφορετική προσέγγιση. Η πιο απλή προϋποθέτει την χρήση διαφορετικών σταθερών C + και C έτσι ώστε να µπορούµε να επιβάλουµε διαφορετική ποινή στα λάθη ταξινόµησης ανάλογα µε την κατηγορία από την οποία προέρχεται το δείγµα. Πιο συγκεκριµένα επιβάλουµε µεγαλύτερη ποινή στο σφάλµα το οποίο είναι περισσότερο ανεπιθύµητο ή/και στο σφάλµα το οποίο προέρχεται 110
Μέθοδοι Ταξινόµησης από την κατηγορία µε τον µικρότερο αριθµό παραδειγµάτων [Osuna et al. 1997; Veropoulos et al. 1999]. Με αυτό το σκεπτικό το πρόβληµα βελτιστοποίησης τροποποιείται και παίρνει την παρακάτω µορφή: 1 Ελαχιστοποίησε την l l 2 + w + C ξi + C i 2 iy : i= 1 iy : i=+ 1 ξ (5.11) ( i ) 1 υπό την προϋπόθεση ότι ( ) y w φ x + b ξ και ξ 0, για i= 1,2,..., l i i Χρησιµοποιώντας µια µεγαλύτερη τιµή κόστους για τα λάθη που προέρχονται από την κατηγορία µε το µικρότερο «πληθυσµό» (που συνήθως τυγχάνει να είναι και η κατηγορία την οποία επιθυµούµαενα αναγνωρίσουµε µε µεγαλύτερη ακρίβεια) εξωθούµε το «σύνορο» (υπερεπίπεδο στο χώρο των χαρακτηριστικών και υπερεπιφάνεια στο χώρο εισόδου) να αποµακρυνθεί από τη συγκεκριµένη κατηγορία. Θα πρέπει να σηµειωθεί ότι η παραπάνω προσέγγιση µπορεί να επεκταθεί χρησιµοποιώντας διαφορετική τιµή κόστους για κάθε ένα παράδειγµα ξεχωριστά. Με αυτό τον τρόπο εάν µε κάποιο τρόπο είµαστε σίγουροι ότι κάποια από τα παραδείγµατα αποτελούν πρότυπα τα οποία χαρακτηρίζουν καλύτερα µια κατηγορία και συνεπώς θα ήταν επιθυµητό να κατηγοριοποιηθούν σωστά, µπορούµε µεµονωµένα να τους αντιστοιχήσουµε µία µεγαλύτερη τιµή C i επιτρέποντας στο i αντίστοιχο a i να πάρει µία αρκετά µεγάλη τιµή. 5.5 Κρυφά Μοντέλα Markov (Hidden Markov Models (HMMs)) Τα Κρυφά Μοντέλα Markov (Hidden Markov Models) [Dharmadhikari 1963, Burke 1958] αποτελούν ένα πολύ δηµοφιλές και πολύ αποδοτικό εργαλείο στο πεδίο της αναγνώρισης προτύπων. Ένα Κρυφό Μοντέλο Markov µπορεί να περιγραφεί ως δύο σχετιζόµενες στοχαστικές διεργασίες οι οποίες συµβαίνουν ταυτόχρονα (Σχήµα 5.11). Η πρώτη διεργασία αποτελείται από µια αλληλουχία από παρατηρήσιµα σύµβολα (παρατηρήσεις) και η δεύτερη είναι µία «κρυφή» διαδικασία η οποία απαρτίζεται από διασυνδεδεµένες καταστάσεις. Κάθε παρατήρηση στην πρώτη στοχαστική διεργασία συνδέεται µε κάθε µία από τις καταστάσεις του κρυφού επιπέδου µέσω µιας πιθανοτικής κατανοµής. Έχοντας µια σειρά από παρατηρήσεις, δεν είναι δυνατόν να καθοριστεί επακριβώς εκείνη η ακολουθία των καταστάσεων που παρήγαγε αυτές τις παρατηρήσεις. Με άλλα λόγια η αλληλουχία των καταστάσεων η οποία σχετίζεται µε µία αλληλουχία παρατηρήσεων είναι κρυφή και από εκεί προκύπτει η ονοµασία Κρυφά Μοντέλα Markov. 111
Κεφάλαιο 5 ο Ένα Κρυφό Μοντέλο Markov περιγράφεται από: a. Τον αριθµό N των καταστάσεων του µοντέλου. Το σύνολο τον καταστάσεων συµβολίζεται = { s1, s2,..., sn } συµβολίζεται ως qi () t. s και όταν το µοντέλο βρίσκεται στην κατάσταση s i τη χρονική στιγµή t b. Τον πιθανοτικό πίνακα µετάβασης A = { a ij }, όπου ( ( 1 ) ( )) a = p q t+ q t (5.12) ij j i Από τον ορισµό του A προκύπτει ότι: N aij = 1. j= 1 c. Την πιθανοτική κατανοµή της εξόδου B = { b j } όπου j ( ) ( ( )) = ( ) j( ), η οποία σχετίζεται µε κάθε κρυφή κατάσταση, b y t p y t q t (5.13) και y () t είναι το διάνυσµα των παρατηρήσεων (χαρακτηριστικών) τη χρονική στιγµή t. d. Την κατανοµή π που χαρακτηρίζει την αρχική κατάσταση, όπου i ( i( 1) ) π = p q (5.14) Σχήµα 5.11: Ένα Κρυφό Μοντέλο Markov µε µετάβαση από αριστερά προς τα δεξιά Όλα τα κλασσικά-κοινά Κρυφά Μοντέλα Markov χαρακτηρίζονται από τις προαναφερόµενες παραµέτρους. Για την εφαρµογή των Κρυφών Μοντέλων Markov σε προβλήµατα κατηγοριοποίησης ένα ή περισσότερα µοντέλα µπορούν να εκπαιδευτούν µε τα δεδοµένα µιας συγκεκριµένης 112
Μέθοδοι Ταξινόµησης κατηγορίας. Κατά τη διάρκεια της κατηγοριοποίησης, δοσµένης µιας σειράς παρατηρήσεων, η κατηγορία της οποίας το µοντέλο είναι πιο πιθανό να παρήγαγε τη δεδοµένη αλληλουχία επιλέγεται, και ως εκ τούτου θεωρούµε ότι τα δεδοµένα αυτά ανήκουν στη συγκεκριµένη κατηγορία [Duda et al. 2001]. 5.6 Νευρωνικά ίκτυα Κυµατιδίου (Wavelet Neural Networks) Σε αυτή την ενότητα προτείνουµε και παρουσιάζουµε µία νέα µέθοδο η οποίο αντιµετωπίζει ενιαία το πρόβληµα της εξαγωγής χαρακτηριστικών και της κατηγοριοποίησης. ηλαδή το τρίτο, τέταρτο και πέµπτο µπλοκ του µοντέλου όπως το έχουµε περιγράψει µπορούν να «συγχωνευθούν» όπως απεικονίζεται στο Σχήµα 5.12. Σχήµα 5.12: Ενοποιηµένο µοντέλο ταξινόµησης. Τα τεχνητά νευρωνικά δίκτυα όπως αναφέρθηκε σε προηγούµενη ενότητα, χρησιµοποιούνται µε µεγάλη επιτυχία σε προβλήµατα κατηγοριοποίησης. Έχουν την ικανότητα να βρίσκουν µη γραµµικές σχέσεις ανάµεσα σε δεδοµένα τα οποία µε µια πρώτη µατιά µπορεί να φαίνονται τελείως ασυσχέτιστα και για αυτό το λόγο χρησιµοποιούνται σε πολλές εφαρµογές κατηγοριοποίησης [Bishop 1995, Ripley 1996]. Ο µετασχηµατισµός κυµατιδίου όπως επίσης αναπτύχθηκε στο κεφάλαιο 4 αποσυνθέτει ένα σήµα σε µια σειρά από συναρτήσεις βάσης οι οποίες καλούνται κυµατίδια. Αυτές οι συναρτήσεις βάσεις προέρχονται από µία αρχική συνάρτηση, µε µια σειρά από αλλαγές κλίµακας αλλά και µετατοπίσεις: ψ 1 t b ab, () t = a ψ a (5.15) Τα προτεινόµενα νευρωνικά δίκτυα κυµατιδίου προσπαθούν να συνδυάσουν τις δυνατότητες που παρέχει ο µετασχηµατισµός κυµατιδίου για την εξαγωγή χαρακτηριστικών µε τη δυνατότητα που έχουν τα νευρωνικά δίκτυα για κατηγοριοποίηση-ταξινόµηση [Dickhaus and Heinrich 1996]. Ένα νευρωνικό δίκτυο κυµατιδίου µπορεί να περιγραφεί ως µία προέκταση του δικτύου perceptron µε την ενσωµάτωση κόµβων κυµατιδίων (wavelet nodes) ως µονάδες προεπεξεργασίας για την εξαγωγή 113
Κεφάλαιο 5 ο χαρακτηριστικών (Σχήµα 5.13). Κάθε κόµβος κυµατιδίου υπολογίζει το εσωτερικό γινόµενο µεταξύ του υπό εξέταση σήµατος και του προκαθορισµένου κυµατιδίου. Οι κόµβοι περιγράφονται από µία παράµετρο µετατόπισης, b k, και µια παράµετρο αλλαγής κλίµακας, δίνεται από τη σχέση: φ 1 t bk k = st () a ψ ak ak και η έξοδος κάθε κόµβου (5.16) Το Σχήµα 5.13 δείχνει ένα απλό νευρωνικό δίκτυο κυµατιδίου µε τρεις κόµβους κυµατιδίου στο επίπεδο εισόδου, 2 σιγµοειδείς κόµβους στον κρυφό επίπεδο και ένα σιγµοειδή κόµβο στο επίπεδο εξόδου. Το τµήµα του δικτύου το οποίο περικλείεται στο ορθογώνιο είναι ένα τυπικό δίκτυο perceptron µε σιγµοειδείς συναρτήσεις ενεργοποίησης. Σχήµα 5.13: Ένα απλό νευρωνικό δίκτυο κυµατιδίου. Οι παράµετροι των κόµβων κυµατιδίου, όσο και τα συναπτικά βάρη, ρυθµίζονται χρησιµοποιώντας µέθοδο εκµάθησης µε επίβλεψη. Η εκµάθηση συνήθως πραγµατοποιείται µέσω της ελαχιστοποίησης µιας συνάρτησης λάθους, όπως για παράδειγµα το συνολικό τετραγωνικό σφάλµα ανάµεσα στην έξοδο του δικτύου και την επιθυµητή έξοδο για όλο το σύνολο τον παραδειγµάτων. Αν και το άθροισµα των τετραγώνων των σφαλµάτων είναι κατάλληλο για προβλήµατα παλινδρόµησης (regression), για προβλήµατα κατηγοριοποίησης είναι συχνά προτιµότερο να πραγµατοποιείται η ρύθµιση του δικτύου χρησιµοποιώντας την cross entropy συνάρτηση σφάλµατος [Bishop 1995]: 114
Μέθοδοι Ταξινόµησης N { nln n ( 1 n) ln ( 1 n) } (5.17) E = t y + t y όπου N είναι το σύνολο το παραδειγµάτων εκπαίδευσης, { 0,1} n= 1 t είναι η «ετικέτα» του n-οστού παραδείγµατος και y n είναι η έξοδος του νευρωνικού δικτύου όταν στην είσοδο του έχει εφαρµοστεί το n-οστό παράδειγµα. Στα πλαίσια της διδακτορικής διατριβής η εκπαίδευση των νευρωνικών δικτύων κυµατιδίου έγινε µε τη χρήση της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων και όλες οι παράµετροι του δικτύου προσαρµόστηκαν ταυτόχρονα. Οι παράµετροι αποτελούνται από τον πίνακα µε τα συναπτικά βάρη, καθώς και τις παρεµέτρους µετατόπισης και αλλαγής κλίµακας που σχετίζονται µε κάθε κόµβο κυµατιδίου. Στη συνέχεια θα παρουσιάσουµε τη µέθοδο βελτιστοποίησης µε σµήνος σωµατιδίων [Eberhart and Kennedy 1995]. n 5.7 Βελτιστοποίηση µε σµήνος σωµατιδίων (Particle Swarm Optimization PSO) Η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων είχε αρχικά προταθεί από τον J. Kennedy ως µια µέθοδος προσοµοίωσης της κοινωνικής συµπεριφοράς πουλιών και χρησιµοποιήθηκε για πρώτη φορά ως ένας τρόπος βελτιστοποίησης το 1995 [Eberhart and Kennedy 1995]. Πρόκειται για ένα στοχαστικό αλγόριθµο βελτιστοποίησης βασισµένο σε ένα πληθυσµό από µονάδες/άτοµα [Kennedy and Eberhart 2001]. Ανήκει στην κατηγορία των αλγορίθµων νοηµοσύνης σµήνους (που κατατάσσονται στην ευρύτερη κατηγορία των εξελικτικών αλγορίθµων) οι οποίοι εµπνέονται από την κοινωνική δυναµική και από την συµπεριφορά που αναπτύσσεται σε κοινωνικά οργανωµένες αποικίες. Ανήκει στην κατηγορία των µεθόδων βελτιστοποίησης που δεν κάνουν χρήση πληροφορίας παραγώγου [Parsopoulos and Vrahatis, 2002] και έχει χρησιµοποιηθεί µε επιτυχία σε αρκετές εφαρµογές συµπεριλαµβανοµένης της εκπαίδευσης νευρωνικών δικτύων [Kennedy and Eberhart 2001]. Η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων όπως αναφέρθηκε είναι µια µέθοδος η οποία στηρίζεται στην ύπαρξη ενός πληθυσµού, δηλαδή εκµεταλλεύεται ένα πληθυσµό από µονάδες για να βρει υποσχόµενες περιοχές εντός του χώρου αναζήτησης. Ο πληθυσµός καλείται σµήνος και οι µονάδες (δηλαδή τα υποψήφια σηµεία-λύσεις) ονοµάζονται σωµατίδια. Η κίνηση των σωµατιδίων είναι στοχαστική, παρόλα αυτά επηρεάζεται από τη «µνήµη» κάθε ενός από τα σωµατίδια αλλά και από τις µνήµες των γειτόνων τους. 115
Κεφάλαιο 5 ο Η ελαχιστοποίηση (ή µεγιστοποίηση) της υπό εξέταση έκφρασης πραγµατοποιείται χρησιµοποιώντας κάθε σωµατίδιο τόσο τη δική του καλύτερη µέχρι τότε θέση όσο και την καλύτερη έως εκείνη τη στιγµή θέση µεταξύ των γειτονικών του σωµατιδίων. Στη βασική εκδοχή του αλγορίθµου, όπου η γειτονία του κάθε σωµατιδίου αποτελείται από όλο το σµήνος, οι εξισώσεις που δίνουν την ταχύτητα και τη θέση του κάθε σωµατιδίου δίνεται από τις παρακάτω σχέσεις: ( + 1) = ( ) ( ) + ( ) + ( ) vi t φ t vi t η1r pi xi t η2 r pg( t) xi t (5.18) ( + 1) = ( ) + ( ) x t x t v t i i i (5.19) όπου i είναι ο δείκτης του σωµατιδίου, vi () t είναι η τρέχουσα τιµή της ταχύτητας του i-οστού σωµατιδίου, φ () t είναι µία συνάρτηση αδράνειας (συνήθως µια συνάρτηση που µειώνεται γραµµικά), xi () t είναι η τρέχουσα θέση του i-οστού σωµατιδίου, pi είναι η θέση µε την καλύτερη τιµή της συνάρτησης καταλληλότητας από αυτές που έχει επισκεφθεί έως εκείνη τη στιγµή το i-οστό σωµατίδιο, g () t είναι το σωµατίδιο µε την καλύτερη τιµή της συνάρτησης καταλληλότητας ανάµεσα σε όλα τα σωµατίδια (δηλαδή η βέλτιστη θέση µέχρι που έχει βρεθεί µέχρι στιγµής ολική εκδοχή της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων (global version) [Eberhart and Kennedy 1995], r είναι µια θετική σταθερά η οποία καλείται σταθερά επιτάχυνσης και η1, η 2 είναι τυχαίοι αριθµοί οµοιόµορφα κατανεµηµένοι στο διάστηµα [0, 1]. Για την περίπτωση της εκπαίδευσης των νευρωνικών δικτύων κυµατιδίου, ως συνάρτηση καταλληλότητας επιλέχθηκε η τιµή της cross- entropy συνάρτησης (εξίσωση 5.17) και κάθε µία από τις διαστάσεις του σωµατιδίου αντιστοιχεί είτε σε κάποιο συνεκτικό βάρος είτε στις παραµέτρους µετατόπισης και αλλαγής κλίµακας των κόµβων κυµατιδίου. 116
Μέθοδοι Ταξινόµησης 5.8 Γενετικοί Αλγόριθµοι (Genetic Algorithms (GA)) Οι γενετικοί αλγόριθµοι αποτελούν µεθόδους «εξερεύνησης» οι οποίοι προσοµοιάζουν µε ένα απλοϊκό τρόπο µερικές από τις διεργασίες της φυσικής εξέλιξης. Παρέχουν ένα πολύ αποδοτικό τρόπο «ψαξίµατος» ο οποίος µπορεί να χρησιµοποιηθεί για εφαρµογές βελτιστοποίησης και ταξινόµησης. Αν και στοχαστικοί από τη φύση τους, οι γενετικοί αλγόριθµοι πραγµατοποιούν (συνήθως) µία πολύ αποδοτική εξερεύνηση του χώρου λύσεων του προβλήµατος οδηγώντας την εξερεύνηση σε υποσχόµενες περιοχές λύσεων και επιπλέον δεν περιορίζονται σε µία µόνο στενή κατηγορία προβληµάτων. Όπως και στην περίπτωση της βελτιστοποίησης µε σµήνος σωµατιδίων, οι γενετικοί αλγόριθµοι βασίζονται στην ύπαρξη ενός πληθυσµού. Κάθε µέλος αυτού του πληθυσµού πρόκειται για µία εν δυνάµει, ή υποψήφια λύση του προβλήµατος και στην ουσία δεν είναι κάτι άλλο από ένα διάνυσµα στον υπερχώρο των λύσεων. Κάθε τέτοιο διάνυσµα ονοµάζεται λόγω της αδρής οµοιότητας του µε το βιολογικό ανάλογο ως χρωµόσωµα. Κάθε χρωµόσωµα αποτελείται από έναν αριθµό στοιχείων ο οποίος ισούται µε τον αριθµό των παραµέτρων του προβλήµατος. Κάθε στοιχείο µπορεί να κωδικοποιηθεί είτε µε τη χρήση του δυαδικού είτε µε τη χρήση του δεκαδικού συστήµατος. Η πιο συνήθης κωδικοποίηση είναι η δυαδική. Σε αυτή την περίπτωση κάθε στοιχείο κωδικοποιείται µε έναν αριθµό από bits ανάλογα µε τα όρια στα οποία κινείται η αντίστοιχη παράµετρος. Τα βήµατα τα οποία ακολουθούνται κατά την εφαρµογή του γενετικού αλγορίθµου είναι τα ακόλουθα: 1. Αρχικοποίηση του πληθυσµού 2. Υπολογισµό µιας τιµής καταλληλότητας για κάθε ένα άτοµο του πληθυσµού 3. Αναπαραγωγή συγκεκριµένων ατόµων για τη δηµιουργία της επόµενης γενιάς 4. Επενέργεια των τελεστών διασταύρωσης και µετάλλαξής στον πληθυσµό 5. Επιστροφή στο βήµα 2 µέχρι να ικανοποιηθεί κάποιο κριτήριο ιαφορετικές παραλλαγές του αλγορίθµου αναπτύσσονται ανάλογα µε τον τρόπο που πραγµατοποιείται η επιλογή των ατόµων για αναπαραγωγή και τον τρόπο που πραγµατοποιούνται οι διαδικασίες της διασταύρωσης και της µετάλλαξης. Στα πλαίσια της παρούσας διατριβής χρησιµοποιήθηκε η µέθοδος επιλογής των ατόµων για τη δηµιουργία της επόµενης γενιάς που ονοµάζεται επιλογή µε αντιπαράθεση (tournament selection). 117
Κεφάλαιο 5 ο Σύµφωνα µε αυτή τη µέθοδο κάθε ένα από τα µέλη του αρχικού πληθυσµού διαγωνίζεται µε άλλα n-1 µέλη του πληθυσµού και κάθε φορά το άτοµο µε την καλύτερη τιµή καταλληλότητας επιλέγεται για να περάσει στην επόµενη γενιά. Για τον τελεστή της διασταύρωσης επιλέχθηκε η διασταύρωση σε ένα µόνο σηµείο του χρωµοσώµατος (one-point crossover), κατά την οποία οι δύο «γονείς» που επιλέχθηκαν τυχαία για διασταύρωση ανταλλάσσουν το δεξιό τµήµα των χρωµοσωµάτων τους στο σηµείο το οποίο επίσης τυχαία επιλέχθηκε να γίνει η διασταύρωση. Ο τελεστής της µετάλλαξης για την περίπτωση δυαδικής κωδικοποίησης, όπως στην περίπτωσή µας, για κάθε µέλος του πληθυσµού (µετά από τη διασταύρωση) αλλάζει την τιµή όλων των bit του χρωµοσώµατος µε µία πολύ µικρή συνήθως πιθανότητα [Goldberg 1989]. 5.9 Σύνοψη Σε αυτό το κεφάλαιο παρουσιάστηκαν όλοι οι ταξινοµητές που χρησιµοποιήθηκαν στα πλαίσια αυτής της διατριβής. Η παρουσίαση ξεκίνησε από τους πιο απλούς ταξινοµητές οι οποίοι συνήθως χρησιµοποιούνται ως µέτρο σύγκρισης για την απόδοση πιο «ισχυρών» ταξινοµητών. Στη συνέχεια τα δύο πιο συχνά χρησιµοποιούµενα νευρωνικά δίκτυα εµπρόσθιας διάδοσης παρατέθηκαν, µε τις βασικές αρχές τους και τις διαφορές τους. Μεγάλο µέρος του κεφαλαίου αφιερώθηκε στην µηχανές διανυσµάτων υποστήριξης τα οποία δοµικά µοιάζουν µε τα νευρωνικά δίκτυα, εκπαιδεύονται όµως µε διαφορετικό τρόπο και συνήθως εµφανίζουν µεγάλη ικανότητα γενίκευσης ακόµα και όταν τα παραδείγµατα εκπαίδευσης είναι περιορισµένα. Τα Κρυφά Μοντέλα Markov περιγράφτηκαν στην συνέχεια καθώς και ο τρόπος µε τον οποίο αυτά µπορούν αν χρησιµοποιηθούν για τις ανάγκες προβληµάτων αναγνώρισης προτύπων. Η έκτη ενότητα του κεφαλαίου είναι αφιερωµένη στην περιγραφή ενός νέου τύπου δικτύου που συνδυάζει το µετασχηµατισµό κυµατιδίου µε ένα νευρωνικό δίκτυο για την αυτόµατη εξαγωγή παραµέτρων και την ταξινόµηση. Η εκπαίδευση του πραγµατοποιείται µε τη χρήση ενός επίσης νέου αλγόριθµου βελτιστοποίησης ο οποίος στηρίζεται σε ένα σµήνος σωµατιδίων. Το κεφάλαιο κλείνει µε µία σύντοµη εισαγωγή στους γενετικούς αλγορίθµους οι οποίοι χρησιµοποιήθηκαν στα πλαίσια της διατριβής για την εκπαίδευση νευρωνικών δικτύων καθώς και ως τµήµα της µεθόδου κατασκευής χαρακτηριστικών, όπως θα αναπτυχθεί στο επόµενο κεφάλαιο. 118
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Κεφάλαιο 6 ο Προτεινόµενες Μεθοδολογίες-Πειραµατικά αποτελέσµατα 6.1 Εισαγωγή Σε αυτό το κεφάλαιο θα παρουσιαστούν συνοπτικά οι προτεινόµενες µεθοδολογίες για την ανάλυση και ταξινόµηση του σήµατος της ΕΚΣ καθώς επίσης και τα πειραµατικά αποτελέσµατα από την εφαρµογή τους. Κάθε µεθοδολογία συνδυάζει µία από τις µεθόδους εξαγωγής χαρακτηριστικών που παρουσιάστηκαν στο κεφάλαιο 4 και µία από τις µεθόδους ταξινόµησης του κεφαλαίου 5, µε απώτερο σκοπό την ταξινόµηση του σήµατος της ΕΚΣ και κατ επέκταση τη διάγνωση της κατάστασης του εµβρύου. Στα πλαίσια της διδακτορικής διατριβής έχουν χρησιµοποιηθεί ποικίλες µέθοδοι τόσο για την εξαγωγή χαρακτηριστικών όσο και για την κατηγοριοποίηση της ΕΚΣ. Για να έχουµε µια συστηµατική προσέγγιση το κεφάλαιο αυτό είναι δοµηµένο γύρω από τις βασικές µεθοδολογίες για την εξαγωγή χαρακτηριστικών. Η πρώτη µεθοδολογία που θα παρουσιαστεί χρησιµοποιεί τη µέθοδο ανάλυσης σε ανεξάρτητες συνιστώσες για να εξάγει χαρακτηριστικά από το σήµα της ΕΚΣ τα οποία στη συνέχεια τροφοδοτούν ένα µη γραµµικό ταξινοµητή. Οι µη γραµµικοί ταξινοµητές που χρησιµοποιήθηκαν ήταν οι δύο πιο συχνά χρησιµοποιούµενοι τύποι νευρωνικών δικτύων εµπρόσθιας διάδοσης, το πολυεπίπεδο δίκτυο perceptron και το δίκτυο ακτινικών συναρτήσεων βάσης, καθώς και µηχανές διανυσµάτων υποστήριξης µε πολυωνυµικούς πυρήνες. Η δεύτερη µεθοδολογία βασίζεται στην εξαγωγή χαρακτηριστικών από το πεδίο του χρόνου, το πεδίο της συχνότητας καθώς και στην εξαγωγή µορφολογικών χαρακτηριστικών. Στα πλαίσια αυτή της διατριβής αναφερόµαστε στα παραπάνω χαρακτηριστικά µε τον όρο «συµβατικά», καθώς βασίζονται σε πιο «συµβατικές» µεθόδους, συγκρινόµενα µε την µέθοδο ανάλυσης σε ανεξάρτητες συνιστώσες και τη χρήση του µετασχηµατισµού κυµατιδίου. Τα χαρακτηριστικά αυτά είτε παρεµβάλλοντας ένα στάδιο µείωσης της διάστασης, µε τη χρήση ανάλυσης σε πρωταρχικές συνιστώσες είτε αυτούσια, τροφοδότησαν µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης αλλά και Κρυµµένα Μοντέλα Markov. Στη δεύτερη περίπτωση χρησιµοποιήθηκε η χρονική µεταβολή των παραµέτρων, µε τη χρήση ενός ολισθαίνοντος παραθύρου. Η τρίτη µεθοδολογία στηρίζεται στη χρήση του διακριτού µετασχηµατισµού κυµατιδίου για την ανάλυση του σήµατος της ΕΚΣ σε συντελεστές κυµατιδίου από τους οποίους προκύπτουν τα 119
Κεφάλαιο 6 ο κατάλληλα χαρακτηριστικά (είτε µε αυτούσια χρήση αυτών των συντελεστών είτε µετά από επεξεργασία) για να τροφοδοτήσουν µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης οι οποίες πραγµατοποιούν την ταξινόµηση. Η τέταρτη µεθοδολογία πραγµατεύεται την «κατασκευή» νέων χαρακτηριστικών από τα ήδη υπάρχοντα συµβατικά χαρακτηριστικά µε τη µέθοδο της εξελικτικής γραµµατικής. Τα νέα αυτά χαρακτηριστικά αποτελούν στην πρώτη προσέγγιση εισόδους σε ένα νευρωνικό δίκτυο ακτινικών συναρτήσεων βάσης και στη δεύτερη σε ένα πολυεπίπεδο δίκτυο perceptron τα οποία πραγµατοποιούν την ταξινόµηση. Η πέµπτη µεθοδολογία αναφέρεται στην ενιαία αντιµετώπιση του προβλήµατος της εξαγωγής παραµέτρων από το σήµα της ΕΚΣ και της ταξινόµησης του µε τη χρήση ενός ειδικού τύπου νευρωνικού δικτύου, το οποίο χρησιµοποιεί στο επίπεδο εισόδου αντί των συµβατικών νευρώνων, κόµβους κυµατιδίου που εξάγουν συντελεστές κυµατιδίου από το σήµα της ΕΚΣ τους οποίους στη συνέχεια «προωθούν» εντός ενός νευρωνικού δικτύου perceptron το οποίο τελικά πραγµατοποιεί και την ταξινόµηση. Πριν προχωρήσουµε στην ανάπτυξη όλων των παραπάνω µεθοδολογιών θα αναφερθούµε στην επόµενη παράγραφο στο στάδιο προεπεξεργασίας που εφαρµόστηκε στο σήµα της ΕΚΣ σε όλα τα πειράµατα µας πριν από το στάδιο της εξαγωγής των χαρακτηριστικών. 6.2 εδοµένα και προεπεξεργασία σήµατος ΕΚΣ Όλα τα σήµατα της ΕΚΣ που χρησιµοποιήθηκαν για την αξιολόγηση των µεθοδολογιών που προτάθηκαν και αναπτύσσονται σε αυτό το κεφάλαιο συλλέχθηκαν στην Μαιευτική και Γυναικολογική κλινική του Πανεπιστηµιακού Νοσοκοµείου του Πόρτο της Πορτογαλίας και µας παραχωρήθηκαν από τον καθηγητή Joao Bernardes, στα πλαίσια µίας συνεργασίας που αναπτύχθηκε, για τις ανάγκες αυτής της διδακτορικής διατριβής. Όλα τα σήµατα καταγράφηκαν κατά τη χρονική διάρκεια του τοκετού µε τη χρήση εσωτερικής καρδιογραφίας (χρήση ηλεκτροδίου για τη λήψη του ηλεκτροκαρδιογραφήµατος). Η χρήση της εσωτερικής καρδιογραφίας δίνει πιο ακριβή αποτελέσµατα σε σχέση µε την αντίστοιχη χρήση της εξωτερικής υπερηχοκαρδιογραφίας, όπως αναφέρθηκε στο κεφάλαιο 2 [Docker 1993]. Τα σήµατα συλλέχθηκαν είτε χρησιµοποιώντας έναν καρδιοτοκογράφο Toitu MT 810B, µε αποθήκευση σε ηλεκτρονική µορφή µέσω της παράλληλης θύρας ενός προσωπικού υπολογιστή, είτε (τα περισσότερα) χρησιµοποιώντας έναν καρδιοτοκογράφο HP 1350 µέσω της σειριακής θύρας ενός ηλεκτρονικού υπολογιστή. Η διαφορά ανάµεσα στις δύο οµάδες σηµάτων έγκειται στο γεγονός ότι η 120
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα πρώτη συσκευή (Toitu MT 810B) δεν παράγει ένα δειγµατοληπτηµένο σε προκαθορισµένα διαστήµατα σήµα, αλλά δίνει µία έξοδο η οποία οδηγείται από την ανίχνευση του καρδιακού επεισοδίου, ενώ η δεύτερη συσκευή (HP 1350) παράγει ένα σήµα µε σταθερή συχνότητα δειγµατοληψίας 4 Hz. Για να έχουµε µια οµοιογενή προσέγγιση µετατρέψαµε τα σήµατα που προέρχονται από τον καρδιοτοκογράφο Toitu MT 810B µε ψευδο-δειγµατοληψία σε µία χρονοσειρά µε κανονική δειγµατοληψία 4 Hz όπως φαίνεται στο Σχήµα 6.1. Original signal 150 145 140 0 0.5 pseudo-sampling 1 1.5 2 2.5 150 145 140 0 0.5 1 Final signal 1.5 2 2.5 150 145 140 0 0.5 1 1.5 2 2.5 Σχήµα 6.1: Ψευδοδειγµατοληψία Ο λόγος που επιλέξαµε την παραπάνω προσέγγιση οφείλεται τόσο σε λόγους απλότητας όσο και σε πρακτικούς λόγους. Παρόλα αυτά υπάρχουν πιο προχωρηµένοι µέθοδοι όπως αυτός που προτάθηκε από τον Berger [Berger et al. 1986] για την επεξεργασία του σήµατος που προέρχεται από τον Toitu καρδιοτοκογράφο καθώς και ο αλγόριθµος ο οποίος προτάθηκε από τον Bracale [Bracale et al. 2003] για την επεξεργασία του σήµατος που παράγεται από τον HP 1350. Στην περίπτωσή µας οι καταγραφές οι προερχόµενες από τον καρδιοτοκογράφο HP 1350 είχαν πολλά τµήµατα όπου το σήµα µηδενιζόταν για µεγάλα χρονικά διαστήµατα και κάθε προσπάθεια να ανακτήσουµε την αρχική χρονοσειρά των καρδιακών επεισοδίων θα ήταν πάρα πολύ δύσκολη αν όχι αδύνατη. Συνεπώς χρησιµοποιήσαµε τελικά την προσέγγιση της χρήσης της εξόδου του HP 1350 ως το πρότυπο στο οποίο έπρεπε να προσαρµόσουµε την µέθοδό µας. Το πιο πάνω στάδιο ήταν το δεύτερο στάδιο προεπεξεργασίας µετά από το στάδιο αφαίρεσης του θορύβου όπου χρησιµοποιήθηκε η µέθοδος που περιγράφτηκε στο κεφάλαιο 3. Το τελικό στάδιο της προεπεξεργασίας αφορούσε την επιλογή των τµηµάτων στα οποία θα εφαρµοζόταν στη συνέχεια η αντίστοιχη µέθοδος για την εξαγωγή χαρακτηριστικών. Τα τµήµατα αυτά επιλεγόταν όσο πιο κοντά 121
Κεφάλαιο 6 ο γινόταν προς το τέλος της καταγραφής, δηλαδή όσο πιο κοντά στη στιγµή της γέννησης. Όλα τα προαναφερθέντα στάδια προεπεξεργασίας παρουσιάζονται στο διάγραµµα του Σχήµατος 6.2. Σχήµα 6.2: Τα στάδια της προεπεξεργασίας των σηµάτων της ΕΚΣ Τέλος πρέπει να σηµειωθεί ότι σε ορισµένες καταγραφές λίγο πριν από το τέλος του τοκετού, η παρουσία του θορύβου είναι τόσο έντονη που η εφαρµογή του αλγορίθµου αφαίρεσης θορύβου οδηγεί σε ένα «αφύσικα» επίπεδο τµήµα το οποίο επίσης δεν µπορεί να χρησιµοποιηθεί για περαιτέρω ανάλυση. Συνεπώς αυτά τα τελευταία 1-2 λεπτά, σε ορισµένα από τα καρδιοτοκογραφήµατα χρειάστηκε να αφαιρεθούν µε το χέρι. 6.3 Ανάλυση σε ανεξάρτητες συνιστώσες Η πρώτη προσέγγιση στο πρόβληµα της κατηγοριοποίησης της ΕΚΣ περιελάµβανε τη χρήση της ανάλυσης σε ανεξάρτητες συνιστώσες ως ένα µέσο για την εξαγωγή χαρακτηριστικών. Όπως αναπτύχθηκε στο κεφάλαιο 4, η ιδέα πίσω από την εφαρµογή της ανάλυσης σε ανεξάρτητες 122
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα συνιστώσες ήταν να χρησιµοποιηθούν αυτές (συνιστώσες/πηγές) ως βάσεις για την περιγραφή των σηµάτων της ΕΚΣ. ηλαδή εν τέλει το διάνυσµα των συντελεστών που ανασυνθέτουν γραµµικά το σήµα της ΕΚΣ µε βάση τις ανεξάρτητες πηγές αποτελούσε την είσοδο στο επόµενο στάδιο της ταξινόµησης. Η συνολική διαδικασία περιγράφεται στο Σχήµα 6.3. Σχήµα 6.3: Σχηµατικά η µεθοδολογία που χρησιµοποιεί χαρακτηριστικά που εξήχθησαν µε τη χρήση της ανάλυσης σε ανεξάρτητες συνιστώσες. 123
Κεφάλαιο 6 ο Συνοπτικά: Μετά το στάδιο της προεπεξεργασίας, εφαρµόζουµε ανάλυση σε πρωταρχικές συνιστώσες και διατηρούµε τόσες συνιστώσες όσος είναι και ο αριθµός των ανεξάρτητων πηγών που θέλουµε να ανακτήσουµε. Κατόπιν στα σήµατα που προκύπτουν από το στάδιο της ανάλυσης σε πρωταρχικές συνιστώσες εφαρµόζουµε ανάλυση σε ανεξάρτητες συνιστώσες. Με βάση τις ανακτόµενες «πηγές» υπολογίζουµε το διάνυσµα των συντελεστών/χαρακτηριστικών για κάθε ένα σήµα ΕΚΣ. Με το διάνυσµα αυτό τροφοδοτούµε έναν µη γραµµικό ταξινοµητή και στο τελικό στάδιο αξιολογούµε την όλη προσέγγιση µε τη χρήση της µεθόδου αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών (stratified multifold cross validation) [Breiman et al. 1984]. Στη συνέχεια θα περιγράψουµε τις διάφορες παραλλαγές (κριτήρια κατηγοριοποίησης, µήκος σηµάτων, ταξινοµητές) µε τις οποίες πειραµατιστήκαµε εφαρµόζοντας την µέθοδο της ανάλυσης σε ανεξάρτητες συνιστώσες. Θα πρέπει να σηµειωθεί ότι µια και µιλάµε για υποτιθέµενες πηγές, δεν είµαστε σε θέση εκ των προτέρων να γνωρίζουµε ποιος είναι ο βέλτιστος αριθµός τους. Μία ένδειξη µπορεί να εξαχθεί κατά το στάδιο της εφαρµογής της ανάλυσης σε πρωταρχικές συνιστώσες από τις ιδιοτιµές του πίνακα ετεροσυσχέτισης. Μια επιλογή που θα µπορούσε να εφαρµοστεί, σχετίζεται µε την διατήρηση τόσων συνιστωσών όσων απαιτούνται ώστε το άθροισµα των αντίστοιχων ιδιοτιµών να ισούται µε ένα προκαθορισµένο ποσοστό του συνολικού αθροίσµατος των ιδιοτιµών (στην βιβλιογραφία συναντώνται διάφορες τιµές, για παράδειγµα 75% [Berthold and Hand 1999]). Μία άλλη, ίσως καλύτερη, προσέγγιση προτείνει την γραφική απεικόνιση των ιδιοτιµών µε φθίνουσα σειρά και την επιλογή µέχρι εκείνης που «φαίνεται» να αποτελεί το όριο πέρα από το οποίο οι υπόλοιπες µεταβάλλονται ανεπαίσθητα [Berthold and Hand 1999]. Στην περίπτωσή µας, αν εξαιρέσουµε την πρώτη ιδιοτιµή οι υπόλοιπες µειώνονται σχετικά αργά συνεπώς η δεύτερη προσέγγιση είναι πρακτικά ανεφάρµοστη. Επίσης για την εφαρµογή του πρώτου κριτηρίου απαιτείται η διατήρηση ενός αρκετά µεγάλου αριθµού ιδιοτιµών κάτι που όµως θα είχε σαν αποτέλεσµα την αύξηση της πολυπλοκότητας του νευρωνικού δικτύου. Συνεπώς ο πιο πρακτικός τρόπος για την επιλογή του αριθµού των υποτιθέµενων πηγών και την αποφυγή του προβλήµατος της αύξησης της πολυπλοκότητας του ταξινοµητή είναι µε τη χρήση και διαδοχικό έλεγχο διαφορετικού (µικρού) αριθµού πηγών. 124
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα 6.3.1 Ταξινόµηση µε πολυεπίπεδα δίκτυα perceptron Στην πρώτη εφαρµογή της µεθοδολογίας είχαµε στη διάθεσή µας ένα δείγµα το οποίο περιελάµβανε 20 σήµατα τα οποία είχαν αξιολογηθεί από µαιευτήρες κατά τη διάρκεια του τοκετού είτε ως ανήκοντα σε υγιή έµβρυα είτε ως παθολογικά ή ύποπτα. Σκοπός της πρώτης αυτής µελέτης ήταν να διαπιστώσουµε εάν µπορούµε συνδυάζοντας την µεθοδολογία του Σχήµατος 6.3 µε ταξινοµητή ένα πολυεπίπεδο νευρωνικό δίκτυο perceptron µε ένα κρυφό επίπεδο, να αναπαράγουµε την απόφαση του γιατρού. Για πρακτικούς λόγους (περιορισµένο αριθµό περιπτώσεων) η κατηγοριοποίηση στη οποία προχωρήσαµε περιορίστηκε στη δηµιουργία δύο κατηγοριών. Η µία περιελάµβανε τα έµβρυα για τα οποία ο µαιευτήρας είχε αποφανθεί ότι ο τοκετός προχωράει φυσιολογικά οπότε δεν έχουµε διάγνωση εµβρυϊκής δυσπραγίας και δεν απαιτείται επέµβαση και η άλλη όλες τις άλλες περιπτώσεις (από κοινού) όπου οι µαιευτήρες υποδείκνυαν ότι υπάρχει κάποια µορφή δυσπραγίας και απαιτείται η λήψη µέτρων (κυρίως επέµβαση µε τη µορφή καισαρικής τοµής). Το µήκος των τµηµάτων του σήµατος της ΕΚΣ που αναλύθηκαν επιλέχθηκε να είναι 20 λεπτά για λόγους πρακτικούς καθώς αυτό ήταν το µέγιστο µήκος ορισµένων καταγραφών. Λόγω του µικρού αριθµού των δειγµάτων, για τη µέτρηση της απόδοσης της µεθοδολογίας χρησιµοποιήσαµε την µέθοδο αφαίρεσης ενός δείγµατος (leave-one-out) η οποία αποτελεί µία ακραία εφαρµογή της µεθόδου αξιολόγησης αναδιπλούµενης διασταύρωσης [Haykin 1999]. Σύµφωνα µε αυτή τη µέθοδο, κάθε φορά χρησιµοποιούσαµε 19 παραδείγµατα για την εκπαίδευση του νευρωνικού δικτύου και το δείγµα που δεν χρησιµοποιήθηκε το «κρατούσαµε» για να ελέγξουµε την απόδοση της µεθοδολογίας. Τη διαδικασία την επαναλάβαµε 20 φορές και πήραµε τη µέση τιµή από τις 20 προσπάθειες. Πειραµατιστήκαµε επιλέγοντας 3 έως 6 ανεξάρτητες συνιστώσες/πηγές προσπαθώντας να διατηρήσουµε το νευρωνικό δίκτυο όσο πιο απλό γίνεται (λόγω του περιορισµένου αριθµού παραδειγµάτων). Ακόµα πειραµατιστήκαµε µε τον αριθµό των νευρώνων του κρυφού επιπέδου όπου χρησιµοποιήσαµε από 2 έως 10. Μια σχηµατική απεικόνιση της διαδικασίας ταξινόµησης φαίνεται στο Σχήµα 6.4. 125
Κεφάλαιο 6 ο Σχήµα 6.4: Ταξινόµηση του σήµατος της ΕΚΣ µε βάση του συντελεστές που προκύπτουν από την εφαρµογή της ανάλυσης σε ανεξάρτητες συνιστώσες. Για την υλοποίηση του νευρωνικού δικτύου χρησιµοποιήσαµε το Neural Network Toolbox του Matlab, και ο αλγόριθµος εκπαίδευσης που χρησιµοποιήθηκε ήταν των Levenberg-Marquardt [Bishop 1995]. Τα αποτελέσµατα της ταξινόµησης για διαφορετικές ανεξάρτητες πηγές συναρτήσει των κόµβων του κρυφού επιπέδου συνοψίζονται στο Σχήµα 6.5 [Georgoulas et al. 2003a]. 100 3 inputs 100 4 inputs Classification rate % 80 60 40 20 Classification rate % 80 60 40 20 0 100 2 3 4 5 6 7 8 9 Hidden nodes 5 inputs 0 100 2 3 4 5 6 7 8 9 Hidden nodes 6 inputs Classification rate % 80 60 40 20 Classification rate % 80 60 40 20 0 2 3 4 5 6 7 8 9 Hidden nodes 0 2 3 4 5 6 7 8 9 Hidden nodes Σχήµα 6.5: Συνολική απόδοση της µεθοδολογίας για διαφορετικό αριθµό ανεξαρτήτων πηγών και διαφορετικό αριθµό νευρώνων στο κρυφό επίπεδο. 126
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Όπως φαίνεται από το Σχήµα 6.5 µε τη χρησιµοποίηση µόνο 3 ανεξαρτήτων συνιστωσών η µέθοδος αποτυγχάνει να δώσει λύση στο συγκεκριµένο πρόβληµα επιτυγχάνοντας µόνο 60% ακρίβεια. Για 5 και 6 συνιστώσες η απόδοση είναι σταθερά µεγαλύτερη ή ίση του 60%. Η καλύτερη απόδοση (85%) παρόλα αυτά επιτυγχάνεται χρησιµοποιώντας 4 συνιστώσες και µόνο 3 νευρώνες στο κρυφό επίπεδο. Πρόκειται δηλαδή για έναν αρκετά απλό ταξινοµητή κάτι που άλλωστε περιµέναµε από την αρχή. 6.3.2 Σύγκριση ταξινόµησης µε δίκτυα ακτινικών συναρτήσεων βάσης Σε αυτή την προσπάθεια ακολουθήσαµε την ίδια ακριβώς προσέγγιση που περιγράφτηκε στην παράγραφο 6.3.1, αλλά µειώσαµε τη διάρκεια του τµήµατος από το σήµα της ΕΚΣ που χρησιµοποιήσαµε από 20 σε 15 λεπτά προκειµένου να µελετήσουµε την επίδραση του µήκους του σήµατος στην προτεινόµενη µέθοδο. Επαναλάβαµε την παραπάνω διαδικασία χρησιµοποιώντας επιπλέον και νευρωνικά δίκτυα ακτινικών συναρτήσεων βάσης. Τα αποτελέσµατα τα οποία προέκυψαν ήταν χειρότερα συγκρινόµενα µε αυτά της προηγούµενης παραγράφου. Τα καλύτερα αποτελέσµατα για την ταξινόµηση µε πολυεπίπεδο δίκτυο perceptron ήταν 68% χρησιµοποιώντας 3 πηγές και µόνο 2 κρυφούς νευρώνες και 75% για την ταξινόµηση µε δίκτυα ακτινικών συναρτήσεων βάσης και υποθέτοντας 5 πηγές. Στο Σχήµα 6.6 φαίνονται τα αποτελέσµατα για 3 συνιστώσες και για διαφορετικό αριθµό νευρώνων στο κρυφό επίπεδο του πολυεπίπεδου δικτύου perceptron και στο Σχήµα 6.7 τα αποτελέσµατα για 5 συνιστώσες και για διαφορετικές τιµές της παραµέτρου σ για το δίκτυο ακτινικών συναρτήσεων βάσης [Georgoulas et al. 2003b]. 80 MLP with 3 inputs 70 68% 60 classification rate % 50 40 30 20 10 0 2 3 4 5 6 hidden neurons Σχήµα 6.6: Αποτελέσµατα για 3 συνιστώσες και διαφορετικό αριθµό κρυφών νευρώνων ενός πολυεπίπεδου δικτύου perceptron 127
Κεφάλαιο 6 ο RBF with 5 inputs 80 75% 70 60 classification rate % 50 40 30 20 10 0 0 0.5 1 1.5 2 2.5 3 3.5 spread Σχήµα 6.7: Αποτελέσµατα από τη χρήση δικτύου ακτινικών συναρτήσεων βάσης µε 5 συνιστώσες και για διαφορετικά σ. Όπως γίνεται φανερό η επιλογή των 15 λεπτών αντί των 20, δεν βοηθάει στην αύξηση της απόδοσης της µεθοδολογίας. Αντίθετα στην πρώτη προσέγγιση επιτύχαµε µία αρκετά υψηλή απόδοση, συµφωνώντας µε την υπόδειξη του µαιευτήρα σε 85% των περιπτώσεων (κατά µέσο όρο). Παρόλα αυτά πρέπει να σηµειωθεί ότι: Α) ο µαιευτήρας κατά τη διάρκεια του τοκετού έχει στη διάθεσή του και άλλα δεδοµένα τα οποία εµείς δεν διαθέταµε και Β) η γνώµη του µαιευτήρα αν και πολύ σηµαντική είναι υποκειµενική και πιο αντικειµενικοί δείκτες ίσως θα έπρεπε να εξετάζονται όπως η τιµή του ph του αίµατος του εµβρύου όπως αυτό λαµβάνεται µε το πέρας του τοκετού. Αυτή η τελευταία διαπίστωση µας ώθησε να χρησιµοποιήσουµε την τιµή του ph του αίµατος του εµβρύου όπως αυτό λαµβάνεται µε το πέρας του τοκετού και µε βάση αυτή να πραγµατοποιούµε την ταξινόµηση των σηµάτων της ΕΚΣ, εγκαταλείποντας την διάγνωση του µαιευτήρα. 6.3.3 Ταξινόµηση µε βάση την τιµή του ph Σε αυτή την προσέγγιση χρησιµοποιήσαµε την ίδια µεθοδολογία όπως αυτή περιγράφτηκε στην ενότητα 6.3.1 αλλά για ένα διαφορετικό σετ δεδοµένων και χρησιµοποιώντας την τιµή του ph που λαµβάνεται παίρνοντας δείγµα αίµατος από τον οµφάλιο λώρο, σαν βάση για την ταξινόµηση των σηµάτων της ΕΚΣ. Το νέο σετ δεδοµένων αποτελούνταν από 40 σήµατα ΕΚΣ, από τα οποία τα 20 είχαν ph µικρότερο από 7.1 και 20 δείγµατα µε ph µεγαλύτερο από 7.2. Έτσι δηµιουργήσαµε 2 128
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα κατηγορίες από τις οποίες η πρώτη (ph<7.1) περιελάµβανε σήµατα της ΕΚΣ των εµβρύων τα οποία εµφάνισαν σε κάποιο βαθµό υποξία και η δεύτερη µε (ph>7.2) αποτελούσε την κατηγορία µε τα σήµατα της ΕΚΣ των «υγιών» εµβρύων που δεν εµφάνισαν κανένα πρόβληµα µε αποτέλεσµα να µην έχουν µειωµένο ph. Με την αύξηση του αριθµού των περιπτώσεων, αλλάξαµε και τον τρόπο µε τον οποίο πραγµατοποιήσαµε την µέτρηση της απόδοσης του ταξινοµητή χρησιµοποιώντας αντί για τη µέθοδο «αφαίρεσης ενός δείγµατος», την µέθοδο αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών, η οποία αποτελεί µια επέκταση της συνηθισµένης µεθόδου αξιολόγησης αναδιπλούµενης διασταύρωσης [Breiman 1984]. Χωρίσαµε τα 40 δείγµατα σε 5 µη επικαλυπτόµενα σύνολα, κάθε ένα από τα οποία αποτελούνταν από 4 δείγµατα της µίας κατηγορίας και 4 της άλλης. Κάθε φορά ένα σύνολο (8 δείγµατα) εξαιρούνταν από τη διαδικασία της εκπαίδευσης και χρησιµοποιούνταν µόνο κατά τη διαδικασία του ελέγχου της απόδοσης. ιεξάγαµε 2 διαφορετικά πειράµατα. Στο πρώτο χρησιµοποιήσαµε για την κατηγοριοποίηση πολυεπίπεδα δίκτυα perceptron, και στο δεύτερο µηχανές διανυσµάτων υποστήριξης µε πολυωνυµικούς πυρήνες. 6.3.3.1 Ταξινόµηση µε πολυεπίπεδα δίκτυα perceptron Όπως και στα προηγούµενα πειράµατα προσπαθήσαµε να διατηρήσουµε έναν όσο το δυνατόν πιο απλό νευρωνικό δίκτυο. οκιµάσαµε διάφορες αρχιτεκτονικές µεταβάλλοντας τους νευρώνες του κρυφού επιπέδου από 2 έως 8 και µεταβάλλαµε επίσης και των αριθµό των υποτιθέµενων πηγών από 3 έως 9. Η καλύτερη απόδοση επιτεύχθει χρησιµοποιώντας 8 «πηγές» (δηλαδή 8 χαρακτηριστικά) και 6 κρυφούς νευρώνες. Για αυτή την αρχιτεκτονική επιτύχαµε συνολική απόδοση ταξινόµησης ίση µε 74.875% και επιµέρους αποδόσεις για την κατηγορία των «υγιών» εµβρύων 84.5% και 62.25% για την κατηγορία των εµβρύων που βρίσκονταν σε κίνδυνο. Συγκεντρωτικά τα αποτελέσµατα για την περίπτωση των 8 πηγών και για διαφορετικό αριθµό κρυφών νευρώνων φαίνονται στο Σχήµα 6.8. 129
Κεφάλαιο 6 ο Σχήµα 6.8: Επιµέρους και συνολική ακρίβεια για 8 χαρακτηριστικά εισόδου και µεταβλητό αριθµό νευρώνων στο κρυφό επίπεδο. 6.3.3.2 Ταξινόµηση µε µηχανές διανυσµάτων υποστήριξης Για την ίδια µεθοδολογία και χρησιµοποιώντας το ίδιο σύνολο δεδοµένων αλλάξαµε τον ταξινοµητή και καταφύγαµε σε µηχανές διανυσµάτων υποστήριξης µε πολυωνυµικούς πυρήνες. Και σε αυτή την περίπτωση πειραµατισθήκαµε µε 2 έως 9 πηγές και µε βαθµό πολυωνύµου από 2 έως 6. Την µέγιστη συνολική απόδοση την επιτύχαµε χρησιµοποιώντας πολυωνυµικούς πυρήνες 5 ου βαθµού και µόνο 2 ανεξάρτητες πηγές. Για αυτή την αρχιτεκτονική επιτύχαµε συνολική απόδοση ταξινόµησης ίση µε 70% και επιµέρους αποδόσεις για την κατηγορία των «υγιών» 80% και 60% για την κατηγορία των εµβρύων που βρίσκονταν σε κίνδυνο [Georgoulas et al. 2004c]. Τα παραπάνω αποτελέσµατα ήταν κατώτερα των προσδοκιών µας αν και χρησιµοποιήσαµε έναν ταξινοµητή που συνήθως έχει πολύ καλές ιδιότητες γενίκευσης. Συνεπώς θεωρήσαµε ότι τα όχι και τόσο καλά αποτελέσµατα οφείλονται στην επιλογή των χαρακτηριστικών και αυτό µας ώθησε να εγκαταλείψουµε τη συγκεκριµένη προσέγγιση µε τη χρήση ανεξάρτητων συνιστωσών ως ένα µέσο για την εξαγωγή χαρακτηριστικών/παραµέτρων από το σήµα της ΕΚΣ. Ως τελικό σχόλιο θα πρέπει να αναφερθεί ότι σε όλες τις παραπάνω προσεγγίσεις, θεωρήσαµε ότι όλα τα δεδοµένα προέρχονται από τις ίδιες χρονικές περιόδους του τοκετού. Αυτό είναι σχεδόν αληθές αλλά δεν µπορούµε να είµαστε απόλυτα βέβαιοι. Συνεπώς η εφαρµογή της παραπάνω ανάλυσης, πέρα από την καθαρά µαθηµατική της εφαρµογή, από πρακτικής απόψεως παρουσιάζει ορισµένες αδυναµίες. 130
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα 6.4 Μεθοδολογία βασισµένη σε συµβατική εξαγωγή χαρακτηριστικών Η δεύτερη προσέγγιση στο πρόβληµα της κατηγοριοποίησης της ΕΚΣ επικεντρώθηκε στη χρήση συµβατικών χαρακτηριστικών. Πιο συγκεκριµένα χρησιµοποιήθηκαν χαρακτηριστικά από το πεδίο του χρόνου, από το πεδίο της συχνότητας καθώς και µορφολογικά χαρακτηριστικά. Όσον αφορά τα χαρακτηριστικά από το πεδίο του χρόνου, όλα τους είχαν στο παρελθόν χρησιµοποιηθεί για τη διάγνωση διαφόρων προβληµατικών καταστάσεων κατά την περίοδο της εγκυµοσύνης αρκετά πριν από τον τοκετό. Στη συγκεκριµένη προσέγγιση ήταν η πρώτη φορά που ελέγχονταν η χρησιµότητα τους για την περίοδο του τοκετού (και πιο συγκεκριµένα του δευτέρου σταδίου του τοκετού). Όσον αφορά τα χαρακτηριστικά από την ανάλυση στο πεδίο της συχνότητας, όπως αναπτύχθηκε στο κεφάλαιο 4 δεν υπάρχει κάποιος «προτυποποιηµένος» διαχωρισµός του εύρους των συχνοτήτων (όπως δεν υπάρχει και προτυποποιηµένη συχνότητα δειγµατοληψίας) και για αυτό το λόγο στη συγκεκριµένη διατριβή πειραµατιστήκαµε µε διαφορετικούς διαχωρισµούς. Τέλος τα µορφολογικά χαρακτηριστικά είναι αυτά τα οποία αξιολογούνται καθηµερινά από τους γυναικολόγους-µαιευτήρες και σε αυτά στηρίζεται σε µεγάλο βαθµό η κρίση τους για την εξέλιξη του τοκετού. Παρόλα αυτά όπως φαίνεται και από το κεφάλαιο 2, υπάρχει µία τάση να αναθεωρούνται τόσο οι ορισµοί τους όσο και οι οδηγίες για την αξιολόγησή τους αν και η χρήση τους έχει συµπληρώσει 4 δεκαετίες ζωής. Στη συγκεκριµένη διδακτορική διατριβή δοκιµάσαµε συνδυασµούς χαρακτηριστικών και από τα 3 αυτά πεδία τα αποτελέσµατα των οποίων θα παρουσιαστούν στη συνέχεια της ενότητας. Η συνολική διαδικασία περιγράφεται σχηµατικά στο Σχήµα 6.9. 131
Κεφάλαιο 6 ο ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ Εξαγωγή χαρακτηριστικών Χρόνος Συχνότητα Μορφολογικά Ταξινόµηση (SVM, HMM,knn,ldc,qdc) Αξιολόγηση Σχήµα 6.9: Σχηµατικά η µεθοδολογία µε τη χρήση χαρακτηριστικών που εξήχθησαν από το πεδίο του χρόνου, το πεδίο της συχνότητας και από «µορφολογική» ανάλυση του σήµατος της ΕΚΣ. Συνοπτικά: Με τη συγκεκριµένη µεθοδολογία µετά το στάδιο της προεπεξεργασίας εξάγουµε ένα σύνολο χαρακτηριστικών από το πεδίο του χρόνου, το πεδίο της συχνότητας και από τη «µορφολογική» ανάλυση του σήµατος της ΕΚΣ. Τα χαρακτηριστικά αυτά τροφοδοτούν έναν ταξινοµητή και στο τελικό στάδιο αξιολογούµε την όλη προσέγγιση µε τη χρήση της µεθόδου αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών. Ειδικό βάρος σε αυτή τη µεθοδολογία δόθηκε στη χρήση µηχανών διανυσµάτων υποστήριξης, συγκρίνοντάς την απόδοσή του µε τις αποδόσεις συµβατικών ταξινοµητών. Στη συνέχεια θα περιγράψουµε τις διάφορες παραλλαγές (επιλογή χαρακτηριστικών, διαφορετικά σύνολα δεδοµένων, τρόποι αξιολόγησης) µε τις οποίες πειραµατιστήκαµε καθώς και τα αντίστοιχα αποτελέσµατα. 132
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα 6.4.1 Χαρακτηριστικά από το πεδίο του χρόνου και της συχνότητας µε µηχανές διανυσµάτων υποστήριξης Στην πρώτη προσέγγιση µας µε τη χρήση «συµβατικών» χαρακτηριστικών χρησιµοποιήσαµε το σύνολο Tdset που περιλαµβάνει τα 7 χαρακτηριστικά από το πεδίο του χρόνου όπως αυτά περιγράφονται στην ενότητα 4.2.1, και το σύνολο Fdset3 µε 4 χαρακτηριστικά από το πεδίο της συχνότητας (υιοθετώντας τον 3 ο χωρισµό της µπάντας συχνοτήτων όπως αυτός περιγράφεται στην ενότητα 4.2.2) δηλαδή συνολικά 11 χαρακτηριστικά. Σε αυτά τα πειράµατα το όριο για τον χαρακτηρισµό των εµβρύων που εµφάνισαν σε κάποιο βαθµό υποξία είχε τεθεί η τιµή του ph=7.05 σε µια προσπάθεια να αυξήσουµε τα όρια διάκρισης µεταξύ των δύο κατηγοριών. Τα έµβρυα µε ph>7.2 αποτελούσαν την κατηγορία των «υγιών» εµβρύων που δεν εµφάνισαν πρόβληµα µε την παροχή οξυγόνου. Με αυτό το διαχωρισµό είχαµε 16 παραδείγµατα που ανήκαν στην κατηγορία που πιθανόν να εµφάνιζαν πρόβληµα και 20 παραδείγµατα από την υγιή οµάδα. Για τον έλεγχο της απόδοσης της µεθοδολογίας, χρησιµοποιήθηκε και πάλι η µέθοδος αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών χρησιµοποιώντας µε 4 µη επικαλυπτόµενα σύνολα το κάθε ένα από τα οποία περιείχε 5 δείγµατα της κατηγορίας µε τα υγιή και 4 από την κατηγορία µε τα «ύποπτα». Ακόµη χρησιµοποιήσαµε διαφορετικά µήκη από το αρχικό σήµα της ΕΚΣ και συγκεκριµένα 5, 10 και 20 λεπτά, υπολογισµένα από το τέλος (πλησιέστερα στον τοκετό) και προς την αρχή της καταγραφής. Χρησιµοποιώντας αυτά τα 11 χαρακτηριστικά του σήµατος της ΕΚΣ, υπολογισµένα για διαφορετικές χρονικές διάρκειες, επιχειρήσαµε να κατηγοριοποιήσουµε τα 36 σήµατα χρησιµοποιώντας ως ταξινοµητές µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης. Για την επιλογή των παραµέτρων της µηχανής διανυσµάτων υποστήριξης (σ και C ) χρησιµοποιήσαµε µία συστηµατική µεταβάλλοντας τες µε συγκεκριµένο βήµα εντός συγκεκριµένων ορίων, εφαρµόζοντας µια διαδικασία δηλαδή ελέγχου όλων των δυνατών συνδυασµών εντός ενός «πλέγµατος» τιµών (grid search). Στον Πίνακα 6.1 καταγράφονται οι καλύτερες επιδόσεις για τα διάφορα µήκη σήµατος της ΕΚΣ που χρησιµοποιήθηκαν [Georgoulas et al. 2004a]. 133
Κεφάλαιο 6 ο Πίνακας 6.1. Βέλτιστη απόδοση για τα 3 διαφορετικά µήκη σήµατος ιάρκεια Συνολική Απόδοση Υγιή «Σε κίνδυνο» 20 (min) 86.11 % 95 % 90% 10 (min) 86.11 % 90% 81.25% 5 (min) 86.11 % 90% 81.25% Τα παραπάνω αποτελέσµατα έδειξαν ότι τα τµήµατα που ήταν πιο κοντά προς το τέλος της καταγραφή παρείχαν «περισσότερη» πληροφορία σχετικά µε την κατάσταση των παθολογικών περιπτώσεων. Αυτό συνάδει και µε τη φυσιολογία του τοκετού δεδοµένου ότι τα τελευταία λεπτά είναι αυτά στα οποία ασκείται η µεγαλύτερη πίεση στο έµβρυο µε αποτέλεσµα η πίεση αυτή να αντανακλάται σε χαµηλές τιµές του ph. 6.4.2 Χαρακτηριστικά από το πεδίο του χρόνου, της συχνότητας και η βασική γραµµή του σήµατος µε Κρυµµένα Μοντέλα Markov Σε αυτή την προσέγγιση χρησιµοποιήσαµε το ίδιο σύνολο παραδειγµάτων και τα ίδια χαρακτηριστικά µε την εφαρµογή της ενότητας 6.4.1 συν ένα επιπλέον µορφολογικό χαρακτηριστικό, τη βασική γραµµή του σήµατος της ΕΚΣ ενώ για την ταξινόµηση χρησιµοποιήθηκαν Κρυµµένα Μοντέλα Markov. Τα Κρυµµένα Μοντέλα Markov έχουν την ικανότητα να «συλλαµβάνουν» τη χρονική εξέλιξη διαφόρων φαινοµένων και για αυτό το λόγο µια διαφοροποιηµένη προσέγγιση απαιτείται για την εξαγωγή των χαρακτηριστικών της ΕΚΣ έτσι ώστε να περιγράφεται η εξέλιξη στο χρόνο. Πιο συγκεκριµένα από τα σήµατα της ΕΚΣ χρησιµοποιήθηκαν τµήµατα διάρκειας 20 λεπτών. Κάθε ένα από αυτά τα τµήµατα χωρίστηκε σε επικαλυπτόµενα τµήµατα των 5 λεπτών µε 4 λεπτά επικάλυψη µεταξύ τους όπως φαίνεται στο παρακάτω Σχήµα 6.10. 134
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Σχήµα 6.10: Επικαλυπτόµενα παράθυρα για την εξαγωγή «διαδοχικών» διανυσµάτων χαρακτηριστικών. Εντός κάθε ενός από τα τµήµατα των 5 λεπτών υπολογίσαµε τα 12 χαρακτηριστικά (Tdset µε 7 από το πεδίο του χρόνου, 4 από το πεδίο της συχνότητας (Fdset3) και η τιµή της βασικής γραµµής του σήµατος της ΕΚΣ) που περιγράφτηκαν στην ενότητα 4.2. Έτσι σε κάθε σήµα ΕΚΣ αντιστοιχούσαν 16 διαδοχικά διανύσµατα το κάθε ένα από τα οποία είχε 12 στοιχεία (τα υπολογεισθέντα χαρακτηριστικά). Αυτή η αλληλουχία διανυσµάτων, στη συνέχεια τροφοδοτούσε ένα Κρυµµένo Μοντέλο Markov. Για την ακρίβεια επειδή είχαµε 2 κατηγορίες, εκπαιδεύσαµε 2 Κρυµµένα Μοντέλα Markov, ένα για τις φυσιολογικές περιπτώσεις και ένα για τις περιπτώσεις µε χαµηλό ph (ύποπτα ή παθολογικά έµβρυα). Κάθε µοντέλο ήταν ένα Κρυµµένο Μοντέλο Markov µε µετάβαση από αριστερά προς τα δεξιά χωρίς υπερπήδηση καταστάσεων µε συνεχείς πυκνότητες (left to right Continuous Density Hidden Markov Model (CDHMM) with no state skip). Οι κατανοµές της εξόδου µοντελοποιήθηκαν µε τη χρήση γκαουσιανών µε διαγώνιο πίνακα συνδιασποράς. Πειραµατιστήκαµε µε διαφορετικά Κρυµµένα Μοντέλο Markov χρησιµοποιώντας από 3 έως 8 κρυφές καταστάσεις και για την εκτίµηση της απόδοσης τους χρησιµοποιήσαµε και πάλι την µέθοδο αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 4 σύνολα (µε 5 υγιή και 4 πιθανά ύποπτα σε κάθε σύνολο). Τα αποτελέσµατα φαίνονται στο ραβδόγραµµα του Σχήµατος 6.11 [Georgoulas et al. 2004b]. 135
Κεφάλαιο 6 ο Classification rate (%) 100% 90% 80% 70% 60% 50% 3 4 5 6 7 8 Normal 80% 75% 70% 90% 85% 65% Abnormal 81% 81% 88% 75% 81% 88% Overall 81% 78% 78% 83% 83% 78% Σχήµα 6.11: Ποσοστά ταξινόµησης για διαφορετικούς αριθµούς κρυφών καταστάσεων. Όπως µπορεί να παρατηρήσει κανείς, καταφέραµε να επιτύχουµε συνολικό ποσοστό σωστών κατηγοριοποιήσεων ίσο µε 83% (για 7 κρυφές καταστάσεις) έχοντας και ισορροπηµένες αποδόσεις για τις δύο επιµέρους κατηγορίες (85% για τα υγιή και 81% για τα πιθανόν παθολογικά). Την ίδια συνολική απόδοση επιτύχαµε και µε τη χρήση Κρυφών Μοντέλων Markov µε 6 κρυφές καταστάσεις αλλά µε άνισες επιµέρους αποδόσεις (που ως συνήθως ευνοούσαν την κατηγορία µε τα υγιή έµβρυα). Ένα µειονέκτηµα της συγκεκριµένης πειραµατικής προσέγγισης είναι ότι θεωρούµε ότι ολόκληρο το τµήµα του σήµατος της ΕΚΣ αντιστοιχεί σε µια παθολογική κατάσταση. Αυτό δεν είναι απόλυτο σωστό, γιατί δεν µπορούµε να ξέρουµε µε ακρίβεια πότε ακριβώς συντελείται η µετάβαση από µία φυσιολογική κατάσταση σε µία παθολογική. 6.4.3 Συνδυασµός όλων των συµβατικών χαρακτηριστικών Στην τρίτη και πιο ολοκληρωµένη πειραµατική εργασία µε τη χρήση συµβατικών χαρακτηριστικών συµπεριλάβαµε όσο το δυνατόν περισσότερα χαρακτηριστικά και δοκιµάσαµε διάφορους συνδυασµούς τους, όπως θα αναπτυχθεί στη συνέχεια. Για το στάδιο της ταξινόµησης χρησιµοποιήθηκαν µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης. Η όλη διαδικασία παρουσιάζεται στο Σχήµα 6.12. Όπως φαίνεται λόγω του µεγάλου αριθµού των χαρακτηριστικών χρησιµοποιήθηκε και ένα στάδιο µείωσης της διάστασης του διανύσµατος εισόδου µε τη χρήση της ανάλυσης σε πρωταρχικές συνιστώσες. 136
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Αφαίρεση θορύβου Προεπεξεργασία Ψευδοδειγµατοληψία Επιλογή τµηµάτων Εξαγωγή χαρακτηριστικών Πεδίο χρόνου Πεδίο συχνότητας Μορφολογικα Μείωση διάστασης -PCA SVM Ταξινόµηση a +1 b Αξιολόγηση 1 2 9 10 Επιλογή SVM Σχήµα 6.12: Η συνολική µεθοδολογία. 137
Κεφάλαιο 6 ο Στην προκειµένη περίπτωση το σύνολο των δειγµάτων αποτελούνταν από 80 σήµατα ΕΚΣ. Τα 60 από αυτά ανήκαν σε «υγιή» έµβρυα όπου µε τον όρο υγιή εννοούµε όλα τα έµβρυα τα οποία είχαν ph>7.2 ενώ µόνο τα 20 απάρτιζαν την οµάδα µε τα έµβρυα τα οποία ήταν ύποπτα να έχουν υποστεί κάποια µορφή ασφυξίας η οποία αντικατοπτρίζεται µε µια χαµηλή τιµή του ph (ph<7.1). Από τα 80 δείγµατα τα 57 ελήφθησαν από έναν καρδιοτοκογράφο HP 1350 και τα υπόλοιπα 23 από έναν καρδιοτοκογράφο Toitu MT810B. Επειδή η µικρότερη διάρκεια των καταγραφών ήταν 20 λεπτά, χρησιµοποιήσαµε αυτή τη διάρκεια ως τη µέγιστη για όλα τα δείγµατα ενώ χρησιµοποιήσαµε και µικρότερα δείγµατα διάρκειας 10 λεπτών (υπολογισµένα πάντα από το τέλος την καταγραφής). Από τα παραδείγµατα µε χαµηλό ph, τα 10 προερχόταν από τον HP 1350 και τα άλλα 10 από τον Toitu MT810B. Συνεπώς στη συγκεκριµένη περίπτωση είχαµε να αντιµετωπίσουµε ένα πρόβληµα µε µη ισορροπηµένη κατανοµή των δειγµάτων. Σε τέτοιες περιπτώσεις µία διαφορετική προσέγγιση απαιτείται για την εφαρµογή του αλγορίθµου εκπαίδευσης των µηχανών διανυσµάτων υποστήριξης. Αυτό έγινε αντιληπτό από την αρχή όταν δοκιµάσαµε να αντιµετωπίσουµε το πρόβληµα µε την κλασσική θεώρηση των µηχανών διανυσµάτων υποστήριξης. Το αποτέλεσµα ήταν απογοητευτικό µε την έννοια ότι δηµιουργήσαµε µία σειρά από µηχανές διανυσµάτων υποστήριξης οι οποίες κατηγοριοποιούσαν σχεδόν όλα τα παραδείγµατα στην κατηγορία µε τα υγιή έµβρυα. Η πιο απλή τροποποίηση που επιδέχεται ο αλγόριθµος είναι η χρήση διαφορετικών παραµέτρων C + and C (όπως αυτή περιγράφεται στην ενότητα 4.5). Όπως έχει αναφερθεί στη διεθνή βιβλιογραφία [Lee et al. 2001, Perkins et al. 2001, Akbani et al. 2004], και στο ίδιο συµπέρασµα καταλήξαµε χρησιµοποιώντας διαφορετικές επιλογές για το συγκεκριµένο λόγο, ο λόγος των δύο αυτών παραµέτρων πρέπει να τεθεί ίσος µε το αντίστροφο του λόγου του αριθµού των παραδειγµάτων που ανήκουν στις δύο κατηγορίες. Συνεπώς στη συγκεκριµένη περίπτωση ο λόγος τέθηκε ίσος µε 3. ιατηρήσαµε το λόγο αυτό σταθερό και χρησιµοποιήσαµε την προσέγγιση µε χρήση της µεθόδου αναδιπλούµενης διασταύρωσης για την επιλογή συγκεκριµένων τιµών τόσο για αυτές τις παραµέτρους όσο και για την παράµετρο σ για τους πυρήνες ακτινικών συναρτήσεων βάσης [Muller et al. 2001, Cristianini and Shaw-Taylor 2000]. Ακολουθώντας την ιατρική ορολογία αναφερόµαστε στην οµάδα των εµβρύων µε το χαµηλό ph ως την οµάδα µε τα θετικά παραδείγµατα (τα αντικείµενα που έχουν το πρόβληµα) και στην οµάδα µε τα «φυσιολογικά» έµβρυα ως την οµάδα µε τα αρνητικά παραδείγµατα (τα αντικείµενα που δεν έχουν το πρόβληµα). Λόγω του σχετικά περιορισµένου αριθµού των παραδειγµάτων για την εκτίµηση της απόδοσης της µεθόδου χρησιµοποιήσαµε την µέθοδο αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 10 υποσύνολα (stratified 10-fold cross validation) [Breiman 1984]. 138
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Συνεπώς διαιρέσαµε τα 80 παραδείγµατα σε 10 µη επικαλυπτόµενα υποσύνολα κάθε ένα από τα οποία περιελάµβανε 8 περιπτώσεις (6 υγιή και 2 σε κίνδυνο). Για κάθε ένα από τα 10 αυτά υποσύνολα δηµιουργήσαµε ένα σύνολο εκπαίδευσης το οποίο αποτελούνταν από τα υπόλοιπα 9 υποσύνολα. Από τα παραδείγµατα που θα χρησιµοποιούσαµε για εκπαίδευση και για την επιλογή των «βέλτιστων» παραµέτρων για το SVM χρησιµοποιήσαµε και πάλι τη µέθοδο αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 9 υποσύνολα (9-fold stratified crossvalidation). Μετά την επιλογή των «βέλτιστων» παραµέτρων χρησιµοποιήσαµε το σύνολο των παραδειγµάτων που διαθέταµε για εκπαίδευση (72) και η απόδοση του ταξινοµητή έγινε χρησιµοποιώντας το υποσύνολο που δεν είχαµε συµπεριλάβει από την αρχή (8). Η παραπάνω διαδικασία υιοθετήθηκε έτσι ώστε να µην χρησιµοποιήσουµε το ίδιο σύνολο για την ταυτόχρονη επιλογή του µοντέλου και για την εκτίµηση της απόδοσης του, κάτι που µπορεί να οδηγήσει σε µία ελαφρώς «αισιόδοξη» πρόβλεψη για την απόδοση του ταξινοµητή [Salzberg 1997]. Η απόδοση µίας διαδικασίας ταξινόµησης µπορεί να περιγραφεί µε ένα πίνακα, όπως αυτός του Σχήµατος 6.13 για την περίπτωση ενός προβλήµατος ταξινόµησης µε 2 κατηγορίες, ο οποίος ονοµάζεται «πίνακας σύγχυσης» (confusion matrix). TN είναι ο αριθµός των αρνητικών παραδειγµάτων που έχουν ταξινοµηθεί σωστά (True Negatives), FP είναι ο αριθµός των αρνητικών παραδειγµάτων που έχουν λανθασµένα ταξινοµηθεί ως θετικά (False Positives), FN είναι ο αριθµός των θετικών παραδειγµάτων που έχουν λανθασµένα ταξινοµηθεί ως αρνητικά (False Negatives) και TP είναι ο αριθµός των θετικών παραδειγµάτων που έχουν σωστά ταξινοµηθεί (True Positives). Σχήµα 6.13: Πίνακας σύγχυσης (Confusion Matrix). Σε προβλήµατα µε ανοµοιογενή κατανοµή των παραδειγµάτων ανάµεσα στις διάφορες κατηγορίες η ακρίβεια (accuracy) (ή αλλιώς το συνολικό ποσοστό σωστών ταξινοµήσεων) a= ( TP+ TN) ( TP+ FP+ TN + FN) δεν αποτελεί το καλύτερο µέτρο για την εκτίµηση της 139
Κεφάλαιο 6 ο απόδοσης. Για παράδειγµα στην περίπτωσή µας, ένας ταξινοµητής ο οποίος κατηγοριοποιεί όλα τα παραδείγµατα ως υγιή θα έχει απόδοση 75% αλλά στην πράξη θα είναι τελείως άχρηστος. Ένα πιο κατάλληλο µέτρο είναι η χρήση του γεωµετρικού µέσου [Kubat and Matwin, 1999]: + g = a a (6.1) όπου a + = TP ( TP+ FN) είναι η ακρίβεια που παρατηρείται λαµβάνοντας υπόψη µόνο τα θετικά παραδείγµατα (η οποία είναι επίσης γνωστή µε τον όρο ευαισθησία (sensitivity)) και a = TN ( FP+ TN) είναι η ακρίβεια που παρατηρείται λαµβάνοντας υπόψη µόνο τα αρνητικά παραδείγµατα (η οποία είναι επίσης γνωστή µε τον όρο ειδικότητα (specificity)). Μια άλλη προσέγγιση είναι να συγκριθούν οι ταξινοµητές χρησιµοποιώντας τις αντίστοιχες χαρακτηριστικές καµπύλες λειτουργίες του δέκτη (receiver operating characteristic (ROC) curves). Το εµβαδόν κάτω από µία τέτοια καµπύλη (area under the ROC curve (AUC)) αποτελεί επίσης ένα µέγεθος το οποίο µπορεί να χρησιµοποιηθεί για τη σύγκριση ταξινοµητών [Provost and Fawcett 1997, Bradley 1997]. To εµβαδό αυτό για έναν ταξινοµητή ισούται µε την πιθανότητα ο ταξινοµητής να δώσει µεγαλύτερη τιµή σε ένα τυχαία επιλεγµένο θετικό παράδειγµα από την τιµή που θα δώσει σε ένα τυχαία επιλεγµένο αρνητικό παράδειγµα. Από τη άλλη µεριά µεγιστοποίηση του γεωµετρικού µέσου αντιστοιχεί στην εύρεση του ορθογωνίου µε το µέγιστο εµβαδό που είναι κάτω από την ROC καµπύλη. Στην προκειµένη περίπτωση χρησιµοποιήσαµε το γεωµετρικό µέσο ως την ποσότητα µέτρησης της απόδοσης την οποία προσπαθούσαµε να µεγιστοποιήσουµε. Ως ένα επιπλέον µέγεθος σύγκρισης υπολογίσαµε και το εµβαδό κάτω από τις εν λόγω καµπύλες (AUC) για κάθε ένα από τους ταξινοµητές που χρησιµοποιήσαµε. Στο καθαρά πειραµατικό κοµµάτι, πραγµατοποιήσαµε µια σειρά από 11 πειράµατα µε διαφορετικό σύνολο χαρακτηριστικών σε κάθε ένα από αυτά και για τις δύο χρονικές διάρκειες των τµηµάτων της ΕΚΣ (10 και 20 λεπτά). Οι 11 οµάδες συνόλων χαρακτηριστικών που χρησιµοποιήθηκαν είναι τα παρακάτω (στο κεφάλαιο 4 γίνεται λεπτοµερής περιγραφή του κάθε ενός χαρακτηριστικού): 1. Μόνο τα 4 µορφολογικά χαρακτηριστικά, {Mset1}. 2. Μόνο τα 6 µορφολογικά χαρακτηριστικά, {Mset2}. 3. Μόνο τα 7 χαρακτηριστικά από το πεδίο του χρόνου, {Tdset}. 4. Μόνο τα 4 χαρακτηριστικά από το πεδίο της συχνότητας, {Fdset1}. 140
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα 5. Χαρακτηριστικά τόσο από το πεδίο του χρόνου όσο και από το πεδίο της συχνότητας, {Tdset, Fdset1} (11 χαρακτηριστικά). 6. Συνολικά 15 χαρακτηριστικά και από τα 3 πεδία, {Mset1, Tdset, Fdset1}. 7. Συνολικά 17 χαρακτηριστικά και από τα 3 πεδία, {Mset2, Tdset, Fdset1}. 8. Μόνο τα 5 χαρακτηριστικά από το πεδίο της συχνότητας, {Fdset2}. 9. Χαρακτηριστικά τόσο από το πεδίο του χρόνου όσο και από το πεδίο της συχνότητας, {Tdset, Fdset2} (12 χαρακτηριστικά). 10. Συνολικά 16 χαρακτηριστικά και από τα 3 πεδία, {Mset1, Tdset, Fdset2}. 11. Συνολικά 18 χαρακτηριστικά και από τα 3 πεδία, {Mset2, Tdset, Fdset2}. Για κάθε µία από τις παραπάνω οµάδες χαρακτηριστικών χρησιµοποιήσαµε την µέθοδο ανάλυσης σε πρωταρχικές συνιστώσες για την µείωση της διάστασης του διανύσµατος των χαρακτηριστικών και πειραµατιστήκαµε διατηρώντας διαφορετικό αριθµό από πρωταρχικές συνιστώσες (κάθε φορά από 1 έως το µέγιστο αριθµό χαρακτηριστικών που περιλαµβάνει κάθε µία από τις 11 οµάδες χαρακτηριστικών). Για κάθε µία από τις παραπάνω οµάδες χαρακτηριστικών εκπαιδεύσαµε τόσο µηχανές διανυσµάτων υποστήριξης όσο και για λόγους σύγκρισης και συµβατικούς ταξινοµητές όπως ο ταξινοµητής των k κοντινότερων γειτόνων, γραµµικούς και τετραγωνικούς ταξινοµητές (Κεφάλαιο 5). Το δύσκολο έργο της ταξινόµησης έγινε ακόµα πιο δύσκολο από το γεγονός ότι είχαµε ανοµοιογενή κατανοµή των παραδειγµάτων. Αυτό γίνεται εύκολο αντιληπτό παρατηρώντας την απόδοση των συµβατικών ταξινοµητών (Πίνακας 6.2). Για αυτό το συγκεκριµένο πρόβληµα και οι τρεις συµβατικοί ταξινοµητές αποτυγχάνουν να ταξινοµήσουν παραδείγµατα που προέρχονται από την κατηγορία µε τα «θετικά» δείγµατα. Εάν είχαµε χρησιµοποιήσει την ακρίβεια ως µέτρο σύγκρισης τότε θα καταλήγαµε στο λανθασµένο συµπέρασµα ότι όλοι οι ταξινοµητές έχουν περίπου την ίδια απόδοση. Χρησιµοποιώντας το γεωµετρικό µέσο µπορούµε να δούµε ότι ο ταξινοµητής που υλοποιείται από µία µηχανή διανυσµάτων υποστήριξης, υπερέχει των άλλων τριών ταξινοµητών επιτυγχάνοντας µια ισορροπηµένη απόδοση και για τις δύο κατηγορίες (Πίνακας 6.2) [Georgoulas et al. 2006a]. Η υπεροχή της µηχανής διανυσµάτων υποστήριξης γίνεται ακόµα πιο φανερή ελέγχοντας την τιµή του εµβαδού κάτω από τη ROC καµπύλη (AUC). Για την ακρίβεια οι συµβατικοί ταξινοµητές αποτυγχάνουν να δώσουν µία µεγαλύτερη τιµή στα θετικά πραδείγµατα από τα αρνητικά παραδείγµατα αποδεικνύοντας το πόσο δύσκολο είναι το συγκεκριµένο πρόβληµα. 141
Κεφάλαιο 6 ο Πίνακας 6.2. Αποτελέσµατα ταξινόµησης για τµήµατα διάρκειας 20 λεπτών (καλύτερα αποτελέσµατα για κάθε ταξινοµητή) k-nn (6 PC) ld c (5 PC) qdc (5 PC) SVM ( 3 PC) SVM ( 2 PC) {Mset2, {Mset2, {Tdset } {Tdset, {Tdset, Tdset, Tdset, Fdset2} Fdset2, Fdset2} Fdset2} Mset1} accuracy (%) 76,25 81,25 83.75 81.25 78.75 accuracy+ (%) 25 45 50 70 70 accuracy- (%) 93.33 93.33 95 85 81.68 g (%) 48.31 64,81 68.92 77.14 75.61 AUC 0.367 0.48 0.59 0.75 0.775 PC: Principal Components (Πρωταρχικές συνιστώσες) Στην περίπτωση των δειγµάτων µήκους 10 λεπτών η απόδοση µειώνεται για όλα τα σύνολα των χαρακτηριστικών. Τα καλύτερα αποτελέσµατα επιτυγχάνονται για το 11 ο σύνολο χαρακτηριστικών {Mset2, Tdset, Fdset1}) και διατηρώντας µόνο 2 από τις πρωταρχικές συνιστώσες. Για αυτή την περίπτωση είχαµε: g=70.83%, a + = 70%, a = 70.67%, a = 71.25%, (error rate=0.2875 standard deviation of error= 0.0506) και AUC=0.7. Όσον αφορά τα µορφολογικά χαρακτηριστικά όταν χρησιµοποιούνται µόνα τους τότε η απόδοση του ταξινοµητή είναι κατώτερη σε σχέση µε τα υπόλοιπα σύνολα χαρακτηριστικών. Αυτό υποδηλώνει ότι απαιτείται ενδεχοµένως περαιτέρω έλεγχος, µια και η πίστη µεταξύ των γυναικολόγων είναι ότι η επιβραδύνσεις παρέχουν σηµαντικές πληροφορίες σχετικά µε την έκβαση του τοκετού. Προς αυτή την κατεύθυνση, σε µελλοντική ερευνά µας, το κοµµάτι που υπολογίζει τα µορφολογικά χαρακτηριστικά πρόκειται να ξανασχεδιαστεί µελλοντικά µε βάση τις οδηγίες που έχουν εκδοθεί [Rooth et al. 1987; [National Institute of Child Health and Human Development Research Planning Workshop 1997], όπως έγινε στις εργασίες [Ayres-de-Campos et al. 2000; Bernardes et al. 1998], ή εξετάζοντας µια προσέγγιση µε τη χρήση νευρωνικών δικτύων [Ulbricht et al. 1998, Fontenla-Romero et al. 2001], και θα ελεγχθεί περαιτέρω µε τη βοήθεια των γυναικολόγων/µαιευτήρων. 142
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Για όλα τα σύνολα των χαρακτηριστικών, χρησιµοποιώντας µηχανή διανυσµάτων υποστήριξης είχαµε υψηλότερες τιµές τόσο για το γεωµετρικό µέσο g όσο και για εµβαδό κάτω από την ROC καµπύλη (AUC) συγκρινόµενες µε τις αντίστοιχες των συµβατικών ταξινοµητών (εξαιρώντας την τιµή του γεωµετρικού µέσου (g) για την περίπτωση των µορφολογικών χαρακτηριστικών όταν αυτά χρησιµοποιούνται µόνα τους). Προσαρµόζοντας τις δύο παραµέτρους C + και C επιτύχουµε υψηλή επιµέρους ακρίβεια για κάθε µία από τις δύο κατηγορίες. ήµαστε σε θέση να Συνοψίζοντας οι βέλτιστες τιµές, ως προς την τιµή του γεωµετρικού µέσου (g) επιτεύχθηκαν χρησιµοποιώντας την οµάδα {Tdset, Fdset2} διατηρώντας µόνο 3 πρωταρχικές συνιστώσες: g=77.14 a + = 70%, a = 85%, a = 81.25%, (error rate=0.1975 standard deviation of error=0.0445), AUC=0.75.. Όσον αφορά το εµβαδό κάτω από την ROC καµπύλη (AUC) η βέλτιστη απόδοση επιτεύχθει όταν στα παραπάνω χαρακτηριστικά προστέθηκαν και µορφολογικά χαρακτηριστικά (µε µόνο ένα τύπο επιβραδύνσεων) {Mset1, Tdset, Fdset2}, διατηρώντας µόνο 2 πρωταρχικές συνιστώσες: g=75.61 a + = 70%, a = 81,67%, a = 78.75%, (error rate=0.2125 standard deviation of error=0.0457), AUC=0.775. Στο Σχήµα 6.14 φαίνονται για κάθε ένα από τα 11 σύνολα χαρακτηριστικών και για διάρκεια 20 λεπτών η απόδοση µε τη χρήση µηχανών διανυσµάτων υποστήριξης. 143
Κεφάλαιο 6 ο Σχήµα 6.14: Η απόδοση για τα 11 διαφορετικά σύνολα χαρακτηριστικών µε τη χρήση µηχανών διανυσµάτων υποστήριξης. Χρησιµοποιώντας την ακρίβεια ως µέτρο, ο τετραγωνικός ταξινοµητής εµφανίζει την καλύτερη απόδοση αλλά δύσκολα θα τον συνιστούσαµε µια και αποτυγχάνει τελείως να αντιµετωπίσει το πρόβληµα µε την ανοµοιογενή κατανοµή των παραδειγµάτων ανάµεσα στις δύο κατηγορίες. Μεταβάλλοντας τις παραµέτρους θα µπορούσαµε και µε τις µηχανές διανυσµάτων υποστήριξης να επιτύχουµε αύξηση της επιµέρους απόδοσης για τα αρνητικά παραδείγµατα αλλά αυτό θα οδηγούσε σε µείωση της επιµέρους απόδοσης για τα θετικά παραδείγµατα. Η απόδοση η οποία επιτεύχθει χρησιµοποιώντας τόσο µηχανές διανυσµάτων υποστήριξης όσο και του υπολοιπους συµβατικούς ταξινοµητές όσον αφορά εµβαδό κάτω από την ROC καµπύλη (AUC) δείχνει ότι αν και το σήµα της ΕΚΣ µεταφέρει χρήσιµη πληροφορία, όταν αυτό χρησιµοποιείται µεµονωµένα, πιθανόν δεν είναι σε θέση να επιτύχει πολύ υψηλά ποσοστά ταξινόµησης. Σε αυτό το σηµείο ολοκληρώνονται ως ένα βαθµό τα πειράµατα που ασχολούνται µε τη χρησιµοποίηση συµβατικών χαρακτηριστικών για την κατηγοριοποίηση της ΕΚΣ. Θα επανέρθουµε σε επόµενη ενότητα αυτού του κεφαλαίου όπου θα κάνουµε χρήση µιας νέας µεθόδου για την κατασκευή 144
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα νέων χαρακτηριστικών από ήδη υπάρχοντα, όπου τα συµβατικά χαρακτηριστικά αποτελούν τη βάση για τη δηµιουργία νέων. 6.5. Χαρακτηριστικά εξαγόµενα µε διακριτό µετασχηµατισµό κυµατιδίου Η τρίτη προσέγγιση στο πρόβληµα της κατηγοριοποίησης της ΕΚΣ επικεντρώθηκε στη χρησιµοποίηση χαρακτηριστικών τα οποία εξήχθησαν µε τη χρήση του διακριτού µετασχηµατισµού κυµατιδίου. Πιο συγκεκριµένα, όπως αναπτύχθηκε µε µεγαλύτερη λεπτοµέρεια στο κεφάλαιο 4, χρησιµοποιήθηκε ο διακριτός µετασχηµατισµός κυµατιδίου για την «αποσύνθεση» του αρχικού σήµατος της ΕΚΣ σε µια σειρά από συντελεστές κυµατιδίου από τους οποίους εντέλει εξήχθησαν µια σειρά χαρακτηριστικών τα οποία τροφοδοτούσαν στη συνέχεια µία µηχανή διανυσµάτων υποστήριξης. Αν και δεν είναι η πρώτη φορά που χρησιµοποιείται ο διακριτός µετασχηµατισµός κυµατιδίου για το πρόβληµα της ανάλυσης και κατηγοριοποίησης σηµάτων καρδιακής συχνότητας (η περισσότερη ερευνητική δουλειά έχει γίνει για την ανάλυση της χρονοσειρά των καρδιακών γεγονότων ενηλίκων) πρέπει να επισηµάνουµε ότι ορισµένα από τα χαρακτηριστικά που υπολογίσαµε χρησιµοποιήθηκαν για πρώτη φορά στα πλαίσια αυτής της διδακτορικής διατριβής για την ταξινόµηση των σηµάτων της ΕΚΣ. Επίσης είναι η πρώτη φορά που συνδυάζονται τέτοιου είδους χαρακτηριστικά µε µία µηχανή διανυσµάτων υποστήριξης. Η συνολική διαδικασία περιγράφεται στο Σχήµα 6.15. 145
Κεφάλαιο 6 ο ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ DWT Εξαγωγή χαρακτηριστικών Ταξινόµηση (SVM,knn,ldc,qdc) Αξιολόγηση Εικόνα 6.15: Σχηµατικά η µεθοδολογία µε τη χρήση χαρακτηριστικών που εξήχθησαν µε τη χρήση του διακριτού µετασχηµατισµού κυµατιδίου Συνοπτικά: Μετά το στάδιο της προεπεξεργασίας πραγµατοποιούµε ανάλυση του σήµατος της ΕΚΣ χρησιµοποιώντας τον διακριτό µετασχηµατισµό κυµατιδίου. Επενεργώντας στους συντελεστές κυµατιδίου εξάγουµε ένα σύνολο χαρακτηριστικών µε τα οποία τροφοδοτούµε έναν ταξινοµητή και στο τελικό στάδιο αξιολογούµε την όλη προσέγγιση και πάλι µε τη χρήση της µεθόδου αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών. Ειδικό βάρος σε αυτή τη µεθοδολογία δόθηκε στη χρήση των µηχανών διανυσµάτων υποστήριξης συγκρίνοντάς την απόδοσή του µε τις αποδόσεις συµβατικών ταξινοµητών. Στη συνέχεια θα περιγράψουµε τις διάφορες παραλλαγές (επιλογή χαρακτηριστικών, διαφορετικά σύνολα δεδοµένων, κτλ) µε τις οποίες πειραµατιστήκαµε για να αξιολογήσουµε την προτεινόµενη µεθοδολογία. 146
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα 6.5.1 ιακριτός µετασχηµατισµός κυµατιδίου Ι Σε µια πρώτη παραλλαγή της µεθοδολογίας χρησιµοποιήσαµε και συγκρίναµε 3 διαφορετικά σύνολα χαρακτηριστικών χρησιµοποιώντας για την εξαγωγή τους το διακριτό µετασχηµατισµό κυµατιδίου του σήµατος της ΕΚΣ. Τα χαρακτηριστικά που εξαγάγαµε (και τα οποία έχουν περιγραφεί λεπτοµερώς στην ενότητα 4.3) είναι: α) η εντροπία κατά Shannon της κατανοµής των κανονικοποιηµένων ενεργειών των συντελεστών ανά κλίµακα (1 ο σύνολο χαρακτηριστικών), β) οι τιµές (απόλυτο µέγιστο) των συντελεστών και η θέση τους (2 ο σύνολο χαρακτηριστικών) και γ) η µέγιστη τιµή της τυπικής απόκλισης υπολογισµένη εντός ενός ολισθαίνοντος παραθύρου για κάθε κλίµακα καθώς και η θέση του παραθύρου (3 ο σύνολο χαρακτηριστικών). Όλα τα παραπάνω χαρακτηριστικά τα εξαγάγαµε τόσο για τα τελευταία 10 όσο και για τα τελευταία 5 λεπτά των σηµάτων της ΕΚΣ. Για τον υπολογισµό και τη χρήση του πρώτου χαρακτηριστικού προχωρήσαµε υλοποιώντας τον διακριτό µετασχηµατισµό κυµατιδίου µέχρι το 6 ο επίπεδο και για κάθε κλίµακα υπολογίσαµε την εντροπία της κατανοµής των κανονικοποιηµένων ενεργειών των συντελεστών κυµατιδίου. Για τον υπολογισµό του δεύτερου χαρακτηριστικού προχωρήσαµε υλοποιώντας τον διακριτό µετασχηµατισµό κυµατιδίου µέχρι το 5 ο επίπεδο και για κάθε κλίµακα υπολογίσαµε την µέγιστη απόλυτη τιµή των συντελεστών και τη θέση τους. Μέχρι το 5 ο επίπεδο προχωρήσαµε και στην περίπτωση του 3 ου χαρακτηριστικού. Θα πρέπει να σηµειωθεί ότι χρησιµοποιήσαµε διαφορετικές οικογένειες κυµατιδίων µε µια ποικιλία όσον αφορά τον αριθµό των µηδενικών ροπών. Σε αυτή την εργασία επιχειρήσαµε την ταξινόµηση 40 δειγµάτων από τα οποία 20 είχαν ph<7.1 και 20 είχαν ph>7.2. Για την ταξινόµηση χρησιµοποιήθηκαν µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης και για την εκτίµηση της απόδοσης χρησιµοποιήθηκε και πάλι η µέθοδος αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 4 υποσύνολα (4-fold). Συγκεντρωτικά τα καλύτερα αποτελέσµατα για τα συνολικά 6 πειράµατα απεικονίζονται στο γράφηµα του Σχήµατος 6.16. 147
Κεφάλαιο 6 ο Σχήµα 6.16: Τα καλύτερα αποτελέσµατα για τα 3 διαφορετικά χαρακτηριστικά και για χρονική διάρκεια a) 10 λεπτών και b) 5 λεπτών. Χρησιµοποιώντας το πρώτο σύνολο χαρακτηριστικών και για διάρκεια 10 λεπτών επιτύχαµε ακρίβεια 82.5 % (για περισσότερες από µία πρωταρχικές συναρτήσεις). Μειώνοντας το χρονικό παράθυρο στα 5 λεπτά η ακρίβεια αυξήθηκε στο 90% (µε επιµέρους ακρίβειες επίσης στο 90%) χρησιµοποιώντας διορθογώνια (biorthogonal) κυµατίδια. Για την περίπτωση της δεύτερης οµάδας χαρακτηριστικών τα αποτελέσµατα ήταν κατά κάποιο τρόπο «αντίστροφα», εµφανίζοντας µεγαλύτερη ακρίβεια για το παράθυρο των 10 λεπτών 82.5 % η οποία πέφτει ελαφρώς στο 80% καθώς µειώνεται η διάρκεια στα 5 λεπτά. Το τρίτο σύνολο παραδόξως εµφανίζει χειρότερα αποτελέσµατα συγκρινόµενο µε τα άλλα δύο έχοντας ακρίβεια 72.5% για την περίπτωση των 10 λεπτών και 77.5% για την περίπτωση των 5 λεπτών. Αυτό ήταν το πρώτο σύνολο πειραµάτων για το οποίο επιτύχαµε τόσο υψηλή ακρίβεια [Georgoulas et al. 2005a]. 6.5.2 ιακριτός µετασχηµατισµός κυµατιδίου ΙΙ Στη δεύτερη παραλλαγή της µεθόδου µε τη χρήση του διακριτού µετασχηµατισµού κυµατιδίου, επικεντρωθήκαµε σε τµήµατα µικρής διάρκειας κοντά στο τέλος του τοκετού χρησιµοποιώντας το ίδιο ακριβώς σύνολο δεδοµένων µε αυτό που περιγράφτηκε στην παράγραφο 6.5.1. Η όλη διαδικασία µπορεί να χωριστεί σε δύο µέρη. Στο πρώτο µέρος πειραµατιστήκαµε µε παράθυρα διάρκειας από 1 148
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα έως 15 λεπτών για τα οποία χρησιµοποιήσαµε ως χαρακτηριστικά την τυπική απόκλιση των συντελεστών κυµατιδίου ανά κλίµακα. Στο δεύτερο µέρος χρησιµοποιήσαµε ένα µικρό ολισθαίνων παράθυρο για να µελετήσουµε τη συµπεριφορά της µεθόδου ταξινόµησης καθώς «κινούµαστε» στο χρόνο. Και στις δύο περιπτώσεις προχωρήσαµε υλοποιώντας τον διακριτό µετασχηµατισµό κυµατιδίου µέχρι το 6 ο επίπεδο χρησιµοποιώντας για την πρώτη προσέγγιση διάφορες οικογένειες από κυµατίδια ενώ για τη δεύτερη χρησιµοποιήσαµε εκείνο το κυµατίδιο και εκείνη τη διάρκεια παραθύρου για την οποία είχαµε την καλύτερη απόδοση στην προηγούµενη φάση. Για την κατηγοριοποίηση χρησιµοποιήθηκαν µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης και για την εκτίµηση της απόδοσης χρησιµοποιήθηκε και πάλι η µέθοδος αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 4 υποσύνολα (4-fold). Για την πρώτη προσέγγιση τα αποτελέσµατα περιγράφονται γραφικά στην παρακάτω εικόνα η οποία προέκυψε µε τη χρήση κυµατιδίου symmlet µε 13 µηδενικές ροπές. Όπως φαίνεται τα καλύτερα αποτελέσµατα προκύπτουν για ένα χρονικό παράθυρο 3 λεπτών (Σχήµα 6.17). Για αυτό το συνδυασµό επιτύχαµε ακρίβεια 90% η οποία µάλιστα ήταν ισορροπηµένη όσων αφορά και τις δύο κατηγορίες (επιµέρους ακρίβειες 90%) [Georgoulas et al. 2005b]. Σχήµα 6.17: Απόδοση ταξινόµησης για διαφορετικά µήκη παραθύρων. Στη δεύτερη προσέγγιση χρησιµοποιήσαµε ολισθαίνοντα παράθυρα 3 λεπτών µε 2 λεπτά επικάλυψη µεταξύ τους και χρησιµοποιώντας κυµατίδιο symmlet µε 13 µηδενικές ροπές για την ανάλυση. Στο Σχήµα 6.18 φαίνεται η µεταβολή της ακρίβειας του ταξινοµητή καθώς αποµακρυνόµαστε από τα τελευταία λεπτά του τοκετού. 149
Κεφάλαιο 6 ο Σχήµα 6.18: Απόδοση του ταξινοµητή για ένα ολισθαίνον παράθυρο 3 λεπτών. Όπως φαίνεται η απόδοση πέφτει σηµαντικά υποδηλώνοντας ότι όσο αποµακρυνόµαστε από τα τελευταία λεπτά του τοκετού τόσο µειώνεται η συσχέτιση του σήµατος της ΕΚΣ µε την έκβαση του τοκετού. Αυτό είναι δικαιολογηµένο καθώς στα τελευταία λεπτά η πίεση που ασκείται στο έµβρυο είναι µεγαλύτερη και αυτή ακριβώς η πίεση αντικατοπτρίζεται σε αποκλίσεις από τα «φυσιολογικά» όρια του ph όπως και στη περίπτωση των αποτελεσµάτων της ενότητας 6.5.1. 6.5.3 ιακριτός µετασχηµατισµός κυµατιδίου ΙΙI Στην τρίτη και πιο ολοκληρωµένη προσέγγιση όσον αφορά τη χρήση χαρακτηριστικών τα οποία εξήχθησαν µε τη χρήση του διακριτού µετασχηµατισµού κυµατιδίου, επικεντρωθήκαµε κυρίως στα τελευταία λεπτά της καταγραφής και πιο συγκεκριµένα σε διαστήµατα των 5 και 10 λεπτών πριν από το τέλος της. Το σύνολο των δεδοµένων ήταν το ίδιο µε αυτό το οποίο περιγράφτηκε στην ενότητα 6.4.3. Για την εξαγωγή των χαρακτηριστικών χρησιµοποιήθηκαν οι συντελεστές που προκύπτουν από τον µετασχηµατισµό κυµατιδίου. ιαφορετικές οικογένειες από κυµατίδια δοκιµάστηκαν (Daubechies, Symmlets και Coiflets) µε διαφόρους αριθµούς από µηδενικές ροπές. Η ανάλυση πραγµατοποιήθηκε µέχρι το 5 ο επίπεδο αν και δεν χρησιµοποιήθηκαν όλες οι κλίµακες σε όλα τα σετ πειραµάτων. Στο πρώτο σετ πειραµάτων χρησιµοποιήθηκαν οι µέγιστοι συντελεστές (κατά απόλυτη τιµή) και ο δείκτης που προσδιορίζει τη θέση τους από τα επίπεδα 2-4 (Wset1). Στο δεύτερο σετ συµπεριλάβαµε και το 5 ο επίπεδο στην ανάλυση (Wset2). Στο τρίτο σετ πειραµάτων χρησιµοποιήθηκαν οι συντελεστές 150
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα από τα επίπεδα 2-4 και η εντροπία των κανονικοποιηµένων ενεργειών των συντελεστών εντός ενός ολισθαίνοντος παραθύρου (κεφάλαιο 4), καθώς και η θέση του παραθύρου (Wset3). Στο τέταρτο χρησιµοποιήσαµε το 3 ο σετ και συµπεριλάβαµε και το 5 ο επίπεδο στην ανάλυση προσθέτοντας δύο ακόµα χαρακτηριστικά (Wset4). Οι συντελεστές από το πρώτο επίπεδο m=1 εξαιρέθηκαν από την ανάλυση γιατί αντιστοιχούν στο υψηλό συχνοτικό περιεχόµενο του σήµατος και θεωρήθηκε ότι αποτελούν κυρίως το κοµµάτι του σήµατος που αντιστοιχεί σε θόρυβο. Για το στάδιο της ταξινόµησης χρησιµοποιήθηκαν και πάλι µηχανές διανυσµάτων υποστήριξης µε πυρήνες ακτινικών συναρτήσεων βάσης. Η προσέγγιση τόσο για τον υπολογισµό της απόδοσης όσο και για την επιλογή των παραµέτρων είναι αυτή η οποία περιγράφεται στην ενότητα 6.4.3. Στη συγκεκριµένη προσέγγιση δεν χρησιµοποιήθηκε στάδιο µείωσης της διάστασης του διανύσµατος των χαρακτηριστικών µια και ο αριθµός των χαρακτηριστικών ήταν ήδη αρκετά µικρός. Χρησιµοποιώντας τα σύνολα Wset1 και Wset2, για τα τµήµατα των 5 λεπτών δεν είχαµε ικανοποιητικά αποτελέσµατα, αλλά επίσης χαµηλή ήταν και η απόδοση των συµβατικών ταξινοµητών όπως φαίνεται από τους Πίνακες 6.3 και 6.4. Η υψηλή ακρίβεια του τετραγωνικού ταξινοµητή είναι επιφανειακή µια και επιτυγχάνει µόνο υψηλή απόδοση ταξινόµησης για την κατηγορία των σηµάτων µε υψηλό ph. Από την άλλη µεριά οι µηχανές διανυσµάτων υποστήριξης καταφέρνουν να έχουν µια αρκετά ισορροπηµένη απόδοση. Πίνακας 6.3. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset1 και για χρονική διάρκεια 5 λεπτών. nn-c ldc qdc SVM a 72.5 76.25 82.5 72.5 a + 40 5 50 80 a 83.33 100 93.33 70 g 57.73 22.36 68.3 74.83 151
Κεφάλαιο 6 ο Πίνακας 6.4. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset2 και για χρονική διάρκεια 5 λεπτών.. nn-c ldc qdc SVM a 67.5 76.25 73.75 75 a + 30 10 86.67 70 a 80 98.33 35 76.67 g 48.99 31.36 55.08 73.26 Για την ίδια χρονική διάρκεια (των 5 λεπτών) η προσθήκη των χαρακτηριστικών από το 5 ο επίπεδο βελτιώνει την απόδοση όπως φαίνεται στους Πίνακες 6.5 και 6.6. Τόσο οι συµβατικοί ταξινοµητές όσο και οι µηχανές διανυσµάτων υποστήριξης παρουσιάζουν υψηλή απόδοση ταξινόµησης για την κατηγορία των σηµάτων µε υψηλό ph, αλλά οι µηχανές διανυσµάτων υποστήριξης έχουν επίσης και υψηλή απόδοση ταξινόµησης για την κατηγορία των σηµάτων µε χαµηλό ph. Τα καλύτερα αποτελέσµατα επιτεύχθηκαν µε τη χρήση Daubecies κυµατιδίων µε 11 µηδενικές ροπές αν και υψηλή απόδοση επίσης επιτευχθεί και µε τη χρήση και των άλλων οικογενειών Symmlets και Coiflets. Πίνακας 6.5. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset3 και για χρονική διάρκεια 5 λεπτών. nn-c ldc qdc SVM a 72.5 83.75 63.75 86.25 a + 40 45 40 70 a 83.33 96.67 71.67 91.67 g 59.44 65.96 53.54 80.1 152
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Πίνακας 6.6. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset4 και για χρονική διάρκεια 5 λεπτών. nn-c ldc qdc SVM a 82.5 82.5 85 88.75 a + 55 55 60 75 a 91.67 91.67 93.33 93.33 g 71 71 74.8 83.67 Χρησιµοποιώντας τα σύνολα χαρακτηριστικών Wset1 and Wset2 για τµήµατα διάρκειας 10 λεπτών και πάλι δεν είχαµε ικανοποιητικά αποτελέσµατα όπως και στην περίπτωση των 5 λεπτών. Τα αποτελέσµατα ήταν σχεδόν τα ίδια και για τις δύο χρονικές διάρκειες. Πίνακας 6.7. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset1 και για χρονική διάρκεια 10 λεπτών. nn-c ldc qdc SVM a 72.5 76.25 65 70 a + 50 5 30 80 a 80 100 76.67 66.67 g 63.25 22.36 47.96 73.03 153
Κεφάλαιο 6 ο Πίνακας 6.8. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset2 και για χρονική διάρκεια 10 λεπτών. nn-c ldc qdc SVM a 75 76.25 71.25 67.5 a + 45 10 40 85 a 85 98.33 81.67 61.67 g 61.85 31.36 57.16 72.4 Πίνακας 6.9 Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset3 και για χρονική διάρκεια 10 λεπτών. nn-c ldc qdc SVM a 78.75 77.5 75 80.25 a + 50 40 35 70 a 88.33 90 88.33 85 g 66.46 60 55.6 77.14 Πίνακας 6.10. Αποτελέσµατα ταξινόµησης για το σύνολο των χαρακτηριστικών Wset4 και για χρονική διάρκεια 10 λεπτών. nn-c ldc qdc SVM a 81.25 82.5 82.5 88.75 a + 55 55 45 70 a 90 91.67 95 95 g 70.36 71 65.38 81.55 Όπως φαίνεται στους πίνακες 6.9 και 6.10 τα σύνολα χαρακτηριστικών Wset3 και Wset4 για τµήµατα των 10 λεπτών παρουσιάζουν πολύ καλή απόδοση (όπως και στην περίπτωση των 5 λεπτών). Η επιπλέον πληροφορία που υπάρχει στους συντελεστές του πέµπτου επιπέδου της ανάλυσης του 154
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα σήµατος της ΕΚΣ (σύνολα χαρακτηριστικών Wset3 και Wset4) βελτιώνουν την απόδοση του ταξινοµητή είτε πρόκειται για συµβατικό ταξινοµητή είτε για µηχανές διανυσµάτων υποστήριξης. Παρατηρώντας τα αποτελέσµατα όπως παρουσιάζονται στους Πίνακες 6.3-6.10 εάν κάποιος επικεντρωθεί µόνο στην ακρίβεια τότε θα καταλήξει και πάλι στο λανθασµένο συµπέρασµα ότι οι συµβατικοί ταξινοµητές συµπεριφέρονται µε τον ίδιο τρόπο που συµπεριφέρεται και οι µηχανές διανυσµάτων υποστήριξης. Αυτό βέβαια δεν είναι αληθές (τουλάχιστον στην προκειµένη περίπτωση). Μια πιο αξιόπιστη σύγκριση απαιτεί την εξέταση της 5 ης γραµµής των Πινάκων 6.3-6.10 η οποία παρουσιάζει το γεωµετρικό µέσο (g). Κάτω από αυτό το πρίσµα γίνεται φανερό ότι οι µηχανές διανυσµάτων υποστήριξης υπερέχουν σε όλες τις περιπτώσεις των συµβατικών. Από τους προηγούµενους Πίνακες (6.3, 6,4, 6.7 και 6.8), φαίνεται ότι οι µεµονωµένοι συντελεστές (σύνολα Wset1 και Wset2) δεν είχαν και τόσο καλά αποτελέσµατα. Αν και έχουν χρησιµοποιηθεί µε επιτυχία στην ανάλυση ηλεκτροεγκεφαλογραφηµάτων φαίνεται ότι αυτή η απλουστευµένη προσέγγιση δεν µπορεί να περιγράψει την φυσιολογία του σήµατος της ΕΚΣ. Από την άλλη µεριά τα χαρακτηριστικά (σύνολα Wset3 και Wset4) που βασίζονται στην εντροπία µπορούν να χρησιµοποιηθούν µε µεγαλύτερη επιτυχία για τον καθορισµό της κατάστασης της υγείας του εµβρύου. Άλλωστε είναι γνωστό ότι η ΕΚΣ εξαρτάται από πολύπλοκους µηχανισµούς καθώς επηρεάζεται τόσο από το ίδιο το έµβρυο, όσο και από την έγκυο η οποία ελέγχει το µηχανισµό αναπνοής του εµβρύου και καθορίζει την οξυγόνωση του αίµατος του εµβρύου. Από την άλλη µεριά, τα χαρακτηριστικά που περιέχουν τα σύνολα Wset3 και Wset4,και βασίζονται στην εντροπία, φαίνεται να περιέχουν σηµαντικότερη πληροφορία και όπως αποδείχθηκε και µπορούν να χρησιµοποιηθούν µε µεγαλύτερη επιτυχία για τον καθορισµό της κατάστασης της υγείας του εµβρύου 6.6 ηµιουργία νέων χαρακτηριστικών µε εξελικτική γραµµατική Σε αυτή την ενότητα προτείνεται µια νέα ολοκληρωµένη µεθοδολογία, η οποία χρησιµοποιεί εξελικτική γραµµατική για να δηµιουργήσει νέα τεχνητά χαρακτηριστικών από ήδη υπάρχοντα. Πρόκειται για µία νέα µέθοδο που επιδιώκει να ανακαλύψει κρυφές συσχετίσεις µεταξύ των µεταβλητών εισόδου. Μάλιστα τα αποτελέσµατα από τη χρήση της συγκεκριµένης µεθόδου για την επεξεργασία σηµάτων ΕΚΣ είναι πολύ ενθαρρυντικά. Τα αρχικά χαρακτηριστικά στα οποία θα εφαρµοσθεί η τεχνική της εξελεγκτικής γραµµατικής προκειµένου να προκύψουν νέα τεχνητά χαρακτηριστικά, προέρχονται από το πεδίο του χρόνου, της συχνότητας και από τη «µορφολογική» ανάλυση του σήµατος της ΕΚΣ, τα οποία περιγράφθηκαν αναλυτικά στο κεφάλαιο 4. 155
Κεφάλαιο 6 ο 6.6.1 Συνδυασµός εξελικτικής γραµµατικής µε Νευρωνικά ίκτυα Ακτινικών Συναρτήσεων Βάσης Στην πρώτη εφαρµογή της µεθόδου χρησιµοποιήθηκαν συνολικά 18 χαρακτηριστικά εξαγόµενα και από τα πεδία του χρόνου, της συχνότητας καθώς και τα µορφολογικά χαρακτηριστικά {Mset2, Tdset, Fdset2} τα οποία περιγράφονται στο κεφάλαιο 4 (ενότητα 4.2). Το σύνολο των δεδοµένων το οποίο χρησιµοποιήθηκε ήταν το ίδιο µε αυτό το οποίο περιγράφεται στην ενότητα 6.4.1. Η χρονική διάρκεια των τµηµάτων της ΕΚΣ που χρησιµοποιήθηκαν ήταν 20 λεπτά. Για την εκτίµηση της απόδοσης χρησιµοποιήθηκε η µέθοδος αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 5 υποσύνολα (5-fold). Συγκεκριµένα χρησιµοποιήθηκαν 5 µη επικαλυπτόµενα υποσύνολα στο κάθε ένα από τα οποία συµπεριλαµβάνονταν 4 παραδείγµατα από την κατηγορία µε τα υγιή και 4 από την κατηγορία µε τα ύποπτα έµβρυα. Για την τελική ταξινόµηση και για τον υπολογισµό της τιµής της συνάρτησης καταλληλότητας η οποία στην προκειµένη περίπτωση είναι το εκτιµούµενο σφάλµα κατηγοριοποίησης επιλέχθηκε η χρήση ενός νευρωνικού δικτύου ακτινικών συναρτήσεων βάσης. Πιο συγκεκριµένα µε τη χρήση της εξελικτικής γραµµατικής δηµιουργούσαµε µια έκφραση της οποίας η τιµή της συνάρτησης καταλληλότητας υπολογιζόταν χρησιµοποιώντας τα 4*8=32 παραδείγµατα. Το εκτιµούµενο σφάλµα (η ακρίβεια µε άλλα λόγια της µεθοδολογίας) προέκυπτε από την εφαρµογή της µεθόδου στο σύνολο (8 παραδείγµατα) που δεν είχε χρησιµοποιηθεί κατά την εκπαίδευση. Στο Σχήµα 6.19 απεικονίζεται γραφικά η όλη διαδικασία. Επειδή τόσο η εκπαίδευση του νευρωνικού όσο και η δηµιουργία της έκφρασης είναι µια στοχαστική διαδικασία, τις παραπάνω ενέργειες τις επαναλάβαµε 5 φορές και τελικά υπολογίσαµε την µέση ακρίβεια. Η επιλογή του δικτύου ακτινικών συναρτήσεων βάσης έγινε λόγω του µικρού χρόνου που απαιτείται για την εκπαίδευσή του συγκρινόµενου µε άλλους ταξινοµητές που εκπαιδεύονται µε επίβλεψη (π.χ. πολυεπίπεδα δίκτυα perceptron, µηχανές διανυσµάτων υποστήριξης κτλ.). Με αυτό τον τρόπο προσπαθήσαµε να αντισταθµίσουµε την εξαιρετικά χρονοβόρα διαδικασία που απαιτεί η χρήση της εξελεγκτικής γραµµατικής. 156
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Σχήµα 6.19: Η διαδικασία κατασκευής νέων χαρακτηριστικών και ταξινόµησης µε δίκτυο ακτινικών συναρτήσεων βάσης Χρησιµοποιήσαµε διαφορετικές τοπολογίες για το δίκτυο ακτινικών συναρτήσεων βάσης µεταβάλλοντας των αριθµό των κρυφών νευρώνων (1-15). Επίσης δοκιµάσαµε διαφορετικό πλήθος από κατασκευασµένα νέα χαρακτηριστικά (1-6). Τα καλύτερα αποτελέσµατα συνοψίζονται στο παρακάτω γράφηµα (Σχήµα 6.19) µε συνολική µέγιστη ακρίβεια ίση µε 92.5%. accuracy 100% 90% (%) 80% 70% 60% 1 2 3 4 5 6 # features Σχήµα 6.20: Απόδοση της µεθόδου για διαφορετικό αριθµό κατασκευασµένων χαρακτηριστικών Μερικά από τα νέα χαρακτηριστικά που «κατασκευάστηκαν» παρατίθονται στη συνέχεια (προφανώς σε κάθε µία επανάληψη δεν δηµιουργούνταν τα ίδια χαρακτηριστικά): f = sin( x ) x + x 1 13 17 18 f = sin( x ) exp( x ) + x 2 7 17 18 f = x 3 18 157
Κεφάλαιο 6 ο Είναι η πρώτη φορά που χρησιµοποιήθηκαν κατασκευασµένα χαρακτηριστικά µε τη µέθοδο της εξελεγκτικής γραµµατικής σε δεδοµένα που προέρχονται από την ανάλυση της ΕΚΣ και έχουν προκύψει ενδιαφέρουσες παρατηρήσεις. Πρώτα απ όλα τα χαρακτηριστικά τα οποία χρησιµοποίησε πιο συχνά το σύστηµα είναι τα: (,,,,,, ) x x x x x x x. Τα υπόλοιπα από τα πρωταρχικά 2 5 7 11 13 17 18 χαρακτηριστικά δεν έγιναν αποδεκτά στις περισσότερες των περιπτώσεων, υποδεικνύοντας ότι πιθανόν να µην εµπεριέχουν χρήσιµη πληροφορία για το συγκεκριµένο πρόβληµα ταξινόµησης. Από την άλλη µεριά όταν κάποιο χαρακτηριστικό χρησιµοποιείται αναλλοίωτο αυτό σηµαίνει ότι η πληροφορία που µεταφέρει είναι σηµαντική όπως στην περίπτωση του ( x 18 ) που δίνει µια γενική πληροφορία για την ύπαρξη επιβραδύνσεων. Τα χαρακτηριστικά (,, ) x x x αντιστοιχούν στον αριθµό των επιταχύνσεων, τον αριθµό των 13 17 18 επιβραδύνσεων βαρείας µορφής και το ποσοστό του χρόνου που καταλαµβάνεται από επιβραδύνσεις γενικότερα. Ειδικότερα η ύπαρξη επιβραδύνσεων είναι ένα από τα πιο σηµαντικά ευρήµατα τα οποία αξιολογούνται από τους µαιευτήρες σε καθηµερινή βάση ως «ανησυχητική» ένδειξη και είναι το χαρακτηριστικό το οποίο συναντήσαµε αρκετές φορές αναλλοίωτο µετά την εφαρµογή της µεθόδου. Από την άλλη µεριά η ύπαρξη επιταχύνσεων θεωρείται επίσης σηµαντικό εύρηµα και δείγµα της καλής κατάστασης του εµβρύου. Τα χαρακτηριστικά ( 2, 5, 7) µέτρησης τις διακύµανση της ΕΚΣ ({ std, II, Delta _ } x x x αποτελούν διαφορετικούς τρόπους total ενότητα 4.2.1) η οποία (διακύµανση) θεωρείται επίσης σηµαντική για την αξιολόγηση της κατάστασης του εµβρύου. 6.6.2 Εξελικτική γραµµατική και πολυεπίπεδα δίκτυα perceptron Σε αυτή την εργασία χρησιµοποιήθηκε ένα µεγαλύτερο σύνολο παραδειγµάτων, συνολικά 160 από τα οποία τα 130 αντιστοιχούσαν σε έµβρυα µε ph>7.2 και 30 σε έµβρυα µε ph<7.1. Όπως είναι φανερό το πρόβληµα µε την ανοµοιογενή κατανοµή των παραδειγµάτων έγινε ακόµα πιο έντονο. Για αυτό το λόγο ειδική µέριµνα έπρεπε να ληφθεί έτσι ώστε να µην εκπαιδεύσουµε έναν ταξινοµητή ο οποίος θα είχε περιορισµένη διακριτική ικανότητα σχετικά µε την κατηγορία των εµβρύων µε χαµηλό ph. Για την αντιµετώπιση αυτού του προβλήµατος χρησιµοποιήσαµε τη µέθοδο δηµιουργίας συνθετικών παραδειγµάτων µε υπερδειγµατο-ληψία της µειοψηφούσας κατηγορίας (Synthetic Minority Oversampling TEchnique (SMOTE), ενότητα 4.6). Θα πρέπει να σηµειωθεί ότι τα παραδείγµατα δηµιουργούνται όχι στον αρχικό χώρο του σήµατος αλλά στο χώρο των χαρακτηριστικών. Ο αριθµός των κοντινότερων γειτόνων τέθηκε ίσος µε 8 και πειραµατιστήκαµε µε τη χρήση 3, 4 και 5 από αυτούς οδηγούµενοι υπερδειγµατοληψία 300%, 400% και 500% αντίστοιχα. Μετά από το στάδιο της δηµιουργία συνθετικών παραδειγµάτων επέρχεται εξισορρόπηση µεταξύ των 158
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα πληθυσµών των δύο κατηγοριών και η µέθοδος συνεχίζει µε τη διαδικασία κατασκευής νέων χαρακτηριστικών. Τα πρωταρχικά χαρακτηριστικά είναι τα ίδια τα οποία περιγράφτηκαν στην προηγούµενη παράγραφο,δηλαδή χρησιµοποιούνται τα συµβατικά χαρακτηριστικά {Mset2, Tdset, Fdset2}. Η διαδικασία της κατασκευής των χαρακτηριστικών και της εκπαίδευσης του δικτύου (που σε αυτή την περίπτωση είναι ένα πολυεπίπεδο δίκτυο perceptron) διαφοροποιείται από αυτή της προηγούµενης παραγράφου. Πιο συγκεκριµένα αρχικά δηµιουργείται ένας πληθυσµός από 400 χρωµοσώµατα τα οποία κωδικοποιούν τα χαρακτηριστικά που πρόκειται να κατασκευαστούν µε βάση την προκαθορισµένη γραµµατική (ενότητα 4.5.2). Η τιµή καταλληλότητας του κάθε ενός από τα χρωµοσώµατα σε κάθε γενιά (συνολικά 300) είναι το σφάλµα εκπαίδευσης ενός πολυεπίπδου δικτύου perceptron µε ένα κρυφό επίπεδο και 5 κρυφούς νευρώνες σε αυτό και το οποίο εκπαιδεύεται µε µία «γρήγορη» παραλλαγή της BFGS µεθόδου [Powell 1989] για λίγες µόνο επαναλήψεις της. Με το πέρας των 300 γενιών τα καλύτερα νέα χαρακτηριστικά τροφοδοτούν 10 διαφορετικά πολυεπίπεδα δίκτυα perceptron (1 έως 10 κρυφοί νευρώνες) τα οποία εκπαιδεύονται µε µία υβριδική µέθοδο. Αρχικά µε τη χρήση γενετικού αλγορίθµου (50 γενιές, 100 χρωµοσώµατα, µε πιθανότητα µετάλλαξης 5%, πιθανότητα διασταύρωσης 95% και µε επιλογή µε αντιπαράθεση (tournament selection) µε πληθυσµό 10) εκπαιδεύονται τα βάρη του (και όχι η τοπολογία τους που είναι προκαθορισµένη) έτσι ώστε να έχουµε µία καλή αρχικοποίηση για το επόµενο στάδιο το οποίο περιλαµβάνει τη χρήση και πάλι την BFGS παραλλαγής. Με το πέρας και αυτής της διαδικασίας η καλύτερη τοπολογία δικτύου διατηρείται µαζί µε τα νέα κατασκευασµένα χαρακτηριστικά από το προηγούµενο στάδιο. Πειραµατιστήκαµε µε 1,2 και 3 νέα χαρακτηριστικά και µε νευρωνικά δίκτυα µε µία έξοδο και 1 έως 10 νευρώνες στο κρυφό επίπεδο. Για την εκτίµηση της απόδοσης χρησιµοποιήσαµε και πάλι την µέθοδο αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 10 υποσύνολα (10 fold). ηλαδή χωρίσαµε τα 160 παραδείγµατα σε 10 µη επικαλυπτόµενα σύνολα το κάθε ένα από τα οποία περιελάµβανε 13 παραδείγµατα από τα υγιή και 3 από τα ύποπτα/παθολογικά παραδείγµατα. Κάθε φορά ένα από τα δέκα υποσύνολα χρησιµοποιούνταν µόνο για την εκτίµηση της απόδοσης της µεθόδου. Τα υπόλοιπα 9 σύνολα (107 παραδείγµατα από τα υγιή και 27 από την οµάδα µε τα ύποπτα/παθολογικά) χρησιµοποιούνταν για την εκπαίδευση. Πριν από τη διαδικασία της εκπαίδευσης τα παραδείγµατα από την παθολογική κατηγορία χρησιµοποιούνταν για τη δηµιουργία νέων συνθετικών παραδειγµάτων. Για να ελέγξουµε την απόδοση της µεθόδου, συγκρίναµε τα αποτελέσµατά της µε αυτά που προκύπτουν µε τη χρήση συµβατικών ταξινοµητών οι οποίοι τροφοδοτούνται µε διανύσµατα 159
Κεφάλαιο 6 ο χαρακτηριστικών τα οποία έχουν υποστεί µείωση της αρχικής τους διάστασης µε τη χρήση της ανάλυσης σε πρωταρχικές συνιστώσες. Τα αποτελέσµατα της µεθοδολογίας συνοψίζονται στον Πίνακα 6.11 ενώ στον Πίνακα 6.12 παρουσιάζονται τα καλύτερα αποτελέσµατα της µεθόδου µας και συγκρίνονται µε εκείνα που προκύπτουν µε τη χρήση συµβατικών ταξινοµητών [Georgoulas et al. 2006c]. Πίνακας 6.11. Αποτελέσµατα ταξινόµησης για 1,2,3 χαρακτηριστικά και 0,300, 400, 500 υπερδειγµατοληψία Αριθµός Συνολική Ακρίβεια (-) Ακρίβεια (+) g SMOTE κατασκευασµένων ακρίβεια (%) (%) (%) χαρακτηριστικών (%) 1 88.125 97.692 46.667 67.52 2 88.125 98.462 43.333 65.32 0 3 89.375 98.462 50 70.165 1 76.875 80 63.333 71.181 2 85 90 63.333 75.498 300 3 81.25 81.538 80 80.766 1 83.125 83.846 80 81.901 2 80 80.769 76.667 78.691 400 3 78.125 79.231 73.333 76.225 1 89.375 90 86.667 88.318 2 90 90 90 90 500 3 88.125 86.923 93.333 90.071 160
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Πίνακας 6.12. Σύγκριση καλύτερων αποτελεσµάτων knn(17 PC) ldc (9 PC) qdc (4 PC) GE+MLP Ακρίβεια 80.63 68.75 72.5 90 Ακρίβεια (-) 83.85 66.92 73.85 90 Ακρίβεια (+) 66.67 76.67 66.67 90 g (%) 74.76 71.63 70.16 90 PC: Principal Components (Πρωταρχικές συνιστώσες) Τα αποτελέσµατα αυτής της µεθόδου είναι πολύ ενθαρρυντικά και σε κάθε περίπτωση πολύ καλύτερα από τα αποτελέσµατα των συµβατικών ταξινοµητών. Αν και αυξήθηκε η ανισοκατανοµή των παραδειγµάτων στις δύο κατηγορίες η µέθοδος της κατασκευής νέων χαρακτηριστικών σε συνδυασµό µε τη µέθοδο δηµιουργίας συνθετικών χαρακτηριστικών φαίνεται ικανή να δώσει λύση στο δύσκολο και απαιτητικό πρόβλήµα του διαχωρισµού των εµβρύων µε βάση την ανάλυση του σήµατος της ΕΚΣ. 6.7 Συνδυασµός νευρωνικών δικτύων κυµατιδίου και της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίου σε ένα ολοκληρωµένο µοντέλο ταξινόµησης της ΕΚΣ Σε αυτή την ενότητα παρουσιάζονται τα αποτελέσµατα της εφαρµογής µιας νέας ολοκληρωµένης µεθοδολογίας επεξεργασίας και ταξινόµησης της ΕΚΣ. Πιο συγκεκριµένα η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων χρησιµοποιείται για τη εκπαίδευση ενός νευρωνικού δικτύου το οποίο αποτελείται από κόµβους κυµατιδίου στο επίπεδο εισόδου (Σχήµα 6.21). Η συγκεκριµένη µεθοδολογία, όπως και όλες οι προηγούµενες χρησιµοποιήθηκε για την ανάλυση σηµάτων ΕΚΣ και την ταξινόµηση τους ανάλογα µε την τιµή του ph. Το σύνολο των δειγµάτων το οποίο χρησιµοποιήθηκε ήταν το ίδιο µε αυτό το οποίο περιγράφεται στην ενότητα 6.4.1. H χρονική διάρκεια των τµηµάτων της ΕΚΣ που χρησιµοποιήθηκαν ήταν 5 λεπτά. Αυτά τα 5-λεπτα των τµηµάτων των σηµάτων της ΕΚΣ τροφοδοτούν το νευρωνικό δίκτυο κυµατιδίου το οποίο συγχρόνως πραγµατοποιεί την εξαγωγή των χαρακτηριστικών και την ταξινόµηση. Προσπαθώντας να διατηρήσουµε ένα όσο το δυνατόν πιο απλό νευρωνικό δίκτυο χωρίς όµως να υπεραπλουστεύουµε (Ocan s razor) [Haykin 1999] χρησιµοποιήσαµε ένα δίκτυο µε 3 κόµβους κυµατιδίου στο επίπεδο εισόδου, 2 σιγµοειδής νευρώνες στο κρυφό επίπεδο και 1 σιγµοειδή νευρώνα 161
Κεφάλαιο 6 ο στο επίπεδο εξόδου. Χρησιµοποιήσαµε δυαδικούς κόµβους κυµατιδίου, δηλαδή επιτρέπαµε µόνο προκαθορισµένες διακριτές τιµές τόσο για την παράµετρο µετατόπισης b k, όσο και για την παράµετρο αλλαγής κλίµακας a k (χρησιµοποιήσαµε δηλαδή την παρακάτω µορφή για τους κόµβους κυµατιδίου): m 1 t n2 ψmn, ψ ψ m m 2 2 m/2 m () t = = 2 ( 2 t n) (6.2) Οι παράµετροι n, m επιλέχθηκαν ως µέρος της διαδικασίας εκπαίδευσης µε τη χρήση της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων. Κάθε κόµβος κυµατιδίου παίρνει σαν είσοδο το σήµα της ΕΚΣ παράγει ένα συντελεστή κυµατιδίου ο οποίος περνάει µέσα από το υπόλοιπο τµήµα του δικτύου το οποίο στην ουσία είναι ένα perceptron µε σιγµοειδείς συναρτήσεις ενεργοποίησης. Σχήµα 6.21: Εκπαίδευση νευρωνικού δικτύου κυµατιδίου µε τη µέθοδο βελτιστοποίησης µε σµήνος σωµατιδίων (PSO). Για την εκτίµηση της απόδοσης χρησιµοποιήθηκε µέθοδος αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 4 υποσύνολα (4 fold). Επειδή η εκπαίδευση του νευρωνικού είναι µια στοχαστική διαδικασία, τις παραπάνω ενέργειες τις επαναλάβαµε 5 φορές και τελικά υπολογίσαµε την µέση ακρίβεια. 162
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Η ικανότητα της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων για την εύρεση του ελαχίστου µπορεί να οδηγήσει σε υπερεκπαίδευση στην περίπτωση των νευρωνικών δικτύων. εν πρέπει να ξεχνάµε ότι η µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων είναι πολύ ισχυρή στην εύρεση ελαχίστων/µεγίστων συναρτήσεων, αλλά η ελαχιστοποίηση κάποιου κριτηρίου λάθους δεν εγγυάται ότι το νευρωνικό δίκτυο θα γενικεύει το ίδιο καλά και στην περίπτωση δεδοµένων που δεν χρησιµοποιήθηκαν κατά την εκπαίδευση. Για αυτό το λόγο τροποποιήσαµε τη συνάρτηση crossentropy (ενότητα 5.5, εξίσωση 5.17) µε την προσθήκη ενός όρου φθίνοντος βάρους (weight decay penalty) [Bishop 1995], και συνεπώς η νέα συνάρτηση προς ελαχιστοποίησης δίνεται από την παρακάτω έκφραση: E = E+ λ w (6.2) r 2 i Τα καλύτερα αποτελέσµατα επιτεύχθηκαν µε τη χρήση Daubechies κυµατιδίων µε 4 µηδενικές ροπές. Τα αποτελέσµατα από τη χρήση του νευρωνικού δικτύου κυµατιδίου µε και χωρίς την προσθήκη του όρου φθίνοντος βάρους παρατίθονται στον Πίνακα 6.13. Πίνακας 6.13: Απόδοση ταξινόµησης του νευρωνικού δικτύου κυµατιδίου µε και χωρίς όρο φθίνοντος βάρους. Ακρίβεια (%) Ακρίβεια (-) (%) Ακρίβεια (+) (%) Χωρίς τον όρο φθίνοντος βάρους Με τον όρο φθίνοντος βάρους 58.50 60 57 77.50 84 71 Θα πρέπει να επισηµάνουµε ότι αν και η παραπάνω προσέγγιση χρησιµοποίησε ένα πολύ απλό νευρωνικό δίκτυο κυµατιδίου µε µόνο 3 κόµβους κυµατιδίου, που σηµαίνει ότι τελικά χρησιµοποιήθηκαν µόνο τρία χαρακτηριστικά αριθµός ο οποίος είναι ο µικρότερος από όλες τις προηγούµενες προσπάθειες µας. Παρόλο αυτά τα αποτελέσµατά είναι συγκρίσιµα µε αυτά τα οποία παρουσιάστηκαν στην ενότητα 6.4.1, όπου είχαµε χρησιµοποιήσει 6 χαρακτηριστικά βασισµένα σε µεµονωµένους συντελεστές, πράγµα που φανερώνει τη δυναµική της προτεινόµενης µεθόδου. Η εισαγωγή του όρου φθίνοντος βάρους στη συνάρτηση σφάλµατος βελτιώνει δραµατικά την ικανότητα γενίκευσης του νευρωνικού δικτύου κυµατιδίου και περισσότερη έµφαση πρέπει να δοθεί στην εύρεση της κατάλληλης τιµής της παραµέτρου κανονικοποίησης λ (regularization parameter). 163
Κεφάλαιο 6 ο 6.8 Επιλογή των παραµέτρων των µηχανών διανυσµάτων υποστήριξης µε τη χρήση της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων Σε αυτή την ενότητα παρουσιάζονται τα αποτελέσµατα της εφαρµογής µιας νέας ολοκληρωµένης µεθοδολογίας επεξεργασίας και ταξινόµησης της ΕΚΣ που βασίζεται στο συνδυασµό των µηχανών διανυσµάτων υποστήριξης και της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων. Σε όλες τις προηγούµενες ενότητες, όπου χρησιµοποιήθηκαν οι µηχανές διανυσµάτων υποστήριξης, για την επιλογή των παραµέτρων τους, πραγµατοποιήσαµε µία σχεδόν εξαντλητική αναζήτηση στο χώρο των παραµέτρων για την επιλογή των καταλληλότερων τιµών τους. Στη συγκεκριµένη προσέγγιση αυτή η αναζήτηση πραγµατοποιείται µε την χρήση της µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίου. Η συγκεκριµένη µεθοδολογία, όπως και όλες οι προηγούµενες χρησιµοποιήθηκε για την ανάλυση σηµάτων ΕΚΣ και την ταξινόµηση τους ανάλογα µε την τιµή του ph. Το σύνολο των δεδοµένων ήταν το ίδιο µε αυτό το οποίο περιγράφτηκε στην ενότητα 6.4.3. Πιο συγκεκριµένα κατά την εφαρµογή των µηχανών διανυσµάτων υποστήριξης υπάρχουν, ανάλογα µε την επιλογή του πυρήνα εσωτερικού γινοµένου, διάφορες παράµετροι οι οποίες πρέπει να καθοριστούν και οι οποίες µπορούν να επηρεάσουν δραµατικά την απόδοση της ταξινόµησης. Στην 1 2 περίπτωση που έχουµε πυρήνες ακτινικών συναρτήσεων βάσης ( K (, i) = exp 2 i 2σ xx x x ) µένει να καθοριστεί η τιµή τόσο της παραµέτρου σ των πυρήνων όσο και η παράµετρος C που καθορίζει εν γένει το πόσο «εύκαµπτη» θα είναι η διαχωριστική επιφάνεια. Για την περίπτωση πολυωνυµικών πυρήνων πέρα από την παράµετρο C µένει να καθοριστεί και ο βαθµός d του πολυωνύµου στην απλούστερη των περιπτώσεων ( K (, i) = ( i + 1) Τ πυρήνων δικτύων perceptron 2 επιπέδων ( K (, i) = tanh( β0 i β1) είναι 2 ( β0, β 1). d xx xx ) ενώ στην περίπτωση xx xx ) οι επιπλέον παράµετροι Στη συγκεκριµένη ερευνητική προσπάθεια περιοριστήκαµε µόνο σε πυρήνες ακτινικών συναρτήσεων βάσης και σε πολυωνυµικούς πυρήνες, έχοντας και στις δύο περιπτώσεις ένα δισδιάστατο διάνυσµα παραµέτρων ((C, σ) και (C, d) αντίστοιχα). Λόγω της ανισοκατανοµής των παραδειγµάτων µεταξύ των δύο κατηγοριών, πριν από την εφαρµογή του αλγορίθµου εκπαίδευσης χρησιµοποιήσαµε τη µέθοδο δηµιουργίας συνθετικών παραδειγµάτων µε υπερδειγµατο-ληψία της µειοψηφούσας κατηγορίας (Synthetic Minority Oversampling TΕchnique (SMOTE), ενότητα 4.6). Ο αριθµός των κοντινότερων γειτόνων τέθηκε ίσος µε 8 και κάθε φορά χρησιµοποιούσαµε 4 από αυτούς οδηγούµενοι σε υπερδειγµατοληψία της κατηγορίας µε τα παθολογικά δείγµατα, 400%. 164
Προτεινόµενες Μεθοδολογίες Πειραµατικά αποτελέσµατα Για την εκτίµηση της απόδοσης χρησιµοποιήσαµε και πάλι την µέθοδο αξιολόγησης αναδιπλούµενης διασταύρωσης µε διατήρηση των αρχικών αναλογιών µε 10 υποσύνολα (10 fold). Λόγω της στοχαστικής φύσης τόσο του αλγορίθµου δηµιουργίας συνθετικών παραδειγµάτων όσο και την µεθόδου βελτιστοποίησης µε σµήνος σωµατιδίων, την πιο πάνω διαδικασία την επαναλάβαµε 5 φορές και τα αποτελέσµατα συνοψίζονται στον Πίνακα 6.14 (Georgoulas et al. 2006d). Πίνακας 6.14. Συγκεντρωτικά αποτελέσµατα Πυρήνας Ακρίβεια (%) Ακρίβεια (-) (%) Ακρίβεια (+) (%) RBF 86.87 87.38 85.33 Πολυώνυµικός 88.82 89.54 86.67 Τα αποτελέσµατα είναι πολύ ενθαρρυντικά µε την περίπτωση των πολυωνυµικών πυρήνων να αποδίδουν ελαφρώς καλύτερα. Επιπλέον τα αποτελέσµατα είναι ισορροπηµένα αν και χρησιµοποιήσαµε κοινή τιµή για την παράµετρο C και για τις δύο κατηγορίες. Στην παρούσα περίοδο βρισκόµαστε σε διερεύνηση της χρήσης διαφορετικών τιµών της παραµέτρου C για τις δύο κατηγορίες, αυξάνοντας κατά µία διάσταση τον χώρο των παραµέτρων. 6.9 Σύνοψη Σε αυτό το κεφάλαιο της διδακτορικής διατριβής παρουσιάστηκαν όλα τα πειραµατικά αποτελέσµατα από την εφαρµογή όλων των θεωρητικών µοντέλων και «εργαλείων» που παρουσιάστηκαν και αναλύθηκαν στα δύο προηγούµενα κεφάλαια. Για να έχουµε µία πιο συστηµατική προσέγγιση του θέµατος το κεφάλαιο χωρίστηκε αρχικά µε βάση τις µεθόδους που χρησιµοποιήθηκαν για την εξαγωγή των χαρακτηριστικών που στη συνέχεια τροφοδοτούσαν κάποιον από τους ταξινοµητές που περιγράφονται στο κεφάλαιο 5. Έτσι αρχικά παρουσιάστηκαν τα αποτελέσµατα από την εφαρµογή της µεθόδου ανάλυσης σε ανεξάρτητες συνιστώσες που και χρονικά προηγήθηκαν των άλλων προσεγγίσεων. Στη συνέχεια δόθηκαν µε λεπτοµέρεια τα αποτελέσµατα της ταξινόµησης µε βάση τα «συµβατικά» χαρακτηριστικά. Στη συνέχεια παρουσιάσθηκαν τα αποτελέσµατα της χρήσης του διακριτού µετασχηµατισµού κυµατιδίου για την εξαγωγή χαρακτηριστικών. Η χρήση των συντελεστών κυµατιδίου για ταξινόµηση έδωσαν καλύτερα αποτελέσµατα συγκρινόµενα µε αυτά των «συµβατικών» χαρακτηριστικών σε µειωµένο όµως χρονικό παράθυρο. Οι επόµενες ενότητες παράγραφοι παρουσιάζουν τρεις νέες µεθοδολογίες. Οι δύο πρώτες αντιµετωπίζουν µε ενιαίο τρόπο την εξαγωγή χαρακτηριστικών και την εκπαίδευση του ταξινοµητή και η τρίτη προτείνει µία διαφορετική προσέγγιση στην επιλογή των παραµέτρων για τις µηχανές 165
Κεφάλαιο 6 ο διανυσµάτων υποστήριξης. Και οι τρεις αυτές προσεγγίσεις χρονικά είναι µεταγενέστερες των προσπαθειών που παρουσιάσθηκαν στην αρχή του κεφαλαίου και οι οποίες βρίσκονται ακόµα στο στάδιο της ανάπτυξης και διερεύνησης. Η πρώτη χρησιµοποιεί µία µέθοδο η οποία βασίζεται σε ένα κλάδο της υπολογιστικής νοηµοσύνης για τη δηµιουργία-κατασκευή χαρακτηριστικών από προϋπάρχοντα και η οποία έχει δώσει τα καλύτερα αποτελέσµατα µέχρι τώρα συγκρινόµενη µε τις άλλες µεθόδους. Η δεύτερη συνδυάζει σε ένα υβριδικό µοντέλο τα νευρωνικά δίκτυα µε τα κυµατίδια για τη δηµιουργία «νευρωνικών δικτύων κυµατιδίου» και χρησιµοποιεί τη µέθοδο βελτιστοποίησης µε σµήνος σωµατιδίων για την εκπαίδευσή τους, η οποία έχει δώσει πολύ καλά αποτελέσµατα. Η τρίτη τέλος χρησιµοποιεί τη µέθοδο βελτιστοποίησης µε σµήνος σωµατιδίων για την επιλογή των παραµέτρων των µηχανών διανυσµάτων υποστήριξης µε επίσης πολύ ενθαρρυντικά αποτελέσµατα.. 166
Συµπεράσµατα Κεφάλαιο 7 ο Συµπεράσµατα 7.1 Εισαγωγή Η ερµηνεία του σήµατος της ΕΚΣ είναι σηµαντική καθώς αποτελεί µία από τις λιγοστές διαθέσιµες µετρήσεις-ενδείξεις για την εκτίµηση της οξυγόνωσης του εµβρύου κατά τη διάρκεια του τοκετού. Η εκτεταµένη χρήση της παρακολούθησης της ΕΚΣ κατά τη διάρκεια του τοκετού, από την εισαγωγή της καρδιοτοκογραφίας από τη δεκαετία του 60 µέχρι σήµερα, έκανε φανερό ότι η συγκεκριµένη µέθοδος παρουσιάζει µεν σχεδόν τέλεια διαγνωστική ικανότητα όσον αφορά τον χαρακτηρισµό εµβρύων που δεν έχουν υποστεί υποξία, αλλά πολύ µικρή ικανότητα σωστής πρόβλεψης για τον εντοπισµό εµβρύων µε υποξία. Στα πλαίσια της συγκεκριµένης διδακτορικής διατριβής επικεντρωθήκαµε στην έρευνα µεθοδολογιών για την επίτευξη µίας όσο το δυνατόν πιο ισορροπηµένης απόδοσης στην ταξινόµηση ανάµεσα στις δύο προαναφερθέντες κατηγορίες και σε µεγάλο βαθµό το επιτύχαµε. Επίσης προσπαθήσαµε να αντιµετωπίσουµε το όλο πρόβληµα αλγοριθµικά έτσι ώστε να εξαλείψουµε το γνωστό πρόβληµα της (µερικής) αδυναµίας για αναπαραγωγή της διάγνωσης του µαιευτήρα όταν το ίδιο σήµα ΕΚΣ αξιολογείται ακόµα και από τον ίδιο µαιευτήρα µετά τη µεσολάβηση κάποιου χρονικού διαστήµατος. Προς αυτή την κατεύθυνση προτείναµε και υλοποιήσαµε ολοκληρωµένες µεθοδολογίες συνδυάζοντας και προτείνοντας διάφορες µεθόδους από τα πεδία της ανάλυσης σήµατος και της αναγνώρισης προτύπων επιτυγχάνοντας την πλήρη εξάλειψη υποκειµενικών παραγόντων. Συνοψίζοντας: Α) Προτείναµε, χρησιµοποιήσαµε και αξιολογήσαµε την εξαγωγή νέων χαρακτηριστικών /παραµέτρων βασιζόµενοι στην ανάλυση της ΕΚΣ σε ανεξάρτητες συνιστώσες. Β) Χρησιµοποιήσαµε συµβατικά εξαγόµενα χαρακτηριστικά, και µέσα από µια λεπτοµερή αναζήτηση καθορίσαµε εκείνα που περιέχουν το µεγαλύτερο ποσό πληροφορίας και βελτιστοποιούν την απόδοση κάθε ταξινοµητή. Γ) Χρησιµοποιήσαµε εκτενώς την επεξεργασία των συντελεστών που προέρχονται από την εφαρµογή του µετασχηµατισµού κυµατιδίου στο σήµα της ΕΚΣ. Ιδιαίτερα τα αποτελέσµατα από τη χρήση του µετασχηµατισµού κυµατιδίου είναι πολύ υποσχόµενα και µένει να βρεθεί τρόπος να 167
Κεφάλαιο 7 ο επεκταθεί το χρονικό παράθυρο για το οποίο επιτυγχάνουµε τόσο υψηλές αποδόσεις στα µέχρι τώρα πειράµατά µας. ) Εισαγάγαµε για πρώτη φορά στο πεδίο της ανάλυσης της ΕΚΣ µια µέθοδο «κατασκευής» τεχνητών χαρακτηριστικών από συµβατικά εξαγόµενα χαρακτηριστικά. Η συγκεκριµένη µεθοδολογία βασίζεται σε εξελικτικούς αλγορίθµους και αποτελεί ταυτόχρονα και µία νέα πρόταση για το πρόβληµα της µείωσης της διάστασης του διανύσµατος χαρακτηριστικών/παραµέτρων. Ε) Εισαγάγαµε και χρησιµοποιήσαµε για πρώτη φορά µηχανές διανυσµάτων υποστήριξης οι οποίες τα τελευταία χρόνια έχουν βρει ευρεία εφαρµογή σε πολλά προβλήµατα ταξινόµησης µε καλύτερα συνήθως αποτελέσµατα σε σχέση µε άλλους ταξινοµητές όπως τα νευρωνικά δίκτυα. Η υπεροχή τους έναντι συµβατικών ταξινοµητών αποδείχθηκε και στα πλαίσια αυτής της διδακτορικής διατριβής. ΣΤ) Χρησιµοποιήσαµε για πρώτη φορά την τεχνική την βελτιστοποίησης µε σµήνος σωµατιδίων για την επιλογή των παραµέτρων των µηχανών διανυσµάτων υποστήριξης, βελτιώνοντας σηµαντικά την απόδοσή τους. Ζ) Χρησιµοποιήσαµε έναν νέο τύπο Νευρωνικών ικτύων, τα Νευρωνικά ίκτυα Κυµατιδίου, τα οποία αποτελούν µια σύνθετη µέθοδο για την ενιαία αντιµετώπιση της εξαγωγής χαρακτηριστικών και ταξινόµησης σηµάτων ΕΚΣ µε πολύ καλά αποτελέσµατα. Η µέθοδος αυτή είναι γενικού σκοπού και µπορεί να χρησιµοποιηθεί για οποιαδήποτε χρονοσειρά. Η) Ασχοληθήκαµε µε το πρόβληµα το οποίο είναι παρόν σε όλα σχεδόν τα ιατρικά προβλήµατα, της αντιµετώπισης της ανισοκατανοµής των δειγµάτων ανάµεσα στις δύο κατηγορίες µε ενθαρρυντικά αποτελέσµατα. Καταλήγοντας αποδείχθηκε ότι ο συνδυασµός της παρακολούθησης της ΕΚΣ του εµβρύου λαµβάνοντας υπ όψιν και άλλες σχετικές µετρήσεις, εάν υλοποιηθεί µε τη χρήση ενός ευφυούς υπολογιστικού συστήµατος µπορεί να βοηθήσει στην εγκυρότερη εκτίµηση της υγείας του εµβρύου. Παρόλα αυτά δεν πρέπει να ξεχνάµε ότι οι ιατρικές αποφάσεις δεν πρέπει να βασίζονται αποκλειστικά στην πληροφορία η οποία προέρχεται από µία και µόνο εξέταση γιατί πάντα υπάρχει η περίπτωση για εµφάνιση λανθασµένων ενδείξεων που οφείλονται είτε στον εξοπλισµό, είτε στο λογισµικό που χρησιµοποιείται, είτε εν τέλει στην εγγενή ιδιοµορφία της κάθε κύησης. 168
Συµπεράσµατα 7.2 Κατευθύνσεις για µελλοντική έρευνα Όσον αφορά µελλοντικές κατευθύνσεις της ερευνητικής προσπάθειας για την ανάλυση των σηµάτων της ΕΚΣ και όχι µόνο έχουµε να προτείνουµε τα παρακάτω: Ανάλυση σε ανεξάρτητες συνιστώσες Ο βαθµός της βλαβης που µπορεί να προκληθεί στο έµβρυο µετά από ένα σοβαρό επεισόδιο ασφυξίας µπορεί να διαφέρει αρκετά από έµβρυο σε έµβρυο. Επιπλέον, η χρήση της ανάπτυξης σε ανεξάρτητες συνιστώσες είναι ένα πολύ ισχυρό εργαλείο το οποίο όµως δεν έτυχε πλήρους εκµετάλλευσης λόγω της δυσκολίας ευθυγράµµισης στο χρόνο των σηµάτων της ΕΚΣ. Συνεπώς µία πιο κατάλληλη προσέγγιση ίσως θα ήταν η θεώρηση του κάθε εµβρύου ως µία αυτόνοµη µονάδα και η εφαρµογή της ανάλυσης σε ανεξάρτητες συνιστώσες µεµονωµένα σε κάθε ένα σήµα, χρησιµοποιώντας την έννοια της δυναµικής ενσωµάτωσης (Dynamical Embedding) [Kantz and Schreiber 2003]. Κάτι τέτοιο θα µπορούσε να αποτελέσει ένα πεδίο µελλοντικής έρευνας. Βελτιστοποίηση µε σµήνος σωµατιδίων και νευρωνικά δίκτυα κυµατιδίου Ένα πολύ ενδιαφέρον πεδίο µελλοντικής έρευνας είναι η χρησιµοποίηση νευρωνικών δικτύων κυµατιδίου µε κόµβους κυµατιδίου µε µεγαλύτερη ανάλυση όσον αφορά τις παραµέτρους b k, a k. Προτείνεται να εξετασθούν νέες διαφορετικές τοπολογίες νευρωνικών βασιζόµενα σε δίκτυα ακτινικών συναρτήσεων βάσης, καθώς και δίκτυα µε συνδυασµό από συναρτήσεις ενεργοποίησης, καθώς και διαφορετικές συναρτήσεις λάθους έτσι ώστε να διερευνηθούν πλήρως οι δυνατότητες που παρέχει αυτή η υβριδική και ολοκληρωµένη προσέγγιση για εξαγωγή χαρακτηριστικών και ταξινόµηση. Αυτή αποτελεί µία από τις κατευθύνσεις που διερευνούµε, όπως και την εφαρµογή της σε άλλα πεδία Βελτιστοποίηση µε σµήνος σωµατιδίων και επιλογή παραµέτρων για µηχανές διανυσµάτων υποστήριξης Επίσης η πολλά υποσχόµενη µέθοδος βελτιστοποίησης µε σµήνος σωµατιδίων µπορεί να χρησιµοποιηθεί για τον καθορισµό των παραµέτρων των µηχανών διανυσµάτων υποστήριξης. Σε όλα τα πειράµατα για την εύρεση των καταλληλότερων παραµέτρων χρησιµοποιήσαµε την προσέγγιση της σχεδόν εξονυχιστικής αναζήτησης εντός προκαθορισµένων ορίων. Με τη χρήση της µεθόδου 169
Κεφάλαιο 7 ο βελτιστοποίησης µε σµήνος σωµατιδίων παρέχεται η δυνατότητα διερεύνησης και άλλων πιθανών λύσεων πέρα από αυτές που ορίζονται πάνω στο «δικτύωµα» που πραγµατοποιείται η έρευνα. Μία πρώτη προσέγγιση έχει ήδη γίνει [Georgoulas et al. 2006d] µε υποσχόµενα αποτελέσµατα και µια πιο συστηµατική διερεύνηση πραγµατοποιείται αυτή την περίοδο. Εξελεγκτική γραµµατική και µηχανές διανυσµάτων υποστήριξης Η µέθοδος για την κατασκευή τεχνητών χαρακτηριστικών θα µπορούσε να χρησιµοποιηθεί σε συνδυασµό µε µηχανές διανυσµάτων υποστήριξης σε µια προσπάθεια για περαιτέρω αύξηση της απόδοσης ταξινόµησης. Ανισοκατανοµή Χρήζει περαιτέρω µελέτης το πρόβληµα της αντιµετώπισης της ανισοκατανοµής των δειγµάτων εκπαίδευσης καθώς συναντάται σχεδόν σε όλες τις ιατρικές εφαρµογές. Σε αυτά τα πλαίσια θα µπορούσαµε να εξετάσουµε πιο συστηµατικά το εµβαδό κάτω από την (ROC) καµπύλη (AUC) το οποίο, όπως αναφέρθηκε στο κεφάλαιο 6, αποτελεί ένα γενικό µέσο µέτρησης της απόδοσης ταξινοµητών ειδικά στην περίπτωση που το κόστος για λανθασµένη ταξινόµηση είναι άγνωστο. Μορφολογική ανάλυση -Επιβραδύνσεις Οι επιβραδύνσεις θεωρούνται πολύ σηµαντικές για την αξιολόγηση της κατάστασης του εµβρύου. Στη διάρκεια των ερευνών δεν καταλήξαµε σε αυτό το συµπέρασµα παρά µόνο στην περίπτωση της χρήσης της εξελικτικής γραµµατικής. Πιθανόν αυτό να σηµαίνει ότι ο αλγόριθµος που χρησιµοποιούµε για να υπολογίζει/αναγνωρίζει επιβραδύνσεις σε σήµατα ΕΚΣ να χρειάζεται να «αναθεωρηθεί». Προς αυτή την κατεύθυνση, σε µελλοντική ερευνά µας, το κοµµάτι που υπολογίζει τα µορφολογικά χαρακτηριστικά πρόκειται να ξανασχεδιαστεί µε βάση τις οδηγίες που έχουν εκδοθεί κατά καιρούς [Rooth et al. 1987; National Institute of Child Health and Human Development Research Planning Workshop 1997], όπως έγινε στις εργασίες [Ayres-de-Campos et al. 2000; Bernardes et al. 1998], λαµβάνοντας υπόψη και το σήµα των συσπάσεων της µήτρας ή εξετάζοντας µια προσέγγιση µε τη χρήση νευρωνικών δικτύων [Ulbricht et al. 1998, Fontenla-Romero et al. 2001], και θα ελεγχθεί περαιτέρω µε τη βοήθεια των γυναικολόγων/µαιευτήρων. 170
171
Κεφάλαιο 7 ο 172
ΠΑΡΑΡΤΗΜΑ ΠΑΡΑΡΤΗΜΑ Π.1 Εισαγωγή Σύστηµα για την λήψη και αποθήκευση καρδιοτοκογραφηµάτων. Το πρώτο βήµα για την ανάπτυξη ενός συστήµατος λήψης αποφάσεων κατά τον τοκετό αλλά και κατά την περίοδο πριν από τον τοκετό προϋποθέτει τη δυνατότητα λήψης και αποθήκευσης του καρδιοτοκογραφήµατος σε ηλεκτρονική µορφή. Απαιτείται δηλαδή η δηµιουργία µία εφαρµογής η οποία θα επιτρέπει τη σύνδεση του καρδιοτοκογράφου µε έναν προσωπικό υπολογιστή. Αυτό το σύστηµα θα αποτελέσει τον πυρήνα πάνω στον οποίο θα αναπτυχθεί ένα εξελιγµένο σύστηµα το οποίο θα πραγµατοποιεί και περαιτέρω ανάλυση του καρδιοτοκογραφήµατος µε βάση όποια από τις προτεινόµενες µεθόδους αποδειχθεί σε βάθος χρόνου ότι αποτελεί την πιο αξιόπιστη λύση στην ανάλυση του καρδιοτοκογραφήµατος. Αυτό το κοµµάτι µε τη σειρά του θα αποτελέσει ένα τµήµα ενός ολοκληρωµένου συστήµατος λήψης απόφασης, χρησιµοποιώντας και επιπλέον κλινική πληροφορία που θα παρέχεται από άλλες εξετάσεις και µετρήσεις ή απευθείας από το γυναικολόγο µαιευτήρα. Π.2 Λήψη δεδοµένων Οι σηµερινοί καρδιοτοκογράφοι είναι σχεδόν όλοι εφοδιασµένοι µε µια σειριακή θύρα RS232 η οποία µπορεί να χρησιµοποιηθεί για τη λήψη του καρδιοτοκογραφήµατος µέσω ενός υπολογιστή (και όχι µόνο) παρέχοντας και τη δυνατότητα για αποµακρυσµένη πρόσβαση µέσω δικτύου. Μέσω αυτή της θύρας τόσο η ΕΚΣ όσο και η συσπάσεις της µήτρας µπορούν να καταγραφούν, να απεικονισθούν και να επεξεργαστούν. Για το λόγο αυτό αναπτύχθηκε ένα εργαλείο, σε συνεργασία µε τον κ. Νικόλαο Νικηταρή µεταπτυχιακό φοιτητή του τµήµατος φυσικής εκείνη την περίοδο, βασισµένο στο λειτουργικό σύστηµα Microsoft Windows, µια και το συγκεκριµένο λειτουργικό σύστηµα αποτελεί ένα δηµοφιλές και φιλικό προς το χρήστη περιβάλλον. Το συγκεκριµένο εργαλείο αναπτύχθηκε χρησιµοποιώντας τη Microsoft Visual C++ έκδοση 6. Η ανάπτυξη του συστήµατος έγινε για τον καρδιοτοκογράφο Huntleigh's BD4000. Το πρωτόκολλο επικοινωνίας ανάµεσα στο PC και τον καρδιοτοκογράφο βασίζεται σε µία διαδικασία αποστολής και 173
ΠΑΡΑΡΤΗΜΑ λήψης µηνυµάτων χρησιµοποιώντας της προδιαγραφές που περιγράφονται στο εγχειρίδιο της Huntleigh [BD4000 1999]. Κατά τη διαδικασία της επικοινωνίας το αναπτυχθέν εργαλείο ενεργεί ως «master» και ο καρδιοτοκογράφος ως «slave». Όταν αρχίζει η διαδικασία λήψης, το εργαλείο αποστέλλει µία «λέξη» στη συσκευή µέσω της σειριακή θύρας (COM1 ή COM2). Η συσκευή απαντάει µε ένα αλφαριθµητικό, το οποίο περιέχει την πληροφορία που της ζητήθηκε καθώς και µια CRC (Cyclic Redundancy Check) λέξη για έλεγχο της ορθότητας της αποσταλµένης πληροφορίας. Χρησιµοποιώντας λοιπόν ένα απλό πρωτόκολλο, το εργαλείο λαµβάνει τα δεδοµένα της ΕΚΣ, τα δεδοµένα των συσπάσεων της µήτρας και άλλες σηµαντικές πληροφορίες και τα αποθηκεύει στη µνήµη του υπολογιστή και σε ένα προσωρινό αρχείο για τυχόν περαιτέρω ανάλυση. Το εργαλείο χρησιµοποιεί κανονική/σταθερή δειγµατοληψία για τη λήψη της ΕΚΣ. Υπάρχει η δυνατότητα για επιλογή δειγµατοληψίας στα 4 Hz (προεπιλεγµένη) και στα 10 Hz για πειραµατικούς σκοπούς. Η συχνότητα των 4 Hz αποτελεί µια λογική τιµή για τη συγκεκριµένη εφαρµογή και µάλιστα είναι µεγαλύτερη από τις αντίστοιχες συχνότητες που συναντώνται στη βιβλιογραφία [Signorini et al. 2003; Dawes et al. 1995]. Για τη λήψη του σήµατος των συσπάσεων της µήτρας χρησιµοποιείται µικρότερη (αλλά και πάλι σταθερή) δειγµατοληψία 1 Hz η οποία είναι κάτι παραπάνω από αρκετή για το αργά µεταβαλλόµενο αυτό σήµα. Από τεχνικής απόψεως η µέθοδος δειγµατοληψίας χρησιµοποιεί έναν µηχανισµό µέτρησης του χρόνου που παρέχεται από το λειτουργικό σύστηµα των Windows. Ρυθµίζοντας κατάλληλα τον χρονιστή ώστε να έχουµε την απαιτούµενη συχνότητα δειγµατοληψίας, το εργαλείο στέλνει περιοδικά «µηνύµατα» στον καρδιοτοκογράφο µέσω της σειριακής θύρας (COM1/2). Όταν ληφθεί η απάντηση από τη συσκευή µε τη µορφή ενός αλφαριθµητικού αυτή αναλύεται ώστε να αποµονωθεί η πληροφορία και να ελεγχθεί για τυχόν λάθη µε βάση τον κώδικα κυκλικής διόρθωσης λαθών (εφόσον έχουµε ενεργοποιήσει αυτή την επιλογή). Εάν ανιχνευθεί σφάλµα τότε η διαδικασία λήψης διακόπτεται και εµφανίζεται ένα µήνυµα λάθους. Το δοµικό διάγραµµα της εφαρµογής απεικονίζεται στο Σχήµα Π.1. Η διαδικασία που µόλις περιγράφηκε αποτελεί (για την ώρα) την On-line λειτουργία του εργαλείου η οποία πραγµατοποιείται προφανώς κατά τη διάρκεια της λήψης των δεδοµένων από την εγκυµονούσα. Μελλοντικά θα υπάρξει και η δυνατότητα για Off-line λειτουργία για το άνοιγµα ήδη αποθηκευµένων καταγραφών και περαιτέρω ανάλυση. 174
ΠΑΡΑΡΤΗΜΑ Start application IDLE Mode: Waiting user to choose between: Online processing (getting data form COM) or Offline (getting data from file) Offline mode Open FileDialog for user to choose the data file initialize graphic displays all available data Online mode Send commands to COM every T (100 or 250) milliseconds Start processing? IDLE mode: waiting for aswer word from COM thread No Process/filtering data Yes Aswer word receiver: Command Parser Display processing result and update graphics No Check if checksum error exists No Has user stoped processing? Yes Terminate procedure. Display error message. IDLE mode: Waiting for user action. Σχήµα Π.1: ιάγραµµα ροής της εφαρµογής. Π.3 Η διεπαφή εργαλείου χρήστη Η όλη εφαρµογή είναι «φιλική» για το χρήστη και αρκετά εύχρηστη. εν απαιτεί οποιεσδήποτε γνώσεις προγραµµατισµού αλλά προϋποθέτει µια µικρή εξοικείωση µε παραθυρικό περιβάλλον. Όταν εκτελείται, ένα κύριο παράθυρο εµφανίζεται το οποίο υποδιαιρείται σε 3 µέρη. Το τµήµα στο οποίο απεικονίζονται τα γραφήµατα της ΕΚΣ και των συσπάσεων της µήτρας, το παράθυρο στο οποίο εµφανίζονται τα αποτελέσµατα της on-line ανάλυσης και το τµήµα στο οποίο ο χρήστης µπορεί να αλλάξει παραµέτρους που σχετίζονται τόσο µε τη λήψη όσο και µε την απεικόνιση (Σχήµα Π.2). 175
ΠΑΡΑΡΤΗΜΑ Σχήµα Π.2: Κύριο παράθυρο της εφαρµογής Μετά την εγκατάσταση του προγράµµατος και την εκτέλεση του απαιτούνται να γίνουν ορισµένες ρυθµίσεις. Το πρώτο πράγµα το οποίο θα πρέπει να καθοριστεί είναι σε ποια θύρα είναι συνδεδεµένος ο καρδιοτοκογράφος (Σχήµα Π.3). Σχήµα Π.3: Το παράθυρο επιλογής της θύρας επικοινωνίας Επίσης από ένα υποµενού µπορεί ο χρήστης να καθορίσει ορισµένες επιπλέον λειτουργίες (Σχήµα Π.4): Ποια καρδιοτοκογραφική συσκευή είναι συνδεδεµένη στον υπολογιστή (για την ώρα µόνο ο καρδιοτοκογράφος Huntleigh's BD4000 υποστηρίζεται). 176
ΠΑΡΑΡΤΗΜΑ Ποια δεδοµένα θα ληφθούν και θα αποθηκευθούν. Εάν θα εµφανιστεί το παράθυρο για την εισαγωγή σχολίων από τον επιβλέποντα γιατρό µε το πέρας της καταγραφής (Doctor s Comments at the end). Εάν θα πραγµατοποιείται έλεγχος λαθών κατά τη διάρκεια της λήψης των δεδοµένων (Calculate Checksum). Σχήµα Π.4: Παράθυρο επιπλέον ρυθµίσεων. Πριν από την καταγραφή των καρδιοτοκογραφικών δεδοµένων ο χρήστης, συνήθως γιατρός ή νοσοκόµα, πρέπει να καταγράψει τα προσωπικά δεδοµένα της εγκύου. Η συγκεκριµένη φόρµα περιλαµβάνει την ηλικία της, την εβδοµάδα της κύησης, τον αριθµών των τοκετών της. Η συγκεκριµένη φόρµα είναι ακόµα υπό συζήτηση και δεν έχει την τελική της µορφή (Σχήµα Π.5). Σχήµα Π.5: «Καρτέλα» ασθενή. Επίσης δίνεται η δυνατότητα να καταγραφούν και σχόλια από τον επιβλέποντα την κύηση. Με αυτό τον τρόπο απλοποιείται η εργασία της αρχειοθέτησης και µελλοντικά θα µπορούσε να 177
ΠΑΡΑΡΤΗΜΑ αντικαταστήσει όλα τα αρχεία τα οποία φυλάσσονται σε µορφή τυπωµένων καρδιοτοκογραφηµάτων. Το σύστηµα αποθηκεύει τα προσωπικά δεδοµένα και το δεδοµένα του καρδιοτοκογραφήµατος, περιλαµβάνοντας το χρόνο έναρξης και λήξης της καταγραφής, σε ένα αρχείο ASCII, το οποίο παίρνει το όνοµα του µε βάση το όνοµα της ασθενούς και την ώρα της λήψης του καρδιοτοκογραφήµατος. Πέρα από το παράθυρο που περιέχει τις πληροφορίες της εγκύου ο γιατρός µπορεί να προσθέσει επιπλέον πληροφορία µετά την καταγραφή του καρδιοτοκογραφήµατος χρησιµοποιώντας το παρακάτω παράθυρο για την περίπτωση του τοκετού (Σχήµα Π.6). Σχήµα Π.6: Παράθυρο εισαγωγής σχολίων του επιβλέποντα ιατρού. Π.4 Μελλοντική προοπτική Αυτή την περίοδο βρισκόµαστε στο στάδιο της µετατροπής του συστήµατος από Visual C++ σε LabVIEW το οποίο είναι πιο εύχρηστο από την πλευρά του τεχνικού και παρέχει πολλές περισσότερες δυνατότητες όσον αφορά την υλοποίηση συστηµάτων λήψης και επεξεργασίας σηµάτων. Όλοι οι αλγόριθµοι θα σχεδιαστούν ξανά από την αρχή σε στενή συνεργασία µε το νέο προσωπικό της µαιευτικής και γυναικολογικής κλινικής του πανεπιστηµιακού νοσοκοµείου του Ρίου. 178