ιπλωµατική Εργασία του ϕοιτητή του Τµήµατος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστηµίου Πατρών

Σχετικά έγγραφα
Κεφάλαιο 1 ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΝΕΥΡΟΦΥΣΙΟΛΟΓΙΑΣ

Καινοτόµο σύστηµα αξιοποίησης φυσικού φωτισµού µε αισθητήρες στο επίπεδο εργασίας

14-Σεπτ-2009 ΗΛΕΚΤΡΟΕΓΚΕΦΑΛΟΓΡΆ ΦΗΜΑ. Χαρακτηριστικά, εντολές εισόδου

Στόχος της ψυχολογικής έρευνας:

ΠΑΡΑΓΩΓΗ ΜΙΚΡΟΚΥΜAΤΩΝ ΜΕ ΔΙΟΔΟ GUNN

Λειτουργία και Απόδοση του Πρότυπου Ανιχνευτή ΝΕΣΤΩΡ

Συνιστώνται για... Οι δονήσεις είναι αποτελεσματικές...

Οπτική αντίληψη. Μετά?..

Η συμβολή των απεικονιστικών μεθόδων στη διάγνωση μαθησιακών και αναπτυξιακών διαταραχών. Φοιτήτρια: Νούσια Αναστασία

ΔΑΜΔΑΣ ΙΩΑΝΝΗΣ. Βιολογία A λυκείου. Υπεύθυνη καθηγήτρια: Μαριλένα Ζαρφτζιάν Σχολικό έτος:

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΨΥΧΟΛΟΓΙΑ με έμφαση στις γνωστικές λειτουργίες. Θεματική Ενότητα 10: Μελέτη του Εγκεφάλου

«Επικοινωνίες δεδομένων»

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΨΥΧΟΛΟΓΙΑ (ΨΧ 00)

ΟΠΤΙΚΟΚΙΝΗΤΙΚO ΣYΣΤΗΜΑ. Αθανασιάδης Στάθης φυσικοθεραπευτής NDT

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΒΙΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΦΥΣΙΟΛΟΓΙΑΣ ΖΩΩΝ ΚΑΙ ΑΝΘΡΩΠΟΥ ΟΡΓΑΝΟΛΟΓΙΑ ΑΘΗΝΑ 2010

Συλλογή μεταφορά και έλεγχος Δεδομένων ΘΟΡΥΒΟΣ - ΓΕΙΩΣΕΙΣ

«Επικοινωνίες δεδομένων»

14. ΔΕΥ: Υπάρχων συστήματα

ΔΥΝΑΜΙΚΗ & ΕΛΕΓΧΟΣ - ΕΡΓΑΣΤΗΡΙΟ

20-Ιαν-2009 ΗΜΥ Εισαγωγή στην Ψηφιακή Επεξεργασία Σημάτων

Μάθηση Απόδοση. Διαφοροποιήσεις στην Κινητική Συμπεριφορά. Μάθημα 710 Μάθηση - Απόδοση Διάλεξη 3η

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

Σύναψη µεταξύ της απόληξης του νευράξονα ενός νευρώνα και του δενδρίτη ενός άλλου νευρώνα.

ΥΠΟΔΟΧΕΙΣ ΣΩΜΑΤΙΚΕΣ ΑΙΣΘΗΣΕΙΣ

Kalman Filter Γιατί ο όρος φίλτρο;

Εισαγωγή στα ψηφιακά Συστήµατα Μετρήσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Τεχνητά Νευρωνικά Δίκτυα. Τσιριγώτης Γεώργιος Τμήμα Μηχανικών Πληροφορικής ΤΕΙ Ανατολικής Μακεδονίας & Θράκης

Κωδικοποίηση βίντεο (MPEG)

ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ

Keywords λέξεις κλειδιά:

Πώς μελετάμε τις νοητικές λειτουργίες;

Τεχνολογία επεµβατικής Ακτινολογίας στην Καρδιολογία

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΤΕΧΝΟΛΟΓΙΑ ΜΗ ΚΑΤΑΣΤΡΟΦΙΚΟΥ ΕΛΕΓΧΟΥ 4 ο ΜΑΘΗΜΑ ΘΕΩΡΙΑ 2017

Σχεδιασµός Οικολογικού ιαµεσολαβητή για την εποπτεία και διαχείριση δικτύου διανοµής ηλεκτρικής ενέργειας

Αναγνώριση Προτύπων Ι

Ασκήσεις στα Συστήµατα Ηλεκτρονικών Επικοινωνιών Κεφάλαιο 3 ο : ΕΙΣΑΓΩΓΗ στις ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ ΗΛΕΚΤΡΟΜΑΓΝΗΤΙΚΟ ΚΥΜΑ και ΤΕΧΝΙΚΕΣ ΙΑΜΟΡΦΩΣΗΣ

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

ΦΥΣΙΟΛΟΓΙΑ ΖΩΩΝ ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ

710 -Μάθηση - Απόδοση. Κινητικής Συμπεριφοράς: Προετοιμασία

Κεφάλαιο 3 ο : ΕΙΣΑΓΩΓΗ στις ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ. ΗΛΕΚΤΡΟΜΑΓΝΗΤΙΚΟ ΚΥΜΑ και ΤΕΧΝΙΚΕΣ ΙΑΜΟΡΦΩΣΗΣ

«Η ομορφιά εξαρτάται από τα μάτια εκείνου που τη βλέπει»

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Ενότητα 3: Μετασχηµατισµοί Έντασης & Χωρικό Φιλτράρισµα

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ. Εργαστήριο 8 ο. Αποδιαμόρφωση PAM-PPM με προσαρμοσμένα φίλτρα

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΟΠΤΙΚΗΣ ΤΟΜΟΓΡΑΦΙΑΣ ΣΥΝΟΧΗΣ-OCT ΜΕ ΨΗΦΙΑΚΗ ΑΓΓΕΙΟΓΡΑΦΙΑ

Ψηφιακή Επεξεργασία Εικόνων

ΜΕΤΑΤΡΟΠΕΙΣ ΣΥΝΕΧΟΥΣ ΡΕΥΜΑΤΟΣ

ΠΕΙΡΑΜΑ 4: ΕΞΟΙΚΕΙΩΣΗ ΜΕ ΠΑΛΜΟΓΡΑΦΟ ΚΑΙ ΜΕΤΡΗΣΗ ΕΝΑΛΛΑΣΣΟΜΕΝΩΝ ΣΗΜΑΤΩΝ

Σκοπός του μαθήματος είναι ο συνδυασμός των θεωρητικών και ποσοτικών τεχνικών με τις αντίστοιχες περιγραφικές. Κεφάλαιο 1: περιγράφονται οι βασικές

J-GANNO. Σύντοµη αναφορά στους κύριους στόχους σχεδίασης και τα βασικά χαρακτηριστικά του πακέτου (προέκδοση 0.9Β, Φεβ.1998) Χάρης Γεωργίου

Ιατρικά Ηλεκτρονικά. Δρ. Π. Ασβεστάς Τμήμα Μηχανικών Βιοϊατρικής Τεχνολογίας Τ.Ε

Εισαγωγή στα Προσαρµοστικά Συστήµατα

ΕΡΓΑΣΤΗΡΙΟ ΦΥΣΙΚΗΣ ΟΠΤΙΚΗΣ - ΟΠΤΟΗΛΕΚΤΡΟΝΙΚΗΣ & LASER ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΧΗΜΕΙΑΣ & Τ/Υ ΑΣΚΗΣΗ ΝΟ7 ΟΠΤΙΚΗ FOURIER. Γ. Μήτσου

710 -Μάθηση - Απόδοση

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Συστήµατα DAQ. 6.1 Εισαγωγή

Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή

ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ

ΚΥΡΙΑ ΣΤΟΙΧΕΙΑ ΜΑΘΗΜΑΤΟΣ

4.3. Γραµµικοί ταξινοµητές

Οδηγός διαφοροποίησης για την πρωτοβάθµια

Μετρήσεις µε παλµογράφο

Σχήµα Π1.1: Η γεννήτρια κρουστικών ρευµάτων EMC 2004 της HILO TEST

Μεθοδολογίες Αξιοποίησης Δεδομένων

Αναγνώριση Προτύπων Ι

Ο Ήχος ως Σήμα & η Ακουστική Οδός ως Σύστημα

710 -Μάθηση - Απόδοση

Σημειώσεις κεφαλαίου 16 Αρχές επικοινωνίας με ήχο και εικόνα

Χαρακτηρισμός και μοντέλα τρανζίστορ λεπτών υμενίων βιομηχανικής παραγωγής: Τεχνολογία μικροκρυσταλλικού πυριτίου χαμηλής θερμοκρασίας

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

ΕΠΕΑΕΚ: ΑΝΑΜΟΡΦΩΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΤΟΥ ΤΕΦΑΑ ΠΘ - ΑΥΤΕΠΙΣΤΑΣΙΑ ΠΕΤΟΣΦΑΙΡΙΣΗ ΚΜ: : 305 ΠΑΤΣΙΑΟΥΡΑΣ ΑΣΤΕΡΙΟΣ

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΣΥΣΤΗΜΑΤΟΣ ΗΛΕΚΤΡΟΕΓΚΕΦΑΛΟΓΡΑΦΟΥ ΤΡΟΧΗΛΑΤΟΥ

Κεφάλαιο 3 Προεπεξεργασία Σήµατος Οµιλίας

Περιεχόμενα. Προλογικό Σημείωμα 9

ΗΧΟΣ και ΘΟΡΥΒΟΣ μια εισαγωγή. Νίκος Κ. Μπάρκας. Τμήμα Αρχιτεκτόνων Μηχανικών ΔΠΘ.

ΗΛΕΚΤΡΙΚΑ ΣΗΜΑΤΑ ΑΠΟ ΤΟ ΣΩΜΑ (II)

ΙΑΤΡΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΘΗΝΩΝ (ΕΚΠΑ) ΚΑΤΑΤΑΚΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ ΑΚ.ΕΤΟΥΣ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΙΑΤΡΙΚΗ ΦΥΣΙΚΗ

Λυχνία Κλύστρον Ανακλάσεως

Διοίκηση Ολικής Ποιότητας ΔΙΑΛΕΞΗ 2 η : Εργαλεία και Τεχνικές

Γενικά χαρακτηριστικά ανάδρασης

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων.

Εργασία στο µάθηµα Ανάλυση εδοµένων

Πότε πρέπει να αρχίζει η λογοθεραπεία στα παιδιά - λόγος και μαθησιακές δυσκολίες

M.Sc. Bioinformatics and Neuroinformatics

ΘΕΜΑ : ΨΗΦΙΑΚΑ ΗΛΕΚΤΡΟΝΙΚΑ DIGITAL ELECTRONICS

Ανοικτά Ακαδηµα κά Μαθήµατα

Περίθλαση από ακµή και από εµπόδιο.

ΜΑΘΗΜΑ 10ο ΜΕΡΟΣ Γ ΜΑΘΗΣΗ ΚΑΙ ΜΝΗΜΗ

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Σχεδιασμός Οικολογικού Διαμεσολαβητή για την εποπτεία και διαχείριση δικτύου διανομής ηλεκτρικής ενέργειας

ΕΚ ΗΛΩΣΗ ΕΝΗΜΕΡΩΣΗΣ ΚΑΙ ΕΥΑΙΣΘΗΤΟΠΟΙΗΣΗΣ ΤΟΥ ΚΟΙΝΟΥ ΣΤΙΣ ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ. Πόλη Ηµεροµηνία Ώρα Αίθουσα ΠΡΟΓΡΑΜΜΑ

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Επικοινωνίες I FM ΔΙΑΜΟΡΦΩΣΗ. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΣΥΣΤΗΜΑΤΟΣ ΒΙΝΤΕΟ-ΗΛΕΚΤΡΟΕΓΚΕΦΑΛΟΓΡΑΦΟΥ 128 ΚΑΝΑΛΙΩΝ

Γ ΛΥΚΕΙΟΥ ΦΥΣΙΚΗ ΘΕΤΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ : ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ : ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ ΚΑΙ ΕΙΚΟΝΩΝ ιπλωµατική Εργασία του ϕοιτητή του Τµήµατος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστηµίου Πατρών ΒΑΣΙΛΗ ΤΣΙΛΙΓΚΙΡΙ Η Αριθµός Μητρώου : 6398 Θέµα Σύγχρονες Τεχνικές στις ιεπαφές Ανθρώπινου Εγκεφάλου - Υπολογιστή Επιβλέπων Καθηγητής Θάνος Στουραΐτης Αριθµός ιπλωµατικής Εργασίας : ΠΑΤΡΑ, Μάρτιος 2011

2

ΠΙΣΤΟΠΟΙΗΣΗ Πιστοποιείται ότι η ιπλωµατική Εργασία µε ϑέµα : Σύγχρονες Τεχνικές στις ιεπαφές Ανθρώπινου Εγκεφάλου - Υπολογιστή του ϕοιτητή του Τµήµατος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών του Πανεπιστηµίου Πατρών ΒΑΣΙΛΗ ΤΣΙΛΙΓΚΙΡΙ Η Αριθµός Μητρώου : 6398 παρουσιάστηκε δηµόσια και εξετάστηκε στο Τµήµα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών στις Μαρτίου 2011 Ο Επιβλέπων Ο ιευθυντής του Τοµέα Θάνος Στουραΐτης, Καθηγητής Ευθύµιος Χούσος Καθηγητής

Αριθµός ιπλωµατικής Εργασίας : Θέµα : Σύγχρονες Τεχνικές στις ιεπαφές Ανθρώπινου Εγκεφάλου - Υπολογιστή Φοιτητής Επιβλέπων : Βασίλης Τσιλιγκιρίδης Θάνος Στουραΐτης, Καθηγητής Περίληψη Τα συστήµατα διεπαφών ανθρώπινου εγκεφάλου-υπολογιστή (BCIs: Brain-Computer Interfaces) απαιτούν την πραγµατικού χρόνου, αποτελεσµατική επεξεργασία των µετρήσεων των ηλεκτροεγκεφαλογραφικών (ΗΕΓ) σηµάτων του χρήστη τους, προκειµένου να µεταφράσουν τις νοητικές διεργασίες/προθέσεις του σε σήµατα ελέγχου εξωτερικών διατάξεων ή συστηµάτων. Στο πλαίσιο της εργασίας αυτής µελετήθηκε το ϑεωρητικό υπόβαθρο του προβλήµατος και αναλύθηκαν συνοπτικά οι κυριότερες τεχνικές που χρησιµοποιούνται σήµερα. Επιπρόσθετα, παρουσιάστηκε µία µέθοδος ταξινόµησης των νοητικών προθέσεων της αριστερής και δεξιάς κίνησης των χεριών ενός χρήστη η οποία εφαρµόστηκε σε πραγµατικά ιατρικά δεδοµένα. Η εξαγωγή των χαρακτηριστικών που διαφοροποιούνται µεταξύ των δύο καταστάσεων ϐασίστηκε σε πληροφορίες του πεδίου χρόνου-συχνότητας, οι οποίες αντλούνται µε το ϕιλτράρισµα των ακατέργαστων ΗΕΓ δεδοµένων και µε τη ϐοήθεια των αιτιατών κυµατιδίων Morlet, ενώ για την επακόλουθη ταξινόµηση των χαρακτηριστικών αναπτύχθηκαν και συγκρίθηκαν δύο αξιόπιστες µέθοδοι. Η πρώτη αφορά στη δηµιουργία πιθανοθεωρητικών προτύπων κανονικής κατανοµής για κάθε κατηγορία πρόθεσης κίνησης, µε την τελική α- πόφαση ταξινόµησης να λαµβάνεται µε εφαρµογή του απλού ταξινοµητή του Bayes, ενώ η δεύτερη δηµιουργεί ένα πρότυπο ταξινόµησης µε ϐάση το ϑεωρητικό πλαίσιο των Μηχανών ιανυσµάτων Υποστήριξης (SVM). Στόχος του προβλήµατος της δυαδικής ταξινόµησης είναι να αποφασίζεται σε ποια από τις δύο κατηγορίες ανήκει µία δεδοµένη νοητική πρόθεση όσο το δυνατόν ταχύτερα και αξιόπιστα, έτσι ώστε ο σχεδιαζόµενος αλγόριθµος να εξυπηρετήσει ένα πλαίσιο ανατροφοδότησης της τελικής απόφασης στο χρήστη σε συνθήκες πραγµατικού χρόνου. Τα συγκριτικά αποτελέσµατα που προέκυψαν από την εφαρµογή των δύο µεθόδων στα ιατρικά δεδοµένα του υπό µελέτη προβλήµατος και αφορούν στην προεπεξεργασία, εξαγωγή χαρακτηριστικών και στην επακόλουθη ταξινόµηση τους, απέφεραν και στις δύο περιπτώσεις ιδιαίτερα ενδιαφέροντα αποτελέσµατα. Ειδικότερα, παρατηρήθηκε η υπεροχή της απλής ταξινόµησης Bayes, έναντι της SVM, αφού στην προκειµένη περίπτωση η διαφορά στην ταχύτητα απόκρισης µεταξύ των δύο µεθόδων έπαιξε σηµαντικότερο ϱόλο από την µικρή διαφορά που υπήρχε στη µεταξύ τους ακρίβεια ταξινόµησης.

Ευχαριστίες Ιδιαίτερες ευχαριστίες οφείλονται στον Επιβλέποντα Καθηγητή µου Θάνο Στουραΐτη τη για την εµπιστοσύνη που µου έδειξε, για την πολύτιµη ϐοήθειά του στην εκπόνηση αυτής της µελέτης, καθώς και για τις ουσιαστικές παρατηρήσεις και παρεµβάσεις του. Οφείλω επίσης να ευχαριστήσω εκείνους που µε ϐοήθησαν στην κατανόηση του ϕυσικού προβλήµατος, κα- ϑώς και όλους τους γνωστούς και ϕίλους που µε ενθάρρυναν και µε στήριξαν µε κάθε τρόπο σε αυτή την προσπάθεια.

Περιεχόµενα Εισαγωγή 13 1 Εισαγωγή στα BCIs 1 1.1 Εισαγωγή.................................... 1 1.2 Οµάδες ΗΕΓ Σηµάτων/Κυµατοµορφών (EEG-BCIs).............. 2 1.2.1 αισθητικοκινητικοί ϱυθµοί....................... 2 1.2.1.1 Οι SMR ως σήµα εισόδου σε BCI (SMR-BCIs)........ 4 1.2.2 Αργά δυναµικά στο ϕλοιό του εγκεφάλου................ 5 1.2.2.1 Τα SCP ως σήµα εισόδου σε BCIs συστήµατα (SCP-BCIs).. 5 1.2.3 υναµικά σχετιζόµενα µε γεγονότα................... 5 1.2.3.1 Η συνιστώσα P300....................... 6 1.2.3.2 Η P300 ως σήµα εισόδου σε BCI (P300-BCIs)........ 7 1.2.3.3 Το οπτικά προκλητό δυναµικό σταθερής κατάστασηςssvep 7 1.2.3.4 Το SSVEP ως σήµα εισόδου σε BCI (SSVEP-BCIs)...... 8 1.3 Στάδια Επεξεργασίας ΗΕΓ Σηµάτων σε ένα BCI................ 9 1.3.1 Προεπεξεργασία των ΗΕΓ σηµάτων................... 10 1.3.1.1 Μέθοδοι αναφοράς των καναλιών............... 11 1.3.1.2 Η µέθοδος των κοινών χωρικών ακολουθιών......... 12 1.3.2 Εξαγωγή χαρακτηριστικών....................... 12 1.3.2.1 Χρονικές - ϕασµατικές µέθοδοι................ 13 1.3.2.2 Παραµετρικά µοντέλα..................... 14 1.3.2.3 Χαρακτηριστικά και ιδιότητες................. 15 1.3.3 Επιλογή των χαρακτηριστικών...................... 16 1.3.3.1 Ανάλυση Κύριων Συνιστωσών................. 17 1.3.3.2 Γενετικοί Αλγόριθµοι..................... 17 1.3.4 Ταξινόµηση των χαρακτηριστικών.................... 18 1.3.4.1 Γραµµικοί ταξινοµητές.................... 20 1.3.4.2 Νευρωνικά δίκτυα....................... 20 1.3.4.3 Μη γραµµικοί ταξινοµητές Bayes............... 21 1.3.4.4 Ταξινοµητές του πλησιέστερου γείτονα............ 22 1.4 Το σύστηµα Graz-BCI.............................. 24 1.4.1 Συνιστώσες του Graz-BCI........................ 25 1.4.2 ERD/ERS στο σύστηµα Graz-BCI................... 27 1.4.3 Ελεγχος µέσω των ERD/ERS...................... 29 2 Κυµατιδιακή Ανάλυση 31 9

2.1 Εισαγωγή.................................... 31 2.2 Κυµατίδια.................................... 32 2.2.1 Ιδιότητες κυµατιδίου........................... 32 2.2.2 Κριτήρια Επιλογής Κυµατιδίου..................... 33 2.3 Μετασχηµατισµός Κυµατιδίου.......................... 34 2.3.1 Συνεχής Μετασχηµατισµός Κυµατιδίου................. 37 2.3.1.1 Υπολογισµός του Συνεχούς Μετασχηµατισµού Κυµατιδίου. 40 2.3.1.2 Μαθηµατική προσέγγιση του CWT.............. 43 2.3.1.3 Ανάλυση και απεικόνιση στο πεδίο χρόνου - συχνότητας.. 46 2.3.2 ιακριτός Μετασχηµατισµός Κυµατιδίου (DWT)............ 48 2.3.3 Μετασχηµατισµός Κυµατιδιακών Πακέτων (ΩΠΤ)............ 54 3 Μέθοδοι εκµάθησης και ταξινόµησης 57 3.1 Θεωρία αποφάσεων Bayes............................ 57 3.1.1 Βασικές αρχές.............................. 57 3.1.1.1 Περίπτωση πολλών κλάσεων.................. 61 3.1.1.2 Περίπτωση δύο κλάσεων.................... 62 3.1.2 Η πυκνότητα πιθανότητας της κανονικής κατανοµής.......... 63 3.1.2.1 Η µονοδιάστατη συνάρτηση π.π. της κανονικής κατανοµής. 64 3.1.2.2 Συνάρτηση κατανοµής πολλών µεταβλητών.......... 65 3.2 Μηχανές ιανυσµάτων Υποστήριξης (SVM)................... 66 3.2.1 Μαθηµατικό υπόβαθρο των SVM.................... 68 3.2.2 Μη διαχωρίσιµα προβλήµατα...................... 71 3.2.3 Συναρτήσεις πυρήνα........................... 72 4 Μεθοδολογία και Αποτελέσµατα 75 Μεθοδολογία και Αποτελέσµατα 75 4.1 Εισαγωγή.................................... 75 4.2 Περιγραφή πειραµατικού πλαισίου και δεδοµένων............... 76 4.3 Προεπεξεργασία και εξαγωγή χαρακτηριστικών................ 77 4.3.1 Μιγαδικά κυµατίδια Morlet....................... 78 4.3.2 Εφαρµογή των κυµατιδίων Morlet στα δεδοµένα............ 80 4.4 Πρότυπα ταξινόµησης.............................. 82 4.4.1 Πιθανοθεωρητικά πρότυπα ταξινόµησης Bayes............. 82 4.4.1.1 Συνδυάζοντας πληροφορία στο χρόνο............. 83 4.4.2 Ταξινόµηση µε SVM........................... 84 4.5 Αποτελέσµατα - Συµπεράσµατα......................... 88 4.5.1 Αξιολόγηση ενός συστήµατος BCI.................... 88 4.5.1.1 Κοινή πληροφορία µιας συνεχόµενης εξόδου......... 90 4.5.1.2 Χρόνος απόκρισης....................... 92 4.5.2 Αποτελέσµατα ταξινοµητών Bayes.................... 93 4.5.3 Αποτελέσµατα ταξινοµητών SVM.................... 94 4.5.4 Βέλτιστη µέθοδος............................ 100 5 Συµπεράσµατα 107 ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 10

ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 11

ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 12

Εισαγωγή Οι διεπαφές ανθρώπινου εγκεφάλου-υπολογιστή (BCI: Brain-Computer Interfaces) χρησιµοποιούν ηλεκτρικά, µαγνητικά ή αιµοδυναµικά εγκεφαλικά σήµατα για να επιτύχουν τον έλεγχο εξωτερικών διατάξεων, όπως είναι οι υπολογιστές, οι διακόπτες, οι αναπηρικές καρέκλες, ή διάφορα προσθετικά όργανα. Μία διεπαφή ανθρώπινου εγκεφάλου-υπολογιστή έχει ως στόχο την αναγνώριση της πρόθεσης του χρήστη της, παρατηρώντας και αναλύοντας την εγκεφαλική του δραστηριότητά µε χρήση επεµβατικών ή µη επεµβατικών τεχνικών α- πεικόνισης, όπως το ΗλεκτροΕγκεφαλοΓράφηµα (ΗΕΓ/EEG). Παράλληλα, προσφέρει ένα πρόσθετο κανάλι εξόδου χρησιµοποιώντας τη νευρική δραστηριότητα του εγκεφάλου για να ελέγξει εξωτερικές διατάξεις, µε στόχο, για παράδειγµα, την αποκατάσταση κινητικών δυσλειτουργιών. Η νευρική δραστηριότητα µικρού αριθµού νευρώνων ή µεγάλων οµάδων κυττάρων δειγµατοληπτείται και επεξεργάζεται σε πραγµατικό χρόνο, και µετατρέπεται σε εντολές για έλεγχο µιας εφαρµογής, όπως ενός ϱοµποτικού ϐραχίονα ή ενός προγράµµατος επικοινωνίας. Η δραστηριότητα του εγκεφάλου καταγράφεται είτε ενδοκρανιακά από τον εγκεφαλικό ϕλοιό µε τη ϐοήθεια µίας πολυηλεκτροδιακής διάταξης, είτε µε ένα σύνολο ηλεκτροδίων που ε- ϕάπτονται στο κρανίο. Από το ευρύ ϕάσµα της ηλεκτρικής εγκεφαλικής δραστηριότητας, αλγόριθµοι αναγνώρισης σηµάτων ϕιλτράρουν και αφαιρούν το ϑόρυβο από το σήµα ενδιαφέ- ϱοντος, έτσι ώστε η αποκωδικοποιηµένη πληροφορία να µπορεί να µετατραπεί σε επιθυµητά σήµατα ελέγχου. Τα τρία ϐασικά χαρακτηριστικά των BCIs είναι : η συλλογή και µέτρηση των σηµάτων από τον ανθρώπινο εγκέφαλο. οι µέθοδοι και οι αλγόριθµοι για την αποκωδικοποίηση εγκεφαλικών καταστάσεων / προθέσεων του χρήστη από αυτά τα σήµατα. η µεθοδολογία και οι αλγόριθµοι για την αντιστοίχία της αποκωδικοποιηµένης εγκε- ϕαλικής δραστηριότητας σε προτιθέµενη συµπεριφορά ή ενέργεια του χρήστη. Η έρευνα που αφορά στα συστήµατα BCI ευελπιστεί, κατά κύριο λόγο, να δηµιουργήσει νέα κανάλια επικοινωνίας για ανθρώπους µε σοβαρά προβλήµατα αναπηρίας. Οι ασθενείς µπο- ϱεί να έχουν µόνο έναν περιορισµένο αριθµό µυών για να ελέγχουν τεχνητές διατάξεις, ώστε να επικοινωνούν τις ανάγκες και τις επιθυµίες τους µε το περιβάλλον τους. Οι περισσότερες µέθοδοι επικοινωνίας που ϐρίσκονται σε χρήση σήµερα, απαιτούν από τους χρήστες ορισµένο µυϊκό έλεγχο, οπότε δεν µπορούν να ϕανούν χρήσιµες σε ανθρώπους που παρουσιάζουν ολική παράλυση (complete locked-in state) ή έχουν άλλες σοβαρές κινητικές ανικανότητες. Οι τελευταίοι χρειάζονται ένα εναλλακτικό κανάλι επικοινωνίας, ανεξάρτητο µυϊκού ελέγχου, 13

µία µέθοδο έκφρασης δηλαδή, που να µην ϐασίζεται στις κανονικές διεξόδους του εγκεφάλου, όπως τα περιφερειακά νεύρα και οι µύες. Πολλές πιθανές εφαρµογές των συστηµάτων BCI αφορούν την αποκατάσταση αναπηριών, τη ϐελτίωση της αντιµετώπισης διάφορων ψυχικών παθήσεων, τη ϑεραπεία χρόνιου πόνου και στην αντιµετώπιση κινητικών δυσκολιών, που οφείλονται π.χ. σε ένα εγκεφαλικό. Παράλληλα µε τις επικεντρωµένες προσπάθειες στη δηµιουργία εφαρµογών που αφορούν την ιατρική αποκατάσταση, υπάρχουν αντίστοιχες προσπάθειες που αφορούν άλλα πεδία εφαρµογών, όπως η επικοινωνία, τα πολυµέσα, η ϱοµποτική, η εικονική πραγµατικότητα, κ.ά. Ακόµη, µε την παρατήρηση και την ανάλυση της εγκεφαλικής δραστηριότητας οι επιστήµονες κατανοούν καλύτερα τη λειτουργία του ανθρώπινου εγκεφάλου, όσον αφορά στην πλαστικότητα, την οργάνωση, την εκπαίδευση, τη µνήµη, την προσοχή, την σκέψη, την συγκέντρωση και πολλές άλλες ϐασικές λειτουργίες του εγκεφάλου. Αρκετές τεχνολογίες εγκεφαλικής απεικόνισης έχουν δοκιµαστεί για τη συλλογή της απα- ϱαίτητης πληροφορίας για τα BCIs. Η ηλεκτρική δραστηριότητα του εγκεφάλου µπορεί να καταγραφεί µε µη επεµβατικό τρόπο µε τη ϐοήθεια της γνωστής τεχνικής του ΗΕΓ. Το ϱεύµα που παράγεται από τη νευρική δραστηριότητα επάγει ένα µαγνητικό πεδίο, το οποίο καταγράφεται από το ΜαγνητοΕγκεφαλοΓράφηµα (ΜΕΓ/MEG). Οι αλλαγές στο λόγο της οξυγονωµένης αιµοσφαιρίνης προς το δεδοµένο όγκο του αίµατος, εξαιτίας της νευρικής δραστηριότητας, υπολογίζονται µέσω της υπέρυθρης ϕασµατογραφίας (NIRS). Άλλες τεχνικές περιλαµβάνουν τη λειτουργική απεικόνιση του µαγνητικού συντονισµού (fmri) και την τοµογραφία εκποµπής ποζιτρονίων (PET). Σηµειώνεται ότι, επειδή οι τεχνολογίες των MEG, fmri και PET είναι ακριβές και απαιτητικές ως προς τον εργαστηριακό εξοπλισµό, είναι πιο κατάλληλες για εξειδικευµένη εργαστηριακή έρευνα ως προς, για παράδειγµα, τον προσδιορισµό των ϑέσεων των πηγών της εγκεφαλικής δραστηριότητας και της διαφοροποίησης αυτής σε περιπτώσεις ασθενειών µε γνωστές νευρολογικές δυσλειτουργίες. Αντίθετα, οι ΗΕΓ, NIRS, όπως και διάφορες επεµβατικές διατάξεις, είναι ϕορητές και συνεπώς µπορούν να προσφέρουν πρακτικά συστήµατα BCIs για επικοινωνία και έλεγχο στην καθηµερινή Ϲωή. Η πλειοψηφία των σηµερινών BCIs συστηµάτων εκµεταλλεύονται τα ηλεκτροεγκεφαλικά σήµατα. Ενα εξιδανικευµένο σύστηµα BCI ϑα µπορούσε να εντοπίσει όλες τις προθέσεις του χρήστη, τις σκεπτόµενες και σχεδιαζόµένες ενέργειες, ακόµη και κάποιες απλές σκέψεις, σε οποιαδήποτε χρονική στιγµή. Μέχρι σήµερα, δεν υπάρχουν αισθητήρες που να έχουν τη δυνατότητα να εντοπίζουν τις προθέσεις και σκέψεις του χρήστη, καθώς η γνώση που έχει αποκτηθεί για την ηλεκτροφυσιολογία του εγκεφάλου και τα σήµατά του είναι ακόµη αρκετά περιορισµένη. Επιπροσθέτως, είναι εξαιρετικά δύσκολο να εξαχθεί η επιθυµητή πληροφορία από τη συνεχόµενη και πολύ ϑορυβώδη δραστηριότητα του εγκεφάλου, που παρουσιάζει ένα λόγο σήµατος προς ϑόρυβο (SNR) χαµηλό έως και -20 db για ΗΕΓ σήµατα. Συνεπώς, η έρευνα για τα συστήµατα BCIs, έως αυτό το σηµείο, έχει προτείνει λύσεις για τη διάκριση ενός περιο- ϱισµένου αριθµού εντολών υπό αυστηρές συνθήκες, µε περιορισµένη ακρίβεια αναγνώρισης, πεπερασµένο χρόνο αναγνώρισης και παραγωγής κάθε εντολής, και µόνο κατά τη διάρκεια συγκεκριµένων περιόδων ενεργοποίησης (περίοδοι χρήσης του συστήµατος BCI). Ενα αποτελεσµατικό σύστηµα BCI ϑα πρέπει να έχει την ικανότητα να : εξάγει πληροφορίες συσχετισµένες µε συγκεκριµένες νοητικές προθέσεις ή διεργασίες, προσαρµόζεται και αυτοδιδάσκεται σε συνεχώς εναλλασσόµενα περιβάλλοντα µε ϑόρυ- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 14

ϐο, προβλέπει τις προθέσεις του χρήστη (όπως η προετοιµασία µίας κίνησης) γρήγορα και αξιόπιστα, εκτελεί τις κατάλληλες ενέργειες (έλεγχος µίας διάταξης, παροχή ανατροφοδότησης της εξόδου του στο χρήστη κ.τ.λ.). Για να υπάρξει πρόοδος στη δηµιουργία πιο αποτελεσµατικών και αξιόπιστων συστηµάτων BCI, είναι απαραίτητο να : Καταγράφονται υψηλής ποιότητας και πραγµατικού χρόνου πληροφορίες σχετικές µε τα εγκεφαλικά και περιφερειακά νεύρα, από µία ποικιλία πηγών και πιθανώς µε τη χρήση διάφορων τεχνικών απεικόνισης. Μετατρέπονται οι πληροφορίες αυτές σε χρήσιµα και αξιόπιστα δεδοµένα, τα οποία ϑα αποτελούν πλέον γνώση για το σύστηµα. Παρέχουν δυνατότητα ανατροφοδότησης της εξόδου µε αποτελεσµατική απεικόνιση του σήµατός της µέσω µίας γραφικής διεπαφής για να παρουσιάζει ποιοτικά ότι αυτό αντιπροσωπεύει. Το ϐασικό στοιχείο ενός επικοινωνιακού συστήµατος BCI (ϐλέπε Σχήµα 1) είναι η ερµηνεία των ΗΕΓ σηµάτων σχετικά µε τις χαρακτηριστικές παραµέτρους της ηλεκτρικής εγκεφαλικής δραστηριότητας. Ο ϱόλος της επεξεργασίας σήµατος είναι σπουδαίος στην ανάπτυξη ενός πραγµατικού χρόνου συστήµατος BCI. Τα στάδια για την ολοκληρωµένη ανάλυση του ΗΕΓ σήµατος είναι : Η συλλογή του σήµατος. Η προεπεξεργασία του σήµατος. Ο προσδιορισµός / εξαγωγή χαρακτηριστικών του σήµατος. Η ταξινόµηση των χαρακτηριστικών. Η αξιολόγηση των αποτελεσµάτων. Στην εργασία αυτή εξετάζεται η επεξεργασία της ΗΕΓ δραστηριότητας ενός ατόµου κατά τη διεξαγωγή νοητικών προθέσεων κίνησης του χεριού προς την αριστερή και τη δεξιά κατεύθυνση, µε τελικό στόχο το µεταξύ τους διαχωρισµό και την ταξινόµηση της κάθε πρόθεσης στην αντίστοιχη, σύµφωνα µε την κατεύθυνσή της, κατηγορία σε συνθήκες πραγµατικού χρόνου. Η διαδικασία της επεξεργασίας έγινε στο γενικότερο πλαίσιο έρευνας γύρω από το Graz-BCI σύστηµα µε σκοπό τη ϐελτίωση των εφαρµοζόµενων αλγορίθµων και µεθοδολογιών στόσο ό- σον αφορά στην προεπεξεργασία των δεδοµένων και στην εξαγωγή χαρακτηριστικών, όσο και στην ταξινόµηση των χαρακτηριστικών σύµφωνα µε τη νοητική πρόθεση που προκάλεσε την εµφάνισή τους στα ΗΕΓ σήµατα. Η εξαγωγή των χαρακτηριστικών που παρέχουν διαφοροποίηση µεταξύ των δύο καταστάσεων ϐασίζεται σε πληροφορίες στο πεδίο χρόνου-συχνότητας, οι οποίες αντλούνται µε το ϕιλτράρισµα των ακατέργαστων ΗΕΓ δεδοµένων µε τη ϐοήθεια ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 15

Σχήµα 1: Το επικοινωνιακό σύστηµα BCI. αιτιατών Morlet κυµατιδίων, ενώ για την επακόλουθη ταξινόµηση των χαρακτηριστικών αναπτύσσονται δύο διαφορετικές µέθοδοι. Πιο συγκεκριµένα στο Κεφάλαιο 1 αναπτύσσονται τα BCI συστήµατα και µελετώνται οι τρόποι συλλογής και επεξεργασίας των ΗΕΓ σηµάτων, στο Κεφάλαιο 2 αναπτύσσονται τα ϐασικά στοιχεία της κυµατιδιακής ανάλυσης, στο Κεφάλαιο 3 αναπτύσσονται οι µέθοδοι εκπαίδευσης και ταξινόµησης µε έµφαση στις µεθόδους του απλού ταξινοµητή Bayes και των µηχανών διανυσµάτων υποστήριξης (SVM), στο Κεφάλαιο 4 περιγράφονται η µεθοδολογία της λύσης του προβλήµατος των νοητικών προθέσεων κίνησης του χεριού και δίνονται τα αποτελέσµατα ενός σχετικού πειράµατος και τέλος στο Κεφάλαιο 5 δίνονται τα συµπεράσµατα. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 16

ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 17

Κεφάλαιο 1 Εισαγωγή στα BCIs 1.1 Εισαγωγή Η ηλεκτρική ϕύση του ανθρώπινου νευρικού συστήµατος έχει αναγνωριστεί εδώ και περισσότερο από έναν αιώνα. Τα ΗΕΓ σήµατα, όπως και η πλειονότητα των ϐιοσηµάτων που µπορούν να καταγραφούν από το ανθρώπινο σώµα, ϐασίζονται στην ηλεκτρική δραστηριότητα ενός µεγάλου αριθµού νευρικών κυττάρων. Η ϐασική µονάδα που είναι το νευρικό κύτταρο ή αλλιώς νευρώνας, αποτελείται από το κυρίως σώµα, τον άξονα και τους δενδρίτες. Συνήθως ο νευρώνας έχει έναν άξονα και µεγάλο αριθµό από δενδρίτες. Κύρια λειτουργία του άξονα είναι η µεταφορά της διέγερσης του νευρώνα προς άλλα κύτταρα. Αντιθέτως, ο ϱόλος των δενδριτών είναι να δέχονται τις διεγέρσεις από τους άξονες άλλων νευρώνων. Το σηµείο επαφής του άξονα µε ένα άλλο κύτταρο, στο οποίο γίνεται και η µεταφορά της διέγερσης, καλείται σύναψη. Οι ϐασικές αλληλεπιδράσεις µεταξύ κυττάρων καλύπτονται από το δυναµικό διέγερσης, το οποίο διαδίδεται κατά µήκος του άξονα, και τα µετασυναπτικά δυναµικά των οποίων η δράση είναι χωρικά περιορισµένη στην περιοχή των συνάψεων και δεν προκαλεί απαραίτητα τη διέγερση του κυττάρου. Σε περιπτώσεις που υπάρχει συγχρονισµένη ενεργοποίηση µεγάλου αριθµού κυττάρων τότε το δυναµικό διέγερσης καθορίζει σε µεγάλο ϐαθµό τα χαρακτηριστικά του παραγόµενου ϐιοσήµατος. Στην περίπτωση του ΗΕΓ, όπου λαµβάνουν χώρα περίπλοκες λειτουργίες, τον κύριο λόγο έχουν τα µετασυναπτικά δυναµικά. Είναι γνωστό, ότι η παρουσία µεταβαλλόµενων ηλεκτρικών δυναµικών στην επιφάνεια του κρανίου αντικατοπτρίζει τις λειτουργικές δραστηριότητες του εγκεφάλου. Αυτά τα επιφανειακά µεταβαλλόµενα δυναµικά µπορούν να καταγραφούν, εφάπτοντας µία συγκεκριµένη διάταξη από ηλεκτρόδια επιφανειακά στο κρανίο και µετρώντας σήµατα τάσης µεταξύ Ϲευγών ηλεκτροδίων, τα οποία ϕιλτράρονται, ενισχύονται, και τέλος καταγράφονται. Το αποτέλεσµα που προκύπτει είναι το ΗΕΓ. Σηµειώνεται, ότι στο σχηµατισµό του ΗΕΓ δεν επιδρούν εξίσου όλα τα είδη της εγκεφαλικής δραστηριότητας, επηρεάζουν όµως το ϐάθος, ο προσανατολισµός και η εσωτερική συµµετρία των συνδέσεων στο ϕλοιό. Ως προς τα ΗΕΓ σήµατα, τα πυραµιδοειδή νευρικά κύτταρα ϑεωρείται ότι προκαλούν το σηµαντικότερο τµήµα τους. Στη σηµερινή εποχή, σύγχρονες τεχνικές για την απόκτηση ΗΕΓ σηµάτων συλλέγουν αυτές τις ηλεκτρικές ακολουθίες από το κρανίο και τις ψηφιοποιούν προς αποθήκευσή τους σε έναν υπολογιστή. Τα ηλεκτρόδια χειρίζονται τα δυναµικά τάσης mvolt ως αδύναµα σήµατα επιπέδου και τα κατευθύνουν σε ενισχυτές που τα µεγεθύνουν προσεγγιστικά έως και 10.000 ϕορές. Η χρήση αυτού του είδους των τεχνικών εξαρτάται ιδιαιτέρως από την τοποθέτηση των 1

ηλεκτροδίων µε συγκεκριµένο τρόπο, όπως και από τον τρόπο που εφάπτονται στην επιφάνεια του κρανίου. Για το λόγο αυτό τα ηλεκτρόδια κατασκευάζονται από αγώγιµα υλικά, όπως είναι ο χλωριούχος χρυσός ή άργυρος, µε διάµετρο της τάξεως του 1 cm, ενώ απαιτούνται και άλλες προεργασίες, όπως π.χ. η χρήση µιας αγώγιµης κρέµας στο κρανίο για να διατηρείται ένας αποδεκτός λόγος σήµατος προς ϑόρυβο. 1.2 Οµάδες ΗΕΓ Σηµάτων/Κυµατοµορφών (EEG-BCIs) Οι διεπαφές ανθρωπίνου εγκεφάλου-υπολογιστή που ϐασίζονται στην επεξεργασία εγκεφαλικών σηµάτων απαιτούν την απευθείας αναγνώριση νοητικών καταστάσεων από την αυθόρ- µητη εγκεφαλική δραστηριότητα που απεικονίζεται στο ΗΕΓ. Σε ένα τυπικό πείραµα BCI, οι συµµετέχοντες εκθέτονται σε ερεθίσµατα ή απαιτείται να πραγµατοποιήσουν συγκεκριµένες νοητικές ενέργειες, ενώ η ηλεκτρική δραστηριότητα των εγκεφάλων τους καταγράφεται µε τη µέθοδο του ΗΕΓ. Τα σχετικά χαρακτηριστικά που λαµβάνονται από το ΗΕΓ µπορούν να ανατροφοδοτηθούν στο χρήστη, µέσω των λεγόµενων συστηµάτων BCI κλειστού ϐρόχου. Συγκεκριµένα ηλεκτροφυσιολογικά σήµατα αναφέρονται στους νευρολογικούς µηχανισµούς ή στις διαδικασίες που εφαρµόζει ο χρήστης ενός BCI συστήµατος προκειµένου να δηµιουργήσει σήµατα ελέγχου. Τα πρόσφατα συστήµατα BCI ταξινοµούνται σε κατηγορίες, ανάλογα µε τους νευρολογικούς µηχανισµούς και την τεχνολογία καταγραφής που χρησιµοποιούν. Κάποιοι από αυτούς τους µηχανισµούς ή τις διαδικασίες που αντικατοπτρίζονται στην ΗΕΓ δραστηριότητα ϱυθµίζονται από το χρήστη του συστήµατος BCI και λέγονται αισθητικοκινητικοί ϱυθµοί, ή προκαλούνται από τα οπτικά, απτά, ή ακουστικά ερεθίσµατα οπότε λέγονται δυναµικά σχετιζόµενα µε γεγονότα, όπως συµβαίνει, για παράδειγµα, µε την P300 συνιστώσα και το οπτικά προκλητό δυναµικό σταθερής κατάστασης (SSVEP). Στη συνέχεια, περιγράφονται κάπως λεπτοµερέστερα οι µηχανισµοί αυτοί. 1.2.1 Αισθητικοκινητικοί ϱυθµοί Οι αισθητικοκινητικοί ϱυθµοί (SMR: SensoriMotor Rhythms) περιλαµβάνουν τον µ- ϱυθµό, ο οποίος έχει σχήµα τόξου, κοντά στη συχνότητα των 10 Hz (εύρος 8-12 Hz), συνήθως αναµειγµένο µε µία συνιστώσα του β -ϱυθµού (13-30 Hz) και µία συνιστώσα του γ-ϱυθµού (κοντά στα 40 Hz), που καταγράφονται πάνω από τον σωµατο-αισθητικό ϕλοιό του εγκεφάλου. Σηµειώνεται ότι : Ο µ-ϱυθµός σχετίζεται µε τις κινητικές λειτουργίες και καταγράφεται καλύτερα πάνω α- πό τον ϕλοιό του εγκεφάλου που σχετίζεται µε την κίνηση. Ο ϱυθµός αυτός ελαττώνεται µε την κίνηση ή την πρόθεση κίνησης. Ο β-ϱυθµός, του οποίου η περιοχή αλλαγής κυµαίνεται µεταξύ 13 και 30 Hz και έχει µία µικρή τιµή κυµαινόµενη στα 5-30 µv, είναι αυτός που σχετίζεται συνήθως µε την ενεργή σκέψη, την ενεργή προσοχή, τη συγκέντρωση στον εξωτερικό κόσµο ή την επίλυση προβληµάτων. Μπορεί να παρατηρηθεί και κοντά στα 50 Hz κατά τη διάρκεια έντονης νοητικής δραστηριότητας. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 2

ο γ-ϱυθµός κυµαίνεται στην περιοχή των 35 Hz και άνω. Κοντά στην πραγµατοποίηση µιας κίνησης το πλάτος του γ-ϱυθµού αυξάνεται, ενώ εµφανίζεται πιο έντονα στον πρωτοταγή σωµατο-αισθητικό ϕλοιό του εγκεφάλου. Οι αισθητικοκινητικοί ϱυθµοί πηγάζουν από την κινητική περιοχή του ϕλοιού, µε τη συµβολή και σωµαταισθητικών περιοχών (συγκεκριµένα µε τη συνιστώσα του β-ϱυθµού να εγείρεται από την κινητική, ενώ τη συνιστώσα του µ-ϱυθµού από αισθητηριακές περιοχές). Ελαττώνονται ή αποσυγχρονίζονται µε την κίνηση, ή και την προετοιµασία της, και ενισχύονται ή συγχρονίζονται στην περίοδο µετά την κίνηση ή κατά τη διάρκεια χαλάρωσης. Ο αποσυγχρονισµός αυτός καλείται αποσυγχρονισµός σχετιζόµενος µε γεγονός (ERD: Event-Related Desynchronization) και γίνεται εµφανής 2 δευτερόλεπτα πριν την εκδήλωση της κίνησης. Μετά την κίνηση η ισχύς των ϱυθµών αυτών επανέρχεται στα αρχικά επίπεδα. Το ϕαινόµενο αυτό καλείται συγχρονισµός σχετιζόµενος µε γεγονός (ERS: Event-Related Synchronization) και ϕτάνει στο µέγιστο περίπου 600 msec µετά την ολοκλήρωση της κίνησης. Πολύ σηµαντικό ϱόλο στη χρήση των συστηµάτων BCIs για ασθενείς σε κατάσταση σοβαρού ϐαθµού παράλυσης (locked-in state), παίζει το γεγονός ότι αποσυγχρονίζονται και µε την πρόθεση της κίνησης, µε αποτέλεσµα η εξασθένηση του πλάτους των αισθητηριοκινητικών ϱυθµών να µην απαιτεί κάποια πραγµατική κίνηση. Άλλες κυµατοµορφές που αποτελούν ξεχωριστές οµάδες είναι : Ο α-ϱυθµός, του οποίου η περιοχή ενδιαφέροντος κυµαίνεται µεταξύ 8-13 Hz µε πλάτος σήµατος 30-50 µv. Εχει ϑεωρηθεί ότι υποδεικνύει τη χαλαρή επίγνωση µιας κατάστασης την έλλειψη προσοχής ή και την αφηρηµένη σκέψη. Είναι πιο ισχυρός πάνω από τον ινιακό (πίσω µέρος του εγκεφάλου) και το µετωπιαίο λοβό. Ο α-ϱυθµός επικρατεί της εγκεφαλικής δραστηριότητας, καθώς καλύπτει ένα µεγάλο εύρος της. Είναι συχνό ϕαινόµενο να ϐλέπουµε µία κορυφή του στο εύρος του β-ϱυθµού, έως και στα 20 Hz. Ο α-ϱυθµός µόνος του υποδεικνύει περισσότερο ένα κενό µυαλό από ένα χαλαρό, µία αφηρηµένη κατάσταση από µία παθητική, ενώ µπορεί να εξαλειφθεί µε το άνοιγµα των µατιών, το άκουσµα άγνωστων ήχων, το άγχος, ή τη νοητική συγκέντρωση. Ο θ-ϱυθµός, ο οποίος κυµαίνεται στην περιοχή των 4-7 Hz µε ένα πλάτος συνήθως µεγαλύτερο από 20 µv. Ο θ-ϱυθµός εγείρεται από ϕαινόµενα που σχετίζονται µε συναισθηµατικό στρες, όπως ο εκνευρισµός, ή η απογοήτευση. Εχει συνδεθεί επίσης µε τη δηµιουργική έµπνευση και το ϐαθύ διαλογισµό. Η µεγαλύτερη επικρατούσα κορυφή των θ κυµατοµορφών είναι κοντά στα 7 Hz. Ο δ-ϱυθµός κυµαίνεται στην περιοχή των 0.5-4 Hz µε ένα µεταβλητό πλάτος. Οι κυ- µατοµορφές του δ-ϱυθµού σχετίζονται πρωταρχικά µε τον ύπνο, ενώ ο εντοπισµός τους σε κατάσταση αφύπνισης ϑεωρείται ότι υποδεικνύουν ϕυσικές ατέλειες στον εγκέφαλο. Είναι πολύ εύκολο να συγχέουµε τις δ κυµατοµορφές µε σήµατα που αποτελούν ϑόρυβο και προκαλούνται από κινήσεις του λαιµού ή του σαγονιού. Αυτό συµβαίνει επειδή οι µύες αυτοί είναι κοντά στην επιδερµίδα και παράγουν µεγάλα σήµατα, ενώ το σήµα ενδιαφέροντος πηγάζει ϐαθιά µέσα από τον εγκέφαλο και εξασθενεί σηµαντικά περνώντας από το κρανίο. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 3

Σχήµα 1.1: Το ϕάσµα του ΗΕΓ ενός ασθενούς µε ALS στο ηλεκτρόδιο ϑέσης CP4, µε το µέσο όρο του πλάτους από 160 δοκιµές. Η γκρι γραµµή αναφέρεται στο µέσο όρο των ΗΕΓ όταν ο κέρσορας πρέπει να µετακινηθεί στον πάνω στόχο από τους δύο, ενώ η µαύρη όταν πρέπει να µετακινηθεί στον κάτω. Η µετακίνηση του κέρσορα προς τα κάτω µπορεί να επιτευχθεί µε εικονική κίνηση από πλευράς του χρήστη (κίνηση του αριστερού χεριού που συντελεί στη µεταβολή του SMR στο CP4 ηλεκτρόδιο), ενώ προς τα πάνω µε κενή σκέψη, δηλαδή ο χρήστης να µην σκέφτεται τίποτα. Κατά τη διάρκεια της µετακίνησης του κέρσορα προς τα κάτω, τα πλάτη των SMR ελαττώνονται (αποσυγχρονισµός). 1.2.1.1 Οι SMR ως σήµα εισόδου σε BCI (SMR-BCIs) Πολλές ερευνητικές οµάδες των συστηµάτων BCI διαλέγουν τους SMR ϱυθµούς ως σήµατα εισόδου, γιατί προσφέρουν συνήθως έναν ευκολότερο τρόπο ϱύθµισης τους µέσω προθέσεων κίνησης. Η ϱύθµιση των SMR µπορεί να επιτευχθεί µε ένα σχετικά απλό πείραµα, στο ο- ποίο χρήστες ενός συστήµατος BCI ϕαντάζονται την κίνηση των αριστερών και δεξιών άκρων τους. Στην πειραµατική διαδικασία, µετά την επακόλουθη µηχανική µάθηση (machine learning), διάρκειας περίπου 2 λεπτών σε ένα συνηθισµένο υπολογιστικό σύστηµα, εξατοµικευµένα χωρο-χρονικά ϕίλτρα και ταξινοµητές είναι έτοιµοι προς χρήση για ανατροφοδότηση του χρήστη. Οι πιο καλοί χρήστες µπορούν να επιτύχουν ϱυθµούς µεταφοράς των 50 bits το λεπτό σε οφφ-λινε λειτουργία του συστήµατος BCI. Για την επίτευξη παρόµοιων ΗΕΓ ακολουθιών εικονικών κινήσεων, συγκρινόµενων µε πραγ- µατικών, είναι σηµαντικό οι χρήστες του πειράµατος να ϕαντάζονται την εκάστοτε κίνηση µε κιναισθητικό τρόπο. Για να χειριστούν ένα SMR-BCI, οι χρήστες απαιτείται να ϱυθµίζουν το πλάτος των SMR και, οπότε, έχουν στη διάθεση τους διάφορα είδη οπτικής ή ακουστικής ανάδρασης. Σε ένα τυπικό πείραµα, παρουσιάζονται δύο ή περισσότεροι στόχοι σε µία οθόνη, καθώς και ένας κέρσορας, ο οποίος πρέπει να κινηθεί µέσω ϱύθµισης του πλάτους των SMR. Σε πρόσφατη µελέτη µε 4 ασθενείς που πάσχουν από αµυοτροφική πλευρική σκλήρυνση (ALS), αποδείχτηκε ότι η ϱύθµιση των SMR είναι δυνατή, παρόλο τον αξιοσηµείωτο εκφυλισµό εγκεφαλικών και σπονδυλικών κινητικών νευρώνων [2]. Ωστόσο, τα πλάτη των SMR τους είναι πολύ ελαττωµένα σε σύγκριση µε τα αντίστοιχα υγιών ατόµων (ϐλέπε Σχήµα 1.1). ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 4

1.2.2 Αργά δυναµικά στο ϕλοιό του εγκεφάλου Τα αργά δυναµικά στο ϕλοιό του εγκεφάλου (SCP: Slow Cortical Potentials) είναι αργές µεταβολές στα δυναµικά του ΗΕΓ, στις συχνότητες 1-2 Hz, που µπορούν να διαρκούν από 300 msec έως αρκετά δευτερόλεπτα. Μέσω της ανατροφοδότησης των συστηµάτων οι εκπαιδευόµενοι χρήστες µπορούν να µάθουν πώς να ελέγχουν τα SCP στα ΗΕΓ τους µε δική τους πρωτοβουλία. Η παραγωγή µεγάλων ϑετικών και αρνητικών αποκλίσεων στα SCP µε πρωτοβουλία των χρηστών αποτέλεσε µία από τις πρώτες µεθόδους δηµιουργίας σήµατος ελέγχου για ένα σύστηµα BCI. 1.2.2.1 Τα SCP ως σήµα εισόδου σε BCIs συστήµατα (SCP-BCIs) Ενα SCP-BCI σύστηµα απαιτεί από τους χρήστες να επιτύχουν εκούσια ϱύθµιση της εγκε- ϕαλικής τους δραστηριότητας. Ενα από τα τυπικά παραδείγµατα ενός SCP-BCI αποτελεί το S1-S2, το οποίο οδήγησε στη δεκαετία του 60 στον εντοπισµό της CNV (Contingent Negative Variation). Η CNV αποτελείται από µία αρνητική SCP µεταβολή, η οποία ακολουθεί ένα προειδοποιητικό ερέθισµα (S1) δύο µε δέκα δευτερόλεπτα πριν ένα προστακτικό ερέθισµα (S2) που απαιτεί από τους χρήστες την εκτέλεση µιας διεργασίας (π.χ. πάτηµα ενός κουµπιού ή µετακίνηση ενός κέρσορα). Ανάλογα, στο παράδειγµα αυτό, το SCP-BCI παρουσιάζει στους χρήστες ένα υψίσυχνο τόνο (S1) που προειδοποιεί ότι δύο δευτερόλεπτα αργότερα, παράλληλα µε ένα πιο χαµηλό τόνο (S2), ϑα αρχίσει η ανατροφοδότηση των SCP, είτε οπτικά µέσω της µετακίνησης ενός κέρσορα σε µία οθόνη, είτε ακουστικά µέσω ήχων µουσικών οργάνων. Οι χρήστες έχουν σεκάθε περίπτωση δύο διαφορετικές εργασίες να εκτελέσουν, π.χ. τη µετακίνηση του κέρσορα σε ϑέσεις-στόχους στο πάνω ή στο κάτω µέρος της οθόνης, την αύξηση ή τη µείωση της έντασης των ακουστικών µέσων. Για την εκτέλεση τους, οι χρήστες πρέπει να παράγουν ϑετικές και αρνητικές µεταβολές SCP, µε σηµείο αναφοράς µία αρχική τιµή (ϐλέπε Σχήµα 1.2). Οι µεταβολές αυτές πρέπει να είναι πάνω ή κάτω από ένα κατώφλι για την ταξινόµησή τους ως ϑετικές η αρνητικές. Ο µηχανισµός αυτός έχει εφαρµοστεί για να δείξει ότι ασθενείς που πάσχουν από ALS µπορούν µέσω ενός συστήµατος BCI να ελέγξουν ένα συλλαβιστή για να επικοινωνήσουν µε το περιβάλλον τους [19]. 1.2.3 υναµικά σχετιζόµενα µε γεγονότα Τα δυναµικά σχετιζόµενα µε γεγονότα (ERP - Event Related Potentials) είναι ηλεκτρικά δυναµικά στον ϕλοιό του εγκεφάλου, τα οποία µπορούν να µετρηθούν στα ΗΕΓ πριν, κατά τη διάρκεια ή µετά από ένα αισθητικό, κινητικό, ή ψυχολογικό γεγονός - ερέθισµα. Εχουν µία συγκεκριµένη χρονική καθυστέρηση σε σχέση µε το δεδοµένο ερέθισµα και το πλάτος τους είναι συνήθως πολύ µικρότερο από αυτό της παράλληλης ταυτόχρονης ΗΕΓ δραστηριότητας. Τα πλάτη είναι µικρότερα επειδή τα ERP εντοπίζονται κατά κύριο λόγο στις αντίστοιχες πε- ϱιοχές εµφάνισής τους στο ϕλοιό. Εµφανίζονται λιγότερο συχνά από τις αυθόρµητες ΗΕΓ κυµατοµορφές µε παρόµοια µορφή και πλάτος. Για να αποκτηθούν τα ERP συνήθως χρησιµοποιούνται τεχνικές, κατά τις οποίες υπολογίζεται ο µέσος όρος ενός πλήθους σύντοµων σε χρονική διάρκεια τµηµάτων ΗΕΓ, και το αποτέλεσµα αποτελείται από µία σειρά µεγάλων, διφασικών κυµάτων, µε διάρκεια από 500 έως 1000 msec. Επιπλέον, η απεικόνιση σφαλµάτων συνοδεύεται από προκλητά δυναµικά, τα οποία αναφέρονται ως δυναµικά σχετιζόµενα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 5

Σχήµα 1.2: Μέσος όρος των SCP 600 δοκιµών (το πλάτος είναι συνάρτηση του χρόνου). Η γκρι γραµµή δείχνει την πορεία των SCP για τη µετακίνηση του κέρσορα προς το στόχο στο πάνω µέρος της οθόνης, η µαύρη για τη µετακίνηση προς τον αντίστοιχο στο κάτω µέρος. Τα αρνητικά και ϑετικά SCP παρουσιάζουν ϕανερές διαφορές µεταξύ των δύο στόχων. Μεταξύ των S1 και S2 δηµιουργείται µία CNV, που υποδεικνύει ότι ο χρήστης ετοιµάζεται να εκτελέσει τη διεργασία. µε σφάλµατα (ERP: Error-Related Potentials). Αυτές οι αποκλίσεις στο ΗΕΓ µπορούν να χρησιµοποιηθούν για τον εντοπισµό λαθών σε ένα BCI σύστηµα. Τα προκλητά αυτά δυναµικά µπορούν να προσφέρουν στον έλεγχο, όταν η εφαρµογή πα- ϱάγει το κατάλληλο ερέθισµα για το χρήστη (online BCI). Με αυτό τον τρόπο υπάρχει το πλεονέκτηµα ότι απαιτείται από τους χρήστες ένας µικρός χρόνος εκπαίδευσης για να είναι σε ϑέση να κάνουν χρήση του BCI, µε το µειονέκτηµα όµως της καθυστέρησης αναµένοντας την εµφάνιση του κατάλληλου, σε κάθε περίπτωση, ερεθίσµατος, ενώ προσφέρεται δυνατότητα ελέγχου σε σχεδόν όλους τους χρήστες, καθώς τα δυναµικά αυτά αποτελούν αυθόρµητες εγκεφαλικές αποκρίσεις. Στη συνέχεια περιγράφονται η συνιστώσα P300 των ERP, το SSVEP, καθώς επίσης η χρήση τους σε ένα BCI σύστηµα. 1.2.3.1 Η συνιστώσα P300 Η συνιστώσα P300 είναι µία ϑετική απόκλιση στο ΗΕΓ, παρατηρούµενη ως αποτέλεσµα α- κουστικών ή οπτικών ερεθισµάτων, περίπου 300-400 msec µετά την εµφάνιση τους. Μπορεί τυπικά να παρατηρηθεί, όταν από τους χρήστες απαιτείται να προσέξουν ένα σπάνιο σε συχνότητα ερέθισµα-στόχο, ανάµεσα σε µία σειρά από συχνά εµφανιζόµενα ερεθίσµατα. Το πλάτος της ποικίλει συναρτήσει των χαρακτηριστικών της προβλεπόµενης ενέργειας, όπως η δυνατότητα διάκρισης µεταξύ σταθερών, καθιερωµένων ερεθισµάτων και ερεθισµάτων-στόχων, η συνολική πιθανότητα εµφάνισης του ερεθίσµατος-στόχου, η ακολουθία ερεθισµάτων που προηγήθηκε του στόχου, αλλά και η ϑέση του ηλεκτροδίου στο οποίο καταγράφεται. Παρατη- ϱείται περισσότερο σε κεντρικές και πλευρικές περιοχές, και ϑεωρείται ως ένας συσχετισµός µιας διαδικασίας εξάλειψης της µνήµης µικρής διάρκειας όταν καινούργια ερεθίσµατα απαιτούν µία ενηµέρωση των αποκρίσεων. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 6

Σχήµα 1.3: Ο µέσος όρος των ΗΕΓ δεδοµένων στο ηλεκτρόδιο ενός ασθενούς µε ALS, χρησιµοποιώντας έναν 7x7 P300 συλλαβιστή. Η µαύρη γραµµή αναφέρεται στην απόκριση του ΗΕΓ σε 2448 συνήθη ερεθίσµατα και η γκρι γραµµή σε 51 γράµµατα-στόχους (oddball) που πρέπει να επιλεγούν από τον πίνακα, του οποίου οι γραµµές και οι στήλες αναβοσβήνουν. Μία ϑετική απόκλιση ως απόκριση στους στόχους µπορεί να παρατηρηθεί στο χρονικό παράθυρο µεταξύ 200 και 500 msec. 1.2.3.2 Η P300 ως σήµα εισόδου σε BCI (P300-BCIs) Από τα τέλη της δεκαετίας του 80, οι Farewell και Donchin είχαν δείξει ότι η P300 συνιστώσα των ERP µπορεί να χρησιµοποιηθεί για να επιλεγούν αντικείµενα εµφανιζόµενα σε µία οθόνη υπολογιστή [18]. Κατά τη διεξαγωγή του πειράµατος, οι συµµετέχοντες έχουν µπροστά τους µία µήτρα 6x6, όπου καθένα από τα 36 κελιά της περιέχει ένα χαρακτήρα ή ένα σύµβολο. Σύµφωνα µε το συγκεκριµένο σχεδιασµό, κάθε γραµµή και κάθε στήλη της µήτρας αναβοσβήνει για 100 msec µε τυχαία σειρά, ενώ έχει Ϲητηθεί από τους συµµετέχοντες να επιστήσουν την προσοχή τους µόνο σε ένα από τα 36 κελιά. Συνεπώς, σε µια ακολουθία 12 αναβοσβηµάτων (6 γραµµές και 6 στήλες), το στοχευµένο από το χρήστη κελί ϑα έχει αναβοσβήσει µόλις 2 ϕορές, αποτελώντας έτσι ένα σπάνιο ως προς τη συχνότητα εµφάνισης γεγονός, συγκρινόµενο µε τις 10 ϕορές που ϑα αναβοσβήσουν και οι υπόλοιπες γραµµές και στήλες, εξάγοντας έτσι µία P300. Η επιλογή καθορίζεται από τον εντοπισµό της γραµµής και της στήλης που εξάγουν τη µεγαλύτερη P300 συνιστώσα. Το P300-BCI δεν απαιτεί την αυτορρύθµιση των ΗΕΓ από τους χρήστες, αλλά µόνο την ικανότητα να µπορούν να συγκεντρώνουν την προσοχή τους για ένα σηµαντικό χρονικό διάστηµα στο κελί-στόχο. Επιπλέον, τα τελευταία χρόνια έχει δοθεί ιδιαίτερο ενδιαφέρον στη χρήση της P300 ως σήµα εισόδου και ελέγχου των BCI. Σηµαντικές είναι οι ϐελτιώσεις που έχουν επιτευχθεί στον P300 συλλαβιστή (P300 Speller), ο οποίος λειτουργεί µε την ίδια λογική της επιλογής χαρακτήρων που πα- ϱουσιάστηκε στο παραπάνω πείραµα (ϐλέπε Σχήµα 1.3). Με χρήση κατάλληλης κατηγορίας ταξινοµητών, έχει αναφερθεί απευθείας επιλογή 3 χαρακτήρων το λεπτό µε 95 τοις εκατό επιτυχία [9]. Πρόσφατα, εισήχθηκε για πρώτη ϕορά P300-BCI για καθηµερινή χρήση στο οικιακό περιβάλλον ενός ασθενούς (ϐλέπε Σχήµα 1.4). 1.2.3.3 Το οπτικά προκλητό δυναµικό σταθερής κατάστασηςssvep Μετά από ένα οπτικό ερέθισµα, προκλητά δυναµικά µπορούν να καταγραφούν από τον πρωτοταγή οπτικό ϕλοιό στον ινιακό λοβό (O1, O2, Oz σύµφωνα µε το διεθνές 10-20 σύστηµα). ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 7

Σχήµα 1.4: (a) Ενας 6x6 πίνακας ενός P300 συλλαβιστή. Οι γραµµές και οι στήλες ανα- ϐοσβήνουν όπως ϕαίνεται από τη στήλη 3. (b) Οι µέσοι όροι των κυµατοµορφών για κάθε ένα από τα 36 κελιά του πίνακα στο ηλεκτρόδιο Pz. Το γράµµα-στόχος Ο προκάλεσε τη µεγαλύτερη σε πλάτος απόκριση της συνιστώσας P300, ενώ µία µικρότερη απόκριση είναι ϕανερή για άλλους χαρακτήρες (ερεθίσµατα) στη στήλη 3 και στη γραµµή 3, καθώς αυτοί αναβοσβήνουν µαζί µε το γράµµα-στόχο. Κάθε απόκριση είναι ο µέσος όρος που προκύπτει από 30 παρουσιάσεις των ερεθισµάτων. Ενα οπτικά προκλητό δυναµικό γίνεται σταθερό, εάν η συχνότητα εµφάνισης του αντίστοιχου ερεθίσµατος είναι µεγαλύτερη των 6 Hz και χαρακτηρίζεται από µία αύξηση της ΗΕΓ δραστηριότητας στη συχνότητα αυτή. Οταν οι συµµετέχοντες συγκεντρώνουν τη µατιά τους σε ένα στόχο που αναβοσβήνει, το πλάτος του SSVEP αυξάνεται στη ϑεµελιώδη συχνότητα του στόχου, καθώς και στις δεύτερες και τρίτες αρµονικές. Το πλάτος και η ϕάση του SSVEP εξαρτάται από τις παραµέτρους του ερεθίσµατος, όπως η συχνότητα επανάληψής του και οι αντιθέσεις µεταξύ των επαναλήψεων. Ο λόγος της συχνότητας δειγµατοληψίας προς το συνολικό αριθµό δειγµάτων είναι περίπου 0.2 Hz και το εύρος συχνοτήτων στο οποίο το SSVEP µπορεί να εντοπιστεί αξιόπιστα στο διάστηµα µεταξύ 6 και 24 Hz. 1.2.3.4 Το SSVEP ως σήµα εισόδου σε BCI (SSVEP-BCIs) Οπως και το P300-BCI, το SSVEP-BCI απαιτεί µεγάλο ϐαθµό συγκέντρωσης και προσοχής (ειδικά ως προς τη µατιά του χρήστη η οποία πρέπει να είναι σταθερή προς το ερέθισµα) αλλά καµία εκπαίδευση του χρήστη, καθώς η εγκεφαλική απόκριση προκαλείται από εξωτε- ϱικά ερεθίσµατα. Για να προκληθούν τα SSVEP, παρουσιάζονται στόχοι που αναβοσβήνουν µε διαφορετικές συχνότητες είτε σε µία οθόνη ή σε ένα πίνακα µε διόδους που εκπέµπουν ϕως. Σε διάφορα πειράµατα που έχουν διεξαχθεί, ο αριθµός των στόχων κυµαίνεται από 4 έως και 48, ενώ η ακρίβεια ταξινόµησης που έχει επιτευχθεί συχνά ξεπερνά το 90%. Σε ένα SSVEP-BCI 9 στόχων, υγιείς χρήστες συλλάβισαν τον αριθµό του τηλεφώνου και την ηµερο- µηνία γέννησής τους µε ϱυθµό 7.2-11.5 επιλογές το λεπτό (ϱυθµός µεταφοράς δεδοµένων 18.37-27.29 bits/min) (Nielsen (2006)) και σε ένα αντίστοιχο 11 στόχων µε µέση ακρίβεια 83.3% (23.06 bits/min) (Lee (2006)). Η εξάρτηση των SSVEP από την οπτική συγκέντρωση σε ένα συγκεκριµένο στόχο, τα καθιστά ακατάλληλα για χρήση ως σήµατα εισόδου και ελέγχου σε ένα BCI για ασθενείς µε περιορι- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 8

Σχήµα 1.5: Η κορυφή στα 31 Hz που έχει καταγραφεί στο ηλεκτρόδιο της ϑέσης C3, όταν επικεντρώνεται η προσοχή του χρήστη στο ερέθισµα προς τον δεξιό δείκτη, και στα 26 Hz στο C4, όταν επικεντρώνεται στο ερέθισµα προς τον αριστερό. Και οι δύο κορυφές αντικατοπτρίζουν σωστά τις συχνότητες των ερεθισµάτων. σµένη όραση. Ενα BCI ϐασισµένο σε προκλητά δυναµικά τελείως ανεξάρτητα της όρασης, πραγµατοποιήθηκε µε χρήση δονητικών ερεθισµάτων των αριστερών και δεξιών ακροδαχτύλων του χεριού, προκειµένου να διεγερθούν σωµαταισθητικά προκλητά δυναµικά σταθε- ϱής κατάστασης (SSSEP) [15]. Το ΗΕΓ καταγράφεται από κεντρικά ηλεκτρόδια (C3, Cz, C4 σύµφωνα µε το διεθνές 10-20 σύστηµα). Σε κάθε δοκιµή του πειράµατος, οι δείκτες των χεριών των συµµετεχόντων ερεθίζονται ταυτόχρονα µε διαφορετικούς ϱυθµούς, ενώ σε µία οθόνη τόξα παρουσιάζουν σε ποιον από τους δύο δείκτες ϑα πρέπει να δοθεί προσοχή. Η ακρίβεια ταξινόµησης δεν ϐρίσκεται στα ίδια επίπεδα µε την αντίστοιχη ενός SSVEP-BCI, αλλά το SSSEP-BCI µπορεί να αποτελέσει µία εναλλακτική επιλογή για ασθενείς µε σοβαρές διαταραχές στην όρασή τους (ϐλέπε Σχήµα 1.5). 1.3 Στάδια Επεξεργασίας ΗΕΓ Σηµάτων σε ένα BCI Υπάρχουν τρία ϐασικά στάδια εφαρµογής στα υπάρχοντα BCI συστήµατα. Αρχικά, το σύστηµα εφαρµόζει ένα στάδιο προεπεξεργασίας προκειµένου να αφαιρέσει το ϑόρυβο κάθε µορφής και να ενισχύσει το λόγο σήµατος προς ϑόρυβο (SNR). Στη συνέχεια, για να µπορέσει να επιτευχθεί ο έλεγχος ενός BCI, τα νευροφυσιολογικά σήµατα πρέπει να αντιστοιχιστούν σε τιµές χαρακτηριστικών που να επιτρέπουν τη διάκριση µεταξύ των διαφορετικών κατηγοριών των σηµάτων. Συνεπώς, στο επόµενο στάδιο, το σύστηµα εκτελεί την εξαγωγή και επιλογή των χαρακτηριστικών για να µπορέσει να ανιχνεύσει τα συγκεκριµένα πρότυπα-στόχους στην εγκεφαλική δραστηριότητα. Τα πρότυπα αυτά κωδικοποιούν τις νοητικές καταστάσεις του χρήστη, εντοπίζουν µία σχετική µε ένα γεγονός απόκριση ή, ακόµη, αντικατοπτρίζουν τις κινητικές προθέσεις του. Συχνά η διαδικασία αυτή συνοδεύεται από την παράλληλη επιλογή των χαρακτηριστικών εκείνων που ϑα προσφέρουν τη µεγαλύτερη ικανότητα διάκρισης κατά την ταξινόµηση. Ο µετασχηµατισµός των σηµάτων σε τιµές χαρακτηριστικών είναι συνυφασµένος µε το είδος του νευρολογικού µηχανισµού που εφαρµόζει ο χρήστης για να έχει τη δυνατότητα ελέγχου. Για παράδειγµα, εάν ο χρήστης επιθυµεί να ελέγξει την ισχύ των µ και β ϱυθµών του, ϑα πρέπει να υπάρξει εξαγωγή χαρακτηριστικών σχετικών µε την εκτίµηση του ϕάσµατος ισχύος των ϱυθµών αυτών. Το τελευταίο στάδιο στοχεύει στη µετάφραση (ή συσχέτιση) των συγκεκριµένων χαρακτηριστικών σε λογικά σήµατα ελέγχου µίας εξωτερικής διάταξης. Για την υλοποίησή του εφαρµόζονται αλγόριθµοι µηχανικής εκµάθησης, έτσι ώστε το σύστηµα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 9

BCI να εκπαιδευθεί πως να ταξινοµεί τα σήµατα ενός συγκεκριµένου χρήστη από ένα σετ δεδοµένων. Οι περισσότεροι αλγόριθµοι µηχανικής εκπαίδευσης µπορούν να διαιρεθούν σε δύο κατηγορίες, κάθε µία από τις οποίες αντιπροσωπεύεται από τα δύο τελευταία στάδια της επεξεργασίας σήµατος, το στάδιο της εξαγωγής και το στάδιο της ταξινόµησης των χαρακτηριστικών. 1.3.1 Προεπεξεργασία των ΗΕΓ σηµάτων Ο στόχος της προεπεξεργασίας των σηµάτων σε ένα BCI σύστηµα είναι ο µετασχηµατισµός τους µε τρόπο τέτοιο ώστε ο λόγος σήµατος προς ϑόρυβο να µεγιστοποιείται και οπότε να µεγιστοποιείται η πιθανότητα της σωστής αναγνώρισης της εγκεφαλικής κατάστασης. Ενα από τα σηµαντικά προβλήµατα στην αυτόµατη ανάλυση ΗΕΓ είναι η ανίχνευση των διαφόρων ειδών κυµατοµορφών παρεµβολής, που αποτελούν ϑόρυβο, και προστίθενται στα ΗΕΓ σήµατα κατά τη διάρκεια της καταγραφής. Αυτές οι κυµατοµορφές παρεµβολής ή ϑορύβου (artifacts) µπορούν να είναι οποιαδήποτε καταγεγραµµένα ηλεκτρικά δυναµικά που δεν πηγάζουν από τον εγκέφαλο. Υπάρχουν 4 κύριες πηγές εκποµπής τους : Ο εξοπλισµός για την καταγραφή των ΗΕΓ σηµάτων. Η εξωτερική του χρήστη και του συστήµατος καταγραφής ηλεκτρική παρεµβολή. Τα ηλεκτρόδια. Ο ίδιος ο χρήστης : τυπική ηλεκτρική δραστηριότητα από την καρδιά, το ϐλεφάρισµα ή την κίνηση των µατιών και από διάφορους µύες γενικότερα. Στην περίπτωση οπτικής επιθεώρησης, ο ϑόρυβος αυτού του είδους µπορεί εύκολα να α- νιχνευτεί από ειδικούς στην ανάγνωση των ΗΕΓ. Ωστόσο, κατά τη διάρκεια της αυτόµατης ανάλυσης, αυτές οι ακολουθίες σηµάτων προκαλούν σοβαρά λάθη στην ταξινόµηση, µε αποτέλεσµα τον περιορισµό της χρηστικότητας των συστηµάτων αυτών σε κλινικές εφαρµογές. Η αναγνώριση και η απόρριψη του ϑορύβου σε πραγµατικού χρόνου καταγεγραµµένα ΗΕΓ είναι µία περίπλοκη εργασία, αλλά ουσιαστική για την ανάπτυξη πρακτικών συστηµάτων BCI. Ενα από τα είδη ϑορύβου που εξετάζονται είναι αυτός που προκαλείται από το άνοιγµα και κλείσιµο των µατιών, καθώς και από την κίνηση των ϐολβών τους. Μία κίνηση του ϐολβού του µατιού και των ϐλεφαρίδων επιφέρει αλλαγή στο πεδίο δυναµικού, εξαιτίας της υπάρχουσας διαφοράς δυναµικού της τάξης των 100mV µεταξύ του κερατοειδή και του αµφιβληστροειδή χιτώνα. Η αλλαγή αυτή επηρεάζει κυριότερα τα σήµατα που καταγράφονται από τα πιο µετωπικά ηλεκτρόδια (Fp1, Fp2, F3, F4, F7, F8) και επάγουν σε αυτά πολλές υψηλές και χαµηλές συχνότητες, ανάλογα τη χρονική διάρκεια και το πλάτος. Σε µία κλινική εφαρµογή ο ϑόρυβος αυτός απορρίπτεται µε οπτική εξέταση των σηµάτων που έχουν καταγραφεί. Υπάρχουν κάποια απλά κριτήρια για την αναγνώριση του ϑορύβου, που µπορούν να ϐοηθήσουν στο να ϐρεθεί µια κατάλληλη τεχνική για τον απευθείας καθαρισµό του σήµατος, όπως : Μεγάλο πλάτος του δ ϱυθµού (0.5-4 Hz) στα κανάλια των ηλεκτροδίων Fp1 και Fp2. Οµοιότητα των σηµάτων στα κανάλια Fp1 και Fp2. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 10

ραστική εξασθένηση του δ ϱυθµού στα υπόλοιπα κανάλια (το πλάτος του στα Fp1 και Fp2 είναι αρκετά µεγαλύτερο). Στο στάδιο της προεπεξεργασίας για την αποµάκρυνση αυτού του είδους των παρεµβολών ϑορύβου, το σύστηµα µπορεί να αναλύσει τα καταγεγραµµένα εγκεφαλικά σήµατα σε υποχώρους σήµατος και ϑορύβου, χρησιµοποιώντας πρότυπες τεχνικές όπως η ανάλυση σε κύ- ϱιες συνιστώσες (PCA: Principal Component Analysis), η παραγοντική ανάλυση, η ανάλυση σε στατιστικά ανεξάρτητες συνιστώσες-πηγές δραστηριότητας (ICA: Independent Component Analysis), η αποσύνθεση σε µοναδικές τιµές (SVD: Singular Value Decomposition), το µη γραµµικό προσαρµοστικό ϕιλτράρισµα. Στην πραγµατικότητα, έχει εφαρµοστεί επιτυχώς η τεχνική ICA για το διαχωρισµό των ακατέργαστων αρχικών δεδοµένων σε υποχώρους σήµατος ϑορύβου, και τη µετέπειτα εξαγωγή υποσυνόλων µε µεγαλύτερη ακρίβεια ταξινόµησης, σε σχέση µε την αντίστοιχη που ϑα προέκυπτε, αν γινόταν χρήση των αρχικών πρωτότυπων ΗΕΓ σηµάτων. Ωστόσο, ο ϑόρυβος που προκαλείται από την επίδραση κάποιων ϕυσιολογικών αιτίων είναι δύσκολο να αποµακρυνθεί, ειδικά ορισµένη µυϊκή δραστηριότητα που χαρακτη- ϱίζεται από ένα ευρύ ϕάσµα συχνοτήτων, καλύπτει σχεδόν ολόκληρο το εύρος συχνοτήτων ενδιαφέροντος και δεν είναι περιοδική. Μετά την απόρριψη των παρεµβολών ϑορύβου, σηµαντική είναι η επιλογή της κατάλληλης τεχνικής ϕιλτραρίσµατος, συχνοτικού και χωρικού, για τη ϐελτίωση του λόγου σήµατος προς ϑόρυβο στα ΗΕΓ σήµατα που έχουµε στη διάθεσή µας. Η επιλογή αυτή εξαρτάται από πα- ϱάγοντες όπως η τεχνολογία καταγραφής των σηµάτων, ο αριθµός των ηλεκτροδίων και ο µηχανισµός νευρολογικής δραστηριότητας του συστήµατος BCI. Το συχνοτικό ϕιλτράρισµα χρησιµοποιείται για να αφαιρέσει ϑορυβώδη σήµατα όπως αργές µετατοπίσεις και ϑόρυβο γραµµής. Το χωρικό ϕιλτράρισµα συνδυάζει µε γραµµικό τρόπο σήµατα από πολλά ηλεκτρόδια για να επικεντρωθεί στη δραστηριότητα σε µία συγκεκριµένη περιοχή του εγκεφάλου. Χρησιµοποιείται για να µπορούµε να λάβουµε σήµατα που αντιστοιχούν σε συγκεκριµένες πηγές δραστηριότητας και αποκτά ιδιαίτερη σπουδαιότητα, αν το σήµα που µας ενδιαφέρει είναι ασθενές σε σύγκριση µε ισχυρά σήµατα από άλλες πηγές στην ίδια Ϲώνη συχνοτήτων. Μία περίπτωση όπου συναντάµε αυτό το ϕαινόµενο είναι οι SMR ϱυθµοί, οι οποίοι συχνά επικαλύπτονται από τον οπτικό α ϱυθµό. Ενα παράδειγµα χωρικού ϕιλτραρίσµατος είναι η τεχνική ICA που είδαµε παραπάνω. Παρακάτω παρουσιάζονται συνοπτικά δύο τεχνικές χωρικού ϕιλτραρίσµατος : µε µεθόδους αναφοράς των καναλιών και µε κοινές χωρικές ακολουθίες (CSP: Common Spatial Patterns), οι οποίες αποτελούν δύο από τις πιο διαδεδοµένες τεχνικές στη BCI έρευνα. 1.3.1.1 Μέθοδοι αναφοράς των καναλιών Οι µέθοδοι αναφοράς των καναλιών λειτουργούν ως χωρικά ϕίλτρα. Η κατάλληλη επιλογή του χωρικού ϕίλτρου για ένα BCI καθορίζεται από τη ϑέση και την έκταση των σηµάτων (π.χ. του µ-ϱυθµού) και των διάφορων πηγών ϑορύβου προερχόµενου είτε από τα ίδια τα εγκεφαλικά σήµατα ή εκτός αυτών (artifacts). Οι πηγές αυτές δεν είναι απολύτως ορισµένες και διαφέρουν σε µεγάλο ϐαθµό από πείραµα σε πείραµα, τόσο στην περίπτωση ενός συγκεκρι- µένου χρήστη όσο και σε διαφορετικούς µεταξύ τους. Οι πιο κοινές µέθοδοι αναφοράς είναι η µέθοδος κοινού µέσου αναφοράς (CAR), στην οποία τα σήµατα που προκύπτουν λαµβάνονται προσεγγιστικά όταν ο µέσος όλων των καναλιών των γειτονικών ηλεκτροδίων αφαιρείται από κάθε κανάλι ξεχωριστά, και το ϕίλτρο Laplace, στο οποίο τα σήµατα που προκύπτουν ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 11

λαµβάνονται όταν ο µέσος όλων των καναλιών του ΕΕΓ αφαιρείται από κάθε κανάλι ξεχωριστά. Οι µέθοδοι αυτοί χρησιµοποιούν υψιπερατά χωρικά ϕίλτρα και ενισχύσουν την κεντρική δραστηριότητα από τις τοπικές πηγές (π.χ. τους µ και β -ϱυθµούς) και µειώνουν την ευρέως διανεµηµένη δραστηριότητα, συµπεριλαµβανοµένης και αυτής που προκύπτει από απόµακρες πηγές (EMG, κινήσεις των µατιών, οπτικός α ϱυθµός). Αν και µία ακριβής προσέγγιση του ϕίλτρου Laplace από δεδοµένα που δεν έχουν υποστεί καµία επεξεργασία ϑα απαιτούσε τη χρήση πολλών ηλεκτροδίων, πρόσφατες έρευνες έδειξαν ότι οι επιδόσεις αναγνώρισης είναι καλές και µε χρήση µόνο ενός µικρού αριθµού ηλεκτροδίων. Σε αυτή την περίπτωση, ο γραµµικός συνδυασµός των καναλιών που υλοποιούν τη προσέγγιση του ϕίλτρου Laplace είναι πιθανό να προκαλεί έναν επιθυµητό µετασχηµατισµό των σηµάτων για την αναγνώριση διαφορετικών προτύπων στο ΗΕΓ. 1.3.1.2 Η µέθοδος των κοινών χωρικών ακολουθιών Η µέθοδος των κοινών χωρικών ακολουθιών (CSP) είναι µία µέθοδος ενίσχυσης του λόγου σήµατος προς ϑόρυβο, που ανιχνεύει ακολουθίες στο ΗΕΓ ενσωµατώνοντας τη χωρική πληροφορία των σηµάτων τους. Η τεχνική αυτή µας επιτρέπει να καθορίσουµε χωρικά ϕίλτρα που στόχο έχουν τη µεγιστοποίηση της διασποράς των σηµάτων για µία κατάσταση (π.χ. εικονική κίνηση του αριστερού χεριού) και, παράλληλα, την ελαχιστοποίηση της διασποράς των σηµάτων για µία άλλη κατάσταση (εικονική κίνηση του δεξιού χεριού). Λόγω του ότι η διασπορά των σηµάτων που έχουν υποστεί Ϲωνοπερατό ϕιλτράρισµα είναι ίση µε την ισχύ στη µπάντα αυτή, η µέθοδος είναι κατάλληλη για τη διάκριση νοητικών καταστάσεων που χαρακτηρίζονται από ERS/ERD στοιχεία. Ενα ακόµη πλεονέκτηµα της µεθόδου CSP είναι ότι δεν απαιτεί την εκ των προτέρων επιλογή των εξειδικευµένων για κάθε χρήστη Ϲωνών συχνοτήτων. Από την άλλη πλευρά, ένα µειονέκτηµα είναι ότι απαιτεί τη χρήση πολλών ηλεκτροδίων, αλλά µε αντιστάθµισµα τη ϐελτιωµένη απόδοση. Το µεγάλο πρόβληµα στη εφαρµογή της µεθόδου CSP είναι η ευαισθησία της σε παρεµβολές τύπου artifacts. Λόγω του ότι οι µήτρες συνδιασποράς χρησιµοποιούνται ως ϐάση για τον υπολογισµό των χωρικών ϕίλτρων και προσεγγίζονται µε ένα σχετικά µικρό αριθµό από παραδείγµατα, µία µοναδική δοκιµή προσβεβληµένη µε τέτοιου είδους ϑόρυβο, µπορεί να προκαλέσει µεγάλες αλλαγές στα ϕίλτρα. Επιπλέον, λόγω του ότι η CSP ανιχνεύει χωρικές ακολουθίες στα ΗΕΓ, κάθε αλλαγή στις ϑέσεις των ηλεκτροδίων µπορεί να καταστήσει άκυρες οποιεσδήποτε ϐελτιώσεις που επιτεύχθηκαν µε τη µέθοδο αυτή στην ακρίβεια ταξινόµησης. Για το λόγο αυτό, η CSP απαιτεί σχεδόν αυτούσιες ϑέσεις για τα ηλεκτρόδια για όλες τις δοκιµές, γεγονός που είναι δύσκολο να πραγµατοποιηθεί (ϐλέπε Σχήµα 1.6). 1.3.2 Εξαγωγή χαρακτηριστικών Για να παραχθεί το σήµα ελέγχου από το σύστηµα BCI, το επόµενο στάδιο είναι να εξαχθούν τα χαρακτηριστικά του ΗΕΓ, µε µεθοδολογία που ϐασίζεται στους τύπους της νευροφυσιολογικής δραστηριότητας. Η προεπεξεργασία του σήµατος και η εξαγωγή των χαρακτηριστικών είναι δύο συναφείς διαδικασίες και ένας ξεκάθαρος διαχωρισµός µεταξύ τους είναι δύσκολος. Παράλληλος στόχος είναι να µειωθεί ο αριθµός των χαρακτηριστικών και/ή των καναλιών που χρησιµοποιούνται σε ένα δεδοµένο πείραµα, έτσι ώστε δεδοµένα πολύ µεγάλων διαστάσεων ή που εµπεριέχουν πολύ ϑόρυβο να απορρίπτονται. Ιδανικά, τα χαρακτηριστικά που είναι ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 12

Σχήµα 1.6: Φάσµατα ΗΕΓ που αφορούν την εικονική κίνηση του αριστερού (µαύρη γραµ- µή) και του δεξιού χεριού (γκρι γραµµή). Ολα τα διαγράµµατα υπολογίστηκαν από το ίδιο σύνολο δεδοµένων αλλά χρησιµοποιώντας διαφορετικά χωρικά ϕίλτρα (το πρώτο αντιστοιχεί στα δεδοµένα χωρίς καµία επεξεργασία). Η διάκριση µεταξύ των δύο καταστάσεων ποσοτικοποιείται µε την τιµή r2. σηµαντικά και χρήσιµα κατά το στάδιο της ταξινόµησης αναγνωρίζονται και επιλέγονται, ενώ τα υπόλοιπα παραλείπονται. Η εξαγωγή των χαρακτηριστικών αποτελεί τη µεγαλύτερη πρόκληση σε ολόκληρη τη διαδικασία επεξεργασίας σήµατος σε ένα σύστηµα BCI, καθώς επιχειρεί να χαρακτηρίσει µε σθεναρό τρόπο τα προεπεξεργασµένα σήµατα ενδιαφέροντος. Για το λόγο αυτό επιχειρείται εξαγωγή κυρίως χρονικών ή ϕασµατικών χαρακτηριστικών, µε τα πρώτα να παράγονται απευθείας από το σήµα όπως η µέση χρονική πορεία, και τα τελευταία να χαρακτηρίζουν την ισχύ του εγκε- ϕαλικού σήµατος σε διάφορες µπάντες συχνοτήτων. Οι χρονο-ϕασµατικές αναπαραστάσεις (TFRs) συνδυάζουν τόσο χρονικά όσο και ϕασµατικά χαρακτηριστικά περιγράφοντας πως η ισχύς του ϕάσµατος µεταβάλλεται µε το χρόνο. 1.3.2.1 Χρονικές - ϕασµατικές µέθοδοι Ενα σήµα, σαν µία συνάρτηση του χρόνου, µπορεί να ϑεωρείται σαν µία αναπαράσταση µε τέλεια χρονική ανάλυση. Το πλάτος του µετασχηµατισµού Fourier (FT) του σήµατος µπο- ϱεί να ϑεωρηθεί σαν µία αναπαράσταση µε τέλεια ϕασµατική ανάλυση, αλλά χωρίς καµία χρονική πληροφορία. Τα ϕασµατικά χαρακτηριστικά είναι πολύ διαδεδοµένα σε χρήση στην επεξεργασία σήµατος, λόγω της ευκολίας στη χρήση, υπολογιστικής ταχύτητας και δυνατότητας άµεσης ερµηνείας των αποτελεσµάτων που διαθέτουν. Συγκεκριµένα, περίπου το ένα τρίτο των σχεδιασµένων συστηµάτων BCI χρησιµοποιούν χαρακτηριστικά ϕάσµατος ισχύος. Εξαιτίας της µη στάσιµης ϕύσης των ΗΕΓ σηµάτων, αυτά τα χαρακτηριστικά δεν προσφέρουν καµία πληροφόρηση για το τι συµβαίνει στο πεδίο του χρόνου. Συνεπώς, υπήρξε ανάγκη να ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 13

εισαχθούν χρονο-ϕασµατικές αναπαραστάσεις (TFRs) που να αντιστοιχούν ένα µονοδιάστατο σήµα σε µία δισδιάστατη συνάρτηση χρόνου και συχνότητας, για την ανάλυση του µεταβλητού στο χρόνο ϕασµατικού περιεχοµένου των σηµάτων. Εχει αποδειχθεί ότι οι µέθοδοι που χρησιµοποιούν TFR µπορούν να συντελέσουν σε ϐελτιώσεις της απόδοσης σε σύγκριση µε παραδοσιακές µεθόδους που ϐασίζονται στον µετασχηµατισµό Fourier. Οι περισσότε- ϱοι σχεδιασµοί που περιλαµβάνουν TFR µεθόδους χρησιµοποιούν αλγόριθµους εξαγωγής χαρακτηριστικών που ϐασίζονται στο µετασχηµατισµό κυµατιδίου wavelet. Η επιλογή του συγκεκριµένου κυµατιδίου αποτελεί ένα κρίσιµο παράγοντα στην απόκτηση χρήσιµης πλη- ϱοφορίας από τη σχετική ανάλυση. Προγενέστερη γνώση της ϕυσιολογικής δραστηριότητας στον εγκέφαλο µπορεί να προβεί χρήσιµη για τον καθορισµό της κατάλληλης συνάρτησης κυµατιδίου. Η συσχετική TFR (CTFR) είναι µία άλλη µέθοδος χρονο-ϕασµατικής αναπαράστασης, η ο- ποία, εκτός από τη ϕασµατική πληροφορία, προσφέρει πληροφορίες σχετικές µε τις χρονο- ϕασµατικές αλληλεπιδράσεις µεταξύ των συνιστωσών του σήµατος εισόδου. Με την CTFR, τα ΗΕΓ δείγµατα δεν αναλύονται ανεξάρτητα (όπως στην περίπτωση του µετασχηµατισµού Fourier), αλλά η µεταξύ τους σχέση λαµβάνεται εξίσου υπόψη. Ενα µειονέκτηµα της συγκεκριµένης µεθόδου είναι η σχετικά υψηλή ευαισθησία της σε ϑόρυβο. Συνεπώς ϑα πρέπει να επιλεγούν µόνο οι πιο σηµαντικές τιµές της, σε σχέση πάντα µε την ταξινόµηση. 1.3.2.2 Παραµετρικά µοντέλα Οι παραµετρικές προσεγγίσεις υποθέτουν την υπό ανάλυση χρονική ακολουθία ως την έξοδο ενός δεδοµένου γραµµικού µαθηµατικού µοντέλου. Απαιτούν την εκ των προθύστερη επιλογή της δοµής και της τάξης του µοντέλου µηχανισµού παραγωγής σήµατος. Η ϐέλτιστη τάξη µοντέλου εκτιµάται καλύτερα περιορίζοντας την πολυπλοκότητά του. Για ϑορυβώδη σήµατα, αν η τάξη του µοντέλου είναι πολύ υψηλή, ϑα έχουµε ως αποτέλεσµα παραπλανητικές κορυ- ϕές στο ϕάσµα, ενώ αντίθετα, αν η τάξη είναι χαµηλή, το ϕαινόµενο αυτό αποφεύγεται. Για µικρά ΗΕΓ τµήµατα, τα παραµετρικά µοντέλα οδηγούν σε καλύτερη ανάλυση στο χώρο της συχνότητας και µία καλή εκτίµηση του ϕάσµατος. Στην περίπτωση όµως που τα τµήµατα αυτά είναι υπερβολικά µικρά, οι εκτιµήσεις µπορεί να µην αποφέρουν τα αναµενόµενα αποτελέσµατα. Για τα µοντέλα αυτά, δεν υπάρχει ανάγκη για εκ των προτέρων γνώση των πιθανών Ϲωνών συχνοτήτων, καθώς επίσης και για την τοποθέτηση των δεδοµένων σε παρά- ϑυρα προκειµένου να µειωθεί η ϕασµατική διαρροή. Ακόµη, η ανάλυση στη συχνότητα δεν εξαρτάται από τον αριθµό των δεδοµένων που είναι διαθέσιµα. Παρόλα αυτά, η εκτίµηση των παραµέτρων είναι πολύ ευαίσθητη σε παρεµβολές ϑορύβου. Ειδική προσοχή πρέπει να δίνεται στη επιλογή του ϱυθµού δειγµατοληψίας στα παραµετρικά µοντέλα, αφού η υπερδειγµατοληψία των σηµάτων συχνά έχει ως αποτέλεσµα την παρουσία πολύ µικρών διαφορών στο πλάτος µεταξύ συνεχόµενων δειγµάτων. Ως αποτέλεσµα, µοντέλα χαµηλής τάξης παράγουν µικρά σφάλµατα πρόβλεψης, δίνοντας τη λανθασµένη εντύπωση ότι έχει αποκτηθεί ένα επαρκές µοντέλο. Οι ϱυθµοί δειγµατοληψίας που επιβάλλονται από το κριτήριο του Nyquist είναι οι συνιστώµενοι. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 14

1.3.2.3 Χαρακτηριστικά και ιδιότητες Ακόµη και αν η χρήση ϕίλτρων αφαιρεί κάποιο ϑόρυβο, η εγκεφαλική δραστηριότητα στο ϐάθος παραµένει. Εποµένως, όταν εξάγονται τα χαρακτηριστικά, υπάρχει µια µεγάλη ποικιλοµορφία από δοκιµή σε δοκιµή στο πείραµα, και σε κάποιες περιπτώσεις, τα χαρακτηριστικά υπολογίζονται πάνω από ένα µεγάλο αριθµό δειγµάτων, αυξάνοντας έτσι τον SNR. Ενα σηµαντικό χαρακτηριστικό των ΗΕΓ σηµάτων είναι η ισχύς που παρουσιάζουν σε συγκεκριµένες µπάντες συχνοτήτων. Παραδοσιακά, ένα σύστηµα BCI υπολογίζει την ισχύ σε ένα εύρος συχνοτήτων µε τη ϐοήθεια του γρήγορου µετασχηµατισµού Fourier (FFT), τη χρήση Ϲωνοπερατών ϕίλτρων και τετραγωνισµού, ή µε την αυτοπαλινδροµική ϕασµατική ανάλυση. Ωστόσο, αυτές οι τεχνικές απαιτούν την προεπιλογή των καλύτερων προς διάκριση Ϲωνών συχνοτήτων για κάθε χρήστη. Προς αποφυγή αυτής της δυσκολίας, οι ερευνητές έχουν αναπτύξει προσαρµοστικές παραµέτρους αυτοπαλινδρόµησης (AAR) που αντιπροσωπεύουν όλο το ϕάσµα. Σε αντίθεση µε την ισχύ ενός εύρους συχνοτήτων που απαιτεί τουλάχιστον δύο παραµέτρους, την ανώτερη και την κατώτερη συχνότητα άκρου, το AAR µοντέλο απαιτεί µόνο µία. Οπως αναφέρθηκε, µία µεγάλη ποικιλία από χαρακτηριστικά έχουν χρησιµοποιηθεί για τη σχεδίαση των BCI συστηµάτων, όπως είναι οι τιµές του πλάτους των ΗΕΓ σηµάτων, η ισχύς σε διάφορες µπάντες συχνοτήτων, οι τιµές της πυκνότητας ϕάσµατος ισχύος, οι παράµετροι µοντέλων αυτοπαλινδρόµησης (AR) και προσαρµοστικής αυτοπαλινδρόµησης (AAR), τα χαρακτηριστικά χρόνου-συχνότητας και τα χαρακτηριστικά ϐασισµένα στο αντίστροφο µοντέλο. Οσον αφορά στο σχεδιασµό ενός BCI συστήµατος, κάποιες από τις πλέον σηµαντικές ιδιότητες αυτών των χαρακτηριστικών που πρέπει να ληφθούν υπόψη είναι οι ακόλουθες : Θόρυβος και ακραίες τιµές : τα χαρακτηριστικά των BCI είναι ϑορυβώδη ή εµπεριέχουν ακραίες τιµές γιατί τα σήµατα ΗΕΓ έχουν χαµηλό SNR. Υψηλή διαστατικότητα : στα συστήµατα BCI, τα διανύσµατα χαρακτηριστικών έχουν συχνά µεγάλες διαστάσεις. Μεγάλος αριθµός χαρακτηριστικών εξάγεται από πολλά κανάλια και από πολλά χρονικά κοµµάτια πριν ενωθούν όλα σε ένα µοναδικό διάνυσµα χαρακτηριστικών. Χρονική πληροφορία : τα χαρακτηριστικά των BCI πρέπει να εµπεριέχουν χρονική πληροφορία καθώς οι ακολουθίες εγκεφαλικής δραστηριότητας είναι συσχετισµένες µε συγκεκριµένες διαφοροποιήσεις στο χρόνο στα ΗΕΓ σήµατα. Μη στασιµότητα : τα χαρακτηριστικά των συστηµάτων BCI είναι µη στάσιµα καθώς τα ΗΕΓ σήµατα µπορεί να αλλάζουν µε υψηλό ϱυθµό µέσα στο χρόνο και ειδικά µεταξύ των πειραµάτων. Μικρά σύνολα δεδοµένων εκπαίδευσης : τα σύνολα εκπαίδευσης είναι µικρά σε αριθµό, καθώς η διαδικασία εκπαίδευσης είναι χρονοβόρα και απαιτητική για τα υποκείµενα. Οι περισσότερες ακολουθίες εγκεφαλικής δραστηριότητας που χρησιµοποιούνται για να ε- λεγχθούν τα BCI συστήµατα, είναι συσχετισµένες µε συγκεκριµένες διαφοροποιήσεις στο χρόνο στα ΗΕΓ σήµατα, πιθανώς σε συγκεκριµένες µπάντες συχνοτήτων. Συνεπώς, η χρονική εξέλιξη των ΗΕΓ σηµάτων πρέπει να λαµβάνεται υπόψη κατά τη διάρκεια της εξαγωγής χαρακτηριστικών. Για τη χρήση της χρονικής αυτής πληροφορίας έχουν προταθεί οι παρακάτω προσεγγίσεις : ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 15

Συνένωση των χαρακτηριστικών από διάφορα χρονικά κοµµάτια : έγκειται στην εξαγωγή χαρακτηριστικών από αρκετά χρονικά κοµµάτια διαφορετικά µεταξύ τους, και η συνένωσή τους σε ένα µοναδικό διάνυσµα χαρακτηριστικών. Η προσέγγιση αυτή είναι η πιο διαδεδοµένη, γεγονός που εξηγεί γιατί τα διανύσµατα χαρακτηριστικών είναι συχνά µεγάλων διαστάσεων. Συνδυασµός ταξινοµήσεων σε διαφορετικά χρονικά κοµµάτια : έγκειται στην εκτέλεση των ϐηµάτων της εξαγωγής χαρακτηριστικών και ταξινόµησης σε διάφορα χρονικά τµή- µατα και µετά στο συνδυασµό των αποτελεσµάτων των διάφορων ταξινοµητών. υναµική ταξινόµηση : έγκειται στην εξαγωγή χαρακτηριστικών από διάφορα χρονικά τµήµατα για την κατασκευή µιας χρονικής ακολουθίας από διανύσµατα χαρακτηριστικών. Αυτή η ακολουθία µπορεί να ταξινοµηθεί χρησιµοποιώντας ένα δυναµικό ταξινο- µητή. Γενικά, οι µέθοδοι προεπεξεργασίας δεν εισάγουν κάποια χρονικά καθυστέρηση, σε αντίθεση µε τις µεθόδους εξαγωγής χαρακτηριστικών που χρησιµοποιούν ένα κυλιόµενο παράθυρο, για να ληφθεί υπόψη η µη στασιµότητα των δεδοµένων. Η µη στασιµότητα των εγκεφαλικών σηµάτων που καταγράφονται µπορεί να οφείλεται, για παράδειγµα, στις διαφορετικές νοητικές καταστάσεις η τα διαφορετικά επίπεδα κούρασης του χρήστη, από τον οποίο καταγράφονται τα εγκεφαλικά σήµατα. Μία λύση στο πρόβληµα είναι η επιλογή χαρακτηριστικών αµετάβλητων ως προς τις µη στασι- µότητες, ενώ µία άλλη ϑα ήταν η συνεχόµενη προσαρµογή του ταξινοµητή κατά τη διάρκεια του πειράµατος, για να αντισταθµίσει τις αλλαγές στις στατιστικές των σηµάτων. Το µέγεθος του παραθύρου καθορίζει τη χρονική καθυστέρηση. Ενα µεγάλο παράθυρο επιτρέπει µόνο αργές αλλαγές, ενώ ένα µικρό παράθυρο είναι γρήγορο, αλλά µε κόστος την ακρίβεια των χαρακτηριστικών που εξάγονται. Ο στόχος είναι να υπάρξει η ϐέλτιστη ανταλλαγή µεταξύ ταχύτητας και ακρίβειας. Η τυπική υπολογιστική πολυπλοκότητα µιας προσέγγισης κυλιό- µενου παραθύρου µε µέγεθος Ν είναι Ο(Ν) για κάθε ϐήµα ενηµέρωσης. Μία εξαίρεση είναι η προσαρµοστική εκτίµηση, που ενηµερώνει την προηγούµενη εκτίµηση µε το καινούργιο δείγµα µόνο και έτσι διατηρεί την πολυπλοκότητα σε Ο(1) για κάθε ϐήµα ενηµέρωσης. Οι µέθοδοι κατακερµάτισης µειώνουν επίσης το υπολογιστικό κόστος, αλλά εκτιµούν τα χαρακτηριστικά µε χαµηλότερο ϱυθµό δεδοµένων, περιορίζοντας έτσι και την ανάλυση στο χρόνο. Συνεπώς, οι προσαρµοστικοί µέθοδοι προτιµούνται σε σχέση µε τις προσεγγίσεις κυλιόµενου παραθύρου και κατακερµάτισης, που επιπλέον κατανέµουν τις υπολογιστικές ανάγκες πιο οµοιόµορφα, πλεονέκτηµα για τη χρήση τους σε εφαρµογές BCI πραγµατικού χρόνου. 1.3.3 Επιλογή των χαρακτηριστικών Τα χαρακτηριστικά µπορούν να εξάγονται στο χρόνο, στο χώρο ή στη συχνότητα. Με αυτή τη λογική, συνήθως παράγεται ένα µεγάλο πλήθος χαρακτηριστικών, τα οποία πρέπει να αξιολογηθούν από τη µονάδα επεξεργασίας του συστήµατος και να επιλεγούν κάποια από αυτά, έτσι ώστε να διατηρηθεί ένας λογικός χρόνος εκπαίδευσης του χρήστη και να διευκολυνθεί η διαδικασία εκπαίδευσης του ταξινοµητή. Οι αλγόριθµοι επιλογής χαρακτηριστικών που χρησιµοποιούνται στο σχεδιασµό BCI συστη- µάτων έχουν ως στόχο να ϐρουν τα χαρακτηριστικά εκείνα που εµπεριέχουν τις πιο χρήσιµες ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 16

πληροφορίες σχετικά µε την ταξινόµησή τους. Το γεγονός αυτό είναι ιδιαίτερα σηµαντικό για συστήµατα BCI µε δεδοµένα εισόδου µεγάλων διαστάσεων, καθώς έτσι ελαττώνονται οι διαστάσεις του χώρου χαρακτηριστικών. Με τον τρόπο αυτό ελαττώνεται η πολυπλοκότητα του προβλήµατος της ταξινόµησης και υπάρχει η δυνατότητα επιτυχίας υψηλότερης ακρίβειας κατά τη διεξαγωγή της. Σχετικές πειραµατικές διαδικασίες έχουν αποδείξει ότι η ακρίβεια ταξινόµησης είναι καλύτερη όταν χρησιµοποιούµε αλγόριθµους επιλογής χαρακτηριστικών, από όταν όλα τα χαρακτηριστικά ϑέτονται προς ταξινόµηση [11]. Η Ανάλυση των Κύριων Συνιστωσών (PCA: Principal Component Analysis) και οι Γενετικοί Αλγόριθµοι (GA: Genetic Algorithms) είναι δύο από τις πιο διαδεδοµένες µεθόδους επιλογής χαρακτηριστικών ή/και µείωσης της διαστατικότητας στα BCI. 1.3.3.1 Ανάλυση Κύριων Συνιστωσών Οπως είδαµε, η τεχνική της ανάλυσης των κύριων συνιστωσών (PCA: Principal Component Analysis χρησιµοποιείται ευρέως κατά το στάδιο της προεπεξεργασίας των σηµάτων, για την αποµάκρυνση παρεµβολών τύπου artifacts από τα ΗΕΓ σήµατα. Πρόκειται για ένα γραµ- µικό µετασχηµατισµό που µπορεί να χρησιµοποιηθεί για την µείωση της διαστατικότητας σε ένα σετ δεδοµένων, συγκρατώντας παράλληλα τα χαρακτηριστικά του σετ που συνεισφέρουν περισσότερο στη διασπορά του, λαµβάνοντας υπόψη τις χαµηλής τάξης κύριες συνιστώσες και αγνοώντας τις αντίστοιχες υψηλότερης. Τέτοιες χαµηλής τάξης συνιστώσες συνήθως εµπεριέχουν τις πιο ουσιαστικές πληροφορίες των δεδοµένων. Η PCA διακρίνεται ως ο ϐέλτιστος γραµµικός µετασχηµατισµός για τη συγκράτηση του υποχώρου που παρουσιάζει τη µεγαλύτερη διασπορά. Εχει τη δυνατότητα να ϐρίσκει µόνο γραµµικούς υποχώρους, δουλεύει καλύτερα αν οι συνιστώσες παρουσιάζουν κανονικές κατανοµές και δεν ϐελτιστοποιείται για διαχωρισµό των κλάσεων. 1.3.3.2 Γενετικοί Αλγόριθµοι Σε αντίθεση µε την PCA, οι Γενετικοί Αλγόριθµοι (GAs: Genetic Algorithms) είναι τεχνικές αναζήτησης στο χώρο του προβλήµατος. Οι GAs συνήθως διατηρούν ένα σταθερού µεγέθους πληθυσµό δειγµάτων στο χώρο µέσα στον οποίο ϑα γίνει η αναζήτηση. Κάθε δείγµα αξιολογείται από τη συνολική καταλληλότητά του σε σχέση µε το δεδοµένο πεδίο εφαρµογής. Νέα δείγµατα στο χώρο αναζήτησης παράγονται µε τη δηµιουργία απογόνων από δείγµατα υψηλής απόδοσης που επιλέγονται από τους αλγόριθµους και διατηρούν πολλά από τα χαρακτηριστικά των προγόνων τους. Με συνεχείς επαναλήψεις τελικά οδηγούµαστε σε ένα πληθυσµό του οποίου η καταλληλότητα ως προς το δεδοµένο στόχο είναι υψηλότερη. Οι γενετικοί αλγόριθµοι παρουσιάζονται ως πολύ πιο αποδοτικοί από ένα µεγάλο αριθµό τυχαίων και τοπικών µεθόδων αναζήτησης. Το γεγονός αυτό οφείλεται στη δυνατότητά τους να εκµεταλλεύονται τη συσσωρευµένη πληροφορία γύρω από έναν αρχικά άγνωστο χώρο αναζήτησης, προκειµένου να επιφέρουν ανάλογη αναζήτηση σε πιο υποσχόµενους, ως προς την απόδοση των δειγµάτων τους, υποχώρους. Ενα σηµαντικό ϐήµα για την ανάπτυξη µίας αναζήτησης ϐασισµένης σε γενετικό αλγόριθµο είναι ο ορισµός µίας κατάλληλης συνάρτησης καταλληλότητας. Μια ιδανική συνάρτηση καταλληλότητας συσχετίζεται άµεσα µε το στόχο του αλγόριθµου, ενώ παράλληλα µπορεί να υπολογιστεί µε ταχύτητα. Η ταχύτητα εκτέλεσης της συνάρτησης παίζει σπουδαίο ϱόλο, καθώς ένας τυπικός γενετικός αλγόριθµος πρέπει να ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 17

επαναληφθεί πολλές ϕορές για να δώσει ένα χρήσιµο αποτέλεσµα σε ένα δεδοµένο πρόβληµα. Ο ορισµός της συνάρτησης καταλληλότητας είναι σε πολλές περιπτώσεις δοσµένος µε έµµεσο τρόπο και συχνά εκτελείται επαναληπτικά, αν οι λύσεις που παρέχονται από το γενετικό αλγόριθµο δεν είναι οι επιθυµητές. 1.3.4 Ταξινόµηση των χαρακτηριστικών Για να επιτευχθεί ο έλεγχος ενός συστήµατος BCI, ο χρήστης πρέπει να παράγει διαφορετικές ακολουθίες εγκεφαλικής δραστηριότητας που ϑα αναγνωρίζονται από το σύστηµα και ϑα µεταφράζονται σε σήµατα ελέγχου. Στα περισσότερα υπάρχοντα BCI συστήµατα, η αναγνώριση ϐασίζεται σε έναν αλγόριθµο ταξινόµησης, ο οποίος στοχεύει στην αυτόµατη προσέγγιση της κλάσης των δεδοµένων που εκπροσωπούνται από ένα διάνυσµα χαρακτηριστικών. Ο κύριος στόχος του ταξινοµητή είναι να αντιστοιχήσει τα χαρακτηριστικά που έχουν εξαχθεί σε λογικά σήµατα ελέγχου. Η διαδικασία επιλογής του πιο κατάλληλου ταξινοµητή είναι άµεσα συσχετισµένη µε τα χαρακτηριστικά που χρησιµοποιούνται, τις ιδιότητες τους και πως αυτές χρησιµοποιούνται. Επιπλέον, για να επιλεχθεί ο πιο κατάλληλος ταξινοµητής για ένα δεδοµένο σετ χαρακτηριστικών, οι ιδιότητες των διαθέσιµων ταξινοµητών πρέπει να είναι γνωστές. ιάφοροι ορισµοί χρησιµοποιούνται συχνά για να περιγράψουν τα διαφορετικά είδη των ταξινοµητών µερικοί εκ των οποίων δίνονται στη συνέχεια : Παραγωγικοί - ιακριτικοί : Οι παραγωγικοί ταξινοµητές µαθαίνουν τα µοντέλα των κλάσεων. Για να ταξινοµήσουν ένα διάνυσµα χαρακτηριστικών υπολογίζουν την πιθανότητα της κάθε κλάσης και επιλέγουν αυτή µε τη µεγαλύτερη. Οι διακριτικοί αλγόριθµοι, όπως οι µηχανές διανυσµάτων υποστήριξης (SVM: Support Vector Machines) µα- ϑαίνουν µόνο τον τρόπο να διακρίνουν τις κλάσεις ή τις ιδιότητες των κλάσεων µεταξύ τους, για την άµεση ταξινόµηση του διανύσµατος χαρακτηριστικών. Στατικοί - υναµικοί : Οι στατικοί ταξινοµητές, όπως τα perceptrons πολλών επιπέδων, δεν µπορούν να λάβουν υπόψη τους χρονική πληροφορία κατά τη διάρκεια της ταξινόµησης, καθώς ταξινοµούν ένα µοναδικό διάνυσµα χαρακτηριστικών. Σε αντίθεση, οι δυναµικοί ταξινοµητές µπορούν να ταξινοµούν µία ακολουθία από διανύσµατα χαρακτηριστικών και να αντιλαµβάνονται τη χρονική δυναµική του συστήµατος. Ευσταθείς - Ασταθείς : Οι ευσταθείς ταξινοµητές, όπως η γραµµική διακριτική ανάλυση (LDA), έχουν χαµηλή πολυπλοκότητα. Θεωρούνται ευσταθείς, καθώς µικρές διαφο- ϱοποιήσεις στο σύνολο εκπαίδευσης δεν είναι σε ϑέση να επηρεάσουν ουσιαστικά την απόδοσή τους. Αντίθετα, οι ασταθείς ταξινοµητές, όπως τα περςεπτρονς πολλών επιπέδων, έχουν υψηλή πολυπλοκότητα και οι ίδιες αλλαγές µπορούν να έχουν σηµαντική επίδραση στην απόδοση. Κανονικοποιηµένοι : Η κανονικοποίηση έγκειται στον προσεκτικό έλεγχο της πολυπλοκότητας του ταξινοµητή προκειµένου να αποτραπεί η υπερεκπαίδευσή του. Ενας κανονικοποιηµένος ταξινοµητής παρουσιάζει καλές αποδόσεις σε περίπτωση γενίκευσης και είναι πιο σθεναρός σε ακραίες τιµές. Καθώς πραγµατοποιείται µια διαδικασία αναγνώρισης ακολουθιών, οι ταξινοµητές µπορεί να αντιµετωπίζουν σοβαρά προβλήµατα σχετικά µε ιδιότητες των χαρακτηριστικών όπως οι ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 18

ακραίες τιµές και η υπερεκπαίδευση. Συγκεκριµένα για τα BCI συστήµατα, δύο σηµαντικά προβλήµατα πρέπει να υπογραµµιστούν : η µεγάλη διαστατικότητα των δεδοµένων και η ανταλλαγή µεταξύ απόκλισης και διασποράς. Ο όγκος της πληροφορίας που απαιτείται για να περιγραφούν κατάλληλα οι διάφορες κλάσεις αυξάνεται εκθετικά µε τη διαστατικότητα των διανυσµάτων χαρακτηριστικών. Στην πραγµατικότητα, αν ο αριθµός των δεδοµένων εκπαίδευσης είναι µικρός σε σύγκριση µε το µέγεθος των διανυσµάτων χαρακτηριστικών, ο ταξινοµητής είναι πιο πιθανό να έχει χαµηλή απόδοση. Σε αυτές τις περιπτώσεις είναι προτιµότερο να χρησιµοποιούνται τουλάχιστον 5 µε 10 ϕορές περισσότερα δείγµατα εκπαίδευσης για κάθε κλάση σε σχέση µε τη διάσταση του διανύσµατος. υστυχώς, αυτό δεν µπορεί να συµβεί σε όλα τα συστήµατα BCI καθώς, συνήθως, η διαστατικότητα είναι υψηλή και το σύνολο εκπαίδευσης µικρό, δηµιουργώντας µε αυτό τον τρόπο ένα άλλο σοβαρό πρόβληµα, αυτό της υπερπροσαρµογής (overfitting) στους αλγό- ϱιθµους µηχανικής εκπαίδευσης. Στο σχεδιασµό ενός συστήµατος BCI, ένας αλγόριθµος µηχανικής εκπαίδευσης εκπαιδεύεται µε ϐάση κάποιο σύνολο δεδοµένων και ϑεωρείται ότι ϑα ϕτάσει σε µία κατάσταση όπου ϑα µπορεί να είναι σε ϑέση να προβλέπει τη σωστή έξοδο για άλλα παραδείγµατα, γενικεύοντας έτσι σε καταστάσεις που δεν παρουσιάζονται κατά τη διάρκεια της εκπαίδευσης. Ειδικά σε περιπτώσεις όπως αυτές που παρουσιάζονται σε πολλά συστήµατα BCI, στις οποίες τα δεδοµένα εκπαίδευσης είναι ελάχιστα και τα διανύσµατα χαρακτηριστικών πολύ µεγάλα, ο αλγόριθµος µπορεί να προσαρµόζεται σύµφωνα µε διάφορα τυχαία χαρακτηριστικά των δεδοµένων εκπαίδευσης που δεν έχουν καµία συνάφεια µε τη συνάρτηση στόχου. Ενα πρότυπο ταξινόµησης που υποφέρει από το ϕαινόµενο της υπερπροσαρµογής έχει στις περισσότερες περιπτώσεις χαµηλή απόδοση πρόβλεψης. Τυπικά, η ταξινόµηση αποτελείται από τον εντοπισµό της σωστής ετικέτας y ενός διανύσµατος χαρακτηριστικών x χρησιµοποιώντας µία αντιστοίχηση f. Αυτή η αντιστοίχιση καθορίζεται από ένα σύνολο εκπαίδευσης T. Η ϐέλτιστη αντιστοίχηση f που έχει δώσει τις σωστές ετικέτες στα δεδοµένα είναι προφανώς άγνωστη. Οι τρεις πιθανές πηγές σφαλµάτων ταξινόµησης είναι : Ο ϑόρυβος µέσα στο ίδιο το σύστηµα, ένα σφάλµα µου δεν µπορεί να υποστεί µείωση. Η απόκλιση µεταξύ της επιλεγµένης και της ϐέλτιστης αντιστοίχησης, που συνεπώς ϐασίζεται στη µέθοδο που έχει επιλεγεί για να ϐρεθεί η f. Η διασπορά, η οποία αντικατοπτρίζει την ευαισθησία στο σύνολο εκπαίδευσης T που χρησιµοποιήθηκε. Για να επιτευχθεί το χαµηλότερο δυνατό σφάλµα ταξινόµησης, τόσο η απόκλιση όσο και η διασπορά πρέπει να έχουν χαµηλές τιµές. Στην πραγµατικότητα όµως υπάρχει µία ϕυσική ανταλλαγή µεταξύ των δύο. Οι ευσταθείς ταξινοµητές τείνουν να εµφανίζουν µεγάλη απόκλιση και µικρή διασπορά, ενώ οι ασταθείς µικρή απόκλιση και µεγάλη διασπορά. Αυτό εξηγεί γιατί κάποιοι απλοί ταξινοµητές σε πολλές περιπτώσεις παρουσιάζουν καλύτερες επιδόσεις από κάποιους πιο σύνθετους. Υπάρχουν διάφορες τεχνικές που χρησιµοποιούνται για µείωση της διασποράς γνωστές ως τεχνικές σταθεροποίησης, όπως ο συνδυασµός ταξινοµητών και η κανονικοποίηση. Τα ΗΕΓ σήµατα είναι ήδη γνωστό ότι δεν είναι στάσιµα, καθώς τα σύνολα δεδοµένων εκπαίδευσης που προέρχονται από διαφορετικές χρονικές περιόδους είναι πιθανό να παρουσιάζουν διαφοροποιήσεις. Συνεπώς, η εξασφάλιση µικρής διασποράς µπορεί να ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 19

αποτελέσει λύση στο πρόβληµα της µεταβλητότητας των συστηµάτων BCI. Οι δηµοφιλέστεροι ταξινοµητές καθώς και οι σηµαντικότερες ιδιότητες τους σε σχέση µε τις BCI εφαρµογές περιγράφονται συνοπτικά στη συνέχεια. 1.3.4.1 Γραµµικοί ταξινοµητές Οι γραµµικοί ταξινοµητές είναι αλγόριθµοι που χρησιµοποιούν γραµµικές συναρτήσεις για να διαχωρίζουν τις κλάσεις. Αποτελούν τους δηµοφιλέστερους αλγόριθµους ταξινόµησης για BCI εφαρµογές. ύο είναι οι πλέον σπουδαιότεροι που περιγράφονται συνοπτικά στη συνέχεια, η γραµµική διακριτική ανάλυση και η µηχανές διανυσµάτων υποστήριξης. Γραµµική ιακριτική ( ιαχωριστική) Ανάλυση : Ο στόχος της Γραµµικής ιαχωριστικής Α- νάλυσης (LDA: Linear Discriminant Analysis ή Fisher As LDA) είναι να χρησιµοποιεί υπερεπίπεδα για να διαχωρίζει τα δεδοµένα που εκπροσωπούν τις διάφορες κλάσεις. Για ένα πρόβληµα 2 κλάσεων, η κλάση ενός διανύσµατος χαρακτηριστικών ϑα εξαρτάται από την πλευρά του υπερεπίπεδου στην οποία ϑα ϐρίσκεται το διάνυσµα. Η LDA υποθέτει κανονική κατανοµή των δεδοµένων, µε ίσες µήτρες συνδιασποράς και για τις δύο κλάσεις. Το διαχωριστικό υπερεπίπεδο ϐρίσκεται εντοπίζοντας την προβολή που µεγιστοποιεί την απόσταση µεταξύ των µέσων τιµών των δύο κλάσεων και ελαχιστοποιεί τη διασπορά στο εσωτερικό τους. Για την επίλυση ενός προβλήµατος N κλάσεων (N > 2) χρησιµοποιούνται περισσότερα υπε- ϱεπίπεδα και η στρατηγική που ακολουθείται έχει ως στόχο το διαχωρισµό της κάθε κλάσης από τις υπόλοιπες. Η τεχνική LDA έχει χαµηλές υπολογιστικές απαιτήσεις, οπότε κρίνεται κατάλληλη προς χρήση σε on-line BCI συστήµατα. Ο ταξινοµητής είναι απλός στη χρήση και γενικά προσφέρει καλά αποτελέσµατα. Εχει εφαρµοστεί επιτυχώς σε πολλά BCI συστήµατα, όπως για παράδειγµα σε BCI εικονικής κίνησης, συλλαβιστές P300, ασύγχρονα και πολλών κλάσεων BCI. Το σηµαντικό µειονέκτηµα της LDA είναι η γραµµικότητα που µπορεί να οδηγήσει σε χαµηλής απόδοσης αποτελέσµατα σε σύνθετα, µη γραµµικά, ΗΕΓ δεδοµένα. Η κανονικοποιηµένη LDA ή Fisher (RFLDA) έχει επίσης εφαρµοστεί κατά το σχεδιασµό συστηµάτων BCI. Αυτός ο ταξινοµητής εισάγει µία παράµετρο κανονικοποίησης C που µπορεί να επιτρέπει ή να αποτρέπει σφάλµατα ταξινόµησης στο σύνολο δεδοµένων εκπαίδευσης. Ο ταξινοµητής που προκύπτει µπορεί να αντιµετωπίσει τις ακραίες τιµές και να επιτύχει καλύτερες δυνατότητες γενίκευσης. Καθώς οι ακραίες τιµές είναι ένα συχνό ϕαινόµενο στα ΗΕΓ δεδοµένα, η κανονικοποιηµένη αυτή µορφή της LDA µπορεί να δώσει καλύτερα αποτελέσµατα για ένα BCI. 1.3.4.2 Νευρωνικά δίκτυα Τα νευρωνικά δίκτυα (ΝΝ) είναι, µαζί µε τους γραµµικούς ταξινοµητές, η κατηγορία των ταξινοµητών που χρησιµοποιείται περισσότερο στην έρευνα των BCI συστηµάτων. Ενα νευ- ϱωνικό δίκτυο είναι µία συλλογή τεχνητών νευρώνων που µας επιτρέπουν τη δηµιουργία µη γραµµικών κατωφλίων αποφάσεων. Υπάρχουν πολλές αρχιτεκτονικές νευρωνικών δικτύων που εφαρµόζονται µε καλές αποδόσεις ταξινόµησης σε BCI συστήµατα. Στη συνέχεια περιγράφουµε περιληπτικά κάποιες από τις σπουδαιότερες. Perceptron πολλών επιπέδων ( Multilayer Perceptron-MLP): Το πιο διαδεδοµένο νευρωνικό δίκτυο σε εφαρµογές BCI είναι το MLP. Αποτελείται από πολλά επίπεδα νευρώνων : ένα επί- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 20

πεδο εισόδου, ένα ή περισσότερα κρυφά επίπεδα και ένα επίπεδο εξόδου. Η είσοδος κάθε νευρώνα συνδέεται µε την έξοδο των νευρώνων του προηγούµενου επιπέδου, ενώ οι νευρώνες του επιπέδου εξόδου καθορίζουν την κλάση του διανύσµατος χαρακτηριστικών στην είσοδο. Τα νευρωνικά δίκτυα, οπότε και τα MLP είναι καθολικοί εκτιµητές, δηλαδή όταν αποτελούνται από κατάλληλο αριθµό νευρώνων και επιπέδων, µπορούν να εκτιµήσουν οποιαδήποτε συνεχή συνάρτηση. Αν συνυπολογίσουµε το γεγονός ότι µπορούν να ταξινοµήσουν µε οποιοδήποτε αριθµό κλάσεων, τα νευρωνικά δίκτυα παρουσιάζονται ως πολύ ευέλικτοι ταξινοµητές που µπορούν να προσαρµοστούν σε µεγάλη ποικιλία προβληµάτων. Τα MLP ως τα πιο διαδεδοµένα, έχουν εφαρµοστεί σε πολλά προβλήµατα δύο ή πολλών κλάσεων, σύγχρονων ή ασύγχρονων BCI. Παρόλα αυτά, το γεγονός ότι αποτελούν καθολικούς ταξινοµητές τους κάνει ευαίσθητους στην υπερεκπαίδευση, ειδικά µε τόσο ϑορυβώδη και µη στάσιµα δεδοµένα όπως αυτά που προκύπτουν από ΗΕΓ. Για το λόγο αυτό απαιτείται προσεκτική επιλογή αρχιτεκτονικής και κανονικοποίηση. Ενα Perceptron πολλών επιπέδων χωρίς ενδιάµεσα κρυφά επίπεδα είναι γνωστό ως απλό Perceptron και είναι ισοδύναµο µε τον αλγόριθµο LDA. Σε πολλές περιπτώσεις, επιχειρώντας ένα αλγόριθµο PCA τρέχοντας παράλληλα την ταξινόµηση µε ένα Perceptron, δίνουµε διαφορετικά ϐάρη στα χαρακτηριστικά εισόδου του ταξινοµητή και µπορούµε να λάβουµε καλύτερα αποτελέσµατα, καθώς πετυχαίνεται απλοποίηση της εκπαίδευσης του υπόλοιπου συστήµατος. Ταξινοµητής Gauss: Μία αρχιτεκτονική νευρωνικού δικτύου που έχει δηµιουργηθεί ειδικά για εφαρµογές BCI είναι ο Γκαουσιανός ταξινοµητής. Κάθε κοµµάτι του νευρωνικού αυτού δικτύου είναι µία Γκαουσιανή συνάρτηση διάκρισης που αντιπροσωπεύει ένα πρότυπο της κλάσης. Αυτό το νευρωνικό δίκτυο, σύµφωνα µε τα αποτελέσµατα εφαρµογής του, είναι πιο κατάλληλο από το MLP για δεδοµένα BCI και µπορεί να πετύχει αποτελεσµατική απόρριψη αβέβαιων δειγµάτων. Εχει εφαρµοστεί µε επιτυχία σε ταξινοµήσεις εικονικής κίνησης και νοητικών καταστάσεων, ειδικά κατά τη διάρκεια ασυγχρόνιστων πειραµάτων. 1.3.4.3 Μη γραµµικοί ταξινοµητές Bayes ύο ταξινοµητές του Bayes που χρησιµοποιούνται στα συστήµατα BCI είναι ο τετραγωνικός ταξινοµητής Bayes και το κρυφό πρότυπο Markov (HMM: Hidden Markov Model). Οι ταξινοµητές αυτοί παράγουν µη γραµµικά κατώφλια απόφασης, ενώ επειδή είναι πα- ϱαγωγικοί µπορούν να εκτελέσουν πιο αποτελεσµατική απόρριψη αβέβαιων δειγµάτων από διακριτικούς ταξινοµητές. Παρά το γεγονός ότι οι ταξινοµητές αυτοί δεν είναι τόσο διαδεδοµένοι όσο τα δύο άλλα είδη ταξινοµητών στα BCI συστήµατα, στη συνέχεια δίνουµε µια συνοπτική περιγραφή τους. Τετραγωνικός Ταξινοµητής Bayes: Η ταξινόµηση του Bayes στοχεύει στο να αντιστοιχιστεί ένα διάνυσµα χαρακτηριστικών στη κλάση που ανήκει µε την υψηλότερη πιθανότητα. Ο κανόνας του Bayes χρησιµοποιείται για τον υπολογισµό της εκ των υστέρων πιθανότητας που έχει ένα διάνυσµα χαρακτηριστικών να ανήκει στη συγκεκριµένη κλάση. Με χρήση του κανόνα της µέγιστης εκ των υστέρων πιθανότητας MAP: Maximum a Posteriori) και αυτές τις πιθανότητες, η κλάση ενός δεδοµένου διανύσµατος χαρακτηριστικών µπορεί να εκτιµηθεί. Ο τετραγωνικός ταξινοµητής Bayes υποθέτει διαφορετική κανονική κατανοµή των δεδοµένων, γεγονός το οποίο οδηγεί σε τετραγωνικά κατώφλια απόφασης. Αν και ο ταξινοµητής αυτός δεν είναι ιδιαίτερα διαδεδοµένος σε BCI εφαρµογές, έχει εφαρµοστεί µε επιτυχία σε ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 21

ταξινοµήσεις εικονικής κίνησης και νοητικών καταστάσεων. Κρυφό Πρότυπο Markov ( HMM: Hidden Markov: Τα HMM είναι δηµοφιλείς δυναµικοί ταξινοµητές στο πεδίο της αναγνώρισης οµιλίας. Ενα HMM είναι ένα είδος πιθανοθεωρητικού αυτόµατου που µπορεί να παρέχει την πιθανότητα της παρατήρησης µιας δεδοµένης ακολουθίας διανυσµάτων χαρακτηριστικών. Κάθε κατάσταση του αυτόµατου προτυποποιεί την πιθανότητα της παρατήρησης ενός δεδοµένου διανύσµατος χαρακτηριστικών. Για τα BCI, οι πιθανότητες συνήθως είναι µικτά πρότυπα κανονικής κατανοµής. Τα HMM είναι κατάλληλοι αλγόριθµοι για την ταξινόµηση χρονοσειρών. Καθώς οι συνιστώσες των ΗΕΓ σηµάτων που χρησιµοποιούνται για τον έλεγχο των BCI έχουν συγκεκριµένες πορείες στο χρόνο, τα HMM έχουν εφαρµοστεί για την ταξινόµηση χρονικών ακολουθιών των BCI χαρακτηριστικών και ακόµη την ταξινόµηση ακατέργαστων ΗΕΓ σηµάτων. Οπως και ο τετραγωνικός Bayes, και τα HMM δεν είναι διαδεδοµένα στην ερευνητική κοινότητα των BCI, αλλά σχετικές µελέτες αποδεικνύουν ότι µπορούν να αποτελέσουν υποσχόµενους ταξινοµητές για τα BCI συστήµατα. 1.3.4.4 Ταξινοµητές του πλησιέστερου γείτονα Οι ταξινοµητές αυτής της κατηγορίας είναι οι πιο απλοί. Η ταξινόµηση έγκειται στην αντιστοίχηση ενός διανύσµατος χαρακτηριστικών σε µία κλάση σύµφωνα µε τους πιο κοντινούς γείτονές του. Ο γείτονας µπορεί να είναι ένα διάνυσµα χαρακτηριστικών από το σύνολο εκπαίδευσης, όπως στην περίπτωση των k πιο κοντινών γειτόνων, ή ένα πρότυπο κλάσης όπως στην απόσταση Mahalanobis. Πρόκειται για µη γραµµικούς διακριτικούς ταξινοµητές. Ταξινοµητής k πλησιέστερων γειτόνων : Ο στόχος αυτής της τεχνικής είναι να αντιστοιχιστεί η επικρατούσα κλάση σε ένα αφανές σηµείο ανάµεσα στους k πλησιέστερους γείτονες µέσα στο σύνολο εκπαίδευσης. Για τα BCI, αυτοί οι πλησιέστεροι γείτονες συνήθως ϐρίσκονται µε ενός είδους µετρικής απόστασης. Με ένα αρκετά υψηλό αριθµό k και αρκετά δείγµατα εκπαίδευσης, ο ταξινοµητής αυτός µπορεί να προσεγγίσει οποιαδήποτε συνάρτηση που του επιτρέπει να δηµιουργήσει µη γραµµικά κατώφλια απόφασης. Ο ταξινοµητής k πλησιέστερων γειτόνων δεν είναι πολύ δηµοφιλής για εφαρµογές BCI καθώς είναι αρκετά ευαίσθητοι στο πρόβληµα της υψηλής διαστατικότητας. Παρόλα αυτά, αν εφαρµοστεί σε συστήµατα BCI µε διανύσµατα χαρακτηριστικών µικρών διαστάσεων, µπορεί να αποδώσει καλά αποτελέσµατα. Ταξινοµητής Απόστασης Mahalanobis: Ο ταξινοµητής αυτός υποθέτει γκαουσιανή κατανοµή N(µ c, M c ) για κάθε πρότυπο της κλάσης c. Επειτα, ένα διάνυσµα χαρακτηριστικών x αντιστοιχίζεται στην κλάση του πιο κοντινού προτύπου, µε κριτήριο την απόσταση Mahalanobis: d c (x) = (x µ c )M 1 c (x µ c ) T (1.1) Ετσι οδηγούµαστε σε ένα απλό αλλά σθεναρό ταξινοµητή, που έχει αποδειχθεί κατάλληλος για µη σύγχρονα συστήµατα BCI αλλά και BCI πολλών κλάσεων, αλλά όχι ιδιαίτερα διαδεδοµένο στη σχετική έρευνα. Οσον αφορά στα πρόσφατα συστήµατα BCI, οι ταξινοµητές SVM ϕαίνεται να είναι οι πιο αποτελεσµατικοί ανεξαρτήτως του αριθµού των κλάσεων. Αυτή η επιτυχία µπορεί να εξηγη- ϑεί από τις ιδιότητες τους, όπως η κανονικοποίηση, η απλότητα και η σθεναρότητά τους σε προβλήµατα όπως η υψηλή διαστατικότητα των διανυσµάτων χαρακτηριστικών. Εκτός από τους SVM, συνδυασµοί ταξινοµητών και δυναµικοί ταξινοµητές ϕαίνεται να έχουν καλές α- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 22

ποδόσεις στα ίδια συστήµατα BCI. Αντίθετα, στα µη συγχρονισµένα συστήµατα BCI, δεν έχει αποδειχθεί ακόµη η υπεροχή ενός είδους ταξινοµητή έναντι των άλλων. Μία πληροφορία που µπορεί να εξαχθεί µε ϐεβαιότητα, είναι ότι οι δυναµικοί ταξινοµητές, σε αυτή την περίπτωση, χάνουν τη δυνατότητα της καλής απόδοσης που ενδεχόµενα να είχαν. Από µία άλλη οπτική γωνία, µία σύγκριση των ταξινοµητών µπορεί να προκύψει από την ικανότητά τους να αντιµετωπίσουν συγκεκριµένα προβλήµατα των χαρακτηριστικών στα συστήµατα BCI : Θόρυβος και ακραίες τιµές : κανονικοποιηµένοι ταξινοµητές, όπως οι SVM, ϕαίνονται ως οι κατάλληλοι για να αντιµετωπίσουν ακραίες τιµές στα δεδοµένα. Εχει προταθεί η συστηµατική κανονικοποίηση των ταξινοµητών που χρησιµοποιούνται στα BCI συστή- µατα για να ανταπεξέλθουν στις ακραίες τιµές (Muller et al). Επίσης υποστηρίζεται, ότι οι διακριτικοί ταξινοµητές αποδίδουν καλύτερα από τους παραγωγικούς, παρουσία ϑορύβου ή ακραίων τιµών. Υψηλή διαστατικότητα : οι SVM ταξινοµητές είναι πιθανώς οι καταλληλότεροι στην αντιµετώπιση των µεγάλων διαστάσεων των διανυσµάτων των χαρακτηριστικών. Αν αυτές οφείλονται στη χρήση ενός µεγάλου αριθµού χρονικών τµηµάτων, οι δυναµικοί ταξινοµητές µπορούν να δώσουν λύση στο πρόβληµα, ϑεωρώντας ακολουθίες διανυσµάτων χαρακτηριστικών στη ϑέση ενός µοναδικού διανύσµατος µε πολύ µεγάλη διάσταση. Για παράδειγµα, οι SVM και οι δυναµικοί ταξινοµητές όπως τα HMM και τα TDNN είναι σε ϑέση να ταξινοµήσουν ΗΕΓ που δεν έχουν τεθεί υπό επεξεργασία. Αντίθετα, τα knn δεν ϑα έπρεπε να προτιµηθούν σε µία τέτοια περίπτωση καθώς είναι ευαίσθητα στην υψηλή διαστατικότητα των διανυσµάτων. Σε κάθε περίπτωση ϐέβαια, είναι προτιµότερο να έχουµε ένα µικρό αριθµό από χαρακτηριστικά. Συνεπώς, συνίσταται να ϑέτονται σε χρήση τεχνικές µείωσης της διαστατικότητας και/ή επιλογής των χαρακτηριστικών. Χρονική πληροφορία : για σύγχρονα BCI συστήµατα, οι δυναµικοί ταξινοµητές ϕαίνεται να είναι οι πιο κατάλληλοι για να εκµεταλλευτούν τη χρονική πληροφορία που εµπε- ϱιέχεται στα χαρακτηριστικά. Παροµοίως, η ολοκλήρωση των ταξινοµητών στο χρόνο µπορεί να αξιοποιήσει αποτελεσµατικά τις χρονικές πληροφορίες. Για τα ασύγχρονα πειράµατα, δεν έχει παρατηρηθεί υπεροχή κάποιου είδους ταξινοµητή. Μη στασιµότητα : ένας συνδυασµός ταξινοµητών µπορεί να δώσει λύση σε αυτό το πρό- ϐληµα, καθώς ελαττώνει τη διασπορά. Ευσταθείς ταξινοµητές όπως ο LDA ή ο SVM µπορούν επίσης να χρησιµοποιηθούν, αλλά το πιο πιθανό είναι ότι συνδυασµοί τους (LDA ή SVM) ϑα εµφανίσουν καλύτερες επιδόσεις. Μικρά σύνολα εκπαίδευσης : αν το σύνολο δεδοµένων εκπαίδευσης είναι µικρό, συνίσταται να χρησιµοποιούνται απλές µέθοδοι µε λιγοστές παραµέτρους, όπως η LDA. Τυπικά, ένα σύστηµα BCI καταλήγει στον ταξινοµητή των χαρακτηριστικών ανεξάρτητα για κάθε χρήστη, προκειµένου να λάβει υπόψη του τις συγκεκριµένες ιδιότητες του καθενός. Η διαδικασία αυτή γίνεται ιδανικά κατά τη διάρκεια των χρονικών διαστηµάτων µεταξύ των πειραµάτων. Στην πραγµατικότητα, το περισσότερο δύο παράµετροι µπορούν να ϐελτιστοποιηθούν κατά τη διάρκεια των πειραµάτων, ενώ όλες οι υπόλοιπες καθορίζονται εκ των προτέρων. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 23

Ο ταξινοµητής µπορεί να ϐγάζει ως έξοδο διάφορους τύπους σηµάτων ελέγχου, συνεχή και διακριτά ως προς το χρόνο. Για παράδειγµα, κάποιοι ταξινοµητές µπορεί να παράγουν ως έξοδο µια κατάσταση µη πραγµατοποίησης ελέγχου (non-control state), όταν ο χρήστης δεν σκέφτεται εκ προθέσεως για κάποια από τις προκαθορισµένες λειτουργίες. Άλλοι ταξινοµητές µπορούν να παράγουν ως έξοδο µία άγνωστη κατάσταση, αν το επίπεδο εµπιστοσύνης είναι αρκετά χαµηλό για να παρθεί µία απόφαση από τα παρατηρούµενα χαρακτηριστικά. Ιδανικά, το µεταφραστικό στάδιο υποστηρίζει την κατάσταση µη πραγµατοποίησης ελέγχου, γιατί χωρίς αυτή, όλες οι καταστάσεις εξόδου του ταξινοµητή ϑεωρούνται ως απόρροια προθέσεων του χρήστη. Με την υποστήριξη αυτή, ο χρήστης µπορεί να ελέγξει κατά πόσο µία έξοδος µπορεί να ϑεωρηθεί ως προτιθέµενη ή όχι. Στην τελευταία περίπτωση, ένα αυτορρυθµιζόµενο παράδειγµα παρακολουθείται συνεχόµενα, όπου οι χρήστες µπορούν να εκτελέσουν συγκεκριµένες νοητικές λειτουργίες, όποτε εκείνοι επιλέξουν. Ενα από τα προβλήµατα που αντιµετωπίζονται κατά τη µηχανική µάθηση και την ταξινό- µηση είναι το πως µπορεί να εκτιµηθεί η απόδοση του ταξινοµητή σε καινούργια δεδοµένα, η εκτίµηση δηλαδή του σφάλµατος γενίκευσης και το πώς µπορεί να αποφευχθεί το ϕαινόµενο της υπερπροσαρµογής. Ο σκοπός κατά την αξιολόγηση off-line ταξινοµήσεων, που είναι απαραίτητες για την ανάπτυξη και την ενίσχυση των BCI συστηµάτων, είναι η εκτίµηση της µελλοντικής απόδοσης των µεθόδων που αναλύονται, ή µε άλλα λόγια η ικανότητα γενίκευσης των αποτελεσµάτων της µηχανής µάθησης. Η ουσία στην εκτίµηση του σφάλ- µατος γενίκευσης είναι ο διαχωρισµός των διαθέσιµων δεδοµένων σε δεδοµένα εκπαίδευσης (ή εκµάθησης) και δοκιµής, ο καθορισµός όλων των παραµέτρων στα δεδοµένα εκπαίδευσης και έπειτα η αξιολόγηση των δεδοµένων δοκιµής. Οπότε, κατά την εξερεύνηση καινούργιων τρόπων για την επεξεργασία ή ταξινόµηση εγκεφαλικών σηµάτων, ϑα πρέπει πρώτα οι µέθοδοι αυτές να επικυρωθούν και να συγχρονιστούν, πριν την ενσωµάτωσή τους σε ένα on-line σύστηµα και τη διεξαγωγή πειραµάτων ανατροφοδότησης του χρήστη. Τα αποτελέσµατα των πειραµάτων αυτών αποτελούν τον πιο αντικειµενικό τρόπο αξιολόγησης της απόδοσης ενός BCI συστήµατος, αλλά η διεξαγωγή τους απαιτεί µεγάλο κόστος τόσο σε πόρους, όσο και σε χρόνο. Επιπλέον, η παραµόρφωση των ΗΕΓ σηµάτων που οφείλεται στα διάφορα είδη ϑορύβου, προκαλεί µία επιβλαβή επίδραση στον ταξινοµητή. Η σθεναρότητα είναι η ικανότητα του συστήµατος να αντιµετωπίσει παραµορφωµένα ή άκυρα δεδοµένα, καθώς είναι τυπικό για διάφορα είδη ϐιοσηµάτων, όπως τα ΗΕΓ, να παραµορφώνονται από ϑόρυβο προερχόµενο από µη εγκεφαλικές πηγές. Τέλος, εξαιτίας του γεγονότος ότι τα ΗΕΓ σήµατα είναι µη στάσιµα, τα δεδοµένα πρέπει να επεξεργαστούν µε τέτοιο τρόπο έτσι ώστε είτε η έξοδος του στατικού ταξινοµητή να είναι αµετάβλητη σε αυτές τις αλλαγές ή ο ταξινοµητής ϑα πρέπει να προσαρµόζεται σε συγκεκριµένες αλλαγές κατά τη διάρκεια του χρόνου πειράµατος. 1.4 Το σύστηµα Graz-BCI Το Graz-BCI αποτελεί ένα πλαίσιο έρευνας γύρω από τα σύγχρονα συστήµατα BCI, µε στόχο την ανάπτυξη ενός τεχνικού συστήµατος που µπορεί να υποστηρίξει επικοινωνιακές δυνατότητες για ασθενείς µε σοβαρές νευροµυϊκές παθήσεις, οι οποίοι έχουν ανάγκη να αποκτήσουν τον έλεγχο εξωτερικών συσκευών χωρίς την ανάµειξη των νεύρων/µυών τους στη διαδικασία. Το αναπτυσσόµενο BCI σύστηµα χρησιµοποιεί τις ταλαντώσεις ΗΕΓ σηµάτων (που καταγρά- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 24

ϕονται µέσω ηλεκτροδίων κατά τη διάρκεια συγκεκριµένων νοητικών διεργασιών) σαν είσοδο και παρέχει µία επιλογή ελέγχου µέσω της εξόδου του. Πιο συγκεκριµένα, το Graz-BCI σύστηµα χρησιµοποιεί ως σήµατα εισόδου ΗΕΓ σήµατα που εµπεριέχουν πληροφορία σχετική µε προθέσεις κίνησης ή, αλλιώς, πλασµατικές κινήσεις του χρήστη, δηλαδή κινήσεων που ο χρήστης καλείται να ϕανταστεί ότι πραγµατοποιεί χω- ϱίς όµως την ουσιαστική εκτέλεσή τους. Το ενδιαφέρον γεγονός στην περίπτωσή αυτή είναι ότι τόσο οι πραγµατικές όσο και οι πλασµατικές κινήσεις εκφράζονται µε τον ίδιο τρόπο στα ΗΕΓ σήµατα, µε ταλαντώσεις του µ και του β ϱυθµού να είναι εµφανείς και στις δύο περιπτώσεις. Άλλωστε αυτό είναι και το γεγονός που εκµεταλλεύεται το σύστηµα, για να εξοµοιώσει το ουσιαστικό αποτέλεσµα που ϑα είχε η σκέψη µιας κίνησης σε ένα υγιές άτοµο στην περίπτωση ενός ατόµου χωρίς νευροµυϊκές δυνατότητες. Πιο πρόσφατες προσπάθειες έχουν χρησιµοποιήσει επίσης σαν σήµατα εισόδου οπτικά και σωµατο-αισθητικά προκλητά δυναµικά σταθερής κατάστασης (SSVEP, SSSEP). Ειδική προσπάθεια καταβάλλεται στη ϐελτίωση της ταξινόµησης µεµονοµένων ΗΕΓ δοκιµών, δηλαδή των χρονικών διαστηµάτων κατά τη διάρκεια των οποίων εκτελείται κάποια νοητική διεργασία ενδιαφέροντος από το χρήστη, η οποία και καταγράφεται µε τη µορφή ΗΕΓ σηµάτων από τα ηλεκτρόδια. Η ϐελτίωση έγκειται σε παραµέτρους όπως ο τύπος των πλασµατικών κινήσεων (κιναισθητικός ή οπτικών παραµέτρων), η χρήση χαρακτηριστικών από τις Ϲώνες ενδιαφέροντος του ϕάσµατος ισχύος των σηµάτων, η επιλογή των πιο σηµαντικών χαρακτηριστικών και η χρήση αποτελεσµατικών πρασαρµοστικών ταξινοµητών. Τα παραγόµενα σήµατα εξόδου αξιολογούνται χρήσιµα για την πραγµατοποίηση διάφορων λειτουργιών, όπως ο έλεγχος ενός κέρσορα, η επιλογή γραµµάτων ή λέξεων σε έναν συλλαβιστή, ο έλεγχος µιας νευροπροσθετικής συσκευής, ενώ παράλληλα έχουν γίνει τα πρώτα ϐήµατα στη δηµιουργία ενός ασυγχρόνιστου συστήµατος BCI για την πλοήγηση σε ένα εικονικό περιβάλλον [11]. 1.4.1 Συνιστώσες του Graz-BCI Κατά τον σχεδιασµό ενός συστήµατος BCI, διάφορα Ϲητήµατα πρέπει να ληφθούν υπόψη, όπως ο τρόπος λειτουργίας, ο τύπος του σήµατος εισόδου, η στρατηγική κατά τις νοητικές διεργασίες και η ανάδραση στο χρήστη (Σχήµα 1.7). ύο διακριτοί τρόποι λειτουργίας είναι δυνατοί, ο σύγχρονος και ο ασύγχρονος. Στην περίπτωση ενός σύγχρονου BCI, η νοητική διεργασία πρέπει να εκτελεστεί σε προκαθορισµένα χρονικά διαστήµατα ακολουθώντας ένα οπτικό, ακουστικό ή απτό ερέθισµα. Οι χρονικές περίοδοι κατά τη διάρκεια των οποίων ο χρήστης µπορεί να ϑεωρηθεί ότι έχει έλεγχο της κατάστασης, για παράδειγµα µε τη δηµιουργία µίας συγκεκριµένης νοητικής κατάστασης, καθορίζονται από το σύστηµα. Επιπλέον, η επεξεργασία των δεδοµένων είναι περιορισµένη σε αυτές τις καθορισµένες περιόδους. Αντί- ϑετα, ένα ασύγχρονο BCI επιτρέπει στο χρήστη να καθορίσει µία λειτουργία ανεξάρτητα από οποιοδήποτε εξωτερικό ερέθισµα. Αυτό υπονοεί ότι τα χρονικά διαστήµατα των προτιθέµενων νοητικών δραστηριοτήτων είναι άγνωστα, και οπότε το σήµα πρέπει να αναλυθεί µε συνεχό- µενο τρόπο (Mason and Birch, 2000). Η περισσότερη έρευνα στο πλαίσιο του Graz-BCI έχει γίνει µε σύγχρονο τρόπο λειτουργίας, παρόλα αυτά έχουν σχεδιαστεί και συστήµατα µε ασύγχρονο τρόπο λειτουργίας [11]. Τα ηλεκτρικά δυναµικά που χρησιµοποιούνται στα Graz-BCI συστήµατα καταγράφονται µε µηεπεµβατικό τρόπο από το κρανίο. Στη µελέτη των ΗΕΓ σηµάτων, οι δυναµικές των ταλαντώσεων, όπως αυτές του µ και του β ϱυθµού, αναλύονται και ταξινοµούνται. Οπως αναφέρθηκε, ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 25

Σχήµα 1.7: Συνιστώσες ενός συστήµατος BCI. στη ϑέση των ΗΕΓ δυναµικών έχουν χρησιµοποιηθεί και δύο είδη δυναµικών σχετιζόµενων µε γεγονότα, τα οπτικά και τα σωµατο-αισθητικά προκλητά δυναµικά σταθερής κατάστασης (SSVEP, SSSEP). Στο επίπεδο των στρατηγικών που µπορούν να εφαρµοστούν για να επιτευχθούν οι στόχοι των νοητικών διεργασιών, τρεις διαφορετικές περιπτώσεις µπορούν να διακριθούν : αυτορύθµιση των αργών δυναµικών του ϕλοιού, προκαθορισµένη νοητική διεργασία, εστίαση της προσοχής σε ένα εξωτερικά ϱυθµιζόµενο ερέθισµα. Η εφαρµογή της στρατηγικής που σχετίζεται µε µια προκαθορισµένη νοητική διεργασία, ειδικά µε τη δηµιουργία πλασµατικών κινήσεων και, πιο πρόσφατα, της στρατηγικής που αφορά την εστίαση της προσοχής σε ένα εξωτερικά ϱυθµιζόµενο οπτικό ερέθισµα, είναι πιο χαρακτηριστικές για τα συστήµατα Graz-BCI [11]. Για τη δηµιουργία των πλασµατικών κινήσεων, Ϲητείται από τον χρήστη να ϕανταστεί ότι κινεί ένα συγκεκριµένο µέρος του σώµατός του, όπως για παράδειγµα το αριστερό ή το δεξί χέρι, τα δύο πόδια ή τη γλώσσα. Το υπόβαθρο στο οποίο στηρίζεται αυτή η στρατηγική είναι ότι µε το να ϕαντάζεται κανείς ότι εκτελεί µία κίνηση, ενεργοποιούνται παρόµοιες περιοχές στο ϕλοιό και παρουσιάζονται παρόµοια χαρακτηριστικά στο χρόνο, όπως µε το να εκτελεί πραγµατικά την κίνηση (Decety et al., 1994). Η ανατροφοδότηση της απόδοσης είναι ένα σηµαντικό χαρακτηριστικό κάθε BCI συστήµατος, καθώς ο χρήστης έχει τη δυνατότητα να παρατηρεί τις εκτελούµενες από τον ίδιο εντολές (όπως, η κίνηση ενός κέρσορα ή η επιλογή γραµµάτων σε έναν συλλαβιστή) σχεδόν στον ίδιο χρόνο που πραγµατοποιείται η εγκεφαλική απόκριση. Στο Graz-BCI χρησιµοποιούνται δια- ϕορετικοί τύποι ανατροφοδότησης. Η διακριτή ανατροφοδότηση (µε καθυστέρηση) παρέχει την πληροφορία σχετικά µε το κατά πόσο µία απόκριση ήταν σωστή ή λανθασµένη στο τέλος ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 26

της δοκιµής, ενώ η συνεχής ανατροφοδότηση υποδεικνύει απευθείας τη δυνατότητα διάκρισης µεταξύ των εγκεφαλικών ακολουθιών. Σχετική µελέτη έχει δείξει ότι η συνεχής οπτική ανατροφοδότηση µπορεί να έχει τόσο οφέλη, όσο και επιβλαβείς επιδράσεις στον έλεγχο των ΗΕΓ σηµάτων από το χρήστη και ότι τα αποτελέσµατα αυτά ποικίλουν από χρήστη σε χρήστη (McFarland et al., 1998). Πιο πρόσφατα, το σύστηµα Graz-BCI έχει εντάξει και την εικονική πραγµατικότητα ως µέθοδο ανατροφοδότησης [14]. 1.4.2 ERD/ERS στο σύστηµα Graz-BCI Τα ΗΕΓ σήµατα απαρτίζονται από τοπικές και µη-τοπικές ΗΕΓ ϱυθµικές συνιστώσες. Οι τοπικές συνιστώσες µπορούν να ϑεωρηθούν σαν εγγενής δραστηριότητα συγκεκριµένων πε- ϱιοχών του ϕλοιού. Οι µη-τοπικές συνιστώσες παράγονται κυρίως σε περιοχές του ϕλοιού που δεν διευκρινίζονται εκ των προτέρων και µπορούν να καταγραφούν από ηλεκτρόδια τοποθετηµένα στα περισσότερα τµήµατα του κρανίου. Τυπικά παραδείγµατα τοπικών ΗΕΓ ϱυθµών, όπως έχει ήδη προαναφερθεί, είναι οι αισθητικοκινητικοί ϱυθµοί (SMR), όπως ο κινητικός µ και ο κεντρικός β, µε κύριες Ϲώνες συχνοτήτων των ταλαντώσεων τους να ϑεω- ϱούνται για τον µ τα 8-12 Hz και για τον κεντρικό β τα 15-30 Hz. Ενα χαρακτηριστικό αυτών των τοπικών ϱυθµών είναι η λειτουργική σχέση που έχουν οι ταλαντώσεις τους µε την κατάσταση των υποκείµενων δικτύων των νευρώνων στις συγκεκριµένες περιοχές πάνω από τις οποίες καταγράφονται. Οταν η περιοχή αυτή ενεργοποιείται, η ϱυθµική δραστηριότητα στις Ϲώνες συχνοτήτων των ϱυθµών αυτών παρουσιάζει µία µείωση του πλάτους της, γνωστό ως αποσυγχρονισµό σχετιζόµενο µε ένα γεγονός (ERD). Οταν, όµως, οι περιοχές αυτές δεν είναι αποκλειστικά αφιερωµένες σε ένα δεδοµένο τύπο δραστηριότητας σε µία συγκεκριµένη χρονική στιγµή, παρατηρείται ενίσχυση του πλάτους, γνωστό αλλιώς ως συγχρονισµός σχετι- Ϲόµενος µε ένα γεγονός (ERS) (ϐλέπε Ενότητα 1.2.1 και [12]). Η ϐάση της χρήσης ϱυθµικών ΗΕΓ συνιστωσών ως σήµατα εισόδου σε ένα σύστηµα BCI είναι ότι η προετοιµασία ή ο σχεδιασµός µιας συγκεκριµένης κίνησης συντελεί σε έναν ERD του µ και/ή του β ϱυθµού (Jasper and Penfield, 1949; Gastaut, 1952). Κατά την προετοιµασία µιας τέτοιας κίνησης, ο ERD παρουσιάζει διαφορετική χωρική τοποθέτηση ανάλογα µε το αν, για παράδειγµα, σχεδιάζεται µία αριστερή ή µια δεξιά κίνηση του χεριού. Ενα σηµαντικό ερώτηµα που προκύπτει, είναι κατά πόσο οι πλασµατικές αριστερές και δεξιές κινήσεις των χεριών παράγουν παρόµοιες χαρακτηριστικές ERD ακολουθίες, οι οποίες να µπορούν έπειτα να µεταφραστούν σε ένα BCI σήµα ελέγχου και, επιπλέον, αν είναι δυνατή η διαφοροποίηση τους σε πραγµατικό χρόνο µε ένα πλαίσιο ταξινόµησης της κάθε δοκιµής στην αντίστοιχη κατηγορία κίνησης. Ενα από τα ϐασικά χαρακτηριστικά των µετρήσεων των ERD/ERS είναι ότι η ισχύς των ΗΕΓ σηµάτων, καταγραµµένων σε συγκεκριµένη κρανιακή περιοχή µέσα στις δεδοµένες Ϲώνες συχνοτήτων, παρουσιάζεται (µε τη µορφή ποσοστού) σε σχέση µε την ισχύ των ΗΕΓ σηµάτων που καταγράφονται στην ίδια περιοχή αλλά σε µία χρονική περίοδο αναφοράς λίγα δευτε- ϱόλεπτα πριν εκδηλωθεί το γεγονός - ερέθισµα που ενεργοποιεί τις κατάλληλες εγκεφαλικές περιοχές. Καθώς οι µεταβολές των ϱυθµών στη συνεχόµενη ΗΕΓ δραστηριότητα εξαιτίας του ερεθίσµατος χρειάζονται χρόνο για να αναπτυχθούν και στη συνέχεια να εκµηδενιστούν, για να επαναφερθούν οι ϱυθµοί στην αρχική κατάσταση, το χρονικό διάστηµα µεταξύ δύο συνεχόµενων ερεθισµάτων πρέπει να διαρκεί τουλάχιστον για κάποια δευτερόλεπτα. Για τους ϱυθµούς που εξετάζονται στην περίπτωσή µας, ένα διάστηµα της τάξης των 10 δευτερολέπτων ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 27

ϑεωρείται επαρκές. Η κλασική µέθοδος για τον υπολογισµό της χρονικής πορείας του ERD εµπεριέχει τα παρακάτω στάδια : Ϲωνοπερατό ϕιλτράρισµα όλων των δοκιµών κατά τη διάρκεια των οποίων εµφανίζεται το δεδοµένο ερέθισµα, τετραγωνισµός του πλάτους όλων των δειγµάτων, προκειµένου να υπολογιστούν τα δείγ- µατα της ισχύος, υπολογισµός της µέσης τιµής των δειγµάτων ισχύος από όλα τα δοκιµών, χρήση ενός ϕίλτρου κινούµενου µέσου όρου στα χρονικά δείγµατα για την εξοµάλυνση των δεδοµένων και τη µείωση της µεταβλητότητας. Αυτή η διαδικασία συντελεί στη δηµιουργία µίας χρονικής σειράς των τιµών ισχύος για τη Ϲώνη συχνοτήτων που προέκυψε µετά το ϕιλτράρισµα στο πρώτο στάδιο. Για τον υπολογισµό των ποσοστιαίων τιµών για τους ERD/ERS, η ισχύς στη συχνοτική Ϲώνη ενδιαφέροντος στο χρονικό διάστηµα µετά το ερέθισµα δίνεται από το A, ενώ εκείνη της προγενέστερης περιόδου αναφοράς δίνεται από το R. Ο ERD ή ο ERS ορίζεται ως το ποσοστό της µείωσης ή της αύξησης ισχύος αντίστοιχα, σύµφωνα µε τον τύπο : ERD% = A R R 100. (1.2) Στο Σχήµα1.8 απεικονίζονται οι µέσοι ERDs του µ ϱυθµού από ένα σύνολο δοκιµών πλασµατικών δεξιών και αριστερών κινήσεων των χεριών από έναν συγκεκριµένο χρήστη κοντά στα 10 Hz (κύρια Ϲώνη συχνοτήτων µ ϱυθµού). Οι υπολογισµοί έγιναν µετά από την επεξεργασία των αντίστοιχων ΗΕΓ σηµάτων, τα οποία καταγράφηκαν κατά τη διάρκεια των δοκιµών από 2 ηλεκτρόδια τοποθετηµένα πάνω από τα 2 ηµισφαίρια (αριστερό και δεξί) κοντά στο κέντρο (κανάλια C3, C4 αντίστοιχα στο σύστηµα 10-20). Η κάθετη γραµµή τη χρονική στιγµή των 3 sec στη δοκιµή σηµατοδοτεί την έναρξη της περιόδου εκτέλεσης της πλασµατικής κίνησης από το χρήστη. Το πλάτος του µ ϱυθµού εξασθενεί κατά τη διάρκεια της περιόδου που εκδηλώνεται η πρόθεση της κίνησης σε σχέση µε την προγενέστερη περίοδο αναφοράς. Η εξασθένηση αυτή είναι έκδηλη πάνω από τα αντίστροφα ηµισφαίρια σε σχέση µε την κατεύθυνση της κίνησης, δηλαδή πάνω από το αριστερό ηµισφαίριο (C3) για τη δεξιά κίνηση (διακεκοµ- µένη γραµµή) και πάνω από το δεξί ηµισφαίριο (C4) για την αριστερή κίνηση (συµπαγής γραµµή) [7]. Το ανωτέρω γεγονός αυτό αποδεικνύει ότι οι ακολουθίες των ERDs εκδηλώνουν διακριτική ικανότητα ως προς τις δύο διαφορετικές προθέσεις και κατ επέκταση, νοητικές καταστάσεις του χρήστη, οπότε ϑα µπορούσαν να χρησιµοποιηθούν σε µία εφαρµογή που στόχο ϑα είχε το διαχωρισµό αριστερών και δεξιών κινήσεων των χεριών του χρήστη [12]. Η εφαρµογή αυτή ϑα µπορούσε να είναι υλοποιήσιµη από το σύστηµα Graz-BCI, το οποίο στην περίπτωση αυτή ϑα δεχόταν ως είσοδο τα ΗΕΓ σήµατα που ϑα εµπεριέχουν, ανάµεσα στην υπόλοιπη ασυσχέτιστη µε την εφαρµογή πληροφορία, τις ταλαντώσεις ενδιαφέροντος του µ και κεντρικού β ϱυθµού και τα οποία ϑα καταγράφονται από ηλεκτρόδια πάνω από το δεξί και αριστερό ηµισφαίριο (κανάλια C3 και C4). Η έξοδος του BCI, εάν πρόκειται για ένα σύστηµα µε διακριτή ανάδραση, ϑα αποτελούσε µία απόφαση ταξινόµησης στο τέλος κάθε δοκιµή που ϑα το κατέτασσε σε µία από τις δύο δεδοµένες κλάσεις (αριστερή ή δεξιά ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 28

κίνηση). Στην περίπτωση όµως που πρόκειται για ένα σύστηµα µε συνεχή ανατροφοδότηση, η έξοδος ϑα ήταν συνεχόµενη, παίρνοντας απόφαση σε κάθε χρονική στιγµή κατά τη διάρκεια της δοκιµής σχετικά µε το αν η πλασµατική κίνηση που εκτελείται στον ίδιο χρόνο από το χρήστη είναι αριστερής ή δεξιάς κατεύθυνσης, ενώ επιπρόσθετα ϑα παρουσίαζε και το αποτέλεσµά της στο χρήστη σε πραγµατικό χρόνο µε κάποιον οπτικό ή ακουστικό τρόπο. Μία τέτοια εφαρµογή ταξινόµησης ϑα υλοποιηθεί αναλυτικότερα στο τελευταίο κεφάλαιο της εργασίας (για τη δεύτερη περίπτωση του συστήµατος µε ανάδραση), χρησιµοποιώντας κατάλληλες µεθόδους προεπεξεργασίας και εξαγωγής χαρακτηριστικών αλλά και ταξινόµησης, το ϑεωρητικό υπόβαθρο των οποίων παρουσιάζεται στα Κεφάλαια και αντίστοιχα. Σχήµα 1.8: Τα διαγράµµατα παρουσιάζουν τους µέσους των (ERDs) του µ ϱυθµού στα 10 Hz από όλες οι δοκιµές αριστερής (συµπαγής γραµµή) και δεξιάς (διακεκοµµένη γραµµή) πλασµατικής κίνησης του χεριού, πάνω από το αριστερό (C3) και το δεξί (C4) ηµισφαίριο. 1.4.3 Ελεγχος µέσω των ERD/ERS Το σύστηµα Graz-BCI χρησιµοποιεί, όπως εξηγήθηκε παραπάνω, τις πλασµατικές κινήσεις και τις σχετιζόµενες ταλαντώσεις των ΗΕΓ σηµάτων που πηγάζουν από τον αισθητηριοκινητικό ϕλοιό για τον έλεγχο µιας διάταξης [13], [12], [7]. Ο καθιερωµένος πλέον αποσυγχρονισµός (ERD) των µ και β ϱυθµών τη χρονική στιγµή της ενεργοποίησης της κίνησης, και η επανεµφάνισή τους (ERS) όταν η κίνηση έχει ολοκληρωθεί, διαµορφώνουν τη ϐάση του BCI µε δυνατότητα ελέγχου του µέσω των αισθητηριοκινητικών ϱυθµών. Για τον έλεγχο µιας εξωτερικής διάταξης που ϐασίζεται σε ΗΕΓ σήµατα, είναι ουσιαστικής ση- µασίας η εγκεφαλική δραστηριότητα που σχετίζεται µε κάποια δεδοµένη κίνηση να µπορεί να ανιχνευθεί σε πραγµατικό χρόνο ανάµεσα στην συνεχόµενη εγκεφαλική δραστηριότητα. Αν και έχει καταγραφεί ότι η δηµιουργία πλασµατικών κινήσεων προκαλεί προβλέψιµες χρονικά σταθερές αλλαγές στις Ϲώνες των µ και β ϱυθµών (δηλαδή εµφανίζεται µικρή διαφοροποίηση µεταξύ των χρηστών), σε ορισµένους χρήστες δεν παρουσιάζονται οι αναµενόµενες ΗΕΓ αλλαγές. Ακόµη, ϐρέθηκε µία ποικιλία ακολουθιών χρόνου-συχνότητας (υψηλή διαφοροποίηση µεταξύ των χρηστών), ειδικά όσον αφορά στις συχνοτικές συνιστώσες της απόκρισης κατά τη µελέτη των δυναµικών της ταλαντωτικής δραστηριότητας (Wang et al., 2004). Αυτές οι διαφορές στις σχετιζόµενες µε τις πλασµατικές κινήσεις ΗΕΓ αλλαγές µπορούν εν ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 29

µέρει να εξηγηθούν από την ποικιλία των πλασµατικών κινήσεων εκ µέρους των χρηστών (Curran and Strokes, 2003). Στην περίπτωση που δεν έχει δοθεί κάποια συγκεκριµένη ο- δηγία στους χρήστες, οι ίδιοι µπορούν, για παράδειγµα, είτε να ϕανταστούν ότι εκτελούν οι ίδιοι την ενέργεια µε έναν εσωτερικό τρόπο είτε, εναλλακτικά, να ϕανταστούν ότι παρατηρούν τους εαυτούς τους ή κάποιο άλλο άτοµο να πραγµατοποιεί την ενέργεια. Ο πρώτος τρόπος ϑεωρείται ότι εµπεριέχει µία κιναισθητική λειτουργία από την πλευρά του χρήστη, ενώ ο δεύτερος ϐασίζεται κατά κύριο λόγο σε οπτικές παραµέτρους. Υπάρχουν συγκλίνουσες αποδείξεις ότι ο τρόπος µε τον οποίο ο χρήστης ϕαντάζεται τις κινήσεις είναι λειτουργικά ισοδύναµος µε τις εγκεφαλικές διεργασίες που σχετίζονται µε την πραγµατική αντίληψη και ενέργεια (Solodkin et al., 2004). Κατ επέκταση, οι διαφορετικοί αυτοί τρόποι είναι πολύ πιθανόν να είναι συναφείς µε τις ανόµοιες ηλεκτροφυσιολογικές ακολουθίες ενεργοποίησης (όσον αφορά στο πεδίο της συχνότητας, του χρόνου και του χώρου) [11]. Πειράµατα στο πλαίσιο έρευνας του συστήµατος Graz-BCI επιβεβαιώνουν τις προηγούµενες µελέτες, σύµφωνα µε τις οποίες οι πλασµατικές κινήσεις, ειδικά αυτές που δηµιουργούνται µε κιναισθητικό τρόπο, µπορούν να χρησιµοποιηθούν για να δηµιουργήσουν µε τη σειρά τους ακολουθίες ταλαντώσεων εγκεφαλικής δραστηριότητας, οι οποίες να είναι κινησιολογικά εξειδικευµένες και τοπικά περιορισµένες. Ακόµη µπορούµε να αναµένουµε ότι ειδικές οδηγίες σχετικά µε τον τρόπο ϕαντασίας των κινήσεων, µαζί µε προσεκτική εκπαίδευση του χρήστη, µπορεί να οδηγήσουν στην ενίσχυση της ενεργοποίησης στις κύριες περιοχές των αισθητηριοκινητικών ϕλοιών (Lotze et al., 1999b) και, συνεπώς, να ϐελτιώσουν τον έλεγχο του BCI. Η δυνατότητα των χρηστών να είναι σε ϑέση να µαθαίνουν πως να ενισχύουν την ενεργοποίηση του κινητικού ϕλοιού κατά τη διάρκεια των πλασµατικών κινήσεων έχει πα- ϱουσιαστεί σε πραγµατικού χρόνου εφαρµογές ανάδρασης χρησιµοποιώντας την απεικόνιση λειτουργικού µαγνητικού συντονισµού (fmri; DeCharms et al., 2004). Ωστόσο, πραγµατικές εφαρµογές του συστήµατος Graz-BCI έχουν υποδηλώσει ότι ο κιναισθητικός τρόπος δηµιουργίας των πλασµατικών κινήσεων παρουσιάζει µεγαλύτερη αποδοτικότητα σε σχέση µε τον οπτικό τρόπο. Οι παράµετροι που εµφανίζουν µεγαλύτερη ευαισθησία σε σχέση µε συγκεκριµένες νοητικές καταστάσεις πρέπει ϐέβαια συνεχώς να ϐελτιστοποιούνται για κάθε χρήστη ξεχωριστά, για να υπάρξει συµβιβασµός µε τη διαφοροποίηση των ακολουθιών από άτοµο σε άτοµο. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 30

Κεφάλαιο 2 Κυµατιδιακή Ανάλυση 2.1 Εισαγωγή Ο Μετασχηµατισµός Κυµατιδιών (WT: Wavelet Transform) είναι ένα εργαλείο που αντιστοιχεί δεδοµένα ή συναρτήσεις σε συνιστώσες διαφορετικού συχνοτικού περιεχοµένου, µε την ανάλυση κάθε συνιστώσας να γίνεται µε ϐάση την κλίµακά της. Εστιάζοντας στο πλαίσιο εφαρµογής ως προς την επεξεργασία σήµατος, ο WT ενός σήµατος που εξελίσσεται στο χρόνο εξαρτάται από δύο παραµέτρους : την κλίµακα (ή συχνότητα) και το χρόνο. Τα κυµατίδια παρέχουν ένα εργαλείο για τον εντοπισµό της πληροφορίας στο πεδίο χρόνου-συχνότητας. Η κυµατιδιακή ανάλυση είναι µια µέθοδος επεξεργασίας η οποία, σε αντιστοιχία µε τις υπόλοιπες, χρησιµοποιεί ένα σύνολο συναρτήσεων σαν ϐάση προκειµένου να εκφράσει κάποιο σήµα σε σχέση µε αυτές. Η διαφορά µπορεί να γίνει καλύτερα αντιληπτή µέσα από τη σύγκρισή της µε την πλέον διαδεδοµένη από τις κλασικές µεθόδους, εκείνης του Μετασχη- µατισµού Fourier (FT: Fourier Transform). Με τον FT, το εξεταζόµενο σήµα εκφράζεται ως το άθροισµα ενός συνόλου συναρτήσεων ηµιτόνων και συνηµιτόνων (ή µιγαδικών εκθετικών συναρτήσεων) αυστηρά επιλεγµένων συχνοτήτων και άπειρης χρονικής διάρκειας. Το αποτέλεσµα του FT αφορά µόνο το πεδίο της συχνότητας και αποδίδει το ϕασµατικό περιεχόµενο του σήµατος, δηλαδή τις συχνότητες από τις οποίες αποτελείται και τη συµµετοχή της κάθε µίας στο σήµα. Ωστόσο δεν παρέχει καµία πληροφορία για τη χρονική στιγµή που εµφανί- Ϲονται οι συχνότητες αυτές, µε αποτέλεσµα δύο σήµατα που έχουν σηµαντικές µορφολογικές διαφορές στο πεδίο του χρόνου να εµφανίζουν µεγάλες οµοιότητες στο πεδίο της συχνότητας. Η ιδιότητα αυτή του FT µπορεί να µην αποτελεί πρόβληµα, ή ακόµα και να συνιστά πλεονέκτηµα σε άλλα πεδία εφαρµογών, όπως οι τηλεπικοινωνίες, αλλά σε ότι αφορά τα διάφορα ϐιολογικά σήµατα, και ειδικά τα ΗΕΓ, αποτυγχάνει να αναδείξει τα δυναµικά ϕαινόµενα, τις ϕυσιολογικές διεργασίες και τις παθολογικές διαφοροποιήσεις που υποκρύπτει η µορφή του σήµατος στο πεδίο του χρόνου. Η ανάλυση κυµατιδίου ϐασίζεται στην εισαγωγή µιας κατάλληλης ϐάσης και στην περιγραφή του σήµατος από την κατανοµή του πλάτους του στη ϐάση αυτή. Αν η ϐάση είναι ορθογώνια, τότε οποιαδήποτε αυθαίρετα επιλεγµένη συνάρτηση µπορεί να αναλυθεί µε µοναδικό τρόπο πάνω σε αυτή και η διαδικασία µπορεί να αντιστραφεί µε την ανασύνθεση της αρχικής συνάρτησης. Ως εκ τούτου, η ανάλυση κυµατιδίου αποτελεί την κατάλληλη µέθοδο ανίχνευσης και χαρακτηρισµού συγκεκριµένων ϕαινοµένων τόσο στο 31

Σχήµα 2.1: Τυπικές µορφές ενός Mexican Hat και ενός Morlet wavelet. πεδίο του χρόνου όσο και στο πεδίο της συχνότητας. 2.2 Κυµατίδια Το κυµατίδιο (wavelet), όπως υπονοείται από τον τίτλο του είναι µια απλή και ταχύτατα αποσβεννύµενη συνάρτηση ταλάντωσης. Σε αντίθεση µε τις συναρτήσεις ηµιτόνου και συνηµιτόνου του FT οι οποίες είναι αυστηρά τοποθετηµένες ως προς τη συχνότητα αλλά ε- κτείνονται άπειρα στο πεδίο του χρόνου, τα κυµατίδια είναι σχετικά περιορισµένα τόσο στο πεδίο της συχνότητας όσο και στο χρόνο. Επιπλέον, τα κυµατίδια αποτελούνται όχι µόνο από µια συχνότητα αλλά από ένα σχετικά µικρό εύρος διαφόρων συχνοτήτων. Εκτός από την πεπερασµένη διάρκειά τους, τα κυµατίδια µπορούν να είναι ακανόνιστα ή και ασύµµετρα, ιδιότητα που τα καθιστά ιδιαίτερα χρήσιµα στην ανάλυση σηµάτων µε απότοµες µεταβολές αλλά και στην καλύτερη περιγραφή τοπικών χαρακτηριστικών (ϐλέπε Σχήµα 2.1). 2.2.1 Ιδιότητες κυµατιδίου Η ϕαινοµενικά ακανόνιστη µορφή των κυµατιδίων όπως περιγράφηκε παραπάνω δεν σηµαίνει ότι η επιλογή τους µπορεί να είναι και εντελώς τυχαία. Πρακτικά, αυτό σηµαίνει πως δεν µπορεί να σχεδιαστεί εντελώς αυθαίρετα µια περιορισµένη χρονικά κυµατοειδής µορφή, να ονοµαστεί κυµατίδιο και να χρησιµοποιηθεί στη συνέχεια για την ανάλυση ενός σήµατος. Ακόµα όµως και αν επιτευχθεί η ανάλυση ενός σήµατος µε ένα τέτοιο αυθαίρετα επιλεγµένο κυµατίδιο τότε δεν ϑα είναι ϐέβαιη η ακριβής ανακατασκευή του. Προκειµένου µια συνάρτηση ψ( ) να µπορεί να χρησιµοποιηθεί ως κυµατίδιο για την ανάλυση ενός σήµατος και την επακόλουθη ορθή ανακατασκευή του ϑα πρέπει να διαθέτει τις ιδιότητες που αναφέρονται παρακάτω ([21], [5], [5], [25]). + ψ(t)dt = 0. Η συνθήκη αυτή δηλώνει ότι η µέση τιµή της συνάρτησης στο πεδίο του χρόνου ϑα είναι µηδέν. Εποµένως, ϑα έχει τη µορφή ενός κυµατιδίου το οποίο ϑα καλύπτει ίση επιφάνεια πάνω και κάτω από τον οριζόντιο άξονα οπότε το συνολικό του εµβαδόν ϑα είναι µηδέν. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 32

E = + ψ(t) 2 dt <. Η εξίσωση αυτή αποδίδει την ενέργεια (E) του κυµατιδίου, η οποία υπολογίζεται ολοκληρώνοντας, σε όλο το πεδίο του χρόνου, το τετράγωνο του πλάτους του ψ(t) 2. Ο περιορισµός αυτός καθιστά το κυµατίδιο σήµα πεπερασµένης ενέργειας (ή σήµα ενέργειας) και στην περίπτωση µιγαδικού κυµατιδίου υπολογίζεται κανονικά µε ϐάση το πραγµατικό και το ϕανταστικό του µέρος. C ψ <, όπου : C ψ = + 0 Ψ(f) 2 df, η σταθερά αποδεκτικότητας (admissibility con- f stant) και Ψ(f) = + ψ(t)e j2πf dt, ο FT του σήµατος. Ο περιορισµός αυτός είναι γνωστός και ως Συνθήκη Αποδεκτικότητας (Admissibility Condition) και δηλώνει ό- τι ο FT της συνάρτησης κυµατιδίου (άρα το ϕάσµα συχνοτήτων της) δεν περιέχει τη µηδενική συχνότητα. ηλαδή : Ψ(f) 2 f=0 = 0 = + ψ(t)e j2πf dt f=0 = + ψ(t)dt = 0. (2.1) Συνεπώς, πρόκειται για µια κυµατοειδή συνάρτηση µε µηδενική µέση τιµή και στην ουσία αποτελεί µια αυστηρότερη µαθηµατική έκφραση της πρώτης ιδιότητας. Οι συναρτήσεις που ικανοποιούν την παραπάνω συνθήκη µπορούν να χρησιµοποιηθούν σαν κυµατίδια για την ανάλυση και την ακριβή ανακατασκευή ενός σήµατος χωρίς απώλεια πληροφορίας. Άλλη µια συνέπεια της συνθήκης είναι ότι το ϕάσµα συχνοτήτων του κυµατιδίου ϑα έχει Ϲωνοπερατή µορφή [25]. Ενα επιπρόσθετο κριτήριο για τα µιγαδικά κυµατίδια ορίζει ότι ο FT ϑα πρέπει να είναι πραγµατικός και να µηδενίζεται για τις αρνητικές συχνότητες. 2.2.2 Κριτήρια Επιλογής Κυµατιδίου Οι ιδιότητες που αναφέρθηκαν στην προηγούµενη παράγραφο για τις συναρτήσεις κυµατιδίου αποτελούν µαθηµατικές και ϑεωρητικές διατυπώσεις που δεν µπορούν όµως να αποτελέσουν πηγή πληροφορίας στο κρίσιµο Ϲήτηµα της κατάλληλης επιλογής ενός κυµατιδίου για µια συγκεκριµένη εφαρµογή. Η επιλογή αυτή ϐέβαια ακόµα και όταν γίνεται τυχαία δεν είναι περισσότερο αυθαίρετη από ότι στην περίπτωση των συνήθων µετασχηµατισµών (Fourier, Bessel, Legendre κτλ). Ωστόσο, υπάρχουν ορισµένοι ϐασικοί παράγοντες που ϑα πρέπει να ληφθούν υπόψη και µπορούν να συνοψιστούν στους παρακάτω [20]. Ορθογωνικά ή Μη-Ορθογωνικά : Στα ορθογωνικά κυµατίδια, το πλήθος των συνελίξεων σε κάθε κλίµακα είναι ανάλογο προς το εύρος της ϐάσης των κυµατιδίων στη συγκεκριµένη κλίµακα. Η διαδικασία αυτή παράγει ένα ϕάσµα το οποίο περιέχει διακριτά τµήµατα κυµατιδιακής ισχύος και είναι κατάλληλο για επεξεργασία σηµάτων καθώς δίνει την πλέον σύντοµη και συµπαγή αναπαράσταση του σήµατος. Το µειονέκτηµά τους έγκειται στην ανάλυση χρονοσειρών όπου µια απεριοδική µετατόπιση τους αποδίδει ένα τελείως διαφορετικό ϕάσµα κυµατιδιακής ανάλυσης. Αντίθετα, η ανάλυση µε µη-ορθογώνια κυµατίδια είναι υπερπλήρης και χρονικά αµετάβλητη. Η ορθογωνιότητα στην περίπτωση αυτή χρησιµοποιείται µε την κλασική της σηµασία, δηλαδή δυο διαφο- ϱετικές συναρτήσεις ϐάσης (κυµατίδια) είναι ορθογώνιες µεταξύ τους όταν το εσωτερικό τους γινόµενο είναι µηδέν. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 33

Μιγαδικά ή πραγµατικά : Η ανάλυση µε µια µιγαδική συνάρτηση κυµατιδίου ϑα αποδώσει πληροφορίες τόσο για το πλάτος όσο και για τη ϕάση και είναι καλύτερη για την ανάδειξη ταλαντωτικής συµπεριφοράς. Η επεξεργασία µε πραγµατικό κυµατίδιο επιστρέφει µια µόνο συνιστώσα και µπορεί να χρησιµοποιηθεί για να διακρίνει αιχµές ή ασυνέχειες του σήµατος. Εύρος : Ως εύρος κυµατιδίου ορίζουµε το χρόνο που απαιτείται ώστε το πλάτος του να µειωθεί στο 1/e της αρχικής του τιµής (e-folding time). Η διακριτική ικανότητα µιας κυµατιδιακής συνάρτησης καθορίζεται από τον συµβιβασµό (trade-off) ανάµεσα στην έκταση του σήµατος στο πεδίο του χρόνου και στο πεδίο Fourier (συχνότητας). Μια συνάρτηση µε περιορισµένη έκταση στο χρόνο ϑα παρουσιάζει πολύ καλή χρονική ανάλυση αλλά πολύ µειωµένη ανάλυση στο πεδίο συχνοτήτων. Αντίστοιχα, µια συνάρτηση µε µεγαλύτερο χρονικό εύρος ϑα έχει µειωµένη διακριτική ικανότητα στο πεδίο του χρόνου και ϐελτιωµένη ανάλυση στο πεδίο συχνοτήτων. Μορφή : Η συνάρτηση κυµατιδίου ϑα πρέπει να έχει µορφή τέτοια που να προσεγγίζει, ή ϐέλτιστα να συµπίπτει, µε τα ιδιαίτερα χαρακτηριστικά του υπό ανάλυση σήµατος. Μια χρονοσειρά µε απότοµες αλλαγές ή ϐηµατικές µεταβολές αναλύεται καλύτερα µε ένα κυµατίδιο τετραγωνικής µορφής (Haar) ενώ µια χρονοσειρά που µεταβάλλεται οµαλά χρειάζεται ένα πιο οµαλό κυµατίδιο (όπως ένα αποσβεννύµενο ηµίτονο). Ωστόσο, αν το ενδιαφέρον εστιάζεται κυρίως στο ϕάσµα ισχύος του κυµατιδίου, η επιλογή της µορφής του κυµατιδίου δεν είναι κρίσιµης σηµασίας και όλες οι συναρτήσεις δίνουν τα ίδια ποσοτικά αποτελέσµατα. 2.3 Μετασχηµατισµός Κυµατιδίου Η ϐασική αναγκαιότητα για την ανάπτυξη και τη χρήση του µετασχηµατισµού κυµατιδίου WT προέκυψε από την αδυναµία του FT να αναλύσει µη στάσιµα σήµατα. Οπως µπορεί να ϕανεί και στο παρακάτω παράδειγµα, δυο εντελώς διαφορετικά σήµατα, τα οποία όµως αποτελούνται από τις ίδιες συχνότητες, αναπαριστώνται µέσω του FT µε αρκετά παρόµοιο τρόπο. Στο άνω αριστερό διάγραµµα του Σχήµατος 2.2 έχει σχεδιαστεί ένα σήµα το οποίο προέρχεται από το άθροισµα τεσσάρων συνηµίτονων διαφορετικών συχνοτήτων και περιγράφεται από την ακόλουθη σχέση : S(t) = cos(2πf 1 t) + cos(2πf 2 t) + cos(2πf 3 t) + cos(2πf 4 t) (2.2) µε {f 1, f 2, f 3, f 4 } = {10, 25, 50, 100}Hz. Πρόκειται για ένα στάσιµο σήµα καθώς σε όλη τη χρονική του διάρκεια περιέχει τις ίδιες συχνότητες, δηλαδή το ϕασµατικό του περιεχόµενο δεν µεταβάλλεται. Το κάτω αριστερό διάγραµµα του ίδιου σήµατος απεικονίζει το FT αυτού του στάσιµου σήµατος. Οπως ϕαίνεται εύκολα από το διάγραµµα του µετασχηµατισµού, το σήµα αποτελείται από 4 συνιστώσες, όσες και οι κορυφές του πλάτους που αντιπροσωπεύουν τη συγκέντρωση της ενέργειας του σήµατος στις ανάλογες συχνότητες. Το άνω δεξιό τµήµα του σχήµατος αντιστοιχεί σε ένα συνηµίτονο του οποίου η συχνότητα µεταβάλλεται και λαµβάνει διαδοχικά τις παραπάνω τιµές. Το σήµα αυτό είναι µη στάσιµο καθώς δεν διατηρεί σταθερό το ϕασµατικό του περιεχόµενο. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 34

Σχήµα 2.2: Ανάλυση ενός στάσιµου και ενός µη-στάσιµου σήµατος µε τον FT. Η ανάλυσή του µε το FT αποδίδει το διάγραµµα πλάτους που ϐρίσκεται στο κάτω δεξιό τµήµα του σχήµατος. Ο FT του µη στάσιµου σήµατος παρουσιάζει τις ίδιες κορυφές µε εκείνον του στάσιµου α- πλώς µε µεγαλύτερη διασπορά ως προς την κεντρική συχνότητα και κάποιες ταλαντώσεις στον ενδιάµεσο χώρο οι οποίες οφείλονται στις απότοµες αλλαγές της συχνότητας. Αυτές οι µικρές κορυφές στις ενδιάµεσες συχνότητες που διακρίνονται σαν ϑόρυβος εκ πρώτης όψης, αποδεικνύουν ότι και αυτές οι συχνότητες υπάρχουν στο σήµα. Οµως, ο λόγος για τον οποίο έχουν µικρό πλάτος είναι γιατί δεν αποτελούν κύριες συνιστώσες συχνότητας του σήµατος, απλώς εµφανίζονται εξαιτίας των αλλαγών από τη µία κύρια συχνότητα στην άλλη. Παρατηρείται λοιπόν ότι δυο σήµατα που διαφέρουν σηµαντικά στο πεδίο του χρόνου και στον ϕυσικό κόσµο ϑα αντιστοιχούσαν σε διαφορετικές διεργασίες, καταλήγουν, µέσω του FT, να απεικονίζονται σχεδόν µε την ίδια µορφή στο πεδίο της συχνότητας. Για το FT τα δύο σήµατα είναι τα ίδια, καθώς αποτελούνται από τις ίδιες κύριες συνιστώσες συχνότητας. Το γεγονός αυτό αναδεικνύει την αδυναµία του µετασχηµατισµού να διακρίνει χρονικά τις συνιστώσες συχνότητας, δηλαδή να προσδιορίσει σε ποιες χρονικές στιγµές εµφανίζεται κάθε συνιστώσα συχνότητας και µπορεί να λειτουργήσει παραπλανητικά για την επεξεργασία µη στάσιµων σηµάτων, όπως τα ΗΕΓ σήµατα. Προκειµένου να αντιµετωπιστεί η αδυναµία του κλασικού FT στην ανάλυση µη στάσιµων σηµάτων αναπτύχθηκε µια παραλλαγή του, η οποία ϐασίζεται στην υπόθεση ότι αν ένα µη ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 35

στάσιµο σήµα χωριστεί σε µικρότερα τµήµατα, τότε το καθένα από αυτά µπορεί να ϑεωρηθεί στάσιµο. Για τον χωρισµό, επιλέγεται µια κατάλληλη συνάρτηση παραθύρου η οποία εξασφαλίζει, µε ικανοποιητική προσέγγιση, ότι το περιεχόµενο κάθε ενός από αυτά τα τµήµατα µπορεί να ϑεωρηθεί στάσιµο. Ο µετασχηµατισµός αυτός είναι γνωστός ως FT Περιορισµένου Εύρους FT (STFT: Short-Time Fourier Transformation). Θα ανέµενε κανείς ότι µε µείωση του εύρους του παραθύρου λύνεται το πρόβληµα του χρονικού εντοπισµού των συχνοτικών συνιστωσών. Ωστόσο, το µήκος του παραθύρου δεν µπορεί να µειωθεί απεριόριστα ή τουλάχιστον δεν µπορεί να ϐελτιώσει, από κάποιο όριο και κάτω, το τελικό αποτέλεσµα. Οι ϱίζες του προβλήµατος αυτού µπορούν να αναζητηθούν στην αρχή της αβεβαιότητας του Heisenberg, η οποία αναπτύχθηκε αρχικά για την κβαντοµηχανική. Η αρχή της αβε- ϐαιότητας δηλώνει ότι δεν είναι δυνατό να προσδιοριστεί ταυτόχρονα και µε ακρίβεια η ορµή και η ϑέση ενός στοιχειώδους σωµατιδίου. Οσο µεγαλώνει η ακρίβεια µε την οποία προσδιορίζεται η ορµή του, τόσο µειώνεται η ακρίβεια (άρα και η ϐεβαιότητα) για τη ϑέση που αυτό ϐρίσκεται και αντιστρόφως. Στην περίπτωση της ανάλυσης σηµάτων, και ειδικότερα στις αναπαραστάσεις τους στο χώρο χρόνου - συχνότητας, η παραπάνω αρχή περιγράφει τη δυνατότητα προσδιορισµού κάποιας συχνότητας και της χρονικής στιγµής που αυτή εµφανίζεται. Πιο συγκεκριµένα, ορίζει ότι δεν είναι δυνατό να προσδιοριστούν επακριβώς οι ϕασµατικές συνιστώσες ενός σήµατος και συγχρόνως οι χρονικές στιγµές που οι συνιστώσες αυτές εµ- ϕανίζονται στο σήµα. Στην πραγµατικότητα, µέσω του STFT µπορούν να προσδιοριστούν τα χρονικά διαστήµατα εντός των οποίων εµφανίζονται κάποια εύρη συχνοτήτων, γεγονός που ανάγεται σε πρόβληµα ανάλυσης του κάθε χώρου (συχνότητας - χρόνου). Η αδυναµία του STFT έγκειται στο εύρος του παραθύρου που χρησιµοποιείται για να εφαρ- µοστεί στο σήµα ή, αλλιώς, στην περιοχή υποστήριξης του παραθύρου. Ο κλασικός FT δεν παρουσιάζει πρόβληµα διακριτικής ικανότητας στο πεδίο της συχνότητας καθώς αποδίδει µε ακρίβεια όλες τις ϕασµατικές συνιστώσες που υπάρχουν στο αρχικό σήµα. Συγχρόνως στο πεδίο του χρόνου, δεν υφίσταται κανένα πρόβληµα χρονικής διακριτικής ικανότητας, καθώς σε κάθε χρονική στιγµή η τιµή του σήµατος είναι επακριβώς γνωστή. Αντίθετα, η χρονική ανάλυση (ή διακριτική ικανότητα) στο πεδίο της συχνότητας και η ανάλυση συχνότητας στο πεδίο του χρόνου είναι µηδενικές. Ο σχεδόν τέλειος διαχωρισµός των συχνοτήτων στον FT οφείλεται στο γεγονός ότι ο πυρήνας του e jωt, η συνάρτηση kernel, αποτελεί παράλληλα και το παράθυρο εφαρµογής του επί του σήµατος, το οποίο περιλαµβάνει όλο το πεδίο του χρόνου (, + ). Το πεπερασµένο µήκος του χρονικού παραθύρου στον STFT, το οποίο καλύπτει µόνο ένα µέρος του σήµατος, είναι το γεγονός που προκαλεί την υποβάθµιση στην ανάλυση συχνότητας, µε αποτέλεσµα να µην είναι πλέον επακριβώς γνωστές οι συχνότητες που περιλαµβάνονται στο σήµα, αλλά περιοχές συχνοτήτων εντός των οποίων ϐρίσκονται αυτές. Αν χρησιµοποιηθεί παράθυρο µε άπειρο χρονικό εύρος, τότε ο STFT µεταπίπτει στον κλασικό FT µε τέλεια διακριτική ικανότητα στο πεδίο συχνοτήτων αλλά µε µηδενική χρονική πληροφορία, δηλαδή δεν υπάρχει καµία γνώση ως προς το πότε στο χρόνο εµφανίζονται οι συχνότητες αυτές. Επιπλέον, όσο περιορίζεται το εύρος του παραθύρου στον STFT η ανάλυση στο πεδίο του χρόνου ϐελτιώνεται και ικανοποιείται καλύτερα η παραδοχή της στασιµότητας, αλλά υποβαθµίζεται η ανάλυση συχνότητας. Αυτό το trade-off που παρατηρείται εξαιτίας της Αρχή της Αβεβαιότητας δεν αφορά µόνο τον STFT, αλλά δεσµεύει όλους τους µετασχηµατισµούς στην επεξεργασία σηµάτων. Συνεπώς, το ϐασικό ερώτηµα το οποίο πρέπει να απαντήσει κάποιος που χρησιµοποιεί τον STFT για να επιτύχει αναπαράσταση στο χώρο χρόνου - συχνότητας είναι ποιο είναι το ϐέλ- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 36

τιστο παράθυρο που µπορεί να εφαρµόσει στο σήµα του. Το πρόβληµα ϐεβαίως προκύπτει λόγω του ότι καλείται να επιλέξει ένα παράθυρο εξ αρχής, και να χρησιµοποιήσει αυτό το παράθυρο σε όλη την ανάλυση. Η απάντηση ϕυσικά είναι άµεσα εξαρτώµενη από την εφαρ- µογή. Στην περίπτωση που οι συνιστώσες συχνότητας είναι επαρκώς διαχωρισµένες µεταξύ τους από το αρχικό σήµα, τότε µπορεί να ϑυσιαστεί ένα µέρος της διακριτικής ικανότητας στο πεδίο συχνοτήτων και να επικεντρωθεί η προσπάθεια στην καλύτερη ανάλυση στο πεδίο του χρόνου. Αν όµως δεν συµβαίνει κάτι τέτοιο, η εύρεση ενός ικανοποιητικού παραθύρου µπορεί να αναχθεί σε δύσκολη διαδικασία. Σε αυτό το σηµείο, η κυµατιδιακή ανάλυση µπο- ϱεί να αντιµετωπίσει σε σηµαντικό ϐαθµό τα µειονεκτήµατα του STFT ϐελτιστοποιώντας τα αποτελέσµατα χρονικής - συχνοτικής διακριτικής ικανότητας. Η ιδέα της χρήσης κυµατιδίων για την ανάλυση σηµάτων έχει ϐρει εφαρµογές σε µια σειρά µετασχηµατισµών, η επιλογή των οποίων καθορίζεται κάθε ϕορά από τα χαρακτηριστικά των σηµάτων και τις ιδιαιτερότητες της διεργασίας. 2.3.1 Συνεχής Μετασχηµατισµός Κυµατιδίου Αν και τα προβλήµατα στο χρόνο και τη συχνότητα είναι αποτέλεσµα του ϕυσικού ϕαινοµένου που αναφέρθηκε παραπάνω και εµφανίζονται ανεξαρτήτως του ποιος µετασχηµατισµός χρησιµοποιείται, είναι δυνατό να αναλύεται κάθε σήµα χρησιµοποιώντας µια εναλλακτική προσέγγιση, την πολυδιακριτική ανάλυση (MRA: MultiResolution Analysis). Η ανάλυση αυτή, όπως υπονοείται από την ονοµασία της, αναλύει το σήµα µε διαφορετικές αναλύσεις για διαφορετικές συχνότητες. Κάθε συνιστώσα συχνότητας δεν αναλύεται εξίσου καλά ή κακά όπως στην περίπτωση του STFT. Η πολυδιακριτική ανάλυση έχει σχεδιαστεί για να δίνει καλή ανάλυση στο πεδίο του χρόνου και κακή ανάλυση στο πεδίο της συχνότητας για υψηλές συχνότητες και κακή ανάλυση στο πεδίο του χρόνου και καλή ανάλυση στο πεδίο της συχνότητας για χαµηλές συχνότητες. Αυτή η προσέγγιση έχει και πρακτικό νόηµα, όταν το δεδοµένο σήµα έχει συνιστώσες υψηλών συχνοτήτων για µικρά χρονικά διαστήµατα και συνιστώσες χαµηλών συχνοτήτων για µεγαλύτερα χρονικά διαστήµατα. Η προσέγγιση ϐέβαια δεν έχει γίνει µε τυχαίο τρόπο, καθώς τα σήµατα προς ανάλυση σε πολλές πρακτικές εφαρµογές είναι συχνά αυτού του τύπου. Ο Συνεχής Μετασχηµατισµός Κυµατιδίου (CWT: Continuous Wavelet Transform) α- ναπτύχθηκε προκειµένου να αντιµετωπισθεί το πρόβληµα στην ανάλυση που παρουσιάζει ο STFT. Η κυµατιδιακή ανάλυση πραγµατοποιείται µε παρόµοιο τρόπο προς την ανάλυση του STFT, υπό την έννοια ότι το εξεταζόµενο σήµα πολλαπλασιάζεται µε µια συνάρτηση κυµατιδίου, όπως και στην περίπτωση του STFT µε τη συνάρτηση παραθύρου, και ο µετασχηµατισµός υπολογίζεται ξεχωριστά για τα διαφορετικά τµήµατα του σήµατος στο πεδίο του χρόνου. Πα- ϱόλα αυτά, υπάρχουν δύο ουσιώδεις διαφορές, οι οποίες αποτελούν και πλεονεκτήµατα, του WT σε σχέση µε τον STFT: Το εύρος του παραθύρου που εφαρµόζεται επί του σήµατος δεν είναι σταθερό όπως στον STFT, αλλά µεταβάλλεται, καθώς ο µετασχηµατισµός υπολογίζεται για κάθε δια- ϕορετική ϕασµατική συνιστώσα του σήµατος. εν υπολογίζεται ο FT των επιµέρους παραθύρων του σήµατος, οπότε σε κάθε συνιστώσα ϑα αντιστοιχεί µια κορυφή στο πεδίο συχνοτήτων και δεν ϑα απεικονίζονται οι αρνητικές συχνότητες. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 37

Ο CWT ορίζεται ως : Ψ ψ x (a, b) = w(a) + x(t)ψ a,b(t)dt (2.3) Οπως ϕαίνεται από την παραπάνω εξίσωση, ο µετασχηµατισµός του σήµατος είναι µία συνάρτηση δύο µεταβλητών, των a, b, οι οποίες αντιστοιχούν στις παραµέτρους µεταβολής της κλίµακας και της µετατόπισης αντίστοιχα. Η ψ(t) αποτελεί τη συνάρτηση µετασχηµατισµού και ονοµάζεται µητρικής συνάρτησης κυµατιδίου. Ο όρος µητρικό κυµατίδιο παίρνει το ό- νοµά του από δύο σηµαντικές ιδιότητες της ανάλυσης κυµατιδίων : αρχικά, ο όρος κυµατίδιο σηµαίνει µικρό κύµα. Το µικρό µέγεθος αναφέρεται στο γεγονός ότι η συνάρτηση έχει πεπε- ϱασµένο µήκος. Το κύµα αναφέρεται στο γεγονός ότι η συνάρτηση παρουσιάζει ταλαντώσεις, ενώ ο όρος µητρικό υπονοεί ότι οι συναρτήσεις µε διαφορετικές περιοχές υποστήριξης που χρησιµοποιούνται στη διαδικασία µετασχηµατισµού εξάγονται από µία κύρια συνάρτηση, το µητρικό κυµατίδιο, δηλαδή ένα πρωτότυπο για την εξαγωγή όλων των υπόλοιπων συναρτήσεων παραθύρου. Μετά την επιλογή της µητρικής συνάρτησης κυµατιδίου ϑα πρέπει να γίνει η κατάλληλη τροποποίησή της ώστε να αποκτήσει ιδιότητες ευελιξίας και ελαστικότητας που απαιτεί η υλοποίηση του µετασχηµατισµού. Η οικογένεια κυµατιδίων είναι ένα σύνολο στοιχειωδών συναρτήσεων οι οποίες προέρχονται από τη µητρική συνάρτηση µέσω των δυο ακόλουθων χειρισµών : Μεταβολή της κλίµακας (συρρίκνωση - συστολή ή διεύρυνση - διαστολή του ϐασικού κυµατιδίου) και Μετάθεση, δηλαδή µετατόπιση του ϐασικού κυµατιδίου σε διαφορετικές ϑέσεις στο χρόνο, για οποιαδήποτε κλίµακα χωρίς να µεταβάλλεται το σχήµα του. Η συρρίκνωση και διεύρυνση του κυµατιδίου ελέγχονται από την παράµετρο διαστολής της κλίµακας a ενώ η µετατόπιση του κατά µήκος του άξονα του χρόνου καθορίζεται από την παράµετρο µετατόπισης b. Η παράµετρος a λειτουργεί ανάλογα προς το µέγεθος της κλίµακας στους γεωγραφικούς χάρτες. Οπως και στην περίπτωση των χαρτών, οι υψηλές κλίµακες αντιστοιχούν σε ευρύτερες απεικονίσεις του σήµατος ενώ οι χαµηλές κλίµακες σε πιο λεπτο- µερείς. Αντίστοιχα, οι χαµηλές συχνότητες (υψηλές κλίµακες) αντιστοιχούν στη γενικότερη (ευρύτερη) πληροφορία του σήµατος η οποία συνήθως προέρχεται σχεδόν από ολόκληρη την έκτασή του, ενώ οι υψηλές συχνότητες (χαµηλές κλίµακες) αντιστοιχούν σε λεπτοµερή πληρο- ϕορία µοτίβων µικρής χρονικής διάρκειας. Το ϐασικότερο τµήµα των περισσότερων σηµάτων αποτελείται από το χαµηλής συχνότητας περιεχόµενο καθώς είναι αυτό που ουσιαστικά το χαρακτηρίζει, ενώ το περιεχόµενο υψηλών συχνοτήτων αποδίδει τις αποχρώσεις του σήµατος. Η ανθρώπινη ϕωνή παραδείγµατος χάριν ακούγεται διαφορετικά, αποκτά άλλη χροιά, όταν αφαιρεθούν οι υψηλότερες συχνότητες αλλά παρά ταύτα εξακολουθεί να διακρίνεται το νόη- µα. Ωστόσο, αν αφαιρεθούν αρκετές από τις χαµηλότερες συχνότητες τότε το νόηµα χάνεται. Οπως αναφέρθηκε και παραπάνω, στις πρακτικές εφαρµογές οι µικρές κλίµακες (υψηλές συχνότητες) δεν καταλαµβάνουν συνήθως όλη τη διάρκεια του σήµατος αλλά εµφανίζονται σαν εξάρσεις ή αιχµές σε µικρά χρονικά διαστήµατα. Αντίθετα, οι υψηλές κλίµακες εκτείνονται ως επί το πλείστον σε όλο το χρονικό εύρος του σήµατος. Οι δυο αυτές παράµετροι µπορούν να ενσωµατωθούν στον τύπο του κυµατιδίου οπότε οι ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 38

Σχήµα 2.3: Επίδραση των παραµέτρων διαστολής a και µετάθεσης b στο µητρικό κυµατίδιο τύπου Morlet. τροποποιηµένες µορφές της µητρικής συνάρτησης ϑα συµβολίζονται ως : ( ) t b ψ a,b = ψ a (2.4) όπου a η παράµετρος διαστολής και b η παράµετρος µετατόπισης. Είναι σαφές ότι για b = 0 και a = 1, η παραπάνω σχέση ϑα αντιστοιχεί στη µητρική συνάρτηση. Αν f(t) είναι µια δοσµένη συνάρτηση, τότε η f(st) αντιστοιχεί σε µια πιο συρρικνωµένη εκδοχή της όταν s > 1 και σε µια πιο διευρυµένη όταν s < 1. Ωστόσο, επειδή στον ορισµό του µετασχηµατισµού, η παράµετρος της κλίµακας a ϐρίσκεται στον παρονοµαστή, ισχύει στην ουσία το αντίστροφο. ηλαδή, οι τιµές κλίµακας a > 1 διευρύνουν τη συνάρτηση κυµατιδίου, ενώ για a < 1 το κυµατίδιο συρρικνώνεται. Στο Σχήµα 2.3 παρουσιάζεται µια τυπική µητρική συνάρτηση κυµατιδίου Morlet η οποία διαστέλλεται και συστέλλεται κατά το διπλάσιο και το µισό, αντίστοιχα, σε σχέση µε το αρχικό της εύρος στον άξονα του χρόνου (αριστερά διαγράµµατα), ενώ παράλληλα παρουσιάζεται η µετατόπιση της ίδιας µητρικής συνάρτησης για διάφορες τιµές της παραµέτρου b (δεξιά διαγράµµατα). ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 39

2.3.1.1 Υπολογισµός του Συνεχούς Μετασχηµατισµού Κυµατιδίου Επανερχόµενοι στην εξίσωση του CWT και αφού έχει επιλεχθεί η µητρική συνάρτηση κυµατιδίου, ο υπολογισµός του µετασχηµατισµού ξεκινά από την τιµή a = 1 για την παράµετρο κλίµακας και συνεχίζεται για µεγαλύτερες και µικρότερες τιµές της. Συνήθως δεν χρειά- Ϲεται ο πλήρης µετασχηµατισµός κυµατιδίου, καθώς στις πρακτικές εφαρµογές τα σήµατα είναι πεπερασµένου ϕασµατικού εύρους οπότε αρκεί ο υπολογισµός του CWT για ένα πε- ϱιορισµένο πλήθος τιµών κλίµακας. Ετσι κάθε τιµή του CWT υπολογίζεται για µία τιµή της παραµέτρου a, η οποία δηλώνει κατά πόσο διευρυµένο ή συρρικνωµένο είναι το κυµατίδιο που χρησιµοποιήθηκε για τη συγκεκριµένη τιµή του, και για µία τιµή της παραµέτρου b, που δείχνει πόσο µετατοπισµένο είναι το κυµατίδιο σε σχέση µε την αρχή του σήµατος στο χρόνο (το σηµείο 0 αναφέρεται στην αρχή του σήµατος). Ο αστερίσκος στην εξίσωση 5 υποδεικνύει ότι για τον υπολογισµό του ολοκληρώµατος λαµβάνεται ο συζυγής της συνάρτησης κυµατιδίου, κάτι που έχει πρακτική σηµασία όταν χρησιµοποιούνται µιγαδικές συναρτήσεις 1 κυµατιδίων. Η συνάρτηση w(a), που αποτελεί τη συνάρτηση ϐάρους και ορίζεται ως, a χρησιµεύει στο να διασφαλιστεί ότι τα κυµατίδια σε όλες τις κλίµακες ϑα διαθέτουν την ίδια ενέργεια. Μπορεί να οριστεί και ως w(a) = 1 καθώς και µε άλλες εναλλακτικές µορφές που a ϐελτιώνουν τα αποτελέσµατα κάποιων συγκεκριµένων εφαρµογών. Οπότε ο CWT για ένα σήµα x(t) L 2 (R) λαµβάνει τελικά τη µορφή : Ψ ψ x (a, b) = 1 + a ( ) t b x(t)ψ dt (2.5) a και αντιστοιχεί στη συσχέτιση µεταξύ της συνάρτησης (σήµα x(t)) µε την οικογένεια των κυ- µατιδίων για κάθε (a, b). Ο χώρος L 2 (R), ο οποίος αποτελεί χώρο Hilbert, περιλαµβάνει το σύνολο των πραγµατικών και τετραγωνικά ολοκληρώσιµων συναρτήσεων. Ο όρος τετραγωνικά ολοκληρώσιµες, περιγράφει τις συναρτήσεις µε πεπερασµένο ολοκλήρωµα του τετράγωνου της απόλυτης τιµής τους. Η πρόταση αυτή συνοψίζεται στην ακόλουθη µαθηµατική έκφραση : x(t) 2 dt < (2.6) S Το σήµα x(t) µπορεί να προέρχεται από µια πληθώρα εφαρµογών και διεργασιών όπως τα ϐιοσήµατα, τα ακουστικά σήµατα, τις µηχανικές ταλαντώσεις µιας επιφάνειας ή ακόµα και τους οικονοµικούς δείκτες. Οπως µπορεί να ϕανεί και από τον ορισµό του CWT, το γινόµενο του κυµατιδίου µε το σήµα ολοκληρώνεται σε όλη την έκταση του σήµατος, µια διαδικασία που εκφράζει µε µαθηµατικούς όρους τη συνέλιξη. Η κανονικοποιηµένη, σε ότι αφορά το ενεργειακό περιεχόµενο, κυµατιδιακή συνάρτηση µπορεί να πάρει την ακόλουθη, πιο συµπαγή µορφή : ψ a,b (t) = 1 ( ) t b ψ (2.7) a a οπότε το ολοκλήρωµα του µετασχηµατισµού µπορεί πλέον να γραφτεί ως : Ψ ψ x (a, b) = + x(t)ψ a,b(t)dt =< x, ψ a,b > (2.8) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 40

Η επίδραση που έχει η αύξηση της παραµέτρου διαστολής της κλίµακας στο ενεργειακό ϕάσµα ενός τυπικού κυµατιδίου Morlet περιγράφεται στο Σχήµα 2.4. Παρατηρείται ότι όταν το κυµατίδιο διευρύνεται στο πεδίο του χρόνου, το ενεργειακό του ϕάσµα συρρικνώνεται. Το αποτέλεσµα αυτό είναι αναµενόµενο καθώς η διεύρυνση του σήµατος στο πεδίο του χρόνου, συνεπάγεται υποχρεωτικά την επιµήκυνση των χρονικών περιόδων και τη µείωση των αντίστοιχων συχνοτήτων. Συνεπώς, η παράµετρος διαστολής a είναι αντιστρόφως ανάλογη προς όλες τις χαρακτηριστικές συχνότητες. [!ηβπ] Σχήµα 2.4: Επίδραση της παραµέτρου διαστολής της κλίµακας α στο ενεργειακό ϕάσµα του κυµατιδίου τύπου Morlet. Ο τρόπος µε τον οποίο συσχετίζεται το κυµατίδιο µε το σήµα, που ελέγχεται από τις παραµέτρους a, b (µετάθεση - διαστολή), µπορούν να γίνουν κατανοητοί από τη γραφική αναπαράσταση του Σχήµατος 2.5 που ακολουθεί. Στο πρώτο διάγραµµα του σχήµατος, παρουσιάζεται ένα κυµατίδιο κλίµακας a, µετατοπισµένο κατά ένα διάστηµα b επί του άξονα του χρόνου, το οποίο υπερτίθεται σε ένα τυχαίο σήµα. Τα χρονικά διαστήµατα όπου τόσο το κυµατίδιο όσο και το σήµα λαµβάνουν οµόσηµες τιµές (περιοχές A και B) συνεισφέρουν ϑετικά στο ολοκλήρωµα του µετασχηµατισµού. Αντίθετα, στα διαστήµατα όπου το σήµα έχει διαφο- ϱετικό πρόσηµο από το κυµατίδιο (όπως δηλαδή στα τµήµατα C, D και E), η συνεισφορά στο ολοκλήρωµα του µετασχηµατισµού είναι αρνητική. Το δεύτερο διάγραµµα παρουσιάζει ένα κυµατίδιο σταθερής κλίµακας να µετατοπίζεται ϐαθµιαία σε τέσσερις διαφορετικές ϑέσεις του σήµατος. Στη ϑέση b 1, το κυµατίδιο αλληλεπιδρά µε ένα τµήµα του σήµατος µε το οποίο παρουσιάζει συνάφεια ως προς τη µορφή, µε αποτέλεσµα µια σχετικά µεγάλη τιµή του ολοκληρώµατος Ψ ψ x (a, b) και συνεπώς του CWT. Η ϑέση b 2 περιλαµβάνει τόσο ϑετικές όσο και αρνητικές συνεισφορές (εκατέρωθεν της κεντρικής ϑέσης του κυµατιδίου), οι οποίες αλληλοεξουδετερώνονται σε µεγάλο ϐαθµό οδηγώντας τελικά σε µια σχεδόν µηδενική τιµή του ολοκληρώµατος. Το κυµατίδιο και το σήµα ϐρίσκονται εκτός ϕάσης στη ϑέση b 3, γεγονός που συνεπάγεται µια σχετικά µεγάλη αλλά αρνητική τιµή για το µετασχηµατισµό. Στη ϑέση b 4 το κυµατίδιο µε το σήµα ϐρίσκονται επίσης έκτος ϕάσης µε τη διαφορά όµως ότι το σήµα πλέον εµφανίζει µια τοπικά µεγάλη µέση τιµή. Από τη γραφική ερµηνεία µπορεί να ϕανεί εύκολα ότι η τοπική συνιστώσα µέσης τιµής έχει τόσο ϑετικές όσο και αρνητικές συνεισφορές στο ολοκλήρωµα του µετασχηµατισµού. Αυτό έχει σαν αποτέλεσµα την ανάδειξη µόνο των τοπικών χαρακτηριστικών του σήµατος από τον µετασχηµατισµό στη συγκεκριµένη τοποθεσία, ενώ η µέση τιµή εξουδετερώνεται. Μέσα από τη διαδικασία που περιγράφηκε, ο CWT αναγνωρίζει συναφείς δοµές µεταξύ του σήµατος και του κυµατιδίου για διάφορες τιµές της κλίµακας, οι οποίες αποκαλύπτουν τον συσχετισµό ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 41

Σχήµα 2.5: Γραφική αναπαράσταση και ερµηνεία της αλληλεπίδρασης σήµατος και κυµατιδίου. µεταξύ των συχνοτικών περιεχοµένων τους. Αυξάνοντας την τιµή της παραµέτρου µετάθεσης b, το κυµατίδιο µετακινείται κατά µήκος του σήµατος στον άξονα του χρόνου, αναδεικνύοντας τις µεταξύ τους συνεκτικές δοµές, οπότε και την κοινή συχνοτική τους πληροφορία, και αντιστοιχώντας τις µε τη δεδοµένη (τρέχουσα) τιµή της κλίµακας a. Η διαδικασία αυτή επαναλαµβάνεται για ένα σύνολο τιµών της κλίµακας, άρα και της συχνότητας, µέχρι να διακριθούν όλες οι επιθυµητές δοµές, ή αλλιώς όλα τα σηµαντικά χαρακτηριστικά, που εξετάζονται στο σήµα που αναλύεται. Ενα απλούστερο παράδειγµα που απεικονίζει µε αρκετή σαφήνεια την εξάρτηση του µετασχηµατισµού από τη ϑέση και την κλίµακα του κυµατιδίου, είναι η αλληλεπίδραση ενός απλού ηµιτονοειδούς σήµατος µε ένα κυµατίδιο Mexican Hat για διάφορες τιµές των παρα- µέτρων (a, b). Τα διαγράµµατα I, II & III στο αριστερό τµήµα του Σχήµατος 2.6 αντιστοιχούν σε ένα κυµατίδιο σταθερής κλίµακας, το οποίο υπερτίθεται του ηµιτονοειδούς σήµατος για διαφορετικές τιµές της παραµέτρου b. Οπως µπορεί να ϕανεί εύκολα από το διάγραµµα I, υπάρχει µεγάλη συσχέτιση µεταξύ κυµατιδίου και σήµατος για τις συγκεκριµένες τιµές ϑέσης και κλίµακας, οπότε παρουσιάζουν παρόµοιο συχνοτικό περιεχόµενο, µε αποτέλεσµα το ολοκλήρωµα του γινοµένου τους να αποδώσει µια µεγάλη ϑετική τιµή για τον µετασχηµατισµό. Το διάγραµµα II απεικονίζει το ίδιο κυµατίδιο µετατοπισµένο σε µια καινούρια ϑέση όπου πλέον ϐρίσκεται εκτός ϕάσης µε το σήµα γεγονός που οδηγεί σε µια σχετικά µεγάλη, κατά µέτρο, αλλά αρνητική τιµή του µετασχηµατισµού. Στο διάγραµµα III, το αποτέλεσµα του µετασχηµατισµού είναι σχεδόν µηδέν λόγω της αλληλεξουδετέρωσης των ϑετικών και αρνητικών συνεισφορών από τη σχετική ϑέση κυµατιδίου και σήµατος. Τα διαγράµµατα IV & V στο δεξιό µέρος Σχήµατος 2.6 παρουσιάζουν τα αποτελέσµατα της αλληλεπίδρασης του ίδιου µητρικού κυµατιδίου αλλά για διαφορετικές τιµές κλίµακας έτσι ώστε να αποκλίνει σηµαντικά από τη µορφή του σήµατος και να µη σχετίζεται συχνοτικά σε µεγάλο ϐαθµό µε αυτό. Το διάγραµµα IV αντιστοιχεί στη χρήση ενός κυµατιδίου Mexican Hat µικρότερης κλίµακας, µε αποτέλεσµα η συνέλιξη τόσο των ϑετικών όσο και των αρνητικών τµηµάτων του να γίνεται µε την ίδια σχεδόν περιοχή του σήµατος. Η τιµή, συνεπώς, του µετασχηµατισµού ϑα είναι αρκετά µικρή και όσο η παράµετρος της κλίµακας µειώνεται, τόσο και αυτή ϑα τείνει στο µηδέν. Αυτό µε τη σειρά του δείχνει ότι η συσχέτιση µεταξύ των ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 42

Σχήµα 2.6: Συσχέτιση κυµατιδίου Mexican Hat µε ένα απλό ηµιτονοειδές σήµα για διάφορες τιµές των παραµέτρων a, b. συχνοτικών συνιστωσών κυµατιδίου και σήµατος είναι ελάχιστη έως µηδενική. Η χρήση ενός κυµατιδίου αρκετά µικρής κλίµακας έχει νόηµα σε περίπτωση που το υπό ανάλυση σήµα παρουσιάζει εξάρσεις ή αιχµές υψηλού συχνοτικού περιεχοµένου και µικρής χρονικής διάρκειας, γεγονός που δεν παρατηρείται στο δεδοµένο ηµιτονοειδές σήµα, και οπότε η συσχέτιση µεταξύ τους είναι µικρή. Το ίδιο συµβαίνει και όταν η τιµή της κλίµακας αυξηθεί υπερβολικά (διάγραµµα V) καθώς τότε το κυµατίδιο ϑα καλύπτει σχεδόν εξίσου τις περιοδικά επαναλαµβανόµενες (αρνητικές και ϑετικές) περιοχές του σήµατος οδηγώντας σε µηδενικές τιµές του ολοκληρώµατος. Ενα κυµατίδιο τόσο υψηλής κλίµακας εµφανίζει µεγάλη συσχέτιση µε σήµατα πολύ χαµηλών συχνοτικών συνιστωσών, µε αποτέλεσµα σε µία τέτοια περίπτωση ο µετασχηµατισµός να αποφέρει υψηλές τιµές. Είναι σαφές ότι όταν η συνάρτηση του κυµατιδίου διασταλεί ή συρρικνωθεί σηµαντικά σε σχέση µε τα µορφολογικά χαρακτηριστικά του σήµατος τότε ο µετασχηµατισµός κυµατιδίου τείνει προς µηδενικές τιµές. 2.3.1.2 Μαθηµατική προσέγγιση του CWT Η υποενότητα αυτή καλύπτει το κύριο υπόβαθρο της ϑεωρίας της κυµατιδιακής ανάλυσης, το οποίο αποτελεί και το υπόβαθρο των περισσότερων τεχνικών ανάλυσης σηµάτων. Ο FT χρησιµοποιεί συναρτήσεις ϐάσης για την ανάλυση και την ανακατασκευή της συνάρτησης. Κάθε ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 43

διάνυσµα σε ένα διανυσµατικό χώρο µπορεί να περιγραφεί ως ένας γραµµικός συνδυασµός των διανυσµάτων ϐάσης του χώρου αυτού, πολλαπλασιάζοντας τα διανύσµατα µε κάποιες σταθερές και έπειτα αθροίζοντας τα γινόµενα µεταξύ τους. Η ανάλυση του σήµατος εµπε- ϱιέχει την εκτίµηση των συντελεστών µετασχηµατισµού (σταθερές στους πολλαπλασιασµούς), ενώ η σύνθεση ή ανακατασκευή αντιστοιχεί στον υπολογισµό του γραµµικού συνδυασµού. ιανύσµατα Βάσης : Η ϐάση ενός διανυσµατικού χώρου V είναι ένα σετ γραµµικά ανεξάρτητων διανυσµάτων, τέτοια ώστε κάθε διάνυσµα v στο χώρο V να µπορεί να περιγραφεί ως ένας γραµµικός συνδυασµός των διανυσµάτων αυτών. Περισσότερες από µία ϐάσεις µπορούν να αντιστοιχούν σε ένα διανυσµατικό χώρο, όµως όλες οι ϐάσεις του ϑα έχουν τον ίδιο αριθµό διανυσµάτων, µε τον αριθµό αυτό να είναι γνωστός ως η διάσταση του διανυσµατικού χώρου. Για παράδειγµα, για ένα δισδιάστατο διανυσµατικό χώρο η ϐάση του ϑα αποτελείται από δύο διανύσµατα. Η παρακάτω εξίσωση δείχνει πως ένα διάνυσµα v µπορεί να περιγραφεί σαν ένας γραµµικός συνδυασµός των διανυσµάτων ϐάσης b k και των αντίστοιχων συντελεστών v k. v = k v k b k (2.9) Η υπόθεση αυτή µπορεί να γενικευτεί εύκολα από τα διανύσµατα στις συναρτήσεις, αντικαθιστώντας τα διανύσµατα ϐάσης b k µε συναρτήσεις ϐάσης φ k, και το περιγραφόµενο διάνυσµα v µε µία συνάρτηση f(t). Η παραπάνω εξίσωση τότε παίρνει τη µορφή : f(t) = k µ k φ k (t) (2.10) Οι µιγαδικές εκθετικές συναρτήσεις (αναλύονται σε ηµίτονα και συνηµίτονα) αποτελούν τις συναρτήσεις ϐάσης για τον FT. Επιπρόσθετα, αποτελούν ορθογώνιες συναρτήσεις και έτσι διαθέτουν κάποιες επιθυµητές ιδιότητες όσον αφορά στην ανακατασκευή των συναρτήσεων που αναλύονται. Εστω f(t) και g(t) οι δύο συναρτήσεις του χώρου L 2 [a, b] (το σύνολο των τετραγωνικά ολοκληρώσιµων συναρτήσεων στο διάστηµα [a, b]). Το εσωτερικό γινόµενο των δύο συναρτήσεων ορίζεται ως : < f(t), g(t) >= b a f(t)g (t)dt (2.11) Σύµφωνα µε τον παραπάνω ορισµό του εσωτερικού γινοµένου, ο CWT µπορεί να ϑεω- ϱηθεί ως το εσωτερικό γινόµενο του σήµατος που αναλύεται µε τις συναρτήσεις ϐάσης ψa,b (t) οδηγώντας τελικά στην Εξίσωση (2.8) (µε τις συναρτήσεις ϐάσης να ορίζονται από την Εξίσωση (2.7) ). Ο ορισµός του CWT αποδεικνύει ότι η ανάλυση κυµατιδίου είναι ένα µέτρο της οµοιότητας µεταξύ των συναρτήσεων ϐάσης (κυµατίδια) και του σήµατος που αναλύεται. Σε αυτή την περίπτωση, η οµοιότητα µπορεί να εννοηθεί ως προς το συχνοτικό περιεχό- µενο µε τους υπολογιζόµενους συντελεστές να αναφέρονται ως προς αυτή που υπάρχει µεταξύ σήµατος και κυµατιδίου στην τρέχουσα κλίµακα. Συµπερασµατικά, δίνεται µία καλύτερη επεξήγηση ως προς τη συσχέτιση του σήµατος µε το κυµατίδιο σε µία δεδοµέ- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 44

νη κλίµακα. Αν το σήµα έχει µία επικρατούσα συνιστώσα συχνότητας που αντιστοιχεί στη δεδοµένη κλίµακα του κυµατιδίου, τότε το συγκεκριµένο κυµατίδιο ϑα είναι σχεδόν παρόµοιο µε το σήµα στη ϑέση όπου υπάρχει η συχνότητα αυτή. Συνεπώς, ο συντελεστής του CWT που υπολογίζεται σε αυτό το σηµείο στο επίπεδο χρόνου - κλίµακας ϑα έχει µία σχετικά µεγάλη τιµή. Εσωτερικό Γινόµενο, Ορθογωνιότητα και Ορθοκανονικότητα : ύο διανύσµατα v, w ϑεωρούνται ορθογώνια αν το εσωτερικό τους γινόµενο είναι µηδενικό : < v, w >= n v n w n = 0 (2.12) Παροµοίως, δύο συναρτήσεις f(t) και g(t) ϑεωρούνται ορθογώνιες µεταξύ τους αν το εσωτερικό τους γινόµενο είναι µηδενικό : < f(t), g(t) >= b a f(t)g (t)dt = 0 (2.13) Ενα σύνολο διανυσµάτων v 1, v 2,..., v n ϑεωρείται ορθοκανονικό, αν τα διανύσµατα είναι ανά δύο ορθογώνια µεταξύ τους και είναι όλα µοναδιαία. Το τελευταίο εκφράζεται και ως : < v m, v n >= δ mn (2.14) Παροµοίως, ένα σύνολο συναρτήσεων φ k (t), k = 1, 2, 3,..., ϑεωρείται ορθοκανονικό, αν : και ή ισοδύναµα b a φ k (t)φ l (t)dt = 0 µε k l (2.15) b a b a φ k (t) 2 dt = 1 (2.16) φ k (t)φ l (t)dt = δ kl, (2.17) όπου το δ kl είναι γνωστό και ως η συνάρτηση δέλτα του Kronecker: δ kl = { 1 αν k = l 0 αν k l (2.18) Οπως αναφέρθηκε, µπορεί να υπάρχουν πάνω από ένα σύνολο συναρτήσεων ϐάσης (ή διανυσµάτων ϐάσης) για ένα δεδοµένο χώρο. Μεταξύ αυτών, οι ορθοκανονικές συναρτήσεις ϐάσης έχουν ιδιαίτερη σηµασία, καθώς παρουσιάζουν ιδιαιτέρα καλές ιδιότητες στην εύρεση των συντελεστών ανάλυσης. Οι ορθοκανονικές ϐάσεις επιτρέπουν τον υπολογισµό των συντελεστών µ k µε ένα πολύ απλό και άµεσο τρόπο χρησιµοποιώντας την ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 45

ιδιότητα της ορθοκανονικότητας : µ k =< f, φ k >= b a f(t)φ k(t)dt (2.19) και η συνάρτηση f(t) µπορεί να ανακατασκευαστεί αντικαθιστώντας στην εξίσωση 3-10 τους συντελεστές που έχουν προκύψει : f(t) = k µ k φ k (t) = k < f, φ k > φ k(t) (2.20) Οι ορθοκανονικές ϐάσεις µπορεί να µην είναι διαθέσιµες για κάθε τύπο εφαρµογής, όπου µπορεί να χρησιµοποιηθεί η πιο γενικευµένη εκδοχή των διορθογώνιων ϐάσεων. Ο όρος διορθογώνιες αναφέρεται σε δύο διαφορετικές ϐάσεις, οι οποίες είναι ορθογώνιες µεταξύ τους, αλλά η κάθε µία δε διαµορφώνει από µόνη της ένα ορθογώνιο σύνολο συναρτήσεων (ή διανυσµάτων). Σηµειώνεται ότι σε ορισµένες εφαρµογές αποκλείεται και η περίπτωση των διορθογώνιων ϐάσεων, οπότε χρησιµοποιούνται πλαίσια (frames). 2.3.1.3 Ανάλυση και απεικόνιση στο πεδίο χρόνου - συχνότητας Εστιάζοντας καλύτερα στις ιδιότητες ανάλυσης του WT, αξίζει να σηµειωθεί ότι η ανάλυση είναι και ο ϐασικός λόγος που απαιτούσε την εισαγωγή του σε σχέση µε άλλους µετασχηµατισµούς (STFT). Το Σχήµα 2.7 ή παραλλαγές του χρησιµοποιούνται συχνά για να εξηγήσουν πως να ερµηνεύονται οι αναλύσεις στη συχνότητα και στο χρόνο. Κάθε κουτί στο σχήµα αντιστοιχεί σε µία τιµή του WT στο χώρο χρόνου - συχνότητας. Σηµειώνεται ότι τα κουτιά καταλαµβάνουν µία συγκεκριµένη µη µηδενική περιοχή, κάτι που υπονοεί ότι η ακριβής τιµή ενός συγκεκριµένου σηµείου στο χώρο δεν µπορεί να είναι γνωστή. Ολα τα σηµεία του επιπέδου συχνότητας - χρόνου που ϐρίσκονται µέσα σε ένα κουτί αντιπροσωπεύονται από µία τιµή του WT. Μία πρώτη παρατήρηση που µπορεί να γίνει είναι ότι παρότι τα πλάτη και τα ύψη των κουτιών αλλάζουν, το εµβαδόν του κάθε κουτιού παραµένει σταθερό. Ο χώρος χρόνου- συχνότητας ισοµοιράζεται στα κουτιά και έτσι κάθε κουτί αντιπροσωπεύει ένα τµήµα του χώρου µε δια- ϕορετικές αναλογίες ως προς το χρόνο και τη συχνότητα. Στις χαµηλές συχνότητες, το ύψος των κουτιών είναι χαµηλότερο, το οποίο αντιστοιχεί σε καλύτερη ανάλυση συχνότητας καθώς υπάρχει λιγότερη ασάφεια σε σχέση µε την τιµή του Μ/Σ σε µία συγκεκριµένη συχνότητα, αλλά το πλάτος είναι µεγαλύτερο, που αντιστοιχεί σε χειρότερη ανάλυση στο χρόνο καθώς υπάρχει περισσότερη ασάφεια σε σχέση µε την τιµή σε µία συγκεκριµένη χρονική στιγµή. Σε υψηλότερες συχνότητες το πλάτος των κουτιών µειώνεται, δηλαδή η ανάλυση στο χρόνο γίνεται καλύτερη, και το ύψος των κουτιών αυξάνεται, δηλαδή η ανάλυση στη συχνότητα γίνεται χειρότερη. Στο Σχήµα 2.7 το πρώτο πιο συρρικνωµένο κυµατίδιο (µικρότερης κλίµακας) παρουσιάζει χειρότερη ανάλυση στο πεδίο της συχνότητας και καλύτερη στο πεδίο του χρόνου, σε σχέση µε το δεύτερο πιο διευρυµένο κυµατίδιο (µεγαλύτερης κλίµακας)[2]. Σε αυτό το σηµείο, αξίζει να επισηµανθεί ότι στον STFT οι αναλύσεις στο χρόνο και στη συχνότητα καθορίζονται από το εύρος της ανάλυσης παραθύρου, το οποίο επιλέγεται µία ϕορά για ολόκληρη τη διαδικασία ανάλυσης. Συνεπώς και οι δύο αναλύσεις παραµένουν σταθερές, ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 46

Σχήµα 2.7: Τα κουτιά ϐοηθούν στην ερµηνεία των ιδιοτήτων ανάλυσης στο χρόνο και στη συχνότητα µέσω του κατακερµατισµού του χώρου χρόνου - συχνότητας. οπότε και ο χώρος συχνότητας - χρόνου αποτελείται από τετράγωνα κουτιά (λόγω του ότι ο χώρος πρέπει να ισοµοιράζεται στα κουτιά). Ανεξαρτήτως των διαστάσεων των κουτιών, τα εµβαδά όλων των κουτιών (και στον STFT και στον CWT) είναι ίσα, καθοριζόµενα και περιο- ϱιζόµενα από την αρχή της αβεβαιότητας του Heisenberg, δηλαδή το εµβαδόν ενός κουτιού είναι συγκεκριµένο για κάθε συνάρτηση παραθύρου στον STFT και κάθε µητρική συνάρτηση κυµατιδίου στον CWT, ενώ διαφορετικά παράθυρα ή µητρικά κυµατίδια έχουν ως αποτέλεσµα διαφορετικά εµβαδά. Παρόλα αυτά, όλα τα εµβαδά για τα κουτιά περιορίζονται στο 1 4 π, δηλαδή δεν είναι δυνατό να µειωθεί το εµβαδόν ενός κουτιού πέρα από αυτή την τιµή εξαιτίας της αρχής της αβεβαιότητας. Από την άλλη πλευρά, για ένα δεδοµένο µητρικό κυµατίδιο οι διαστάσεις του κουτιού δεν είναι σταθερές και µπορούν να αλλάζουν, διατηρώντας πάντα το εµβαδόν του σταθερό. Ετσι, ο WT επιτυγχάνει διαφορετικές αναλύσεις στο χρόνο και στη συχνότητα, δίνοντας ϐάρος ανάλογα µε την εφαρµογή. Ο CWT δεν υπολογίζεται συνήθως για αυθαίρετες τιµές κλίµακας ή κάποιες µεµονωµένες ϑέσεις αλλά για ένα συνεχές εύρος τιµών των δυο παραµέτρων (a, b). Το διάγραµµα τριών διαστάσεων συνιστά µια εύληπτη αναπαράσταση η οποία απεικονίζει τις τιµές των παραµέτρων (a, b) στους οριζόντιους άξονες και τις αντίστοιχες τιµές του CWT στον κατακόρυφο άξονα. Η κωδικοποίηση των τιµών του γίνεται µε ϐάση κάποια χρωµατική κλίµακα όπως ϕαίνεται στο δεύτερο διάγραµµα του Σχήµα 2.8. Από τα διαγράµµατα στο σχήµα µπορεί να ϕανεί ότι για τις πολύ µικρές ή για τις πολύ µεγάλες τιµές της κλίµακας ο µετασχηµατισµός τείνει στο µηδέν, ενώ στις ενδιάµεσες τιµές παρατηρούνται κάποιες κυµατοµορφές που αντιστοιχούν στα κυµατίδια παρεµφερούς κλίµακας µε το υπό εξέταση σήµα. Οπως αναφέρθηκε, ο ορισµός για τον CWT δείχνει ότι η κυµατιδιακή ανάλυση συνιστά ένα µέτρο οµοιότητας του ϕασµατικού περιεχοµένου µεταξύ των συναρτήσεων ϐάσης που είναι τα κυµατίδια και του ίδιου του σήµατος. Οι συντελεστές που υπολογίζονται από το ολοκλήρωµα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 47

Σχήµα 2.8: Τρισδιάστατη απεικόνιση του CWT (ΣΜΚ) ενός ηµίτονου 10 Hz. εκφράζουν την οµοιότητα του σήµατος µε το κυµατίδιο σε ορισµένη κλίµακα. Οταν στο σή- µα περιλαµβάνεται κάποια χαρακτηριστική ϕασµατική συνιστώσα που αντιστοιχεί σε κάποια κλίµακα ανάλυσης, τότε το κυµατίδιο (η συνάρτηση ϐάσης του µετασχηµατισµού δηλαδή) ϑα προσεγγίζει το σήµα στη χρονική περιοχή όπου υφίσταται η συγκεκριµένη ϕασµατική συνιστώσα. Οπότε, ο συντελεστής του CWT που υπολογίζεται στο σηµείο αυτό ϑα έχει µια σχετικά µεγάλη τιµή αναπαράστασης στο πεδίο χρόνου - κλίµακας. 2.3.2 ιακριτός Μετασχηµατισµός Κυµατιδίου (DWT) Ο υπολογισµός του CWT, όπως άλλωστε και του FT, γίνεται στην πράξη µέσω αλγορίθµων µε τη χρήση υπολογιστών και όχι µε την επίλυση αναλυτικών εξισώσεων και ολοκληρωµάτων, οπότε καθίσταται αναγκαία η διακριτοποίηση των µετασχηµατισµών. Ο πλέον εύκολος τρόπος για να πραγµατοποιηθεί αυτό είναι µε οµοιόµορφη δειγµατοληψία στο επίπεδο χρόνου - κλίµακας (συχνότητας) του µετασχηµατισµού. Ωστόσο, ειδικά για την περίπτωση του CWT, η µεταβολή της κλίµακας µπορεί να αξιοποιηθεί για τη µείωση του ϱυθµού δειγµατοληψίας στο πεδίο του χρόνου. Αυτό απορρέει από το κριτήριο του Nyquist, το οποίο καθορίζει ότι η τέλεια ανακατασκευή ενός συνεχούς σήµατος είναι εφικτή όταν η συχνότητα δειγµατοληψίας του είναι µεγαλύτερη από το διπλάσιο της µέγιστης ϕασµατικής συνιστώσας που περιλαµβάνει. Ετσι, όσο αυξάνεται η τιµή της κλίµακας, µε συνέπεια να µειώνεται η αντίστοιχη συχνότητα, µπορεί να χρησιµοποιηθεί χαµηλότερος ϱυθµός δειγµατοληψίας. Πρακτικά αυτό σηµαίνει ότι εάν για τη δειγµατοληψία του επιπέδου χρόνου - κλίµακας σε µια τιµή κλίµακας a 1 το κριτήριο του Nyquist ορίζει σαν ελάχιστο ϱυθµό δειγµατοληψίας τον N 1 τότε για µια µεγαλύτερη τιµή κλίµακας a 2 > a 1 µπορεί να εφαρµοστεί µικρότερος ϱυθµός N 2 > N 1. Η ακριβής ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 48

σχέση που συνδέει τα µεγέθη κλίµακας και ϱυθµό δειγµατοληψίας είναι η ακόλουθη : N 2 = a 1 a 2 N 1 N 2 = f 2 f 1 N 1 (2.21) Το κριτήριο του Nyquist επιτρέπει την ανακατασκευή του αρχικού σήµατος συνεχούς χρόνου από το πλήθος των διακριτών δειγµάτων του. Θα πρέπει ωστόσο να σηµειωθεί ότι αν δεν απαιτείται η ανακατασκευή του σήµατος τότε ο ϱυθµός δειγµατοληψίας δεν χρειάζεται να ικανοποιεί το κριτήριο του Nyquist και για την ανάλυση του σήµατος µπορούν να χρησιµοποιηθούν ακόµα χαµηλότεροι ϱυθµοί δειγµατοληψίας. Το επίπεδο χρόνου - κλίµακας όπου αναπαρίστανται οι συντελεστές του CWT περιλαµβάνει ένα άπειρο πλήθος σηµείων. Η µετατροπή αυτού του συνεχούς πλήθους σηµείων σε διακριτό γίνεται αρχικά µε τη δειγµατοληψία του άξονα της κλίµακας. Από το άπειρο πλήθος σηµείων του άξονα, λαµβάνεται ένα πεπερασµένο σύνολο τιµών µε χρήση λογαριθµικού κανόνα. Η ϐάση του λογαρίθµου εξαρτάται από τον χρήστη αλλά η πλέον συνήθης είναι η δυαδική λόγω των ευκολιών που παρέχει στους υπολογισµούς. Στην περίπτωση αυτή ϑα υπολογίζονται µόνο οι τιµές κλίµακας που είναι δυνάµεις του 2 (2, 4, 8, 16, 32,...). Αν χρησιµοποιηθεί ως ϐάση το 3 τότε υπολογίζονται οι κλίµακες 3, 9, 27, 81 κτλ. Οι διακριτές πλέον τιµές της κλίµακας διαφέρουν µεταξύ τους κατά έναν παράγοντα του 2, δηλαδή η τιµή κάθε κλίµακας ισούται µε το διπλάσιο της προηγούµενης, γεγονός που σηµαίνει ότι η αντίστοιχη συχνότητα ϑα είναι το µισό της προηγούµενης. Η παραπάνω διαδικασία δειγµατοληψίας µπορεί να εκφραστεί µε µαθηµατικούς όρους αντικα- ϑιστώντας τις συνεχείς παραµέτρους κλίµακας και µετάθεσης µε διακριτές. Συγκεκριµένα, ϑέτοντας a j = a j 0 και b j,k = ka j 0b 0, η συµπαγής σχέση για τη συνεχή συνάρτηση κυµατιδίου παίρνει την ακόλουθη µορφή : ψ a,b = a j/2 0 ψ(a j 0 t kb 0 ) µε (j, k) Z, a 0 > 1, b 0 > 0 (2.22) Αφού σε κάθε αύξηση του επιπέδου κλίµακας η συχνότητα µειώνεται στο µισό της προηγούµενης, ϑα υποδιπλασιάζεται και ο απαιτούµενος ϱυθµός δειγµατοληψίας της µε ϐάση το κριτήριο Nyquist. Αυτό πρακτικά σηµαίνει ότι ϑα υποδιπλασιάζεται και το πλήθος δειγµάτων στο χρόνο που απαιτείται για την δειγµατοληψία της και την επακόλουθη ανακατασκευή της. Η συγκεκριµένη µέθοδος δειγµατοληψίας απεικονίζεται και στο Σχήµα 2.9, όπου στον κάθετο άξονα απεικονίζονται οι λογάριθµοι των τιµών της κλίµακας ενώ στον οριζόντιο, το πλήθος των χρονικών σηµείων. Μπορεί εύκολα να διαπιστωθεί ότι σε κάθε διακριτό επίπεδο κλίµακας αντιστοιχεί ο µισός αριθµός δειγµάτων χρόνου σε σχέση µε το προηγούµενο επίπεδο [24]. Η διαδικασία δειγµατοληψίας που περιγράφηκε επιτρέπει τον υπολογισµό του CWT από υπολογιστές αλλά στην πραγµατικότητα δεν συνιστά έναν διακριτό µετασχηµατισµό. Πρόκειται για µια κυµατιδιακή σειρά που προκύπτει από τη δειγµατοληψία του CWT και εµπεριέχει πλεονάζουσα πληροφορία για την ανακατασκευή του σήµατος. Ο µεγάλος σχετικά όγκος πληροφορίας όµως απαιτεί σηµαντικό υπολογιστικό χρόνο και υψηλή πολυπλοκότητα. Η ανάγκη περιορισµού της υπολογιστικής πολυπλοκότητας οδήγησε στον ιακριτό Μετασχηµατισµό Κυµατιδίου (DWT: Descrete Wavelet Transform) ο οποίος παρέχει ε- παρκή πληροφορία τόσο για την ανάλυση όσο και για την ανακατασκευή του σήµατος µε ταυτόχρονη µείωση του υπολογιστικού χρόνου. Αξίζει να σηµειωθεί ότι ο CWT εφαρµόζεται ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 49

Σχήµα 2.9: υαδική δειγµατοληψία για τη διακριτοποίηση του CWT στο επίπεδο χρόνου - κλίµακας. σε ένα συνεχή χώρο κλίµακας - χρόνου µε δειγµατοληψία των σηµείων και υπολογισµό των συνελίξεων για αυτά τα διακριτά σηµεία, ενώ ο DWT εφαρµόζεται σε ένα εξαρχής ψηφιακό σήµα. Ο DWT υλοποιείται µέσω ενός σχήµατος απλών ψηφιακών ϕίλτρων τα οποία εφαρµόζονται επαναληπτικά, ενώ η ανακατασκευή του αρχικού σήµατος µπορεί να επιτευχθεί µε ανάλογη διαδικασία εφαρµογής των αντίστροφων ϕίλτρων. Ο υπολογισµός του CWT γινόταν µετα- ϐάλλοντας την παράµετρο κλίµακας του παραθύρου ανάλυσης, µετακινώντας το παράθυρο κατά µήκος του χρόνου, πολλαπλασιάζοντας στη συνέχεια µε το σήµα και ολοκληρώνοντας για όλο το πεδίο του χρόνου. Στην περίπτωση του DWT, η ανάλυση του σήµατος στις διά- ϕορες κλίµακες πραγµατοποιείται µε ϕίλτρα διαφορετικών συχνοτήτων αποκοπής. Το σήµα διέρχεται από µια σειρά υψιπερατών ϕίλτρων, για την ανάλυση των υψηλών συχνοτήτων, και από ϐαθυπερατά ϕίλτρα για την ανάλυση των χαµηλών. Η διακριτική ικανότητα του σήµατος (ανάλυση), η οποία εκφράζει το ποσό της λεπτοµερούς πληροφορίας που εµπεριέχει, µετα- ϐάλλεται από τη λειτουργιά των ϕίλτρων ενώ η παράµετρος της κλίµακας αλλάζει µέσω της παράλληλης εφαρµογής υποδειγµατοληψίας. Το πρώτο στάδιο υλοποίησης του DWT στο ψηφιακό σήµα x[n] περιλαµβάνει την εφαρµογή ενός ϐαθυπερατού ψηφιακού ϕίλτρου µε κρουστική απόκριση h[n] και συχνότητα αποκοπής τέτοια ώστε να απορρίπτει τις συχνότητες που είναι µεγαλύτερες από το µισό της µέγιστης ϕασµατικής συνιστώσας του σήµατος. Η παραπάνω διαδικασία περιγράφεται µε µαθηµατικούς όρους από τη συνέλιξη του σήµατος µε την κρουστική απόκριση του ϕίλτρου : x[n] h[n] = + k= x[k]h[n k] (2.23) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 50

Μετά τη διέλευση από το ϐαθυπερατό ϕίλτρο, η µέγιστη συχνότητα του σήµατος µειώνεται στο µισό σε σχέση µε το αρχικό σήµα, οπότε, σύµφωνα µε το κριτήριο του Nyquist,η συχνότητα δειγµατοληψίας του µπορεί να υποδιπλασιαστεί. Αυτό πρακτικά σηµαίνει ότι το αρχικό πλήθος των δειγµάτων του σήµατος, που διατηρήθηκε αναλλοίωτο µε τη χρήση του ϕίλτρου, περιλαµβάνει πλεονάζουσα πληροφορία και µπορεί να υποδιπλασιαστεί διατηρώντας τη δυνατότητα ανακατασκευής και τα χαρακτηριστικά του. Η αποµάκρυνση κάθε δεύτερου δείγµατος από το σήµα ϑα έχει ως αποτέλεσµα την υποδειγµατοληψία του κατά παράγοντα 2, µε την κλίµακά του πλέον να έχει διπλασιαστεί. Η εφαρµογή του ϐαθυπερατού ϕίλτρου αποµακρύνει το άνω µισό του αρχικού ϕάσµατος, γεγονός που µπορεί να ερµηνευθεί ως απώλεια της µισής διαθέσιµης πληροφορίας του αρχικού σήµατος, αλλά δεν επηρεάζει την κλίµακα. Οµως, η απώλεια των µισών συχνοτήτων του ϕάσµατος υποδιπλασιάζει τη διακριτική ικανότητα ή ανάλυση του σήµατος, η οποία σχετίζεται µε την ποσότητα της υπάρχουσας πληροφορίας. Η ακόλουθη υποδειγµατοληψία κατά έναν παράγοντα 2 µε τη σειρά της δεν επηρεάζει τη διακριτική ικανότητα, καθώς η αποµάκρυνση των µισών ϕασµατικών συνιστωσών καθιστά από µόνο του το πλήθος των δειγµάτων περιττό. Η αποµάκρυνση των µισών δειγµάτων γίνεται χωρίς την απώλεια πληροφορίας και µε την κλίµακα να διπλασιάζεται. Η διαδικασία ϕιλτραρίσµατος και υποδειγµατοληψίας συνοψίζεται µαθηµατικά στην εξίσωση : y[n] h[n] = + k= h[k]x[2n k] (2.24) Στην κυµατιδιακή ανάλυση οι συντελεστές του DWT αναφέρονται συχνά ως συντελεστές προσέγγισης και συντελεστές λεπτοµέρειας. Οι συντελεστές προσέγγισης αντιστοιχούν στις συνιστώσες χαµηλής συχνότητας του σήµατος και προκύπτουν από την ανάλυση κυµατιδίου σε µεγάλες τιµές κλίµακας, ενώ οι συντελεστές λεπτοµέρειας αντιστοιχούν στις συνιστώσες υψηλής συχνότητας που προκύπτουν από την ανάλυση κυµατιδίου σε µικρές τιµές κλίµακας. Το πρώτο επίπεδο υλοποίησης του DWT ϕαίνεται στο Σχήµα 2.10, µε τους συντελεστές cd που λαµβάνονται να αποτελούν το πρώτο επίπεδο των συντελεστών του DWT. Ο DWT αναλύει το σήµα κάθε ϕορά σε διαφορετικές περιοχές συχνοτήτων µε διαφορετικά επίπεδα ανάλυσης, διαχωρίζοντας το κάθε ϕορά σε µια εκδοχή του που το προσεγγίζει και σε µια που εστιάζει στα λεπτοµερή χαρακτηριστικά του. Ο µετασχηµατισµός χρησιµοποιεί τις λεγόµενες συναρτήσεις κλίµακας (scale functions) και τις κυµατιδιακές συναρτήσεις, οι οποίες σχετίζονται µε τα ϐαθυπερατά και υψιπερατά ϕίλτρα αντίστοιχα. Η ανάλυση του σήµατος σε διαφορετικές περιοχές συχνοτήτων πραγµατοποιείται µέσα από τις διαδοχικές διελεύσεις του από αυτά τα ϕίλτρα. Συγκεκριµένα, το σήµα διέρχεται αρχικά από δυο ϕίλτρα, ένα υψιπερατό και ένα ϐαθυπερατό, που χωρίζουν το υπάρχον ϕάσµα του στη µέση. Μετά το ϕιλτράρισµα και σύµφωνα µε όσα αναφέρθηκαν για το κριτήριο του Nyquist, τα µισά δείγµατα µπορούν να εξαιρεθούν απορρίπτοντας κάθε δεύτερο δείγµα. Αυτό συνιστά το πρώτο επίπεδο ανάλυσης και µπορεί να συνοψιστεί µαθηµατικά ως : y high [k] = n x[n]g[2k n] (2.25) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 51

Σχήµα 2.10: Πρώτο επίπεδο υλοποίησης του DWT. Το σήµα S περνά από ένα υψιπερατό ϕίλτρο, για να διατηρηθούν οι τα υψίσυχνα χαρακτηριστικά του (cd), και από ένα ϐαθυπερατό ϕίλτρο για να διατηρηθούν οι χαµηλές του συχνότητες ή αλλιώς η προσέγγισή του (ca). Οι έξοδοι των ϕίλτρων υποδειγµατοληπτούνται κατά παράγοντα 2. y low [k] = n x[n]h[2k n] (2.26) όπου y high καιy low είναι οι έξοδοι των υψιπερατών και ϐαθυπερατών ϕίλτρων αντίστοιχα, µετά την υποδειγµατοληψία κατά παράγοντα 2 [16]. Η αποσύνθεση του σήµατος υποδιπλασιάζει την ανάλυσή του στο χρόνο, καθώς πλέον µόνο ο µισός αριθµός δειγµάτων χρησιµοποιείται για να περιγράψει ολόκληρο το σήµα. Ωστόσο, λόγω της αντίστοιχης µείωσης του ϕασµατικού του εύρους, υποδιπλασιάζεται και η αβεβαιότητα στον προσδιορισµό της συχνότητας, µε αποτέλεσµα το διπλασιασµό της διακριτικής ικανότητας στο πεδίο της συχνότητας. Η διαδικασία αυτή, η οποία είναι γνωστή στο πεδίο της επεξεργασίας σήµατος και εικόνας (subband coding), συνεχίζεται επαναληπτικά στην έξοδο του ϐαθυπερατού ϕίλτρου µέχρι τελικά να αποµείνουν µόνο δυο δείγµατα (τελευταίο επίπεδο της ανάλυσης). Ο DWT του αρχικού σήµατος λαµβάνεται µε τη σύµπτυξη των συντελεστών από το τελευταίο επίπεδο ανάλυσης προς το πρώτο. Το Σχήµα 2.11 παρουσιάζει µε απλό τρόπο την ανάλυση του σήµατος σε επίπεδα, την εξαγωγή των συντελεστών σε κάθε επίπεδο και τη µέθοδο διάταξής τους ώστε να συγκροτηθεί ο µετασχηµατισµός [22]. Σχήµα 2.11: Εξαγωγή των συντελεστών του DWT. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 52

Οι κύριες συνιστώσες συχνότητας του αρχικού σήµατος ϑα εµφανίζονται µε µεγάλα πλάτη στην περιοχή εκείνη του DWT που ϑα περιλαµβάνει τις συγκεκριµένες συχνότητες. Η ϐασική διαφορά σε σχέση µε τον FT είναι ότι ϑα διατηρείται ο χρονικός εντοπισµός των συχνοτήτων, αλλά η διακριτική τους ικανότητα ϑα εξαρτάται από το επίπεδο ανάλυσης στο οποίο αυτές εµφανίζονται. Οταν η κύρια πληροφορία του σήµατος περιλαµβάνεται στις υψηλές συχνότητες, τότε ο χρονικός προσδιορισµός αυτών των συχνοτήτων ϑα είναι πιο ακριβής καθώς τα επίπεδα ανάλυσης τους ϑα διαθέτουν σχετικά µεγάλο πλήθος δειγµάτων. Αντίθετα, εάν ο κύριος όγκος πληροφορίας του σήµατος εµπεριέχεται στις πολύ χαµηλές συχνότητες τότε ο χρονικός εντοπισµός τους δεν ϑα είναι ιδιαίτερα ακριβής, αφού σε εκείνη την περιοχή χρησι- µοποιούνται λίγα δείγµατα για την περιγραφή τους. Η µέθοδος αυτή δηλαδή παρέχει καλή χρονική διακριτική ικανότητα για τις υψηλές συχνότητες ενός σήµατος και καλή διακριτική ικανότητα στο πεδίο της συχνότητας για τις χαµηλές ϕασµατικές συνιστώσες. Τα ϐαθυπερατά και υψιπερατά ϕίλτρα που χρησιµοποιούνται για την υλοποίηση του µετασχηµατισµού δεν είναι εντελώς ανεξάρτητα µεταξύ τους και συγκεκριµένα συνδέονται µέσω της σχέσης : g[l 1 n] = ( 1) n h[n] (2.27) όπου g[n], h[n] είναι αντίστοιχα οι συναρτήσεις του υψιπερατού και ϐαθυπερατού ϕίλτρου και L το µήκος του. Οπως ϕαίνεται από την παραπάνω εξίσωση, τα δυο ϕίλτρα αντεστραµµένα µεταξύ τους και η µετατροπή του h[n] σε υψιπερατό οφείλεται στον όρο ( 1) n. Τα ϕίλτρα αυτά ονοµάζονται τετραγωνικά κατοπτρικά ϕίλτρα (Quadrature Mirror Filters), οι κρουστικές τους αποκρίσεις είναι συµµετρικές περί την τιµή π και επιτρέπουν την τέλεια ανακατασκευή 2 του σήµατος (πρακτικά µε πολύ µεγάλη ακρίβεια) καθώς συνιστούν µια ορθοκανονική ϐάση. Η διαδικασία της ανακατασκευής του σήµατος ακολουθεί την αντίστροφη πορεία σε σχέση µε την ανάλυση. Τα σήµατα υφίστανται αρχικά υπέρδειγµατοληψία, είτε συµπληρώνοντας µηδενικά ανάµεσα στα δείγµατά τους, είτε ανάµεσα σε δύο διαδοχικά δείγµατα τη µέση τιµή τους και στη συνεχεία διέρχονται από τα ϕίλτρα σύνθεσης τα οποία είναι πανοµοιότυπα µε τα αντίστοιχα ϕίλτρα ανάλυσης, µε εξαίρεση την αντιστροφή τους στο χρόνο. Η εξίσωση της ανακατασκευής για κάθε επίπεδο ανάλυσης του µετασχηµατισµού είναι η παρακάτω : x[n] = + k= (y high [k]g[ n + 2k] + y low [k]h[ n + 2k]) (2.28) Παρόλα αυτά, αν τα ϕίλτρα δεν είναι ιδανικά ηµίσεια, δεν µπορεί να επιτευχθεί τέλεια ανακατασκευή. Αν και δεν είναι δυνατό να υλοποιηθούν ιδανικά ϕίλτρα, κάτω από ορισµένες συνθήκες είναι πιθανό να ϐρεθούν ϕίλτρα που αποδίδουν τέλεια ανακατασκευή (τα πιο διάσηµα τέτοια ϕίλτρα είναι τα κυµατίδια Daubechies). Επίσης, αξίζει να σηµειωθεί ότι λόγω της διαδοχικής υποδειγµατοληψίας κατά παράγοντα 2, το µήκος του σήµατος πρέπει να είναι δύναµη του 2 ή τουλάχιστον παράγωγο δύναµης του 2, προκειµένου να είναι αποτελεσµατικό το πλαίσιο αυτό. Το µήκος του σήµατος καθορίζει τον αριθµό των επιπέδων τα οποία απαιτούνται για την ανάλυσή του, για παράδειγµα αν το µήκος του σήµατος είναι 1024 δείγµατα υπάρχει δυνατότητα ανάλυσης σε 10 επίπεδα. Στο πρώτο διάγραµµα του Σχήµατος 2.12 παρουσιάζεται ένα τυπικό σήµα µήκους 512 δειγ- µάτων, το οποίο έχει κανονικοποηθεί σε µοναδιαίο πλάτος. Στον οριζόντιο άξονα ϐρίσκεται ο αριθµός των δειγµάτων και στον κατακόρυφο το µοναδιαίο πλάτος. Το δεύτερο διάγραµµα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 53

Σχήµα 2.12: Παράδειγµα υπολογισµού συντελεστών DWT. παρουσιάζει τον DWT 8 επιπέδων του σήµατος, µε τα τελευταία 256 δείγµατα να αντιστοιχούν στην Ϲώνη υψηλότερων συχνοτήτων που υπάρχουν σε αυτό, τα προηγούµενα 128 δείγµατα στη Ϲώνη µε τις αµέσως χαµηλότερες συχνότητες κτλ. Σηµειώνεται ότι µόνο τα πρώτα 64 δείγµατα, τα οποία αντιστοιχούν στις χαµηλότερες συνιστώσες συχνότητας της ανάλυσης, εµπεριέχουν τη σηµαντική πληροφορία για το σήµα µε τα υπόλοιπα δείγµατα να µην περιέχουν σχεδόν καθόλου πληροφορία. Συνεπώς, όλα τα δείγµατα εκτός των 64 πρώτων µπορούν να εξαιρεθούν, χωρίς να υπάρχει κόστος απώλειας πληροφορίας. Με αυτό τον τρόπο ϕαίνεται πως ο DWT παρέχει ένα αποτελεσµατικό πλαίσιο για τη µείωση των δεδοµένων και για το λόγο αυτό αποτελεί ένα πολύ χρήσιµο εργαλείο σε πεδία που χειρίζονται µεγάλο αριθµό δεδοµένων, όπως η επεξεργασία εικόνας [22]. 2.3.3 Μετασχηµατισµός Κυµατιδιακών Πακέτων (ΩΠΤ) Η Ανάλυση Κυµατιδιακών Πακέτων (Wavelet Packet Analysis) αποτελεί µια γενίκευση του DWT, η οποία παρέχει µεγαλύτερο εύρος δυνατοτήτων για την ανάλυση του σήµατος. Στην περίπτωση του DWT, το σήµα χωρίζεται σε µια συνιστώσα προσέγγισης και σε µια συνιστώσα λεπτοµέρειας. Στη συνέχεια, η συνιστώσα προσεγγίσεων διασπάται ξανά µε τον ίδιο τρόπο και η διαδικασία επαναλαµβάνεται ανάλογα µε το πλήθος των δειγµάτων (Σχήµα 2.13). Αν ένα σήµα αναλυθεί σε n επίπεδα τότε υπάρχουν n+1 διαφορετικοί τρόποι αναπαράστασής του όπως ϕαίνεται και από το ακόλουθο σχήµα. Ο Μετασχηµατισµός Κυµατιδιακών Πακέτων (WPT: Wavelet Packet Transform) χρησιµοποιεί σε κάθε επίπεδο ανάλυσης τόσο την συνιστώσα προσέγγισης όσο και τη συνιστώσα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 54

Σχήµα 2.13: Αναπαράσταση σήµατος µε χρήση του (WPT). λεπτοµέρειας, γεγονός που οδηγεί σε περισσότερους από 2 2n 1 διαφορετικούς τρόπους κωδικοποίησης του σήµατος, όπως µπορεί να ϕανεί και από το έντρο Κυµατιδιακής Ανάλυσης του Σχήµατος 2.14. Το δέντρο ανάλυσης του DWT είναι υποσύνολο του παραπάνω δυαδικού δένδρου. Οπως ϕαίνεται και στη σχέση που ακολουθεί ο WPT επιτρέπει την αναπαράσταση του σήµατος µε µια ακολουθία συντελεστών που δεν παρέχεται από τον DWT. Σχήµα 2.14: έντρο ανάλυσης WPT. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 55

ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 56

Κεφάλαιο 3 Μέθοδοι εκµάθησης και ταξινόµησης 3.1 Θεωρία αποφάσεων Bayes Η ϑεωρία αποφάσεων του Bayes είναι µια ϑεµελιώδης στατιστική προσέγγιση του προβλή- µατος της ταξινόµησης προτύπων. Η προσέγγιση αυτή είναι ϐασισµένη στον ποσοτικό προσδιορισµό των συµβιβασµών µεταξύ διάφορων αποφάσεων ταξινόµησης χρησιµοποιώντας την πιθανότητα και το κόστος που συνοδεύει τέτοιες αποφάσεις. Η προσέγγιση στηρίζεται στην παραδοχή ότι το πρόβληµα απόφασης τίθεται µε όρους πιθανοτήτων και ότι όλες οι εµπλεκόµενες τιµές πιθανοτήτων είναι γνωστές. Σε αυτή την ενότητα αναπτύσσουµε τις ϐασικές αρχές αυτής της ϑεωρίας, καθώς και πρόσθετα στοιχεία της τα οποία ϑα ϕανούν χρήσιµα στη διαδικασία εκτίµησης των προτύπων στο δικό µας πρόβληµα. 3.1.1 Βασικές αρχές Οπως είναι γνωστό, το πρώτο ϐήµα στην ταξινόµηση είναι η αναζήτηση των χαρακτηριστικών που καθιστούν τα υπό µελέτη αντικείµενα διαχωρίσιµα. Για παράδειγµα, για ένα σύνολο αντικειµένων µπορούν να µετρηθούν χαρακτηριστικά, όπως η µέση τιµή και η τυπική α- πόκλιση. Κατόπιν είναι απαραίτητο να ελεγχθεί αν τα χαρακτηριστικά αυτά είναι αρκετά, ώστε να διαχωρίζουν µε τη µεγαλύτερη δυνατή σαφήνεια τα αντικείµενα σε κλάσεις. Για να αντιληφθούµε το πρόβληµα καθώς και για να αντιληφθούµε καλύτερα τον τρόπο µε τον ο- ποίο η ϑεωρία αποφάσεων του Bayes µπορεί να ϐοηθήσει ϑα αναλύσουµε ένα συγκεκριµένο υποθετικό πρόβληµα σχεδίασης ενός ταξινοµητή που διαχωρίζει δύο είδη ψαριών : πέρκες ϑάλασσας και σολοµό [23]. Υποθέτουµε ότι ένας παρατηρητής παρακολουθεί την τυχαία ακολουθία των δύο αυτών ειδών ψαριών που ϕτάνουν κατά µήκος µιας Ϲώνης µεταφορέων. Ο παρατηρητής ϐρίσκει δυσκολία στο να προβλέψει ποιο ϑα είναι το επόµενο είδος ψαριού που ϑα προκύψει. Φυσικά, κάθε ψάρι που εµφανίζεται ϑα ανήκει στη µία η την άλλη από τις δύο πιθανές κατηγορίες είδους. Επιλέγουµε τη µεταβλητή ω να δηλώνει το είδος του ψαριού, µε ω = ω 1 για την πέρκα ϑάλασσας και ω = ω 2 για το σολοµό. Επειδή το είδος του ψαριού είναι σε κάθε περίπτωση άγνωστο, ϑεωρούµε το ω ως µια µεταβλητή που πρέπει να περιγραφεί µε όρους πιθανοτήτων. 57

Εάν το τελικό σύνολο είχε τόσες πέρκες όσους και σολοµούς, ϑα λέγαµε ότι το επόµενο ψάρι που ϑα προκύψει είναι εξίσου πιθανό να είναι ένα από τα δύο είδη. Γενικότερα, υποθέτουµε ότι υπάρχει κάποια a priori (ή απλά εκ των προτέρων) πιθανότητα P (ω 1 ), ότι το επόµενο ψάρι ϑα είναι πέρκα ϑάλασσας και κάποια εκ των προτέρων πιθανότητα P (ω 2 ) ότι ϑα είναι σολοµός. Εάν υποθέσουµε ότι δεν υπάρχει κανένας άλλο είδος ψαριών στο παράδειγµα, τότε P (ω 1 )+P (ω 2 ) = 1. Οι εκ των προτέρων πιθανότητες αντανακλούν την εκ των προτέρων γνώση µας για το πόσο πιθανό είναι να προκύψει καθένα από τα είδη πριν εµφανιστεί πραγµατικά το ψάρι. Η γνώση αυτή µπορεί να ϐασίζεται, παραδείγµατος χάριν, στη χρονική περίοδο του έτους ή στην επιλογή της περιοχής. Υποθέτουµε για µια στιγµή, ότι αναγκαστήκαµε να λάβουµε µια απόφαση για το επόµενο είδος ψαριού που ϑα εµφανιστεί, χωρίς να είναι επιτρεπτό να το δούµε. Υποθέτουµε επίσης ότι οποιαδήποτε ανακριβής ταξινόµηση συνεπάγεται το ίδιο κόστος, και ότι οι µόνες πληρο- ϕορίες που έχουµε στη διάθεσή µας είναι οι τιµές των εκ των προτέρων πιθανοτήτων. Εάν µια απόφαση πρέπει να ληφθεί µε τόσο λίγες πληροφορίες, µπορεί να χρησιµοποιηθεί ο ακόλουθος κανόνας απόφασης : Επιλέγουµε ω 1 εάν P (ω 1 ) > P (ω 2 ), αλλιώς επιλέγουµε ω 2. Αυτός ο κανόνας µπορεί να έχει νόηµα εάν πρόκειται να αποφασίσουµε µόνο για ένα ψάρι, αλλά εάν πρόκειται να αποφασίσουµε για πολλά, η επανειληµµένη χρήση του µπορεί να ϕανεί λίγο παράξενη. Τελικά, ϑα λαµβάναµε πάντα την ίδια απόφαση ακόµα κι αν γνωρίζαµε ότι πρόκειται να εµφανιστούν και τα δύο είδη ψαριών. Το πόσο µεγάλο ϑα είναι τελικά το σφάλµα των αποφάσεων εξαρτάται από τις τιµές των εκ των προτέρων πιθανοτήτων. Στις πε- ϱισσότερες περιστάσεις δεν καλούµαστε να λάβουµε αποφάσεις µε τόσες λίγες πληροφορίες. Στο ανωτέρω παράδειγµα ϑα µπορούσαµε να χρησιµοποιήσουµε τις µετρήσεις του ϐάρους των ψαριών x για να ϐελτιώσουµε την ταξινόµηση. ιαφορετικές αφίξεις ϑα δώσουν διαφο- ϱετικές τιµές ϐάρους (τιµές της εκτιµήτριας x). Εκφράζουµε αυτήν την διαφορετικότητα µε όρους πιθανοτήτων. Θεωρούµε το x ως µια συνεχή τυχαία µεταβλητή της οποίας η κατανο- µή εξαρτάται από το είδος του ψαριού και εκφράζεται ως p(x ω). Αυτή είναι η δεσµευµένη συνάρτηση πυκνότητας πιθανότητας (π.π.) ως προς την κατάσταση (κλάση ή είδος), δηλαδή η συνάρτηση π.π. για κάθε x δεδοµένης της κατάστασης ω. Εποµένως, η διαφορά µεταξύ p(x ω 1 ) και p(x ω 2 ) περιγράφει τη διαφορά στο ϐάρος µεταξύ των πληθυσµών της πέρκας και του σολοµού (ϐλέπε Σχήµα 3.1) 1. Υποθέτουµε ότι είναι γνωστές τόσο οι εκ των προτέρων πιθανότητες P (ω j ) όσο και οι δεσµευ- µένες πυκνότητες p(x ω j ). Υποθέτουµε περαιτέρω ότι µετράµε το ϐάρος ενός ψαριού και ϐρίσκουµε ότι η τιµή του είναι x. Το ερώτηµα είναι πως αυτή η µέτρηση επηρεάζει τη γνώση µας όσον αναφορά στο είδος του ψαριού, δηλαδή την κατηγορία στην οποία ανήκει. Παρατηρούµε ότι η κοινή πυκνότητα πιθανότητας της εύρεσης ενός προτύπου που ανήκει στην κατηγορία w j και έχει αξία εκτιµήτριας x µπορεί να γραφτεί µε δύο τρόπους, ως ακολούθως : p(ω j, x) = P (ω j x)p(x) = p(x ω j )P (ω j ) (3.1) 1 Με αυστηρότερο τρόπο, η συνάρτηση π.π. p(x ω) γράφετε p X (x ω) για να δείξει ότι αναφερόµαστε σε µια συγκεκριµένη συνάρτηση πυκνότητας της τυχαίας µεταβλητής X. Αυτή η πιο ξεκάθαρη σήµανση καθιστά σαφές ότι p X ( ) και p Y ( ) δηλώνουν δύο διαφορετικές συναρτήσεις, ένα γεγονός που µπορεί να παρερµηνεύεται όταν γράφουµε p(x) και p(y). εδοµένου ότι αυτή η πιθανή σύγχυση προκύπτει σπάνια στην πράξη, έχουµε επιλέξει να υιοθετήσουµε την απλούστερη σήµανση. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 58

Σχήµα 3.1: Οι δεσµευµένες ως προς την κλάση συναρτήσεις π.π. παρουσιάζουν την π.π. στον υπολογισµό µιας συγκεκριµένης εκτιµήτριας x (π.χ. το ϐάρος του ψαριού) µε δεδοµένο ότι το πρότυπο ανήκει στην κατηγορία ω i. Οι συναρτήσεις πυκνότητας είναι κανονικοποιηµένες, οπότε το εµβαδόν κάτω από κάθε καµπύλη είναι 1. Από την ανωτέρω σχέση προκύπτει η απάντηση της ερώτησης που τέθηκε ανωτέρω και που οδηγεί στο γνωστό τύπο του Bayes: P (ω j x) = p(x ω j)p (ω j ) p(x) (3.2) Στην περίπτωση των δύο ειδών του παραδείγµατός µας ο τύπος παίρνει τη µορφή : p(x) = 2 p(x ω j )P (ω j ). (3.3) j=1 Ο τύπος του Bayes µπορεί να εκφραστεί άτυπα και ως : εκ των υστέρων πιθανότητα = πιθανοφάνεια * εκ των προτέρων πιθανότητα στοιχεία και δείχνει ότι παρατηρώντας την τιµή του x µπορούµε να µετατρέψουµε την εκ των προτέρων πιθανότητα P (ω j ) στην εκ των υστέρων πιθανότητα P (ω j x), δηλαδή την πιθανότητα η κατάσταση του ψαριού να είναι w j δεδοµένου ότι η εκτιµήτρια x έχει µετρηθεί. Καλούµε p(x ω j ) την πιθανοφάνεια της w j ως προς το x και πρόκειται για έναν όρος που έχει επιλεχθεί για να δείξει ότι, αν όλες οι άλλες παράµετροι είναι ίσες, η κατηγορία w j για την οποία η p(x ω j ) είναι µεγαλύτερη είναι πιο πιθανό να είναι η σωστή κατηγορία. Πρέπει να σηµειωθεί ότι το πιο σηµαντικό στον υπολογισµό της εκ των υστέρων πιθανότητας είναι το γινόµενο της πιθανοφάνειας και της εκ των προτέρων πιθανότητας. Ο στοιχειώδης παράγοντας p(x) µπορεί να είναι µόνο ένας παράγοντας κλίµακας που εγγυάται, ότι οι εκ των υστέρων πιθανότητες ϑα έχουν άθροισµα ένα. Η γραφική παράσταση της P (ω j x) σε σχέση µε το x ϕαίνεται στο Σχήµα 3.2 για τις περιπτώσεις που P (ω 1 ) = 2 3 και P (ω 2) = 1. Εάν έχουµε µια τιµή x για την 3 ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 59

Σχήµα 3.2: Οι εκ των υστέρων πιθανότητες µε ϐάση τις εκ των προτέρων πιθανότητες P (ω 1 ) και P (ω 2 ) για τις δεσµευµένες συναρτήσεις π.π. που αφορούν την ταξινόµηση κλάσεων του Σχήµατος 3.1. Σε αυτή την περίπτωση, δεδοµένου ότι η µέτρηση για το πρότυπο είναι x = 14, η πιθανότητα να ανήκει στην κατηγορία ω 1 είναι 0.92 και στην ω 2 περίπου 0.08. Για κάθε x οι εκ των υστέρων πιθανότητες έχουν άθροισµα 1. οποία η P (ω 1 x) είναι µεγαλύτερη από την P (ω 2 x), ϑα µπορούσαµε να οδηγηθούµε στην απόφαση ότι το είδος του συγκεκριµένου ψαριού είναι αυτό που αντιστοιχεί στην κατηγορία ω 1. Οµοίως, αν η P (ω 2 x) είναι µεγαλύτερη από την P (ω 1 x), ϑα διαλέγαµε την ω 2. Για να δικαιολογηθεί αυτή η διαδικασία επιλογής, µπορούµε να υπολογίσουµε την πιθανότητα σφάλµατος, όποτε παίρνουµε µια απόφαση. Οταν παρατηρούµε µια συγκεκριµένη τιµή x, η πιθανότητα σφάλµατος είναι : P (error x) = { P (ω1 x) αν αποφασίσουµε ω 2 P (ω 2 x) αν αποφασίσουµε ω 1 (3.4) Προφανώς για δεδοµένη τιµή του x µπορούµε να ελαχιστοποιήσουµε την πιθανότητα του σφάλµατος επιλέγοντας ω 1 αν P (ω 1 ) > P (ω 2 ) και ω 2 στην άλλη περίπτωση. Βέβαια, δε ϑα µπορέσουµε ποτέ να παρατηρήσουµε ακριβώς την ίδια τιµή του x δύο ϕορές. Ο κανόνας αυτός είναι σε ϑέση να ελαχιστοποιήσει την πιθανότητα λάθους, καθώς η µέση πιθανότητα του σφάλµατος δίνεται από την σχέση : P (error) = + P (error, x)dx = + P (error x)p(x)dx (3.5) και αν για κάθε x εξασφαλίσουµε ότι η P (error x) ϑα είναι όσο δυνατόν µικρότερη, τότε και το ολοκλήρωµα ϑα γίνει όσο το δυνατόν µικρότερο. Εποµένως για την ελαχιστοποίηση της πιθανότητας σφάλµατος έχει διατυπωθεί ο κανόνας απόφασης του Bayes που ακολουθεί : Αποφασίζουµε ω 1 εάν P (ω 1 x) > P (ω 2 x), αλλιώς αποφασίζουµε ω 2. (3.6) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 60

Σύµφωνα µε αυτό τον κανόνα, η Εξίσωση (3.4) παίρνει τη µορφή : P (error x) = min[p (ω 1 x), P (ω 2 x)]. (3.7) Αυτή η µορφή του κανόνα απόφασης εστιάζει στο ϱόλο των εκ των υστέρων πιθανοτήτων. Χρησιµοποιώντας την Εξίσωση (3.2), µπορούµε να εκφράσουµε τον κανόνα µε ϐάρος στις δεσµευµένες και εκ των προτέρων πιθανότητες. Πρώτα πρέπει να παρατηρήσουµε ότι τα στοιχεία p(x) στην Εξίσωση (3.2) δεν παρουσιάζουν ενδιαφέρον όσον αναφορά στη λήψη µιας απόφασης. Βασικά πρόκειται για έναν παράγοντα που δηλώνει πόσο συχνά ϑα µετράµε στην πραγµατικότητα πρότυπα µε τιµή εκτιµήτριας x. Η ύπαρξη του στην Εξίσωση (3.2), όπως αναφέρθηκε παραπάνω, µας διαβεβαιώνει ότι P (ω 1 x) + P (ω 2 x) = 1. Εξαιρώντας αυτό τον παράγοντα, προκύπτει ο ισοδύναµος κανόνας : Αποφασίζουµε ω 1 εάν p(x ω 1 )P (ω 1 ) > p(x ω 2 )P (ω 2 ), αλλιώς αποφασίζουµε ω 2. Μερικές επιπλέον πληροφορίες µπορούν να αποκτηθούν, αν αναλογιστούµε µερικές ειδικές περιπτώσεις. Αν για κάποιο x έχουµε p(x ω 1 ) = p(x ω 2 ), τότε αυτή η παρατήρηση δε µας δίνει καµία πληροφορία για τη κατάσταση της ϕύσης. Σε αυτή την περίπτωση η απόφαση έγκειται αποκλειστικά στις εκ των προτέρων πιθανότητες. Από την άλλη, αν P (ω 1 ) = P (ω 2 ), οι καταστάσεις τις ϕύσης είναι εξίσου πιθανές. Σε αυτή την περίπτωση η απόφαση ϐασίζεται εξ ολοκλήρου στις πιθανοφάνειες p(x ω j ). Γενικά, και οι δύο αυτοί παράγοντες είναι σηµαντικοί στη λήψη µιας απόφασης, οπότε ο κανόνας απόφασης του Bayes τους συνδυάζει για να πετύχει την ελάχιστη πιθανότητα σφάλµατος. 3.1.1.1 Περίπτωση πολλών κλάσεων Υπάρχουν πολλοί διαφορετικοί τρόποι για την αναπαράσταση των ταξινοµητών προτύπων. Ενας από τους πιο χρήσιµους δίνεται µε αναφορά ένα σύνολο από διαχωριστικές συναρτήσεις g i (x), i = 1,..., c. Ο ταξινοµητής ϑεωρείται ότι τοποθετεί ένα διάνυσµα χαρακτηριστικών (ή εκτιµητών) x στην κλάση ω i αν : g i (x) > g j (x) i j (3.8) Κατά συνέπεια, ο ταξινοµητής αντιµετωπίζεται ως ένα δίκτυο ή µία µηχανή που υπολογίζει c διαχωριστικές συναρτήσεις και επιλέγει την κατηγορία που αντιστοιχεί στη µεγαλύτερη από αυτές. Μια δικτυακή αναπαράσταση ενός ταξινοµητή παρουσιάζεται στο Σχήµα 3.3. Ενας ταξινοµητής Bayes αναπαρίσταται εύκολα και ϕυσικά κατ αυτό τον τρόπο. Στην περίπτωση της ταξινόµησης µε ελάχιστο ϱυθµό λάθους (minimum-error-rate) υπάρχει σηµαντική απλοποίηση επιλέγοντας g i (x) = P (ω i x), έτσι ώστε η µέγιστη τιµή της διαχωριστικής συνάρτησης να αντιστοιχεί στη µέγιστη εκ των υστέρων πιθανότητα. Σαφώς, η επιλογή διαχωριστικών συναρτήσεων δεν είναι µοναδική. Μπορούµε πάντα να πολλαπλασιάσουµε όλες τις διαχωριστικές συναρτήσεις µε την ίδια ϑετική σταθερά ή να τις µετατοπίσουµε κατά την ίδια σταθερά χωρίς να επηρεάζεται η απόφαση. Γενικότερα, αντικαθιστώντας το κάθε g i (x) µε f(g i (x)), όπου f( ) είναι µία αύξουσα µονότονη συνάρτηση, η προκύπτουσα ταξινόµηση παραµένει αµετάβλητη. Αυτή η παρατήρηση µπορεί να οδηγήσει σε σηµαντικές αναλυτικές και υπολογιστικές απλοποιήσεις. Ειδικότερα, στην περίπτωση της ταξινόµησης µε ελάχιστο ϱυθµού λάθους, οποιαδήποτε από τις ακόλουθες επιλογές δίνει τα ίδια αποτελέσµατα ταξινόµησης, ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 61

Σχήµα 3.3: Η λειτουργική δοµή ενός γενικού στατιστικού ταξινοµητή προτύπων ο οποίος περιλαµβάνει d εισόδους και c διαχωριστικές συναρτήσεις g i (x). Με ένα επόµενο ϐήµα κα- ϑορίζεται ποια από τις τιµές των g i (x) είναι η µέγιστη, και ταξινοµεί το πρότυπο εισόδου αναλόγως. Τα ϐέλη παρουσιάζουν την κατεύθυνση της ϱοής των πληροφοριών και παραλείπονται όταν η κατεύθυνση είναι αυτονόητη. µε µερικές όµως να είναι απλούστερες ως προς την κατανόηση ή τον υπολογισµό σε σχέση µε άλλες : p(x ω i )P (ω i ) g i (x) = P (ω i x) = c j=1 p(x ω (3.9) j)p (ω j ) g i (x) = p(x ω i )P (ω i ) (3.10) g i (x) = lnp(x ω i ) + lnp (ω i ). (3.11) Ακόµα και αν οι διαχωριστικές συναρτήσεις µπορέσουν να γραφούν διαφορετικά, οι κανόνες απόφασης είναι ισοδύναµοι. Η επίδραση οποιουδήποτε κανόνα απόφασης είναι να διαιρέσει το χώρο των χαρακτηριστικών σε c περιοχές απόφασης, R 1,..., R c. Αν g i (x) > g j (x) για κάθε j i, τότε το x είναι στη περιοχή R i και ο κανόνας απόφασης µας λέει να τοποθετήσουµε το x στο w i. Οι περιοχές είναι χωρισµένες από τα όρια απόφασης, που αποτελούν επιφάνειες στο χώρο χαρακτηριστικών στις οποίες εµφανίζονται ισοπαλίες µεταξύ των µεγαλύτερων διαχωριστικών συναρτήσεων (Σχήµα 3.4). 3.1.1.2 Περίπτωση δύο κλάσεων Ενώ η περίπτωση δύο κλάσεων είναι ακριβώς µια ειδική περίπτωση της πολλών κλάσεων, παραδοσιακά η επεξεργασία της είναι διαφορετική. Πράγµατι, ένας ταξινοµητής που τοπο- ϑετεί ένα πρότυπο σε µία από µόνο δύο κλάσεις λέγεται διχοτόµος. Αντί της χρήσης δύο διαχωριστικών συναρτήσεων g 1 και g 2 και της αντιστοίχησης του x στην ω i αν g 1 > g 2, είναι πιο ϕυσικό να καθοριστεί µια ενιαία συνάρτηση διαχωρισµού : g(x) g 1 (x) g 2 (x) (3.12) και να χρησιµοποιηθεί ο ακόλουθος κανόνας απόφασης : Επιλέγουµε ω 1 αν g(x) > 0, αλλιώς επιλέγουµε ω 2. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 62

Σχήµα 3.4: Στο δισδιάστατο ταξινοµητή δύο κλάσεων του σχήµατος, οι π.π. είναι κανονικές, ενώ το όριο απόφασης αποτελείται από δύο υπερβολές µε αποτέλεσµα η περιοχή απόφασης R 2 να χωρίζεται σε δύο κοµµάτια. Οι ελλείψεις σηµειώνουν τις περιοχές όπου η πυκνότητα είναι 1/e ϕορές η πυκνότητα στην κορυφή της κατανοµής. Κατά συνέπεια, η διχοτόµος µπορεί να ϑεωρηθεί σαν µια µηχανή που υπολογίζει µια ενιαία συνάρτηση διάχωρισµού g(x), και ταξινοµεί το x σύµφωνα µε το αλγεβρικό πρόσηµο του αποτελέσµατος. Από τις διάφορες µορφές που µπορεί να γραφτεί η συνάρτηση διαχωρισµού ελάχιστου ϱυθµού σφάλµατος, προτιµώνται οι ακόλουθες δύο που παράγονται από τις Εξισώσεις (3.9) και (3.11) αντίστοιχα : g(x) = P (ω 1 x) P (ω 2 x) (3.13) g(x) = ln p(x ω 1) p(x ω 2 ) + lnp (ω 1) P (ω 2 ) (3.14) 3.1.2 Η πυκνότητα πιθανότητας της κανονικής κατανοµής Η δοµή ενός ταξινοµητή Bayes καθορίζεται από τις δεσµευµένες συναρτήσεις π.π. p(x ω i ) καθώς και από τις εκ των προτέρων πιθανότητες P (ω i ). Από τις διάφορες συναρτήσεις πυκνότητας που έχουν διερευνηθεί, αυτή που έχει προκαλέσει το µεγαλύτερο ενδιαφέρον είναι η κανονική ή γκαουσιανή συνάρτηση π.π. πολλών µεταβλητών. Ο λόγος που είναι τόσο γνωστή είναι η υπολογιστική απλότητα που προσφέρει σε συνδυασµό µε το γεγονός ότι προτυποποιεί κατάλληλα ένα µεγάλο αριθµό περιπτώσεων. Αποτελεί ένα κατάλληλο πρότυπο στην περίπτωση που τα διανύσµατα των χαρακτηριστικών x για µια δοσµένη κλάση ω i αποτελούν τυχαία αλλοιωµένες εκδόσεις, συνεχείς ως προς τις τιµές τους, ενός ενιαίου τυπικού διανύσµατος µ i. Σε αυτό το τµήµα παρέχεται µια συνοπτική έκθεση της π.π. της κανονικής κατανοµής µίας και πολλών µεταβλητών, εστιάζοντας στις ιδιότητες που παρουσιάζουν ενδιαφέρον για τα προβλήµατα ταξινόµησης. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 63

3.1.2.1 Η µονοδιάστατη συνάρτηση π.π. της κανονικής κατανοµής Αρχικά εισάγουµε τη συνεχή συνάρτηση π.π. που δίνεται από την σχέση : [ p(x) = 1 exp 1 2πσ 2 της κανονικής κατανοµής µιας µεταβλητής ( ) ] 2 x µ, (3.15) σ για την οποία η αναµενόµενη τιµή του x δίνεται από τη σχέση : µ E[x] = + xp(x)dx, (3.16) και όπου η αναµενόµενη τιµή της τετραγωνικής τυπικής απόκλισης ή διασποράς είναι : σ 2 E[(x µ) 2 ] = + (x µ) 2 p(x)dx. (3.17) Η συνάρτηση π.π. µίας µεταβλητής που ακολουθεί την κανονική κατανοµή προσδιορίζεται µε απόλυτο τρόπο από δύο παραµέτρους : τη µέση τιµή µ και τη διασπορά σ 2. Χάριν απλότητας, περιγράφουµε συχνά την Εξίσωση (3.15) γράφοντας p(x) N(µ, σ 2 ) για να δηλώσουµε ότι η µεταβλητή x έχει κανονική κατανοµή µε µέσο µ και διασπορά σ 2. Τα δείγµατα από τις κανονικές κατανοµές τείνουν να συγκεντρωθούν γύρω από το µέσο όρο, µε µια διασπορά σχετική µε την τυπική απόκλιση σ (ϐλέπε Σχήµα 3.5). Σχήµα 3.5: Η κανονική κατανοµή µίας µεταβλητής x έχει κατά προσέγγιση 95% του εµβαδού της στο εύρος x µ 2σ. Η κορυφή της κατανοµής, η οποία έχει τη µορφή καµπάνας, έχει τιµή p(µ) = 1 2πσ. Υπάρχει µια ϐασική σχέση µεταξύ της κανονικής κατανοµής και της εντροπίας, όπου η ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 64

εντροπία µιας κατανοµής δίνεται από τη σχέση : H(p(x)) = + p(x)lnp(x)dx, (3.18) και µετριέται σε nats, ενώ αν χρησιµοποιηθεί λογάριθµος µε ϐάση το 2 η µονάδα γίνεται το bit. Η εντροπία περιγράφει τη ϑεµελιώδη αβεβαιότητα για τις τιµές των σηµείων που επιλέγονται τυχαία από µια κατανοµή. Μπορεί να αποδειχθεί ότι η κανονική κατανοµή παρουσιάζει τη µέγιστη εντροπία όλων των κατανοµών, έχοντας δεδοµένο µέσο όρο και διασπορά [23]. Επιπλέον, όπως δηλώνεται από το κεντρικό οριακό ϑεώρηµα, το συνολικό αποτέλεσµα του α- ϑροίσµατος ενός µεγάλου αριθµού µικρών, ανεξάρτητων τυχαίων διαταραχών ϑα οδηγήσει σε µια κανονική κατανοµή. Επειδή πολλά πρότυπα µπορεί να ϑεωρηθεί ότι ακολουθούν κάποιο ιδανικό ή πρωτότυπο πρότυπο, το οποίο όµως αλλοιώνεται από έναν µεγάλο αριθµό τυχαίων διαδικασιών, η κανονική κατανοµή αποτελεί συχνά ένα καλό µοντέλο για την πραγµατική κατανοµή πιθανότητας. 3.1.2.2 Συνάρτηση κατανοµής πολλών µεταβλητών Η πολυµεταβλητή συνάρτηση π.π. της κανονικής κατανοµής σε d διαστάσεις περιγράφεται από την σχέση : 1 p(x) = (2π) d/2 Σ exp 1 1/2 2 (x µ)t Σ 1 (x µ) (3.19) όπου x είναι ένα διάνυσµα στήλης d-συνιστωσών, µ είναι το διάνυσµα των µέσων τιµών d- συνιστωσών, Σ είναι η µήτρα συνδιασποράς διαστάσεων d x d µε Σ και Σ 1 η ορίζουσα και ο αντίστροφος της αντίστοιχα. Τυπικά, έχουµε : µ E[x] = xp(x)dx (3.20) και Σ E[(x µ)(x µ) T ] = (x µ)(x µ) T p(x)dx, (3.21) όπου η αναµενόµενη τιµή ενός διανύσµατος ή ενός πίνακα ϐρίσκεται µε τη λήψη των ανα- µενόµενων τιµών των συνιστωσών του. Με άλλα λόγια, αν x i είναι η i-οστή συνιστώσα του x, m i είναι η i-οστή συνιστώσα του µ, και σ ij είναι η ij-οστή συνιστώσα του Σ, τότε : µ i = E[x i ] και σ ij = E[(x i µ i )(x j µ j )] (3.22) Ο πίνακας συνδιασποράς Σ είναι πάντοτε συµµετρικός και ϑετικά ηµιορισµένος. Θα περιορίσουµε την προσοχή µας στην περίπτωση στην οποία ο Σ είναι ϑετικά ορισµένος. Τα διαγώνια στοιχεία σ ii είναι οι διασπορές των αντίστοιχων x i (δηλ. σ 2 i ) και τα µη-διαγώνια στοιχεία σ ij είναι οι συνδιασπορές x i και x j. Αν x i και x j είναι στατιστικά ανεξάρτητα, τότε σ ij = 0. Εάν όλα τα µη-διαγώνια στοιχεία είναι µηδέν, η p(x) µειώνεται στο γινόµενο των κανονικών πυκνοτήτων µίας µεταβλητής για τις συνιστώσες του x. Η κανονική πυκνότητα πολλών µεταβλητών διευκρινίζεται πλήρως από d + d(d + 1)/2 πα- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 65

ϱαµέτρους - τα στοιχεία του διανύσµατος µέσων µ και τα ανεξάρτητα στοιχεία της µήτρας συνδιασποράς Σ. Τα δείγµατα που προέρχονται από έναν κανονικό πληθυσµό τείνουν να εµπίπτουν σε ένα ενιαίο σύννεφο ή σύµπλεγµα (ϐλέπε Σχήµα 3.6). Το κέντρο του συµπλέγ- µατος καθορίζεται από το διάνυσµα µέσων και η µορφή του συµπλέγµατος καθορίζεται από τη µήτρα συνδιασποράς. Προκύπτει από την Εξίσωση (3.19), ότι οι γεωµετρικοί τόποι των σηµείων της σταθερής πυκνότητας είναι υπερελλιψοειδή για τα οποία ο τετραγωνικός τύπος (x µ) T Σ 1 (x µ) είναι σταθερός. Οι κύριοι άξονες αυτών των υπερελλιψοειδών δίνονται από τα ιδιοδιανύσµατα της µήτρας Σ, ενώ οι ιδιοτιµές της καθορίζουν τα µήκη τους. Η ποσότητα : r 2 = (x µ) t Σ 1 (x µ) (3.23) καλείται µερικές ϕορές ως τετραγωνική απόσταση Mahalanobis από το x στο µ. Κατά συνέπεια, τα περιγράµµατα σταθερής πυκνότητας είναι υπερελλιψοειδή της σταθερής απόστασης Mahalanobis στο µ και ο όγκος των υπερελλιψοειδών αυτών µετρά τη διασπορά των δειγµάτων γύρω από το µέσο όρο. Σχήµα 3.6: είγµατα από µια δισδιάστατη κανονική κατανοµή που ϐρίσκονται σε ένα σύννεφο µε κέντρο του το µέσο µ. Οι κόκκινες ελλείψεις εκφράζουν γραµµές µε ίση πυκνότητα πιθανότητας της κανονικής κατανοµής. 3.2 Μηχανές ιανυσµάτων Υποστήριξης (SVM) Οι Μηχανές ιανυσµάτων Υποστήριξης (SVM: Support Vector Machines) αποτελούν συστήµατα τα οποία µαθαίνουν ή εκπαιδεύονται χρησιµοποιώντας µια αλγοριθµική προσέγγιση που ϐασίζεται στη ϑεωρία ϐελτιστοποίησης [6], [21]. Είναι κατάλληλα ακόµα και για προβλήµατα µε µικρό αριθµό δεδοµένων/παραδειγµάτων και δεν ϐασίζονται σε εκ των προτέρων γνώση σχετικά µε το υπό εξέταση πρόβληµα. Στόχος ενός ταξινοµητή που ϐασίζεται σε διανύσµατα υποστήριξης είναι να κατασκευάσει το ϐέλτιστο διαχωριστικό υπερεπίπεδο σε ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 66

ένα πολυδιάστατο χώρο χαρακτηριστικών. Με τον όρο ϐέλτιστο εννοούµε ότι, στην περίπτωση γραµµικά διαχωρίσιµων κατηγοριών, το υπερεπίπεδο (w, b) που ϑα κατασκευαστεί ϑα είναι αυτό µε το µέγιστο περιθώριο (ή απόσταση) από τα πιο κοντινά παραδείγµατα σε αυτό τον πολυδιάστατο χώρο των χαρακτηριστικών. Τα παραδείγµατα αυτά που ϐρίσκονται πάνω στο περιθώριο καλούνται διανύσµατα υποστήριξης. Οι µηχανές διανυσµάτων υποστήριξης έχουν αρκετές αξιοπρόσεκτες ιδιότητες που άλλοι αλγόριθµοι εκµάθησης δεν έχουν, όπως η µεγιστοποίηση του περιθωρίου (maximization of margin) και ο µη γραµµικός µετασχηµατισµός του χώρου εισόδου στο χώρο των χαρακτηριστικών χρησιµοποιώντας µεθόδους πυρήνων. Ως αποτέλεσµα, παρουσιάζουν καλές ιδιότητες γενίκευσης, ανθεκτικότητα στην υπερεκπαίδευση και στην υψηλή διαστατικότητα, ίσως µε κόστος σε κάποιες περιπτώσεις τη χαµηλή ταχύτητα εκτέλεσης. Στο Σχήµα 3.7 ϕαίνεται ένα παράδειγµα ενός απλού δισδιάστατου προβλήµατος που είναι γραµµικά διαχωρίσιµο και πα- ϱουσιάζονται παραδείγµατα υπερεπιπέδων που διαχωρίζουν τις κατηγορίες µε διαφορετικές αποτελεσµατικότητας. Το υπερεπίπεδο µέγιστου περιθωρίου µε τα διανύσµατα υποστήριξης ϕαίνεται καλύτερα στο Σχήµα (3.8). Ενας γραµµικός SVM αποτελεί το υπερεπίπεδο που Σχήµα 3.7: Το υπερεπίπεδο Η3 (πράσινο) δεν διαχωρίζει τις δύο κατηγορίες, το Η1 (µπλε) τις διαχωρίζει µε µικρό περιθώριο και το Η2 (κόκκινο) µε το µέγιστο περιθώριο. διαχωρίζει ένα σύνολο ϑετικών παραδειγµάτων από ένα σύνολο αρνητικών, µεγιστοποιώντας το περιθώριο στο χώρο των χαρακτηριστικών, την απόσταση δηλαδή του υπερεπιπέδου από τα πλησιέστερα ϑετικά ή αρνητικά παραδείγµατα. Κάθε χαρακτηριστικό αντιστοιχεί σε µια διάσταση στο χώρο των χαρακτηριστικών. Η απόσταση ενός σηµείου των δεδοµένων (πρότυπο) από το υπερεπίπεδο καθορίζεται από την ισχύ κάθε χαρακτηριστικού του. Για παράδειγµα, για ένα ϑετικό πρότυπο µε πολλά ισχυρά χαρακτηριστικά σχετιζόµενα µε την ϑετική κλάση, η ϑέση του σηµείου του στο χώρο χαρακτηριστικών ϑα είναι µακριά από το υπερεπίπεδο, στην ϑετική πλευρά. ιαισθητικά η µεγιστοποίηση του περιθωρίου οδηγεί σε πιο σθεναρούς ταξινοµητές οι οποίοι δεν εµφανίζουν το γνωστό πρόβληµα της υπερεκπαίδευσης (overtraining) ή καλύτερα της υπερπροσαρµογής στα δεδοµένα εκπαίδευσης. Το πρόβληµα της υπερπροσαρµογής στα δεδοµένα εµφανίζεται σε περιπτώσεις που η διαδι- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 67

Σχήµα 3.8: Το υπερεπίπεδο µέγιστου περιθωρίου και τα περιθώρια για ένα SVM εκπαιδευ- µένο µε δείγµατα από δύο κατηγορίες. Τα δείγµατα που ϐρίσκονται πάνω στο περιθώριο καλούνται διανύσµατα υποστήριξης. κασία εκµάθησης διαρκεί µεγάλα χρονικά διαστήµατα ή που τα παραδείγµατα εκµάθησης είναι ελάχιστα. Τότε, η εκπαίδευση του ταξινοµητή µπορεί να αφοσιωθεί σε πολύ συγκεκριµένα τυχαία χαρακτηριστικά των δεδοµένων εκµάθησης που δεν έχουν καµία ουσιαστική σχέση µε τις συναρτήσεις στόχου, τις οποίες προσπαθεί να προσεγγίσει ο ταξινοµητής. Στη διαδικασία της υπερπροσαρµογής, η απόδοση του ταξινοµητή στα παραδείγµατα εκµάθησης συνεχίζει να αυξάνεται, ενώ η απόδοση σε άγνωστα δεδοµένα χειροτερεύει. Μία απεικόνιση του προβλήµατος της υπερπροσαρµογής παρουσιάζεται στα διαγράµµατα του Σχήµατος 3.9. 3.2.1 Μαθηµατικό υπόβαθρο των SVM Ας ϑεωρήσουµε ένα πρόβληµα ταξινόµησης δύο κλάσεων C 0, C 1, οι οποίες είναι γραµµικά διαχωρίσιµες. Αυτό σηµαίνει ότι υπάρχει ένα διάνυσµα w και ένα κατώφλι w 0, τέτοιο ώστε : { < 0 w T αν x C0 x + w 0 (3.24) > 0 αν x C 1 Είναι σαφές ότι δεν υπάρχει µια µόνο λύση σ αυτό το πρόβληµα ταξινόµησης καθώς άπειρα Ϲεύγη (w, w 0 ) µπορούν να διαχωρίσουν τις δύο κλάσεις. Συνεπώς τίθεται το ερώτηµα της επιλογής µιας λύσεως µεταξύ των πολλών, ϑέτοντας κάποιο κριτήριο αξιολόγησης των λύσεων. Ενα τέτοιο κριτήριο είναι το περιθώριο ταξινόµησης γ, µεταξύ των δύο κλάσεων, το οποίο ορίζεται ως το άθροισµα γ = γ 0 + γ 1 µεταξύ των δύο παρακάτω περιθωρίων (το γ 0 για την ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 68

Σχήµα 3.9: (α) εδοµένα εκµάθησης και ένας ταξινοµητής µε πρόβληµα υπερπροσαρµογής (ϐ) Εφαρµογή του ταξινοµητή µε πρόβληµα υπερπροσαρµογής σε δεδοµένα δοκιµής (γ) εδοµένα εκµάθησης και ένας καλύτερος ταξινοµητής (δ) Εφαρµογή του καλύτερου ταξινοµητή στα δεδοµένα δοκιµής. ( : δεδοµένα εκµάθησης, : τεστ δεδοµένα δοκιµής) κλάση C 0 και το γ 1 για την κλάση C 1 ): γ 0 = min x C0 w T x + w 0 w 0 (w T x + w 0 ) = min x C0, (3.25) w 0 γ 1 = min x C1 w T x + w 0 w 0 (w T x + w 0 ) = min x C1. (3.26) w 0 Για να ερµηνευθεί το κριτήριο αυτό και να κατανοηθεί γιατί χρησιµοποιείται η λέξη περι- ϑώριο ας παρατηρήσουµε ότι η τιµή wt x+w 0 w 0 είναι ευθέως ανάλογη µε την απόσταση του διανύσµατος x από τη γραµµική διαχωριστική επιφάνεια w T x + w 0 = 0. (3.27) Συνεπώς οι αριθµοί γ 0, γ 1 είναι ϑετικοί και αντιστοιχούν στην απόσταση του πιο κοντινού προτύπου της κάθε κλάσης από τη διαχωριστική επιφάνεια. Οσο η τιµή γ 0 πλησιάζει πιο κοντά στο 0, τόσο πιο οριακή είναι η ταξινόµηση των προτύπων της κλάσης C 0, αφού για τα πρότυπα που είναι πιο κοντά στη διαχωριστική επιφάνεια, µια µικρή µετατόπιση, π.χ. λόγω ϑορύβου, ϑα τα στείλει στην άλλη µεριά. Αντίστοιχα, το ίδιο ισχύει και για το γ 1 και την κλάση C 1. Τα πρότυπα x της κλάσης C 0 καθώς και τα πρότυπα x της κλάσης C 1 για τα οποία επιτυγχάνεται η ελάχιστη απόσταση, δηλαδή wt x+w 0 w 0 = γ 0 και wt x +w 0 w 0 = γ 1, καλούνται διανύσµατα υποστήριξης. Με ϐάση τα παραπάνω, το συνολικό περιθώριο ταξινόµησης γ, είναι ένα µέτρο της εγγύτητας µεταξύ των δύο κλάσεων. Η εξίσωση του υπερεπιπέδου (3.27) εµπεριέχει αρκετό πλεονασµό. Για παράδειγµα, τα Ϲεύγη ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 69

(αw, αw 0 ) και (w, w 0 ) περιγράφουν ακριβώς το ίδιο υπερεπίπεδο στο χώρο και µάλιστα αυτό ισχύει για οποιαδήποτε σταθερά α. Ως γνωστόν, το κατώφλι w 0 ευθύνεται για την παράλληλη µετατόπιση του διαχωριστικού υπερεπιπέδου, ενώ το διάνυσµα w ευθύνεται για την κατεύθυνση (κλίση) του υπερεπιπέδου. Ονοµάζουµε κανονικό διαχωριστικό υπερεπίπεδο αυτό το οποίο : τοποθετεί το κατώφλι w 0 ακριβώς στη µέση ανάµεσα στις δύο κλάσεις, οπότε γ 0 = γ 1, και η κλιµάκωση των w και w 0 είναι τέτοια ώστε : { 0 w T αν x C0 x + w 0 (3.28) 0 αν x C 1 Συνεπώς, σύµφωνα µε τις Εξισώσεις (3.25) - (3.26), για ένα κανονικό διαχωριστικό υπερεπίπεδο έχουµε min x C0 w T x + w 0 = min x C1 w T x + w 0 = 1, και γ 0 = γ 1 = 1 w, οπότε : γ = 2 w. (3.29) Εστω ότι διαθέτουµε P Ϲεύγη προτύπων-στόχων : (x 1, d 1 ),... (x P, d P ), όπου d i = 1 αν x i C 0 και d i = 1 αν x i C 1. Τότε οι ανισότητες που περιγράφουν το κανονικό διαχωριστικό υπερεπίπεδο (Εξίσωση (3.28) ) απλοποιούνται στη µορφή : d i (w T x + w 0 ) 1, i = 1,..., P. (3.30) Τώρα είµαστε σε ϑέση να ορίσουµε ως καταλληλότερη λύση του προβλήµατος το κανονικό διαχωριστικό υπερεπίπεδο της µορφής της Εξίσωσης (3.30), το οποίο µεγιστοποιεί το περιθώριο γ της Εξίσωσης (3.29). Σύµφωνα µε την Εξίσωση (3.29), η µεγιστοποίηση του γ ισοδυναµεί µε την ελαχιστοποίηση της νόρµας w ή w 2. Ετσι η αναζήτηση της καταλληλότερης λύσης µετατρέπεται στο ακόλουθο πρόβληµα ϐέλτιστου διαχωριστικού υπερεπιπέδου. Υπολόγισε το ελάχιστο της συνάρτησης : J(w, w 0 ) = 1 2 w 2 (3.31) υπό τους περιορισµούς των P ανισοτήτων που δίνονται στην Εξίσωση (3.30). Το παραπάνω πρόβληµα ϐελτιστοποίησης ανήκει στην περιοχή του τετραγωνικού προγραµ- µατισµού. Η ελαχιστοποίηση της τετραγωνικής συνάρτησης J(w, w 0 ) γίνεται µε τη χρήση των πολλαπλασιαστών Lagrange, δηµιουργώντας την παρακάτω συνάρτηση κόστους Lagrange: L(w, w 0, λ 1,..., λ P ) = 1 2 w 2 P λ i [d i (w T x i + w 0 ) 1] (3.32) i=1 ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 70

όπου έχει εισαχθεί ένας συντελεστής λ i, i = 1,..., P για κάθε περιορισµό της της Εξίσωσης (3.30). Επειδή οι περιορισµοί αυτοί είναι µε τη µορφή ανισότητας οι πολλαπλασιαστές Lagrange πρέπει να ικανοποιούν τις ανισότητες : λ i 0, i = 1,..., P. (3.33) Η συνάρτηση L πρέπει να ελαχιστοποιηθεί ως προς τα w, w 0, και να µεγιστοποιηθεί ως προς τα λ i. Στο ϐέλτιστο σηµείο πρέπει να ισχύουν οι παρακάτω συνθήκες : ϑl ϑw 0 = 0, ϑl ϑw = 0 (3.34) και λ i [d i (w T x i + w 0 ) 1] = 0, i = 1,..., P. (3.35) Μετά από απλές πράξεις ϐρίσκουµε ότι οι συνθήκες ελαχιστοποίησης µεταφράζονται στις παρακάτω εξισώσεις : P λ i d i = 0 (3.36) i=1 w = P λ i d i x i. (3.37) i=1 Ετσι η Εξίσωση (3.37) δίνει τη ϐέλτιστη τιµή του w οπότε η ϐέλτιστη γραµµική διαχωριστική επιφάνεια είναι : P g (x) = w T x + w 0 = λ i d i x T i x + w 0. (3.38) Επίσης, µπορούµε πλεόν να υπολογίσουµε τη ϐέλτιστη πόλωση w 0 µε ϐάση την Εξίσωση (3.37). Πράγµατι, αν το x i είναι ένα διάνυσµα υποστήριξης τότε : i=1 d i (w T x i + w 0 ) = 1 w 0 = 1 d i x i. (3.39) Από την Εξίσωση (3.38) προκύπτει τέλος το ακόλουθο ενδιαφέρον αποτέλεσµα : οι µόνοι πολλαπλασιαστές λ i που µπορούν να είναι µη-µηδενικοί (και συνεπώς να είναι ϑετικοί, αφού λ i 0) είναι αυτοί για τους οποίους d i (w T x i + w 0 ) = 1, δηλαδή αυτοί που αντιστοιχούν σε κάποιο διάνυσµα υποστήριξης x i. Για όλα τα υπόλοιπα διανύσµατα x i, που αποτελούν και τη συντριπτική πλειοψηφία, πρέπει να έχουµε λ i = 0. 3.2.2 Μη διαχωρίσιµα προβλήµατα Η µέθοδος SVM που παρουσιάστηκε παραπάνω είναι κατάλληλη για την επίλυση γραµµικά διαχωρίσιµων προβληµάτων. Βασίζεται στην υπόθεση ότι το πρόβληµα είναι γραµµικά διαχωρίσιµο και έτσι ορίζονται το κανονικό διαχωριστικό υπερεπίπεδο και τα διανύσµατα υποστήριξης. Πολλά προβλήµατα, ωστόσο, δεν είναι διαχωρίσιµα. Παρ ολα αυτά, η µέθο- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 71

δος µπορεί να επεκταθεί και να αντιµετωπίσει επιτυχώς και τα µη διαχωρίσιµα προβλήµατα µε ϐαθµό επιτυχίας ανάλογο µε τις παραµέτρους που επιλέγει ο χρήστης. Συγκεκριµένα, τροποποιούµε το πρόβληµα τετραγωνικού προγραµµατισµού εισάγοντας µεταβλητές χαλαρότητας ξ i για κάθε έναν από τους περιορισµούς της Εξίσωσης (3.30), οι οποίες εισάγονται έτσι ώστε να επιτρέψουν παραβίαση των περιορισµών που σχετίζονται µε το περιθώριο : d i (w T x i + w 0 ) 1 ξ i, i = 1,..., P και ξ i 0. (3.40) Προφανώς αν η µεταβλητή ξ i είναι µεγαλύτερη απο 1 τότε το πρότυπο x i ταξινοµείται στη λάθος κλάση. Συνεπώς το άθροισµα των µεταβλητών χαλαρότητας είναι ένα άνω όριο του πλήθους των προτύπων που ταξινοµούνται λάθος : P ξ i > πλήθος προτύπων που ταξινοµούνται λάθος (3.41) i=1 Ετσι ειναι λογικό να προστεθεί ένα κόστος ανάλογο του παραπάνω αθροίσµατος στην αρχική συνάρτηση κόστους (τετραγωνική συνάρτηση) J(w, w 0 ) σχηµατίζοντας το παρακάτω πρόβλη- µα τετραγωνικού προβληµατισµού : Υπολόγισε το ελάχιστο της συνάρτησης : J ns (w, w 0 ) = 1 2 w 2 +C P ξ i (3.42) i=1 υπό τους περιορισµούς των P ανισοτήτων που δίνονται στην Εξίσωση (3.40). Η παράµετρος C επιλέγεται από το χρήστη και είναι το ϐάρος του κόστους των λάθος ταξινοµήσεων. Σκοπός της είναι να ελέγχει τις αλληλοσυγκρουόµενες απαιτήσεις για τη µεγιστοποίηση του περιθωρίου και για την ελαχιστοποίηση του σφάλµατος ταξινόµησης. Αν C = 0 τότε αγνοούµε τελείως τις παραµέτρους χαλαρότητας και οι λάθος ταξινοµήσεις δεν µας ενδιαφέρουν καθόλου. Αν πάλι το C έχει µεγάλη τιµή τότε δίνουµε µεγάλη σηµασία στην σωστή ταξινόµηση των προτύπων. Οπως και στο πρόβληµα των γραµµικά διαχωρίσιµων κλάσεων µπορούµε να χρησιµοποιήσουµε τους πολλαπλασιαστές Lagrange για να δηµιουργήσουµε την συνάρτηση κόστους Lagrange, να ελαχιστοποιήσουµε και να µεγιστοποιήσουµε ως προς τις κατάλληλες µεταβλητές και να υπολογίσουµε τις ϐέλτιστες τιµές τους. 3.2.3 Συναρτήσεις πυρήνα Στην προηγούµενη ενότητα παρουσιάστηκαν οι SVM, οι οποίες µπορούν να δηµιουργήσουν γραµµικές διαχωριστικές επιφάνειες µε σκοπό τον καλύτερο δυνατό διαχωρισµό δύο κλάσεων, είτε αυτές είναι γραµµικά διαχωρίσιµες είτε όχι. Σηµειώνεται ότι σε πολλές περιπτώσεις στις οποίες οι κλάσεις είναι διαχωρίσιµες από µη γραµµικές επιφάνειες η χρησιµοποίηση του γραµµικού διαχωριστικού προτύπου που έχει ήδη παρουσιαστεί, ϑα προκαλούσε αποτυχία στην ταξινόµηση αρκετών προτύπων. Μια απλή επέκταση των αποτελεσµάτων στην ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 72

περίπτωση των µη-γραµµικά διαχωρίσιµων κλάσεων µπορεί να γίνει χρησιµοποιώντας κάποιο κατάλληλο µη-γραµµικό µετασχηµατισµό Φ( ), υποθέτοντας ότι τα µετασχηµατισµένα πρότυπα Φ(x 1 ),..., Φ(x P ) είναι πλέον γραµµικά διαχωρίσιµα. Στην περίπτωση αυτή ισχύουν ακριβώς τα ίδια αποτελέσµατα, µόνο που κάθε πρότυπο x i αντικαθίσταται µε το Φ(x i ) οπότε η ϐέλτιστη διαχωριστική επιφάνεια είναι πλέον : g (x) = w T Φ(x) + w 0 = P λ i d i Φ(x i ) T Φ(x) + w 0. (3.43) i=1 Παρατηρούµε ότι εµφανίζεται εσωτερικό γινόµενο της µορφής Φ(x) T Φ(y), ενώ η συνάρτηση µετασχηµατισµού Φ δεν εµφανίζεται µόνη της. Ορίζοντας την συνάρτηση : k(x, y) = Φ(x) T Φ(y), (3.44) οπότε παίρνουµε : g (x) = P λ i d i k(x i, x) + w 0. (3.45) i=1 Η συνάρτηση k(, ) καλείται συνάρτηση πυρήνα (kernel). Χρησιµοποιώντας την συνάρτηση αυτή µπορούν να απλοποιηθούν οι πράξεις, ιδιαίτερα όταν η διάσταση του x είναι µικρότερη από τη διάσταση του Φ(x). Υπάρχουν περιπτώσεις όπου τα διανύσµατα Φ(x) και Φ(y) µπορεί να έχουν πολύ µεγάλη διάσταση (ή ακόµα και άπειρη) ενώ το k(x, y) µπορεί να υπολογιστεί µε µικρό αριθµό πράξεων. Πολλές συναρτήσεις πυρήνα σχετίζονται µε συναρτήσεις µετασχηµατισµού άπειρων διαστάσεων. Κάθε συνάρτηση k(x, y) η οποία ικανοποιεί κάποιες, όχι ιδιαίτερα αυστηρές συνθήκες, µπορεί να γραφτεί υπό τη µορφή : k(x, y) = P λ j φ j (x)φ j (y), (3.46) j=1 η οποία ισοδυναµεί µε το εσωτερικό γινόµενο Φ(x) T Φ(y) δύο διανυσµάτων απείρων διαστάσεων : Φ(x) = [ λ 1 φ 1 (x), λ 2 φ 2 (x),...] Φ(y) = [ λ 1 φ 1 (y), λ 2 φ 2 (y),....] T (3.47) Οι συντελεστές λ j είναι οι ιδιοτιµές και οι συναρτήσεις φ j οι ιδιοσυναρτήσεις. Εποµένως υπάρχουν πολλές συναρτήσεις πυρήνα k(, ) που σχετίζονται µε συναρτήσεις µετασχηµατισµού Φ απείρων διαστάσεων. Ο Πίνακας 3.1 δίνει µια λίστα από τις πιο συνηθισµένες συναρτήσεις που χρησιµοποιούνται στην πράξη, είτε αυτές σχετίζονται µε συναρτήσεις Φ απείρων διαστάσεων είτε όχι. exp { x y 2 /(2σ 2 )} Γκαουσιανή RBF [x T y + θ] p Πολυωνυµική tanh(ax T y + θ) Σιγµοειδής 1 Αντίστροφη πολυτετραγωνική x y 2 +c 2 ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 73

Πίνακας 3.1: Συνηθισµένες συναρτήσεις πυρήνα k(x, y) Ενα χαρακτηριστικό παράδειγµα είναι η γκαουσιανή συνάρτηση πυρήνα : k(x, y) = exp{ x y 2 /(2σ 2 )} (3.48) Στην περίπτωση αυτή η συνάρτηση Φ( ) που παράγει τον γκαουσιανό πυρήνα είναι άγνωστη και δεν είναι καθόλου εύκολο να υπολογιστεί. Μάλιστα, η Φ(x) απεικονίζει το διάνυσµα x σε ένα διάνυσµα απείρων διαστάσεων. Καθώς όµως παντού χρησιµοποιείται η συνάρτηση πυρήνα k(, ), η Φ δεν είναι απαραίτητη. Το αν η συνάρτηση πυρήνα k(, ) είναι κατάλληλη για τον διαχωρισµό των συγκεκριµένων κλάσεων είναι ένα ανεξάρτητο ερώτηµα που απαντιέται συνήθως αφού γίνει η εφαρµογή της k στο δεδοµένο πρόβληµα και γίνει αξιολόγηση της λύσης που επιτυγχάνεται (Σχήµατα 3.10 και 3.11). Σχήµα 3.10: ιαχωριστικό υπερεπίπεδο µε χρήση πολυωνυµικής συνάρτησης πυρήνα. Η συνάρτηση µετασχηµατίζει τον χώρο χαρακτηριστικών από δισδιάστατο σε τρισδιάστατο για καλύτερα αποτελέσµατα ταξινόµησης (x 1, x 2 ) (z 1, z 2, z 3 ) = (x 2 1, 2x 1 x 2, x 2 1) Σχήµα 3.11: Η κανονική RBF συνάρτηση k(x, x ) = exp( γ x x 2 ) είναι µία από τις πιο διαδεδοµένες συναρτήσεις πυρήνα. ηµιουργεί µία καµπύλη γύρω από κάθε σηµείο των δεδοµένων : f(x) = m i=1 a iexp( γ x i x 2 ) + b ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 74

Κεφάλαιο 4 Μεθοδολογία και Αποτελέσµατα 4.1 Εισαγωγή Οι διεπαφές ανθρώπινου εγκεφάλου-υπολογιστή, όπως περιγράφηκαν στο Κεφάλαιο ;;, απαιτούν αποτελεσµατική επεξεργασία των µετρήσεων ηλεκτροεγκεφαλογραφικών σηµάτων (ΗΕΓ) σε πραγµατικό χρόνο, προκειµένου να µεταφράσουν τις νοητικές διεργασίες/προθέσεις του σε σήµατα ελέγχου εξωτερικών διατάξεων ή συστηµάτων. Στο Κεφάλαιο αυτό παρουσιάζεται µία µέθοδος για την ταξινόµηση πλασµατικών αριστερών και δεξιών κινήσεων των χεριού, δηλαδή κινήσεων που δεν υλοποιούνται στην πράξη, αλλά µόνο ϕαντάζονται από τον χρήστη, οι οποίες εµφανίζονται ως προκλητά γεγονότα, ενσωµατωµένα σε ϑορυβώδεις χρονοσειρές εγκεφαλικών σηµάτων. Πιο συγκεκριµένα, ο σκοπός του προβλήµατος της δυαδικής ταξινόµησης είναι να ληφθεί η απόφαση όσο το δυνατόν ταχύτερα, αλλά παράλληλα και αξιόπιστα, από τα εγγεγραµ- µένα ΗΕΓ δεδοµένα. Η µέθοδος που παρουσιάζεται ϐασίζεται σε πληροφορίες στο πεδίο χρόνου-συχνότητας (χαρακτηριστικά) που αντλούνται µε το ϕιλτράρισµα των ακατέργαστων ΗΕΓ δεδοµένων ευρείας Ϲώνης µε τη ϐοήθεια αιτιατών κυµατιδίων Morlet, που προσαρµό- Ϲονται στα µεµονωµένα ΗΕΓ ϕάσµατα. Με δεδοµένο ότι οι πλασµατικές κινήσεις των χεριών οδηγούν σε διαταράξεις των εγκεφαλικών ϱυθµών γύρω από το κέντρο του εγκεφάλου (του συνεχόµενου µ ϱυθµού σε µεγαλύτερο ϐαθµό και του κεντρικού β σε µικρότερο), προσεγγίζονται διανύσµατα χαρακτηριστικών για τη διαµόρφωση πλάτους σε χαµηλότερες (10 Hz) και υψηλότερες (20 Hz) Ϲώνες συχνοτήτων πάνω από τους αισθητικοκινητικούς ϕλοιούς, αντίπλευρα και οµόπλευρα στις κινήσεις των χεριών (δηλαδή στα ΗΕΓ κανάλια C3 και C4). Για την ταξινόµηση αναπτύσσονται δύο διαφορετικές µέθοδοι. Η πρώτη µέθοδος αφορά τη δηµιουργία πιθανοτικών µοντέλων κανονικής κατανοµής για κάθε κατηγορία πρόθεσης/κίνησης µε την τελική απόφαση ταξινόµησης να λαµβάνεται από τον κανόνα του Bayes, ενώ η δεύτερη δηµιουργεί ένα µοντέλο ταξινόµησης µε ϐάση το ϑεωρητικό πλαίσιο των Μηχανών ιανυσµάτων Υποστήριξης (SVM). Για να ενσωµατωθούν στην απόφαση ταξινόµησης σε µια δεδοµένη χρονική στιγµή t και οι αποφάσεις που αφορούν προγενέστερες χρονικές στιγµές, προτείνεται ένα κατάλληλο µοντέλο, σταθµισµένο µε ϐάρη, το οποίο δίνει έµφαση στις χρονικές στιγµές που παρέχουν υψηλότερη διαφοροποίηση µεταξύ των στιγµιαίων κατανοµών των δύο κλάσεων των χαρακτηριστικών. 75

4.2 Περιγραφή πειραµατικού πλαισίου και δεδοµένων Οι περισσότερες από τις προσεγγίσεις µοντελοποίησης των χαρακτηριστικών εκείνων που δια- ϕοροποιούν τις προθέσεις του χρήστη για ένα BCI, εκµεταλλεύονται τις διαταράξεις των εγκεφαλικών ϱυθµών, προκειµένου να πετύχουν τη διάκριση µεταξύ των χαρακτηριστικών τους και, κατά συνέπεια, την αποτελεσµατική ταξινόµηση των άγνωστων εγκεφαλικών καταστάσεων. Μία τέτοια περίπτωση παρουσιάζεται στους αισθητικοκινητικούς ϕλοιούς του ανθρώπινου εγκεφάλου, µε τις ϱυθµικές ταλαντώσεις των ΗΕΓ σηµάτων που καταγράφονται πάνω από την περιοχή τους και τις κορυφές στο ϕάσµα ενέργειας κυρίως στα 8-13 Hz (κατά κύριο λόγο πάνω από τον οπίσθιο κεντρικό αισθητικοκινητικό ϕλοιό), που αποτελεί Ϲώνη συχνοτήτων του µ ϱυθµού, και σε µικρότερο ϐαθµό κοντά στα 20 Hz (πάνω από τον εµπρόσθιο κεντρικό αισθητικο-κινητικό ϕλοιό), που αποτελεί Ϲώνη συχνοτήτων του κεντρικού β ϱυθµού. Η διαµόρφωση του µ ϱυθµού προκαλείται από διάφορες εγκεφαλικές διεργασίες, όπως οι προ- ϑέσεις σωµατικής κίνησης, τοσο πραγµατικής όσο και πλασµατικής, αλλά και ως αποτέλεσµα διάφορων σωµατοαισθητηριακών ερεθισµάτων. Τυπικοί µέσοι όροι των trials (επαναλήψεις της ίδιας νοητικής διεργασίας, µε στόχο µια πιο τυποποιηµένη εγκεφαλική απόκριση), όσον αφορά στην ισχύ του µ ϱυθµού, παρουσιάζουν µια ακολουθία εξασθένησης - αποκαλούµενη αποσυγχρονισµός σχετιζόµενος µε κάποιο γεγονός (ERD: Event-Related Desynchronization) και στη συνέχεια ανάκαµψης - συγχρονισµός σχετιζόµενος µε κάποιο γεγονός (ERS: Event-Related Synchronization, ERS) - η οποία συχνά ξεπερνά το επίπεδο πλάτους πριν την εµφάνιση του γεγονότος-ερεθίσµατος. Στο συγκεκριµένο παράδειγµα, προκειµένου να υπάρξει η διάκριση µεταξύ των trials των δεξιών και αριστερών πλασµατικών κινήσεων των χεριών, ϑα γίνει αξιοποίηση των προκαλούµενων διαταράξεων του µ και του κεντρικού β ϱυθµού. Τα ΗΕΓ δεδοµένα συλλέχθηκαν από ένα υγιές άτοµο (25 χρονών, ϑυληκού γένους) κατά τη διάρκεια µιας συνόδου ανατρο- ϕοδότησης, στην οποία καθόταν σε µία καρέκλα µε χαλαρωµένα τα άκρα του. Ο σκοπός είναι ο έλεγχος της µπάρας ανατροφοδότησης µέσω των δεξιών και αριστερών πλασµατικών κινήσεων, η σειρά των οποίων παρουσιάζεται µε τυχαίο τρόπο. Τα δεδοµένα αποτελούνται από 280 trials, που αντιστοιχούν σε εγκεφαλική δραστηριότητα οφειλόµενη σε πλασµατικές κινήσεις των χεριών του χρήστη. Για τα 140 από τα trials είναι γνωστό αν αντιστοιχούν σε αριστερή ή δεξιά κίνηση του χεριού, ενώ για τα άλλα µισά η αντίστοιχη πληροφορία δεν είναι δοσµένη. Σε κάθε περίπτωση ο αριθµός των trials δεξιών και αριστερών κινήσεων είναι ο ίδιος. Κάθε trial έχει διάρκεια 9 sec: στα πρώτα 2 δευτερόλεπτα επικρατεί ηρεµία και τη χρονική στιγµή t = 2 sec ένα ακουστικό ερέθισµα σηµατοδοτεί την εκκίνηση του trial, µε ένα σταυρό να εµφανίζεται στην οθόνη για 1 sec. Τη χρονική στιγµή t = 3 sec εµφανίζεται στην οθόνη µία οπτική ένδειξη (ϐέλος) µε κατεύθυνση είτε ως προς τα αριστερά είτε προς τα δεξιά. Ακολουθεί µία περίοδος ακόµη 6 sec στην οποία Ϲητείται από το άτοµο η εκτέλεση της νοητικής διεργασίας (πλασµατική κίνηση του χεριού που υ- ποδεικνύεται από την αντίστοιχη κατεύθυνση της ένδειξης). Οι προσαρµοστικές παράµετροι αυτοπαλινδρόµησης (AAR) από δύο κανάλια (C3, C4) υπόκεινται σε διαχωριστική ανάλυση και τελικά εµφανίζεται στο άτοµο µία παράµετρος εξόδου, προκειµένου να υλοποιηθεί το πλαίσιο ανατροφοδότησης. Η καταγραφή πραγµατοποιήθηκε µε τη ϐοήθεια ενός ενισχυτή G.tec και Ag/AgCl ηλεκτροδίων. Τρία διπολικά κανάλια (πρόσθιο ( + ), ύστερο ( - ) ) µετρή- ϑηκαν πάνω από τα ηλεκτρόδια C3, Cz, C4 µετά από Ϲωνοπερατό ϕιλτράρισµα (0.5-30 Hz) και δειγµατοληψία στα 128 Hz. Το συγκεκριµένο σύνολο δεδοµένων παραχωρήθηκε από το ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 76

Dept. of Medical Informatics, Inst. for Biomedical Engineering, Univ. of Technology Graz [5]. Τα δεδοµένα αποθηκεύτηκαν σε µορφή αρχείου Matlab (.mat format), µε την πρώτη µεταβλητή του αρχείου να περιέχει τα 3 ΗΕΓ κανάλια (x_train) µε ένα σύνολο 140 trials εκπαίδευσης διάρκειας 9 δευτερολέπτων το καθένα. Η δεύτερη µεταβλητή (y_train) συνίσταται από τις τιµές 1, 2 για να δηλώσουν την κατεύθυνση της κίνησης του χεριού για κάθε trial εκπαίδευσης, µε την τιµή 1 να αντιστοιχεί σε αριστερή κίνηση και την τιµή 2 σε δεξιά. Η τρίτη µεταβλητή (x_test) περιέχει ακόµη ένα σύνολο 140 trials (δοκιµής), χωρίς όµως σε αυτή την περίπτωση να δίνεται εκ των προτέρων η πληροφορία για τη σωστή κλάση ταξινόµησης. Ο στόχος είναι η ανάπτυξη ενός αλγόριθµου, µε ϐάση τα δεδοµένα της εκπαίδευσης, για να αναγνωρίζεται η πρόθεση του χρήστη σε σχέση µε την κίνηση του χεριού του όσο το δυνατόν πιο γρήγορα και αξιόπιστα στα δεδοµένα δοκιµής. Ο ϐέλτιστος αλγόριθµος πρέπει να είναι σε ϑέση να διακρίνει σχεδόν σε πραγµατικό χρόνο αυτές που αντιστοιχούν σε αριστερές κινήσεις του χεριού, σε σχέση µε τις δεξιές, και συνεπώς να τις ταξινοµεί στη σωστή κατηγορία ανά trial. Η προσέγγιση του προβλήµατος ϑα γίνει µε την εφαρµογή ενός αλγόριθµου, εστιάζοντας στις διαφορετικές διαµορφώσεις των εγκεφαλικών ϱυθµών που εξετάζονται. Εχοντας ϑεωρήσει ότι το µεσαίο κανάλι Cz περιέχει πληροφορία µε µικρή διακριτική ικανότητα, αποκλείεται από την ανάλυση και έτσι παραµένουν στη διαδικασία τα C3 και C4. Για να εξαχθεί η ϱυθµική πληροφορία, τα ΗΕΓ δεδοµένα αντιστοιχούνται στο πεδίο του χρόνου - συχνότητας µε τη ϐοήθεια των κυµατιδίων Morlet. Τα χαρακτηριστικά αυτά εκφέρονται µε διαφορετικό τρόπο στο χρόνο και παρουσιάζουν µεγάλη µεταβλητότητα από trial σε trial. Η ταξινόµηση των χαρακτηριστικών στις δύο κατηγορίες προσεγγίζεται µε δύο διαφορετικές µεθόδους. Στην πρώτη, για τις εξαγόµενες χρονοσειρές των χαρακτηριστικών εκτιµούνται δύο πιθανοθεωρητικά πρότυπα, ένα για κάθε µία από τις δύο κλάσεις, µε ϐάση τα γνωστά δεδοµένα εκπαίδευσης. Στη δεύτερη, η ταξινόµηση ϐασίζεται στις µηχανές διανυσµάτων υποστήριξης (SVM), µε το χώρο των χαρακτηριστικών να µετασχηµατίζεται µέσω µιας γραµµικής συνάρτησης πυρήνα. Και στις δύο περιπτώσεις, η ταξινόµηση ενός άγνωστου trial αποφασίζεται από έναν γραµµικό σταθµισµένο συνδυασµό αδύναµων στιγµιαίων πιθανοθεωρητικών ταξινοµητών - σε αυτή την περίπτωση ϑα χρησιµοποιηθούν οι εκ των υστέρων πιθανότητες των δύο κλάσεων σε κάθε χρονική στιγµή - µε κάθε σταθµισµένο όρο να έχει ϐάρος ανάλογο µε την ικανότητα διάκρισης της κάθε χρονικής στιγµής. Κατά αυτόν τον τρόπο, εισάγονται πιθανοθεωρητικά πρότυπα, για κάθε χρονική στιγµή που ανήκει στα trials, καθώς και προσδιορίζεται πως να συνδυαστεί η πληροφορία από όλες τις προγενέστερες χρονικές στιγµές, προκειµένου να υπάρξουν οι κατάλληλες ενδείξεις για την τελική απόφαση ταξινόµησης σε µία δεδοµένη χρονική στιγµή. 4.3 Προεπεξεργασία και εξαγωγή χαρακτηριστικών Σηµειώνουµε µε Ck 3 και C4 k τα ΗΕΓ σήµατα που καταγράφηκαν από τα ηλεκτρόδια C3 και C4 στο k οστό trial τη χρονική στιγµή t. Η τιµή της κλάσης που αντιστοιχεί σε κάθε trial εκπαίδευσης δίνεται από τη µεταβλητή y k {L, R}. Για την ανάλυση χρησιµοποιούνται αναπαραστάσεις τωνtrials στο πεδίο χρόνου-συχνότητας ϕιλτράροντας τα ΗΕΓ δεδοµένα µε µιγαδικά κυµατίδια Morlet [25], [20]. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 77

Σχήµα 4.1: Θέσεις των ηλεκτροδίων (αριστερά) και αναπαράσταση της διαδικασίας ενός trial (δεξιά). Οπως αναφέρθηκε και εκτενέστερα σε προηγούµενο κεφάλαιο, ο µετασχηµατισµός κυµατιδίου αποτελεί ένα ισχυρό εργαλείο για την ανάλυση και σύνθεση σηµάτων. Με τη χρήση των κυµατιδίων, διάφορα χαρακτηριστικά ενός σήµατος µπορούν να προσδιοριστούν αποτελεσµατικά στο πεδίο του χρόνου και, παράλληλα, στο πεδίο της συχνότητας, κάτι το οποίο δεν είναι εφικτό µε τη χρήση του προγενέστερου κλασικού FT. Ακόµη, σε αντίθεση µε τον STFT (Short Time FT), τα κυµατίδια είναι κατάλληλα για τη µελέτη µη στάσιµων και απρό- ϐλεπτων σηµάτων, που εµπεριέχουν τόσο συνιστώσες χαµηλών συχνοτήτων όσο και απότοµες υψίσυχνες µεταβάσεις. Για το λόγο αυτό µπορούν να ϕανούν αποτελεσµατικά στη µελέτη και ανάλυση ΗΕΓ σηµάτων που κατεξοχήν διακρίνονται από τα παραπάνω χαρακτηριστικά. 4.3.1 Μιγαδικά κυµατίδια Morlet Η χρήση κυµατιδίων πραγµατικών τιµών (real-valued wavelets) αντικαθίσταται σε πολλές εφαρµογές από αντίστοιχα µιγαδικών τιµών (complex-valued wavelets), ειδικά σε εφαρµογές που αφορούν την επεξεργασία γεωφυσικών σηµάτων. Η σύνταξη ενός από τα πρώτα άρθρα που αφορούν στην ανάλυση κυµατιδίων (Goupillaud et al., 1984) είχε ως κίνητρο την ανάλυση γεωφυσικών σηµάτων για την εξόρυξη πετρελαίου και ϕυσικού αερίου από τον Jean Morlet, ο οποίος είχε στόχο να αναλύσει σήµατα που εµπεριείχαν αιχµές ή εξάρσεις µικρής διάρκειας και υψηλής συχνότητας σε ένα µικρό αριθµό κύκλων, καθώς και χαµηλές συνιστώσες µεγάλης διάρκειας. Στα παραδείγµατα αυτά χρησιµοποιήθηκε το µιγαδικό κυµατίδιο : όπου C και ω 0 είναι σταθερές. Είναι γνωστό ότι : ψ(u) = Ce jω 0u (e u2 2 2e ω2 0 4 e u 2 ) (4.1) + e jω 0u e u2 2 du = 2πe ω2 0 2 (4.2) + (Bracewall and Walden, 1993), από όπου προκύπτει ότι ψ(u)du = 0 και συνεπώς ισχύει η συνθήκη αποδεκτικότητας (ϐλέπε Ενότητα 3.1). Για τον Morlet, η συνθήκη αυτή αποτε- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 78

λούσε όχι µόνο ένα µαθηµατικό αποτέλεσµα, αλλά και µία ϕυσική αναγκαιότητα, καθώς η χρονοσειρά της σεισµικής αντανάκλασης υπό ανάλυση κατά την ολοκλήρωση της έδινε µηδενικό αποτέλεσµα αφού οι συµπιέσεις και οι αραιώσεις ακύρωναν η µία την άλλη. Η σταθερά C επιλέγεται, έτσι ώστε η µιγαδική εξίσωση ψ(u) 2 du = 1 να ισχύει για µία συγκεκριµένη επιλογή της χαρακτηριστικής ιδιοσυχνότητας ω 0. Για παράδειγµα, όταν η ω 0 = 5, τότε η C = 0.7528. Με περαιτέρω αύξηση της ω 0, ο αρνητικός όρος της Εξίσωσης (4.1) γίνεται αµελητέος, ενώ όταν ω 0 = 10 µε C = π 1 4, τότε έχουµε ψ(u) 2 du = 1 µε ακρίβεια 9 δεκαδικών ψηφίων. Συνεπώς για µεγάλες τιµές της ω 0, ϑα έχουµε : ψ(u) ψ (M) ω 0 (u) = π 1 4 e jω 0 u e u 2 2 (4.3) το οποίο αποκαλείται και ως κυµατίδιο Morlet. Χαρακτηριστικά παραδείγµατα του ψ (M) ω 0 ( ) παρουσιάζονται στα διαγράµµατα του Σχήµατος 4.2 για ω 0 = 3, 5, 7. Πρόκειται ουσιαστικά Σχήµα 4.2: Τρία κυµατίδια Morlet ψ ω (M) 0 ( ). Ως µιγαδικά κυµατίδια, τα πραγµατικά µέρη τους σκιαγραφούνται µε τις πιο έντονες γραµµές, ενώ τα ϕανταστικά µε τις πιο λεπτές. για µία µιγαδική εκθετική συνάρτηση συχνότητας f 0 = ω 0 /(2π), της οποίας το σχήµα και το πλάτος διαµορφώνεται από µία συνάρτηση ανάλογη της τυπικής γκαουσιανής συνάρτησης πυκνότητας πιθανότητας (π.π.). Η παράµετρος ω 0 ελέγχει τη συχνότητα της µιγαδικής εκθετικής συνάρτησης και καθώς αυξάνεται από την τιµή 3 στην τιµή 7 (ϐλέπε Σχήµα 4.2), οι ταλαντώσεις στο εσωτερικό του εύρους της κανονικής συνάρτησης π.π. αυξάνονται. Το κυµατίδιο Morlet επιτυγχάνει µία ανάλυση, η οποία δεν µπορεί να ερµηνευθεί εύκολα µε άµεση ϐάση τις αλλαγές στους µέσους όρους της συνάρτησης στις διάφορες κλίµακες, όπως µπορούν να πετύχουν άλλα κυµατίδια πραγµατικών τιµών (κυµατίδιο Haar, Mexican Hat). Παρόλα αυτά, η οµοιότητα µεταξύ του κυµατιδίου Morlet και των προαναφερθέντων είναι πιο ισχυρή στο πεδίο της συχνότητας οπού όλα δρουν σαν Ϲωνοπερατά ϕίλτρα, µια ιδιότητα την οποία ϑα εκµεταλλευτούµε στη συνέχεια. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 79

4.3.2 Εφαρµογή των κυµατιδίων Morlet στα δεδοµένα Τυπικά, µια οµάδα κυµατιδίων καθορίζεται από ένα µητρικό κυµατίδιο. Οπως είδαµε παραπάνω, στην περίπτωση των κυµατιδίων Morlet, αυτά καθορίζονται από µια µιγαδική εκθετική συνάρτηση µε χαρακτηριστική ιδιοσυχνότητα ω 0, όπως δίνεται από την παρακάτω σχέση : ψ(t) = Ce jω 0t e t2 2, (4.4) µε έναν σταθερό παράγοντα κανονικοποίησης C, ίσο στο παράδειγµά µας µε π 1 4. Οι µετατοπισµένες ως προς το χρόνο και την κλίµακα εκδοχές της πρωτότυπης συνάρτησης δίνονται από την παρακάτω εξίσωση, όπου a είναι η παράµετρος διαστολής της κλίµακας και b η παράµετρος µετατόπισης ως προς το χρόνο : ψ a,b (t) = 1 a ψ ( ) t b Οπως σηµειώθηκε, τα κυµατίδια Morlet αποτελούν γκαουσιανά Ϲωνοπερατά ϕίλτρα στο πεδίο της συχνότητας. Η ιδιότητά τους αυτή ϐολεύει για την εφαρµογή τους στα ΗΕΓ δεδοµένα και την αποµόνωση της ϱυθµικής δραστηριότητας στις Ϲώνες συχνοτήτων ενδιαφέροντος του µ και του κεντρικού β ϱυθµού. Η κατάλληλη παράµετρος α της κλίµακας που επιλέγεται για το κυµατίδιο, εξαρτάται από την κεντρική συχνότητα f του κυµατιδίου και µπορεί να υπολογιστεί σε σχέση µε την ω 0 ως : a (4.5) a(f) = ω 0 + 2 + ω 2 0 4πf (4.6) Τα διαστήµατα ισχύος για το κυµατίδιο στο πεδίο του χρόνου και στο πεδίο της συχνότητας συχνά µπορούν να εκφραστούν ως περίοδοι εξασθένησης από έναν παράγοντα e (e-folding) και σηµειώνονται ως t e και f e, συναρτήσει της κλίµακας s: t e = 2a, f e = 2(2πa) 1. (4.7) Αξίζει να σηµειωθεί ότι η αύξηση της ιδιοσυχνότητας ω 0 του µητρικού κυµατιδίου ϐελτιώνει την ανάλυση όσον αφορά στη συχνότητα, µε παράλληλο κόστος όµως ως προς την ανάλυση στο χρόνο. Ο µετασχηµατισµός κυµατιδίου (WT) ενός πραγµατικού σήµατος Ck i (t) τη χρονική στιγµή t 0 και στη συχνότητα f 0 είναι η συνέλιξη του µε το µετατοπισµένο ως προς το χρόνο και διευρυµένο/συρρικνωµένο ως προς την κλίµακα κυµατίδιο. Από το µιγαδικό σήµα που προκύπτει, υπολογίζουµε το στιγµιαίο πλάτος του : α(t 0, f 0 ) = C i k(t) ψ s(f0 ),t 0 (t) (4.8) Για να εξαχθεί η ϱυθµική δραστηριότητα στις δύο Ϲώνες συχνοτήτων, προσαρµόζουµε τις παραµέτρους (f a, ω0) a και (f β, ω β 0 ) στα ΗΕΓ ϕάσµατα. Οι παράµετροι των κυµατιδίων για τη χαµηλότερη µ-ϲώνη και την υψηλότερη β-ϲώνη συχνοτήτων είναι αντίστοιχα (f a, ω0) a = (10Hz, 10) και (f β, ω β 0 ) = (22Hz, 6). Οι συχνότητες αυτές ϕαίνονται στο Σχήµα 4.4, ενώ οι ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 80

Σχήµα 4.3: Το κυµατίδιο τύπου Morlet που χρησιµοποιείται για την εξαγωγή της δραστηριότητας του µ ϱυθµού από τα δεδοµένα, χαρακτηριστικής ιδιοσυχνότητας ω 0 = 10 και κλίµακας a = 0.16. χρόνοι t e που έχουν χρησιµοποιηθεί για τα κυµατίδια στο παράδειγµα αυτό αντιστοιχούν σε t α e = 226 msec και t β e = 62 msec. Από την Εξίσωση (4.4) προκύπτει ότι τα κυµατίδια Morlet είναι µη οριοθετηµένα, συµµετρικά ως προ το χρόνο ϕίλτρα, κεντραρισµένα στη χρονική στιγµή υπό εξέταση, µε συνέπεια να περιλαµβάνουν ένα αιτιατό µισό (που κοιτάει στο πα- ϱελθόν στον άξονα του χρόνου) και ένα µη αιτιατό µισό (που κοιτάει στο µέλλον). εδοµένου ότι η επεξεργασία των δεδοµένων σε πραγµατικό χρόνο επιτρέπει µόνο αιτιατό ϕιλτράρισµα, πρώτα περιορίζεται η επέκταση των κυµατιδίων στο πεδίο του χρόνου, µε χρονική διάρκεια περιορισµού ίση µε 4 ϕορές το χρόνο e-folding, t e. Επιπροσθέτως, τα κυµατίδια µετατοπί- Ϲονται πίσω στον άξονα του χρόνου κατά το µέγιστο των µη αιτιατοτήτων, δηλαδή κατά 4*t e /2 = 2*t e (452 και 104 msec αντίστοιχα). Οι χρονοσειρές της ϱυθµικής δραστηριότητας στα δύο ηλεκτρόδια, πάνω από τους ϕλοιούς που σχετίζονται µε την κίνηση των χεριών, υπολογίζονται τότε από τη συνέλιξη κάθε trial των δεδοµένων µε τα αιτιατά κυµατίδια. Τα πλάτη των συνελίξεων που προκύπτουν για τις δύο Ϲώνες συχνοτήτων στα δύο ηλεκτρόδια συγχωνεύονται σε ένα διάνυσµα χαρακτηριστικών : a k (t) = (α 3 k(t, f a ), α 4 k(t, f a ), α 3 k(t, f β ), α 4 k(t, f β )) (4.9) Τα διανύσµατα χαρακτηριστικών που προκύπτουν από τα trials εκπαίδευσης, των οποίων το περιεχόµενό είναι γνωστό ως προς την κατεύθυνση της κίνησης, χρησιµοποιούνται στη συνέχεια για την εκτίµηση των µοντέλων ταξινόµησης. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 81

Σχήµα 4.4: Οι µέσοι όροι των ϕασµάτων συχνότητας των ΗΕΓ από το κανάλι 3 (αριστερά) και 4 (δεξιά) για τις αριστερές (µπλε) και τις δεξιές κινήσεις (µωβ) του χεριού από τα δεδοµένα εκπαίδευσης. Οι διακεκοµµένες γραµµές σηµειώνουν τις κεντρικές συχνότητες των δύο διαφορετικών Morlet κυµατιδίων που έχουν χρησιµοποιηθεί. 4.4 Πρότυπα ταξινόµησης Από τις νευροφυσιολογικές διαπιστώσεις που επισηµάνθηκαν στη αρχή του κεφαλαίου, µπο- ϱούµε να ϑεωρήσουµε την ύπαρξη δύο διακριτών πρωτότυπων συµπεριφορών ως προς τη διαµόρφωση των απόλυτων τιµών των δύο εγκεφαλικών ϱυθµών (συνεχόµενου µ και κεντρικού β), προκαλούµενη από πλασµατικές δεξιές ή αριστερές κινήσεις του χεριού. Με ϐάση αυτές τις ϑεωρήσεις, προσεγγίζονται δύο τύποι χαρακτηριστικών, ένας για κάθε κλάση των πλασµατικών κινήσεων των χεριών. 4.4.1 Πιθανοθεωρητικά πρότυπα ταξινόµησης Bayes Για κάθε κλάση και σε κάθε χρονική στιγµή στο διάστηµα t [0 9]sec υποθέτουµε µία πολυδιάστατη κανονική κατανοµή για τα διανύσµατα χαρακτηριστικών a(t), δηλαδή : p(a(t) y) = N(µ y (t), Σ y (t)), (4.10) όπου (µ y, Σ y ) είναι η µέση τιµή και η µήτρα συνδιασποράς για κάθε µία από τις κατανοµές των δύο κλάσεων y {L, R}. Συνεπώς, ας σηµειωθούν µε p(a(t) y), y {L, R} οι συναρτήσεις π.π των δύο πολυδιάστατων κανονικών κατανοµών για τις δύο κλάσεις L (αριστερή κίνηση) και R (δεξιά κίνηση). εδοµένων των προτύπων για τις δύο κλάσεις και µε την υπόθεση ότι η εκ των υστέρων πιθανότητα για κάθε µία από αυτές είναι ίση µε P (y) = 1, y {L, R} 2 όταν είναι γνωστή µια µέτρηση του διανύσµατος χαρακτηριστικών a(t), η εκ των υστέρων ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 82

πιθανότητα για κάθε κλάση σύµφωνα µε τη ϑεωρία του Bayes είναι : P (y a(t)) = p(a(t) y)p (y) p(a(t) L)P (L) + p(a(t) R)P (R) = p(a(t) y) p(a(t) L) + p(a(t) R) (4.11) Στο παράδειγµα που εξετάζουµε, οπότε, γίνεται η εκτίµηση των π.π. των δύο κλάσεων p(a(t) y), y {L, R} µε ϐάση τα δεδοµένα εκπαίδευσης. Εφαρµόζοντας τον παραπάνω κανόνα από τη ϑεωρία του Bayes, αποφασίζεται ταξινόµηση στην κλάση y = L αν P (y = L a(t)) > P (y = R a(t)) και, αντίστροφα, στην κλάση y = R αν P (y = L a(t)) < P (y = R a(t)) (στα δεδοµένα του παραδείγµατος L 1, R 2). Το σφάλµα ταξινόµησης του Bayes προσεγγιστικά δίνεται από την εξίσωση : P (error a(t)) = min[p (y = L a(t)), P (y = R a(t))] (4.12) Ενα µικρό σφάλµα είναι ενδεικτικό του καλού διαχωρισµού µεταξύ των δύο κατανοµών των κλάσεων, ενώ στην αντίθετη περίπτωση, ένα µεγάλο σφάλµα δηλώνει ότι τα δεδοµένα εµπεριέχουν σηµαντικά λιγότερη πληροφορία που σχετίζεται µε το µεταξύ τους διαχωρισµό. Συνεπώς, η ικανότητα διάκρισης των δύο κατανοµών µπορεί να εκτιµηθεί χρησιµοποιώντας το σφάλµα ταξινόµησης του Bayes σε κάθε χρονική στιγµή t: g t = 0.5 P (error a(t)). (4.13) 4.4.1.1 Συνδυάζοντας πληροφορία στο χρόνο Προκειµένου να εξαχθεί τελικά η ϐέλτιστη ταξινόµηση σε πραγµατικό χρόνο για µία συγκεκριµένη χρονική στιγµή t i, κρίνεται απαραίτητο να ενσωµατωθεί σχετική γνώση από όλες τις προηγούµενες χρονικές στιγµές t 0 t t i, οδηγώντας σε µία συγκέντρωση ενδείξεων στο χρόνο σε σχέση µε τη δυαδική διαδικασία απόφασης ταξινόµησης d t. Ο συνδυασµός στο χρόνο υλοποιείται παίρνοντας τις αναµενόµενες τιµές των εκ των υστέρων πιθανοτήτων για κάθε κλάση, λαµβάνοντας υπόψη όµως και τη ικανότητα διάκρισης µεταξύ των κατανοµών των κλάσεων σε κάθε χρονική στιγµή. Σηµειώνεται ότι, η απόφαση ταξινόµησης σε µία χρονική στιγµή t i δίνεται από έναν σταθ- µισµένο γραµµικό συνδυασµό των προγενέστερων χρονικά διαδικασιών απόφασης d t και εκφράζεται ως : D ti = t i t=t 0 g t d t. (4.14) Τα ϐάρη g t αντιπροσωπεύουν την ικανότητα διάκρισης, η οποία, όπως εξηγήθηκε στην προηγούµενη υπο-ενότητα, εκφράζεται µέσω του σφάλµατος ταξινόµησης (Εξίσωση 4.13). Ετσι, για την τελική ταξινόµηση µιας άγνωστης ως προς την κλάση trialς σε µία δεδοµένη χρονική στιγµή t i, ενσωµατώνουµε τη γνώση από όλα τα προγενέστερα χρονικά δείγµατα t t i και πάντα µε ϐάση τα εξαγόµενα αιτιατά χαρακτηριστικά από τη συνέλιξη των ΗΕΓ σηµάτων µε τα κατάλληλα κυµατίδια. Συνεπώς, αρχικά εφαρµόζουµε την Εξίσωση (4.11), δεδοµένων των παρατηρήσεων των διανυσµάτων χαρακτηριστικών a(t), για να ληφθούν οι εκ των υστέρων πιθανότητες για κάθε κλάση έως την t t i. Στη συνέχεια τις συνδυάζουµε µε γραµµικό ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 83

τρόπο στο χρόνο, λαµβάνοντας υπόψη και τα αντίστοιχα ϐάρη : d(y, t i ) = p(y a(t 0 ),..., a(t i )) = t t i g t p(y a(t)) t t i g t (4.15) Πιο συγκεκριµένα, η Εξίσωση (4.15) δίνει την αναµενόµενη τιµή ότι το διάνυσµα χαρακτη- ϱιστικών ενός δεδοµένου trial, παρατηρούµενου µέχρι τη χρονική στιγµή t i, ανήκει σε µία από τις δύο κλάσεις (L και R) µε την πληροφορία έως την t i. Η τελική απόφαση ταξινόµησης για τη δεδοµένη χρονική στιγµή δίνεται από τον τύπο : D(t i ) = 0.5 d(l, t i ), (4.16) όπου ένα ϑετικό ή αρνητικό πρόσηµο αντιστοιχεί σε µία δεξιά ή αριστερή κίνηση αντίστοιχα, ενώ το πλάτος είναι ενδεικτικό της εµπιστοσύνης για την απόφαση, υπολογισµένη σε µία κλίµακα από το 0 έως το 1. 4.4.2 Ταξινόµηση µε SVM Οι SVM αποτελούν µια χρήσιµη τεχνική για την ταξινόµηση δεδοµένων. Οπως είναι γνωστό, η διαδικασία της ταξινόµησης συνίσταται από δύο ϕάσεις, την εκπαίδευση (training) και τον έλεγχο ή τη δοκιµή (testing) του συνόλου των δεδοµένων. Κάθε trial στο σύνολο της εκπαίδευσης (training set) εµπεριέχει κάποιον αριθµό χαρακτηριστικών και µία τιµή στόχο, η οποία δηλώνει την κλάση στην οποία ανήκει. Σκοπός της τεχνικής των SVM είναι να δηµιουργήσει ένα πρότυπο, το οποίο να προβλέπει τις τιµές των κλάσεων για τις trials του συνόλου δεδοµένων, οι οποίες εµπεριέχουν τιµές µόνο για τα χαρακτηριστικά τους. Τα διανύσµατα υποστήριξης είναι τα παραδείγµατα (πρότυπα) του συνόλου που ϐρίσκονται πιο κοντά στο όριο απόφασης και καθορίζουν µε αυτό τον τρόπο το περιθώριο µεταξύ των δύο κλάσεων που συµµετέχουν στην ταξινόµηση. εδοµένου ενός συνόλου εκπαίδευσης µε Ϲεύγη τιµών χαρακτηριστικών - κλάσεων (x i, y i ), i = 1,..., l, όπου x i R n και y i { 1, 1} l, ένας ταξινοµητής µέγιστου περιθωρίου αντιστοιχεί ουσιαστικά στη διακρίνουσα συνάρτηση f(x i ) = w T x i + b που µεγιστοποιεί το περιθώριο 1/ w (και ισοδύναµα ελαχιστοποιεί το w 2 = w T w ) απαιτεί τη λύση του παρακάτω προβλήµατος ϐελτιστοποίησης : λαµβάνοντας υπόψη τους περιορισµούς : 1 min w,b,ξ i 2 wt w + C l ξ i (4.17) i=1 y i (w T (x i ) + b) 1 ξ i, ξ i 0 (4.18) Ο όρος C l i=1 ξ i εισάγεται στη συνάρτηση προς ελαχιστοποίηση, για να δηλώσει το κόστος των λανθασµένων ταξινοµήσεων. Επιτρέποντας σε έναν ταξινοµητή να κατατάξει λάθος έναν αριθµό παραδειγµάτων, µπορεί να συντελέσει σε αύξηση του περιθωρίου. Οι ϐοηθητικές µεταβλητές ξ i επιτρέπουν σε ένα παράδειγµα να είναι στο περιθώριο (0 ξ i 1, σφάλµα ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 84

περιθωρίου) ή να ταξινοµούνται λανθασµένα (ξ i > 1). Η παράµετρος C καθορίζει το σχετικό ϐάρος µεγιστοποίησης του περιθωρίου και ελαχιστοποίησης της λανθασµένης ταξινόµησης. Το παραπάνω ϑεωρητικό πλαίσιο είναι η ϐάση του χαλαρού περιθωρίου της SVM (softmargin SVM). Σε πολλές περιπτώσεις, η χρήση ενός µη γραµµικού ταξινοµητή προσφέρει µεγαλύτερη α- κρίβεια ταξινόµησης σε µία δεδοµένη εφαρµογή. Ο πιο εύκολος τρόπος για να περάσουµε από ένα γραµµικό ταξινοµητή σε ένα µη γραµµικό είναι να αντιστοιχήσουµε τα διανύσµατα χαρακτηριστικών εκµάθησης x i σε έναν χώρο υψηλότερου αριθµού διαστάσεων Φ µέσω της µη γραµµικής συνάρτησης φ. Στο χώρο Φ η διακρίνουσα συνάρτηση παίρνει τη µορφή f(x i ) = w T φ(x i ) + b. Βέβαια, η προσέγγιση του υπολογισµού αποκλειστικά µη γραµµικών χαρακτηριστικών δεν συνάδει επιθυµητά µε τον αριθµό τους, µε τη διαστατικότητα του νέου χώρου των χαρακτηριστικών Φ να πολλαπλασιάζεται σε σχέση µε αυτή του αρχικού χώρου. Αυτό οδηγεί και σε ένα πολλαπλασιασµό της απαιτούµενης µνήµης για την αποθήκευση των χαρακτηριστικών αυτών, καθώς και του χρόνου υπολογισµού της συνάρτησης διαχωρισµού του ταξινοµητή. Οι µέθοδοι του πυρήνα (Kernel methods) επιλύουν το παραπάνω πρόβληµα αποφεύγοντας να αντιστοιχήσουν τα δεδοµένα αποκλειστικά σε χώρους χαρακτηριστικών µε υψηλό αριθµό διαστάσεων. Εκφράζοντας το δίανυσµα ϐάρους ως ένα γραµµικό συνδυασµό των πα- ϱαδειγµάτων εκµάθησης w = n i=1 a ix i, τότε f(x) = n i=1 a ix T i x + b. Η τεχνική των SVM όµως καλείται να ϐρει ένα διαχωριστικό υπερεπίπεδο µε το µέγιστο περιθώριο στον καινούργιο χώρο Φ, οπότε f(x) = n i=1 a iφ(x T i )φ(x) + b, µε την συνάρτηση k(x i, x j ) = φ(x i ) T φ(x j ) ονοµάζεται συνάρτηση πυρήνα (kernel function). Τελικά, η διαχωριστική συνάρτηση σε σχέση µε τη συνάρτηση πυρήνα παίρνει τη µορφή : f(x) = n i=1 a ik(x i, x) + b. Λεπτοµέρεις για τις µηχανές διανυσµάτων υποστήριξης και τις συναρτήσεις πυρήνα αναφέρθηκαν στην Ενότητα 4.4.2. Η διαδικασία που ακολουθείται για τον προσδιορισµό του ϐέλτιστου διαχωριστικού υπερεπιπέδου και τον πιθανό µετασχηµατισµό των χαρακτηριστικών x i σε έναν χώρο διάφορο του αρχικού αποτελείται από τα παρακάτω ϐήµατα ([1], [8]). Κανονικοποίηση των δεδοµένων : Η κανονικοποίηση των δεδοµένων πριν την εφαρµογή της SVM είναι πολύ σηµαντική. Το κύριο πλεονέκτηµα είναι ότι αποτρέπει τα χαρακτηριστικά των οποίων οι τιµές κυµαίνονται σε µεγαλύτερο εύρος να υπερκαλύψουν αυτά που οι τιµές τους ϐρίσκονται σε αισθητά χαµηλότερο. Επίσης, η συνεισφορά της κανονικοποίησης είναι σηµαντική και στην αποτροπή της αριθµητικής πολυπλοκότητας κατά τη διάρκεια της υπολογιστικής διαδικασίας. Καθώς οι τιµές των συναρτήσεων πυρήνα ϐασίζονται στα εσωτερικά γινόµενα των διανυσµάτων χαρακτηριστικών (όπως η γραµµική και η πολυωνυµική συνάρτηση πυρήνα), οι µεγάλες τιµές για τα χαρακτηριστικά µπορεί να δηµιουργήσουν υπολογιστικά προβλήµατα. Στην περίπτωση του παραδείγµατός µας, η κανονικοποίηση γίνεται στο εύρος των τιµών [ 1, 1]. Προφανώς, η κανονικοποίηση πρέπει να εφαρµόζεται τόσο στα δεδοµένα εκµάθησης όσο και στα trialς, πάντα στο ίδιο εύρος τιµών. Επιλογή της κατάλληλης συνάρτησης πυρήνα : Στο δεύτερο ϐήµα επιλέγεται η κατάλληλη συνάρτηση πυρήνα για τον µετασχηµατισµό των χαρακτηριστικών των trials. Πρακτικά, επειδή κάθε εφαρµογή στο πεδίο της µηχανικής µάθησης είναι άµεσα ε- ξαρτηµένη από τον τύπο των δεδοµένων της, κρίνεται ορθότερο να χρησιµοποιηθούν ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 85

και να αξιολογηθούν µε ϐάση την απόδοσή τους διαφορετικές συναρτήσεις πυρήνα. Σε ϑεωρητικό επίπεδο, η επιλογή της κανονικής συνάρτησης ακτινωτής ϐάσης λειτουργίας (RBF: Radial Basis Function) ϕαίνεται ως µία αρκετά λογική επιλογή : k(x i, x j ) = exp( γ x i x j 2 ), γ > 0 (4.19) Η συνάρτηση RBF αντιστοιχεί µε µη γραµµικό τρόπο τα δείγµατα σε ένα χώρο µε υ- ψηλότερο αριθµό διαστάσεων, οπότε και µπορεί να αντιµετωπίσει, σε αντίθεση µε τη γραµµική συνάρτηση πυρήνα, την περίπτωση όπου η σχέση µεταξύ των τιµών των κατηγοριών και των αντίστοιχων χαρακτηριστικών είναι µη γραµµική. Ακόµη, η γραµµική συνάρτηση πυρήνα : k(x i, x j ) = x T i x j + C (4.20) αποτελεί µία ειδική περίπτωση της RBF, καθώς όπως έχει αποδειχθεί (Keerthi and Lin, 2003) η γραµµική συνάρτηση µε υπερ-παράµετρο κόστους C παρουσιάζει την ίδια απόδοση µε την RBF συνάρτηση για κάποιες υπερ-παραµέτρους (C, γ). Βέβαια, µία SVM µε γραµµική συνάρτηση πυρήνα είναι πιο εύκολο να ϱυθµιστεί καθώς η µόνη υπερ-παράµετρος που επηρεάζει την απόδοση είναι η C, στην περίπτωση ϐέβαια που αναφερόµαστε σε SVM χαλαρού περιθωρίου. Επιπλέον και η σιγµοειδής συνάρτηση πυρήνα : k(x i, x j ) = tanh(γx T i x j + r), (4.21) συµπεριφέρεται σαν την RBF για κάποιες δεδοµένες παράµετρους, ενώ η εφαρµογή της δεν ισχύει υπό κάποιες άλλες. Ενας δεύτερος λόγος είναι ο αριθµός των υπερ-παραµέτρων, ο οποίος επηρεάζει την πολυπλοκότητα του µοντέλου επιλογής. Η αντίστοιχη πολυωνυµική συνάρτηση πυρήνα : k(x i, x j ) = (γx T i x j + r) d, γ > 0 (4.22) έχει περισσότερες υπερ-παραµέτρους από µία αντίστοιχη RBF. Τέλος, η RBF συνάρτηση έχει λιγότερες αριθµητικές δυσκολίες. Ενα ϐασικό σηµείο είναι ότι οι τιµές της συνάρτησης RBF είναι περιορισµένες στο διάστηµα 0 < k ij 1, σε αντίθεση µε τις τιµές της πολυωνυµικής συνάρτησης που µπορεί και να απειρίζονται (γx T i x j + r > 1) ή να µηδενίζονται (γx T i x j + r < 1). Βέβαια, υπάρχουν κάποιες περιπτώσεις όπου η χρήση της RBF δεν συνίσταται. Πιο συγκεκριµένα, όταν ο αριθµός των χαρακτηριστικών για κάθε trial είναι πολύ µεγάλος, η µη γραµµική αντιστοίχησή τους σε ένα χώρο ακόµη µεγαλύτερων διαστάσεων δεν ϑα αποτελούσε µία ϐοηθητική επιλογή. Σε αυτή την περίπτωση, η χρήση της γραµµικής αντιστοίχησης µε τη ϐέλτιστη επιλογή της υπερ-παραµέτρου κόστους C ϑα ήταν πιο κατάλληλη. Στο δικό µας παράδειγµα ο αριθµός των χαρακτηριστικών είναι µικρός (4) και η επιλογή της µη γραµµικής αντιστοίχησης ϑεωρητικά συνίσταται για την καλύτερη απόδοση του SVM. Ωστόσο, στην ενότητα των αποτελεσµάτων, η αναζήτηση της καλύτερης απόδοσης ταξινόµησης των trials εκµάθησης ξεκινά αρχικά µε τη χρήση της γραµµικής συνάρτησης πυρήνα, µε αυστηρό και µε χαλαρό περιθώριο, και συνεχίζεται µε την αντικατάσταση της από µία µη γραµµική συνάρτηση πυρήνα, όπως η RBF. Επιλογή υπερ-παραµέτρων µε διεπικύρωση (cross-validation): Για ένα δεδοµένο πρό- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 86

ϐληµα, δεν είναι γνωστό από πριν ποιες είναι οι καλύτερες τιµές των υπερ-παραµέτρων για τις συναρτήσεις πυρήνα που χρησιµοποιούνται, οπότε για τη δηµιουργία του προτύπου απαιτείται µια διαδικασία αναζήτησής τους. Ο στόχος είναι να προσδιοριστούν κατάλληλες τιµές, έτσι ώστε ο ταξινοµητής να µπορεί να προβλέπει µε ακρίβεια τις σωστές κλάσεις των δεδοµένων δοκιµής. Αξίζει να σηµειωθεί, ότι µπορεί να µην είναι χρήσιµο να πετυχαίνουµε υψηλή ακρίβεια κατά την εκπαίδευση, καθώς ταξινοµητές όπως οι SVM συνήθως προβλέπουν σωστά τις κλάσεις των trials εκµάθησης, οι οποίες είναι εκ των προτέρων γνωστές. Για το λόγο αυτό, ένας συνήθης τρόπος είναι ο διαχωρισµός των trials εκµάθησης σε δύο τµήµατα από τα οποία το ένα ϑα ϑεωρείται άγνωστο στον ταξινοµητή, δηλαδή τα δεδοµένα του δεν ϑα εµφανίζονται κατά την εκπαίδευσή του. Τότε, η ακρίβεια πρόβλεψης σε αυτό το σύνολο των δεδοµένων ϑα αντικατοπτρίζει σε µεγαλύτερο ϐαθµό την απόδοση στην ταξινόµηση των trials. Μια ϐελτιωµένη έκδοση αυτής της διαδικασίας είναι η λεγόµενη διεπικύρωση (cross-validation). Στη διεπικύρωση µε v τµήµατα δεδοµένων, πρώτα διαχωρίζουµε το σύνολο των trials ε- κµάθησης σε v υπο-τµήµατα ίδιου µεγέθους. Με ακολουθιακό τρόπο, κάθε ένα από τα υπο-τµήµατα ϑεωρείται ως το σύνολο δεδοµένων, του οποίου τα trials ταξινοµούνται µε χρήση της SVM της οποίας η εκπαίδευση έχει γίνει µε τα υπόλοιπα v 1 υπο-τµήµατα (µέθοδος Leave-One-Out). Συνεπώς, η κλάση κάθε trial όλου του συνόλου εκµάθησης προβλέπεται µία ϕορά, έτσι ώστε η ακρίβεια της µεθόδου διεπικύρωσης να αποτελεί το ποσοστό των trials που η ταξινόµησή τους έχει γίνει σωστά. Η µέθοδος της διεπικύρωσης µπορεί να αποτρέψει το πρόβληµα της υπερπροσαρµογής, όπως αυτό αναφέρθηκε στη Ενότητα 4.4.2. Ετσι, για την επιλογή των υπερ-παραµέτρων, δοκιµάζονται διά- ϕορες τιµές τους και αυτές που παρουσιάζουν την υψηλότερη ακρίβεια διεπικύρωσης επιλέγονται. Πλέον, µε το Ϲεύγος παραµέτρων προσδιορισµένο, η διαδικασία εκπαίδευσης γίνεται ακόµη µία ϕορα µε το σύνολο των trials εκµάθησης για το τελικό µοντέλο του ταξινοµητή. Το πρότυπο της SVM που δηµιουργήθηκε από την παραπάνω διαδικασία εφαρµόζεται τέλος στα trials δοκιµής. Ο αλγόριθµος που εφαρµόζεται επιστρέφει ως έξοδο ένα διάνυσµα που περιέχει για κάθε trial την κλάση που προβλέπει η SVM ότι ανήκει. Η SVM αποφασίζει σε ποια κατηγορία ϑα κατατάξει το κάθε trial, σύµφωνα µε το πρόσηµο sign(f(x)) της τιµής που ϑα υπολογίσει για την συνάρτηση απόφασης : f(x) = i y i λ i k(x i, x). (4.23) Ακόµη, ο αλγόριθµος επιστρέφει για κάθε trial την εκ των υστέρων πιθανότητα ότι ανήκει σε κάθε µία από τις δύο κλάσεις (P (y a(t)), y {L, R}). Η SVM, όπως αναφέρθηκε, επιστρέ- ϕει µία µη ϐαθµονοµηµένη τιµή (υπολογισµένη σύµφωνα µε τη συνάρτηση f(x)), η οποία δεν αποτελεί πιθανότητα. Αντί της προσέγγισης των δεσµευµένων συναρτήσεων πυκνότητας πιθανότητας p(a(t) y), χρησιµοποιείται ένα παραµετρικό µοντέλο που να προσεγγίζει άµεσα τις εκ των υστέρων πιθανότητες P (y a(t)). Ο Platt (2000) πρότεινε την προσέγγιση τους µέσω µίας σιγµοειδούς συνάρτησης : P (y a(t)) P A,B (f) 1 1 + exp(af + B), (4.24) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 87

όπου f = f(x). Οι παράµετροι του µοντέλου προσαρµόζονται και προσδιορίζονται από τη λύση του προβλήµατος µέγιστης πιθανοφάνειας, προκειµένου να αποδοθούν οι καλύτερες πιθανοτικές έξοδοι. Το σφάλµα ταξινόµησης προσεγγιστικά δίνεται από την Εξίσωση (4.12), όπως είδαµε στην προηγούµενη ενότητα, ενώ η ικανότητα διαχώρισµού σε κάθε χρονική στιγµή t µπορεί να εκτιµηθεί χρησιµοποιώντας το σφάλµα ταξινόµησης όπως στην Εξίσωση (4.13). Κατ αυτόν τον τρόπο, αντίστοιχα µε την περίπτωση του µοντέλου ταξινόµησης Bayes, µπορεί να δηµιουργηθεί ένα συνδυαστικό µοντέλο, το οποίο να ενσωµατώνει σχετική γνώση από όλες τις προηγούµενες χρονικές στιγµές t 0 t t i, οδηγώντας στη ϐέλτιστη ταξινόµηση για µία συγκεκριµένη χρονική στιγµή t i. Η τελική απόφαση ταξινόµησης για την t i δίνεται από έναν σταθµισµένο γραµµικό συνδυασµό των προγενέστερων χρονικά διαδικασιών απόφασης d t των χρονικών στιγµών t 0 t t i, ο οποίος περιγράφεται από τις Εξισώσεις (4.15) και (4.16). Και σε αυτή την περίπτωση, ένα ϑετικό ή αρνητικό πρόσηµο αντιστοιχεί σε ταξινόµηση µίας δεξιάς ή αριστερής κίνηση, ενώ το πλάτος είναι ενδεικτικό της εµπιστοσύνης για την απόφαση, υπολογισµένη σε µία κλίµακα από το 0 έως το 1. 4.5 Αποτελέσµατα - Συµπεράσµατα Ο τελικός σκοπός του πειράµατος είναι να υπάρξει ένας διαχωρισµός σε πραγµατικό χρόνο µεταξύ αριστερών και δεξιών κινήσεων για τα trials µε άγνωστη την πληροφορία ως προς την κατεύθυνση της κίνησης, µε ϐάση τη γνώση που αποκτήθηκε στο στάδιο της εκµάθησης, για τα οποία η αντίστοιχη πληροφορία είναι γνωστή. Ακριβέστερα, στόχος είναι να παρέχεται µία απόφαση για την κατεύθυνση της προτιθέµενης κίνηση του κάθε trial, η οποία ϑα πρέπει να ειναι αυστηρά αιτιατή αφού το πρόβληµα απευθύνεται σε εφαρµογή συνεχόµενου και πραγ- µατικού χρόνου, και η εµπιστοσύνη ως προς την απόφαση αυτή σε κάθε χρονική στιγµή στο διάστηµα από 3 έως 9 sec. Αξίζει να σηµειωθεί, ότι η εξαγωγή των χαρακτηριστικών εξαρτάται από µερικές υπερπαρα- µέτρους, όπως η κεντρική συχνότητα και το χρονικό πλάτος των κυµατιδίων. Ολες αυτές οι παράµετροι επιλέχθηκαν για το µοντέλο από µία διαδικασία ϐελτιστοποίησης (διεπικύρωση µέσω της µεθόδου Leave One Out (LOO Cross Validation) για την απόδοση ταξινόµησης στα δεδοµένα εκπαίδευσης. Αφού γίνει η εκτίµηση των παραµέτρων αυτών, το πρότυπο εφαρµό- Ϲεται στα διανύσµατα χαρακτηριστικών a(t) του συνόλου των δεδοµένων δοκιµής. Μετά την αποκάλυψη των σωστών κλάσεων Y (k) και για τα υπόλοιπες trials, η κάθε µεθόδος αποφάσεων ταξινόµησης D (k)(t) αξιολογήθηκε από τις χρονικές πορείες του σφάλµατος ταξινόµησης, της κοινής πληροφορίας και της µέγιστης κλίσης της, για την τελική έξοδο σε σχέση µε τις πραγµατικές προθέσεις του χρήστη. 4.5.1 Αξιολόγηση ενός συστήµατος BCI Ενας από τους απώτερους στόχους ενός BCI συστήµατος είναι να προσδιορίσει ένα εναλλακτικό κανάλι επικοινωνίας. Ενα BCI σύστηµα µπορεί να προτυποποιηθεί χρησιµοποιώντας ένα κανάλι λευκού προσθετικού γκαουσιανού ϑορύβου (AWGN). Μία δεδοµένη νοητική ενέργεια w i επιλέγεται ανάµεσα σε M πιθανές νοητικές ενέργειες, κάθε µία από τις οποίες κωδικοποιείται από τον εγκέφαλο του χρήστη, παράγοντας ένα διακριτό χαρακτηριστικό x i χωρίς ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 88

µνήµη του τι έχει παραχθεί προγενέστερα. Ας υποθέσουµε ότι η έξοδος Y του συστήµατος είναι µία στοχαστική διεργασία. Στη συνέχεια, η έξοδος µπορεί να αναλυθεί σε µία συνιστώσα των χαρακτηριστικών του σήµατος X, και σε µία συνιστώσα ϑορύβου Z. Η συνιστώσα σήµατος X οφείλεται στη σκόπιµη ενέργεια του χρήστη, καθώς εµπεριέχει την πρόθεσή του. Σε αυτή παρεµβάλλεται λευκός προσθετικός γκαουσιανός ϑόρυβος Z N(0, σz 2 ), ο οποίος είναι ανεξάρτητος της X και εκφράζει την ασυσχέτιστη εγκεφαλική δραστηριότητα που εξελίσσεται παράλληλα µε την διεργασία ενδιαφέροντος, τον ϑόρυβο λόγω ενίσχυσης των σηµάτων των ηλεκτροδίων κτλ. Η έξοδος Y = X + Z αποκωδικοποιείται ως ŵ i από τον ταξινοµητή του συστήµατος, ο οποίος είναι σε ϑέση να αναγνωρίζει M διαφορετικές κατηγορίες για να την κατατάξει στην κατάλληλη (ή M + 1 αν ο ταξινοµητής έχει δυνατότητα απόρριψης). Η µήτρα σύγχυσης (p(ŵ j w i )) (confusion matrix) υπολογίζεται κατά τη διάρκεια της διαδικασίας εκπαίδευσης και εκφράζει την πιθανότητα η νοητική ενέργεια w i να αναγνωρίζεται από τον ταξινοµητή στην αποκωδικοποιηµένη τιµή ŵ i. Η διαγώνιος της µήτρας σύγχυσης είναι ενδεικτική της ακρίβειας ταξινόµησης. Συνεπώς, η µήτρα σύγχυσης στην περίπτωση ενός τέλειου ταξινοµητή είναι µοναδιαία [3]. Αυτό το πρότυπο ενός BCI συστήµατος είναι ιδανικό και δεν αντιστοιχεί σε κάποια πραγµατική BCI εφαρµογή. Κατ αρχάς η πηγή παραγωγής των χαρακτηριστικών δεν είναι πάντα χωρίς µνήµη. Για παράδειγµα, στα πρωτόκολλα µέσων όρων των trials, ο χρήστης πραγµατοποιεί µία συγκεκριµένη νοητική ενέργεια για δεδοµένο αριθµό επαναλήψεων, οπότε, στην περίπτωση αυτή, η πιθανότητα η επόµενη ενέργεια να είναι ίδιου τύπου µε την προηγούµενη είναι υψηλή. Κατά δεύτερον, ο ϑόρυβος που παρεµβάλλεται στο σήµα εξαρτάται από την εφαρµογή, και συνήθως δεν παρουσιάζει κανονική κατανοµή. Τέλος, το γεγονός ότι οι τιµές που προκύπτουν, σύµφωνα µε τις οποίες γίνεται η ταξινόµηση σε κλάσεις, υπαγορεύονται τις περισσότερες ϕορές από τα χαρακτηριστικά που χρησιµοποιούνται, γεγονός που µπορεί να επιβάλει περισσότερους περιορισµούς για τα x i. Για το λόγο αυτό, η κλασική επικοινωνιακή ϑεωρία των Shannon και Weaver (1949) µπορεί να εφαρµοστεί άµεσα για την ποσοτικοποίηση της µεταφοράς πληροφορίας. Οι Farewell και Donchin (1988), έχοντας υλοποιήσει την πρώτη µορφή ενός BCI συστήµατος, υπολόγισαν το ϱυθµό µεταφοράς πληροφορίας για παραδείγµατα M κλάσεων ως : I = log 2 (M). (4.25) Για παράδειγµα, ένα σύστηµα δύο κλάσεων µπορεί να παρέχει έως 1 bit/trial ϱυθµό πλη- ϱοφορίας, ένα σύστηµα 4 κλάσεων 2 bits/trial ϱυθµό πληροφορίας. Αυτός ο ϱυθµός πλη- ϱοφορίας έχει ϑεωρηθεί για ένα σύστηµα χωρίς σφάλµατα ταξινόµησης, µε ισοπίθανες τις νοητικές καταστάσεις που συντελούν στο διαχωρισµό των κλάσεων (p(w i ) = 1/M), και παρέχει ένα ανώτατο όριο για ένα διακριτό σύστηµα M κλάσεων. Συνεπώς, η πρόταση αυτή δεν είναι χρήσιµη για τη σύγκριση µεταξύ διαφορετικών BCI συστηµάτων. Ενας διαφορετικός τύπος για τον προσδιορισµό του ϱυθµού µεταφοράς πληροφορίας για M i=1 n ii παραδείγµατα M κλάσεων και µε ακρίβεια ταξινόµησης p 0 = (όπου n N ii οι σωστές ταξινοµηµένες trials από τα N συνολικά για τις M κλάσεις του συστήµατος) προτάθηκε από τον Wolpaw [10]: B[bits] = log 2 (M) + p 0 log 2 (p 0 ) + (1 p 0 )log 2 (1 p 0 ) M 1. (4.26) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 89

Ο τύπος ισχύει υπό τις παρακάτω ϑεωρήσεις [11]: 1. η έξοδος του ταξινοµητή ϑα αντιστοιχεί σε µία από τις από τις M κλάσεις που έχουν οριστεί ως πιθανές από τις νοητκές προθέσεις του χρήστη, 2. η εκ των προτέρων πιθανότητα για κάθε κλάση είναι η ίδια p(w i ) = 1/M, 3. η ακρίβεια ταξινόµησης είναι ίδια για κάθε κλάση-στόχο (p(ŵ j w i ) = p 0, i = j) 4. το σφάλµα ταξινόµησης 1 p 0 είναι κατανεµηµένο οµοιόµορφα σε όλες τις υπόλοιπες κλάσεις (p(ŵ j w i ) = (1 p 0 )/(M 1), i j). Οι συνθήκες αυτές είναι αρκετά δύσκολο να εκπληρωθούν. Η πρώτη συνθήκη δεν ϑεωρεί την περίπτωση η έξοδος του ταξινοµητή να αποδώσει µία τιµή που να αντιστοιχεί σε κάποια µη αναγνωρισµένη νοητική κατάσταση, όπως συµβαίνει για ταξινοµητές µε απόρριψη. Επιπλέον, στο παράδειγµά µας, δεν µπορεί να εκπληρωθεί η τρίτη συνθήκη, καθώς η ακρίβεια ταξινόµησης για κάθε κλάση - στόχο υπολογίζεται διαφορετική [17]. 4.5.1.1 Κοινή πληροφορία µιας συνεχόµενης εξόδου Τα παραπάνω κριτήρια ϐασίζονται στις διακριτές εξόδους ενός BCI συστήµατος. Κριτήρια αξιολόγησης χρειάζονται όµως και για τις συνεχόµενες εξόδους, όπως αυτές που χρειάζονται για να µετακινήσουν έναν κέρσορα στην αριστερή ή στην δεξιά κατεύθυνση. Το πληροφοριακό περιεχόµενο µιας τέτοιας συνεχόµενης στο χρόνο εξόδου ϑα επηρεάσει την εκπαίδευση του ατόµου για την επίτευξη του στόχου της εκάστοτε διαδικασίας. Εποµένως, η ποσοτικοποίηση αυτού του πληροφοριακού περιεχοµένου παρουσιάζει µεγάλο ενδιαφέρον για το παράδειγµα που εξετάζουµε. Η κλασική ϑεωρία του Shannon µπορεί να εφαρµοστεί στα σή- µατα συνεχόµενου χρόνου. Οπως είδαµε, η έξοδος Y µπορεί να αναλυθεί σε µία συνιστώσα σήµατος X και σε µία συνιστώσα ϑορύβου Z. Η συνιστώσα σήµατος µπορεί να αποκτηθεί από τη συσχέτιση µεταξύ της εξόδου και των πραγµατικών τιµών των κλάσεων (κατευθύνσεων της κίνησης) για κάθε trial. Ο ϑόρυβος είναι η συνιστώσα της εξόδου, η οποία δεν περιέχει καµία πληροφορία που να σχετίζεται µε την κατεύθυνση της κίνησης και οπότε να είναι χρήσιµη στην ταξινόµηση των trials. Σηµειώνεται ότι το σήµα και ο ϑόρυβος είναι ασυσχέτιστες διεργασίες και συντελούν στη δηµιουργία ενός αθροιστικού µοντέλου ϑορύβου. Σύµφωνα µε τη ϑεωρία πληροφορίας, η εντροπία ϑεωρείται ως το µέτρο της αβεβαιότητας που υπάρχει σχετικά µία τυχαία διεργασία. Η εντροπία της εξόδου H(Y ) είναι το άθροισµα της εντροπίας του σήµατος H(X) και της εντροπίας του αθροιστικού ϑορύβου H(Z), δηλαδή η διαφορά µεταξύ των εντροπιών της εξόδου και του ϑορύβου είναι η εντροπία του σήµατος. Η διαφορά της εντροπίας είναι επίσης η κοινή πληροφορία µεταξύ του σήµατος και της εξόδου, που αποκαλείται και µεταφορά πληροφορίας I(X; Y ). Η κοινή πληροφορία είναι ίση µε : I(X; Y ) = H(X) H(X Y ) (4.27) ή εναλλακτικά I(X; Y ) = H(Y ) H(Y X). (4.28) Αυτό σηµαίνει, ότι η κοινή πληροφορία είναι η ποσότητα της πληροφορίας που παρέχει η γνώση της εξόδου Y σχετικά µε το σήµα X, ή µε άλλα λόγια, ένα µέτρο της µείωσης ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 90

της αβεβαιότητας σχετικά µε το X λόγω της πληροφορίας που παρέχεται από το Y ( Εξίσωση (4.27) ). Το αντίστροφο για τα Y, X ισχύει στην Εξίσωση (4.28). Το επόµενο ϐήµα αποτελεί την προσέγγιση της εντροπίας H(X) της στοχαστικής διεργασίας X. Η εντροπία µιας στοχαστικής διεργασίας µε συνάρτηση π.π. p(x) είναι : H(x) = x p(x)log(p(x)). (4.29) Αντίστοιχα, η π.π. p(x) πρέπει να είναι γνωστή. Η π.π. µπορεί να εκτιµηθεί εµπειρικά από το ιστόγραµµα της X. Παρόλα αυτά, αν ο αριθµός των δειγµάτων είναι πολύ µικρός, µπορούν να χρησιµοποιηθούν µόνο στατιστικές 2ης τάξης. Στην περίπτωση αυτή µόνο η µέση τιµή και η διασπορά πρέπει να εκτιµηθούν, υποθέτοντας ότι όλες οι ϱοπές υψηλότερης τάξης είναι µηδέν. Αυτό αντιστοιχεί στην υπόθεση µίας κανονικής (γκαουσιανής) κατανοµής. Η εντροπία µίας κανονικής διεργασίας µε διασπορά σx 2 δίνεται από : H(x) = 1 2 log 2(2πeσ 2 X). (4.30) Η εντροπία της συνιστώσας ϑορύβου H(Y X) εκφράζει την αβεβαιότητα σχετικά µε την έξοδο Y, αφού έχει αφαιρεθεί από αυτή το κοµµάτι της αβεβαιότητας λόγω της γνώσης του X, και ϐασίζεται εξ ολοκλήρου στη διασπορά του ϑορύβου σz 2, αν ϐέβαια ισχύει η υπόθεση ότι ο ϑόρυβος Z και το σήµα X είναι τελείως ασυσχέτιστα. Η εντροπία ολόκληρης της διεργασίας H(Y ) ϐασίζεται στη συνολική διασπορά σy 2 της εξόδου. Η κοινή πληροφορία είναι ενδεικτική της πληροφορίας του σήµατος X που µεταφέρεται µέσα από ένα ϑορυβώδες κανάλι επικοινωνίας και µπορεί να αποκτηθεί στην έξοδο Y. Αντίστοιχα, λοιπόν, έχουµε : I(X; Y ) = H(Y ) H(Y X) = 1 2 log 2(2πeσ 2 Y ) 1 2 log 2(2πeσ 2 Z) = 1 2 log 2( σ2 Y σ 2 Z ) = 1 2 log 2( σ2 X + σ2 Z ) σz 2 = 1 2 log 2(1 + SNR) (4.31) όπου SNR = σ2 Q σ 2 Z = σ2 Y σ 2 Z 1. (4.32) αντιστοιχεί στον λόγο Σήµατος προς Θόρυβο (SNR: Signal-to-Noise ratio). Μία προσέγγιση του SNR συγκρίνοντας τις µέσες τιµές και τις διασπορές της εξόδου για κάθε κλάση έχει δοθεί για την αξιολόγηση συστηµάτων BCI δύο κλάσεων (σκόπιµων εγκεφαλικών διεργασιών) µε συνεχή έξοδο [3]. SNR(t) = (E[D (k)(t)] Y (k) =L E[D (k)(t) ] Y (k) =R) 2 2(V ar[d (k)(t) ] Y (k) =L + V ar[d (k)(t) ] Y (k) =R) (4.33) ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 91

Αντικαθιστώντας, υπολογίζουµε τελικά την κοινή πληροφορία : I(t) = 1 2 log 2(SNR(t) + 1) (4.34) Σύµφωνα µε τον ορισµό της κοινής πληροφορίας, υπάρχει µία στενή σχέση µεταξύ εκείνης και του σφάλµατος ταξινόµησης στην έξοδο του συστήµατος. Ο λόγος για τον οποίο ϑα στηριχθούµε περισσότερο στα αποτελέσµατα της κοινής πληροφορίας, είναι διότι λαµβάνεται υπόψη για τον υπολογισµό της τιµής της στο χρόνο, εκτός από την απόφαση ταξινόµησης, και το πλάτος της εξόδου για κάθε µία απόφαση. Το πλάτος της απόφασης εκφράζει το ϐαθµό εµπιστοσύνης που υπάρχει σε κάθε αποτέλεσµα ταξινόµησης. Συνεπώς για ένα ταξινοµητή µε µεγάλα, κατ απόλυτη τιµή, πλάτη στην έξοδο του, υπάρχει µεγαλύτερη εµπιστοσύνη ότι οι αποφάσεις τις οποίες λαµβάνει είναι οι σωστές και, κατ επέκταση, ότι η εφαρµογή του σε καινούργια δεδοµένα δοκιµής ϑα αποφέρει καλές αποδόσεις. 4.5.1.2 Χρόνος απόκρισης Στις προηγούµενες παραγράφους αναφερθήκαµε σε κριτήρια αξιολόγησης (ακρίβεια ή σφάλ- µα ταξινόµησης, κοινή πληροφορία) που στόχο έχουν τη µέτρηση της διαχωριστικότητας που υπάρχει στα δεδοµένα. Ωστόσο, πρέπει να αναρωτηθούµε τι προκύπτει στην περίπτωση που, αν και έχει αναπτυχθεί η τέλεια µέθοδος επεξεργασίας των δεδοµένων, το αποτέλεσµα λαµβάνεται µετά από ένα µεγάλο χρονικό διάστηµα. Στις περιπτώσεις εφαρµογών που υποστηρίζουν την off-line ανάλυση των δεδοµένων, ίσως αυτό να µην επηρέαζε σε µεγάλο ϐαθµό την τελική αξιολόγηση της µεθόδου, ειδικά αν το ϐάρος είναι στην ακρίβεια που αποφέρει το τελικό αποτέλεσµά της. Σε περιπτώσεις όµως όπως αυτή που εξετάζουµε, στις οποίες απατείται on-line ανατροφοδότηση των αποτελεσµάτων της ταξινόµησης, καθοριστική σηµασία έχει η καθυστέρηση µε την οποία ϑα παρέχεται η ανατροφοδότηση στο χρήστη του BCI, καθώς αυτός εκτελεί τη Ϲητούµενη νοητική ενέργεια. Με άλλα λόγια, ο χρόνος απόκρισης αποτελεί µία επίσης καθοριστική παράµετρο για την αξιολόγηση της απόδοσης ενός BCI. Για να ληφθεί υπόψη εκτός από τη δυνατότητα διαχωριστικότητας και ο χρόνος απόκρισης, έχει εισαχθεί το µέτρο της µέγιστης κλίσης της κοινής πληροφορίας : ST MI(t) = I(t) t t 0, (4.35) όπου t 0 είναι η χρονική στιγµή της ενεργοποίησης του ερεθίσµατος και I(t) η συνεχής κοινή πληροφορία. Η µέγιστη κοινή πληροφορία δίνεται από την εφαπτοµένη της καµπύλης I(t) που περνάει από το σηµείο (t, I) = [t 0, 0]. Το σύστηµα BCI µε τη µεγαλύτερη τιµή για τη µέγιστη κλίση της κοινής πληροφορίας µπορεί να παρέχει την πιο γρήγορη και ακριβή ανατροφοδότηση στην έξοδο. Το µέτρο µπορεί να αποβεί ιδιαιτέρως χρήσιµο στην αναζήτηση µεθόδων επεξεργασίας σήµατος και εξαγωγής χαρακτηριστικών, για παράδειγµα ως προς τον συµβιβασµό (trade-off) µεταξύ της εκτίµησης της ακρίβειας και της χρονικής καθυστέρησης. Επιπλέον, η κλίση της κοινής πληροφορίας παρέχει ένα ανώτατο όριο του ϑεωρητικού ϱυθµού µεταφοράς της πληροφορίας (ποσότητα πληροφορίας ανά χρονική µονάδα) ενός συγκεκριµένου BCI προτύπου [4]. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 92

4.5.2 Αποτελέσµατα ταξινοµητών Bayes Η πρώτη µέθοδος ταξινόµησης, που εφαρµόζεται στα εξαγόµενα διανύσµατα χαρακτηριστικών των trials, προσεγγίζει τα διανύσµατα κάθε κλάσης µε µία πολυµεταβλητή κανονική κατανοµή. Ετσι για κάθε κλάση δηµιουργείται ένα πιθανοθεωρητικό πρότυπο, και στη συνέχεια, µε ϐάση τη ϑεωρία του Bayes αποφασίζεται σε ποιο από τα δύο πρότυπα ανήκει η κάθε trial. Στο Σχήµα 4.5 παρουσιάζονται το σφάλµα ταξινόµησης και η κοινή πληροφορία σε σχέση µε το χρόνο, τόσο για τα δεδοµένα εκµάθησης, µε γνωστή την κλάση για κάθε trial, όσο και για τα δεδοµένα δοκιµής, για τα οποία είναι άγνωστη. Κατά τη διάρκεια των πρώτων 3 δευτερολέπτων η ταξινόµηση ϑα γίνεται κατά τυχαίο τρόπο, εφόσον δεν έχει εµφανιστεί ακόµη στο χρήστη το ερέθισµα υπό τη µορφή του ϐέλους κατεύθυνσης της κίνησης, οπότε δεν υπάρχει νόηµα στην απεικόνιση αυτών των χρονικών στιγµών. Από τα 3 δευτερόλεπτα και έπειτα πα- ϱατηρείται µία ϱαγδαία αλλαγή τόσο στο σφάλµα ταξινόµησης, το οποίο µειώνεται, όσο και στην κοινή πληροφορία, η οποία αυξάνεται. Παρατηρούµε ότι η διαδικασία συγκέντρωσης και συνδυασµού πληροφορίας στο χρόνο αποδίδει κατά το πέρας του trial, µε την υψηλότε- ϱη τιµή για την κοινή πληροφορία να σηµειώνεται στα 9 sec (0.79 bit/trial) και αντίστοιχα τη χαµηλότερη τιµή για το σφάλµα ταξινόµησης (10 %) για τα δεδοµένα εκµάθησης. Στα δεδοµένα δοκιµής, το µοντέλο συνδυασµού της πληροφορίας µειώνει περαιτέρω το σφάλµα µέχρι τα 5.8 sec οπού και καταγράφεται το χαµηλότερο σφάλµα ταξινόµησης (14.3 %), ενώ η υψηλότερη τιµή της κοινής πληροφορίας σηµειώνεται στα 6.6 sec (0.61bit/trial) δηλώνοντας τη µέγιστη εµπιστοσύνη για την απόφαση ταξινόµησης στη δεδοµένη χρονική στιγµή. Στο Σχήµα 4.6 παρατηρούµε το σφάλµα ταξινόµησης και την κοινή πληροφορία συναρτήσει του χρόνου, και για τα δύο σύνολα δεδοµένων, µε την απόφαση ταξινόµησης σε κάθε χρονική στιγµή να λαµβάνεται µόνο ϐάσει της τρέχουσας πληροφορίας, και όχι µε συγκέντρωση πλη- ϱοφορίας από όλες τις προηγούµενες χρονικές στιγµές. Παρατηρούµε ότι για τα δεδοµένα εκµάθησης το ελάχιστο σφάλµα είναι 19.3 % και εµφανίζεται στα 4.3 sec, ενώ για τα δεδοµένα δοκιµής το ελάχιστο είναι 20.7 % και εµφανίζεται περίπου την ίδια χρονική στιγµή (4.2 sec). Συµπεραίνουµε οπότε, ότι µε το µοντέλο που εφαρµόστηκε και τον γραµµικό συνδυασµό της πληροφορίας στο χρόνο υπήρξε ϐελτίωση στην ταξινόµηση της τάξης των 6 µε 10 % για κάθε σύνολο δεδοµένων. Περισσότερο αισθητή είναι η µείωση στην κοινή πληροφορία, η οποία για το απλό πρότυπο µειώνεται στο 0.42 bit/trial στο σύνολο των δεδοµένων εκπαίδευσης, σε σχέση µε το 0.61bit/trial που πετυχαίνει το συνδυαστικό πρότυπο. Στο Σχήµα 4.7 παρουσιάζεται η ικανότητα διάκρισης συναρτήσει του χρόνου για τα δεδοµένα δοκιµής, η οποία εκφράζεται από τα ϐάρη g t που πηγάζουν από τις αποφάσεις ταξινόµησης και την εµπιστοσύνη σε αυτές σε κάθε χρονική στιγµή ( άµεσα εξαρτώµενες από το σφάλµα ταξινόµησης του Σχήµατος (4.5) ). Τέλος, παραθέτεται και ένας συγκριτικός πίνακας µε τιµές του σφάλµατος ταξινόµησης (σύνολο δεδοµένων δοκιµής) για το µοντέλο που κάνει χρήση του συνδυασµού πληροφορίας στο χρόνο και του πιο απλού µοντέλου, που λαµβάνει την από- ϕαση σύµφωνα µε τον κανόνα του Bayes µε πληροφορία που αντιστοιχεί µόνο στη δεδοµένη χρονική στιγµή της απόφασης ( Σχήµα (4.8) ). ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 93

Σχήµα 4.5: Το διάγραµµα ( (α) ) παρουσιάζει το σφάλµα ταξινόµησης (µωβ) και την κοινή πληροφορία στο χρόνο (µπλε) για την ταξινόµηση του συνόλου δεδοµένων εκπαίδευσης. Το διάγραµµα ( (ϐ) ) παρουσιάζει τα ίδια µεγέθη στο χρόνο, αλλά για τα το σύνολο δεδοµένων δοκιµής µετά την αποκάλυψη των κλάσεων στις οποίες όντως ανήκουν. Τα αποτελέσµατα προκύπτουν µε την εφαρµογή του συνδυαστικού µοντέλου ταξινόµησης. 4.5.3 Αποτελέσµατα ταξινοµητών SVM Η δεύτερη µέθοδος που εφαρµόζεται για την ταξινόµηση των trials χρησιµοποιεί την τεχνική των µηχανών διανυσµάτων υποστήριξης για τη λήψη των αποφάσεων στην έξοδο. Οπως ανα- ϕέρθηκε και στην Ενότητα 4.4.2 από ϑεωρητικής άποψης ϕαίνεται να επικρατεί σε αρχικό επίπεδο η επιλογή της χρήσης της γκαουσιανής RBF συνάρτησης πυρήνα. Ρόλος της, η αντιστοίχηση των διανυσµάτων χαρακτηριστικών σε ένα καινούργιο χώρο χαρακτηριστικών όπου ϑα προσδιοριστεί από την SVM το υπερεπίπεδο απόφασης για τις δύο κλάσεις ταξινόµησης. Πρακτικά όµως, επειδή κάθε εφαρµογή στο πεδίο της µηχανικής µάθησης είναι άµεσα ε- ξαρτηµένη από τον τύπο των δεδοµένων της, κρίνεται ορθότερο να χρησιµοποιηθούν και να αξιολογηθούν µε ϐάση την απόδοσή τους περισσότερες από µία συναρτήσεις πυρήνα. Αρχικά, ϑα εφαρµοστεί η γραµµική συνάρτηση πυρήνα για τη δηµιουργία ενός µοντέλου SVM µε αυστηρό περιθώριο, στο οποίο η ταξινόµηση γίνεται σύµφωνα µε τη συνάρτηση απόφασης ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 94

Σχήµα 4.6: Το διάγραµµα ( (α) ) παρουσιάζει το σφάλµα ταξινόµησης (µωβ) και την κοινή πληροφορία στο χρόνο (µπλε) για την ταξινόµηση του συνόλου των δεδοµένων εκπαίδευσης, λαµβάνοντας υπόψη µόνο την πληροφορία της τρέχουσας χρονικής στιγµής και χωρίς τη χρήση του συνδυαστικού προτύπου. Οι ίδιες πληροφορίες δίνονται προς παρατήρηση για τα δεδοµένα δοκιµής στο διάγραµµα ( (ϐ) ). f(x) = n i=1 a ix i x + b. Ο ταξινοµητής προσδιορίζει το υπερεπίπεδο απόφασης µεγίστου περιθωρίου, δηλαδή κα- ϑορίζει τις τιµές των a i και b για το διαχωρισµό των προτύπων των δύο κλάσεων µέσω της διαδικασίας εκµάθησης. Στο στάδιο αυτό ϑεωρούνται γνωστά τα Ϲεύγη (x i, y i ) χαρακτηριστικών - τιµών των κλάσεων µόνο για τα trials εκµάθησης. Για την αξιολόγηση της απόδοσης του ταξινοµητή χρησιµοποιείται η µέθοδος της Leave-One-Out διεπικύρωσης. Τελικά, το πρότυπο SVM αυστηρού περιθωρίου µε χρήση της γραµµικής συνάρτησης πυρήνα δίνει µέγιστη ακρίβεια ταξινόµησης της τάξης του 84% (Σχήµα 4.9). Για τη ϐελτίωση της ακρίβειας ταξινόµησης µένοντας σταθεροί στην επιλογή της γραµµικής συνάρτησης πυρήνα, προχωρά- µε στη δηµιουργία ενός πρότυπου SVM χαλαρού περιθωρίου αυτή τη ϕορά, µε την εισαγωγή της υπερπαραµέτρου C (σταθερά χαλαρού περιθωρίου), που εκφράζει το κόστος µε το οποίο επιβαρύνονται τα σφάλµατα ταξινόµησης του περιθωρίου. Για την επιλογή της ϐέλτιστης τιµής για την παράµετρο δοκιµάζονται διάφορες τιµές της και καταλήγουµε σε αυτή που επιστρέφει την υψηλότερη ακρίβεια ταξινόµησης. Η επιλογή µίας µεγάλης τιµής για το C έχει ως συνέπεια ένα µεγάλο κόστος επιβάρυνσης, µε τα παραδείγµατα που ϐρίσκονται κοντά στο όριο απόφασης (µέσα στο περιθώριο) να επηρεάζουν σηµαντικά τον προσανατολισµό του. Αντίθετα, µία µικρότερη τιµή για το C επιτρέπει να αγνοηθούν τα παραδείγµατα κοντά στο όριο και κατ αυτό τον τρόπο αυξάνει το περιθώριο, σύµφωνα και µε το γνωστό πρόβληµα ϐελτιστοποίησης για τη µεγιστοποίηση του περιθωρίου. Η αξιολόγηση µε τη µέθοδο της διεπικύρωσης δίνει µέγιστη ακρίβεια ταξινόµησης της τάξης του 90% για C = 8. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 95

Σχήµα 4.7: Τα ϐάρη για τον σταθµισµένο συνδυασµό της πληροφορίας των αποφάσεων, τα οποία εκφράζουν την ικανότητα διάκρισης µεταξύ των δύο κλάσεων σε κάθε χρονική στιγµή (δεδοµένα δοκιµής). Παρατηρούµε ότι υπάρχει µία µικρή αύξηση στην ακρίβεια που υπολογίζουµε για την α- ξιολόγηση των δύο µεθόδων ταξινόµησης µε την εφαρµογή της SVM χαλαρού περιθωρίου. Συνεπώς, συµπεραίνουµε ότι τα αποτελέσµατα που λαµβάνουµε µε την επιλογή της γραµµικής συνάρτησης πυρήνα παρέχουν µία ωφέλιµη ϐάση, η οποία ϑα επιχειρηθεί να επεκταθεί µε την ενδεχόµενη ϐελτίωση της απόδοσης χρησιµοποιώντας µία µη-γραµµική συνάρτηση πυρήνα, όπως η γκαουσιανή RBF. Η εισαγόµενη υπερ-παράµετρος γ, η οποία καθορίζει το εύρος της γκαουσιανής συνάρτησης, ελέγχει και την ευελιξία του τελικού ταξινοµητή. Η ευελιξία αυξάνεται όσο αυξάνεται και η τιµή της γ και αυτό µπορεί να συντελέσει τελικά στην Χρονική Σφάλµα ταξινόµησης Σφάλµα ταξινόµησης στιγµή (sec) συνδυαστικού µοντέλου(%) απλού µοντέλου(%) 3.5 45 53.6 4.5 17.1 24.3 5.5 19.3 34.3 5.8 14.3 25.7 6.5 16.4 27.1 7.5 17.1 41.4 8.5 17.9 50.7 Σχήµα 4.8: Συγκριτικός πίνακας µε τιµές του σφάλµατος ταξινόµησης (δεδοµένα δοκιµής). Συγκεντρωτικά παρατηρούµε ότι το συνδυαστικό µοντέλο αποφέρει αισθητά χαµηλότερο σφάλµα ταξινόµησης για την Bayes ταξινόµηση. ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 96

Σχήµα 4.9: Το σφάλµα ταξινόµησης για το µοντέλο SVM αυστηρού περιθωρίου µε χρήση της γραµµικής συνάρτησης πυρήνα (µέθοδος διεπικύρωσης στα trials εκµάθησης). εµφάνιση του ϕαινοµένου της υπερπροσαρµογής σε σετ δεδοµένων µε πολύ υψηλό αριθµό διαστάσεων στο χώρο των χαρακτηριστικών, και σχετικά µικρότερο αριθµό παραδειγµάτων. Κατά συνέπεια, για τη χρήση RBF συνάρτησης πυρήνα, υπάρχουν δύο υπερπαράµετροι για τις οποίες πρέπει να επιλεγούν τιµές. Για την επιλογή των C και γ, προτείνεται µία αναζήτηση σε πλέγµα. Αυτό που γίνεται ουσιαστικά είναι ότι Ϲεύγη τιµών των υπερ-παραµέτρων δοκιµάζονται και το Ϲεύγος που παρουσιάζει την υψηλότερη ακρίβεια ταξινόµησης κατά τη µέθοδο της διεπικύρωσης επιλέγεται. Εχει αποδειχθεί ότι η χρήση εκθετικά αυξανόµενων ακολουθιών για τα C, γ συνιστά µία πρακτική µέθοδο για την ανίχνευση καλών τιµών τους. Στην πραγµατικότητα, υπάρχουν αρκετά πιο εξελιγµένες µέθοδοι που µπορούν να µειώσουν τον υπολογιστικό χρόνο όπως, για παράδειγµα, µε την προσέγγιση του ϱυθµού διεπικύρωσης [8]. Παρόλα αυτά, στη περίπτωσή µας, ϑα προτιµήσουµε την αναλυτικότερη αναζήτηση σε πλέγµα, καθώς λόγω της ύπαρξης µόλις 2 υπερπαραµέτρων προς προσδιορισµό, η διαφορά σε υπολογιστικό χρόνο είναι µικρή ενώ δίνεται παράλληλα η δυνατότητα µιας πιο εξαντλητικής αναζήτησης. Αν όµως επιθυµούµε να µειωθεί περαιτέρω ο υπολογιστικός χρόνος χρησιµοποιώντας την αναζήτηση σε πλέγµα, προτείνεται σε αρχικό στάδιο η δηµιουργία ενός πιο γενικού και λιγότερο λεπτοµερούς πλέγµατος. Αφού προσδιοριστεί µία καλή περιοχή στο πλέγµα, δηλαδή µία περιοχή όπου η ακρίβεια ταξινόµησης είναι υψηλότερη σε σχέση µε τις άλλες, µπορεί να διεξαχθεί εκεί µία πιο λεπτοµερής ανάλυση. Η αναζήτηση, σε αρχικό επίπεδο, έγινε για όλα τα χρονικά δείγµατα στο διάστηµα από 3 έως 9 δευτερόλεπτα, µε την καλύτερη απόδοση κατά τη διαδικασία διεπικύρωσης να λαµβάνεται περίπου στα 4.3 δευτερόλεπτα. Οι τιµές για τις C, γ στις οποίες αναζητείται αρχικά η ϐέλτιστη ακρίβεια ταξινόµησης ϐρίσκονται στο πλαίσιο : C = 2 5, 2 3,..., 2 15, γ = 2 15, 2 13,..., 2 3. Στο τέλος της αναζήτησης, ανακαλύπτουµε ότι οι Ϲητούµενες τιµές είναι οι C = 2 3 και γ = 2 2, όπως ϕαίνεται και στο Σχήµα 4.10. Στη συνέχεια πραγµατοποιείται µία πιο λεπτοµερή ανάλυση πλέγµατος στην περιοχή (2 0, 2 5 ) για την C και (2 3, 2 2 ) για την γ, η οποία και απεικονίζεται στο Σχήµα 4.11. Αν και µε δια- ϕορετικές τιµές για τις υπερ-παραµέτρους αυτή τη ϕορά (2 1.25, 2 1 ), η ακρίβεια ταξινόµησης παραµένει ίδια (κοντά στο 10 % και στις δύο περιπτώσεις). Για το λόγο αυτό αποφασίζουµε να µην προχωρήσουµε σε περαιτέρω ανάλυση σε πιο λεπτοµερές πλέγµα τιµών. Η αξιολόγηση της ταξινόµησης που επιτυγχάνουν τα διαφορετικά µοντέλα SVM µε τη µέθο- ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 97

Σχήµα 4.10: Αναζήτηση των υπερ-παραµέτρων (C, γ) που ϐελτιστοποιούν την ακρίβεια ταξινόµησης κατά τη διαδικασία διεπικύρωσης σε ένα λιγότερο λεπτοµερές αρχικό πλαίσιο. δο της διεπικύρωσης παρουσιάζει τη γραµµική συνάρτηση πυρήνα να ϕέρει τελικώς τα ίδια αποτελέσµατα µε την RBF συνάρτηση για συγκεκριµένη επιλογή υπερ-παραµέτρων. Λόγω της απλότητας υπολογισµού της γραµµικής συνάρτησης σε σχέση µε την RBF, αλλά και της ευκολίας στη ϱύθµισή της (καθώς η µόνη υπερπαράµετρος που επηρεάζει την απόδοση του µοντέλου ταξινόµησης είναι η C), αποφασίζουµε τη χρήση της γραµµικής συνάρτησης και την εφαρµογή του συγκεκριµένου προτύπου SVM στα δεδοµένα δοκιµής, για να εξετάσουµε πλέον την αποτελεσµατικότητά του σε trials, για καθένα από τα οποία δεν είναι εξ αρχής γνωστή η κλάση y i στην οποία αντιστοιχούν. Στο Σχήµα 4.12 παρουσιάζεται το σφάλµα ταξινόµησης (µωβ) και η κοινή πληροφορία (µπλε) όπως προκύπτουν από την εφαρµογή του προτύπου SVM χαλαρού περιθωρίου (C = 8) στα δεδοµένα εκπαίδευσης (a) και στα δεδοµένα δοκιµής (b). Παρατηρούµε ότι για τα δεδοµένα εκπαίδευσης το ελάχιστο σφάλµα είναι 10% και εµφανίζεται στα 4.2 και στα 4.9 sec, ενώ για τα δεδοµένα δοκιµής το ελάχιστο είναι 20.7% και εµφανίζεται στα 4.7 sec. Η κοινή πληροφορία κινείται σε αρκετά χαµηλά επίπεδα πετυχαίνοντας µέγιστη τιµή 0.36 bit/trial στα 4.7 sec. Στην προσπάθεια ϐελτίωσης των αποτελεσµάτων που παρέχουν οι έξοδοι του SVM ταξινοµητή, σειρά έχει η εισαγωγή του συνδυαστικού µοντέλου της περίπτωσης των απλών ταξινοµητών ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 98

Σχήµα 4.11: Αναζήτηση των υπερ-παραµέτρων C, γ που ϐελτιστοποιούν την ακρίβεια ταξινόµησης κατά τη διαδικασία διεπικύρωσης σε ένα πιο λεπτοµερές πλαίσιο. Παρά την πιο λεπτοµερή αναζήτηση, η ακρίβεια δεν ϐελτιώνεται περαιτέρω (παραµένει ίδια) και δεν προχωράµε σε αλλαγή των προσδιορισµένων παραµέτρων. Bayes (ϐλέπε Ενότητα 4.4.1), το οποίο ενσωµατώνει σχετική γνώση από τις αποφάσεις όλων των προηγούµενων χρονικών στιγµών οδηγώντας στη ϐέλτιστη ταξινόµηση για µία συγκεκρι- µένη χρονική στιγµή t i. Στο Σχήµα 4.13 παρουσιάζονται το σφάλµα ταξινόµησης και η κοινή πληροφορία σε σχέση µε το χρόνο, τόσο για τα δεδοµένα εκµάθησης (a), µε γνωστή την κλάση για κάθε trial, όσο και για τα δεδοµένα δοκιµής (b), για τα οποία είναι άγνωστη. Από τα 4.5 δευτερόλεπτα και έπειτα παρατηρείται µία ϱαγδαία αλλαγή τόσο στο σφάλµα ταξινόµησης, το οποίο µειώνεται, όσο και στην κοινή πληροφορία, η οποία αυξάνεται. Παρατηρούµε ότι η διαδικασία συγκέντρωσης και συνδυασµού πληροφορίας στο χρόνο αποδίδει όσο προχωράµε κατά τη χρονική διάρκεια του trial, µε την σταθεροποίηση κοντά στην υψηλότερη τιµή για την κοινή πληροφορία (περίπου 0.79 bit/trial) και αντίστοιχα στη χαµηλότερη τιµή για το σφάλµα ταξινόµησης (4-5%) να σηµειώνεται από τα 6 sec και έπειτα για τα δεδοµένα εκµά- ϑησης. Στα δεδοµένα δοκιµής, το µοντέλο συνδυασµού της πληροφορίας σταθεροποιεί το σφάλµα από τα 6.5 sec και µετά κοντά στο 10%, µε το χαµηλότερο σφάλµα ταξινόµησης να καταγράφεται πρώτη ϕορά στα 7.2 sec (9.3%). Για το ίδιο σύνολο δεδοµένων η κοινή πληρο- ϕορία σταθεροποιείται πάνω από τα 0.9 bit/trial από τα 6 sec και έπειτα, µε την υψηλότερη τιµή να σηµειώνεται στα 7.2 sec (0.69 bit/trial) δηλώνοντας τη µέγιστη εµπιστοσύνη για την απόφαση ταξινόµησης στη δεδοµένη χρονική στιγµή. Συγκεντρωτικά, λοιπόν, σηµειώνεται ΒΑΣΙΛΗΣ ΤΣΙΛΙΓΚΙΡΙ ΗΣ 99