ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διπλωματική Εργασία

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ. Διπλωματική Εργασία"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ Διπλωματική Εργασία του Φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών: ΚΑΡΛΗ ΒΑΣΙΛΕΙΟΥ του ΔΗΜΗΤΡΙΟΥ Αριθμός Μητρώου:5649 Θέμα: ΑΥΤΟΜΑΤΗ ΑΝΑΛΥΣΗ ΗΧΗΤΙΚΩΝ ΣΗΜΑΤΩΝ ΜΗΧΑΝΗΣ ΑΥΤΟΚΙΝΗΤΟΥ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ Επιβλέπων: ΕΠΙΚΟΥΡΟΣ ΚΑΘΗΓΗΤΗΣ: Ε.ΔΕΡΜΑΤΑΣ 1

2 Πάτρα,../../2009 ΠΙΣΤΟΠΟΙΗΣΗ Πιστοποιείται ότι η διπλωματική εργασία με θέμα: ΑΥΤΟΜΑΤΗ ΑΝΑΛΥΣΗ ΗΧΗΤΙΚΩΝ ΣΗΜΑΤΩΝ ΜΗΧΑΝΗΣ ΑΥΤΟΚΙΝΗΤΟΥ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών ΚΑΡΛΗ ΒΑΣΙΛΕΙΟΥ του ΔΗΜΗΤΡΙΟΥ (Α.Μ.5649) παρουσιάστηκε δημόσια και εξετάστηκε στο Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών στις Ο Επιβλέπων../../.. Ο Διευθυντής του Τομέα... Ευάγγελος Δερματάς Νικόλαος Φακωτάκης Επίκουρος Καθηγητής Καθηγητής 2

3 Αριθμός Διπλωματικής Εργασίας: Τίτλος: ΑΥΤΟΜΑΤΗ ΑΝΑΛΥΣΗ ΗΧΗΤΙΚΩΝ ΣΗΜΑΤΩΝ ΜΗΧΑΝΗΣ ΑΥΤΟΚΙΝΗΤΟΥ ΣΕ ΑΝΕΞΑΡΤΗΤΕΣ ΣΥΝΙΣΤΩΣΕΣ Φοιτητής: ΚΑΡΛΗΣ ΒΑΣΙΛΕΙΟΣ του ΔΗΜΗΤΡΙΟΥ Επιβλέπων: ΕΥΑΓΓΕΛΟΣ ΔΕΡΜΑΤΑΣ Περίληψη Στην παρούσα διπλωματική εργασία μελετώνται μέθοδοι διαχωρισμού σημάτων σε ανεξάρτητες συνιστώσες. Αφού δοθεί ο ορισμός του προβλήματος και μια αναφορά στις κυριότερες μεθόδους για την αντιμετώπισή του, γίνεται σαφές ότι δεν μπορούν να σχεδιαστούν γενικές μέθοδοι διαχωρισμού σημάτων. Παρά την πληθώρα των πρακτικών προβλημάτων στα οποία βρίσκει εφαρμογή το μαθηματικό πρότυπο, δεν είναι δυνατός ο σχεδιασμός μιας ενιαίας μεθόδου που να αντιμετωπίζει αποτελεσματικά όλες τις περιπτώσεις διαχωρισμού σημάτων. Ο αναγνώστης πληροφορείται για τις περιοχές έρευνας και ανάπτυξης των διαφόρων μεθόδων καθώς και για τις εφαρμογές τους σε διάφορους τομείς της σύγχρονης επιστήμης. Στη συνέχεια, υλοποιούνται κάποιες από αυτές τις μεθόδους και παρουσιάζονται τα αποτελέσματα προσομοίωσης πραγματικών πειραματικών δεδομένων που λήφθηκαν για την εκπόνηση της συγκεκριμένης διπλωματικής εργασίας. Τα αποτελέσματα εξάγονται με την χρήση και υλοποίηση αλγόριθμου επεξεργασίας των δεδομένων στο πρόγραμμα Matlab και μελετώνται εκτενέστερα με το πρόγραμμα Adobe Audition 1.5. Τέλος, παρουσιάζονται τα συμπεράσματα από την εφαρμογή του αλγόριθμου στα πραγματικά δεδομένα και δίνεται μια μαθηματικήθεωρητική βάση για την βελτιστοποίηση των μεθόδων διαχωρισμού σημάτων. 3

4 Πίνακας Περιεχομένων Κεφάλαιο 1: Εισαγωγή Τι είναι η ανάλυση σε ανεξάρτητες συνιστώσες Εφαρμογές της ICA μεθόδου Συμπεράσματα Οργάνωσης της εργασίας 4 Κεφάλαιο 2: Πιθανότητες και στοχαστικές διαδικασίες Εισαγωγή Χώροι πιθανοτήτων Τυχαίες μεταβλητές και συνεχείς κατανομές Πολλαπλές τυχαίες μεταβλητές και κατανομές Ορισμός και θεμελιώδης ιδιότητες της ανεξαρτησίας.8 Κεφάλαιο 3: Ανάλυση σε ανεξάρτητες συνιστώσες Ορισμός της ICA Ασάφειες της ICA Απεικόνιση της ICA Οι γκαουσσιανές μεταβλητές είναι απαγορευμένες...12 Κεφάλαιο 4: Μέθοδοι για την εκτίμηση του ICA προτύπου Τυφλός διαχωρισμός σημάτων χρησιμοποιώντας την ιδιότητα της μη γκαουσσιανότητας Μέτρα για την εκτίμηση της μη γκαουσσιανότητας..14 4

5 4.2.1 Κύρτωση Negentropy Προσεγγίσεις του Negentropy Ελαχιστοποίηση των αμοιβαίων πληροφοριών Αμοιβαίες πληροφορίες Προσδιορισμός ICA από τις αμοιβαίες πληροφορίες Εκτίμηση μέγιστης πιθανότητας Η πιθανότητα Η αρχή Infomax Σύνδεση με αμοιβαίες πληροφορίες ICA και αναζήτηση προβολής Συνελικτική μίξη και ο αλγόριθμος των Ngugen Thi και Jutten 24 Κεφάλαιο 5: Προεπεξεργασία των σημάτων Κεντροθέτηση Λεύκανση Περαιτέρω προεπεξεργασία...27 Κεφάλαιο 6: Αλγόριθμοι και διαδικασίες εξαγωγής αποτελεσμάτων Αλγόριθμος FastICA Ο αλγόριθμος για μια μονάδα Ο αλγόριθμος για αρκετές μονάδες Αλγόριθμος και μέγιστη πιθανότητα Ιδιότητες.31 5

6 6.6 Περιγραφή του αλγόριθμου Εφαρμογή σε τυχαία δεδομένα Εφαρμογή στα πειραματικά δεδομένα Συμπεράσματα 64 Κεφάλαιο 7: Συμπεράσματα.65 Παράρτημα: Κώδικας 6

7 Κεφάλαιο 1 Εισαγωγή 1.1 Τί είναι η ανάλυση σε ανεξάρτητες συνιστώσες Ο τυφλός χωρισμός σημάτων (BSS) ή αλλιώς ανεξάρτητη ανάλυση συνιστωσών (ICA) είναι τεχνικές επεξεργασίας πινάκων και ανάλυσης στοιχείων που στοχεύουν να ανακτήσουν απαρατήρητα σήματα ή «πηγές» από τα παρατηρούμενα μίγματα, εκμεταλλευόμενες μόνο την υπόθεση της αμοιβαίας ανεξαρτησίας μεταξύ των σημάτων. Ουσιαστικά οι παρατηρήσεις λαμβάνονται στην έξοδο ενός συνόλου αισθητήρων, όπου κάθε αισθητήρας λαμβάνει έναν διαφορετικό συνδυασμό των σημάτων πηγής. Ο χαρακτηρισμός «τυφλές πηγές» δηλώνει το γεγονός ότι 1) τα σήματα πηγής δεν παρατηρούνται και 2) καμία πληροφορία δεν είναι διαθέσιμη για το μίγμα. Έστω ότι βρισκόμαστε σε ένα δωμάτιο όπου δύο άνθρωποι μιλούν ταυτόχρονα. Έχουμε δύο μικρόφωνα, τα οποία κρατάμε σε διαφορετικές θέσεις. Τα μικρόφωνα μας δίνουν δύο ηχογραφημένα χρονικά σήματα, τα οποία θα μπορούσαμε να παραστήσουμε ως x 1 (t) και x 2 (t), με x 1 και x 2 τα εύρη, και t ο χρονικός δείκτης. Κάθε ένα από αυτά τα ηχογραφημένα σήματα είναι ένα σταθμισμένο άθροισμα των σημάτων ομιλίας που εκπέμπονται από τους δύο ομιλητές, τα οποία παριστάνουμε με s 1 (t) και s 2 (t). Θα μπορούσαμε να το εκφράσουμε αυτό ως γραμμική εξίσωση: x () t = a s + a s x () t = a s + a s όπου α 11, α 12, α 21, και α 22 είναι μερικές παράμετροι που εξαρτώνται από τις αποστάσεις των μικροφώνων από τους ομιλητές. Θα ήταν πολύ χρήσιμο εάν θα μπορούσαμε τώρα να υπολογίσουμε τα δύο αρχικά λεκτικά σήματα s 1 (t) και s 2 (t), χρησιμοποιώντας μόνο τα ηχογραφημένα σήματα x 1 (t) και x 2 (t). Αυτό καλείται πρόβλημα κοκτέιλ-συμβαλλόμενων μερών. Πραγματικά, εάν ξέραμε τις παραμέτρους α ij, θα μπορούσαμε να λύσουμε το παραπάνω σύστημα γραμμικών εξισώσεων με τις κλασσικές μεθόδους. Το αξιοσημείωτο είναι, εντούτοις, ότι εάν δεν γνωρίζουμε τα α ij, το πρόβλημα είναι σημαντικά πιο δύσκολο. Μια προσέγγιση στην επίλυση αυτού του προβλήματος θα ήταν να χρησιμοποιήσουμε κάποιες πληροφορίες για τις στατιστικές ιδιότητες των s i (t) σημάτων για να υπολογίσουμε τα α ii. Ουσιαστικά, θεωρείται ότι είναι αρκετό να υποθέσουμε ότι τα s 1 (t) και s 2 (t), σε κάθε στιγμιαίο t, είναι στατιστικώς ανεξάρτητα. Αυτό δεν είναι μια φανταστική υπόθεση σε πολλές περιπτώσεις, και δεν χρειάζεται να είναι ακριβώς αληθινή στην πράξη. Η πρόσφατα αναπτυγμένη τεχνική ανεξάρτητης ανάλυσης συνιστωσών, ή ICA, μπορεί να χρησιμοποιηθεί για να υπολογίσει τα α ij βασιζόμενη στις πληροφορίες της ανεξαρτησίας τους, η οποία μας επιτρέπει να 7

8 διαχωρίσουμε τα δύο αρχικά σήματα της πηγής s 1 (t) και s 2 (t) από τα μίγματά τους x 1 (t) και x 2 (t). Επίσης, είναι γνωστό ότι υπάρχουν πολλές πιθανές εφαρμογές των νευρωνικών δικτύων στην επεξεργασία σήματος και έτσι χρησιμοποιούνται στην εξαγωγή των αρχικών σημάτων πηγής. Ο στόχος είναι να βρεθεί ένα αντίστροφο νευρωνικό σύστημα (που καλείται επίσης σύστημα αναδημιουργίας), για να δούμε εάν υπάρχει και είναι σταθερό και να υπολογιστούν τα αρχικά σήματα εισαγωγής με αυτόν τον τρόπο. Αυτή η εκτίμηση εκτελείται βάσει μόνο των παρατηρούμενων σημάτων εξόδου όπου κάποια προγενέστερη γνώση για το σύστημα και τις στοχαστικές ιδιότητες των σημάτων πηγής είναι διαθέσιμη. Σε αυτή την περίπτωση προκύπτουν τέσσερα θεμελιώδη προβλήματα: 1) η επίλυση του προβλήματος (στην πραγματικότητα, αυτό υπονοεί την ύπαρξη του αντίστροφου συστήματος ή/και αναγνωρισιμότητα του συστήματος) [60], [62], [63]. 2) η σταθερότητα του αντίστροφου προτύπου [46], [33], [64]. 3) η σύγκλιση του αλγορίθμου εκμάθησης και της ταχύτητάς του με το σχετικό πρόβλημα για το πώς να αποφύγει παγίδευση στα τοπικά ελάχιστα 4) η ακρίβεια των αναδημιουργημένων σημάτων πηγής [41], [47]. Αν και πρόσφατα πολλοί αλγόριθμοι έχουν αναπτυχθεί που είναι σε θέση να χωρίσουν επιτυχώς τα σήματα πηγής, υπάρχουν ακόμα πολλά προβλήματα που μελετώνται. 1) Ανάπτυξη των αλγορίθμων εκμάθησης που λειτουργούν: α) στο πλαίσιο των μη γεωστατικών περιβαλλόντων b) όταν ο αριθμός των σημάτων πηγής είναι άγνωστος γ) όταν αλλάζει δυναμικά ο αριθμός σημάτων πηγής, όπου οι ιδιότητες των μη γεωστατικών δεν είναι γνωστές εκ των προτέρων. 2) Οι βέλτιστες επιλογές της μη γραμμικής ενεργοποίησης λειτουργούν όταν οι κατανομές των πηγών είναι άγνωστες και τα μίγματα περιέχουν υπό-γκαουσσιανές και υπέρ-γκαουσσιανές πηγές. 3) Επιρροή των πρόσθετων θορύβων και των μεθόδων για την ακύρωση ή τη μείωσή του. 4) Σφαιρική ανάλυση σταθερότητας και σύγκλισης των αλγορίθμων εκμάθησης. 5) Στατιστική αποδοτικότητα των αλγορίθμων εκμάθησης. 6) Βέλτιστη στρατηγική για την παράμετρο ποσοστού εκμάθησης, ειδικά σε ένα μη γεωστατικό περιβάλλον. Μια άμεση προσέγγιση για να λύσει το πρόβλημα είναι η ακόλουθη: 8

9 1) Σχεδιασμός κατάλληλων προτύπων νευρωνικών δικτύων για το αντίστροφο (χωρισμού) πρόβλημα. 2) Διατύπωση μιας κατάλληλης συνάρτησης απώλειας (που καλείται επίσης αντίθεσης, κόστους, ή συνάρτηση ενέργειας) έτσι ώστε η σφαιρική ελαχιστοποίηση ή η μεγιστοποίηση αυτής της συνάρτησης εγγυάται το σωστό χωρισμό ή την αποσυνέλιξη. Πιο συγκεκριμένα, αυτό εγγυάται τη στατιστική ανεξαρτησία των σημάτων εξόδου ή/και του χωρικού και χρονικού αποσυντονισμού των σημάτων. 3) Εφαρμογή μιας διαδικασίας βελτιστοποίησης για να παραγάγουμε τους αλγόριθμους εκμάθησης. Υπάρχουν πολλές τεχνικές βελτιστοποίησης βασισμένες στον στοχαστικό αλγόριθμο καθόδου κλίσης, όπως ο συζευγμένος αλγόριθμος κλίσης, quasi-newton μέθοδος, και ούτω καθεξής. 1.2 Εφαρμογές της ICA μεθόδου Η ανεξάρτητη ανάλυση συνιστωσών αναπτύχθηκε αρχικά για να εξετάσει τα προβλήματα που είναι στενά συνδεδεμένα στο πρόβλημα κοκτέιλ-συμβαλλόμενων μερών. Από την πρόσφατη αύξηση ενδιαφέροντος για την ICA, έχει γίνει σαφές ότι αυτή η αρχή έχει επίσης πολλές άλλες ενδιαφέρουσες εφαρμογές. Θεωρούμε, παραδείγματος χάριν, τις ηλεκτρικές καταγραφές της δραστηριότητας εγκεφάλου όπως δίνονται από ένα ηλεκτροεγκεφαλογράφημα (EEG). Το στοιχείο EEG αποτελείται από τις καταγραφές των ηλεκτρικών δυναμικών σε πολλές διαφορετικές θέσεις στο κρανίο. Αυτά τα δυναμικά παράγονται πιθανώς με τη μίξη μερικών ελλοχευόντων συνιστωσών της δραστηριότητας του εγκεφάλου. Αυτή η κατάσταση είναι αρκετά παρόμοια με το πρόβλημα κοκτέιλ-συμβαλλόμενων μερών: θα επιθυμούσαμε να βρούμε τις αρχικές συνιστώσες της δραστηριότητας του εγκεφάλου, αλλά μπορούμε μόνο να παρατηρήσουμε τα μίγματα των συνιστωσών. Η ICA μπορεί να αποκαλύψει ενδιαφέρουσες πληροφορίες για τη δραστηριότητα του εγκεφάλου δίνοντας πρόσβαση στις ανεξάρτητες συνιστώσες του. Άλλη, πολύ διαφορετική εφαρμογή της ICA είναι στην εξαγωγή χαρακτηριστικών γνωρισμάτων. Ένα θεμελιώδες πρόβλημα στην ψηφιακή επεξεργασία σήματος είναι να βρεθούν κατάλληλες απεικονίσεις για την εικόνα, τον ήχο ή άλλο είδος δεδομένων για στόχους όπως η συμπίεση και η απαλοιφή του θορύβου. Οι απεικονίσεις δεδομένων είναι συχνά βασισμένες σε (διακριτούς) γραμμικούς μετασχηματισμούς. Οι τυποποιημένοι γραμμικοί μετασχηματισμοί που χρησιμοποιούνται ευρέως στην επεξεργασία εικόνας είναι οι Fourier, Haar, μετατροπές συνημίτονου κλπ. Κάθε ένας από αυτούς έχει τις ευνοϊκές ιδιότητές του [9]. Όσον αφορά την ψηφιακή επεξεργασία ήχου, έχουμε εφαρμογή της ICA στο διαχωρισμό του χαρακτηριστικού ήχου της μηχανής αυτοκινήτου από διαστρεβλωμένες μετρήσεις. Αυτές οφείλονται τόσο στην δόνηση των κινούμενων τμημάτων της περιστρεφόμενης μηχανής όσο και σε θορύβους από το περιβάλλον που λαμβάνουν χώρα οι μετρήσεις. Ο διαχωρισμός τους πραγματοποιείται με βάση μια bilinear μορφή που είναι βασισμένη στον στιγμιαίο χωρισμό πηγής όσον αφορά την ακουστική μίξη, ενώ για την δονητική μίξη χρησιμοποιείται ο αλγόριθμος των Nguyen Thi και Jutten [33]. 9

10 1.3 Συμπεράσματα Η ICA ή BSS μέθοδος είναι μια πολύ γενικής χρήσης στατιστική τεχνική στην οποία τα παρατηρούμενα τυχαία δεδομένα μετασχηματίζονται γραμμικά στις συνιστώσες που είναι κατά το μέγιστο δυνατό τρόπο ανεξάρτητες μεταξύ τους, και ταυτόχρονα έχουν «ενδιαφέρουσες» κατανομές. Με το πέρασμα των χρόνων έχουν αναπτυχθεί διάφοροι αλγόριθμοι και τεχνικές τυφλού διαχωρισμού πηγών για την εξυπηρέτηση διαφόρων εφαρμογών. Η ανάγκη χρήσης τέτοιων μεθόδων προήλθε από εφαρμογές σε πρακτικά προβλήματα διαφόρων επιστημονικών πεδίων, μερικά από τα οποία αναφέραμε προηγουμένως. 1.4 Οργάνωση της εργασίας Η διπλωματική εργασία έχει αναπτυχθεί σε 7 κεφάλαια. Στο κεφάλαιο 1 παρουσιάζεται το πρόβλημα του τυφλού διαχωρισμού σημάτων ή αλλιώς η ανάλυση σε ανεξάρτητες συνιστώσες και ορισμένες εφαρμογές της ICA μεθόδου. Στο κεφάλαιο 2 γίνεται μια επισκόπηση στην θεωρία πιθανοτήτων που είναι η θεωρητική βάση για την κατανόηση του προβλήματος και στις στοχαστικές διαδικασίες, ενώ στο κεφάλαιο 3 δίνεται ο βασικός ορισμός του ICA προτύπου και ιδιότητες του. Στο κεφάλαιο 4 περιγράφονται διάφορες μέθοδοι που έχουν χρησιμοποιηθεί μέχρι σήμερα για την προσέγγιση του προβλήματος. Στο κεφάλαιο 5 αναλύονται τεχνικές προεπεξεργασίας των δεδομένων με σκοπό να απλοποιήσουν την εφαρμογή του αλγόριθμου επεξεργασίας σε αυτά. Στο κεφάλαιο 6 περιγράφεται ο κύριος αλγόριθμος επεξεργασίας των πειραματικών δεδομένων καθώς και τα αποτελέσματα που προκύπτουν από την εφαρμογή του σε αυτά. Τέλος, στο κεφάλαιο 7 παρουσιάζονται τα γενικά συμπεράσματα που προκύπτουν από την χρήση των μεθόδων και της εφαρμογής του αλγόριθμου στα δεδομένα. Κεφάλαιο 2 Πιθανότητες και στοχαστικές διαδικασίες 2.1 Εισαγωγή Είναι γνωστό ότι δύο κατηγορίες σημάτων: η πρώτη κατηγορία χαρακτηρίζεται από ντετερμινιστικές (αιτιοκρατικές) ακουστικές κυματώσεις, ενώ η δεύτερη χαρακτηρίζεται από στοχαστικές κυματώσεις. Σε ένα ντετερμινιστικό σήμα κάθε τιμή μπορεί να προβλεφθεί από προηγούμενες τιμές. Αντίθετα, τα στοχαστικά σήματα είναι τυχαία και δεν μπορούν να χαρακτηριστούν από μια απλή μαθηματική εξίσωση ή να προβλεφθούν επόμενες τιμές. Παραδείγματα ντετερμινιστικών και στοχαστικών κυματώσεων δίνονται στην παρακάτω εικόνα, όπου δίνονται ένα σήμα ημιτόνου και το ίδιο σήμα με τυχαίο προσθετικό θόρυβο. 10

11 Ντετερμινιστικό (ημίτονο) και στοχαστικό κυματοειδές Όπως γίνεται αντιληπτό, αυτό που μας ενδιαφέρει είναι η συλλογή τέτοιων σημάτων, παρά η μελέτη συγκεκριμένων τιμών τους. Η συλλογή τέτοιων σημάτων ονομάζεται τυχαία διαδικασία. 2.2 Χώροι Πιθανοτήτων Για τον τυπικό ορισμό της πιθανότητας θεωρούμε ένα δειγματικό χώρο S, που αποτελεί το σύνολο των αποτελεσμάτων ενός πειράματος μαζί με το κενό. Κάθε σημείο του S ονομάζεται δειγματικό σημείο και κάθε σύνολο δειγματικών σημείων ονομάζεται γεγονός. Η πιθανότητα να συμβεί το γεγονός Α ισούται με το πλήθος των ευνοϊκών αποτελεσμάτων προς το πλήθος των δυνατών αποτελεσμάτων. Προφανώς ισχύει P(s)=1 P(A) 0 Η πιθανότητα της ένωσης δύο γεγονότων Α και Β είναι PA ( B) = PA ( ) + PB ( ) PA ( B) όπου A B είναι η τομή των δυο γεγονότων. Η εξαρτημένη πιθανότητα του B, δεδομένου του A είναι PB ( A) PB ( A) PA ( ) Από τον ορισμό της εξαρτημένης πιθανότητας προκύπτει μια από τις πιο σημαντικές σχέσεις της θεωρίας πιθανοτήτων, ο νόμος του Bayes PB ( ) PA ( B) PB ( A) PA ( ) Από τον παραπάνω νόμο προκύπτει η ανεξαρτησία των ενδεχομένων Α και Β που δίνεται από τον τύπο PA ( B) = PA ( ) PB ( ) και που θα αναλυθεί πιο διεξοδικά παρακάτω. 11

12 2.3 Τυχαίες Μεταβλητές και Συνεχείς Κατανομές Μια τυχαία μεταβλητή είναι η απεικόνιση των δειγματικών σημείων από ένα δειγματικό χώρο ενός πειράματος σε μια πραγματική αριθμητική γραμμή. Μεγέθη που σχετίζονται με μια τυχαία μεταβλητή x είναι η συνάρτηση αθροιστικής κατανομής (cumulative distribution function ή CDF) F ( ) ( ' ) x' x P x x όπου Px ( ' x) είναι η πιθανότητα η τυχαία μεταβλητή x ' να είναι μικρότερη ή ίση του x και η συνάρτηση πυκνότητας πιθανότητας (probability density function ή PDF) d f x' ( x) [ Fx' ( x)] dx Η παραπάνω σχέση με το θεμελιώδες θεώρημα της αριθμητικής ανάλυσης δίνει Pa ( < x' b) = F( b) F( a) f ( ξ ) dξ x' x' x' a Σε κάθε CDF υπάρχουν κάποιες παράμετροι που περιγράφουν την μορφή της κατανομής. Κυριότερες είναι η μέση τιμή μ, η διασπορά Var και η τυπική απόκλιση σ. μ ( ) x' = x fx' x dx 2 ( ') = ( μx' ) x' ( ) Var x x f x dx σ = Var( x ') Εισάγουμε ακόμη τις έννοιες της εξαρτημένης CDF (conditional CDF) Px ( ' xd, ) Fx '( x D) P( x' x D) = PD ( ) και της εξαρτημένης PDF (conditional PDF) d f ( x D) [ F ( x D)] x' dx όπου D είναι ένα οποιοδήποτε αποτέλεσμα (γεγονός ή δειγματικό σημείο) του x με μη μηδενική πιθανότητα. x' b 2.4 Πολλαπλές Τυχαίες Μεταβλητές και Κατανομές Όταν υπάρχουν παραπάνω από δύο ανεξάρτητες μεταβλητές, για παράδειγμα οι x και y, τότε αυτές προέρχονται από διαφορετικούς δειγματικούς χώρους. Προφανώς, η από κοινού συνάρτηση αθροιστικής κατανομής (Joint CDF), θα δίνεται από τη σχέση F (, ) ( ', ' ) x' x y P x x y y όπου Px ( ' xy, ' y) είναι η πιθανότητα η τυχαία μεταβλητή x ' και y ' να είναι μικρότερη ή ίση του x και y αντίστοιχα και η από κοινού συνάρτηση πυκνότητας πιθανότητας (Joint PDF) 2 fx' ( xy, ) [ Fx' y' ( xy, )] xy 12

13 Ομοίως με τις κατανομές μιας μεταβλητής στις πολλαπλών μεταβλητών κατανομές ορίζεται η παράμετρος της μέσης τιμής E του ζεύγους μεταβλητών g(x,y), E{ g( x ', y ')} = g( x, y) f ( x, y) dxdy Για g(x,y)=x και g(x,y)=y παίρνουμε αντίστοιχα 13 xy ' ' μ (, ) x' = x fx' y' x y dx μ (, ) y' = y fx' y' x y dy Ιδιαίτερο ενδιαφέρον έχει η μέση τιμή της g(x,y)= ( x μx )( y μ y ), η οποία ονομάζεται συνδιακύμανση c x y (covariance) δίνεται από τη σχέση c = E{( x' μ )( y' μ )} = ( x' μ )( y' μ ) f ( x, y) dxdy xy ' ' x' y' x' y' xy ' ' Η συσχέτιση (correlation) μεταξύ των μεταβλητών x και y είναι r (, ) xy ' ' = x y f xy ' ' x y dxdy Η διασπορά Var( x ') και η τυπική απόκλιση σ x' δίνονται από τις σχέσεις Var( x ') = E{( x ' μ x ')} σ x' = Var( x ') Με αντίστοιχο τρόπο ορίζονται και τα Var( y ') και σ y '. Οι τυχαίες μεταβλητές x' και y ' ονομάζονται ασυσχέτιστες ή ορθογώνιες αν c xy ' ' = 0. Στις εφαρμογές έχουμε μια πληθώρα τυχαίων μεταβλητών όπως για παράδειγμα τις x ' 1, x' 2,... x ' N, τα οποία ομαδοποιούνται σε τυχαία διανύσματα x' [ x' 1, x' 2,... x' ] T N Έτσι η PDF που σχετίζεται με το διάνυσμα αυτό θα δίνεται από τη σχέση f x' ( x' 1, x' 2,... x' N) fx 1', x' 2,..., x' ( x' 1, x' 2,... x' ) N N Οι πράξεις μεταξύ των τυχαίων διανυσμάτων ακολουθούν τους νόμους της αριθμητικής των πινάκων. Επαναλαμβάνουμε ότι το εσωτερικό γινόμενο ή νόρμα του διανύσματος x' είναι N 2 T 2 x ' = x' x' = xi i= 1 Το εσωτερικό γινόμενο είναι και το ίδιο μια τυχαία μεταβλητή. Αντίθετα με το εσωτερικό, το εξωτερικό γινόμενο είναι το x ' x ' T, που δημιουργεί τον τυχαίο πίνακα, τα (i,j) στοιχεία του οποίου είναι η τυχαία μεταβλητή x i x j. Η μέση τιμή του διανύσματος είναι T μx' = Ex { '} = [ μx'... μ 1 x' ] N Για το διάνυσμα x ' ορίζεται ο πίνακας αυτοσυσχέτισης R x' (autocorrelation matrix), όπου κάθε στοιχείο του είναι η συσχέτιση των μεταβλητών x i και x j, δηλαδή ' Exx { ' ' T } Rx

14 Επίσης ορίζεται ο πίνακας συνδιακύμανσης C x' (covariance matrix), που δίνεται από τη σχέση C E{( x' μ ) ( x' μ ) T } x' x' x' 2.5 Ορισμός και θεμελιώδεις ιδιότητες της ανεξαρτησίας Για να καθορίσουμε την έννοια της ανεξαρτησίας, θεωρούμε δύο τυχαίες μεταβλητές y 1 και y 2. Βασικά, οι μεταβλητές y 1 και y 2 θεωρούνται ανεξάρτητες εάν οι πληροφορίες για την τιμή του y 1 δεν δίνουν οποιεσδήποτε πληροφορίες για την τιμή του y 2, και αντίστροφα. Αυτό συμβαίνει με τις μεταβλητές s 1, s 2 αλλά όχι με τις μεταβλητές μιγμάτων x 1, x 2. Τεχνικά, η ανεξαρτησία μπορεί να καθοριστεί από τις πυκνότητες πιθανότητας. Συμβολίζουμε με p(y 1,y 2 ) την κοινή συνάρτηση πυκνότητας πιθανότητας (pdf) των y 1 και y 2. Συμβολίζουμε επιπλέον με p 1 (y 1 ) την συνάρτηση πυκνότητας πιθανότητας του y 1, όταν είναι μόνο του: p ( y ) = p( y, y ) dy και ομοίως για το y 2. Κατόπιν ορίζουμε τα y 1 και y 2 ως ανεξάρτητα εάν και μόνο εάν η κοινή συνάρτηση πυκνότητας πιθανότητας είναι παραγοντοποιήσιμη με τον ακόλουθο τρόπο: p( y, y ) = p ( y ) p ( y ) Αυτός ο ορισμός επεκτείνεται φυσικά για οποιοδήποτε αριθμό n τυχαίων μεταβλητών, οπότε σε αυτή την περίπτωση η κοινή πυκνότητα πρέπει να είναι ένα γινόμενο n όρων, όπως παρακάτω m p() s = pj( sj) j= 1 Ο ορισμός μπορεί να χρησιμοποιηθεί για να παραγάγει μια σημαντικότερη ιδιότητα των ανεξάρτητων τυχαίων μεταβλητών. Λαμβάνοντας υπόψη τις δύο συναρτήσεις, h 1 και h 2, έχουμε πάντα Eh { ( y) h( y)} = Eh { ( y)} Eh { ( y)} Επίσης, μια πιο αδύναμη μορφή ανεξαρτησίας είναι η μη-συσχέτιση.όπως αναφέρθηκε παραπάνω, δύο τυχαίες μεταβλητές x' και y ' ονομάζονται ασυσχέτιστες αν c xy ' ' = 0,δηλαδή αν ισχύει η σχέση E{ x' y'} E{ x'} E{ y'} = 0 Εάν οι μεταβλητές είναι ανεξάρτητες, τότε είναι και ασυσχέτιστες, ενώ δεν ισχύει το αντίστροφο. Παραδείγματος χάριν, έστω ότι (y 1, y 2 ) είναι μια διακριτή εκτίμηση και ακολουθεί μια τέτοια κατανομή ώστε το ζευγάρι έχει πιθανότητα 1/4 για 14

15 οποιεσδήποτε από τις ακόλουθες τιμές: (0,1), (0, 1), (1,0), ( 1,0). Κατόπιν τα y 1 και y 2 είναι ασυσχέτιστα, αφού ισχύει E{ y1 y2} = 0 = E{ y1} E{ y2} 4 και έτσι οι μεταβλητές δεν μπορούν να είναι ανεξάρτητες. Κεφάλαιο 3 Ανάλυση Σε Ανεξάρτητες Συνιστώσες 3.1 Ορισμός της ICA Για να ορίσουμε αυστηρά την ICA ([4], [65]) υποθέτουμε ότι παρατηρούμε n γραμμικά μίγματα x 1,, x n των ανεξάρτητων συνιστωσών n x = a s + a s + + a s, για όλα τα j. j j1 1 j jn n Στο ICA μοντέλο, υποθέτουμε ότι κάθε μίγμα x j καθώς επίσης και κάθε ανεξάρτητη συνιστώσα s k είναι μια τυχαία μεταβλητή, αντί ενός κατάλληλου χρονικού σήματος. Οι παρατηρούμενες τιμές x j (t), π.χ., τα σήματα μικροφώνων στο πρόβλημα συμβαλλόμενων μερών κοκτέιλ, είναι τώρα ένα δείγμα αυτής της τυχαίας μεταβλητής. Χωρίς βλάβη της γενικότητας, μπορούμε να υποθέσουμε ότι και οι μεταβλητές μιγμάτων και οι ανεξάρτητες συνιστώσες έχουν μέση τιμή μηδέν: Εάν αυτό δεν ισχύει, τότε οι παρατηρούμενες μεταβλητές x i μπορούν πάντα να κεντροθετηθούν με την αφαίρεση του δείγματος μέσης τιμής, το οποίο κάνει το πρότυπο μηδενικού-μέσου όρου. Το ανωτέρω μοντέλο μίξης γράφεται σε μορφή πινάκων ως ακολούθως όπου Α η μήτρα με στοιχεία α ij. x=as Το ICA πρότυπο είναι ένα παραγωγικό πρότυπο, που σημαίνει ότι περιγράφει πώς τα παρατηρούμενα δεδομένα παράγονται με μια διαδικασία μίξης των συνιστωσών s i. Οι ανεξάρτητες συνιστώσες είναι αφανείς μεταβλητές, που σημαίνει ότι δεν μπορούν να παρατηρηθούν άμεσα. Επίσης η μήτρα μίξης υποτίθεται ότι είναι άγνωστη. Ό, τι παρατηρούμε είναι το τυχαίο διάνυσμα x και πρέπει να υπολογίσουμε και το Α και το s χρησιμοποιώντας το. Αυτό πρέπει να γίνει με όσο το δυνατόν γενικότερες υποθέσεις. Η αφετηρία για την ICA είναι η πολύ απλή υπόθεση ότι οι συνιστώσες s i είναι στατιστικώς ανεξάρτητες. Επίσης, για απλότητα, υποθέτουμε ότι η άγνωστη μήτρα μίξης είναι τετράγωνη. Κατόπιν, μετά τον υπολογισμό της μήτρας Α, μπορούμε να 15

16 υπολογίσουμε τον αντίστροφό της, έστω W, και να λάβουμε την ανεξάρτητη συνιστώσα απλά από τον τύπο: s=wx Σε πολλές εφαρμογές, θα ήταν ρεαλιστικότερο να υποτεθεί ότι υπάρχει κάποιος θόρυβος στις μετρήσεις ([11], [15]), το οποίο θα σήμαινε έναν προστιθέμενο όρο θορύβου στο πρότυπο. Για απλότητα, παραλείπουμε οποιουσδήποτε όρους θορύβου, δεδομένου ότι η εκτίμηση του χωρίς θόρυβο προτύπου είναι αρκετά δύσκολη από μόνη της, και φαίνεται να είναι ικανοποιητική για πολλές εφαρμογές. 3.2 Ασάφειες της ICA Στο ICA πρότυπο ισχύουν οι ακόλουθες ασάφειες: 1. Δεν μπορούμε να καθορίσουμε τις διασπορές (ενέργειες) των ανεξάρτητων συνιστωσών. Ο λόγος είναι ότι, και το s και το Α είναι άγνωστα, οποιοσδήποτε βαθμιδωτός πολλαπλασιαστής σε μία από τις πηγές s i θα μπορούσε πάντα να ακυρωθεί με τη διαίρεση της αντίστοιχης στήλης a i του A από τον ίδιο. Κατά συνέπεια, μπορούμε να διορθώσουμε αρκετά τα μεγέθη των ανεξάρτητων συνιστωσών δεδομένου ότι είναι τυχαίες μεταβλητές. Ο φυσικότερος τρόπος να γίνει αυτό είναι να υποτεθεί ότι κάθε μία έχει διασπορά μονάδα: Ε{s i 2 }=1. Κατόπιν η μήτρα A προσαρμόζεται στις ICA μεθόδους λύσης λαμβάνοντας υπόψη αυτόν τον περιορισμό. Αυτή η ασάφεια είναι, ευτυχώς, ασήμαντη στις περισσότερες εφαρμογές. 2. Δεν μπορούμε να καθορίσουμε την σειρά των ανεξάρτητων συνιστωσών. Ο λόγος είναι ότι, πάλι s και Α είναι άγνωστα. Μπορούμε ελεύθερα να αλλάξουμε την σειρά των ανεξάρτητων συνιστωσών και να καλέσουμε οποιαδήποτε από αυτές ως πρώτη. Τυπικά, μια μήτρα παραλλαγής Ρ και το αντίστροφό της μπορούν να αντικατασταθούν στο πρότυπο που δίνει x=ap -1 Ps. Τα στοιχεία των Ρs είναι οι αρχικές ανεξάρτητες μεταβλητές s j, αλλά σε άλλη σειρά. Η μήτρα ΑΡ -1 είναι ακριβώς μια νέα άγνωστη μήτρα μίξης, που λύνεται από τους αλγόριθμους ICA. 3.3 Απεικόνιση της ICA Για να παραστήσουμε το ICA πρότυπο με στατιστικούς όρους, θεωρούμε δύο ανεξάρτητες συνιστώσες που έχουν τις ακόλουθες ομοιόμορφες κατανομές: 1 αν si 3 ps ( i ) = 2 3 0αλλού Η σειρά των τιμών για αυτήν την ομοιόμορφη κατανομή επιλέχτηκε ώστε να καταστήσει το μέσο όρο μηδέν και τη διασπορά ίση με ένα, ώστε να απλοποιηθεί το 16

17 μοντέλο μίξης. Η κοινή πυκνότητα των s 1 και s 2 είναι τότε ομοιόμορφη σε ένα τετράγωνο. Αυτό προκύπτει από το βασικό ορισμό ότι η κοινή πυκνότητα δύο ανεξάρτητων μεταβλητών είναι ακριβώς το γινόμενο των ξεχωριστών πυκνοτήτων τους, δηλαδή πρέπει να υπολογίσουμε απλά το γινόμενό τους. Αναμιγνύουμε τώρα αυτές τις δύο ανεξάρτητες συνιστώσες. Έστω ότι παίρνουμε την παρακάτω μήτρα μίξης Α 0 Α 0 = Έτσι παίρνουμε δύο μεμειγμένες μεταβλητές, x 1 και x 2. Όπως φαίνεται από το παρακάτω σχήμα οι τυχαίες μεταβλητές x 1 και x 2 δεν είναι ανεξάρτητες και ένας εύκολος τρόπος να το δει κανείς αυτό είναι να εξετάσει, εάν είναι δυνατό να προβλεφθεί η τιμή μιας εξ αυτών, έστω της x 2, από την τιμή της άλλης. Σαφώς εάν η x 1 τείνει σε μια από τις μέγιστες ή ελάχιστες τιμές της, κατόπιν αυτό καθορίζει απόλυτα την τιμή της x 2. Δεν είναι επομένως ανεξάρτητες. (Για τις μεταβλητές s 1 και s 2 συμβαίνει το αντίθετο. Από το σχήμα μπορεί να φανεί ότι η γνώση της τιμής της s 1 δεν προσδιορίζει με κάποιο τρόπο την τιμή της s 2.) Το πρόβλημα του υπολογισμού του μοντέλου δεδομένων ICA είναι τώρα να υπολογιστεί η μήτρα μίξης A 0 χρησιμοποιώντας μόνο πληροφορίες που περιλαμβάνονται στα μίγματα x 1 και x 2. Αυτή η εκτίμηση μπορεί να γίνει διαισθητικά από το παρακάτω σχήμα. Οι άκρες του παραλληλογράμμου είναι στις κατευθύνσεις των στηλών του Α. Αυτό σημαίνει ότι θα μπορούσαμε, σε γενικές γραμμές, να υπολογίσουμε το ICA πρότυπο εκτιμώντας πρώτα την κοινή πυκνότητα των x 1 και x 2, και έπειτα να εντοπίζουμε τις άκρες. Έτσι, το πρόβλημα φαίνεται να έχει μια λύση. Ωστόσο, μια τέτοια μέθοδος λειτουργεί μόνο για μεταβλητές με ομοιόμορφες κατανομές και έχει πολύ υπολογιστικό φόρτο. Για αυτό ακριβώς το λόγο, αναπτύσσουμε πιο γενικές μεθόδους για την εκτίμηση του ICA προτύπου στη συνέχεια. Η κοινή κατανομή των ανεξάρτητων συνιστωσών s 1 και s 2 με ομοιόμορφες κατανομές. Οριζόντιος άξονας: s 1. Κάθετος άξονας: s 2. 17

18 Η κοινή κατανομή των παρατηρούμενων μίξεων x 1 και x 2. Οριζόντιος άξονας: x 1. Κάθετος άξονας: x Οι γκαουσσιανές μεταβλητές είναι απαγορευμένες Για να είναι δυνατή η ICA πρέπει οι ανεξάρτητες συνιστώσες να είναι μη γκαουσσιανές. Για να δούμε γιατί οι ισχύει αυτό, υποθέτουμε ότι η μήτρα μίξης είναι ορθογώνια και τα s i είναι γκαουσσιανά. Κατόπιν τα x 1 και x 2 είναι γκαουσσιανά, ασυσχέτιστα, και μοναδιαίας διασποράς. Η κοινή πυκνότητά τους δίνεται από τον τύπο x1 + x2 px ( 1, x2) = exp( ) 2π 2 Το παρακάτω σχήμα δείχνει ότι η πυκνότητα είναι απολύτως συμμετρική. Επομένως, δεν περιέχει οποιεσδήποτε πληροφορίες για τις κατευθύνσεις των στηλών της μήτρας μίξης Α. Γι αυτό η Α δεν μπορεί να υπολογιστεί και η ICA δεν έχει λύση. 18

19 Η πολυμεταβλητή κατανομή των δύο ανεξάρτητων γκαουσσιανών μεταβλητών Κεφάλαιο 4 Μέθοδοι για την εκτίμηση του ICA προτύπου 4.1 Τυφλός διαχωρισμός σημάτων χρησιμοποιώντας την ιδιότητα της μη γκαουσσιανότητας Όπως αναφέρθηκε παραπάνω, χωρίς μη γκαουσσιανότητα η εκτίμηση του ICA προτύπου δεν είναι δυνατή, αλλά αυτή η ιδιότητα είναι βασική προϋπόθεση για τον υπολογισμό του. Στο μεγαλύτερο μέρος της κλασσικής στατιστικής θεωρίας, οι τυχαίες μεταβλητές υποτίθεται ότι έχουν γκαουσσιανές κατανομές, αποκλείοντας κατά συνέπεια οποιεσδήποτε μεθόδους σχετικές με ICA. Το κεντρικό θεώρημα ορίου, ένα κλασσικό αποτέλεσμα στη θεωρία πιθανοτήτων, λέει ότι η κατανομή ενός αθροίσματος ανεξάρτητων τυχαίων μεταβλητών τείνει προς μια γκαουσσιανή κατανομή, υπό ορισμένες συνθήκες. Κατά συνέπεια, ένα άθροισμα δύο ανεξάρτητων τυχαίων μεταβλητών έχει συνήθως μια κατανομή που είναι πιο κοντά σε γκαουσσιανή από οποιεσδήποτε από τις δύο αρχικές τυχαίες μεταβλητές. Τώρα υποθέτουμε ότι το διάνυσμα δεδομένων x κατανέμεται σύμφωνα με την εξίσωση x=as, δηλαδή είναι ένα μίγμα ανεξάρτητων συνιστωσών. Για απλότητα, υποθέτουμε σε αυτό το σημείο ότι όλες οι ανεξάρτητες συνιστώσες έχουν τις ίδιες κατανομές. Για να υπολογίσουμε μία από τις ανεξάρτητες συνιστώσες, θεωρούμε T έναν γραμμικό συνδυασμό των x i που τον συμβολίζουμε με y = wx= wx i i i, όπου το w είναι ένα διάνυσμα που καθορίζεται. Εάν το w ήταν μια από τις σειρές του αντιστρόφου του Α, αυτός ο γραμμικός συνδυασμός θα ήταν πραγματικά ίσος με μία από τις ανεξάρτητες συνιστώσες. Η ερώτηση είναι τώρα: Πώς θα μπορούσαμε να χρησιμοποιήσουμε το κεντρικό θεώρημα ορίου για να καθορίσουμε το w έτσι ώστε να ήταν ίσο με μια από τις σειρές του αντιστρόφου του Α; Στην πράξη, δεν μπορούμε να καθορίσουμε ένα τέτοιο w ακριβώς, επειδή δεν έχουμε καμία γνώση της μήτρας Α, αλλά μπορούμε να βρούμε έναν εκτιμητή που δίνει μια καλή προσέγγιση. Για να δούμε πώς αυτό οδηγεί στη βασική αρχή της ICA εκτίμησης, κάνουμε μια T αλλαγή των μεταβλητών, καθορίζοντας z = A w. Κατόπιν έχουμε T T T y = wx= was= zs. Το y είναι έτσι ένας γραμμικός συνδυασμός των s i, με βάρη που δίνονται από τα z i. Δεδομένου ότι ένα άθροισμα ακόμη και δύο ανεξάρτητων T τυχαίων μεταβλητών είναι πιο γκαουσσιανό από τις αρχικές μεταβλητές, το z s είναι πιο γκαουσσιανό από οποιαδήποτε από τα s i και γίνεται λιγότερο γκαουσσιανό όταν είναι ίσο με ένα από τα s i. Σε αυτήν την περίπτωση, προφανώς μόνο ένα από τα στοιχεία z i του z είναι διαφορετικό από το μηδέν. (Τα s i υποτίθεται ότι εδώ είχαν τις ίδιες κατανομές.) 19

20 Επομένως, θα μπορούσαμε να πάρουμε ως w ένα διάνυσμα που μεγιστοποιεί την T μη γκαουσσιανότητα του w x. Ένα τέτοιο διάνυσμα θα αντιστοιχούσε απαραιτήτως T T σε ένα z που έχει μόνο μία μη μηδενική συνιστώσα. Αυτό σημαίνει ότι το wx= zs είναι ίσο με μία από τις ανεξάρτητες συνιστώσες! T Η μεγιστοποίηση της μη γκαουσσιανότητας του w x μας δίνει μία από τις ανεξάρτητες συνιστώσες. Στην πραγματικότητα, το γράφημα βελτιστοποίησης για την μη γκαουσσιανότητα στο n-διάστατο χώρο των διανυσμάτων w έχει 2n τοπικά μέγιστα, δύο για κάθε ανεξάρτητη συνιστώσα, που αντιστοιχεί στο s i και s i. Για να βρούμε διάφορες ανεξάρτητες συνιστώσες, πρέπει να βρούμε όλα αυτά τα τοπικά μέγιστα. Αυτό δεν είναι δύσκολο, επειδή οι διαφορετικές ανεξάρτητες συνιστώσες είναι ασυσχέτιστες. Ως εκ τούτου μπορούμε πάντα να περιορίσουμε την αναζήτηση στο διάστημα που δίνει εκτιμήσεις ασυσχέτιστες με τις προηγούμενες. Αυτό αντιστοιχεί σε ορθογωνοποίηση σε ένα κατάλληλα μετασχηματισμένο (δηλ. λευκασμένο) διάστημα. 4.2 Μέτρα για την εκτίμηση της μη γκαουσσιανότητας Για να χρησιμοποιήσουμε την μη γκαουσσιανότητα στην ICA εκτίμηση, πρέπει να έχουμε ένα ποσοτικό μέτρο της μη γκαουσσιανότητας μιας τυχαίας μεταβλητής, έστω y. Για να απλοποιήσουμε τα πράγματα, υποθέτουμε ότι το y είναι κεντροθετημένο (μηδενικός μέσος όρος) και έχει διασπορά ίση με ένα Κύρτωση Το κλασσικό μέτρο της μη γκαουσσιανότητας είναι η κύρτωση ή cumulant τέταρτης-τάξης. Η κύρτωση του y καθορίζεται κλασσικά από τον τύπο: kurt( y) = E{ y } 3( E{ y }) Πραγματικά, δεδομένου ότι υποθέσαμε ότι το y έχει διασπορά μονάδα, η δεξιά 4 πλευρά απλοποιείται στο E{ y } 3. Αυτό δείχνει ότι η κύρτωση είναι απλά μια 4 ομαλοποιημένη έκδοση της τέταρτης στιγμής E{ y }. Για ένα γκαουσσιανό y, η 2 2 τέταρτη στιγμή είναι ίση με 3( E{ y }). Κατά συνέπεια, η κύρτωση είναι μηδέν για μια γκαουσσιανή τυχαία μεταβλητή. Για τις περισσότερες (αλλά όχι όλες) τις μη γκαουσσιανές τυχαίες μεταβλητές, η κύρτωση είναι διάφορη του μηδενός. Η κύρτωση μπορεί να είναι θετική ή αρνητική. Οι τυχαίες μεταβλητές που έχουν αρνητική κύρτωση καλούνται υπό-γκαουσσιανές, και εκείνες με θετική κύρτωση καλούνται υπέρ-γκαουσσιανές. Στη στατιστική βιβλιογραφία, οι αντίστοιχες εκφράσεις platykurtic και leptokurtic χρησιμοποιούνται επίσης. Οι υπέργκαουσσιανές τυχαίες μεταβλητές έχουν χαρακτηριστικά μία «ακιδωτή» σ.π.π με βαριές ουρές, δηλ. η σ.π.π είναι σχετικά μεγάλη στο μηδέν και στις μεγάλες τιμές της μεταβλητής, ενώ είναι μικρή για τις ενδιάμεσες τιμές. Ένα χαρακτηριστικό παράδειγμα είναι η κατανομή Laplace της οποίας η σ.π.π (κανονικοποιημένη σε μοναδιαία διασπορά) δίνεται από τον τύπο: 20

21 1 p( y) = exp( 2 y) 2 Αυτή η σ.π.π απεικονίζεται στο παρακάτω σχήμα. Η συνάρτηση πυκνότητας της κατανομής Laplace, που είναι μια τυπική υπέργκαουσσιανή κατανομή. Για σύγκριση, η γκαουσσιανή πυκνότητα δίνεται από την διακεκομμένη γραμμή. Και οι δύο πυκνότητες είναι κανονικοποιημένες σε μοναδιαία διασπορά. Οι υπό-γκαουσσιανές τυχαίες μεταβλητές, αφετέρου, έχουν χαρακτηριστικά μια «επίπεδη» σ.π.π, η οποία είναι μάλλον σταθερή κοντά στο μηδέν, και πολύ μικρή για μεγαλύτερες τιμές της μεταβλητής. Χαρακτηριστικά η μη γκαουσσιανότητα μετριέται από την απόλυτη τιμή της κύρτωσης. Το τετράγωνο της κύρτωσης μπορεί επίσης να χρησιμοποιηθεί. Αυτό είναι μηδέν για μια γκαουσσιανή μεταβλητή, και μεγαλύτερο από μηδέν για περισσότερες μη γκαουσσιανές τυχαίες μεταβλητές. Υπάρχουν μη γκαουσσιανές τυχαίες μεταβλητές που έχουν κύρτωση μηδέν, αλλά μπορούν να θεωρηθούν πολύ σπάνιες. Η κύρτωση, ή μάλλον η απόλυτη τιμή της, έχει χρησιμοποιηθεί ευρέως ως μέτρο μη γκαουσσιανότητας στην ICA και σε σχετικά πεδία. Ο κύριος λόγος είναι η απλότητά της, και υπολογιστική και θεωρητική. Υπολογιστικά, η κύρτωση μπορεί να υπολογιστεί απλά με τη χρησιμοποίηση τις τέταρτης στιγμής των δειγμάτων δεδομένων. Η θεωρητική ανάλυση απλοποιείται λόγω τις ακόλουθης ιδιότητας γραμμικότητας. Εάν x 1 και x 2 είναι δύο ανεξάρτητες τυχαίες μεταβλητές, ισχύει ότι και kurt( x + x ) = kurt( x ) + kurt( x ) kurt( ax ) = a kurt( x ) όπου το α είναι βαθμιδωτό μέγεθος. Αυτές οι ιδιότητες μπορούν να αποδειχθούν. Για να επεξηγήσουμε με ένα απλό παράδειγμα πώς μοιάζει το γράφημα βελτιστοποίησης για την κύρτωση, και πώς οι ανεξάρτητες συνιστώσες θα μπορούσαν να βρεθούν από την ελαχιστοποίηση ή τη μεγιστοποίηση τις κύρτωσης, τις εξετάσουμε το 2- διάστατο 21

22 πρότυπο x=as. Υποθέτουμε ότι οι ανεξάρτητες συνιστώσες s 1, s 2 έχουν τιμές κύρτωσης kurt( s 1), kurt( s 2), αντίστοιχα, και οι δύο διαφορετικές από το μηδέν. Υποθέτουμε ότι έχουμε μοναδιαίες διασπορές για τα s 1, s 2. Ψάχνουμε για μία από τις T ανεξάρτητες συνιστώσες της y = wx. T Κάνουμε πάλι το μετασχηματισμό z = A w. Κατόπιν έχουμε T T T y = w x = w As = z s = z1s1+ z2s2. Τώρα, με βάση την προσθετική ιδιότητα τις 4 4 κύρτωσης, έχουμε kurt( y) = kurt( z s ) + kurt( z s ) = z kurt( s ) + z kurt( s ) Αφετέρου, κάναμε τον περιορισμό ότι η διασπορά του y είναι ίση με 1, βασισμένοι στην ίδια υπόθεση σχετικά με τα s 1, s 2. Αυτό υπονοεί έναν περιορισμό στο z: E{ y } = z1 + z2 = 1. Γεωμετρικά, αυτό σημαίνει ότι το διάνυσμα z είναι περιορισμένο στον μοναδιαίο κύκλο στο 2-διάστατο χώρο. Το πρόβλημα βελτιστοποίησης είναι 4 4 τώρα: που είναι τα μέγιστα τις συνάρτησης kurt( y) = z1kurt( s1) + z2kurt( s2) στον μοναδιαίο κύκλο; Για απλότητα, μπορούμε να θεωρήσουμε ότι η κύρτωση είναι του ίδιου πρόσημου, οπότε σε αυτή την περίπτωση οι απόλυτης τιμής τελεστές μπορούν να παραλειφθούν. Η γραφική παράσταση της συνάρτησης είναι το «γράφημα βελτιστοποίησης» για το πρόβλημα. Είναι εύκολο να αντιληφθεί κανείς [6], ότι τα μέγιστα είναι στα σημεία όπου ακριβώς ένα από τα στοιχεία του διανύσματος z είναι μηδέν και τα άλλα διαφορετικά από το μηδέν λόγω του περιορισμού του μοναδιαίου κύκλου, τα διαφορετικά από το μηδέν στοιχεία πρέπει να είναι ίσα με 1 ή -1. Αλλά αυτά τα σημεία είναι ακριβώς αυτά όταν το y είναι ίσο με μία από τις ανεξάρτητες συνιστώσες ±s i, και το πρόβλημα έχει λυθεί. Στην πράξη θα αρχίζαμε από κάποιο διάνυσμα βάρους w, θα υπολογίζαμε την T κατεύθυνση στην οποία η κύρτωση του y = wx αυξάνεται εντονότερα (εάν η κύρτωση είναι θετική) ή μειώνεται εντονότερα (εάν η κύρτωση είναι αρνητική) βασισμένοι στο διαθέσιμο δείγμα x(1),..., xt ( ) του διανύσματος μιγμάτων x, και θα χρησιμοποιούσαμε μια μέθοδο βάθμωσης ή μια από τις επεκτάσεις της για την εύρεση του νέου διανύσματος w. Το παράδειγμα μπορεί να γενικευτεί για αυθαίρετες διαστάσεις, που δείχνουν ότι η κύρτωση μπορεί θεωρητικά να χρησιμοποιηθεί ως κριτήριο βελτιστοποίησης για το ICA πρόβλημα. Εντούτοις, η κύρτωση έχει μερικά μειονεκτήματα στην πράξη, όταν πρέπει η τιμή της να υπολογιστεί από ένα μετρημένο δείγμα [10]. Η τιμή της μπορεί να εξαρτηθεί μόνο από τις παρατηρήσεις στις ουρές της κατανομής, οι οποίες μπορεί να είναι λανθασμένες ή άσχετες παρατηρήσεις. Με άλλα λόγια, η κύρτωση δεν είναι ένα γερό μέτρο της μη γκαουσσιανότητας. Κατά συνέπεια, άλλα μέτρα της μη γκαουσσιανότητας μπορεί να είναι καλύτερα από την κύρτωση σε τέτοιες καταστάσεις. Παρακάτω θα θεωρήσουμε την negentropy της οποίας οι ιδιότητες είναι μάλλον αντίθετες από εκείνες της κύρτωσης, και θα εισάγουμε τελικά της προσεγγίσεις negentropy που συνδυάζουν λίγο πολύ τις καλές ιδιότητες και των δύο μέτρων. 22

23 4.2.2 Negentropy Ένα δεύτερο πολύ σημαντικό μέτρο τις μη γκαουσσιανότητας δίνεται από το negentropy. Το Negentropy είναι βασισμένο στην πληροφορία-θεωρητική ποσότητα της (διαφορικής) εντροπίας. Η εντροπία είναι η βασική ιδέα της θεωρίας πληροφοριών. Η εντροπία μιας τυχαίας μεταβλητής μπορεί να ερμηνευθεί ως ο βαθμός των πληροφοριών που η παρατήρηση της μεταβλητής δίνει. Όσο πιο «τυχαία», δηλ. απρόβλεπτη και μη δομημένη είναι η μεταβλητή, τόσο μεγαλύτερη η εντροπία της. Πιο αυστηρά, η εντροπία είναι στενά συνδεδεμένη στο μήκος κωδικοποίησης της τυχαίας μεταβλητής, στην πραγματικότητα, με τις απλοποιημένες υποθέσεις, η εντροπία είναι το μήκος κωδικοποίησης της τυχαίας μεταβλητής. Για μια εισαγωγή στην θεωρία πληροφοριών ([5], [23]). Η εντροπία H καθορίζεται για μια διακριτή τυχαία μεταβλητή Y ως H( y) = P( Y = a )log P( Y = a ) i όπου τα α i είναι οι πιθανές τιμές του Y. Αυτός ο πολύ γνωστός ορισμός μπορεί να γενικευτεί για συνεχώς-εκτιμημένες τυχαίες μεταβλητές και διανύσματα, οπότε σε αυτή την περίπτωση καλείται συχνά διαφορική εντροπία. Η διαφορική εντροπία Η ενός τυχαίου διανύσματος y με πυκνότητα f(y) ([5], [23]) ορίζεται ως H ( y) = f( y)log f( y) dy Ένα θεμελιώδες αποτέλεσμα της θεωρίας πληροφοριών είναι ότι μια γκαουσσιανή μεταβλητή έχει τη μεγαλύτερη εντροπία μεταξύ όλων των τυχαίων μεταβλητών της ίσης διασποράς ([5],[23]). Αυτό σημαίνει ότι η εντροπία θα μπορούσε να χρησιμοποιηθεί ως μέτρο μη γκαουσσιανότητας. Στην πραγματικότητα, αυτό δείχνει ότι η γκαουσσιανή κατανομή είναι «η πιο τυχαία» ή η πιο ελάχιστα δομημένη από όλες τις κατανομές. Η εντροπία είναι μικρή για τις κατανομές που συγκεντρώνονται σαφώς σε ορισμένες τιμές, δηλ., όταν η μεταβλητή είναι σαφώς συγκεντρωμένη, ή έχει μια σ.π.π που είναι πολύ «ακιδωτή». Για να λάβουμε ένα μέτρο της μη γκαουσσιανότητας που είναι μηδέν για μια γκαουσσιανή μεταβλητή και πάντα μη αρνητικό, συχνά χρησιμοποιούμε μία ελαφρώς τροποποιημένη έκδοση του καθορισμού της διαφορικής εντροπίας, αποκαλούμενη ως negentropy. Το Negentropy J καθορίζεται ως εξής J( y) = H( y ) H( y) 23 i gauss όπου y gauss είναι μια γκαουσσιανή τυχαία μεταβλητή της ίδιας μήτρας συνδιασποράς με το y. Λόγω των προαναφερθεισών ιδιοτήτων, negentropy είναι πάντα μη αρνητική, και είναι μηδέν εάν και μόνο εάν το y έχει μια γκαουσσιανή κατανομή. Το Negentropy έχει την πρόσθετη ενδιαφέρουσα ιδιότητα ότι είναι αμετάβλητο για τους αντιστρέψιμους γραμμικούς μετασχηματισμούς ([4], [17]). Το πλεονέκτημα της χρήσης της negentropy, ή, ισοδύναμα, διαφορικής εντροπίας, ως μέτρο της μη γκαουσσιανότητας είναι ότι αιτιολογείται καλά από τη στατιστική i

24 θεωρία. Στην πραγματικότητα, negentropy είναι υπό κάποια έννοια ο βέλτιστος εκτιμητής της μη γκαουσσιανότητας, όσον αφορά στις στατιστικές ιδιότητες. Το πρόβλημα στη χρήση της negentropy είναι, εντούτοις, ότι είναι υπολογιστικά πολύ δύσκολη. Ο υπολογισμός της negentropy χρησιμοποιώντας τον ορισμό θα απαιτούσε μια εκτίμηση (ενδεχομένως μη παραμετρική) της σ.π.π. Επομένως, απλούστερες προσεγγίσεις της negentropy είναι πολύ χρήσιμες, όπως θα συζητηθεί παρακάτω Προσεγγίσεις του negentropy Η εκτίμηση του negentropy είναι δύσκολη, όπως αναφέρθηκε ανωτέρω, και επομένως αυτή η συνάρτηση αντίθεσης παραμένει κυρίως θεωρητική. Στην πράξη, κάποια προσέγγιση πρέπει να χρησιμοποιηθεί. Εδώ εισάγουμε προσεγγίσεις που έχουν πολύ ελπιδοφόρες ιδιότητες, και που θα χρησιμοποιηθούν στο εξής για να παραγάγουν μια αποδοτική μέθοδο για ICA. Η κλασσική μέθοδος της προσεγγιστικής negentropy χρησιμοποιεί τις στιγμές υψηλής-τάξης, παραδείγματος χάριν ([19]) ως εξής 1 1 J( y) E{ y } + kurt( y) Η τυχαία μεταβλητή y υποτίθεται ότι ήταν μηδενικής μέσης τιμής και μοναδιαίας διασποράς. Εντούτοις, η ισχύς τέτοιων προσεγγίσεων μπορεί να περιοριστεί μάλλον. Ειδικότερα, αυτές οι προσεγγίσεις πάσχουν από τη μη ευρωστία που αντιμετωπίζεται με την κύρτωση. Για να αποφευχθούν τα προβλήματα που αντιμετωπίστηκαν με τις προηγούμενες προσεγγίσεις του negentropy, νέες προσεγγίσεις αναπτύχθηκαν [12]. Τέτοιες προσεγγίσεις βασίστηκαν στην αρχή μέγιστης-εντροπίας. Γενικά λαμβάνουμε την ακόλουθη προσέγγιση p J( y) k[ E{ G ( y)} E{ G ( v)}] i= 1 i i i όπου k i είναι μερικές θετικές σταθερές, και ν είναι μια γκαουσσιανή μεταβλητή μηδενικής μέσης τιμής και μοναδιαίας διασποράς. Η μεταβλητή y υποτίθεται ότι είναι μηδενικής μέσης τιμής και μοναδιαίας διασποράς, και οι συναρτήσεις G i είναι μερικές μη τετραγωνικές συναρτήσεις [12]. Ακόμη και σε περιπτώσεις όπου αυτή η προσέγγιση δεν είναι πολύ ακριβής, μπορεί να χρησιμοποιηθεί για να κατασκευάσει ένα μέτρο μη γκαουσσιανότητας που είναι συνεπές υπό την έννοια ότι είναι πάντα μη αρνητικό, και ίσο με μηδέν εάν το y έχει μια γκαουσσιανή κατανομή. Στην περίπτωση που χρησιμοποιούμε μόνο μια μη τετραγωνική συνάρτηση G, η προσέγγιση γίνεται J( y) [ E{ G( y)} E{ G( v)}]

25 για σχεδόν οποιοδήποτε μη-τετραγωνική συνάρτηση G. Αυτό είναι σαφώς μια γενίκευση της προηγούμενης περίπτωσης, εάν το y είναι συμμετρικό. Πράγματι, θεωρώντας G(y)=y 4 παίρνουμε μια βασισμένη στην κύρτωση προσέγγιση. Αλλά το αξιοσημείωτο εδώ είναι ότι επιλέγοντας το G σοφά, το ένα λαμβάνει τις προσεγγίσεις του negentropy που είναι πολύ καλύτερες. Ειδικότερα, επιλέγοντας το G που δεν αυξάνεται πάρα πολύ γρήγορα, το ένα λαμβάνει πιο γερούς εκτιμητές. Οι ακόλουθες επιλογές του G έχουν αποδειχθεί πολύ χρήσιμες: 1 2 G ( u) = logcosh au, G ( ) exp( u ) 2 u = a1 όπου 1 α 1 2 είναι κάποια κατάλληλη σταθερά. Κατά συνέπεια λαμβάνουμε τις προσεγγίσεις του negentropy που δίνουν έναν πολύ καλό συμβιβασμό μεταξύ των ιδιοτήτων των δύο κλασσικών μέτρων μη γκαουσσιανότητας που δίνονται από κύρτωση και negentropy. Είναι εννοιολογικά απλοί, γρήγοροι να υπολογιστούν, ακόμα έχουν ελκυστικές στατιστικές ιδιότητες, ειδικά ευρωστία. Επομένως, θα χρησιμοποιήσουμε αυτές τις συναρτήσεις αντίθεσης στις ICA μεθόδους μας. Δεδομένου ότι η κύρτωση μπορεί να εκφραστεί σε αυτό το ίδιο πλαίσιο, μπορεί ακόμα να χρησιμοποιηθεί από τις ICA μεθόδους μας. 4.3 Ελαχιστοποίηση των αμοιβαίων πληροφοριών Μια άλλη προσέγγιση για την ICA εκτίμηση, που εμπνέεται από τη θεωρία πληροφοριών, είναι η ελαχιστοποίηση των αμοιβαίων πληροφοριών. Θα εξηγήσουμε αυτήν την προσέγγιση εδώ, και θα δείξουμε ότι οδηγεί στην ίδια αρχή εύρεσης περισσότερων μη γκαουσσιανών κατευθύνσεων όπως περιγράφηκε ανωτέρω. Ειδικότερα, αυτή η προσέγγιση δίνει μια πιο αυστηρή αιτιολόγηση για τις αρχές που χρησιμοποιήθηκαν παραπάνω Αμοιβαίες πληροφορίες Χρησιμοποιώντας την έννοια της διαφορικής εντροπίας, καθορίζουμε τις αμοιβαίες πληροφορίες I μεταξύ m (βαθμιδωτών) τυχαίων μεταβλητών, y i, i=1 m ως εξής I ( y, y,..., y ) = H( y ) H( y) 1 2 m Οι αμοιβαίες πληροφορίες είναι ένα φυσικό μέτρο της εξάρτησης μεταξύ των τυχαίων μεταβλητών. Στην πραγματικότητα, είναι ισοδύναμο με την γνωστή απόκλιση kullback-leibler μεταξύ της κοινής πυκνότητας f(y) και του γινομένου των οριακών πυκνοτήτων του, ένα πολύ φυσικό μέτρο για την ανεξαρτησία. Είναι πάντα μη αρνητικό, και μηδέν εάν και μόνο εάν οι μεταβλητές είναι στατιστικώς ανεξάρτητες. Κατά συνέπεια, οι αμοιβαίες πληροφορίες λαμβάνουν υπόψη ολόκληρη m i= 1 i 25

26 τη δομή εξάρτησης των μεταβλητών, και όχι μόνο τη συνδιασπορά, όπως η PCA και σχετικές μέθοδοι. Οι αμοιβαίες πληροφορίες μπορούν να ερμηνευθούν με τη χρησιμοποίηση της ερμηνείας της εντροπίας ως μήκος κώδικα. Οι όροι H(y i ) δίνουν τα μήκη των κωδίκων για το y i όταν αυτά κωδικοποιούνται χωριστά, και το H(y) δίνει το μήκος κώδικα όταν το y κωδικοποιείται ως τυχαίο διάνυσμα, δηλ. όλες οι συνιστώσες κωδικοποιούνται στον ίδιο κώδικα. Οι αμοιβαίες πληροφορίες παρουσιάζουν έτσι ποιά μείωση μήκους κώδικα λαμβάνεται με την κωδικοποίηση ολόκληρου του διανύσματος αντί των χωριστών συνιστωσών. Γενικά, καλύτεροι κώδικες μπορούν να ληφθούν με την κωδικοποίηση ολόκληρου του διανύσματος. Εντούτοις, εάν τα y i είναι ανεξάρτητα, δεν δίνουν καμία πληροφορία το ένα για το άλλο, και κάποιο θα μπορούσε εξ ίσου καλά να κωδικοποιήσει τις μεταβλητές χωριστά χωρίς να αυξάνει το μήκος κώδικα. Μια σημαντική ιδιότητα των αμοιβαίων πληροφοριών ([5], [23]) είναι ότι έχουμε για έναν αντιστρέψιμο γραμμικό μετασχηματισμό y=wx: I( y, y,..., y ) = H( y ) H( x) log detw 1 2 n i Τώρα, εξετάζουμε τι συμβαίνει εάν περιορίσουμε τα y i για να είναι ασύνδετα και μοναδιαίας διασποράς. Αυτό σημαίνει ότι T T T E{ yy } = WE{ xx } W = I, το οποίο υπονοεί det I = 1 = (det WE{ xx T } W T ) = (det W)(det E{ xx T })(det W T ) και αυτό υπονοεί ότι το detw πρέπει να είναι σταθερό. Επιπλέον, για το y i της μοναδιαίας διασποράς, η εντροπία και negentropy διαφέρουν μόνο από μια σταθερά, και το πρόσημο. Κατά συνέπεια λαμβάνουμε, I( y, y,..., y ) C J( y ) 1 2 n i = όπου C είναι μια σταθερά που δεν εξαρτάται από το W. Αυτό παρουσιάζει την θεμελιώδη σχέση μεταξύ negentropy και αμοιβαίων πληροφοριών. i i Προσδιορισμός ICA από τις αμοιβαίες πληροφορίες Δεδομένου ότι οι αμοιβαίες πληροφορίες είναι η φυσική πληροφορία-θεωρητικό μέτρο της ανεξαρτησίας των τυχαίων μεταβλητών, θα μπορούσαμε να το χρησιμοποιήσουμε ως κριτήριο για την εύρεση του μετασχηματισμού ICA. Σε αυτήν την προσέγγιση που είναι μια εναλλακτική προσέγγιση στην εκτίμηση του προτύπου, ορίζουμε την ICA ενός τυχαίου διανύσματος x ως έναν αντιστρέψιμο μετασχηματισμό, όπου η μήτρα W ορίστηκε έτσι ώστε οι αμοιβαίες πληροφορίες των μετασχηματισμένων συνιστωσών s i να ελαχιστοποιούνται. Είναι τώρα προφανές ότι το να βρούμε αντιστρέψιμο μετασχηματισμό W που ελαχιστοποιεί τις αμοιβαίες πληροφορίες είναι κατά προσέγγιση ισοδύναμο με την εύρεση των κατευθύνσεων στις οποίες το negentropy μεγιστοποιείται. Ακριβέστερα, είναι κατά προσέγγιση ισοδύναμο με την εύρεση 1-D υποδιαστημάτων έτσι ώστε οι 26

27 προβολές σε εκείνα τα υποδιαστήματα να έχουν μέγιστο negentropy. Από τα παραπάνω φαίνεται ότι η ICA εκτίμηση από την ελαχιστοποίηση των αμοιβαίων πληροφοριών είναι ισοδύναμη με τη μεγιστοποίηση του αθροίσματος των μη γκαουσσιανοτήτων των εκτιμήσεων, όταν οι εκτιμήσεις περιορίζονται για να είναι ασυσχέτιστες. Ο περιορισμός της μη συσχέτισης δεν είναι στην πραγματικότητα απαραίτητος, αλλά απλοποιεί τους υπολογισμούς αρκετά. 4.4 Εκτίμηση μέγιστης πιθανότητας Η πιθανότητα Μια πολύ δημοφιλής προσέγγιση για τον υπολογισμό του ICA προτύπου είναι εκτίμηση μέγιστης πιθανότητας, η οποία συνδέεται πολύ με την αρχή infomax. Εδώ συζητάμε αυτήν την προσέγγιση, και δείχνουμε ότι είναι ουσιαστικά ισοδύναμη με την ελαχιστοποίηση των αμοιβαίων πληροφοριών. Είναι δυνατό να σχηματισθεί άμεσα η πιθανότητα στο χωρίς θόρυβο ICA πρότυπο [28], και υπολογίζει έπειτα το πρότυπο με μια μέθοδο μέγιστης πιθανότητας. Συμβολίζοντας με W=(w 1,, w n ) T την μήτρα Α -1, η λογαριθμική-πιθανότητα λαμβάνει τη μορφή ([28]) T n T L = log f ( w x( t)) + T log detw t= 1 i= 1 i i όπου τα f i είναι οι συναρτήσεις πυκνότητας των s i (που υποτίθεται ότι εδώ ήταν γνωστά), και τα x(t), t=1,,t είναι οι πραγματοποιήσεις του x. Ο όρος log detw στην πιθανότητα προέρχεται από τον κλασικό κανόνα για (γραμμικώς) μετασχηματισμένες τυχαίες μεταβλητές και τις πυκνότητές τους [23]. Γενικά, για οποιοδήποτε τυχαίο διάνυσμα x με πυκνότητα p x και για οποιαδήποτε μήτρα W, η πυκνότητα του y=wx δίνεται από το px( Wx) detw Η αρχή Infomax Μια άλλη σχετική συνάρτηση αντίθεσης προήλθε από μια επισκόπηση των νευρωνικών δικτύων ([1], [22]). Αυτό βασίστηκε στη μεγιστοποίηση της εντροπίας εξόδου (ή της ροής πληροφοριών) ενός νευρωνικού δικτύου με μη γραμμικές εξόδους. Υποθέτουμε ότι το x είναι η είσοδος στο νευρωνικό δίκτυο του οποίου οι T έξοδοι είναι της μορφής φ i( wx i ), όπου τα φi είναι μερικές μη γραμμικές βαθμιδωτές συναρτήσεις, και τα w i είναι τα διανύσματα βάρους των νευρώνων. Έπειτα θέλουμε να μεγιστοποιήσουμε την εντροπία των εξόδων: T L = H( φ ( w x),..., φ ( w x)) T Εάν τα φ i είναι καλώς επιλεγμένα, αυτό το πλαίσιο επιτρέπει επίσης την εκτίμηση του ICA προτύπου. Πράγματι, διάφοροι συγγραφείς, απέδειξαν το εκπληκτικό 27 n n

28 αποτέλεσμα ότι η αρχή της μεγιστοποίησης της εντροπίας δικτύων, ή «infomax», είναι ισοδύναμη με την εκτίμηση μέγιστης πιθανότητας ([2], [24]). Αυτή η ισοδυναμία απαιτεί ότι τα μη γραμμικά φi που χρησιμοποιούνται στο νευρικό δίκτυο επιλέγονται ως οι συναρτήσεις συσσωρευτικής κατανομής που αντιστοιχούν στις πυκνότητες f i, δηλ., φ ' ι (.) = f i (.) Σύνδεση με αμοιβαίες πληροφορίες Για να δούμε τη σύνδεση μεταξύ της πιθανότητας και των αμοιβαίων πληροφοριών, θεωρούμε την προσδοκία της log-πιθανότητας: n 1 { } {log ( T E L = E f w x )} + log det W T i= 1 Ουσιαστικά, εάν τα f i ήταν ίσα με τις πραγματικές κατανομές του όρος θα ήταν ίσος με T H ( w x i ). i i i T wx, i ο πρώτος Ουσιαστικά, στην πράξη η σύνδεση είναι ακόμα ισχυρότερη. Αυτό ισχύει επειδή στην πράξη δεν ξέρουμε τις κατανομές των ανεξάρτητων συνιστωσών. Μια λογική προσέγγιση θα ήταν να υπολογιστεί η πυκνότητα του wx ως τμήμα της ML μεθόδου εκτίμησης και να χρησιμοποιηθεί αυτή ως προσέγγιση της πυκνότητας των s i. Σε αυτήν την περίπτωση, η μέγιστη πιθανότητα και οι αμοιβαίες πληροφορίες είναι, για όλους τους πρακτικούς σκοπούς, ισοδύναμες. Εντούτοις, υπάρχει μια μικρή διαφορά που μπορεί να είναι πολύ σημαντική στην πράξη. Το πρόβλημα με την εκτίμηση μέγιστης πιθανότητας είναι ότι οι πυκνότητες f i πρέπει να υπολογιστούν σωστά. Δεν χρειάζονται να υπολογιστούν με οποιαδήποτε μεγάλη ακρίβεια: στην πραγματικότητα είναι αρκετό να υπολογιστεί εάν είναι υπό- ή υπέρ-γκαουσσιανές ([3], [21], [26]). Σε αυτές τις περιπτώσεις, στην πραγματικότητα, έχουμε αρκετή προγενέστερη γνώση σχετικά με τους ανεξάρτητες συνιστώσες, και δεν χρειάζεται να υπολογίσουμε τη φύση τους από τα δεδομένα. Εν πάση περιπτώσει, εάν οι πληροφορίες στη φύση των ανεξάρτητων συνιστωσών δεν είναι σωστή, η ML εκτίμηση θα δώσει εντελώς λανθασμένα αποτελέσματα. Κάποια προσοχή πρέπει να ληφθεί με την ML εκτίμηση, επομένως. Αντίθετα, χρησιμοποιώντας λογικά μέτρα μη γκαουσσιανότητας, αυτό το πρόβλημα δεν προκύπτει συνήθως. T i 4.5 ICA και αναζήτηση προβολής Είναι ενδιαφέρον να σημειωθεί πώς η προσέγγισή μας στην ICA καθιστά σαφή τη σύνδεση μεταξύ ICA και αναζήτησης προβολής. Η αναζήτηση προβολής ([7], [8], [10], [19]) είναι μια τεχνική που αναπτύσσεται στην στατιστική για την εύρεση των «ενδιαφερουσών» προβολών των πολυδιάστατων δεδομένων. Τέτοιες προβολές μπορούν έπειτα να χρησιμοποιηθούν για τη βέλτιστη απεικόνιση των δεδομένων, και για τέτοιους σκοπούς όπως η εκτίμηση πυκνότητας και η απόκλιση. Στη βασική αναζήτηση προβολής (1D), προσπαθούμε να βρούμε κατευθύνσεις έτσι ώστε οι 28

29 προβολές των στοιχείων σε εκείνες τις κατευθύνσεις να έχουν ενδιαφέρουσες κατανομές, δηλαδή να επιδείξουν κάποια δομή. Έχει υποστηριχτεί ([10], [19]) ότι η γκαουσσιανή κατανομή είναι η λιγότερο ενδιαφερόμενη, και ότι οι πιο ενδιαφέρουσες κατευθύνσεις είναι εκείνες που παρουσιάζουν λιγότερη γκαουσσιανή κατανομή. Αυτό είναι ακριβώς αυτό που κάνουμε για να υπολογίσουμε το ICA πρότυπο. Η χρησιμότητα της εύρεσης τέτοιων προβολών μπορεί να φανεί στο παρακάτω σχήμα, όπου η προβολή στην κατεύθυνση αναζήτησης προβολής, που είναι οριζόντια, παρουσιάζει σαφώς συγκεντρωμένη δομή των δεδομένων. Η προβολή στην πρώτη κύρια συνιστώσα (κάθετη), αφετέρου, αποτυγχάνει να παρουσιάσει αυτήν την δομή. Μια απεικόνιση της αναζήτησης προβολής και των «ενδιαφερουσών» μη γκαουσσιανών προβολών. Κατά συνέπεια, στη γενική διατύπωση, η ICA μπορεί να θεωρηθεί παραλλαγή τους αναζήτησης προβολής. Όλα τα μέτρα μη γκαουσσιανότητας και οι αντίστοιχοι ICA αλγόριθμοι που παρουσιάστηκαν εδώ θα μπορούσαν να ονομαστούν «δείκτες» αναζήτησης προβολής και αλγόριθμοι. Ειδικότερα, η αναζήτηση προβολής μας επιτρέπει να αντιμετωπίσουμε την κατάσταση όπου υπάρχουν λιγότερες ανεξάρτητες συνιστώσες s i από τις αρχικές μεταβλητές x i. Υποθέτοντας ότι εκείνες οι διαστάσεις του διαστήματος που δεν εκτείνονται από τις ανεξάρτητες συνιστώσες γεμίζουν από γκαουσσιανό θόρυβο, βλέπουμε ότι υπολογίζοντας τις μη γκαουσσιανές κατευθύνσεις αναζήτησης προβολής, υπολογίζουμε αποτελεσματικά τις ανεξάρτητες συνιστώσες. Όταν όλες οι μη γκαουσσιανές κατευθύνσεις βρεθούν, όλες οι ανεξάρτητες συνιστώσες έχουν υπολογιστεί. Μια τέτοια διαδικασία μπορεί να ερμηνευθεί ως υβρίδιο της αναζήτησης προβολής και της ICA. Ωστόσο, πρέπει να σημειωθεί ότι στη διατύπωση της αναζήτησης προβολής, δεν γίνεται κάποιο μοντέλο δεδομένων ή κάποια υπόθεση για τις ανεξάρτητες συνιστώσες. Εάν το ICA πρότυπο κρατά, βελτιστοποιώντας τα ICA μέτρα μη γκαουσσιανότητας παράγονται ανεξάρτητες συνιστώσες εάν το πρότυπο δεν κρατά, τότε αυτό που παίρνουμε είναι οι κατευθύνσεις αναζήτησης προβολής. 29

30 4.6 Συνελικτική μίξη και ο αλγόριθμος των Nguyen Thi και Jutten Έχει διαπιστωθεί πειραματικά ότι σε δονούμενες δομές όπως είναι για παράδειγμα οι περιστρεφόμενες μηχανές το συνελικτικό πρότυπο μιγμάτων είναι πιο κατάλληλο και δίνεται από τον τύπο n N xi() t = Aji( k) sj( t k), i=1,,m j= 1 k= 0 όπου το Α είναι τώρα μια μήτρα των FIR-φίλτρων A ji και οι πηγές και τα μίγματα θεωρούνται πάλι πραγματικών-τιμών τυχαίες μεταβλητές. Ένας πρόσθετος όρος θορύβου μπορεί εύκολα να περιληφθεί στο μοντέλο. Ο στόχος είναι να βρεθεί η μήτρα των FIR-φίλτρων που από κοινού απομιγνύει τις μετρήσεις και εξισώνει τις πηγές. Αυτό το πρόβλημα μπορεί να λυθεί και στο πεδίο του χρόνου ([33], [34]) και στο πεδίο συχνότητας ([31], [32]). Οι μέθοδοι πεδίου συχνότητας χρησιμοποιούν συχνά το γεγονός ότι ένα συνελικτικό μίγμα αντιστοιχεί σε ένα στιγμιαίο μίγμα σε κάθε (αρκετά στενή) ζώνη συχνότητας. Ένα παράδειγμα της προσέγγισης στο πεδίο του χρόνου της συνελικτικής απόμιξης είναι ο αλγόριθμος των Nguyen Thi και Jutten [33]. Σε αυτόν τον αλγόριθμο, ένα συνελικτικό μίγμα δύο πηγών s 1,s 2 μετρημένο με δύο αισθητήρες x 1,x 2 (επίσης καλούμενο ως 2 2 συνελικτικό μίγμα) διαμορφώνεται στο Z-πεδίο από τις σχέσεις ( ) x ( z) = A z s ( z) + A ( z) s ( z), ( ) x ( z) = A z s ( z) + A ( z) s ( z), όπου τα φίλτρα A ji (z) είναι γραμμικά και αιτιατά FIR φίλτρα τάξης Μ: M 1 A ( z) = a ( k) z ji k = 0 Το μοντέλο απλοποιείται με την υπόθεση ότι κάθε αισθητήρας είναι κοντινός σε μια πηγή, η οποία οδηγεί σε φίλτρα με A 11 (z)=a 22 (z) =1. Ο στόχος είναι τώρα να υπολογιστεί η αντίστροφη μήτρα φίλτρων τέτοια ώστε Bz ( ) BzAz ( ) ( ) ji k 1 B ( z) 21 = B12( z) 1 H ( z) 0 11 = 0 H22( z) 30

31 Σημειώνουμε ότι η λύση μπορεί να καθοριστεί τυφλά μόνο μέχρι μια παραλλαγή και ένα φιλτράρισμα, δηλαδή μια μήτρα Β(z) που οδηγεί σε μια παράγωγη μήτρα Β(z)A(z) με μηδενικά και FIR φίλτρα H ii αντιμετατιθέμενη σε σχέση με την ανωτέρω μήτρα που χωρίζει επίσης τις πηγές, όταν οποιοδήποτε υπόλοιπο FIR φίλτρο H ii επαρκεί. Η αντίστροφη μήτρα προς προσδιορισμό αποτελείται από FIR φίλτρα μόνο και ο αλγόριθμος εκτελεί μια προσαρμοστική ακύρωση των υψηλής-τάξης διαγώνιων-στατιστικών, π.χ. με την εύρεση των μηδενικών του τον ενημερωτικό κανόνα 3 ^ c ( t+ 1, k) = c ( t, k) + μ si( t) s j( t k) ij ij ^ 2 ^ ^ Es [ i ( t) s j( t k)] με όπου c ij (t,k) είναι ο κατ' εκτίμηση συντελεστής απόμιξης φίλτρων στην κρούση k και το χρόνο t (χρησιμοποιώντας μια επαναλαμβανόμενης απόμιξης αρχιτεκτονική [33]) και μ είναι το (θετικό) μέγεθος βημάτων. Κεφάλαιο 5 Προεπεξεργασία των σημάτων 5.1 Κεντροθέτηση Η πιο βασική και απαραίτητη προεπεξεργασία είναι να κεντροθετηθεί το x, δηλ. να αφαιρεθεί το μέσο διάνυσμά του m=ε{x} ώστε να γίνει το x μια μεταβλητή μηδενικού-μέσου όρου. Αυτό υπονοεί ότι το s είναι μηδενικού-μέσου όρου επίσης, όπως μπορεί να δειχθεί από τις παραπάνω εξισώσεις. Αυτή η προεπεξεργασία γίνεται απλώς για να απλοποιήσει τον ICA αλγόριθμο. Δεν σημαίνει ότι ο μέσος όρος δεν θα μπορούσε να υπολογιστεί. Μετά τον υπολογισμό τους μήτρας μίξης Α με τα κεντροθετημένα δεδομένα, μπορούμε να ολοκληρώσουμε την εκτίμηση με την προσθήκη του μέσου διανύσματος του s πίσω τους κεντροθετημένες εκτιμήσεις του. Το μέσο διάνυσμα του s δίνεται από τον όρο A -1 m, όπου το m είναι ο μέσος όρος που αφαιρέθηκε στην προεπεξεργασία. 5.2 Λεύκανση Μια άλλη χρήσιμη στρατηγική προεπεξεργασίας στην ICA είναι να λευκάνει αρχικά τις παρατηρούμενες μεταβλητές. Αυτό σημαίνει ότι πριν την εφαρμογή του ICA αλγορίθμου (και μετά την κεντροθέτηση), μετασχηματίζουμε το παρατηρούμενο διάνυσμα x γραμμικά έτσι ώστε λαμβάνουμε ένα νέο διάνυσμα x που είναι λευκό, δηλ. οι συνιστώσες του είναι ασυσχέτιστες και οι διασπορές τους μοναδιαίες. Με άλλα λόγια, η μήτρα συνδιασποράς του x είναι ίση με την μοναδιαία μήτρα: 31

32 T Exx { } = I Ο μετασχηματισμός λεύκανσης είναι πάντα δυνατός. Μια δημοφιλής μέθοδος λεύκανσης είναι να χρησιμοποιηθεί η αποσύνθεση ιδιοτιμών (EVD) της μήτρας συνδιασποράς Exx { T } = EDE T, όπου το Ε είναι η ορθογώνια μήτρα ιδιοδιανυσμάτων του Exx { T } και το D είναι η διαγώνια μήτρα ιδιοτιμών του, D=diag(d 1,, d n ). Σημειώστε ότι το Exx { T } μπορεί να υπολογιστεί με έναν τυποποιημένο τρόπο από το διαθέσιμο δείγμα x(1),, x(τ). Η λεύκανση μπορεί τώρα να γίνει από τη σχέση 1 2 T x = ED E x όπου η μήτρα D -1/2 υπολογίζεται από μια απλή συνάρτηση ως D -1/2 =diag (d 1-1/2,, d n - T 1/2 ). Είναι εύκολο να ελέγξουμε ότι τώρα ότι ισχύει Exx { } = I. Η λεύκανση μετασχηματίζει τη μήτρα μίξης σε μια νέα, A. Έχουμε ακόμα ότι 1 2 T x = ED E As = A s Η χρησιμότητα της λεύκανσης οφείλεται στο γεγονός ότι η νέα μήτρα μίξης A ορθογώνια. Αυτό μπορεί να δειχθεί από τον τύπο είναι T T T T Exx { } = AEss { } A = AA = I Εδώ βλέπουμε ότι η λεύκανση μειώνει τον αριθμό των παραμέτρων που υπολογίζονται. Αντί να πρέπει να υπολογιστούν οι n 2 παράμετροι που είναι τα στοιχεία της αρχικής μήτρας Α, πρέπει μόνο να υπολογίσουμε τη νέα, ορθογώνια μήτρα μίξης A. Μια ορθογώνια μήτρα περιέχει nn ( 1) βαθμούς ελευθερίας. 2 Παραδείγματος χάριν, σε δύο διαστάσεις, ένας ορθογώνιος μετασχηματισμός καθορίζεται από μια και μόνο παράμετρο γωνίας. Σε μεγαλύτερες διαστάσεις, μια ορθογώνια μήτρα περιέχει μόνο περίπου το μισό από τον αριθμό των παραμέτρων από μια αυθαίρετη μήτρα. Κατά συνέπεια κάποιος μπορεί να πει ότι η λεύκανση λύνει το μισό από το πρόβλημα ICA. Επειδή η λεύκανση είναι μια πολύ απλή και τυποποιημένη διαδικασία, πολύ απλούστερη από οποιουσδήποτε ICA αλγορίθμους, είναι μια καλή ιδέα να μειωθεί η πολυπλοκότητα του προβλήματος με αυτόν τον τρόπο. Μπορεί επίσης να είναι αρκετά χρήσιμο να μειώσουμε τη διάσταση των δεδομένων την ίδια στιγμή που κάνουμε τη λεύκανση. Κατόπιν εξετάζουμε τις ιδιοτιμές d j του Ε{xx T } και απορρίπτουμε εκείνες που είναι πάρα πολύ μικρές, όπως γίνεται συχνά στη στατιστική τεχνική ανάλυσης κύριων συνιστωσών. Αυτό έχει συχνά την επίδραση της μείωσης του θορύβου. Μια γραφική απεικόνιση της επίδρασης της λεύκανσης μπορεί να δειχθεί στο παρακάτω σχήμα 32

33 Η κοινή κατανομή των λευκών μιγμάτων 5.3 Περαιτέρω προεπεξεργασία Η επιτυχία της ICA για ένα δεδομένο σύνολο στοιχείων μπορεί να εξαρτάται αποφασιστικά από την εκτέλεση μερικών εφαρμογών-εξαρτημένων βημάτων προεπεξεργασίας. Παραδείγματος χάριν, εάν τα δεδομένα αποτελούνται από σήματα χρόνου, κάποιο ζωνοδιαβατό φιλτράρισμα μπορεί να είναι πολύ χρήσιμο. Σημειώστε ότι εάν φιλτράρουμε γραμμικά τα παρατηρούμενα σήματα x i (t) για να λάβουμε νέα σήματα, έστω x i * (t), το ICA πρότυπο ισχύει ακόμα για το x i * (t), με την ίδια μήτρα μίξης. Αυτό μπορεί να δειχθεί ως εξής. Συμβολίζουμε με X τη μήτρα που περιέχει τις παρατηρήσεις x(1),,x(τ) ως στήλες του, και ομοίως για το S. Τότε το ICA πρότυπο μπορεί να εκφραστεί ως: X=AS Τώρα, το χρονικό φιλτράρισμα του Χ αντιστοιχεί στον πολλαπλασιασμό του Χ από δεξιά με μια μήτρα, που την καλούμε Μ. Αυτό δίνει X * =XM=ASM=AS *, το οποίο δείχνει ότι το ICA πρότυπο παραμένει ακόμα έγκυρο. Κεφάλαιο 6 Αλγόριθμοι και διαδικασίες εξαγωγής αποτελεσμάτων 33

34 6.1 Ο αλγόριθμος FastICA Παραπάνω παρουσιάσαμε διάφορες μεθόδους για την ICA εκτίμηση. Στην πράξη χρειαζόμαστε να ορίσουμε μια συνάρτηση αντίθεσης και έναν αλγόριθμο που θα μεγιστοποιεί αυτή τη συνάρτηση. Σε αυτό το κεφάλαιο εισάγουμε έναν πολύ αποδοτικό αλγόριθμο για τον σκοπό αυτό. Θεωρούμε ότι τα μεμειγμένα δεδομένα υπόκεινται αρχικά σε προεπεξεργασία, δηλαδή κεντροθέτηση και λεύκανση, όπως αναφέρθηκε παραπάνω. 6.2 Ο αλγόριθμος για μια μονάδα Αρχικά, παρουσιάσουμε την μιας-μονάδας έκδοση του FastICA. Με τον όρο «μονάδα» αναφερόμαστε σε μια υπολογιστική μονάδα, ουσιαστικά σε έναν τεχνητό νευρώνα, που έχει ένα διάνυσμα βάρους w, το οποίο ο νευρώνας είναι σε θέση να ενημερώσει με έναν κανόνα εκμάθησης. Ο κανόνας εκμάθησης FastICA βρίσκει μια κατεύθυνση, δηλ. ένα μοναδιαίο διάνυσμα w τέτοιο ώστε η προβολή w T x να μεγιστοποιεί την μη γκαουσσιανότητα. Η μη γκαουσσιανότητα μετράται εδώ από την 2 προσέγγιση του negentropy J( y) [ E{ G( y)} E{ G( v)}], όπου y= w T x. Επαναλαμβάνουμε ότι η διασπορά του w T x πρέπει να περιοριστεί στη μονάδα, κάτι που για τα λευκά στοιχεία είναι ισοδύναμο με τον περιορισμό της νόρμας του w στη μονάδα. Το FastICA είναι βασισμένο σε ένα σχέδιο επανάληψης σταθερών σημείων για την εύρεση ενός μεγίστου της μη γκαουσσιανότητας του w T x, όπως μετράται από την παραπάνω σχέση ([13], [18]). Μπορεί να βρεθεί επίσης ως προσεγγιστική επανάληψη Newton ([18]). Συμβολίζουμε με g την παράγωγο της μη τετραγωνικής συνάρτησης G που χρησιμοποιείται στην προσέγγιση του negentropy και επομένως οι παράγωγοι είναι: g ( u) = tanh( au) 1 1 g u u u 2 2 ( ) = exp( 2) όπου 1 α 1 2 είναι κάποια κατάλληλη σταθερά, συχνά παρμένη ως α 1 =1. Η βασική μορφή του αλγορίθμου FastICA είναι η ακόλουθη: 1. Επιλέγουμε ένα αρχικό (π.χ. τυχαίο) διάνυσμα βάρους w T T 2. Έστω w + = Exgwx { ( )} Eg { '( wx)} w 3. Έστω w= w / w Εάν δεν έχουμε σύγκλιση, πηγαίνουμε πίσω στο βήμα 2. Σημειώνουμε ότι σύγκλιση σημαίνει ότι παλαιές και νέες τιμές του σημείου w στην ίδια κατεύθυνση, δηλ. το σημείο-γινόμενό τους είναι (σχεδόν) ίσο με 1. Δεν είναι απαραίτητο ότι το διάνυσμα συγκλίνει σε ένα ενιαίο σημείο, δεδομένου ότι το w και το w καθορίζουν την ίδια κατεύθυνση. Αυτό ισχύει επειδή οι ανεξάρτητες 34

35 συνιστώσες μπορούν να καθοριστούν μόνο μέχρι ένα πολλαπλάσιο σημείο. Σημειώνουμε επίσης ότι εδώ υποτίθεται ότι τα δεδομένα είναι προασπρισμένα. Επομένως, η διαδικασία του FastICA είναι η ακόλουθη. Πρώτα σημειώνουμε ότι τα μέγιστα της προσέγγισης του negentropy του w T x λαμβάνονται σε ορισμένα T βέλτιστα του EGwx { ( )}. Σύμφωνα με τις συνθήκες kuhn-tucker ([20]), τα βέλτιστα T T 2 2 του EGwx { ( )} κάτω από τον περιορισμό E{( w x) } = w = 1 λαμβάνονται στα σημεία όπου T Exgwx { ( )} β w= 0 Προσπαθούμε να λύσουμε αυτήν την εξίσωση με τη μέθοδο Newton. Συμβολίζοντας τη συνάρτηση στην αριστερή πλευρά της παραπάνω εξίσωσης με F, λαμβάνουμε τη Jacobian μήτρα της JF(w) ως T T JF( w) = E{ xx g '( w x)} β I Για να απλοποιήσουμε την αντιστροφή αυτής της μήτρας, αποφασίζουμε να προσεγγίσουμε τον πρώτο όρο της εξίσωσης. Δεδομένου ότι τα δεδομένα είναι σφαιρικά, μια λογική προσέγγιση φαίνεται να είναι T T T T T Exxg { '( wx)} Exx { } Eg { '( wx)} = Eg { '( wx)} I. Κατά συνέπεια η μήτρα Jacobian γίνεται διαγώνια, και μπορεί εύκολα να αντιστραφεί. Κατά συνέπεια λαμβάνουμε την ακόλουθη προσεγγιστική επανάληψη Newton: T T w + = w [ Exgwx { ( )} β w]/[ Eg { '( wx)} β ] ) Αυτός ο αλγόριθμος μπορεί να απλοποιηθεί περαιτέρω με τον πολλαπλασιασμό T και των δύο πλευρών της παραπάνω εξίσωσης με β Eg { '( wx)}. Αυτό δίνει, μετά από αλγεβρική απλοποίηση, την επανάληψη FastICA. 6.3 Ο αλγόριθμος για αρκετές μονάδες Ο αλγόριθμος μιας-μονάδας της προηγούμενης παραγράφου υπολογίζει ακριβώς μία από τις ανεξάρτητες συνιστώσες, ή μια κατεύθυνση αναζήτησης προβολής. Για να υπολογίσουμε διάφορες ανεξάρτητες συνιστώσες, πρέπει να τρέξουμε τον αλγόριθμο FastICA μιας-μονάδας χρησιμοποιώντας αρκετές μονάδες (π.χ. νευρώνες) με διανύσματα βάρους w 1,,w n. Για να αποτρέψουμε τα διαφορετικά διανύσματα από τη σύγκλιση στα ίδια μέγιστα πρέπει να αποσυνδέσουμε τις εξόδους w 1 T x,,w n T x μετά από κάθε επανάληψη. Παρουσιάζουμε εδώ τρεις μεθόδους για να το πετύχουμε αυτό. Ένας απλός τρόπος αποσυσχέτισης είναι ένα σχέδιο αντιπληθωρισμού βασισμένο σε μια ομοιάζουσα στην Gram-Schmidt αποσυσχέτιση. Αυτό σημαίνει ότι υπολογίζουμε τις ανεξάρτητες συνιστώσες μία προς μία. Όταν έχουμε υπολογίσει p ανεξάρτητες συνιστώσες, ή p διανύσματα w 1,,w p, τρέχουμε τον αλγόριθμο σταθερών σημείων μιας-μονάδας για w p + 1, και μετά από κάθε βήμα επανάληψης 35

36 T αφαιρούμε από τα w p + 1 τις «προβολές» wp+ 1wjwj, j=1,,p των προηγουμένως εκτιμημένων διανυσμάτων p, και έπειτα κανονικοποιούμε τα w p + 1 : 1. Έστω w w w T w w = p p j= 1 p j j 2. Έστω w T p+ 1 = wp+ 1 wp+ 1wp+ 1 Σε ορισμένες εφαρμογές, εντούτοις, μπορεί να επιδιώκουμε να χρησιμοποιήσουμε μια συμμετρική αποσυσχέτιση, στην οποία κανένα διάνυσμα δεν είναι «προνομιούχο» έναντι των άλλων [27]. Αυτό μπορεί να ολοκληρωθεί, π.χ., με την κλασσική μέθοδο που περιλαμβάνει τις τετραγωνικές ρίζες μητρών, p Έστω = ( ) T 12 w ww w όπου το W είναι η μήτρα (w 1,, w n ) T των διανυσμάτων, και η αντίστροφη T 12 τετραγωνική ρίζα ( ww ) λαμβάνεται από την αποσυσχέτιση των ιδιοτιμών των T T T T ww = FDF ως ( ww ) = FD F. Μια απλούστερη εναλλακτική λύση είναι ο ακόλουθος επαναληπτικός αλγόριθμος [13], 1. Έστω w= w/ ww T 2. Έστω 3 1 T w= w ww w 2 2 Επαναλαμβάνουμε το 2 μέχρι την σύγκλιση. 6.4 Αλγόριθμος και μέγιστη πιθανότητα Τέλος, δίνουμε μια έκδοση FastICA που παρουσιάζει ρητά τη σύνδεση με τον γνωστό αλγόριθμο infomax ή μέγιστης πιθανότητας ([1], [3], [25], [61]). Εάν εκφράζουμε τον FastICA χρησιμοποιώντας τον τύπο T T w + = w [ Exgwx { ( )} β w]/[ Eg { '( wx)} β ] και τον γράψουμε σε μορφή μητρών ([14]), βλέπουμε ότι ο FastICA λαμβάνει την ακόλουθη μορφή: T w + = w + diag( a )[ diag( β ) + E{ g( y) y }] w i Όπου y=wx, β i = E{ yig( yi)} και ai = 1/( βi E{ g'( yi)}). Η μήτρα W πρέπει να ορθογωνιοποιείται μετά από κάθε βήμα. Σε αυτήν την έκδοση μητρών, το W ορθογωνιοποιείται συμμετρικά. Η ανωτέρω έκδοση του FastICA θα μπορούσε να συγκριθεί με την στοχαστική μέθοδο κλίσης για την μεγιστοποίηση της πιθανότητας ([1], [3], [25], [61]), T w + = w + μ[ I + g( y) y ] w i 36

37 όπου μ είναι το ποσοστό εκμάθησης, όχι απαραιτήτως σταθερό στο χρόνο. Εδώ, g ' είναι μια συνάρτηση της σ.π.π των ανεξάρτητων συνιστωσών: g = fi / fi όπου το f i είναι η σ.π.π μιας ανεξάρτητης συνιστώσας. Από τα παραπάνω, συμπεραίνουμε ότι ο FastICA μπορεί να θεωρηθεί ως αλγόριθμος σταθερών σημείων για την εκτίμηση της μέγιστης πιθανότητας του ICA μοντέλου δεδομένων [14]. Επίσης, η ταχύτητα σύγκλισης βελτιστοποιείται από την επιλογή των μητρών diag (α i ) και diag (β i ). Ένα άλλο πλεονέκτημα του FastICA είναι ότι μπορεί να υπολογίσει και τις υπό- και τις υπέρ-γκαουσσιανές ανεξάρτητες συνιστώσες, κάτι που είναι σε αντίθεση με τους συνηθισμένους ML αλγορίθμους, οι οποίοι εργάζονται μόνο για μια δεδομένη κατηγορία κατανομών. 6.5 Ιδιότητες Ο FastICA αλγόριθμος και οι ελλοχεύουσες συναρτήσεις αντίθεσης έχουν διάφορες επιθυμητές ιδιότητες συγκρινόμενες με τις υπάρχουσες μεθόδους για το ICA. 1. Η σύγκλιση είναι κυβική (ή τουλάχιστον τετραγωνική), στις περιπτώσεις του ICA προτύπου δεδομένων [13]. Αυτό είναι σε αντίθεση με τους συνηθισμένους ICA αλγορίθμους βασισμένους στις (στοχαστικές) μεθόδους καθόδου κλίσης, όπου η σύγκλιση είναι μόνο γραμμική. Αυτό σημαίνει μια πολύ γρήγορη σύγκλιση, όπως έχει επιβεβαιωθεί από τις προσομοιώσεις και τα πειράματα στα πραγματικά δεδομένα [29]. 2. Αντίθετα στους βασισμένους στην κλίση αλγόριθμους, δεν υπάρχουν παράμετροι μεγέθους βημάτων για να επιλεχθούν. Αυτό σημαίνει ότι ο αλγόριθμος είναι εύχρηστος. 3. Ο αλγόριθμος βρίσκει απευθείας τις ανεξάρτητες συνιστώσες (σχεδόν) οποιασδήποτε μη γκαουσσιανής κατανομής χρησιμοποιώντας οποιαδήποτε μη γραμμικότητα g. Αυτό είναι σε αντίθεση με πολλούς αλγορίθμους, όπου κάποια εκτίμηση της συνάρτησης κατανομής πιθανότητας πρέπει να είναι πρώτη διαθέσιμη, και η μη γραμμικότητα πρέπει να επιλεχτεί αναλόγως. 4. Η απόδοση της μεθόδου μπορεί να βελτιστοποιηθεί με την επιλογή μιας κατάλληλης μη γραμμικότητας g. Ειδικότερα, κάποιος μπορεί να λάβει αλγορίθμους που είναι σθεναροί ή/και της ελάχιστης διασποράς. Στην πραγματικότητα, οι δύο μη 2 γραμμικότητες g1( u) = tanh( au 1 ) και g 2 ( u ) = u exp( u 2) έχουν μερικές βέλτιστες ιδιότητες [13]. 5. Οι ανεξάρτητες συνιστώσες μπορούν να υπολογιστούν μία προς μία, το οποίο είναι κατά προσέγγιση ισοδύναμο με να κάνουμε αναζήτηση προβολής. Αυτή η τεχνική είναι χρήσιμη στη διερευνητική ανάλυση στοιχείων και μειώνει τον υπολογιστικό φόρτο της μεθόδου σε περιπτώσεις όπου μόνο μερικές από τις ανεξάρτητες συνιστώσες πρέπει να υπολογιστούν. 6. Το FastICA έχει τα περισσότερα από τα πλεονεκτήματα των νευρωνικών αλγορίθμων. Είναι παράλληλο, κατανεμημένο, υπολογιστικά απλό, και απαιτεί λίγο 37

38 χώρο μνήμης. Οι στοχαστικές μέθοδοι κλίσης φαίνονται να είναι προτιμητέες μόνο εάν απαιτείται γρήγορη προσαρμοστικότητα σε ένα μεταβαλλόμενο περιβάλλον. 6.6 Περιγραφή του αλγόριθμου Ο κώδικας του αλγόριθμου fastica παρουσιάζεται αναλυτικά στο παράρτημα και εδώ περιγράφεται η λειτουργία του. Η συνάρτηση fastica δέχεται ως εισόδους τα μεμειγμένα σήματα σε μορφή πίνακα και κάποιο μεταβλητό αριθμό άλλων παραμέτρων και παράγει στην έξοδο τα διαχωρισμένα σήματα, τις μήτρες A και W, καθώς και το σφάλμα σύγκλισης του αλγόριθμου, σύμφωνα με κάποιο κριτήριο τερματισμού. Επίσης, ο αλγόριθμος αυτός, καλεί κάποιες συναρτήσεις, όπως είναι η remmean, η whitenv, η pcamat, καθώς και η fpica, που είναι και ο κύριος αλγόριθμος διαχωρισμού των σημάτων. Όλες αυτές οι συναρτήσεις παρουσιάζονται αναλυτικά στο παράρτημα, ενώ εδώ εκθέτουμε τη λειτουργία τους. remmean: Χρησιμοποιήθηκε για την αφαίρεση του μέσου όρου των δεδομένων. Αυτή η συνάρτηση δέχεται ως όρισμα εισόδου τα δεδομένα υπό μορφή διανύσματος γραμμής και επιστρέφει στην έξοδο την μέση τιμή τους και τα νέα δεδομένα, που έχουν μέση τιμή μηδέν. pcamat: Χρησιμοποιείται σε συνδυασμό με τη συνάρτηση whiten για την λεύκανση των δεδομένων. Η pcamat πραγματοποιεί την ανάλυση των δεδομένων σε κύριες συνιστώσες ή αλλιώς PCA. Πιο συγκεκριμένα, δέχεται ως είσοδο τα δεδομένα υπό μορφή διανύσματος γραμμής και επιστρέφει στην έξοδο το ιδιοδιάνυσμα και τον διαγώνιο πίνακα ιδιοτιμών της εισόδου. Επίσης, δέχεται στην είσοδο τις παραμέτρους firsteig, lasteig, s_interactive και s_verbose που εξηγούνται αναλυτικά παρακάτω. firsteig: τιμή της μεγαλύτερης ιδιοτιμής που κρατάμε. Αυθαίρετα θεωρείται 1. lasteig: τιμή της μικρότερης ιδιοτιμής που κρατάμε. Αυθαίρετα θεωρείται ίση με την διάσταση των διανυσμάτων. s_interactive: Καθορίζει αν πρέπει να δώσει τιμές ο χρήστης στις παραμέτρους firsteig και lasteig παίρνοντας την τιμή on, ή αν αυτές θα ληφθούν αυθαίρετα παίρνοντας την τιμή off. Επίσης, με την τιμή gui ο χρήστης δίνει την τιμή που επιθυμεί στις παραμέτρους μέσω ενός γραφικού περιβάλλοντος εργασίας. s_verbose: Η τιμή της, on ή off, καθορίζει αντίστοιχα αν θα δίνονται μηνύματα στο χρήστη για την πορεία του αλγορίθμου ή όχι. whitenv: Η κύρια συνάρτηση που πραγματοποιεί την λεύκανση των δεδομένων. Δέχεται ως εισόδους τα δεδομένα υπό μορφή διανύσματος γραμμής, το ιδιοδιάνυσμα E και τον πίνακα ιδιοτιμών D που υπολογίστηκαν από την συνάρτηση pcamat, ενώ επιστρέφει στην έξοδο τα ασπρισμένα διανύσματα γραμμής και τους ασπρισμένους και μη πίνακες. fpica: Το κυρίως κομμάτι του αλγόριθμου fastica, αφού αυτή η συνάρτηση είναι υπεύθυνη για τον διαχωρισμό των μεμειγμένων σημάτων. Δέχεται ως εισόδους τα αποτελέσματα της συνάρτησης whitenv, δηλαδή τα ασπρισμένα διανύσματα γραμμής και τους ασπρισμένους και μη πίνακες, καθώς και πλήθος άλλων παραμέτρων που 38

39 εξηγούνται πιο αναλυτικά παρακάτω, ενώ επιστρέφει στην έξοδο τοα πίνακα μίξης A, τον αντίστροφό του W και το σφάλμα σύγκλισης του αλγόριθμου. approach: Η προσέγγιση αποσυσχέτισης που χρησιμοποιείται για την εκτίμηση του αποτελέσματος και παίρνει τιμές deflation ή symmetric. Με την πρώτη τιμή εκτιμώνται οι ανεξάρτητες συνιστώσες μία προς μία όπως στην αναζήτηση προβολής, ενώ με την δεύτερη όλες οι ανεξάρτητες συνιστώσες εκτιμώνται παράλληλα (ταυτόχρονα). numofic: Ο αριθμός των ανεξάρτητων συνιστωσών που εκτιμώνται και κυμαίνεται από 0 μέχρι την διάσταση των ασπρισμένων διανυσμάτων γραμμής. g: Η μη γραμμικότητα που χρησιμοποιείται στον κώδικα και η οποία παίρνει μια από τις εξής τιμές: pow3, tanh, gauss, skew. finetune: Η μη γραμμικότητα που χρησιμοποιείται σε finetuning και παίρνει τιμές όπως το g και ακόμα off. a1: Παράμετρος όταν το finetune είναι tanh. Αυθαίρετη τιμή είναι το 1. a2: Παράμετρος όταν το finetune είναι gauss. Αυθαίρετη τιμή είναι το 1. stabilization: Ευστάθεια του αλγορίθμου που παίρνει τιμές on ή off και όταν είναι mu<1 τότε αυτόματα παίρνει την τιμή on. Αυτή η παράμετρος ελέγχει αν το πρόγραμμα χρησιμοποιεί την ευσταθή έκδοση του αλγορίθμου ή όχι. Αν η ευστάθεια είναι στο on και ο αλγόριθμος κολλάει μεταξύ δύο σημείων, τότε αυτόματα το μέγεθος βήματος (mu) υποδιπλασιάζεται. Το ίδιο γίνεται για το υπόλοιπο των επαναλήψεων αν δεν έχουμε σύγκλιση του αλγορίθμου μέχρι το μισό του αριθμού των επαναλήψεων. epsilon: Κριτήριο τερματισμού των επαναλήψεων του αλγορίθμου. Αυθαίρετη τιμή είναι το maxnumiterations: Μέγιστος αριθμός επαναλήψεων του αλγορίθμου. Αυθαίρετη τιμή είναι το maxfinetune: Μέγιστος αριθμός επαναλήψεων για finetuning. Αυθαίρετη τιμή είναι το 100. initstate: Αρχική πρόβλεψη για την τυχαία αρχική κατάσταση. Παίρνει τιμές rand ή guess. guess: Αρχική πρόβλεψη για τον πίνακα A. Αγνοείται όταν είναι initstate= rand. samplesize: Ποσοστό των δειγμάτων του σήματος που χρησιμοποιείται σε μια επανάληψη. Παίρνει τιμές από 0 έως 1. displaymode: Απεικόνιση των υπολογισμών που εκτελούνται. Παίρνει τιμές signals, basis, filters, off. 39

40 displayinterval: Ο αριθμός των επαναλήψεων που παίρνουμε μεταξύ των απεικονίσεων. verbose: Αναφορά της προόδου του αλγορίθμου στον χρήστη. Παίρνει τιμές on ή off. fastica: Όπως αναφέρθηκε και παραπάνω είναι ο αλγόριθμος που δέχεται ως είσοδο τα μεμειγμένα σήματα (που έχουν υποστεί προηγουμένως μια επεξεργασία) και δίνει στην έξοδο τα διαχωρισμένα σήματα. Επίσης, δέχεται ως ορίσματα και άλλες παραμέτρους που είναι ίδιες με αυτές του fpica και αναλύθηκαν εκτενώς παραπάνω. 6.7 Εφαρμογή σε τυχαία δεδομένα Αρχικά εφαρμόζουμε τον αλγόριθμο σε τυχαία δοκιμαστικά σήματα, τα οποία αναμειγνύουμε με τυχαία μήτρα μίξης A, για να διαπιστώσουμε την λειτουργικότητα και αποδοτικότητα του αλγόριθμου. Έτσι παίρνουμε το κάτωθι τμήμα κώδικα N=500; v=[0:n-1]; sig=[]; sig(1,:)=sin(v/2); sig(2,:)=((rem(v,23)-11)/9).^5; sig(3,:)=((rem(v,27)-13)/9); sig(4,:)=((rand(1,n)<.5)*2-1).*log(rand(1,n)); for t=1:4 sig(t,:)=sig(t,:)/std(sig(t,:)); x=sig(1,:); x=x(1:200); y=sig(2,:); y=y(1:200); w=sig(3,:); w=w(1:200); z=sig(4,:); z=z(1:200); A=rand(4); sig=[x;y;w;z]; mixedsig=a*sig; [icasig]=fastica(mixedsig); 40

41 Με την εισαγωγή του παραπάνω κώδικα στο Matlab δημιουργούμε τέσσερα αρχικά σήματα που οι γραφικές τους παραστάσεις φαίνονται παρακάτω 41

42 Εν συνεχεία παίρνουμε τα μεμειγμένα σήματα 42

43 Εφαρμόζοντας τον αλγόριθμο fastica παίρνουμε τα διαχωρισμένα σήματα 43

44 Παρατηρούμε ότι με απλά σήματα όπως τα παραπάνω και με γνωστή τη μήτρα μίξης A, τα εξαγόμενα σήματα του αλγόριθμου είναι σε μεγάλο βαθμό όμοια με τα 44

45 αρχικά, αλλά όχι ακριβώς ίδια. Είναι παραμορφωμένα σε σχέση με τα αρχικά, κυρίως λόγω θορύβου, και ακόμα κάποια είναι ανεστραμμένα, κάτι που δεν μας ενοχλεί ιδιαίτερα. Αυτό σημαίνει πώς με πιο σύνθετα σήματα όπως αυτά της μηχανής και με άγνωστη τη μήτρα A, τα αποτελέσματα που θα πάρουμε δεν θα είναι πολύ ικανοποιητικά. Τα παραπάνω σχήματα τα πήραμε μελετώντας τα τυχαία σήματα στο πεδίο του χρόνου. Μπορούμε, επίσης, να τα μελετήσουμε στο πεδίο της συχνότητας χρησιμοποιώντας στο Matlab την εντολή abs(fft(x)), όπου x τα σήμα σε μορφή διανύσματος γραμμής, και να πάρουμε έτσι το μέτρο του μετασχηματισμού Fourier(MF) στην έξοδο. Πιο αναλυτικά, κάνουμε χρήση του παρακάτω τμήματος κώδικα ως συνέχεια αυτού που χρησιμοποιήσαμε για την ανάλυση στο πεδίο του χρόνου xf=abs(fft(x)); yf=abs(fft(y)); wf=abs(fft(w)); zf=abs(fft(z)); sigf=[xf;yf;wf;zf]; mixedsigf=a*sigf; [icasigf]=fastica(mixedsigf); Και έτσι παίρνουμε τα τέσσερα αρχικά σήματα 45

46 Στη συνέχεια παίρνουμε τα μεμειγμένα σήματα 46

47 47

48 Εφαρμόζοντας τον fastica έχουμε τελικά 48

49 Όπως παρατηρούμε, ο αλγόριθμος δουλεύει με μεγάλη ακρίβεια και στη συχνότητα, ενώ τα σήματα έχουν κάποιο ποσοστό θορύβου και κάποια είναι ανεστραμμένα, όπως συμβαίνει και στο χρόνο. 6.8 Εφαρμογή στα πειραματικά δεδομένα Τα σήματα μηχανής τα οποία λαμβάνουμε από μετρήσεις τα χρησιμοποιούμε ως παρατηρούμενα σήματα για την εξαγωγή των ανεξάρτητων συνιστωσών. Αυτά τα σήματα έχουν ληφθεί από δύο αισθητήρες που ο ένας είναι τοποθετημένος στο καπάκι της μηχανής του αυτοκινήτου και ο άλλος στο αμορτισέρ. Για την απεικόνιση (τόσο στο πεδίο του χρόνου όσο και της συχνότητας) και την επεξεργασία (κατάτμηση σε μικρότερα κομμάτια) αυτών των σημάτων χρησιμοποιούμε το πρόγραμμα adobe audition 1.5. Έτσι παίρνουμε τα παρακάτω σχήματα 49

50 Μεμειγμένο σήμα από το καπάκι της μηχανής Μεμειγμένο σήμα από το αμορτισέρ του αυτοκινήτου Τα παραπάνω σήματα τα χωρίζουμε σε μικρότερα τμήματα με σκοπό την καλύτερη εφαρμογή του αλγόριθμου fastica σε αυτά. Κάποια από αυτά τα τμήματα, καθώς επίσης και τα διαχωρισμένα που προκύπτουν μετά από την εκτέλεση του αλγόριθμου φαίνονται παρακάτω. Για δική μας ευκολία συμβολίζουμε το μεμειγμένο σήμα από το καπάκι της μηχανής με A και το αντίστοιχο από το αμορτισέρ με D. Έτσι, το πρώτο τμήμα από το σήμα στο καπάκι δείχνεται με A 1 και το αντίστοιχο από το αμορτισέρ με D 1 και όλα τα υπόλοιπα τμήματα έχουν παρόμοιους συμβολισμούς. Τα διαχωρισμένα τμήματα των σημάτων έχουν μπροστά και ένα s,π.χ.sa 1 και sad 1 Κ.Ο. Επίσης, είναι χρήσιμο να παραθέσουμε κάποιες εντολές της Mat lab με τις οποίες επεξεργαστήκαμε τα σήματα πριν και μετά την εισαγωγή τους στον κύριο αλγόριθμο. Αυτές είναι οι εξής 50

51 [An,mean,soda]=presto(A); για το A σήμα και [Dn,mean,stud]=presto(D); για το D αντίστοιχα, με την οποία επεξεργαζόμαστε τα σήματα ώστε να έχουν μέση τιμή 0 και τυπική απόκλιση 1, δηλαδή στην ουσία τα κοινωνικοποιούμε. vara=var(a); και αντίστοιχα vard=var(d); με την οποία υπολογίσαμε τις διασπορές (ενέργειες) των σημάτων. data=[an Dn]'; με την οποία δημιουργούμε πίνακα 2x(αριθμός δειγμάτων σημάτων) για την εισαγωγή των δεδομένων στον κώδικα fastica(ως διανύσματα γραμμής). sepa=icasig(1,:); και αντίστοιχα sepd=icasig(2,:); για την καταχώρηση των ανεξάρτητων συνιστωσών στις μεταβλητές sepa και sepd. sa=sepa./k1; όπου k1=sqrt(1/vara); και αντίστοιχα sd=sepd./k2; όπου k2=sqrt(1/vard); για να έχουν ίσες διασπορές (ενέργειες) τα σήματα εισόδου και εξόδου. wavwrite(sa,fs,'sa'); για την αποθήκευση του διαχωρισμένου σήματος sa στο αρχείο με όνομα sa και αντίστοιχη εντολή για το sd. A 1 sa 1 51

52 D 1 sd 1 A 2 52

53 sa 2 D 2 sd 2 53

54 A 3 sa 3 D 3 54

55 sd 3 A 4 sa 4 55

56 D 4 sd 4 56

57 A 5 sa 5 D 5 57

58 sd 5 A 6 58

59 sa 6 D 6 sd 6 59

60 A 7 sa 7 60

61 D 7 sd 7 Τα παραπάνω σχήματα έχουν ληφθεί με παραμέτρους epsilon= και maxnumiterations=100000, ενώ οι παράμετροι approach και g μεταβάλλονται ανάλογα με το ποια προσέγγιση και ποια μη γραμμικότητα δίνει πιο ικανοποιητικά αποτελέσματα. Έτσι, διαπιστώνουμε και στην πράξη ότι για g= tanh ή g= gauss παίρνουμε πιο καλά αποτελέσματα από ότι για τις άλλες δύο τιμές της παραμέτρου g. Επίσης διακρίνουμε ελάχιστες διαφορές στο πεδίο του χρόνου μεταξύ των αρχικών μεμειγμένων και των διαχωρισμένων σημάτων, κάτι το οποίο αναμέναμε όπως αναφέρθηκε και πιο πάνω. Για να βρούμε περισσότερες διαφορές εξετάζουμε τα σήματα και στο πεδίο της συχνότητας με χρήση του ΜF. Σε αντίθεση με τα τυχαία σήματα στα οποία χρησιμοποιήσαμε ΜF μέσω του Matlab, εδώ εξετάζουμε τα σήματα μηχανής στο πεδίο της συχνότητας μέσω του προγράμματος Adobe Audition 1.5. Έτσι παίρνουμε τα παρακάτω σχήματα A 1 (στα 0 sec) sa 1 (στα 0 sec) 61

62 D 1 (στα 0 sec) sd 1 (στα 0 sec) A 2 (στα 0 sec) sa 2 (στα 0 sec) D 2 (στα 5 sec) 62

63 sd 2 (στα 5 sec) A 3 (στα 3 sec) sa 3 (στα 3 sec) D 3 (στα 2 sec) sd 3 (στα 2 sec) A 4 (στα 0 sec) 63

64 sa 4 (στα 0 sec) D 4 (στα 0 sec) sd 4 (στα 0 sec) A 5 (στα 3 sec) sa 5 (στα 3 sec) 64

65 D 5 (στα 0 sec) sd 5 (στα 0 sec) A 6 (στα 3.5 sec) sa 6 (στα 3.5 sec) D 6 (στα 0 sec) sd 6 (στα 0 sec) 65

66 A 7 (στα 2 sec) sa 7 (στα 2 sec) sd 7 (στα 2 sec) sd 7 (στα 2 sec) Όπως αναφέρθηκε και στην παράγραφο για τις ιδιότητες του αλγόριθμου, ο fastica έχει κυβική σύγκλιση ή τουλάχιστον τετραγωνική, που σημαίνει ότι το σφάλμα σύγκλισης φτάνει κοντά στην τελική του τιμή (εδώ ) πολύ γρήγορα και σε μικρό αριθμό βημάτων. Το πώς προσεγγίζει την τελική του τιμή το σφάλμα φαίνεται στα παρακάτω σχήματα για κάθε ζεύγος των διαχωρισμένων σημάτων 66

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ Δ.Π.Μ.Σ. ΗΛΕΚΤΡΟΝΙΚΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΙΔΙΚΗ ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΧΡΗΣΗ ΜΕΘΟΔΩΝ ΑΝΑΛΥΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ Δ.Π.Μ.Σ. ΗΛΕΚΤΡΟΝΙΚΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΙΔΙΚΗ ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΧΡΗΣΗ ΜΕΘΟΔΩΝ ΑΝΑΛΥΣΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ Δ.Π.Μ.Σ. ΗΛΕΚΤΡΟΝΙΚΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΙΔΙΚΗ ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΧΡΗΣΗ ΜΕΘΟΔΩΝ ΑΝΑΛΥΣΗΣ ΑΝΕΞΑΡΤΗΤΩΝ ΚΥΡΙΑΡΧΩΝ ΣΥΝΙΣΤΩΣΩΝ (INDEPENDENT COMPONENT ANALYSIS)

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Διπλωματική Εργασία της φοιτήτριας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Διπλωματική Εργασία της φοιτήτριας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ: ΕΝΣΥΡΜΑΤΗΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΣ Διπλωματική Εργασία της φοιτήτριας

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

E [ -x ^2 z] = E[x z]

E [ -x ^2 z] = E[x z] 1 1.ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτήν την διάλεξη θα πάμε στο φίλτρο με περισσότερες λεπτομέρειες, και θα παράσχουμε μια νέα παραγωγή για το φίλτρο Kalman, αυτή τη φορά βασισμένο στην ιδέα της γραμμικής

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ 3.1 Εισαγωγή ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ Στο κεφ. 2 είδαμε πώς θα μπορούσαμε να σχεδιάσουμε έναν βέλτιστο ταξινομητή εάν ξέραμε τις προγενέστερες(prior) πιθανότητες ( ) και τις κλάση-υπό όρους πυκνότητες

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2 HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Θεωρία πιθανοτήτων Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (αντίθετα με τις ντετερμινιστικές μεταβλητές)

Διαβάστε περισσότερα

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο 2018-2019 Τμήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή,

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΕΝΣΥΡΜΑΤΗΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΣ Διπλωματική Εργασία του φοιτητή του

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων Περιεχόμενα Πιθανότητες Πληροφορία Μέτρο

Διαβάστε περισσότερα

Γκούσκου Μαρία του Διονυσίου-Αναστασίου Αριθμός Μητρώου: Θέμα «Υλοποίηση του αλγορίθμου FAST-ICA στον μικροελεγκτή ADuC7020»

Γκούσκου Μαρία του Διονυσίου-Αναστασίου Αριθμός Μητρώου: Θέμα «Υλοποίηση του αλγορίθμου FAST-ICA στον μικροελεγκτή ADuC7020» ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ: ΕΝΣΥΡΜΑΤΗΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΣ Διπλωματική Εργασία της φοιτήτριας

Διαβάστε περισσότερα

7. ΕΠΕΞΕΡΓΑΣΊΑ ΣΗΜΆΤΩΝ

7. ΕΠΕΞΕΡΓΑΣΊΑ ΣΗΜΆΤΩΝ 7. ΕΠΕΞΕΡΓΑΣΊΑ ΣΗΜΆΤΩΝ 1 Principal & Independent Component Analysis (PCA, ICA) PRINCIPAL COMPONENT ANALYSIS (PCA) Principal Component Analysis (PCA): ορθογώνιος μετασχηματισμός κατά τον οποίο αφαιρείται

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ 20 3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ ΟΡΙΣΜΟΣ ΤΗΣ ΜΕΣΗΣ ΤΙΜΗΣ Μια πολύ σηµαντική έννοια στη θεωρία πιθανοτήτων και τη στατιστική είναι η έννοια της µαθηµατικής ελπίδας ή αναµενόµενης τιµής ή µέσης τιµής µιας τυχαίας

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

Στοχαστικές Ανελίξεις (2) Αγγελική Αλεξίου

Στοχαστικές Ανελίξεις (2) Αγγελική Αλεξίου Στοχαστικές Ανελίξεις (2) Αγγελική Αλεξίου alexiou@unipi.gr 1 Στοχαστικές Διαδικασίες 2 Στοχαστική Διαδικασία Στοχαστικές Ανελίξεις Α. Αλεξίου 3 Στοχαστική Διαδικασία ως συλλογή από συναρτήσεις χρόνου

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Ψηφιακές Τηλεπικοινωνίες. Βέλτιστος Δέκτης

Ψηφιακές Τηλεπικοινωνίες. Βέλτιστος Δέκτης Ψηφιακές Τηλεπικοινωνίες Βέλτιστος Δέκτης Σύνδεση με τα Προηγούμενα Επειδή το πραγματικό κανάλι είναι αναλογικό, κατά τη διαβίβαση ψηφιακής πληροφορίας, αντιστοιχίζουμε τα σύμβολα σε αναλογικές κυματομορφές

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΦΟΡΙΑΣ ΕΡΓΑΣΤΗΡΙΟ Διπλωματική Εργασία της φοιτήτριας του Τμήματος Ηλεκτρολόγων

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11. Σύνολα..............................................................

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σ.κ. της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα

Διαβάστε περισσότερα

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής Σήματα και Συστήματα Διάλεξη 1: Σήματα Συνεχούς Χρόνου Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Εισαγωγή στα Σήματα 1. Σκοποί της Θεωρίας Σημάτων 2. Κατηγορίες Σημάτων 3. Χαρακτηριστικές Παράμετροι

Διαβάστε περισσότερα

Στατιστική Συμπερασματολογία

Στατιστική Συμπερασματολογία Στατιστική Συμπερασματολογία Διαφάνειες 1 ου κεφαλαίου Βιβλίο: Κολυβά Μαχαίρα, Φ. & Χατζόπουλος Στ. Α. (2016). Μαθηματική Στατιστική, Έλεγχοι Υποθέσεων. [ηλεκτρ. βιβλ.] Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών

Διαβάστε περισσότερα

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών Δημήτρης Κουτσογιάννης Τομέας Υδατικών Πόρων και Περιβάλλοντος, Σχολή Πολιτικών Μηχανικών, Εθνικό Μετσόβιο Πολυτεχνείο Αθήνα Επανέκδοση

Διαβάστε περισσότερα

X = = 81 9 = 9

X = = 81 9 = 9 Πιθανότητες και Αρχές Στατιστικής (11η Διάλεξη) Σωτήρης Νικολετσέας, καθηγητής Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών Ακαδημαϊκό Ετος 2018-2019 Σωτήρης Νικολετσέας, καθηγητής 1 / 35 Σύνοψη

Διαβάστε περισσότερα

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές Εαρινό εξάμηνο 2018-2019 μήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό μήμα, Πανεπιστήμιο

Διαβάστε περισσότερα

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι)

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι) HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών Σημάτων Διάλεξη 5: Στοχαστικά/Τυχαία Σήματα Διακριτού Διάλεξη 5: Στοχαστικά/Τυχαία Σήματα Διακριτού Χρόνου (Ι) Στοχαστικά σήματα Στα προηγούμενα: Ντετερμινιστικά

Διαβάστε περισσότερα

X 1 X 2. X d X = 2 Y (x) = e x 2. f X+Y (x) = f X f Y (x) = f X (y)f Y (x y)dy. exp. exp. dy, (1) f X+Y (x) = j= σ2 2) exp x 2 )

X 1 X 2. X d X = 2 Y (x) = e x 2. f X+Y (x) = f X f Y (x) = f X (y)f Y (x y)dy. exp. exp. dy, (1) f X+Y (x) = j= σ2 2) exp x 2 ) Εστω X : Ω R d τυχαίο διάνυσμα με ΠΟΛΥΔΙΑΣΤΑΤΗ ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ X Εχουμε δει ότι η γνώση της κατανομής καθεμιάς από τις X, X,, X d δεν αρκεί για να προσδιορίσουμε την κατανομή του X, αφού δεν περιέχει

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11 2. Σύνολα..............................................................

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

HMY 799 1: Αναγνώριση Συστημάτων

HMY 799 1: Αναγνώριση Συστημάτων HMY 799 : Αναγνώριση Συστημάτων Διάλεξη Στοχαστικές Τυχαίες Μεταβλητές/ Στοχαστικά Σήματα Πειραματικά δεδομένα >Επιλογή τύπου μοντέλου >Επιλογή κριτηρίου >Υπολογισμός >Επικύρωση Προσαρμογή καμπύλης (Curve

Διαβάστε περισσότερα

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Ελλιπή δεδομένα. Εδώ έχουμε 1275. Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων Ελλιπή δεδομένα Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 75 ατόμων Εδώ έχουμε δ 75,0 75 5 Ηλικία Συχνότητες f 5-4 70 5-34 50 35-44 30 45-54 465 55-64 335 Δεν δήλωσαν 5 Σύνολο 75 Μπορεί

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

f(y) dy = b a dy = b a x f(x) dx = b a dx = x 2 = b2 a 2 2(b a) b a dx = = (a2 + ab + b 2 )(b a) 3(b a)

f(y) dy = b a dy = b a x f(x) dx = b a dx = x 2 = b2 a 2 2(b a) b a dx = = (a2 + ab + b 2 )(b a) 3(b a) Κεφάλαιο 11 Συνεχείς κατανομές και ο Ν.Μ.Α. Στο προηγούμενο κεφάλαιο ορίσαμε την έννοια της συνεχούς τυχαίας μεταβλητής, και είδαμε τις βασικές της ιδιότητες. Εδώ θα περιγράψουμε κάποιους ιδιαίτερους τύπους

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ . ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ. Μέγιστα και Ελάχιστα Συναρτήσεων Χωρίς Περιορισμούς Συναρτήσεις μιας Μεταβλητής Εστω f ( x) είναι συνάρτηση μιας μόνο μεταβλητής. Εστω επίσης ότι x είναι ένα σημείο στο πεδίο ορισμού

Διαβάστε περισσότερα

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Προϋποθέσεις Εφαρμογής

Διαβάστε περισσότερα

Μέθοδος μέγιστης πιθανοφάνειας

Μέθοδος μέγιστης πιθανοφάνειας Αν x =,,, παρατηρήσεις των Χ =,,,, τότε έχουμε διαθέσιμο ένα δείγμα Χ={Χ, =,,,} της κατανομής F μεγέθους με από κοινού σκ της Χ f x f x Ορισμός : Θεωρούμε ένα τυχαίο δείγμα Χ=(Χ, Χ,, Χ ) από πληθυσμό το

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2014 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής Με λόγια, η f ( x, y) δίνει την πιθανότητα να εμφανισθεί

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας

Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ. M. Kούτρας Επισκόπηση ύλης Πιθανοτήτων Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ M. Kούτρας Πειραιάς, 2015 1 Από κοινού συνάρτηση πιθανότητας μιας δισδιάστατης διακριτής τυχαίας μεταβλητής

Διαβάστε περισσότερα

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ Αναγνώριση Προτύπων Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ Χριστόδουλος Χαμζάς Τα περιεχόμενο της παρουσίασης βασίζεται στο βιβλίο: Introduction to Pattern Recognition A Matlab Approach, S. Theodoridis,

Διαβάστε περισσότερα

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8 ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ Άλγεβρα 1 ο Κεφάλαιο 1. Τι ονομάζουμε αριθμητική και τι αλγεβρική παράσταση; Να δώσετε από ένα παράδειγμα. Μια παράσταση που περιέχει πράξεις με αριθμούς, καλείται αριθμητική παράσταση,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1 ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1 5.1: Εισαγωγή 5.2: Πιθανότητες 5.3: Τυχαίες Μεταβλητές καθ. Βασίλης Μάγκλαρης

Διαβάστε περισσότερα

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή

Στατιστική. Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3 η : Χαρακτηριστικά Τυχαίων Μεταβλητών Θεωρητικές Κατανομές Πιθανότητας για Διακριτή Τυχαία Μεταβλητή Γεώργιος Ζιούτας Άδειες

Διαβάστε περισσότερα

= 7. Στο σημείο αυτό θα υπενθυμίσουμε κάποιες βασικές ιδιότητες του μετασχηματισμού Laplace, δηλαδή τις

= 7. Στο σημείο αυτό θα υπενθυμίσουμε κάποιες βασικές ιδιότητες του μετασχηματισμού Laplace, δηλαδή τις 1. Εισαγωγή Δίνεται η συνάρτηση μεταφοράς = = 1 + 6 + 11 + 6 = + 6 + 11 + 6 =. 2 Στο σημείο αυτό θα υπενθυμίσουμε κάποιες βασικές ιδιότητες του μετασχηματισμού Laplace, δηλαδή τις L = 0 # και L $ % &'

Διαβάστε περισσότερα

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο ΓΕΝΙΚΑ ΠΕΡΙ ΑΝΙΣΩΣΕΩΝ Έστω f σύνολο Α, g Α ΒΑΘΜΟΥ είναι δύο παραστάσεις μιας μεταβλητής πού παίρνει τιμές στο Ανίσωση με έναν άγνωστο λέγεται κάθε σχέση της μορφής f f g g ή, η οποία αληθεύει για ορισμένες

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2016-2017 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων Τοπογράφων Μηχανικών

Διαβάστε περισσότερα

Τυχαία μεταβλητή (τ.μ.)

Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) είναι μια συνάρτηση X ( ) με πεδίο ορισμού το δειγματικό χώρο Ω του πειράματος και πεδίο τιμών ένα υποσύνολο πραγματικών αριθμών που συμβολίζουμε συνήθως

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση) TETY Εφαρμοσμένα Μαθηματικά Ενότητα ΙΙ: Γραμμική Άλγεβρα Ύλη: Διανυσματικοί χώροι και διανύσματα, μετασχηματισμοί διανυσμάτων, τελεστές και πίνακες, ιδιοδιανύσματα και ιδιοτιμές πινάκων, επίλυση γραμμικών

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ Σε κάθε αποτέλεσμα του πειράματος αντιστοιχεί μία αριθμητική τιμή Μαθηματικός ορισμός: Τυχαία μεταβλητή X είναι

Διαβάστε περισσότερα

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ Σκοπός Οι δειγματικοί χώροι, ανάλογα με τη φύση και τον τρόπο έκφρασης των ενδεχομένων τους κατατάσσονται σε ποσοτικούς και ποιοτικούς. Προφανώς ο υπολογισμός πιθανοτήτων

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 4: Πολυδιάστατες Τυχαίες Μεταβλητές Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Άδειες

Διαβάστε περισσότερα

Τυχαία Διανύσματα και Ανεξαρτησία

Τυχαία Διανύσματα και Ανεξαρτησία Τυχαία Διανύσματα και Ανεξαρτησία Θα γενικεύσουμε την έννοια της τυχαίας μεταβλητής από συνάρτηση στο R σε συνάρτηση στο R n. Ακολούθως, θα επεκτείνουμε τις έννοιες με τις οποίες ασχοληθήκαμε μέχρι τώρα

Διαβάστε περισσότερα

Θέματα ενδοσχολικών εξετάσεων Άλγεβρας Α Λυκείου Σχ. έτος , Ν. Δωδεκανήσου ΘΕΜΑΤΑ ΕΝΔΟΣΧΟΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΤΑΞΗ: Α ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΑΛΓΕΒΡΑ

Θέματα ενδοσχολικών εξετάσεων Άλγεβρας Α Λυκείου Σχ. έτος , Ν. Δωδεκανήσου ΘΕΜΑΤΑ ΕΝΔΟΣΧΟΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΤΑΞΗ: Α ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΑΛΓΕΒΡΑ Θέματα ενδοσχολικών εξετάσεων Άλγεβρας Α Λυκείου Σχ. έτος 013-014, Ν. Δωδεκανήσου ΘΕΜΑΤΑ ΕΝΔΟΣΧΟΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΤΑΞΗ: Α ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΑΛΓΕΒΡΑ ΣΧΟΛΙΚΟ ΕΤΟΣ: 013-014 Επιμέλεια: Καραγιάννης Ιωάννης Σχολικός

Διαβάστε περισσότερα

Σημειώσεις διαλέξεων: Βελτιστοποίηση πολυδιάστατων συνεχών συναρτήσεων 1 / 20

Σημειώσεις διαλέξεων: Βελτιστοποίηση πολυδιάστατων συνεχών συναρτήσεων 1 / 20 Σημειώσεις διαλέξεων: Βελτιστοποίηση πολυδιάστατων συνεχών συναρτήσεων Ισαάκ Η Λαγαρής 1 Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιον Ιωαννίνων 1 Με υλικό από το υπό προετοιμασία βιβλίο των: Βόγκλη,

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,

Διαβάστε περισσότερα

(p 1) (p m) (m 1) (p 1)

(p 1) (p m) (m 1) (p 1) ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Σκοπός της παραγοντικής ανάλυσης είναι να περιγράψει την συνδιασπορά μεταξύ των μεταβλητών με την βοήθεια τυχαίων άγνωστων ποσοτήτων που ονομάζονται παράγοντες. Το μοντέλο είναι το

Διαβάστε περισσότερα

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Τοπογραφικά Δίκτυα και Υπολογισμοί 5 ο εξάμηνο, Ακαδημαϊκό Έτος 2017-2018 Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων και Τοπογράφων

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Σύμφωνα με στοιχεία από το Πανεπιστήμιο της Οξφόρδης η πιθανότητα ένας φοιτητής να αποφοιτήσει μέσα σε 5 χρόνια από την ημέρα εγγραφής του στο

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 14 Μαρτίου 018 1/34 Διαστήματα Εμπιστοσύνης. Εχουμε δει εκτενώς μέχρι τώρα τρόπους εκτίμησης

Διαβάστε περισσότερα

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης

Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης. Διάστημα εμπιστοσύνης Σφάλματα Μετρήσεων 4.45 Πίνακας 4.4 Διαστήματα Εμπιστοσύνης. Τιμές που Επίπεδο εμπιστοσύνης Διάστημα εμπιστοσύνης βρίσκονται εκτός του Διαστήματος Εμπιστοσύνης 0.500 X 0.674σ 1 στις 0.800 X 1.8σ 1 στις

Διαβάστε περισσότερα

ΤΕΤΥ Εφαρμοσμένα Μαθηματικά 1. Τελεστές και πίνακες. 1. Τελεστές και πίνακες Γενικά. Τι είναι συνάρτηση? Απεικόνιση ενός αριθμού σε έναν άλλο.

ΤΕΤΥ Εφαρμοσμένα Μαθηματικά 1. Τελεστές και πίνακες. 1. Τελεστές και πίνακες Γενικά. Τι είναι συνάρτηση? Απεικόνιση ενός αριθμού σε έναν άλλο. ΤΕΤΥ Εφαρμοσμένα Μαθηματικά 1 Τελεστές και πίνακες 1. Τελεστές και πίνακες Γενικά Τι είναι συνάρτηση? Απεικόνιση ενός αριθμού σε έναν άλλο. Ανάλογα, τελεστής είναι η απεικόνιση ενός διανύσματος σε ένα

Διαβάστε περισσότερα

Φυσική για Μηχανικούς

Φυσική για Μηχανικούς Φυσική για Μηχανικούς Ο νόμος του Gauss Εικόνα: Σε μια επιτραπέζια μπάλα πλάσματος, οι χρωματιστές γραμμές που βγαίνουν από τη σφαίρα αποδεικνύουν την ύπαρξη ισχυρού ηλεκτρικού πεδίου. Με το νόμο του Gauss,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό ΗΜΥ 429 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό 1 (i) Βασική στατιστική 2 Στατιστική Vs Πιθανότητες Στατιστική: επιτρέπει μέτρηση και αναγνώριση θορύβου και

Διαβάστε περισσότερα

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2) Κεφάλαιο 10 Συνεχείς τυχαίες μεταβλητές Σε αυτό το κεφάλαιο θα εξετάσουμε τις ιδιότητες που έχουν οι συνεχείς τυχαίες μεταβλητές. Εκείνες οι Τ.Μ. X, δηλαδή, των οποίων το σύνολο τιμών δεν είναι διακριτό,

Διαβάστε περισσότερα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας. Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς

Διαβάστε περισσότερα

HMY 799 1: Αναγνώριση Συστημάτων

HMY 799 1: Αναγνώριση Συστημάτων HMY 799 : Αναγνώριση Συστημάτων Διάλεξη Γραμμική παλινδρόμηση (Linear regression) Εμπειρική συνάρτηση μεταφοράς Ομαλοποίηση (smoothing) Y ( ) ( ) ω G ω = U ( ω) ω +Δ ω γ ω Δω = ω +Δω W ( ξ ω ) U ( ξ) G(

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Επεξεργασία Στοχαστικών Σημάτων

Επεξεργασία Στοχαστικών Σημάτων Επεξεργασία Στοχαστικών Σημάτων Σεραφείμ Καραμπογιάς Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής και Τηλεπικοινωνιών Η Έννοια της τυχαίας Διαδικασίας Η έννοια της τυχαίας διαδικασίας βασίζεται στην επέκταση

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Σημειακή επεξεργασία και μετασχηματισμοί Κατηγορίες μετασχηματισμού εικόνων Σημειακοί μετασχηματισμοί

Διαβάστε περισσότερα

Φεργαδιώτης Αθανάσιος ΤΡΑΠΕΖΑ ΘΕΜΑΤΩΝ ΣΤΗΝ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. Θέμα 2 ο (150)

Φεργαδιώτης Αθανάσιος ΤΡΑΠΕΖΑ ΘΕΜΑΤΩΝ ΣΤΗΝ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ. Θέμα 2 ο (150) Φεργαδιώτης Αθανάσιος ΤΡΑΠΕΖΑ ΘΕΜΑΤΩΝ ΣΤΗΝ ΑΛΓΕΒΡΑ Α ΛΥΚΕΙΟΥ Θέμα ο (150) -- Τράπεζα θεμάτων Άλγεβρας Α Λυκείου Φεργαδιώτης Αθανάσιος -3- Τράπεζα θεμάτων Άλγεβρας Α Λυκείου Φεργαδιώτης Αθανάσιος ΚΕΦΑΛΑΙΟ

Διαβάστε περισσότερα

1.4 Λύσεις αντιστρόφων προβλημάτων.

1.4 Λύσεις αντιστρόφων προβλημάτων. .4 Λύσεις αντιστρόφων προβλημάτων. Ο τρόπος παρουσίασης της λύσης ενός αντίστροφου προβλήµατος µπορεί να διαφέρει ανάλογα µε τη «φιλοσοφία» επίλυσης που ακολουθείται και τη δυνατότητα παροχής πρόσθετης

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΑΛΓΕΒΡΑΣ Α ΛΥΚΕΙΟΥ

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΑΛΓΕΒΡΑΣ Α ΛΥΚΕΙΟΥ ΘΕΜΑ ο Δίνεται η συνάρτηση f με τύπο : f( x) α. Να βρείτε το πεδίο ορισμού της. x x x x β. Να βρείτε τα σημεία τομής της με τους άξονες αν υπάρχουν. γ. Αν α, β ρίζες της εξίσωσης: ΘΕΜΑ ο Δίνεται η συνάρτηση

Διαβάστε περισσότερα

Α Λυκείου Άλγεβρα Τράπεζα Θεμάτων Το Δεύτερο Θέμα

Α Λυκείου Άλγεβρα Τράπεζα Θεμάτων Το Δεύτερο Θέμα Α Λυκείου Άλγεβρα Τράπεζα Θεμάτων Το Δεύτερο Θέμα Θεωρούμε την ακολουθία (α ν ) των θετικών περιττών αριθμών: 1, 3, 5, 7, α) Να αιτιολογήσετε γιατί η (α ν ) είναι αριθμητική πρόοδος και να βρείτε τον εκατοστό

Διαβάστε περισσότερα

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall 3..2 Ο Συντελεστής Συσχέτισης τ Του Kendall Ο συντελεστής συχέτισης τ του Kendall μοιάζει με τον συντελεστή ρ του Spearman ως προς το ότι υπολογίζεται με βάση την τάξη μεγέθους των παρατηρήσεων και όχι

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς Καστοριά, Ιούλιος 14 A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας

Διαβάστε περισσότερα

X(t) = sin(2πf t) (1)

X(t) = sin(2πf t) (1) Στοχαστικές Διαδικασίες πίνακας περιεχομένων Κινητικότης.................................... Στασιμότης..................................... 6 Λανθάνουσες ισχείς............................... 1 Γκαουσιανή

Διαβάστε περισσότερα

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Μαθηματικά Ενότητα 2: Διαφορικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Παρεμβολή & πρόγνωση άγνωστης συνάρτησης μέσω σημειακής προσαρμογής

Παρεμβολή & πρόγνωση άγνωστης συνάρτησης μέσω σημειακής προσαρμογής Ειδικά Θέματα Συνορθώσεων & Εφαρμογές 8 ο εξάμηνο, Ακαδημαϊκό έτος 2018-2019 Παρεμβολή & πρόγνωση άγνωστης συνάρτησης μέσω σημειακής προσαρμογής (Least squares collocation) Χριστόφορος Κωτσάκης Τμήμα Αγρονόμων

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΘΕΜΑ 2. Θεωρούμε την ακολουθία (α ν ) των θετικών περιττών αριθμών: 1, 3, 5, 7,

ΘΕΜΑ 2. Θεωρούμε την ακολουθία (α ν ) των θετικών περιττών αριθμών: 1, 3, 5, 7, Θεωρούμε την ακολουθία (α ν ) των θετικών περιττών αριθμών: 1, 3, 5, 7, α) Να αιτιολογήσετε γιατί η (α ν ) είναι αριθμητική πρόοδος και να βρείτε τον εκατοστό όρο της. (Μονάδες 15) β) Να αποδείξετε ότι

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ Συναρτήσεις Προεπισκόπηση Κεφαλαίου Τα μαθηματικά είναι μια γλώσσα με ένα συγκεκριμένο λεξιλόγιο και πολλούς κανόνες. Πριν ξεκινήσετε το ταξίδι σας στον Απειροστικό Λογισμό, θα πρέπει να έχετε εξοικειωθεί

Διαβάστε περισσότερα