ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ"

Transcript

1 ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «ΑΝΑΠΤΥΞΗ ΣΤΑΤΙΣΤΙΚΩΝ ΓΛΩΣΣΙΚΩΝ ΜΟΝΤΕΛΩΝ ΓΙΑ ΤΑ ΕΛΛΗΝΙΚΑ ΜΕ ΧΡΗΣΗ ΡΙΖΑΣ ΚΑΙ ΜΕΡΟΥΣ ΤΟΥ ΛΟΓΟΥ» ΙΠΛΑΡΗΣ ΣΩΤΗΡΗΣ ΠΡΑΤΣΟΛΗΣ ΗΜΗΤΡΗΣ Επιβλέπων: Καθηγητής ιγαλάκης Βασίλης Εξεταστική Επιτροπή: Καθηγητής Πατεράκης Μιχάλης Καθηγητής Κουµπαράκης Μανώλης Χανιά, Ιούνιος 200

2 Σελίδα ΕΥΧΑΡΙΣΤΙΕΣ Θα θέλαµε να εκφράσουµε τις ειλικρινείς µας ευχαριστίες στον καθηγητή κ. Βασίλη ιγαλάκη, που µας εµπιστεύτηκε το θέµα, και κυρίως για την καθοδήγησή του και τις πολύτιµες συµβουλές του, που βοήθησαν σηµαντικά στην ολοκλήρωση της διπλωµατικής αυτής εργασίας. Επιπλέον, για την ευκαιρία που µας έδωσε να αποκτήσουµε σηµαντικές εµπειρίες πάνω σε έναν συνεχώς αναπτυσσόµενο τοµέα, όπως αυτός της αναγνώρισης φωνής. Επίσης, θα θέλαµε να ευχαριστήσουµε τους αναγνώστες της εργασίας µας, καθηγητές κ. Μιχάλη Πατεράκη και κ. Μανώλη Κουµπαράκη για τον χρόνο που διέθεσαν για να κάνουν τις παρατηρήσεις τους. Ευχαριστούµε τους συναδέλφους µας στο Εργαστήριο Τηλεπικοινωνιών για την κατανόησή τους κάθε φορά που βρεθήκαµε αντιµέτωποι µε κάποιο πρόβληµα. Ιδιαίτερα ευχαριστούµε τον ηµήτρη Οικονοµίδη για τις πολύτιµες υποδείξεις του πάνω σε γλωσσικά µοντέλα. Τέλος, χρωστάµε ευγνωµοσύνη στις οικογένειές µας, χωρίς την υλική και ηθική συµπαράσταση των οποίων,δε θα ήταν δυνατή η ολοκλήρωση των σπουδών µας, καθώς και σε όλους τους φίλους µας, εδώ στα Χανιά, από τους οποίους αντλούσαµε δύναµη για να συνεχίσουµε την προσπάθειά µας. Σωτήρης ιπλάρης ηµήτρης Πρατσόλης Πολυτεχνείο Κρήτης Ιούνιος 200

3 Σελίδα 2 «Αφιερώνεται στους γονείς µου. Στους δύο ανθρώπους που, µε τις θυσίες τους, µου έχουν δώσει το δικαίωµα να κάνω όνειρα για τη ζωή µου...» ηµήτρης Πρατσόλης

4 Σελίδα 3 «Αφιερώνεται στην οικογένειά µου» Σωτήρης ιπλάρης

5 Σελίδα 4 ΠΕΡΙΕΧΟΜΕΝΑ ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ 7 ΛΙΣΤΑ ΠΙΝΑΚΩΝ 8 ΛΙΣΤΑ ΓΡΑΦΙΚΩΝ ΠΑΡΑΣΤΑΣΕΩΝ 9 ΚΕΦΑΛΑΙΟ : ΕΙΣΑΓΩΓΗ. Το πρόβληµα της αναγνώρισης φωνής 3.. Προεπεξεργασία του σήµατος φωνής 6..2 Το ακουστικό µοντέλο Το γλωσσικό µοντέλο 7.2 Σκοπός της διπλωµατικής εργασίας 8.3 οµή της διπλωµατικής εργασίας 9 ΚΕΦΑΛΑΙΟ 2: ΤΕΧΝΙΚΕΣ ΓΛΩΣΣΙΚΩΝ ΜΟΝΤΕΛΩΝ 2 2. Εισαγωγή στα γλωσσικά µοντέλα Additive smoothing Εκτιµήτρια Good-Turing Jelineck-Mercer smoothing Katz Smoothing Absolute Discounting Περίληψη αλγορίθµων Γλωσσικά µοντέλα βασισµένα σε κλάσεις Κλάσεις λέξεων Υπολογισµός της απόδοσης ενός γλωσσικού µοντέλου (Perplexity) Πληροφορία, εντροπία και αβεβαιότητα από την οπτική γωνία της θεωρίας πληροφοριών Αξιολόγηση του µέτρου της αβεβαιότητας (perplexity) Word-error-rate N-best rescoring Lattice rescoring 56 ΚΕΦΑΛΑΙΟ 3: ΑΛΓΟΡΙΘΜΟΣ STEMMING ΓΙΑ ΤΑ ΕΛΛΗΝΙΚΑ 58

6 Σελίδα Εισαγωγή Stemmer για τα ελληνικά Αποτελέσµατα και αξιολόγηση του αλγορίθµου Stemming για τα ελληνικά64 ΚΕΦΑΛΑΙΟ 4: N-POS ΜΟΝΤΕΛΑ Ένα γενικευµένο N-pos µοντέλο ιαδικασία POS tagging στις λέξεις του κειµένου εκπαίδευσης (training corpus) Εµπλουτισµός του POS λεξικού 77 ΚΕΦΑΛΑΙΟ 5: CLASS-BASED ΓΛΩΣΣΙΚΑ ΜΟΝΤΕΛΑ ΜΕ ΧΡΗΣΗ STEMMING ΚΑΙ PART-OF-SPEECH 8 5. Εισαγωγή ngram-count disambig ngram Βασικό Backoff Bigram µοντέλο Class-based bigram γλωσσικά µοντέλα µε χρησιµοποίηση stemming Suffix-based γλωσσικό µοντέλο Root-based γλωσσικό µοντέλο Class-based bigram γλωσσικό µοντέλο µε χρησιµοποίηση POS Class-based γλωσσικό µοντέλο µε συνδυασµό stemming και POS Υβριδικά γλωσσικά µοντέλα µε συνδυασµό κλάσεων και λέξεων Γλωσσικά µοντέλα µεγαλύτερης τάξης 98 KΕΦΑΛΑΙΟ 6: ΑΠΟΤΕΛΕΣΜΑΤΑ ΚΑΙ ΣΧΟΛΙΑΣΜΟΣ 0 6. Βασικό Backoff Bigram µοντέλο Class-based bigram γλωσσικά µοντέλα µε χρησιµοποίηση stemming Class-based bigram γλωσσικό µοντέλο µε χρησιµοποίηση POS Class-based γλωσσικό µοντέλο µε συνδυασµό stemming και POS Υβριδικά γλωσσικά µοντέλα µε συνδυασµό κλάσεων και λέξεων Γλωσσικά µοντέλα µεγαλύτερης τάξης 3

7 Σελίδα 6 ΚΕΦΑΛΑΙΟ 7: ΣΥΜΠΕΡΑΣΜΑΤΑ-ΜΕΛΛΟΝΤΙΚΕΣ ΕΠΕΚΤΑΣΕΙΣ 7 7. Συµπεράσµατα Μελλοντικές επεκτάσεις 8 ΠΑΡΑΡΤΗΜΑ Α: ΣΤΑΤΙΣΤΙΚΑ ΣΤΟΙΧΕΙΑ ΚΕΙΜΕΝΩΝ 9 ΠΑΡΑΡΤΗΜΑ Β: ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΚΕΙΜΕΝΩΝ 20 ΠΑΡΑΡΤΗΜΑ Γ: ΚΩ ΙΚΑΣ STEMMER 22 ΠΑΡΑΡΤΗΜΑ : ΜΟΡΦΗ ΓΛΩΣΣΙΚΩΝ ΜΟΝΤΕΛΩΝ 28 ΠΑΡΑΡΤΗΜΑ Ε: ΤΟ ΓΕΝΙΚΕΥΜΕΝΟ N-POS MONTEΛΟ - ΜΕΡΟΣ Α 32 ΠΑΡΑΡΤΗΜΑ ΣΤ: ΤΟ ΓΕΝΙΚΕΥΜΕΝΟ N-POS MONTEΛΟ ΜΕΡΟΣ Β 34 ΠΑΡΑΡΤΗΜΑ Ζ: ΟΡΙΣΜΟΙ POS ΚΛΑΣΕΩΝ 36 ΠΑΡΑΡΤΗΜΑ Η: ΚΩ ΙΚΕΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ SCRIPTS 40 ΒΙΒΛΙΟΓΡΑΦΙΑ 93

8 Σελίδα 7 Λίστα Σχηµάτων Σχήµα.:Εποπτική εικόνα ενός συστήµατος αναγνώρισης φωνής...5 Σχήµα.2: Ένα απλό σύστηµα αναγνώρισης φωνής...7 Σχήµα Σχήµα 2.2: Το σύνολο των πιθανών προτάσεων, κατά την αναζήτηση, σαν δοµή δέντρου...52 Σχήµα 2.3:Το πεδίο αναζήτησης όταν χρησιµοποιούµε bigram γλωσσικό µοντέλο...54 Σχήµα 2.4:Το πεδίο αναζήτησης όταν χρησιµοποιούµε trigram γλωσσικό µοντέλο...55 Σχήµα 3.:Εφαρµογή κανόνων stemming...62 Σχήµα 3.2:Κανόνες stemming...63

9 Σελίδα 8 Λίστα Πινάκων Πίνακας 3.: Aποτελέσµατα της εφαρµογής του stemming αλγορίθµου στα διάφορα λεξικά...64 Πίνακας 5.:Χαρακτηριστικά των υβριδικών µοντέλων...97 Πίνακας 6.:Perplexity baseline bigram µοντέλων ανοιχτού λεξικού 64Κ...0 Πίνακας 6.2:Perplexity και WER baseline bigram µοντέλων κλειστού λεξικού 64Κ και 40Κ...02 Πίνακας 6.3 :Perplexity και WER stemmed γλωσσικών µοντέλων...03 Πίνακας 6.4: Perplexity POS-based γλωσσικού µοντέλου...04 Πίνακας 6.5: Perplexity και WER συνδυασµένου POS-stemmed γλωσσικού µοντέλου...06 Πίνακας 6.6: Perplexity και WER υβριδικών µοντέλων που προέκυψαν από λεξικό 64K...08 Πίνακας 6.7: Perplexity και WER υβριδικών µοντέλων που προέκυψαν από λεξικό 40K...09 Πίνακας 6.8: Perplexity baseline trigram µοντέλου ανοιχτού λεξικού 64Κ...4 Πίνακας 6.9: Perplexity και WER baseline trigram µοντέλων κλειστού λεξικού διαφόρων µεγεθών...5 Πίνακας Α.: Στατιστικά στοιχεία κειµένων...2

10 Σελίδα 9 Λίστα Γραφικών Παραστάσεων Γραφική παράσταση 6.: Peprlexity µοντέλων που χρησιµοποιούν stemming...04 Γραφική παράσταση 6.2: Σύγκριση perplexity POS και stemmed µοντέλων...05 Γραφική παράσταση 6.3: Σύγκριση perplexity POS,stemmed και συνδυασµένου POSstemmed µοντέλων...06 Γραφική παράσταση 6.4 Σύγκριση perlexity διαφόρων υβριδικών µοντέλων λεξικού 64Κ λέξεων...0 Γραφική παράσταση 6.5 :Σύγκριση perlexity διαφόρων υβριδικών µοντέλων λεξικού 40Κ λέξεων...0 Γραφική παράσταση 6.6: Σύγκριση WER (%) διαφόρων υβριδικών µοντέλων λεξικού 64Κ λέξεων... Γραφική παράσταση 6.7: Σύγκριση WER (%) διαφόρων υβριδικών µοντέλων λεξικού 40Κ λέξεων... Γραφική παράσταση 6.8: Perplexity και WER (%) των διαφόρων υβριδικών µοντέλων λεξικού 64Κ...2 Γραφική παράσταση 6.9: Perplexity και WER (%) των διαφόρων υβριδικών µοντέλων λεξικού 40Κ...2 Γραφική παράσταση 6.0: Mεταβολή του αριθµού των λέξεων και των κλάσεων στα λεξικά των διαφόρων υβριδικών µοντέλων (64Κ)...3 Γραφική παράσταση 6.: Mεταβολή του αριθµού των λέξεων και των κλάσεων στα λεξικά των διαφόρων υβριδικών µοντέλων (40Κ)...3

11 Σελίδα 0 Γραφική παράσταση 6.2: WER (%) word-trigram µοντέλων µε διαφορετικό µέγεθος λεξικού...7

12 Σελίδα Κεφάλαιο Εισαγωγή Η έρευνα που γίνεται πάνω στα γλωσσικά µοντέλα έχει ως σκοπό την ανάπτυξη υπολογιστικών τεχνικών και δοµών που περιγράφουν ακολουθίες λέξεων όπως αυτές παράγονται από τους ανθρώπους. Τέτοια µοντέλα µπορούν να δηµιουργηθούν για να παρέχουν εκτιµήσεις της ορθότητας και της αληθοφάνειας δεδοµένων δειγµάτων κειµένου και έχουν γίνει απαραίτητα εργαλεία για διάφορα ερευνητικά πεδία. Η διπλωµατική αυτή εργασία αναφέρεται στην εφαρµογή των µοντέλων αυτών στην επεξεργασία φωνής, η οποία έχει εξελιχθεί σε ένα κύριο ερευνητικό πεδίο τα 30 τελευταία χρόνια. Ο βασικός στόχος αυτή τη στιγµή είναι είναι η ανάπτυξη αναγνωριστών µε µεγάλο µέγεθος λεξικού (large-vocabulary recognisers) για φυσικό, αυθόρµητο και συνεχή λόγο. Παρά τη σταθερή πρόοδο, όµως, η βελτίωση κάποιων παραγόντων είναι ακόµα απαραίτητη πριν γίνει εφικτή η εκτεταµένη βιοµηχανική χρήση των αναγνωριστών. Αλλά το πολύ ευρύ φάσµα των δυνατών εφαρµογών µπορεί να εγγυηθεί ότι η τεχνολογία αυτή θα κερδίσει πολύ έδαφος, όταν ωριµάσει. ύο βασικές προσεγγίσεις της µοντελοποίησης της ανθρώπινης γλώσσας µπορούν να προσδιοριστούν. Η πρώτη βασίζεται στην συντακτική και σηµασιολογική ανάλυση του κειµένου για να καθορίσει την ιεραρχική δοµή των προτάσεων. Μια τέτοια ανάλυση χρησιµοποιεί µια σειρά κανόνων για να διαπιστωθεί το αν µια πρόταση είναι επιτρεπτή ή όχι. Αν και η προσέγγιση αυτή είναι δυνατόν να περιγράψει ένα σηµαντικό ποσοστό µιας γλώσσας, η πλήρης κάλυψη της είναι σχεδόν αδύνατη, κυρίως λόγω των συνεχών αλλαγών που συµβαίνουν σε µια γλώσσα. Επιπλέον, κάποιες φραστικές διατυπώσεις (utterances) που παρατηρούνται σε µια γλώσσα και δεν είναι σωστές γραµµατικά, δεν µπορούν να περιγραφούν από µια τέτοια ανάλυση.

13 Σελίδα 2 Από την άλλη µεριά, µια δεύτερη προσέγγιση βασιζόµενη σε στατιστικές τεχνικές έχει µεγαλύτερη ευρωστία σε γραµµατικές ανωµαλίες. Τέτοια στατιστικά γλωσσικά µοντέλα (statistical language models) αντιστοιχούν σε κάθε λέξη µιας φραστικής διατύπωσης µια τιµή πιθανότητας σύµφωνα µε την εκτιµώµενη πιθανοφάνεια της ανάµεσα στα συµφραζόµενα της ακολουθίας λέξεων που περιβάλλει την συγκεκριµένη λέξη. Αυτές οι πιθανότητες συνάγονται από ένα κείµενο µεγάλου µεγέθους, στο οποίο αναφερόµαστε ως κείµενο εκπαίδευσης (training text). Με τον τρόπο αυτό το γλωσσικό µοντέλο µπορεί να αντικατοπτρίζει τη χρήση της γλώσσας όπως αυτή χρησιµοποιείται στην πράξη, και όχι µόνο την γραµµατική της εξειδανίκευση. Ένα µεγάλο πλεονέκτηµα είναι το ότι το µέγεθος των διαθέσιµων κειµένων εκπαίδευσης στις µέρες µας κυµαίνεται πια σε εκατοντάδες εκατοµµύρια λέξεις. Ένα σύστηµα αναγνώρισης φωνής πρέπει να βρίσκει την πιο πιθανή υπόθεση πρότασης (sentence hypothesis) για κάθε φραστική διατύπωση. Στο συνεχή λόγο, όχι µόνο κάποιες λέξεις θα είναι άγνωστες, αλλά επίσης και τα όριά τους στο χρόνο. Για µεγάλα λεξικά αυτό συνεπάγεται ένα εξαιρετικά υψηλό αριθµό πιθανών εναλλακτικών κατατµήσεων του ακουστικού σήµατος σε λέξεις. Σε αυτό το σηµείο, το γλωσσικό µοντέλο υπολογίζει την γλωσσική ορθότητα και αληθοφάνεια µέρους ή ολόκληρων των υποθέσεων. Σε συνδυασµό µε το υπόλοιπο σύστηµα αναγνώρισης, η εκτίµηση αυτή βοηθά στο να βρεθούν εκείνες οι υποθέσεις που είναι πιο πιθανό να οδηγήσουν στο σωστό αποτέλεσµα, όπως επίσης και εκείνες οι υποθέσεις που µπορούν να απορριφθούν µε στόχο τον περιορισµό του αριθµού των υποθέσεων σε πρακτικά επίπεδα. Αν και η συγκεκριµένη διπλωµατική εργασία εστιάζει στην εφαρµογή των γλωσσικών µοντέλων σε συστήµατα αναγνώρισης φωνής, τα γλωσσικά µοντέλα είναι σηµαντική παράµετρος και σε άλλες εφαρµογές όπως η αναγνώριση γραφικού χαρακτήρα, ορθογραφική διόρθωση, part-of-speech tagging. Οι επόµενες παράγραφοι περιγράφουν τα κύρια µέρη στα οποία µπορεί να διαιρεθεί ένα σύστηµα αναγνώρισης φωνής, αναδεικνύουν το ρόλο των γλωσσικών µοντέλων και σκιαγραφούν το πεδίο της διπλωµατικής αυτής εργασίας.

14 Σελίδα 3. Το πρόβληµα της αναγνώρισης φωνής Στην αναγνώριση φωνής, ο σκοπός είναι να βρεθεί η περισσότερο πιθανή ακολουθία λέξεων w, δεδοµένων των ακουστικών δεδοµένων x που έχουν παρατηρηθεί. Αυτό επιτυγχάνεται βρίσκοντας την κατάλληλη ακολουθία λέξεων w που µεγιστοποιεί την υπό συνθήκη πιθανότητα P(w x). Από τον κανόνα του Bayes έχουµε, P( x w) P( w) P( w x) = (.) P( x) αλλά καθώς το P(x) είναι σταθερό για ένα δεδοµένο ακουστικό σήµα, µία ισοδύναµη στρατηγική είναι να υπολογίσουµε την ποσότητα : arg max w { P( x w) P( w) }, (.2) όπου argmax συµβολίζει το όρισµα που µεγιστοποιεί την αντίστοιχη ποσότητα. Η ποσότητα που πρέπει να µεγιστοποιηθεί είναι το γινόµενο των πιθανοτήτων P(w) και P(x w). Το P(x w) αναπαριστά την πιθανότητα εµφάνισης µιας ακολουθίας ακουστικών διανυσµάτων x, δεδοµένης µιας ακολουθίας λέξεων w. Η πιθανότητα αυτή υπολογίζεται από το ακουστικό µέρος του αναγνωριστή και είναι γνωστή ως ακουστικό µοντέλο (acoustic model). Ο όρος P(w) αναπαριστά την εκτίµηση της εκ των προτέρων (a-priori) πιθανότητας µιας δεδοµένης ακολουθίας λέξεων w, ανεξάρτητα από το ακουστικό σήµα που παρατηρήθηκε. Η εκτίµηση γίνεται µε βάση κάποιο στατιστικό µοντέλο και η πιθανότητα είναι γνωστή ως γλωσσικό µοντέλο (language model). Ας θεωρήσουµε την ακολουθία λέξεων w= «το καλοκαίρι κάνει πολλή ζέστη». Τότε ένα γλωσσικό µοντέλο θα υπολόγιζε την P(w) ως εξής: P(w)= P(«το καλοκαίρι κάνει πολλή ζέστη»)= = P(«το») P(«καλοκαίρι» «το») P(«κάνει» «το καλοκαίρι») P(«πολλή» «το καλοκαίρι κάνει») P(«ζέστη» «το καλοκαίρι κάνει πολλή»)

15 Σελίδα 4 Η γλωσσική µονάδα που µοντελοποιείται είναι συνήθως η λέξη. Για να υπάρχει η δυνατότητα γενίκευσης και να µοντελοποιούνται λέξεις που δεν παρατηρήθηκαν στα δεδοµένα εκπαίδευσης, χρησιµοποιούνται µικρότερες γλωσσικές µονάδες όπως το φώνηµα (phoneme) ή η συλλαβή. Η όλη διαδικασία ονοµάζεται σχεδίαση του ακουστικού µοντέλου. Στην παρούσα εφαρµογή κάθε λέξη µετατρέπεται σε µία ακολουθία βασικών ήχων, τα φωνήµατα, χρησιµοποιώντας ένα λεξικό προφορών (dictionary). Το λεξικό προφορών είναι ένα αρχείο που περιέχει τις ηχητικές αποδόσεις όλων των λέξεων που περιέχονται στη γραµµατική και πρέπει να συνταχθεί ώστε να περιγράφει ακριβώς τις προφορές των λέξεων ακόµη και µε περισσότερους του ενός τρόπους. Η δοµή ενός τέτοιου λεξικού φαίνεται µε το εξής παράδειγµα: άγνωστες a+ j n o s t e s άνθρωπος a+ n th r o p o s δυναµικών dh i n a m i k o n κωνσταντίνος k o n s t a d i+ n o s κωνσταντίνος k o s t a d i+ n o s νοικιασµένο n i k2 y a s m e+ n o... Όλα τα παραπάνω φαίνονται στο Σχήµα., όπου περιγράφεται η διαδικασία υπολογισµού της πιθανότητας P(x w) µιας ακολουθίας λέξεων w δεδοµένου ενός παραµετροποιηµένου ακουστικού σήµατος x.

16 Σελίδα 5 Σχήµα.

17 Σελίδα 6.. Προεπεξεργασία του σήµατος φωνής Το σήµα φωνής που παράγεται από ένα µικρόφωνο ή µια συσκευή εγγραφής είναι στη µορφή ενός αναλογικού ηλεκτρικού σήµατος. Το σήµα αυτό επεξεργάζεται σε µια µορφή κατάλληλη για χρήση από το σύστηµα αναγνώρισης φωνής, από µια σειρά λειτουργιών στην οποία αναφερόµαστε ως προεπεξεργασία σήµατος (front-end). Συνήθως αυτά τα βήµατα περιλαµβάνουν περιορισµό του εύρους του σήµατος (band limiting), δειγµατοληψία του και στη συνέχεια εφαρµογή κάποιων φασµατικών µετασχηµατισµών για να κωδικοποιηθούν τα χαρακτηριστικά της συχνότητας του σήµατος. Το τελευταίο αυτό βήµα περιλαµβάνει τον διακριτό µετασχηµατισµό Fourier βραχέως χρόνου (short-time discrete Fourier transform), και µια συγκεκριµένη δηµοφιλής επιλογή είναι να κωδικοποιηθεί το σήµα σαν συντελεστές Cepstrum []. Το αποτέλεσµα είναι µια διακριτού χρόνου σειρά από διανύσµατα παρατηρήσεως (observation vectors), η οποία είναι και η έξοδος του front-end. Η έξοδος του front-end περνάει στη συνέχεια στον αλγόριθµο αναγνώρισης...2 Το ακουστικό µοντέλο Το ακουστικό µοντέλο είναι κεντρική έννοια σε κάθε σύστηµα αναγνώρισης φωνής και είναι ένας τρόπος κωδικοποίησης των ήχων που εµπεριέχονται στην ανθρώπινη φωνή. Η πιο επιτυχής µέθοδος κωδικοποίησης των ήχων της φωνής είναι η χρήση των κρυφών µαρκοβιανών µοντέλων (Hidden Markov Models). Περιγράφοντας τα διανύσµατα παρατήρησης σαν µια πιθανοτική χρονική σειρά, τα ΗΜΜs λαµβάνουν υπόψη την έµφυτη φυσική µεταβλητότητα των χαρακτηριστικών της ανθρώπινης φωνής. εδοµένου ενός αριθµού παραδειγµάτων ενός συγκεκριµένου ήχου στη µορφή των αντίστοιχων σειρών διανυσµάτων παρατήρησης X, οι παράµετροι του µοντέλου M µπορούν να ρυθµιστούν έτσι ώστε να αναπαριστούν µε τον καλύτερο τρόπο αυτά τα δεδοµένα µε µια πιθανοτική σηµασία, η οποία συχνά συµβολίζεται ως P(X M). Το µοντέλο µπορεί εποµένως να χρησιµοποιηθεί για τον υπολογισµό της πιθανότητας µιας νέας σειράς διανυσµάτων παρατήρησης αναφορικά µε τις παραµέτρους του, κι εποµένως να δώσει µια ένδειξη του πόσο όµοια είναι η

18 Σελίδα 7 νέα µέτρηση µε αυτές που αρχικά χρησιµοποιήθηκαν για να καθορίσουν τις παραµέτρους του µοντέλου. Η πιθανότητα αυτή χρησιµοποιείται για την εξαγωγή µιας στατιστικής απόφασης σχετικά µε την φραστική διατύπωση που πρόκειται να αναγνωριστεί όπως φαίνεται στο σχήµα που ακολουθεί. (Σχήµα.2). Σχήµα.2 Τα ΗΜΜs µπορούν να εκπαιδευτούν είτε για να µοντελοποιήσουν απ ευθείας ολόκληρες λέξεις, είτε για να µοντελοποιήσουν µικρότερες µονάδες λέξεων (φωνήµατα), οι οποίες συνδέονται για να σχηµατίσουν λέξεις. Αυτή η τελευταία προσέγγιση είναι αυτή που συνήθως επιλέγεται, καθώς ακόµα και για µικρού µεγέθους λεξικά, είναι πιθανό να µην υπάρχει επαρκές υλικό εκπαίδευσης για να καθοριστούν αξιόπιστα µοντέλα ολόκληρων λέξεων...3. Το γλωσσικό µοντέλο Ενώ το ακουστικό µοντέλο δείχνει πόσο πιθανό είναι µία ακολουθία λέξεων να ταιριάζει µε τα ακουστικά δεδοµένα, το γλωσσικό µοντέλο εκτιµά την a-priori πιθανότητα της ακολουθίας λέξεων αυτής καθεαυτής, π.χ. : ( w( 0, K )) P (.3),όπου w(0,k-)= w(0),w(),,w(k-) είναι η ακολουθία K ζητούµενων λέξεων, και η περισπωµένη δηλώνει εκτιµήτρια συνάρτηση. Η πιθανότητα αυτή µπορεί να βοηθήσει το σύστηµα αναγνώρισης φωνής να αποφασίσει σχετικά µε τους διάφορους

19 Σελίδα 8 πιθανούς, όµοια ακουστικούς, ανταγωνιζόµενους τρόπους κατάτµησης των διανυσµάτων παρατηρήσης σε λέξεις σύµφωνα µε την ακουστική τους πιθανότητα. Από τον ορισµό των υπό συνθήκη πιθανοτήτων, µπορούµε να αναλύσουµε την από κοινού πιθανότητα της ποσότητας (.3) σε ένα γινόµενο από υπό συνθήκη πιθανότητες. P Κ ι= 0 ( w(0, K ) ) = P( w( i) w(0, i ) ) (.4),όπου πρακτικά το w(0,-) υποδεικνύει το σύµβολο της αρχής της πρότασης (start of sentence symbol). Εφόσον η χρήση ενός γλωσσικού µοντέλου στη διαδικασία της αναγνώρισης φωνής συνήθως απαιτεί υπολογισµό των υπό συνθήκη πιθανοτήτων που εµφανίζονται στο δεξιό µέλος της εξίσωσης (.4), αυτές κανονικά υπολογίζονται κατευθείαν. Αναπτύσσοντας ένα γλωσσικό µοντέλο, ο κύριος σκοπός είναι να βρεθούν κατάλληλες δοµές που θα µοντελοποιήσουν τις πιθανοτικές εξαρτήσεις µεταξύ των λέξεων στη φυσική γλώσσα, και στη συνέχεια να χρησιµοποιηθούν αυτές οι δοµές για τον υπολογισµό είτε των υπό συνθήκη είτε των από κοινού πιθανοτήτων των ακολουθιών λέξεων..2 Σκοπός της διπλωµατικής εργασίας Στη διπλωµατική αυτή εργασία σκοπός µας είναι να κατασκευάσουµε γλωσσικά µοντέλα µεγάλου λεξιλογίου για τα ελληνικά. Τα γλωσσικά αυτά µοντέλα χρησιµοποιούνται για αναγνώριση οµιλίας και πιο συγκεκριµένα για υπαγόρευση ελληνικού κειµένου, στα πλαίσια του έργου «Λογοτυπογραφία Βελτίωση της ροής στο δηµοσιογραφικό χώρο µε σύστηµα αυτόµατης υπαγόρευσης ελληνικού κειµένου». Τα βασισµένα σε λέξεις γλωσσικά µοντέλα (word-based language models) µοντελοποιούν τη γλώσσα µε βάση τη σχέση µίας λέξης µε τις προηγούµενές της. Το µειονέκτηµά τους είναι ότι µε τον τρόπο αυτό δε λαµβάνονται υπόψη συντακτικά και γραµµατικά πρότυπα της γλώσσας. Ταυτόχρονα, σε σχετικά µικρά λεξικά όπου υπάρχει σποραδικότητα δεδοµένων, τα word-based γλωσσικά µοντέλα αποτυγχάνουν

20 Σελίδα 9 να αναπαραστήσουν µε ευρωστία (robustness) τη γλώσσα. Για το λόγο αυτό, για µια γλώσσα µε πλούσια µορφολογία όπως τα ελληνικά, χρησιµοποιούµε οµαδοποίηση λέξεων σε κλάσεις µε σκοπό την καλύτερη αναπαράστασή της, τουλάχιστον στις περιπτώσεις όπου υπάρχει σποραδικότητα δεδοµένων, δηλαδή όταν υπάρχει ανάγκη για µικρό σε µέγεθος λεξικό. Το αποτέλεσµα είναι η δηµιουργία πιο γενικευµένων γλωσσικών µοντέλων, που µπορούν να καλύψουν και bigrams λέξεων που δεν έχουν παρατηρηθεί στα κείµενα εκπαίδευσης. Υλοποιούµε και µελετούµε την απόδοση word-bigram backoff γλωσσικών µοντέλων, µοντέλων βασισµένων σε κλάσεις λέξεων (class-based language models), υβριδικών µοντέλων που περιέχουν συνδυασµό λέξεων και κλάσεων, καθώς και word-based µοντέλων µεγαλύτερης τάξης. Για την οµαδοποίηση των λέξεων σε κλάσεις χρησιµοποιούµε δύο προσεγγίσεις, καθώς και το συνδυασµό τους. Οι δύο αυτοί τρόποι οµαδοποίησης λέξεων είναι το stemming, δηλαδή η οµαδοποίηση λέξεων µε βάση την οµοιότητα της ρίζας ή της κατάληξής τους, και το part-of-speech tagging, δηλαδή η οµαδοποίηση λέξεων µε βάση το µέρος του λόγου ή τη γραµµατική ιδιότητά τους. Για την υλοποίηση του stemming αναπτύσσουµε έναν απλό αλγόριθµο stemming για τα ελληνικά που χωρίζει κάθε λέξη σε ρίζα και κατάληξη, ενώ για την υλοποίηση του part-of-speech tagging βασιζόµαστε σε part-of-speech αγγλοελληνικό λεξικό καθώς και σε κανόνες της ελληνικής γραµµατικής για τον εµπλουτισµό των κλάσεων..3 οµή της διπλωµατικής εργασίας Στο δεύτερο κεφάλαιο περιγράφονται οι βασικές τεχνικές κατασκευής n-gram γλωσσικών µοντέλων, οι περιπτώσεις word-based και class-based γλωσσικών µοντέλων, οι τρόποι µέτρησης της απόδοσης των γλωσσικών µοντέλων, καθώς και θέµατα υλοποίησής τους. Στο τρίτο κεφάλαιο παρουσιάζεται ο αλγόριθµος stemming για τα ελληνικά που αναπτύξαµε και τα αποτελέσµατα που έδωσε για διάφορες περιπτώσεις λεξικών. Η θεωρία στην οποία βασίζεται το part-of-speech tagging, καθώς και ο τρόπος που υλοποιήθηκε περιγράφεται στο τέταρτο κεφάλαιο. Στο πέµπτο κεφάλαιο παρουσιάζονται όλα τα γλωσσικά µοντέλα που αναπτύχθηκαν στα πλαίσια αυτής της διπλωµατικής, ο τρόπος που υλοποιήθηκαν, και τα χαρακτηριστικά

21 Σελίδα 20 τους. Τα αποτελέσµατα των πειραµάτων αυτών, καθώς και η ανάλυσή τους δίνονται στο έκτο κεφάλαιο, ενώ στο έβδοµο κεφάλαιο παρουσιάζονται τα συµπεράσµατα της διπλωµατικής εργασίας και οι πιθανές µελλοντικές επεκτάσεις.

22 Σελίδα 2 Κεφάλαιο 2 Τεχνικές γλωσσικών µοντέλων 2. Εισαγωγή στα γλωσσικά µοντέλα Τα γλωσσικά µοντέλα είναι ένας πρωτεύων παράγοντας σε πολλά πεδία, τα οποία περιλαµβάνουν την αναγνώριση φωνής, την αναγνώριση γραφικού χαρακτήρα, την ορθογραφική διόρθωση και άλλα. Η κυρίαρχη τεχνολογία στα γλωσσικά µοντέλα είναι τα n-gram µοντέλα. Ένα γλωσσικό µοντέλο, συνήθως, διατυπώνεται σαν µια κατανοµή πιθανότητας P(s) πάνω σε συµβολοσειρές s που προσπαθεί να αναπαραστήσει πόσο συχνά µια συµβολοσειρά s συµβαίνει σε µια πρόταση. Για παράδειγµα για ένα γλωσσικό µοντέλο που περιγράφει την ελληνική γλώσσα, µπορεί να έχουµε P(«γεια») 0,0 αφού, ίσως, µία από κάθε εκατό προτάσεις που ένας άνθρωπος λέει είναι «γεια». Από την άλλη µεριά, µπορεί να είχαµε P(«εγώ φασόλια τον φύλακα») 0 και P(«ο αετός κολυµπάει θετικά») 0 αφού είναι εξαιρετικά απίθανο κάποιος να πει κάποια από αυτές τις δύο συµβολοσειρές. Βλέπουµε ότι σε αντίθεση µε τη γλωσσολογία, η γραµµατική ορθότητα δεν έχει σχέση µε τη µοντελοποίηση της γλώσσας. Ακόµα κι αν η συµβολοσειρά «ο αετός κολυµπάει θετικά» είναι γραµµατικά σωστή, το µοντέλο αντιστοιχεί σ αυτή µία πιθανότητα κοντά στο µηδέν. Τα πιο ευρέως χρησιµοποιούµενα γλωσσικά µοντέλα είναι, µακράν τα n-gram γλωσσικά µοντέλα. Ας πάρουµε την περίπτωση των συγκεκριµένων µοντέλων όταν n=2. Τα µοντέλα αυτά ονοµάζονται bigram µοντέλα. Αρχικά για µια πρόταση s η οποία αποτελείται από τις λέξεις w,..,w l, χωρίς απώλεια της γενικότητας µπορούµε να εκφράσουµε την πιθανότητα P(s) ως:

23 Σελίδα 22 P l ) = P( wi w... wi i = ( s) = P( w ) P( w2 w) P( w3 ww2)... P( wl w... wl ) (2.) Στα bigram µοντέλα κάνουµε την προσέγγιση ότι η πιθανότητα µιας λέξης εξαρτάται µόνο από την ταυτότητα της αµέσως προηγούµενης λέξης και έτσι µπορύµε να εκφράσουµε την σχέση (2.) ως εξής : P l P( wi i= l w... wi ) P( wi wi ) (2.2) i= ( s) = Για να έχει νόηµα η πιθανότητα P(w i w i- ) για ι= µπορούµε να εισάγουµε στην αρχή της πρότασης το σύµβολο <s>. Με αυτό τον τρόπο υποθέτουµε ότι το w 0 είναι το <s>. Επιπρόσθετα, για να ισούται το άθροισµα των πιθανοτήτων όλων των συµβολοσειρών P ( s) µε είναι απαραίτητο να τοποθετήσουµε και ένα σύµβολο s </s> στο τέλος των προτάσεων και να το συµπεριλάβουµε στο γινόµενο της εξίσωσης (2.2). Για παράδειγµα, για να υπολογίσουµε την πιθανότητα P(«αυτός διαβάζει ένα βιβλίο») θα έχουµε P(«αυτός διαβάζει ένα βιβλίο») = P(«αυτός» <s>) P(«διαβάζει» «αυτός») P(«ένα» «διαβάζει») P(«βιβλίο» «ένα») P(</s> «βιβλίο») Για να εκτιµήσουµε την πιθανότητα P(w i w i- ), δηλαδή την συχνότητα µε την οποία η λέξη w i εµφανίζεται µε δεδοµένο ότι η τελευταία λέξη είναι η w i-, µπορούµε απλά να µετρήσουµε πόσο συχνά το bigram w i- w i εµφανίζεται σε κάποιο κέιµενο και να κανονικοποιήσουµε. Έστω c(w i- w i ) ο αριθµός των φορών που το bigram w i- w i εµφανίζεται στο δοσµένο κείµενο. Έτσι έχουµε: c( wi wi) P(wi wi - ) = (2.3) c( wi wj) wj

24 Σελίδα 23 Το διαθέσιµο κείµενο για τη δηµιουργία ενός µοντέλου ονοµάζεται κείµενο εκπαίδευσης (training text). Για n-gram µοντέλα, το µέγεθος των δεδοµένων εκπαίδευσης είναι τυπικά πολλά εκατοµµύρια λέξεις. Η εκτίµηση της πιθανότητας P(w i w i- ) που δίνεται από τον τύπο (2.3) ονοµάζεται εκτίµηση µεγίστης πιθανοφάνειας (maximum likelihood estimation ML) της πιθανότητας P(w i w i- ), επειδή η ισότητα αυτή παράγει το bigram µοντέλο που προσδίδει την µέγιστη πιθανότητα στο κείµενο εκπαίδευσης, από όλα τα πιθανά bigram µοντέλα. Για n-gram µοντέλα όπου n > 2 αντί να συνθηκοποιούµε την πιθανότητα µιας λέξης µε την ταυτότητα της αµέσως προηγούµενης λέξης, συνθηκοποιούµε αυτή την πιθανότητα µε την ταυτότητα των n προηγούµενων λέξεων. Γενικεύοντας την εξίσωση (2.3) για n > 2 έχουµε: l + i= i P ( s) = P( w i w i n+ ) (2.4) όπου το j w i συµβολίζει τις λέξεις w i,...,w j. Επίσης θεωρούµε ότι το w -n+2, µέσω του w 0, είναι το <s> και το w l+ το </s>. Για να εκτιµήσουµε τις πιθανότητες P(w i w i i n+ ), η ανάλογη ισότητα στην (2.4) είναι: P( wi w c( w ) w c (2.5) ) i i i n+ i n+ ) = i ( w i i n+ Στην πράξη, το µεγαλύτερο n που χρησιµοποιείται είναι το n=3. Ένα τέτοιο µοντέλο ονοµάζεται trigram µοντέλο. Οι λέξεις w πριν την τωρινή λέξη w i, i i n+ ονοµάζoνται συχνά ιστορία (history). Επίσης, συχνά αναφερόµαστε στην τιµή του n ενός n-gram µοντέλου σαν τάξη (order) του µοντέλου. Ας θεωρήσουµε ένα µικρό παράδειγµα. Έστω ότι τα δεδοµένα εκπαίδευσης S αποτελούνται από τις εξής τρεις προτάσεις: «αυτός διαβάζει ουµπέρτο έκο»,

25 Σελίδα 24 «αυτή διαβαζει ένα διαφορετικό βιβλίο», «εκείνη διαβάζει ένα βιβλίο που της έδωσε ο νίκος» και ας υπολογίσουµε την πιθανότητα P(«αυτός διαβάζει ένα βιβλίο») για το bigram µοντέλο µεγίστης πιθανοφάνειας. Έχουµε λοιπόν: c( < s > αυτός ) P( αυτ ός < s > ) = = w c( < s > w) 3 ( ) ( ) = c αυτός διαβάζει P διαβ άζει αυτός = w c( αυτός w ) ( ) ( ) = c διαβάζει ένα P ένα διαβάζει = w c( διαβάζει w ) 2 3 ( ) ( ) = c ένα βιβλίο P βιβλ ίο ένα = w c( ένα w ) 2 c( βιβλίο < \ s > ) P( < \ s > βιβλ ίο) = = w c( βιβλίο w) 2 και τελικά: P(«αυτός διαβάζει ένα βιβλίο»)= P( αυτός < s > ) P( διαβάζει αυτός ) P( ένα διαβάζει) P( βιβλίο ένα) 2 P ( < \ s > βιβλίο) =

26 Σελίδα Smoothing Ας θεωρήσουµε τώρα την πρόταση «ο νίκος διαβάζει ένα βιβλίο». Εχουµε: ( ) ( ) = c νίκος διαβάζει P διαβάζει νίκος = w c( νίκος w ) 0 που µας δίνει P(«ο νίκος διαβάζει ένα βιβλίο») = 0. Προφανώς αυτό είναι µια υποεκτίµηση της πιθανότητας της πρότασης «ο νίκος διαβάζει ένα βιβλίο», αφού υπάρχει κάποια πιθανότητα να εµφανιστεί η συγκεκριµένη πρόταση. Για να δείξουµε γιατί είναι σηµαντικό να δωθεί στην πιθανότητα αυτή µια µη µηδενική τιµή, ας αναλογιστούµε την πρωταρχική εφαρµογή των γλωσσικών µοντέλων, την αναγνώριση φωνής. Στην αναγνώριση φωνής προσπαθούµε να βρούµε µια πρόταση s που µεγιστοποιεί την ποσότητα: P( A s) P( s) P( s A) = (2.6) P( A) για ένα δεδοµένο ακουστικό σήµα Α. Εάν η πιθανότητα P(s) είναι ίση µε το µηδέν, τότε και η πιθανότητα P(s A) θα είναι µηδέν και η συµβολοσειρά s δεν θα θεωρηθεί ποτέ σαν πιθανή πρόταση. Έτσι, οποτεδήποτε µια συµβολοσειρά s, τέτοια ώστε P(s)=0, εµφανίζεται κατά την διάρκεια µιας εφαρµογής αναγνώρισης φωνής, θα συµβαίνει λάθος. Αντιστοιχίζοντας όλες τις συµβολοσειρές µε µια µη µηδενική πιθανότητα, αποφεύγουµε λάθη στην αναγνώριση φωνής. Η τεχνική που χρησιµοποιούµε για το σκοπό αυτό ονοµάζεται smoothing. Ο όρος smoothing περιγράφει τεχνικές παραγωγής περισσότερο ακριβών πιθανοτήτων από την εκτίµηση µέγιστης πιθανοφάνειας των πιθανοτήτων (όπως στους τύπους 2.3,2.5). Η λέξη smoothing προέρχεται από το γεγονός ότι αυτές οι τεχνικές χρησιµοποιούνται για να κάνουν τις κατανοµές πιθανοτήτων πιο οµοιόµορφες, αυξάνοντας τις χαµηλές πιθανότητες, όπως οι µηδενικές, και µειώνοντας τις υψηλές πιθανότητες. Οι µέθοδοι smoothing όχι µόνο αποτρέπουν τις µηδενικές πιθανότητες αλλά προσπαθούν επίσης να βελτιώσουν την ακρίβεια του γλωσσικού µοντέλου στο

27 Σελίδα 26 σύνολο του. Όταν µια πιθανότητα έχει εκτιµηθεί από µη επαρκή δεδοµένα εκπαίδευσης, οι τεχνικές smoothing µπορουν να βελτιώσουν σηµαντικά την εκτίµηση. Για να δώσουµε ένα παράδειγµα, µια απλή τεχνική smoothing είναι να θεωρήσουµε ότι κάθε bigram εµφανίζεται µια φορά περισσότερο απ ότι στην πραγµατικότητα. Έτσι θα έχουµε: P( wi w i + c( wi wi) + c( wi wi) ) = =, (2.7) + i i V + i i w [ c( w w )] i w c( w w ) i όπου V είναι το λεξικό, δηλαδή το σύνολο όλων των επιτρεπτών λέξεων. Ας θεωρήσουµε τώρα το παράδειγµα της προηγούµενης παραγράφου χρησιµοποιώντας τη νέα αυτή κατανοµή πιθανοτήτων και θεωρώντας ότι το λεξικό V αποτελείται από όλες τις λέξεις που εµφανίζονται στα δεδοµένα εκπαίδευσης S. Εποµένως θα είναι V = 8. Για την πρόταση «αυτός διαβάζει ένα βιβλίο», έχουµε τώρα: P(«αυτός διαβάζει ένα βιβλίο»)= P( αυτός < s > ) P( διαβάζει αυτός ) P( ένα διαβάζει) P( βιβλίο ένα) P ( < \ s > βιβλίο) = Με άλλα λόγια, εκτιµήσαµε ότι η πρόταση «αύτος διαβάζει ένα βιβλίο» εµφανίζεται περίπου µια φορά σε κάθε δέκα χιλιάδες προτάσεις. Η εκτίµηση αυτή είναι περισσότερο λογική από την εκτίµηση µεγίστης πιθανοφάνειας ( 0.06). Για την πρόταση «ο νίκος διαβάζει ένα βιβλίο» έχουµε: P(«ο νίκος διαβάζει ένα βιβλίο») = P( o < s > ) P( νίκος ο) P( διαβάζει νίκος ) P( ένα διαβάζει) P( βιβλίο ένα) P ( \ s > βιβλίο) < =

28 Σελίδα 27 Πάλι βλέπουµε ότι η εκτίµηση αυτή είναι πιο λογική από την µηδενική πιθανότητα του µοντέλου µεγίστης πιθανοφάνειας. Όπως είδαµε το smoothing είναι µια τεχνική αντιµετώπισης προβληµάτων που προκύπτουν από την έλλειψη επαρκών δεδοµένων εκπαίδευσης. Υπάρχουν και άλλες µέθοδοι αντιµετώπισης τέτοιων προβληµάτων όπως είναι η οµαδοποίηση των λέξεων (word classing) Additive smoothing Ένας από τους πιο απλούς τρόπους για smoothing που χρησιµοποιούνται στην πράξη είναι το additive smoothing [2],[3],[4], που είναι απλώς µια γενικευµένη έκφραση της µεθόδου που περιγράφηκε στη σχέση (2.7). Αντί να υποθέσουµε ότι κάθε n-gram εµφανίζεται µία παραπάνω φορά από όσες πραγµατικά εµφανίζεται, υποθέτουµε ότι εµφανίζεται δ φορές παραπάνω, όπου τυπικά ισχύει 0 < δ : P add ( w i w i i n+ δ + c( w ) = δ V + ) i i n+ i c( wi n+ w i ) (2.8) Οι Lidstone και Jeffreys χρησιµοποιούν για το δ την τιµή δ=. Οι Gale και Church [5],[6] υποστήριξαν ότι η µέθοδος αυτή έχει φτωχή απόδοση Εκτιµήτρια Good-Turing Η εκτιµήτρια Good-Turing [7] αποτελεί τη βάση για πολλές τεχνικές smoothing. Η εκτιµήτρια Good-Turing δηλώνει ότι για οποιοδήποτε n-gram που εµφανίζεται r φορές, πρέπει να υποθέτουµε ότι εµφανίζεται r * φορές όπου :

29 Σελίδα 28 n =, (2.9) n * r+ r ( r + ) r και όπου n r είναι ο αριθµός των n-grams που εµφανίζονται ακριβώς r φορές στα δεδοµένα εκπαίδευσης. Για να µετατρέψουµε τον αριθµό εµφανίσεων σε πιθανότητα, απλά κανονικοποιούµε. Για ένα n-gram α µε r εµφανίσεις, έχουµε : r ( α ) = (2.0) N P GT * όπου * N = n r r. Παρατηρούµε ότι : r= 0 * nrr = ( r + ) nr+ = N = rn, (2.) r= 0 r= 0 r= r δηλαδή το Ν είναι ίσο µε το πραγµατικό σύνολο των αριθµών εµφάνισης των ngrams στην κατανοµή. Για να παράγουµε αυτή την εκτιµήτρια, ας υποθέσουµε ότι υπάρχει ένα σύνολο από s διαφορετικά n-grams α,...,α s και ότι οι πραγµατικές τους πιθανότητες ή συχνότητες εµφάνισης είναι P,,P s, αντίστοιχα. Ας εκτιµήσουµε τώρα την αληθινή πιθανότητα ενός n-gram α i που εµφανίζεται r φορές σε κάποια δεδοµένα, δεδοµένου ότι δεν ξέρουµε την ταυτότητα του n-gram α i,αλλά ξέρουµε τις υποψήφιες πιθανότητες P,,P s. Ισοδύναµα µπορούµε να υπολογίσουµε την τιµή Ε(P i c(α i )=r), όπου Ε είναι η αναµενόµενη τιµή και όπου c(α i ) είναι ο αριθµός των φορών που το n-gram α i εµφανίζεται στα δεδοµένα. Η ποσότητα αυτή αναλύεται ως εξής : s E( P c( α ) = r) = P( i= j c( α ) = r) P (2.2) i i j= i j

30 Σελίδα 29 Η πιθανότητα P(i=j c(α i )=r) είναι η πιθανότητα ενός άγνωστου n-gram α i µε r εµφανίσεις να είναι πραγµατικά το j-οστό n-gram α i (µε αντίστοιχη συχνότητα εµφάνισης p j ). Αυτή η πιθανότητα µπορεί να γραφεί και ως εξής : = = = = = = = = = = s j r N j r j r N j r j s j r N j r j N r r N j r j N r s j j j i P P P P P P P P r c P r c P r c j i P ) ( ) ( ) ( ) ( ) ( ) ( ) ) ( ( ) ) ( ( ) ) ( ( α α α (2.3) όπου = = s j j c N ) (α είναι το σύνολο των αριθµών εµφάνισης των ngrams. Αντικαθιστώντας αυτό στην εξίσωση (2.2), παίρνουµε = = + = = s j r N j r j s j r N j r j i i P P P P r c P E ) ( ) ( ) ) ( ( α (2.4) Ας θεωρήσουµε τώρα την ποσότητα Ε Ν (n r ) ως τον αναµενόµενο αριθµό ngrams που έχουν ακριβώς r αριθµούς εµφάνισης, δεδοµένου ότι το σύνολο των αριθµών εµφάνισης των n-grams είναι Ν. Η ποσότητα αυτή είναι ίση µε το άθροισµα της πιθανότητας για κάθε n-gram να έχει ακριβώς r αριθµούς εµφάνισης : = = = = = s j r N j r j N r s j j r N P P r c P n E ) ( ) ( ) ) ( ( ) ( α (2.5) Αντικαθιστώντας την παράσταση αυτή στην εξίσωση (2.4) παίρνουµε : ) ( ) ( ) ) ( ( r N r N i i n E n E N r r c P E = = α (2.6) Αυτή είναι µια εκτιµήτρια για την αναµενόµενη πιθανότητα ενός n-gram a i µε αριθµό εµφάνισης r. Για να την εκφράσουµε µε τους όρους του διορθωµένου αριθµού εµφάνισης r *, χρησιµοποιώντας τη σχέση (2.9) εξάγουµε

31 Σελίδα 30 r * = N E( P c( α ) = r) = N i i r N + E + E (2.7) N + N ( nr+ ) n ( r + ) ( n ) n r r+ r Σηµειώνουµε ότι στην παραπάνω εξίσωση χρησιµοποιούνται οι προσεγγίσεις Ε Ν (n r ) n r και Ε Ν+ (n r+ ) n r+. Με άλλα λόγια χρησιµοποιούµε τις εµπειρικές τιµές του n r για να εκτιµήσουµε τις αναµενόµενες τιµές του. Η εκτιµήτρια Good-Turing δεν µπορεί να χρησιµοποιηθεί όταν n r =0. Γενικά είναι απαραίτητο να «εξοµαλύνουµε» τα n r, για παράδειγµα να προσαρµόσουµε τα n r ώστε να είναι όλα µεγαλύτερα του µηδέν. Σχετικά πρόσφατα οι Gale και Sampson [8] πρότειναν έναν απλό και αποδοτικό αλγόριθµο για την εξοµάλυνση αυτών των τιµών. Στην πράξη, η εκτιµήτρια Good-Turing δε χρησιµοποιείται αυτούσια για ngram smoothing, επειδή δεν υποστηρίζει το συνδυασµό µοντέλων µεγαλύτερης τάξης µε µοντέλα µικρότερης τάξης, συνδυασµό απαραίτητο για καλή απόδοση, όπως επεξηγείται στις επόµενες παραγράφους. Ωστόσο, χρησιµοποιείται σαν εργαλείο σε διάφορες άλλες τεχνικές smoothing Jelineck-Mercer smoothing Ας θεωρήσουµε την περίπτωση κατασκευής ενός bigram µοντέλου πάνω σε δεδοµένα εκπαίδευσης από τα οποία παίρνουµε : c(«παρατηρώ το») = 0 c(«παρατηρώ καταβεβληµένος») = 0 Τότε, σύµφωνα µε το additive smoothing, αλλά και σύµφωνα µε την εκτιµήτρια Good-Turing, θα έχουµε : P(«το» «παρατηρώ») = P(«καταβεβληµένος» «παρατηρώ»)

32 Σελίδα 3 Ωστόσο, διαισθητικά θα έπρεπε να ισχύει : P(«το» «παρατηρώ») > P(«καταβεβληµένος» «παρατηρώ») καθώς η λέξη «το» είναι πολύ πιο κοινή από όσο η λέξη «καταβεβληµένος». Για να εντάξουµε στο µοντέλο αυτή τη συµπεριφορά, µπορούµε να παρεµβάλουµε (interpolate) το bigram µοντέλο µε ένα unigram µοντέλο. Το unigram µοντέλο δεν εξαρτά την πιθανότητα µιας λέξης από καµία άλλη λέξη, και έτσι απλώς αντανακλά τη συχνότητα των λέξεων στο κείµενο. Για παράδειγµα, το unigram µοντέλο µέγιστης πιθανοφάνειας (maximum-likelihood unigram model) είναι : P ML c( wi ) ( wi ) = (2.8) c( w ) w i i Μπορούµε να παρεµβάλουµε γραµµικά ένα bigram µοντέλο µε ένα unigram µοντέλο ως εξής : P interp (w i w i- ) = λp ML (w i w i- )+ (-λ)p ML (w i ) (2.9) Όπου 0 λ. Επειδή : P(«το» «παρατηρώ») = P(«καταβεβληµένος» «παρατηρώ») = 0 ενώ P ML («το») > > P ML («καταβεβληµένος»), θα έχουµε ότι : P interp («το» «παρατηρώ») > P interp («καταβεβληµένος» «παρατηρώ») όπως ακριβώς το επιθυµούµε. Γενικά, είναι χρήσιµο να παρεµβάλουµε µεγαλύτερης τάξης n-gram µοντέλα µε µικρότερης τάξης µοντέλα επειδή όταν υπάρχουν ανεπαρκή δεδοµένα για να εκτιµηθεί µια πιθανότητα στο µεγαλύτερης τάξης µοντέλο, το µικρότερης τάξης µοντέλο µπορεί συχνά να προσφέρει χρήσιµη πληροφορία. Μια γενική κλάση παρεµβαλλόµενων µοντέλων περιγράφεται από τους Jelinek και Mercer [9]. Ένας

33 Σελίδα 32 κοµψός τρόπος υλοποίησης αυτής της παρεµβολής δίνεται από τους Brown κ.ά. [0] ως εξής : P ( w w i i ) = λ P ( w w ) + ( λ ) P ( w w ) (2.20) i int erp i i n+ i + + ML i i n i wi n w i n + int erp i i n+ 2 Αυτό σηµαίνει ότι το n-τάξης smoothed µοντέλο ορίζεται αναδροµικά σαν µία γραµµική παρεµβολή ανάµεσα στο n-τάξης µέγιστης πιθανοφάνειας µοντέλο και το (n-)-τάξης smoothed µοντέλο. Για να τελειώσει η αναδροµή, µπορούµε να θεωρήσουµε το smoothed πρώτης τάξης µοντέλο ως την µεγίστης πιθανοφάνειας κατανοµή, ή να θεωρήσουµε το smoothed 0-τάξης µοντέλο ως την οµοιόµορφη κατανοµή Punif ( wi ) = (2.2) V Για ένα σταθερό P ML είναι δυνατό να ψάξουµε αποτελεσµατικά για το λ i w i n + που µεγιστοποιεί την πιθανότητα µερικών δεδοµένων, χρησιµοποιώντας τον αλγόριθµο Baum-Welch []. Για να εξάγουµε αποτελέσµατα που έχουν νόηµα, τα δεδοµένα που χρησιµοποιούµε για εκτιµήσουµε το λ i πρέπει να είναι w i n + διαφορετικά από τα δεδοµένα που χρησιµοποιούµε για να υπολογίσουµε το P ML. Στη held-out παρεµβολή, κρατάµε ένα τµήµα των δεδοµένων εκπαίδευσης για το λόγο αυτό, όπου αυτά τα «κρατηµένα απ έξω» δεδοµένα δεν χρησιµοποιούνται στον υπολογισµό του P ML. Εναλλακτικά, οι Jelinek και Mercer περιγράφουν µία τεχνική, γνωστή ως deleted interpolation ή deleted estimation όπου τα διαφορετικά µέρη των δεδοµένων εκπαίδευσης εναλλάσσονται στην εκπαίδευση είτε του P ML είτε του λ i w i n +. Το τελικό αποτέλεσµα είναι ο µέσος όρος των επί µέρους αποτελεσµάτων. ιστορικά Παρατηρούµε ότι το βέλτιστο λ i είναι διαφορετικό για διαφορετικά w i n + w i i n+. Για παράδειγµα, για κάποια συµφραζόµενα που έχουν παρατηρηθεί χιλιάδες φορές, θα είναι κατάλληλο ένα υψηλό λ καθώς η κατανοµή µεγαλύτερης τάξης θα είναι πολύ αξιόπιστη. Αντίθετα, για ένα ιστορικό που έχει παρατηρηθεί µόνο µία φορά, θα είναι κατάλληλο ένα µικρό λ. Το να εκπαιδεύσουµε κάθε

34 Σελίδα 33 παράµετρο λ i ανεξάρτητα, γενικά δεν είναι εύστοχο. Θα χρειαζόµαστε ένα w i n + τεράστιο ποσό δεδοµένων για να εκπαιδεύσουµε µε ακρίβεια τόσες πολλές ανεξάρτητες παραµέτρους. Έτσι, αντί γι αυτό, οι Jelinek και Mercer προτείνουν τη διαίρεση των λ i σε έναν λογικό αριθµό τµηµάτων (buckets), και τον καθορισµό w i n + ίδιας τιµής για όλα τα λ i που ανήκουν στο ίδιο τµήµα, µειώνοντας µε τον τρόπο w i n + αυτό τον αριθµό των ανεξάρτητων παραµέτρων που πρέπει να εκτιµηθούν. Στην ιδανική περίπτωση, θα έπρεπε να τοποθετήσουµε µαζί στο ίδιο τµήµα τα λ i αυτά w i n + για τα οποία έχουµε έναν εκ των προτέρων λόγο να πιστεύουµε ότι θα έχουν όµοιες τιµές. Οι Bahl, Jelinek και Mercer [2] προτείνουν την επιλογή αυτών των οµάδων i λ σύµφωνα µε το c ( w i n+ ), δηλαδή το συνολικό άθροισµα των αριθµών i w i n + w i εµφάνισης που παρεµβάλλονται στην µεγαλύτερης τάξης κατανοµή (το οποίο ισούται µε το αριθµό φορών εµφάνισης στο αντίστοιχο ιστορικό). Όπως αναφέρθηκε πιο πάνω, αυτός ο συνολικός αριθµός φορών εµφάνισης θα πρέπει να συσχετίζεται µε το πόσο πολύ θα πρέπει να βαρύνει η κατανοµή µεγαλύτερης τάξης. Όσο µεγαλύτερος αυτός ο αριθµός φορών, τόσο υψηλότερη τιµή θα πρέπει να έχει το λ i. Πιο + συγκεκριµένα, οι Bahl κ.ά. προτείνουν το διαµερισµό (partitioning) της κλίµακας των δυνατών τιµών του συνολικού αριθµού φορών εµφάνισης και την τοποθέτηση στο ίδιο τµήµα (bucket) όλων των λ i που σχετίζονται µε το ίδιο κοµµάτι (partition). + w i n Ο Chen [3] έδειξε ότι η διαίρεση (bucketing) σύµφωνα µε το µέσο αριθµό φορών εµφάνισης ανά µη µηδενικό στοιχείο σε µια κατανοµή w i καλύτερη απόδοση από τη χρησιµοποίηση της τιµής c ( w i n+ ). w i i w c( w i i n+ ) w i n i εξάγει i : c( w ) > 0 i n Katz Smoothing Η µέθοδος Katz smoothing [4] είναι µια προέκταση της µεθόδου Good- Turing, εισάγοντας το συνδυασµό µοντέλων µεγαλύτερης τάξης (higher-order models) µε µοντέλα µικρότερης τάξης (lower-order models). Αρχικά θα περιγράψουµε το Katz

35 Σελίδα 34 smoothing για bigram µοντέλα. Για ένα bigram i wi µε αριθµό εµφάνισης r = c( i wi ) υπολογίζουµε τον διορθωµένο αριθµό εµφάνισης του χρησιµοποιώντας την εξίσωση: d r r if r > 0 ( i ckatz w ) i = α(w i- ) P ML (w i ) if r = 0 (2.22) Αυτό σηµαίνει ότι σε όλα τα bigrams µε ένα µη µηδενικό αριθµό εµφάνισης r έχουµε µείωση (discount) αυτού του αριθµού σύµφωνα µε ένα συντελεστή d r r * (discounting ratio). Ο συντελεστής d r είναι περίπου ίσος µε, δηλαδή ίσος µε την r µείωση που προβλέπεται από την εκτίµηση Good-Turing, και θα καθοριστεί αµέσως µετά. Οι αριθµοί εµφάνισης, που αφαιρούνται από bigrams µε µη µηδενικό r, κατανέµονται στη συνέχεια στα bigrams µε µηδενικό αριθµό εµφάνισης σύµφωνα µε την επόµενη χαµηλότερης τάξης κατανοµή, δηλαδή το unigram µοντέλο. Η τιµή α(w i- ) επιλέγεται έτσι ώστε το σύνολο των αριθµών εµφάνισης στην κατανοµή w i c katz w i i ) ( να µένει αναλλοίωτο, δηλαδή να ισχύει: w c ) i i katz( wi = i i w c ( w ) i. (2.23) Η κατάλληλη τιµή για το α(w i- ) είναι: w P ( w w ) wi: i i i: c( wi ) > 0 katz i i c( wi ) > 0 katz i i α ( wi ) = = (2.24) wi: c( w i i ) = 0PML( wi) i wi: c( wi ) > 0PML( wi) P ( w w ) Για να υπολογίσουµε την πιθανότητα P katz (w i w i- ) από τον διορθωµένο αριθµό εµφάνισης, κανονικοποιούµε: P katz ( wi w i ckatz( wi ) ) (2.25) i katz w c ( w i i ) i = Η ποσότητα d r υπολογίζεται µε τον ακόλουθο τρόπο: οι µεγάλοι αριθµοί εµφάνισης θεωρούνται σωστοί, και εποµένως δεν µειώνονται. Ειδικότερα, η µέθοδος Katz παίρνει d r = για όλα τα r για τα οποία ισχύει r>k για κάποιο k. Συνήθως στη µέθοδο

36 Σελίδα 35 Katz είναι k=5. Οι συντελεστές µείωσης για τους χαµηλότερους αριθµούς εµφάνισης r<=k υπολογίζονται από την εφαρµογή του αλγορίθµου εκτίµησης Good-Turing στο σύνολο της κατανοµής των bigrams. ηλαδή το n r στην εξίσωση (2.9) υποδηλώνει τους συνολικούς αριθµούς των bigrams που εµφανίζονται ακριβώς r φορές στα δεδοµένα εκπαίδευσης. Αυτά τα d r επιλέγονται έτσι ώστε οι τελικές µειώσεις στους αριθµούς εµφάνισης να είναι ανάλογες µε τις µειώσεις που προβλέπονται από την εκτίµηση Good-Turing, και τέτοια ώστε το σύνολο των αριθµών εµφάνισης στο σύνολο της κατανοµής των bigrams να είναι ίσο µε τον σύνολο των αριθµών εµφάνισης που πρέπει να αποδωθούν στα bigrams µε µηδενικούς αριθµούς εµφάνισης σύµφωνα µε τον αλγόριθµο Good-Turing. Αυτός ο περιορισµός εκφράζεται από τις εξισώσεις: * r dr = µ ( ) (2.26) r για r {,...,k} για κάποια σταθερά µ. Ο αλγόριθµος Good-Turing προβλέπει ότι το σύνολο των αριθµών εµφάνισης που πρέπει να αποδωθεί στα bigrams µε µηδενικό αριθµό εµφάνισης είναι n 0 0 n n = n * = n0 (2.27) 0 Έτσι ο δεύτερος περιρισµός αντιστοιχεί στην εξίσωση: k r= n ( d r n r r) = (2.28) Η µοναδική λύση των εξισώσεων είναι η: d * r ( k + ) n r n ( k + ) n n k + r = (2.29) k + Η µέθοδος Katz smoothing για µοντέλα υψηλότερης τάξης καθορίζεται µε ανάλογο τρόπο. Όπως µπορούµε να δούµε στην εξίσωση (2.22), το bigram µοντέλο καθορίζεται σε σχέση µε το unigram µοντέλο. Γενικά το Katz n-gram µοντέλο

37 Σελίδα 36 καθορίζεται σε σχέση µε το Katz (n-)-gram µοντέλο, µε παρόµοιο τρόπο όπως και στο Jelinek-Mercer smoothing. Για να τελειώσει η αναδροµή, το Katz unigram µοντέλο θεωρείται ότι είναι το unigram µοντέλο µεγίστης πιθανοφάνειας (maximum likelihood). Όπως αναφέρθηκε και στην παράγραφο ( 2.2.2), είναι συχνά απαραίτητο να γίνει smoothing στην ποσότητα n r όταν χρησιµοποιούµε την εκτίµηση Good-Turing, για εκείνα τα n r που είναι πολύ χαµηλά. Όµως, στο Katz smoothing αυτό δεν είναι απαραίτητο επειδή η εκτίµηση Good-Turing χρησιµοποιείται µόνο για µικρούς αριθµούς εµφάνισης r<=k και το n r είναι γενικά πολύ υψηλό για αυτές τις τιµές του r Absolute Discounting Η τεχνική absolute discounting [5], όπως και η τεχνική Jelinek-Mercer, εµπλέκει την παρεµβολή (interpolation) υψηλότερης και χαµηλότερης τάξης µοντέλων. Όµως, αντί να πολλαπλασιάζει την κατανοµή µεγίστης πιθανοφάνειας του µοντέλου υψηλότερης τάξης µε ένα συντελεστή λ wi i n +, η κατανοµή υψηλότερης τάξης δηµιουργείται από την αφαίρεση ενός συντελεστή D<= από κάθε µη µηδενικό αριθµό εµφάνισης. Έτσι από την εξίσωση (2.20): P int erp ( wi w i i n+ i i ) = λ ( i + ) + ( ) int erp( i wi P w wi n λ wi P w wi n+ 2 ) (2.30) i n+ i n + έχουµε: i i max{ c( + ),0} ( + ) = wc i n D i Pabs wi wi n + ( i ) abs( i i n+ 2 ) i ( ) w P w w i n + w w λ (2.3) i i n+ Για να αθροίζει αυτή η κατανοµή στο παίρνουµε: D i λ = + wi N ( w + ) i i n i n + w c ( w (2.32) + ) i i n όπου το i N + ( ) είναι: w i n+ + i i N ( w ) = { wi : c( w w i ) > 0} i n+ i n+

38 Σελίδα 37 και θεωρώντας ότι 0<=D<=. Έχει βρεθεί ότι η καταλληλότερη τιµή για το D είναι η: 2 2n n n D + = (2.33) όπου τα n,n 2 είναι ο συνολικός αριθµός από n-grams που έχουν ακριβώς µία ή δύο εµφανίσεις στα δεδοµένα εκπαίδευσης Περίληψη αλγορίθµων Όπως σηµείωσαν οι Kneser και Ney [6], οι περισσότεροι αλγόριθµοι smoothing που υπάρχουν µπορούν να περιγραφούν µε την ακόλουθη εξίσωση: = > = ) ( ) ( ) ( 0 ) ( ) ( ) ( 2 i n i i n i i smooth i n i i n i i n i i i n i i smooth w c w w p w w c w w w w P αν γ αν α (2.34) Αυτό σηµαίνει ότι, αν ένα n-gram έχει µη µηδενικό αριθµό εµφάνισης τότε χρησιµοποιούµε την κατανοµή ) ( + i n w i w i α. Αλλιώς, «οπισθοχωρούµε» (backoff) στη µικρότερης τάξης κατανοµή ) ( 2 + i n i i smooth w w p, όπου ο συντελεστής ) ( + i n w i γ επιλέγεται έτσι ώστε η υπό συνθήκη κατανοµή να αθροίζει στη µονάδα. Αναφερόµαστε στους αλγορίθµους που εµπίπτουν σε αυτή την κατηγορία ως backoff µοντέλα. Η µέθοδος Katz smoothing είναι το τυπικό παράδειγµα backoff smoothing. ιάφοροι άλλοι αλγόριθµοι smoothing εκφράζονται ως γραµµική παρεµβολή µεγαλύτερης µε µικρότερης τάξης n-gram µοντέλων, όπως είδαµε για παράδειγµα στην εξίσωση (2.20) που την υπενθυµίζουµε κι εδώ : ) ( ) ( ) ( ) ( = i n i i smooth w i n i i ML w i n i i smooth w w P w w P w w P i n i i n i λ λ Η σχέση αυτή µπορεί να ξαναγραφεί ως εξής :

39 Σελίδα 38 i i i i P smooth ( wi wi n+ ) = α ( wi wi n+ ) + γ ( wi n+ ) P smooth ( wi wi n+ 2 ) (2.35) όπου : i i α ( w i w i n+ ) = λ i P ( ) ML wi wi n+ (2.36) wi n + και i γ ( = λ ) w i n+ ) ( i w i n+. (2.37) Στη συνέχεια, ορίζοντας : i i i i α ( w i w i n+ ) = α ( wi wi n+ ) + γ ( wi n+ ) Psmooth ( wi n+ ) (2.38) 2 παρατηρούµε ότι αυτά τα µοντέλα µπορούν να γραφούν στη µορφή της εξίσωσης (2.35). Αναφερόµαστε στα µοντέλα αυτού του τύπου ως παρεµβαλλόµενα (interpolated) µοντέλα. Η ειδοποιός διαφορά ανάµεσα σε backoff και interpolated µοντέλα είναι ότι στον καθορισµό της πιθανότητας των n-grams που έχουν µη µηδενικό αριθµό εµφάνισης, τα interpolated µοντέλα χρησιµοποιούν πληροφορία από µικρότερης τάξης κατανοµές, ενώ τα backoff µοντέλα όχι. Και στις δύο περιπτώσεις χρησιµοποιούνται µικρότερης τάξης κατανοµές για τον καθορισµό της πιθανότητας των n-grams µε µηδενικό αριθµό εµφάνισης. Σηµειώνουµε ότι είναι εύκολο να δηµιουργήσουµε µία backoff έκδοση ενός αλγορίθµου παρεµβολής. Αντί να χρησιµοποιήσουµε την εξίσωση (2.38), µπορούµε απλώς να θέσουµε : i i α ( w i w i n+ ) = α ( w i w i n+ ) (2.39) i και στη συνέχεια να ρυθµίσουµε κατάλληλα την τιµή του γ ( ), ώστε οι πιθανότητες να αθροίζουν στη µονάδα. w i n+

40 Σελίδα Γλωσσικά µοντέλα βασισµένα σε κλάσεις Μέχρι στιγµής είδαµε ότι ένα γλωσσικό µοντέλο µπορεί να βρίσκει σχέσεις µεταξύ ξεχωριστών λέξεων. Είναι ξεκάθαρο, όµως, ότι µερικές λέξεις µοιάζουν πολύ µε κάποιες άλλες, τόσο από σηµασιολογικής, όσο και από συντακτικής άποψης. Για παράδειγµα, θα ήταν αναµενόµενο να παρατηρήσουµε παρόµοια πιθανότητα κατανοµής λέξεων γύρω από τη λέξη «καθαρή», µε αυτή που θα παρατηρούσαµε γύρω από τη λέξη «καθαρότερη». Φυσικά οι κατανοµές αυτές δε θα είναι πανοµοιότυπες, καθώς είναι σπάνιο να ακούσουµε κάποιον να λέει «η καθαρότερη ευτέρα». Αν λοιπόν µπορέσουµε, µε επιτυχηµένο τρόπο, να χωρίσουµε τις λέξεις σε κατηγορίες (κλάσεις), είναι δυνατό να σχεδιαστεί ένα γλωσσικό µοντέλο που να ανακαλύπτει σχέσεις ανάµεσα σε κλάσεις. Η προσέγγιση αυτή έχει τα ακόλουθα πλεονεκτήµατα : Στα βασισµένα σε κλάσεις γλωσσικά µοντέλα (class-based language models) οι λέξεις που ανήκουν σε µια κλάση έχουν από κοινού κάποια στατιστικά στοιχεία και κατά συνέπεια γίνεται δυνατό να γενικευθεί το γλωσσικό µοντέλο, αναθέτοντας υψηλότερης τάξης πιθανότητες συνδυασµούς λέξεων που δεν εµφανίστηκαν ποτέ στο κείµενο εκπαίδευσης. Η ικανότητα αυτή του µοντέλου να επεξεργάζεται µε κάποια λογική γεγονότα που δεν έχουν παρατηρηθεί ονοµάζεται ευρωστία (robustness) του γλωσσικού µοντέλου. Η κατηγοριοποίηση των λέξεων µπορεί να µειώσει την ποικιλία των συµφραζοµένων σε ένα µοντέλο, αντιµετωπίζοντας έτσι το πρόβληµα της σποραδικότητας (sparseness) των δεδοµένων στο κείµενο εκπαίδευσης. Η µείωση της ποικιλίας των συµφραζοµένων οδηγεί σε ένα πιο συµπαγές (compact) γλωσσικό µοντέλο µε λιγότερες παραµέτρους. Σαν αποτέλεσµα, οι απαιτήσεις σε χώρο για την αποθήκευσή του µειώνονται, πράγµα που µπορεί να είναι σηµαντικό από πρακτική σκοπιά.

41 Σελίδα 40 Στη συνέχεια, θα εισάγουµε τους µαθηµατικούς συµβολισµούς για το χειρισµό των κλάσεων λέξεων και θα περιγράψουµε πως αυτές εφαρµόζονται στην ανάπτυξη γλωσσικών µοντέλων Κλάσεις λέξεων Ως κλάση θα θεωρούµε οποιαδήποτε οµαδοποίηση λέξεων. Έστω ότι υπάρχουν Ν c τέτοιες κλάσεις που δηλώνονται ως εξής : C = {c 0,c,,c Nc } (2.40) Ας ορίσουµε µια συνάρτηση C( ) που αντιστοιχίζει κάθε λέξη w i : i {0,,,N w } σε µία ή περισσότερες κλάσεις c j : j {0,,,N c }, π.χ. : c j = C(w i ) j {0,,,N c -} και i {0,,,N w -} (2.4) όπου c j είναι η κλάση στην οποία η συνάρτηση C( ) αντιστοιχίζει το w i. Αν αυτή η αντιστοίχιση είναι «πολλά προς ένα» (many-to-one), τότε µιλάµε για ντετερµινιστική σχέση µεταξύ µελών και κλάσης (deterministic membership), ενώ αν είναι «πολλά προς πολλά» (many-to-many) αναφερόµαστε σε στοχαστική σχέση (stochastic membership). Υποθέτουµε τώρα ότι η πιθανότητα να παρατηρήσουµε µια λέξη w(i) ορίζεται απολύτως από τη γνώση της κλάσης στην οποία ανήκει, ώστε να µπορούµε να γράψουµε: i i P ( wi w ) = P( wi ci) P( ci w ) (2.42) 0 0 όπου w είναι το ιστορικό (history) της λέξης w i. i 0 Στην περίπτωση του stochastic membership, µας επιτρέπεται να αναλύσουµε τις εκτιµήτριες της υπό συνθήκη πιθανότητας ως εξής :

42 Σελίδα 4 P ( wi w (2.43) i i 0 ) = P( wi c) P( c w0 ) c: c C ( w( i) ) Στη συνέχεια, οµαδοποιώντας το ιστορικό σε ισοδύναµες κλάσεις προκύπτει : i i ( c j w0 ) = P( c j h) P( h w0 ) P (2.44) h: h H ( w( i) ) Σαν αντιστοίχιση του ιστορικού µιας λέξης µε ισοδύναµες κλάσεις µπορούµε να επιλέξουµε τις n- πιο πρόσφατες κλάσεις που παρατηρήθηκαν : Η(w i ) = { c i-n+, c i-n+2,,c i- } (2.45) Από την παραπάνω αντιστοίχιση παίρνουµε ένα class-based γλωσσικό µοντέλο. Παρατηρούµε ότι όταν η συνάρτηση C( ) είναι one-to-many, η εξίσωση (2.45) αναπαριστά µια many-to-many αντιστοίχιση. Όταν η αντιστοίχιση του ιστορικού µε ισοδύναµες κλάσεις είναι many-to-one, η εξίσωση (2.44) απλοποιείται ως εξής : P i ( c( i) w ) P( c H ( wi) ) 0 j (2.46) Έτσι, µπορούµε να ξαναγράψουµε την σχέση (2.43) ως εξής : i ( w( i) w0 ) P( wi C( wi) ) P( C( wi) H ( wi) ) P (2.47) c: c C ( w( i) ) Η παραπάνω εξίσωση χρησιµοποιήθηκε για την κατασκευή class-based bigram γλωσσικών µοντέλων, όπου οι κλάσεις ήταν είτε τα µέρη του λόγου (part-ofspeech based model), είτε οι ρίζες των λέξεων (stem based model), είτε ο συνδυασµός τους. Στα part-of-speech µοντέλα εκµεταλλευόµαστε τη γραµµατική λειτουργία κάθε λέξης, ενώ τα stemmed µοντέλα αντιµετωπίζουν τον πολυµορφισµό της ελληνικής

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange 64 Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrage Ας υποθέσουµε ότι ένας δεδοµένος χώρος θερµαίνεται και η θερµοκρασία στο σηµείο,, Τ, y, z Ας υποθέσουµε ότι ( y z ) αυτού του χώρου δίδεται από

Διαβάστε περισσότερα

Αρµονική Ανάλυση. Ενότητα: L p Σύγκλιση. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών

Αρµονική Ανάλυση. Ενότητα: L p Σύγκλιση. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών Ενότητα: L p Σύγκλιση Απόστολος Γιαννόπουλος Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creaive Commos. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε

Διαβάστε περισσότερα

Σηµειώσεις στις σειρές

Σηµειώσεις στις σειρές . ΟΡΙΣΜΟΙ - ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ Σηµειώσεις στις σειρές Στην Ενότητα αυτή παρουσιάζουµε τις βασικές-απαραίτητες έννοιες για την µελέτη των σειρών πραγµατικών αριθµών και των εφαρµογών τους. Έτσι, δίνονται συστηµατικά

Διαβάστε περισσότερα

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn) MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ g( Έστω τυχαίες µεταβλητές οι οποίες έχουν κάποια από κοινού κατανοµή Ας υποθέσουµε ότι επιθυµούµε να προσδιορίσουµε την κατανοµή της τυχαίας µεταβλητής g( Η θεωρία των ένα-προς-ένα

Διαβάστε περισσότερα

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex Γραµµικός Προγραµµατισµός - Μέθοδος Simplex Η πλέον γνωστή και περισσότερο χρησιµοποιηµένη µέθοδος για την επίλυση ενός γενικού προβλήµατος γραµµικού προγραµµατισµού, είναι η µέθοδος Simplex η οποία αναπτύχθηκε

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ

ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ ΠΡΟΒΛΗΜΑΤΑ ΕΛΑΧΙΣΤΟΠΟΙΗΣΗΣ Ελαχιστοποίηση κόστους διατροφής Ηεπιχείρηση ζωοτροφών ΒΙΟΤΡΟΦΕΣ εξασφάλισε µια ειδική παραγγελίααπό έναν πελάτη της για την παρασκευή 1.000 κιλών ζωοτροφής, η οποία θα πρέπει

Διαβάστε περισσότερα

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ)

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ) Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ) ΜΙΧΑΛΗΣ ΤΖΟΥΜΑΣ ΕΣΠΟΤΑΤΟΥ 3 ΑΓΡΙΝΙΟ. ΠΕΡΙΛΗΨΗ Η έννοια της συνάρτησης είναι στενά συνυφασµένη µε τον πίνακα τιµών και τη γραφική παράσταση.

Διαβάστε περισσότερα

οµή δικτύου ΣΧΗΜΑ 8.1

οµή δικτύου ΣΧΗΜΑ 8.1 8. ίκτυα Kohonen Το µοντέλο αυτό των δικτύων προτάθηκε το 1984 από τον Kοhonen, και αφορά διαδικασία εκµάθησης χωρίς επίβλεψη, δηλαδή δεν δίδεται καµία εξωτερική επέµβαση σχετικά µε τους στόχους που πρέπει

Διαβάστε περισσότερα

Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις

Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις ΚΕΦΑΛΑΙΟ 2 Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις 2.1 ΕΙΣΑΓΩΓΗ Όπως έχουµε δει, για να προσδιορίσουµε τις αποκρίσεις ενός κυκλώµατος, πρέπει να λύσουµε ένα σύνολο διαφορικών

Διαβάστε περισσότερα

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής: ΣΕΙΡΕΣ TAYLOR Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων Πολυώνυµο είναι κάθε συνάρτηση της µορφής: p( ) = a + a + a + a + + a, όπου οι συντελεστές α i θα θεωρούνται

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson Ιαν. 009 Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson Έστω y, y,, yn παρατηρήσεις µιας m -διάστατης τυχαίας µεταβλητής µε συνάρτηση πυκνότητας πιθανότητας p( y; θ) η οποία περιγράφεται από ένα

Διαβάστε περισσότερα

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 2004., η οποία όµως µπορεί να γραφεί µε την παρακάτω µορφή: 1 e

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 2004., η οποία όµως µπορεί να γραφεί µε την παρακάτω µορφή: 1 e ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΥΣΗΣ ΗΛΕΚΤΡΙΚΩΝ ΚΥΚΛΩΜΑΤΩΝ ΜΑΘΗΜΑ: ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΩΝ ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 4 AΣΚΗΣΗ () [ ] (.5)

Διαβάστε περισσότερα

Μηχανική ΙI. Μετασχηµατισµοί Legendre. της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα). Εάν

Μηχανική ΙI. Μετασχηµατισµοί Legendre. της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα). Εάν Τµήµα Π. Ιωάννου & Θ. Αποστολάτου 7/5/2000 Μηχανική ΙI Μετασχηµατισµοί Legendre Έστω µια πραγµατική συνάρτηση. Ορίζουµε την παράγωγο συνάρτηση της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα).

Διαβάστε περισσότερα

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j Το θεώρηµα Tor στις πολλές µεταβλητές Ο σκοπός αυτής της παραγράφου είναι η απόδειξη ενός θεωρήµατος τύπου Tor για συναρτήσεις πολλών µεταβλητών Το θεώρηµα για µια µεταβλητή θα είναι ειδική περίπτωση του

Διαβάστε περισσότερα

Πολύγωνο αθροιστικών σχετικών συχνοτήτων και διάµεσος µιας τυχαίας µεταβλητής ρ. Παναγιώτης Λ. Θεοδωρόπουλος πρώην Σχολικός Σύµβουλος ΠΕ03 e-mail@p-theodoropoulos.gr Πρόλογος Στην εργασία αυτή αναλύονται

Διαβάστε περισσότερα

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 11η διάλεξη

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 11η διάλεξη ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 11η διάλεξη ηµήτρης-αλέξανδρος Τουµπακάρης Τµήµα ΗΜ&ΤΥ, Πανεπιστήµιο Πατρών 17 Μαΐου 2011 (2η έκδοση, 21/5/2011) ηµήτρης-αλέξανδρος Τουµπακάρης Προχωρηµένα

Διαβάστε περισσότερα

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β ηµήτρης Κουγιουµτζής http://users.auth.gr/dkugiu/teach/civilengineer E mail: dkugiu@gen.auth.gr 1/11/2009 2 Περιεχόµενα 1 ΠΕΡΙΓΡΑΦΙΚΗ

Διαβάστε περισσότερα

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j Το θεώρηµα Tor στις πολλές µεταβλητές Ο σκοπός αυτής της παραγράφου είναι η απόδειξη ενός θεωρήµατος τύπου Tor για συναρτήσεις πολλών µεταβλητών Το θεώρηµα για µια µεταβλητή θα είναι ειδική περίπτωση του

Διαβάστε περισσότερα

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια. Kεφάλαιο 10 Θα δούµε ένα δύο παραδείγµατα να ορίσουµε/ µετρήσουµε τα υποπαίγνια και µετά θα λύσουµε και να βρούµε αυτό που λέγεται τέλεια κατά Nash ισορροπία. Εδώ θα δούµε ένα παίγνιο όπου έχουµε µια επιχείρηση

Διαβάστε περισσότερα

Διαχείριση Web Περιεχομένου & Γλωσσικά Εργαλεία

Διαχείριση Web Περιεχομένου & Γλωσσικά Εργαλεία Διαχείριση Web Περιεχομένου & Γλωσσικά Εργαλεία Μάθημα7 ο N-grams Σοφία Στάμου Άκ.Έτος 2008-09 Acknowledgement: McCoy, http://www.cis.udel.edu/~mccoy/courses/cisc882.03f/lectures/lect5-ngrams.ppt Μια μική

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3 ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ ) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ Άσκηση. ( µον.). Έστω z ο µιγαδικός αριθµός z i, µε, R. (α) ίνεται η εξίσωση: z

Διαβάστε περισσότερα

5. Γεννήτριες Τυχαίων Αριθµών.

5. Γεννήτριες Τυχαίων Αριθµών. 5. Γεννήτριες Τυχαίων Αριθµών. 5.1. Εισαγωγή. Στο Κεφάλαιο αυτό θα δούµε πώς µπορούµε να δηµιουργήσουµε τυχαίους αριθµούς από την οµοιόµορφη κατανοµή στο διάστηµα [0,1]. Την κατανοµή αυτή, συµβολίζουµε

Διαβάστε περισσότερα

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών 54 ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών ιαφόριση συναρτήσεων πολλών µεταβλητών Ένας στέρεος ορισµός της παραγώγισης για συναρτήσεις πολλών µεταβλητών ανάλογος µε τον ορισµό για συναρτήσεις µιας µεταβλητής

Διαβάστε περισσότερα

3.9 Πίνακας συνδιακύμανσης των παραμέτρων

3.9 Πίνακας συνδιακύμανσης των παραμέτρων Στην περίπτωσή µας έχοµε p= 1περιορισµό της µορφής : που γράφεται ως : ' = m + m z ' (3.47) 1 m Fm 1 = [1 z '] = [ '] = h m. (3.48) Η εξίσωση 3.46 στην περίπτωση αυτή χρησιµοποιώντας τους πίνακες που είδαµε

Διαβάστε περισσότερα

Εφαρµογες Της Ψηφιακης Επεξεργασιας Σηµατων. Εκτιµηση Συχνοτητων Με ΙδιοΑναλυση του Μητρωου ΑυτοΣυσχετισης

Εφαρµογες Της Ψηφιακης Επεξεργασιας Σηµατων. Εκτιµηση Συχνοτητων Με ΙδιοΑναλυση του Μητρωου ΑυτοΣυσχετισης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ Εφαρµογες Της Ψηφιακης Επεξεργασιας Σηµατων Εκτιµηση Συχνοτητων Με ΙδιοΑναλυση του Μητρωου ΑυτοΣυσχετισης

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) Ενδεικτικές Λύσεις ΕΡΓΑΣΙΑ η (Ηµεροµηνία Αποστολής στον Φοιτητή: Οκτωβρίου 005) Η Άσκηση στην εργασία αυτή είναι

Διαβάστε περισσότερα

Πρακτική µε στοιχεία στατιστικής ανάλυσης

Πρακτική µε στοιχεία στατιστικής ανάλυσης Πρακτική µε στοιχεία στατιστικής ανάλυσης 1. Για να υπολογίσουµε µια ποσότητα q = x 2 y xy 2, µετρήσαµε τα µεγέθη x και y και βρήκαµε x = 3.0 ± 0.1και y = 2.0 ± 0.1. Να βρεθεί η ποσότητα q και η αβεβαιότητά

Διαβάστε περισσότερα

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό. Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» Κεφάλαιο : Ακολουθίες πραγµατικών αριθµών Α Οµάδα Εξετάστε αν οι παρακάτω προτάσεις είναι αληθείς ή ψευδείς αιτιολογήστε πλήρως την απάντησή σας α Κάθε

Διαβάστε περισσότερα

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων

προβλήµατος Το φίλτρο Kalman διαφέρει από τα συνηθισµένα προβλήµατα ΜΕΤ σε δύο χαρακτηριστικά: παραµέτρων αγνώστων Φίλτρα Kalman Εξαγωγή των εξισώσεων τους µε βάση το κριτήριο ελαχιστοποίησης της Μεθόδου των Ελαχίστων Τετραγώνων. Αναλυτικές Μέθοδοι στη Γεωπληροφορική Μεταπτυχιακό Πρόγραµµα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ ιατύπωση του

Διαβάστε περισσότερα

Ποιές οι θεµελιώδεις δυνατότητες και ποιοί οι εγγενείς περιορισµοί των υπολογιστών ; Τί µπορούµε και τί δε µπορούµε να υπολογίσουµε (και γιατί);

Ποιές οι θεµελιώδεις δυνατότητες και ποιοί οι εγγενείς περιορισµοί των υπολογιστών ; Τί µπορούµε και τί δε µπορούµε να υπολογίσουµε (και γιατί); Μοντελοποίηση του Υπολογισµού Στοιχεία Θεωρίας Υπολογισµού (): Τυπικές Γλώσσες, Γραµµατικές Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Ποιές οι θεµελιώδεις δυνατότητες

Διαβάστε περισσότερα

Στοιχεία Θεωρίας Υπολογισµού (1): Τυπικές Γλώσσες, Γραµµατικές

Στοιχεία Θεωρίας Υπολογισµού (1): Τυπικές Γλώσσες, Γραµµατικές Στοιχεία Θεωρίας Υπολογισµού (1): Τυπικές Γλώσσες, Γραµµατικές Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Ο. Τελέλης Πανεπιστήµιο Πειραιώς Θεωρία Υπολογισµού 1 /

Διαβάστε περισσότερα

Η παρούσα αξία της επένδυσης αν αυτή υλοποιηθεί άµεσα είναι 0 K 0 1 K

Η παρούσα αξία της επένδυσης αν αυτή υλοποιηθεί άµεσα είναι 0 K 0 1 K 6. Αβεβαιότητα και µη Αναστρέψιµες Επενδύσεις Στην περίπτωση που µία επένδυση δεν µπορεί να αντιστραφεί χωρίς κόστος, δηλαδή αφού έχει πραγµατοποιηθεί η αγορά κεφαλαιακού εξοπλισµού, κατασκευή κτηρίων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 7 Ιανουαρίου 2005 ιάρκεια εξέτασης: 5:00-8:00 Έστω ότι

Διαβάστε περισσότερα

HY118- ιακριτά Μαθηµατικά. Μαθηµατική επαγωγή. 11 Επαγωγή

HY118- ιακριτά Μαθηµατικά. Μαθηµατική επαγωγή. 11 Επαγωγή Επαγωγή HY8- ιακριτά Μαθηµατικά Τρίτη, /03/06 Μαθηµατική Επαγωγή Αντώνης Α. Αργυρός e-mail: argyros@csd.uoc.gr Το υλικό των διαφανειών έχει βασιστεί σε διαφάνειες του Kees van Deemter, από το University

Διαβάστε περισσότερα

ΘΕΩΡΙΑ: Έστω η οµογενής γραµµική διαφορική εξίσωση τάξης , (1)

ΘΕΩΡΙΑ: Έστω η οµογενής γραµµική διαφορική εξίσωση τάξης , (1) 1 ΘΕΩΡΙΑ: Έστω η οµογενής γραµµική διαφορική εξίσωση τάξης (1) όπου οι συντελεστές είναι δοσµένες συνεχείς συναρτήσεις ορισµένες σ ένα ανοικτό διάστηµα. Ορισµός 1. Ορίζουµε τον διαφορικό τελεστή µέσω της

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Λυσεις Ασκησεων - Φυλλαδιο 1

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Λυσεις Ασκησεων - Φυλλαδιο 1 ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Λυσεις Ασκησεων - Φυλλαδιο ιδασκοντες: Α. Μπεληγιάννης - Σ. Παπαδάκης Ιστοσελιδα Μαθηµατος : http://users.uoi.gr/abeligia/numbertheory/nt.html Τετάρτη 7 Φεβρουαρίου 03 Ασκηση. είξτε ότι

Διαβάστε περισσότερα

Κεφάλαιο 6. Πεπερασµένα παραγόµενες αβελιανές οµάδες. Z 4 = 1 και Z 2 Z 2.

Κεφάλαιο 6. Πεπερασµένα παραγόµενες αβελιανές οµάδες. Z 4 = 1 και Z 2 Z 2. Κεφάλαιο 6 Πεπερασµένα παραγόµενες αβελιανές οµάδες Στο κεφάλαιο αυτό ϑα ταξινοµήσουµε τις πεπερασµένα παραγόµενες αβελιανές οµάδες. Αυτές οι οµάδες είναι από τις λίγες περιπτώσεις οµάδων µε µία συγκεκριµένη

Διαβάστε περισσότερα

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-3/03, -/04/006. Πρακτικά Συνεδρίου Έµµεσες µετρήσεις φυσικών µεγεθών. Παράδειγµα: Ο πειραµατικός υπολογισµός του g µέσω της µέτρησης του χρόνου των αιωρήσεων απλού

Διαβάστε περισσότερα

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τοµέας Μαθηµατικών, Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόµενα Εισαγωγή στη

Διαβάστε περισσότερα

(CLR, κεφάλαιο 32) Στην ενότητα αυτή θα µελετηθούν τα εξής θέµατα: Παραστάσεις πολυωνύµων Πολυωνυµική Παρεµβολή ιακριτός Μετασχηµατισµός Fourier

(CLR, κεφάλαιο 32) Στην ενότητα αυτή θα µελετηθούν τα εξής θέµατα: Παραστάσεις πολυωνύµων Πολυωνυµική Παρεµβολή ιακριτός Μετασχηµατισµός Fourier Ταχύς Μετασχηµατισµός Fourier CLR, κεφάλαιο 3 Στην ενότητα αυτή θα µελετηθούν τα εξής θέµατα: Παραστάσεις πολυωνύµων Πολυωνυµική Παρεµβολή ιακριτός Μετασχηµατισµός Fourier Ταχύς Μετασχηµατισµός Fourier

Διαβάστε περισσότερα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα

Εξαγωγή κανόνων από αριθµητικά δεδοµένα Εξαγωγή κανόνων από αριθµητικά δεδοµένα Συχνά το σύστηµα που θέλουµε να µοντελοποιήσουµε η να ελέγξουµε αντιµετωπίζεται ως µαύρο κουτί και η πληροφορία για τη λειτουργία του διατίθεται υπό µορφή ζευγών

Διαβάστε περισσότερα

5.1 Θεωρητική εισαγωγή

5.1 Θεωρητική εισαγωγή ΨΗΦΙΑΚΑ ΚΥΚΛΩΜΑΤΑ - ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 5 ΚΩ ΙΚΟΠΟΙΗΣΗ BCD Σκοπός: Η κατανόηση της µετατροπής ενός τύπου δυαδικής πληροφορίας σε άλλον (κωδικοποίηση/αποκωδικοποίηση) µε τη µελέτη της κωδικοποίησης BCD

Διαβάστε περισσότερα

2. Δυναμικό και χωρητικότητα αγωγού.

2. Δυναμικό και χωρητικότητα αγωγού. . Δυναμικό και χωρητικότητα αγωγού. Σε όλα τα σηµεία ενός αγωγού, σε ηλεκτροστατική ισορροπία, το δυναµικό είναι σταθερό. Για παράδειγµα, στην φορτισµένη σφαίρα του διπλανού σχήµατος τα σηµεία Α και Β

Διαβάστε περισσότερα

1 Ορισµός ακολουθίας πραγµατικών αριθµών

1 Ορισµός ακολουθίας πραγµατικών αριθµών ΜΑΣ 02. Απειροστικός Λογισµός Ι Ορισµός ακολουθίας πραγµατικών αριθµών Ορισµός.. Ονοµάζουµε ακολουθία πραγµατικών αριθµών κάθε απεικόνιση του συνόλου N των ϕυσικών αριθµών, στο σύνολο R των πραγµατικών

Διαβάστε περισσότερα

7. Ταλαντώσεις σε συστήµατα µε πολλούς βαθµούς ελευθερίας

7. Ταλαντώσεις σε συστήµατα µε πολλούς βαθµούς ελευθερίας 7 Ταλαντώσεις σε συστήµατα µε πολλούς βαθµούς ελευθερίας Συζευγµένες ταλαντώσεις Βιβλιογραφία F S Crawford Jr Κυµατική (Σειρά Μαθηµάτων Φυσικής Berkeley, Τόµος 3 Αθήνα 979) Κεφ H J Pai Φυσική των ταλαντώσεων

Διαβάστε περισσότερα

Γραµµική Άλγεβρα. Εισαγωγικά. Μέθοδος Απαλοιφής του Gauss

Γραµµική Άλγεβρα. Εισαγωγικά. Μέθοδος Απαλοιφής του Gauss Γραµµική Άλγεβρα Εισαγωγικά Υπάρχουν δύο βασικά αριθµητικά προβλήµατα στη Γραµµική Άλγεβρα. Το πρώτο είναι η λύση γραµµικών συστηµάτων Aλγεβρικών εξισώσεων και το δεύτερο είναι η εύρεση των ιδιοτιµών και

Διαβάστε περισσότερα

ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΒΑΣΙΚΕΣ Ι ΙΟΤΗΤΕΣ ΤΗΣ (Συνέχεια)

ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΒΑΣΙΚΕΣ Ι ΙΟΤΗΤΕΣ ΤΗΣ (Συνέχεια) ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΒΑΣΙΚΕΣ Ι ΙΟΤΗΤΕΣ ΤΗΣ (Συνέχεια) Χαράλαµπος Α. Χαραλαµπίδης 21 Οκτωβρίου 2009 ΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ Η ανάγκη εισαγωγής της δεσµευµένης πιθανότητας αναφύεται στις περιπτώσεις όπου µία µερική

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 2

ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ. Λυσεις Ασκησεων - Φυλλαδιο 2 ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ Τµηµα Β Λυσεις Ασκησεων - Φυλλαδιο ιδασκων: Α. Μπεληγιάννης Ιστοσελιδα Μαθηµατος : http://users.uoi.gr/abeligia/numbertheory/nt016/nt016.html Πέµπτη 7 Οκτωβρίου 016 Ασκηση 1. Βρείτε όλους

Διαβάστε περισσότερα

, όπου οι σταθερές προσδιορίζονται από τις αρχικές συνθήκες.

, όπου οι σταθερές προσδιορίζονται από τις αρχικές συνθήκες. Στην περίπτωση της ταλάντωσης µε κρίσιµη απόσβεση οι δύο γραµµικώς ανεξάρτητες λύσεις εκφυλίζονται (καταλήγουν να ταυτίζονται) Στην περιοχή ασθενούς απόσβεσης ( ) δύο γραµµικώς ανεξάρτητες λύσεις είναι

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ ΕΠΛ 035 - ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ ΓΙΑ ΗΛΕΚΤΡΟΛΟΓΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΚΑΙ ΜΗΧΑΝΙΚΟΥΣ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδηµαϊκό έτος 2017-2018 Υπεύθυνος εργαστηρίου: Γεώργιος

Διαβάστε περισσότερα

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 12η διάλεξη

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 12η διάλεξη ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 12η διάλεξη ηµήτρης-αλέξανδρος Τουµπακάρης Τµήµα ΗΜ&ΤΥ, Πανεπιστήµιο Πατρών 2 Ιουνίου 2015 ηµήτρης-αλέξανδρος Τουµπακάρης Προχ. Θέµατα Θεωρίας Πληροφορίας 12η

Διαβάστε περισσότερα

ΚΑΜΠΥΛΗ ENGEL ΚΑΙ Ι ΙΟΤΗΤΕΣ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΖΗΤΗΣΗΣ ΚΑΤΑ MARSHALL ΚΑΙ HICKS. 1. Η καµπύλη Engel

ΚΑΜΠΥΛΗ ENGEL ΚΑΙ Ι ΙΟΤΗΤΕΣ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΖΗΤΗΣΗΣ ΚΑΤΑ MARSHALL ΚΑΙ HICKS. 1. Η καµπύλη Engel ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΘΗΓΗΤΗΣ ΚΩΣΤΑΣ ΒΕΛΕΝΤΖΑΣ ΚΑΜΠΥΛΗ ENGEL ΚΑΙ Ι ΙΟΤΗΤΕΣ ΤΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΖΗΤΗΣΗΣ ΚΑΤΑ ARSALL ΚΑΙ ICKS. Η καµπύλη Egel Η καµπύλη Egel παράγεται από την

Διαβάστε περισσότερα

Κεφάλαιο 6 Παράγωγος

Κεφάλαιο 6 Παράγωγος Σελίδα από 5 Κεφάλαιο 6 Παράγωγος Στο κεφάλαιο αυτό στόχος µας είναι να συνδέσουµε µία συγκεκριµένη συνάρτηση f ( ) µε µία δεύτερη συνάρτηση f ( ), την οποία και θα ονοµάζουµε παράγωγο της f. Η τιµή της

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης.

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης. Γενικές Παρατηρήσεις Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα () Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Υπάρχουν µη κανονικές γλώσσες, π.χ., B = { n n n }. Αυτό

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Κεφάλαιο 5 Οι χώροι. Περιεχόµενα 5.1 Ο Χώρος. 5.3 Ο Χώρος C Βάσεις Το Σύνηθες Εσωτερικό Γινόµενο Ασκήσεις

Κεφάλαιο 5 Οι χώροι. Περιεχόµενα 5.1 Ο Χώρος. 5.3 Ο Χώρος C Βάσεις Το Σύνηθες Εσωτερικό Γινόµενο Ασκήσεις Σελίδα 1 από 6 Κεφάλαιο 5 Οι χώροι R και C Περιεχόµενα 5.1 Ο Χώρος R Πράξεις Βάσεις Επεξεργασµένα Παραδείγµατα Ασκήσεις 5. Το Σύνηθες Εσωτερικό Γινόµενο στο Ορισµοί Ιδιότητες Επεξεργασµένα Παραδείγµατα

Διαβάστε περισσότερα

o AND o IF o SUMPRODUCT

o AND o IF o SUMPRODUCT Πληροφοριακά Εργαστήριο Management 1 Information Συστήματα Systems Διοίκησης ΤΕΙ Τμήμα Ελεγκτικής Ηπείρου Χρηματοοικονομικής (Παράρτημα Πρέβεζας) και Αντικείµενο: Μοντελοποίηση προβλήµατος Θέµατα που καλύπτονται:

Διαβάστε περισσότερα

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ] Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών ΗΥ-317: Εφαρµοσµένες Στοχαστικές ιαδικασίες-εαρινό Εξάµηνο 2016 ιδάσκων : Π. Τσακαλίδης Συνδιασπορά - Συσχέτιση Τυχαίων Μεταβλητών Επιµέλεια : Κωνσταντίνα

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) ΑΠΑΝΤΗΣΕΙΣ Α ΕΡΓΑΣΙΑΣ. ( 8 µον.) Η άσκηση αυτή αναφέρεται σε διαιρετότητα και ρίζες πολυωνύµων. a. Να λυθεί η εξίσωση

Διαβάστε περισσότερα

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ Παρουσίαση ΙΑΝΥΣΜΑΤΑ Παρουσίαση η Κάθετες συνιστώσες διανύσµατος Παράδειγµα Θα αναλύσουµε το διάνυσµα v (, ) σε δύο κάθετες µεταξύ τους συνιστώσες από τις οποίες η µία να είναι παράλληλη στο α (3,) Πραγµατικά

Διαβάστε περισσότερα

Όνοµα: Λιβαθινός Νικόλαος 2291

Όνοµα: Λιβαθινός Νικόλαος 2291 ΠΡΩΤΗ ΆΣΚΗΣΗ ΣΤΗΝ ΚΡΥΠΤΟΓΡΑΦΙΑ Όνοµα: Λιβαθινός Νικόλαος 9 Ηµεροµηνία: 3/5/003 Άσκηση ώστε όλες τις υποοµάδες των Z και Ζ 5 * Προκειµένου να δώσουµε τις υποοµάδες θα πρέπει αρχικά να ορίσουµε τα σύνολα

Διαβάστε περισσότερα

Επίλυση Γραµµικών Συστηµάτων

Επίλυση Γραµµικών Συστηµάτων Κεφάλαιο 3 Επίλυση Γραµµικών Συστηµάτων 31 Εισαγωγή Αριθµητική λύση γενικών γραµµικών συστηµάτων n n A n n x n 1 b n 1, όπου a 11 a 12 a 1n a 21 a 22 a 2n A [a i j, x a n1 a n2 a nn x n, b b 1 b 2 b n

Διαβάστε περισσότερα

[ ], σχηµατίζουµε το άθροισµα. Το άθροισµα αυτό είναι µια δυαδική πράξη η οποία αντιστοιχεί στις ακολουθίες f [ 1

[ ], σχηµατίζουµε το άθροισµα. Το άθροισµα αυτό είναι µια δυαδική πράξη η οποία αντιστοιχεί στις ακολουθίες f [ 1 ΚΕΦΑΛΑΙΟ 4 ΣΥΝΕΛΙΞΗ 4.. ΣΥΝΕΛΙΞΗ Στην προηγούµενη παράγραφο εισαγάγαµε την ιδέα της συνέλιξης από τα συµφραζόµενα των γραµµικών συστηµάτων. Σ' αυτήν την παράγραφο ορίζουµε τη συνέλιξη σαν µια πράξη η οποία

Διαβάστε περισσότερα

Ασαφής Λογική Παράδειγµα. Νίκος Καραδήµας

Ασαφής Λογική Παράδειγµα. Νίκος Καραδήµας Ασαφής Λογική Παράδειγµα Νίκος Καραδήµας Παράδειγµα Θα εξεταστεί το πρόβληµα του φιλοδωρήµατος: «Ποιο είναι το "σωστό" φιλοδώρηµα γιατονσερβιτόροµας;» Λαµβάνοντας υπόψη έναν αριθµό µεταξύ 0 και 10 που

Διαβάστε περισσότερα

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα;

µηδενικό πολυώνυµο; Τι ονοµάζουµε βαθµό του πολυωνύµου; Πότε δύο πολυώνυµα είναι ίσα; ΘΕΩΡΙΑ ΠΟΛΥΩΝΥΜΩΝ 1. Τι ονοµάζουµε µονώνυµο Μονώνυµο ονοµάζεται κάθε γινόµενο το οποίο αποτελείται από γνωστούς και αγνώστους (µεταβλητές ) πραγµατικούς αριθµούς. Ο γνωστός πραγµατικός αριθµός ονοµάζεται

Διαβάστε περισσότερα

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville Τµήµα Π. Ιωάννου & Θ. Αποστολάτου 16/5/2000 Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville Στη Χαµιλτονιανή θεώρηση η κατάσταση του συστήµατος προσδιορίζεται κάθε στιγµή από ένα και µόνο σηµείο

Διαβάστε περισσότερα

Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών

Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών Συμβολισμοί Σε αναλογία με τους ορισμούς συμβολίζουμε μια ακολουθία: 1 είτε μέσω του διανυσματικού ορισμού, παραθέτοντας αναγκαστικά

Διαβάστε περισσότερα

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 6η διάλεξη

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 6η διάλεξη ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 6η διάλεξη ηµήτρης-αλέξανδρος Τουµπακάρης Τµήµα ΗΜ&ΤΥ, Πανεπιστήµιο Πατρών 24 Μαρτίου 2010 ηµήτρης-αλέξανδρος Τουµπακάρης Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας

Διαβάστε περισσότερα

τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα.

τη µέθοδο της µαθηµατικής επαγωγής για να αποδείξουµε τη Ϲητούµενη ισότητα. Αριστοτελειο Πανεπιστηµιο Θεσσαλονικης Τµηµα Μαθηµατικων Εισαγωγή στην Αλγεβρα Τελική Εξέταση 15 Φεβρουαρίου 2017 1. (Οµάδα Α) Εστω η ακολουθία Fibonacci F 1 = 1, F 2 = 1 και F n = F n 1 + F n 2, για n

Διαβάστε περισσότερα

KΕΦΑΛΑΙΟ 1 ΧΡΗΣΙΜΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ. { 1,2,3,..., n,...

KΕΦΑΛΑΙΟ 1 ΧΡΗΣΙΜΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ. { 1,2,3,..., n,... KΕΦΑΛΑΙΟ ΧΡΗΣΙΜΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ Βασικές έννοιες διαιρετότητας Θα συµβολίζουµε µε, τα σύνολα των φυσικών αριθµών και των ακεραίων αντιστοίχως: {,,3,,, } { 0,,,,, } = = ± ± ± Ορισµός Ένας φυσικός αριθµός

Διαβάστε περισσότερα

Κεφάλαιο M3. Διανύσµατα

Κεφάλαιο M3. Διανύσµατα Κεφάλαιο M3 Διανύσµατα Διανύσµατα Διανυσµατικά µεγέθη Φυσικά µεγέθη που έχουν τόσο αριθµητικές ιδιότητες όσο και ιδιότητες κατεύθυνσης. Σε αυτό το κεφάλαιο, θα ασχοληθούµε µε τις µαθηµατικές πράξεις των

Διαβάστε περισσότερα

(GNU-Linux, FreeBSD, MacOsX, QNX

(GNU-Linux, FreeBSD, MacOsX, QNX 1.7 διαταξεις (σελ. 17) Παράδειγµα 1 Θα πρέπει να κάνουµε σαφές ότι η επιλογή των λέξεων «προηγείται» και «έπεται» δεν έγινε απλώς για λόγους αφαίρεσης. Μπορούµε δηλαδή να ϐρούµε διάφορα παραδείγµατα στα

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) ΕΡΓΑΣΙΑ η (Ηµεροµηνία Αποστολής στον Φοιτητή: 7 Οκτωβρίου 00) Η Εργασία χωρίζεται σε µέρη: Το πρώτο Ασκήσεις - περιλαµβάνει

Διαβάστε περισσότερα

Κεφάλαιο 1. Θεωρία Ζήτησης

Κεφάλαιο 1. Θεωρία Ζήτησης Κεφάλαιο 1 Θεωρία Ζήτησης Στο κεφάλαιο αυτό υποθέτουµε ότι καταναλωτής εισέρχεται στην αγορά µε πλούτο w > 0 και επιθυµεί να τον ανταλλάξει µε διάνυσµα αγαθών x που να µεγιστοποιεί τις προτιµήσεις του.

Διαβάστε περισσότερα

Ορισµός. (neighboring) καταστάσεων. ηλαδή στην περίπτωση αλυσίδας Markov. 1.2 ιαµόρφωση µοντέλου

Ορισµός. (neighboring) καταστάσεων. ηλαδή στην περίπτωση αλυσίδας Markov. 1.2 ιαµόρφωση µοντέλου 200-04-25. ιαδικασίες γεννήσεων-θανάτων. Ορισµός Οι διαδικασίες γεννήσεων-θανάτων (birth-death rocesses) αποτελούν µια σπουδαία κλάση αλυσίδων Markov (διακριτού ή συνεχούς χρόνου). Η ιδιαίτερη συνθήκη

Διαβάστε περισσότερα

3 Αναδροµή και Επαγωγή

3 Αναδροµή και Επαγωγή 3 Αναδροµή και Επαγωγή Η ιδέα της µαθηµατικής επαγωγής µπορεί να επεκταθεί και σε άλλες δοµές εκτός από το σύνολο των ϕυσικών N. Η ορθότητα της µαθηµατικής επαγωγής ϐασίζεται όπως ϑα δούµε λίγο αργότερα

Διαβάστε περισσότερα

Μαθηµατικό Παράρτηµα 2 Εξισώσεις Διαφορών

Μαθηµατικό Παράρτηµα 2 Εξισώσεις Διαφορών Γιώργος Αλογοσκούφης, Δυναµική Μακροοικονοµική, Αθήνα 206 Μαθηµατικό Παράρτηµα 2 Εξισώσεις Διαφορών Στο παράρτηµα αυτό εξετάζουµε τις ιδιότητες και τους τρόπους επίλυσης εξισώσεων διαφορών. Oι εξισώσεις

Διαβάστε περισσότερα

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata

Σύνοψη Προηγούµενου. Γλώσσες χωρίς Συµφραζόµενα (2) Ισοδυναµία CFG και PDA. Σε αυτό το µάθηµα. Αυτόµατα Στοίβας Pushdown Automata Σύνοψη Προηγούµενου Γλώσσες χωρίς Συµφραζόµενα (2) Ορέστης Τελέλης telelis@unipi.gr Τµήµα Ψηφιακών Συστηµάτων, Πανεπιστήµιο Πειραιώς Αυτόµατα Στοίβας Pushdown utomata Ισοδυναµία µε τις Γλώσσες χωρίς Συµφραζόµενα:

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΜΗ ΓΡΑΜΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ

ΚΕΦΑΛΑΙΟ 2 ΜΗ ΓΡΑΜΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ ΚΕΦΑΛΑΙΟ ΜΗ ΓΡΑΜΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ Η αδυναµία επίλυσης της πλειοψηφίας των µη γραµµικών εξισώσεων µε αναλυτικές µεθόδους, ώθησε στην ανάπτυξη αριθµητικών µεθόδων για την προσεγγιστική επίλυσή τους, π.χ. συν()

Διαβάστε περισσότερα

Παράρτηµα 3 Εξισώσεις Διαφορών και Στοχαστικές Διαδικασίες

Παράρτηµα 3 Εξισώσεις Διαφορών και Στοχαστικές Διαδικασίες Γιώργος Αλογοσκούφης, Θέµατα Δυναµικής Μακροοικονοµικής, Αθήνα 0 Παράρτηµα 3 Εξισώσεις Διαφορών και Στοχαστικές Διαδικασίες Στο παράρτηµα αυτό εξετάζουµε τις ιδιότητες και τους τρόπους επίλυσης των εξισώσεων

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) Ενδεικτικές Λύσεις ΕΡΓΑΣΙΑ η Ηµεροµηνία Αποστολής στον Φοιτητή: Ιανουαρίου 6 Ηµεροµηνία Παράδοσης της Εργασίας από

Διαβάστε περισσότερα

Αρµονική Ανάλυση. Ενότητα: Το ϑεώρηµα παρεµβολής του Riesz και η ανισότητα Hausdorff-Young. Απόστολος Γιαννόπουλος.

Αρµονική Ανάλυση. Ενότητα: Το ϑεώρηµα παρεµβολής του Riesz και η ανισότητα Hausdorff-Young. Απόστολος Γιαννόπουλος. Ενότητα: Το ϑεώρηµα παρεµβολής του Riesz και η ανισότητα Hausdorff-Young Απόστολος Γιαννόπουλος Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών

Γραµµική Αλγεβρα Ι. Ενότητα: ιανυσµατικοί χώροι. Ευάγγελος Ράπτης. Τµήµα Μαθηµατικών Ενότητα: ιανυσµατικοί χώροι Ευάγγελος Ράπτης Τµήµα Μαθηµατικών Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται

Διαβάστε περισσότερα

Κεφάλαιο 2. Παραγοντοποίηση σε Ακέραιες Περιοχές

Κεφάλαιο 2. Παραγοντοποίηση σε Ακέραιες Περιοχές Κεφάλαιο Παραγοντοποίηση σε Ακέραιες Περιοχές Γνωρίζουµε ότι στο Ÿ κάθε στοιχείο εκτός από το 0 και τα ± γράφεται ως γινόµενο πρώτων αριθµών κατά τρόπο ουσιαστικά µοναδικό Από τη Βασική Άλγεβρα ξέρουµε

Διαβάστε περισσότερα

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 14 Νοεµβρίου, 2006 Γεώργιος Έλληνας Επίκουρος Καθηγητής ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ 3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ 3. Διαφορά μετρήσεων από εκτιμήσεις μετρήσεων. Όταν επιλύοµε ένα αντίστροφο πρόβληµα υπολογίζοµε ένα διάνυσµα παραµέτρων est m το οποίο αντιπροσωπεύει

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 25 Αυγούστου 26 :-4: Κατασκευάστε έναν αισθητήρα (perceptron)

Διαβάστε περισσότερα

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Τοµέας Τηλεπικοινωνιών Αναπληρωτής Καθηγητής: Αλέξανδρος Ποταµιάνος

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Τοµέας Τηλεπικοινωνιών Αναπληρωτής Καθηγητής: Αλέξανδρος Ποταµιάνος ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Τοµέας Τηλεπικοινωνιών Αναπληρωτής Καθηγητής: Αλέξανδρος Ποταµιάνος ΤΗΛ 413 : Συστήµατα Επικοινωνίας Φυσικής Γλώσσας 8 ο Εξάµηνο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ ο 2.5 µονάδες ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 2 Οκτωβρίου 23 ιάρκεια: 2 ώρες Έστω το παρακάτω γραµµικώς

Διαβάστε περισσότερα

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης Αναγνώριση Προτύπων (Pattern Recognton Μπεϋζιανή Θεωρία Αποφάσεων (Bayesan Decson Theory Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ Μπεϋζιανή Θεωρία Αποφάσεων (Bayes Decson theory Στατιστικά

Διαβάστε περισσότερα

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος. Γλωσσική Τεχνολογία Εισαγωγή 2015 16 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ Τι θα ακούσετε Εισαγωγή στη γλωσσική τεχνολογία. Ύλη και οργάνωση του μαθήματος. Προαπαιτούμενες γνώσεις και άλλα προτεινόμενα

Διαβάστε περισσότερα

Ζητείται να µελετηθεί το εν λόγω σύστηµα µε είσοδο βηµατική συνάρτηση δηλαδή () =(). (3)

Ζητείται να µελετηθεί το εν λόγω σύστηµα µε είσοδο βηµατική συνάρτηση δηλαδή () =(). (3) Παράδειγµα 1: Έστω ένα σύστηµα που περιγράφεται από τη διαφορική εξίσωση () +2 () 29 () +42()=() (1) µε µηδενικές αρχικές συνθήκες. (δηλαδή ()(0) = () (0)=()(0)=0) (2) Ζητείται να µελετηθεί το εν λόγω

Διαβάστε περισσότερα

4. Ο αισθητήρας (perceptron)

4. Ο αισθητήρας (perceptron) 4. Ο αισθητήρας (perceptron) Σκοπός: Προσδοκώµενα αποτελέσµατα: Λέξεις Κλειδιά: To µοντέλο του αισθητήρα (perceptron) είναι από τα πρώτα µοντέλα νευρωνικών δικτύων που αναπτύχθηκαν, και έδωσαν µεγάλη ώθηση

Διαβάστε περισσότερα

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων Περιεχόµενα ΕΠΛ 422: Συστήµατα Πολυµέσων Ψηφιακή Αναπαράσταση Σήµατος: ειγµατοληψία Βιβλιογραφία ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων Βασικές Έννοιες Επεξεργασίας Σηµάτων Ψηφιοποίηση

Διαβάστε περισσότερα

( x) (( ) ( )) ( ) ( ) ψ = 0 (1)

( x) (( ) ( )) ( ) ( ) ψ = 0 (1) ΚΑΤΑΣΤΑΣΕΙΣ ΕΛΑΧΙΣΤΗΣ ΑΒΕΒΑΙΟΤΗΤΑΣ ΘΕΣΗΣ ΟΡΜΗΣ ΣΤΗΝ ΑΝΑΠΑΡΑΣΤΑΣΗ ΘΕΣΗΣ Στην προηγούµενη ανάρτηση, δείξαµε ότι η κατάσταση είναι κατάσταση ελάχιστης αβεβαιότητας των µη µετατιθέµενων ερµιτιανών τελεστών

Διαβάστε περισσότερα

2. Στοιχεία Πολυδιάστατων Κατανοµών

2. Στοιχεία Πολυδιάστατων Κατανοµών Στοιχεία Πολυδιάστατων Κατανοµών Είναι φανερό ότι έως τώρα η µελέτη µας επικεντρώνεται κάθε φορά σε πιθανότητες που αφορούν µία τυχαία µεταβλητή Σε αρκετές όµως περιπτώσεις ενδιαφερόµαστε να εξετάσουµε

Διαβάστε περισσότερα

Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1)

Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1) Case 06: Το πρόβληµα τωνlorie και Savage Εισαγωγή (1) Το εσωτερικό ποσοστό απόδοσης (internal rate of return) ως κριτήριο αξιολόγησης επενδύσεων Προβλήµατα προκύπτουν όταν υπάρχουν επενδυτικές ευκαιρίες

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ ) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ Οι πρώτες δύο ασκήσεις αναφέρονται στις έννοιες γραµµική ανεξαρτησία, γραµµικός

Διαβάστε περισσότερα