ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΕ «ΣΥΣΤΗΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ ΚΑΙ ΕΙΚΟΝΩΝ: ΘΕΩΡΙΑ, ΥΛΟΠΟΙΗΣΕΙΣ, ΕΦΑΡΜΟΓΕΣ»

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΕ «ΣΥΣΤΗΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ ΚΑΙ ΕΙΚΟΝΩΝ: ΘΕΩΡΙΑ, ΥΛΟΠΟΙΗΣΕΙΣ, ΕΦΑΡΜΟΓΕΣ»"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΕ «ΣΥΣΤΗΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ ΚΑΙ ΕΙΚΟΝΩΝ: ΘΕΩΡΙΑ, ΥΛΟΠΟΙΗΣΕΙΣ, ΕΦΑΡΜΟΓΕΣ» «ΥΛΟΠΟΙΗΣΗ ΒΑΘΜΙΔΑΣ Ψ.Ε.Σ. (ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΟΣ) ΣΥΣΤΗΜΑΤΟΣ ΣΥΝΘΕΣΗΣ ΟΜΙΛΙΑΣ ΜΕ ΒΑΣΗ ΤΟΝ ΑΛΓΟΡΙΘΜΟ ΗΝΜ» ΒΑΣΙΛΟΠΟΥΛΟΣ ΙΩΑΝΝΗΣ ΠΤΥΧΙΟΥΧΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΡΙΘΜΟΣ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ... ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: κ. ΦΑΚΩΤΑΚΗΣ ΝΙΚΟΛΑΟΣ ΤΡΙΜΕΛΗΣ ΕΞΕΤΑΣΤΙΚΗ ΕΠΙΤΡΟΠΗ: κ. ΣΤΟΥΡΑΪΤΗΣ ΑΘΑΝAΣΙΟΣ κ. ΦΑΚΩΤΑΚΗΣ ΝΙΚΟΛΑΟΣ κ. ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΙΩΑΝΝΗΣ ΟΚΤΩΒΡΙΟΣ 2005

2 ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ ΤΙ ΕΙΝΑΙ ΕΝΑ TEXT TO SPEECH (TTS) ΣΥΣΤΗΜΑ ΑΠΟ ΤΙ ΑΠΟΤΕΛΕΙΤΑΙ Ο ΗΧΟΣ ΠΕΡΙΓΡΑΦΗ ΕΝΟΣ TEXT TO SPEECH (TTS) ΣΥΣΤΗΜΑΤΟΣ Βαθμίδα Επεξεργασίας Φυσικής Γλώσσας... 5 (Natural Language Proceng - NLP) Βαθμίδα Ψηφιακής Επεξεργασίας Σήματος (Dgtal Sgnal Proceng - DSP) ΚΕΦΑΛΑΙΟ 2 ΤΕΧΝΙΚΕΣ ΣΥΝΘΕΣΗΣ ΟΜΙΛΙΑΣ ΚΑΤΗΓΟΡΙΕΣ ΤΕΧΝΙΚΩΝ ΣΥΝΘΕΣΗΣ ΟΜΙΛΙΑΣ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΣΗΜΑΤΩΝ ΣΥΝΘΕΣΗ ΒΑΣΙΣΜΕΝΗ ΣΕ ΚΑΝΟΝΕΣ ΚΑΙ ΣΥΝΘΕΣΗ ΜΕ ΣΥΝΕΝΩΣΗ ΣΥΝΘΕΣΗ ΓΡΑΜΜΙΚΗΣ ΠΡΟΒΛΕΨΗΣ ΚΑΙ PSOLA ΣΥΝΘΕΣΗ FORMANT ΣΥΝΘΕΣΗ ΣΥΝΘΕΣΗ ΓΡΑΜΜΙΚΗΣ ΠΡΟΒΛΕΨΗΣ PSOLA ΣΥΝΘΕΣΗ ΓΕΝΙΚΕΣ ΑΡΧΕΣ ΤΗΣ PSOLA ΣΥΝΘΕΣΗΣ TD-PSOLA ΚΕΦΑΛΑΙΟ 3 Ο ΑΛΓΟΡΙΘΜΟΣ PSOLA ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΗΧΗΡΟΙ ΚΑΙ ΑΗΧΟΙ ΗΧΟΙ ΥΨΟΣ ΦΩΝΗΣ (PITCH) ΠΕΡΙΒΑΛΛΟΥΣΑ ΥΨΟΥΣ ΦΩΝΗΣ (PITCH CONTOUR) TD-PSOLA ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΑΝΑΛΥΣΗ ΟΜΙΛΙΑΣ ΣΥΝΘΕΣΗ ΟΜΙΛΙΑΣ ΜΕΤΑΒΟΛΕΣ ΣΤΗΝ ΣΥΝΘΕΤΙΚΗ ΟΜΙΛΙΑ ΠΕΡΙΟΡΙΣΜΟΙ ΤΟΥ ΒΑΣΙΚΟΎ ΑΛΓΟΡΙΘΜΟΥ PSOLA ΒΕΛΤΙΏΣΕΙΣ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ PSOLA FD-PSOLA LP-PSOLA MBR-PSOLA ΚΕΦΑΛΑΙΟ 4 Ο ΑΛΓΟΡΙΘΜΟΣ HNM (HARMONIC PLUS NOISE MODEL) ΕΙΣΑΓΩΓΗ ΠΕΡΙΓΡΑΦΗ ΤΟΥ HNM ΥΠΟΛΟΓΙΣΜΟΣ ΠΑΡΑΜΕΤΡΩΝ HNM PITCH, VOICING ΚΑΙ ΜΕΓΙΣΤΗ ΗΧΗΡΗ ΣΥΧΝΟΤΗΤΑ ΑΡΧΙΚΗ ΕΚΤΙΜΗΣΗ PITCH VOICED / UNVOICED ΑΠΟΦΑΣΗ ΥΠΟΛΟΓΙΣΜΟΣ ΜΕΓΙΣΤΗΣ ΗΧΗΡΗΣ ΣΥΧΝΟΤΗΤΑΣ ΒΕΛΤΙΩΣΗ ΑΡΧΙΚΗΣ ΕΚΤΙΜΗΣΗ.PITCH ΑΛΓΟΡΙΘΜΟΣ ΑΝΙΧΝΕΥΣΗΣ PITCH ΥΠΟΛΟΓΙΣΜΟΣ ΠΛΑΤΟΥΣ ΚΑΙ ΦΑΣΗΣ ΥΠΟΛΟΓΙΣΜΟΣ ΠΑΡΑΜΕΤΡΩΝ ΘΟΡΥΒΟΥ ΥΠΟΛΟΓΙΣΜΟΣ ΠΕΡΙΒΑΛΛΟΥΣΩΝ ΠΛΑΤΟΥΣ ΚΑΙ ΦΑΣΗΣ ΥΠΟΛΟΓΙΣΜΟΣ ΠΕΡΙΒΑΛΛΟΥΣΑΣ ΦΑΣΗΣ ΥΠΟΛΟΓΙΣΜΟΣ ΠΕΡΙΒΑΛΛΟΥΣΑΣ ΠΛΑΤΟΥΣ ΣΥΝΘΕΣΗ ΧΩΡΙΣ ΜΕΤΑΒΟΛΕΣ... 56

3 4.5.1 ΣΥΝΘΕΣΗ ΤΟΥ ΑΡΜΟΝΙΚΟΥ ΜΕΡΟΥΣ ΣΥΝΘΕΣΗ ΤΟΥ ΜΕΡΟΥΣ ΘΡΥΒΟΥ ΜΙΑ ΕΝΑΛΛΑΚΤΙΚΗ ΜΕΘΟΔΟΣ ΓΙΑ ΤΟ ΜΕΡΟΣ ΘΟΡΥΒΟΥ ΠΡΟΣΩΔΙΑΚΕΣ ΜΕΤΑΒΟΛΕΣ ΥΠΟΛΟΓΙΣΜΟΣ ΧΡΟΝΙΚΩΝ ΣΤΙΓΜΩΝ ΣΥΝΘΕΣΗΣ ΧΡΟΝΙΚΕΣ ΜΕΤΑΒΟΛΕΣ ΜΕΤΑΒΟΛΕΣ PITCH ΣΥΝΔΥΑΣΜΟΣ ΧΡΟΝΙΚΩΝ PITCH ΜΕΤΑΒΟΛΩΝ ΑΝΤΙΣΤΟΙΧΙΣΗ ΧΡΟΝΙΚΩΝ ΣΤΙΓΜΩΝ ΣΥΝΘΕΣΗΣ ΣΤΙΣ ΧΡΟΝΙΚΕΣ ΣΤΙΓΜΕΣ ΑΝΑΛΥΣΗΣ ΥΠΟΛΟΓΙΣΜΟΣ ΠΛΑΤΟΥΣ ΚΑΙ ΦΑΣΗΣ ΣΤΙΣ ΜΕΤΑΒΛΗΘΕΙΣΕΣ ΑΡΜΟΝΙΚΕΣ ΣΥΧΝΟΤΗΤΕΣ ΣΥΝΘΕΣΗ ΜΕ ΤΗ ΧΡΗΣΗ ΤΩΝ ΤΡΟΠΟΠΟΙΗΜΕΝΩΝ ΠΑΡΑΜΕΤΡΩΝ ΗΜΙΤΟΝΩΝ ΜΕΤΑΒΟΛΕΣ ΕΝΤΑΣΗΣ ΑΛΛΟΥ ΕΙΔΟΥΣ ΜΕΤΑΒΟΛΕΣ ΣΧΗΜΑ ΣΥΝΘΕΣΗΣ ΓΙΑ ΠΡΟΣΩΔΙΑΚΕΣ ΜΕΤΑΒΟΛΕΣ ΚΕΦΑΛΑΙΟ 5 ΥΛΟΠΟΙΗΣΗ ΤΟΥ TEXT TO SPEECH ΣΥΣΤΗΜΑΤΟΣ ΥΛΟΠΟΙΗΣΗ ΒΑΘΜΙΔΑΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ ΟΡΓΑΝΩΣΗ ΗΧΗΤΙΚΗΣ ΒΑΣΗΣ ΛΕΙΤΟΥΡΓΙΑ ΒΑΘΜΙΔΑΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ ΥΛΟΠΟΙΗΣΗ ΒΑΘΜΙΔΑΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΟΣ ΑΝΑΛΥΣΗ ΗΝΜ ΗΝΜParametrzeFle.m CenterSgnal.m SgToFrame.m FFTFrame.m ComputeHarmErrorFFT.m FndBetPathInMnma.m CreatePtchT.m CreateMaxFreqTHard.m GetCplxAmpl.m UnWrapPhae.m GetCeptrCoefFromAmpl.m GetLPCAmplNoe.m ΣΥΝΘΕΣΗ ΗΝΜ ΗΝΜSynthezeFle.m InvereFunc.m GetNewAk.m GetNewAkFromAmpltudeEnvelope.m GetNewFkFromPhaeEnvelope.m GetNewAkFromAmpltudeEnvelopeIn.m GetNewFkFromPhaeEnvelopeIn.m UnWrapPhaeIn.m ΚΕΦΑΛΑΙΟ 6 ΠΟΙΟΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΣΜΑΤΩΝ...94 ΠΑΡΑΠΟΜΠΕΣ...114

4 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ Σκοπός αυτής της διπλωματικής εργασίας είναι η εξέταση της βαθμίδας ΨΕΣ (Ψηφιακής Επεξεργασίας Σήματος) ενός TTS (Τext-To-Speech) Συστήματος και πως μπορεί να χρησιμοποιηθεί ο αλγόριθμος HNM (Harmonc plu Noe Model) για να υλοποιήσουμε ένα σύστημα σύνθεσης ομιλίας. Θα αναφερθούν μερικά εισαγωγικά στοιχεία για τα TTS συστήματα, τη λειτουργία τους και τη χρήση τους καθώς και τις καινοτομίες που εισάγει ο αλγόριθμος HNM τόσο στην κωδικοποίηση του ηχητικού σήματος ομιλίας όσο και στις τεχνικές που χρησιμοποιεί για την επανασύνθεση και την τροποποίηση της διάρκειας και του ptch του αρχικού σήματος. 1.1 ΤΙ ΕΙΝΑΙ ΕΝΑ TEXT TO SPEECH (TTS) ΣΥΣΤΗΜΑ Aπο καιρό υπήρχε η επιθυμία των ανθρώπων να δημιουργήσουν ένα μηχάνημα το οποίο θα μπορούσε να μιλά όπως ο άνθρωπός. Ήδη από τον 18 ο αιώνα είχαν ξεκινήσει τέτοιου είδους προσπάθειες. Τα πρώτα συστήματα παραγωγής ομιλίας ήταν κατασκευασμένα με μηχανικά ή ηλεκτρονικά μέσα [1]. Αν και είχαν γίνει παρά πολλές προσπάθειες, να επιτευχθεί υψηλής ποιότητας ήχος,αυτό μπόρεσε να γίνει εφικτό μόνο μετά την ανακάλυψη των ψηφιακών Η/Υ και αυτό γιατί τα σύγχρονα συστήματα παραγωγής ομιλίας χρησιμοποιούν ψηφιακά μέσα. Λόγω της ευχρηστίας των ψηφιακών μεθόδων μπορούν να εφαρμοστούν πιο περίπλοκοι αλγόριθμοι και έτσι να επιτευχθεί μια αρκετή καλή ποιότητα ομιλίας.[1,2] Πριν γίνει λόγος για τη σύνθεση της ομιλίας θα εξεταστεί πρώτα το τι είναι ένα πλήρες Text To Speech (TTS) σύστημα. Μια απλή παρουσίαση είναι ότι ένα Text To Speech (TTS) είναι σύστημα το οποίο μετατρέπει το γραπτό λόγο σε προφορικό.[3] Ένας αναλυτικότερος και πιο ολοκληρωμένος ορισμός, όμως, θα μπορούσε να είναι ο εξής : ένα Text To Speech (TTS) σύστημα είναι ένα βασισμένο σε υπολογιστή σύστημα που πρέπει να είναι σε θέση να διαβάσει οποιοδήποτε κείμενο μεγαλοφώνως, εάν εισήχθη άμεσα στον υπολογιστή από έναν χειριστή ή εισήχθη με τη βοήθεια canner και έπειτα σε ένα σύστημα οπτικής αναγνώρισης χαρακτήρων (Optcal Character Regognton - OCR).[3] Υπάρχει μια θεμελιώδης διαφορά μεταξύ του συστήματος που συζητείται εδώ και οποιασδήποτε άλλης ομιλούσας μηχανής ( κασετόφωνο παραδείγματος χάριν) υπό την έννοια ότι ο βασικός σκοπός είναι η αυτόματη παραγωγή νέων προτάσεων.[4] Αυτός ο ορισμός χρειάζεται ακόμα μερικούς καθορισμούς. Τα συστήματα που απλά συνενώνουν απομονωμένες λέξεις ή μέρη προτάσεων, που αναφέρονται ως Συστήματα Απόκρισης Φωνής, μπορούν να χρησιμοποιηθούν μόνο όταν απαιτείται ένα περιορισμένο λεξιλόγιο (χαρακτηριστικά μερικές εκατοντάδες λέξεων), και όταν οι προτάσεις έχουν μια πολύ περιορισμένη δομή, όπως συμβαίνει για την ανακοίνωση των αφίξεων στους σταθμούς τραίνων παραδείγματος χάριν[4]. Στα πλαίσια της TTS σύνθεσης, είναι αδύνατο (και ευτυχώς άχρηστο) να καταγραφούν και να αποθηκευτούν όλες οι λέξεις της 1

5 γλώσσας. Είναι έτσι καταλληλότερο να καθοριστεί ένα Text To Speech (TTS) ως σύστημα αυτόματη παραγωγή ομιλίας, μέσω μετατροπής των στοιχείων γραφής (grapheme) των προτάσεων που θα ειπωθούν σε φωνήματα. Η ανάγνωση θα πρέπει να είναι καταληπτή και φυσική, διότι σε τέτοια συστήματα δεν ενδιαφέρει η απλή αναπαραγωγή της προηχογραφημένης ομιλίας, αλλά κυρίως η φυσικότητα και η καταληπτότητα της ομιλίας[5]. Κάθε προσπάθεια σύνθεσης είναι το αποτέλεσμα μιας ιδιαίτερης και αρχικής μίμησης της ανθρώπινης ικανότητας ανάγνωσης, που υπόκειται στους τεχνολογικούς και επινοητικούς περιορισμούς που είναι χαρακτηριστικοί του χρόνου δημιουργίας της. Η έννοια της υψηλής ποιότητας TTS σύνθεσης εμφανίστηκε στα μέσα της δεκαετία του '80, ως αποτέλεσμα των σημαντικών εξελίξεων στις τεχνικές λεκτικής σύνθεσης και επεξεργασίας φυσικής γλώσσας, που οφείλονται κυρίως στην εμφάνιση των νέων τεχνολογιών[6].οι πιθανές εφαρμογές των υψηλής ποιότητας TTS συστημάτων είναι πράγματι πολυάριθμες. Παρακάτω παρουσιάζονται μερικά παραδείγματα: Τηλεπικοινωνιακές υπηρεσίες. Τα TTS συστήματα καθιστούν πιθανό να έχει κανείς πρόσβαση σε πληροφορίες με μορφή κειμένου από το τηλέφωνο. Οι πληροφορίες σε μορφή κειμένου μπορεί να ειναι από απλά μηνύματα, όπως οι τοπικές πολιτιστικές εκδηλώσεις (κινηματογράφοι, θέατρα...), στις τεράστιες βάσεις δεδομένων που μπορούν μετά βίας να διαβαστούν και να αποθηκευτούν ως ψηφιοποιημένη ομιλία. Οι ερωτήσεις ανάκτησης σε τέτοια συστήματα πληροφοριών θα μπορούσαν να τεθούν μέσω της φωνής του χρήστη (με τη βοήθεια ενός λεκτικού συστήματος αναγνώρισης), ή μέσω του τηλεφωνικού πληκτρολογίου (με τα συστήματα DTMF). Μερικές τηλεφωνικές υπηρεσίες που μπορούν να υλοποιηθούν με τη χρήση TTS συστημάτων είναι: Ηχητική αναγνώριση κλήσεων (μπορεί κανείς να ακούσει το όνομα του καλούντος πριν συνδεθεί η κλήση και την αποφύγει), ολοκληρωμένο μήνυμα (μπορεί κανείς να ακούσει το ηλεκτρονικό ταχυδρομείο ή το facmle αυτόματα από το τηλέφωνο). Αυτές οι εφαρμογές έχουν αποδειχθεί αποδεκτές, και ακόμα και δημοφιλείς, υπό τον όρο ότι η σαφήνεια των συνθετικών εκφράσεων είναι αρκετά υψηλή. Η φυσικότητα δεν ήταν ένα σημαντικό ζήτημα στις περισσότερες περιπτώσεις. Γλωσσική εκπαίδευση. Η υψηλής ποιότητας TTS σύνθεση μπορεί να συνδυαστεί με ένα σύστημα εκμάθησης με βοήθεια υπολογιστή, και να παρέχει ένα χρήσιμο εργαλείο για να μάθει κανείς μια νέα γλώσσα. Κάτι που δεν έχει υλοποιηθεί πλήρως ακόμα, λαμβάνοντας υπόψη τις κρίσιμες απαιτήσεις τέτοιων σκοπών σε αντιδιαστολή με τη σχετικά κακή ποιότητα, που είναι διαθέσιμη στα εμπορικά συστήματα. Βοήθεια στους ανθρώπους με ειδικές ανάγκες. Οι αναπηρίες φωνής δημιουργούνται από διανοητικές ή σωματικές διαταραχές. Οι μηχανές μπορούν να είναι μια ανεκτίμητη βοήθεια στην τελευταία περίπτωση: με τη βοήθεια ενός ειδικά σχεδιασμένου πληκτρολογίου και ενός γρήγορου προγράμματος σύνθεσης προτάσεων, η συνθετική ομιλία μπορεί να παραχθεί σε μερικά δευτερόλεπτα για να ξεπεράσει τέτοιου είδους εμπόδια. Όσοι άνθρωποι επίσης πάσχουν από 2

6 προβλήματα όρασης μπορούν να ωφεληθούν από TTS συστήματα, τα οποία μπορούν να συνδεθούν με τα οπτικά συστήματα αναγνώρισης (OCR) και να προσφέρουν πρόσβαση σε γραπτές πληροφορίες. Ομιλούντα βιβλία και παιχνίδια. Η αγορά παιχνιδιών έχει αγγιχτεί ήδη από τη λεκτική σύνθεση. Πολλά παιχνίδια ομιλίας έχουν εμφανιστεί, η κακή ποιότητα των οποίων αναπόφευκτα σταματά την εκπαιδευτική φιλοδοξία τέτοιων προϊόντων. Η υψηλής ποιότητας σύνθεση όμως σε προσιτές τιμές μπορεί να ανατρέψει κάτι τέτοιο. Φωνητικός έλεγχος. Σε μερικές περιπτώσεις, οι προφορικές πληροφορίες είναι αποδοτικότερες από τα γραπτά μηνύματα. Η φωνητική έκκληση είναι ισχυρότερη, ενώ η προσοχή μπορεί να εστιάσει και σε άλλες οπτικές πηγές πληροφοριών. Πολυμέσα, επικοινωνία ανθρώπου-μηχανής. Μακροπρόθεσμα, η ανάπτυξη των υψηλής ποιότητας TTS συστημάτων είναι ένα απαραίτητο βήμα (όπως είναι η αύξηση των λεκτικών συστημάτων αναγνώρισης) προς τους πληρέστερους τρόπους επικοινωνίας μεταξύ των ατόμων και των υπολογιστών. Τα πολυμέσα είναι μια πρώτη αλλά ελπιδοφόρος κίνηση σε αυτήν την κατεύθυνση. Βασική και εφαρμοσμένη έρευνα. Τα Text To Speech (TTS) συστήματα έχουν ένα πολύ ιδιαίτερο χαρακτηριστικό γνώρισμα που τα κάνει θαυμάσια εργαστηριακά εργαλεία για τους γλωσσολόγους: είναι πλήρως ελεγχόμενα, έτσι ώστε όταν επαναλαμβάνεται η ίδια διαδικασία να μπορεί να παρέχει τα ίδια αποτελέσματα (κάτι που δεν συμβαίνει με τους ανθρώπους). Ένας ιδιαίτερος τύπος TTS συστημάτων, που είναι βασισμένα σε μια περιγραφή του φωνητικού σήματος μέσω των ηχηρών συχνοτήτων του (formant) έχει επίσης χρησιμοποιηθεί εκτενώς από επιστήμονες στην μελέτη της ομιλία σε σχέση με τους ακουστικούς κανόνες. 1.2 ΑΠΟ ΤΙ ΑΠΟΤΕΛΕΙΤΑΙ Ο ΗΧΟΣ Για να επιτευχθεί φυσική ομιλία χρειάζεται να βαθύτερη γνώση για την ίδια τη φύση της ομιλίας. Πολλές έρευνες που διεξήχθησαν για εκατοντάδες χρόνια δείχνουν ότι η ομιλία είναι ένα πολύ περίπλοκο φαινόμενο. Για να μπορέσει κανείς να έχει μια πλήρη εικόνα της ομιλίας, πρέπει να τη δει σε διάφορα επίπεδα, το οποία ονομαστικά είναι τα εξής: το ακουστικό, το φωνητικό το φωνολογικό το μορφολογικό, το συντακτικό, το σημασιολογικό και το πραγματικό[7]. Στο ακουστικό επίπεδο η ομιλία είναι ένα σύνολο σημάτων των οποίων το πλάτος μεταβάλλεται με το χρόνο. Αν γίνει ανάλυση σε αυτά τα σήματα το καθένα μπορεί να αναγνωριστεί από τη θεμελιώδη συχνότητα, την ένταση και τις κατανομές της φασματικής ενέργειας. Κάθε ακουστικό γνώρισμα σχετίζεται με μια ποσότητα, 3

7 αντιληπτή από τον άνθρωπο: το ύψος της φωνής (ptch), την ένταση της φωνής (loudne) και τη χροιά (tmbre)[7,8]. Η παρατήρηση της χρονικής κυματομορφής της ομιλίας εμφανίζει μια εναλλαγή μεταξύ παύσεων και τμημάτων που μπορούν να θεωρηθούν περιοδικά ή τμημάτων θορύβου, τα οποία τμήματα ονομάζονται αντίστοιχα ηχηρά (voce) και άηχα (unvoced). Για τα ηχηρά τμήματα η θεμελιώδης συχνότητα της ανθρώπινης φωνής έχει έκταση από 70 μέχρι 200 Hz για τους άνδρες, από 150 μέχρι 400 Hz για τις γυναίκες και από 200 μέχρι 600 Hz για τα παιδία[8]. Στο φωνητικό επίπεδο η ομιλία μπορεί να διαιρεθεί σε μικρά κομμάτια, τα οποία μπορούν να ομαδοποιηθούν σε φωνητικές κλάσεις ανάλογα με το τρόπο άρθρωσης τους. Στην νεοελληνική γλώσσα χωρίζουμε τριάντα ομάδες, στα οποία περιλαμβάνονται πέντε φωνήεντα, δεκαοχτώ σύμφωνα και επτά αλλόφωνα[8]. Τα φωνήεντα χωρίζονται σε 3 κατηγορίες τα πρόσθια φωνήεντα τα πίσω φωνήεντα και τα κεντρικά φωνήεντα. Μπορούμε επίσης να ορίσουμε μια τέταρτη κατηγορία φωνηέντων που να περιλαμβάνει τους δίφθογγούς. Τα σύμφωνα χωρίζονται σε εκρηκτικά, τυρβώδη, ένρινα, ημιφωνήεντα και μη τυρβώδη[7] Στο φωνολογικό επίπεδο διαχωρίζουμε φωνήματα, ενώ στο μορφολογικό λέξεις. Το συντακτικό επίπεδο ασχολείται με τη γραμματική, το σημασιολογικό δίνει έμφαση στο νόημα και τέλος το πραγματικό επίπεδο καλύπτει κάποια υπονοούμενα της ομιλίας 1.3 ΠΕΡΙΓΡΑΦΗ ΕΝΟΣ TEXT TO SPEECH (TTS) ΣΥΣΤΗΜΑΤΟΣ Τα μοντέρνα Text To Speech (TTS) συστήματα αποτελούνται από δύο κύρια μέρη : το επίπεδο Επεξεργασίας Φυσικής Γλώσσας (Natural Language Proceng - NLP) και το επίπεδο Ψηφιακής Επεξεργασίας Σήματος (Dgtal Sngle Proceng DSP)[3]. Το Σχήμα 1.1 δείχνει το λειτουργικό διάγραμμα ενός πολύ γενικού Text To Speech (TTS) συστήματος. Για την λειτουργία που αντιστοιχεί στη ανθρώπινη ανάγνωση, περιλαμβάνει την βαθμίδα Επεξεργασίας Φυσικής Γλώσσας [5] (Natural Language Proceng - NLP), η οποία αποδίδει μια φωνητική γραφή του κειμένου που διαβάζεται μαζί με τον επιθυμητό τονισμό και την επιθυμητή ταχύτητα του κειμένου (που καλούνται συχνά και προσωδία) -η διαδικασία καθορισμού της προσωδίας είναι πολύ σημαντική διότι περεχεί της απαραίτητες πληροφορίες για την παραγωγής μιας φυσικής ομιλίας - και μια βαθμίδα Ψηφιακής Επεξεργασίας Σήματος[5] (Dgtal Sngle Proceng DSP), που μετατρέπει τις συμβολικές πληροφορίες που λαμβάνει σε ομιλία. Σχήμα 1.1. Ένα απλό λειτουργικό διάγραμμα ενός Text To Speech (TTS) 4

8 Πολλές φορές οι φορμαλισμοί και οι αλγόριθμοι που εφαρμόζονται πετυχαίνουν, λόγω των μαθηματικών και γλωσσικών μοντέλων γνώσης που χρησιμοποιούνται, να βραχυκυκλώσουν ορισμένα βήματα επεξεργασίας. Αυτό επιτυγχάνεται, περιστασιακά, εις βάρος μερικών περιορισμών στο προς ανάγνωση κείμενο, ή αλλιώς οδηγεί σε κάποια μείωση της "συναισθηματικής δυναμικής" της συνθετικής φωνής (τουλάχιστον σε σύγκριση με την ανθρώπινη απόδοση), αλλά γενικά επιτρέπει τη λύση του προβλήματος σε πραγματικό χρόνο με τις περιορισμένες απαιτήσεις για μνήμη Βαθμίδα Επεξεργασίας Φυσικής Γλώσσας (Natural Language Proceng - NLP) Το Σχήμα 1.2 παρουσιάζει γενικά το διάγραμμα μιας NLP βαθμίδας σε ένα TTS σύστημα. Κάτι που γίνεται αμέσως φανερό είναι ότι, επιπλέον από τις αναμενόμενες δομές μετατροπής των γραμμάτων σε ήχους και προσωδίας, περιλαμβάνει έναν μορφοσυντακτικό αναλυτή, ο οποίος αναδύει έμμεσα την ανάγκη για συντακτική επεξεργασία, σε ένα υψηλής ποιότητας Text To Speech σύστημα.[9] Πράγματι, το να μπορεί να καταμερισθεί μια δεδομένη πρόταση σε μικρότερα μέρή, π.χ. στα μέρη του λόγου που την αποτελούν, και να μπορεί να περιγραφεί περαιτέρω υπό μορφή συντακτικού δέντρου, το οποίο να παρουσιάζει την εσωτερική δομή της πρότασης, απαιτείται για τουλάχιστον δύο λόγους: 1. Η ακριβής φωνητική μετατροπή μπορεί να επιτευχθεί μόνο υπό τον όρο ότι είναι διαθέσιμες κατηγορίες μέρων του λόγου, καθώς επίσης και εάν είναι γνωστή η σχέση εξάρτησης μεταξύ των διαδοχικών λέξεων. 2. Η φυσική προσωδία στηρίζεται σε μεγάλο ποσοστό στη σύνταξη. Προφανώς έχει επίσης, να κάνει πολύ με τη σημασιολογία και την πραγματολογία, αλλά δεδομένου ότι πολύ λίγα στοιχεία είναι διαθέσιμα σήμερα για αυτά τα θέματα τα TTS συστήματα επικεντρώνονται μόνο στη σύνταξη και προς το παρόν, μόνο σε λίγα τέτοια συστήματα παρέχονται πραγματικά οι πλήρεις ικανότητες αποσαφήνισης και διάρθρωσης. Στο Σχήμα 1.2 βλέπουμε επίσης τη βαθμίδα NLP να είναι σαφώς διαχωρισμένη σε 3 τμήματα, αυτά είναι το τμήμα Ανάλυσης Κειμένου (Text Analy), Αυτόματης Φωνοποίησης (Automatc Phonetzaton ) και Παραγωγής Προσωδίας (Proody Generaton), τα οποία εξετάζονται συνοπτικά παρακάτω[10]. 5

9 Σχήμα 1.2. Γενικό διάγραμμα βαθμίδας NLP Τμήμα Ανάλυσης Κειμένου (Text Analy) To τμήμα ανάλυσης κειμένού αποτελείται από: μια ενότητα προεπεξεργασίας (pre-proceng module), η οποία οργανώνει τις προτάσεις εισαγωγής σε εύχρηστους καταλόγους λέξεων. Προσδιορίζει τους αριθμούς, τις συντμήσεις, τα αρκτικόλεξα και τους ιδιωματισμούς και τους μετασχηματίζει σε πλήρες κείμενο όταν αυτό απαιτείται. Ένα σημαντικό πρόβλημα παρουσιάζεται με την ασάφεια των σημείων στίξης (συμπεριλαμβανομένης της κρίσιμης περίπτωσης που αναζητείται το τέλος μια πρότασης).το παραπάνω πρόβλημα μπορεί να λυθεί, ως ένα ορισμένο βαθμό, με τις στοιχειώδεις κανονικές γραμματικές. 6

10 μια ενότητα μορφολογικής ανάλυσης (morphologcal analy module), ο στόχος της οποίας είναι να προταθούν όλες οι πιθανές κατηγορίες των μέρων του λόγου που μπορεί να ανήκει η κάθε λέξη ξεχωριστά, ανάλογα με την ορθογραφία της. Κλιμένες, παραγόμενες, και σύνθετες λέξεις αποσυντίθενται στις βασικές γραφηματικές μονάδες τους (τα morph) από λεξικά που χρησιμοποιούν απλούς κανόνες γραμματικής η ενότητα ανάλυσης συμφραζόμένων (contextual analy module), εξετάζει το περιεχόμενο των λέξεων με σκοπό να μειώσει τον κατάλογο των πιθανών κατηγοριών μέρους του λόγου, που μπορεί να ανήκει η κάθε λέξη, σε έναν πολύ περιορισμένο αριθμό ιδιαίτερα πιθανών υποθέσεων, λαμβάνοντας υπόψη τα αντίστοιχα πιθανά μέρη του λόγου των γειτονικών λέξεων. Αυτό μπορεί να επιτευχθεί είτε με n-gram, που περιγράφουν τις τοπικές συντακτικές εξαρτήσεις με τη μορφή πιθανολογικών αυτομάτων πεπερασμένων καταστάσεων (δηλ. ως μοντέλο Μarkov), σε μικρότερη έκταση με πολυεπίπεδα perceptron (δηλ. νευρικά δίκτυα) που εκπαιδεύονται σε κανόνες συμφραζομένων, ή με τοπικές, μη-στοχαστικές γραμματικές που παρέχονται από τους ειδικούς γλωσσολόγους ή που προκύπτουν αυτόματα από ένα σύνολο στοιχείων με τεχνικές δέντρων ταξινόμησης και οπισθοδρόμησης (Clafcaton And Regreon Tree- CART) και τελικά, ένας συντακτικός-προσωδιακός αναλυτής (Syntactc-Proodc Parer), ο οποίος εξετάζει το υπόλοιπο διάστημα αναζήτησης και βρίσκει τη δομή κειμένων (δηλ. την οργάνωσή του στην πρόταση και τα φρασεολογικά συστατικά) που συσχετίζεται περισσότερο με την αναμενόμενη προσωδία του. Τμήμα Αυτόματης Φωνοποίησης (Automatc Phonetzaton ) Η μονάδα Letter To Sound (LTS) είναι αρμόδια για τον αυτόματο καθορισμό της φωνητικής μετατροπής του κειμένου εισόδου. Εκ πρώτης όψεως φαίνεται, ότι ο στόχος της είναι το ίδιο απλός με το να ψάχνεις μια λέξη σε ένα λεξικό! Από μια βαθύτερη εξέταση, όμως, γρήγορα συνειδητοποιεί κανείς ότι οι περισσότερες λέξεις εμφανίζονται σε φυσική ομιλία με διάφορες φωνητικές μετατροπές, πολλές από τις οποίες δεν αναφέρονται ακόμη και στα λεξικά προφοράς. Δηλαδή: 1. τα λεξικά προφοράς αναφέρονται μόνο στη ρίζα της λέξης. Δεν συμπεριλαμβάνουν μορφολογικές παραλλαγές (δηλ. πληθυντικός, θηλυκός, κλίσεις, που πρέπει να εξεταστούν από ένα συγκεκριμένο κλάδο της φωνολογίας, αποκαλούμενο, μορφοφωνολογία). 2. μερικές λέξεις αντιστοιχούν σε διαφορετικά λήμματα στο λεξικό, ή γενικότερα σε διάφορες μορφολογικές αναλύσεις, με διαφορετικές προφορές. Αυτή είναι χαρακτηριστικά η περίπτωση των ετερόφωνων ομογράφων, δηλ. λέξεις που προφέρονται διαφορετικά ακόμα κι αν έχουν την ίδια ορθογραφία. Η σωστή προφορά τους εξαρτάται γενικά από τι μέρος του λόγου είναι, αν και μπορεί επίσης να βασιστεί στα συντακτικά γνωρίσματα, 7

11 3. δεν μπορούν όλες οι λέξεις να βρεθούν σε ένα φωνητικό λεξικό: η προφορά των νέων λέξεων και πολλών ονομάτων πρέπει να μπορεί να προκύψει από τις προφορές των ήδη γνωστών λέξεών. Είναι επίσης δυνατό ο στόχος της ενότητας LTS να οργανωθεί από πολλές απόψεις (Σχήμα 1.3), συχνά όμως ταξινομείται χοντρικά σε στρατηγικές βασισμένες σε λεξικά[9] και στρατηγικές βασισμένες σε κανόνες[11], αν και υπάρχουν πολλές ενδιάμεσες λύσεις. Σχήμα 1.3. Στρατηγικές βασισμένες σε λεξικά και στρατηγικές βασισμένες σε κανόνες, Οι λύσεις βασισμένες σε λεξικά προτείνουν την αποθήκευση μιας πολύ μεγάλης ποσότητας της φωνολογικής γνώσης σε ένα λεξικό. Προκειμένου να κρατηθεί το μέγεθός της εύλογα μικρό, οι καταχωρήσεις είναι γενικά περιορισμένες στα μορφήματα, και η προφορά επιτυγχάνεται από κλιτικούς, παραγωγικούς, και συνθετικούς μορφοφωνητικόυς κανόνες που περιγράφουν πώς τροποποιούνται οι φωνητικές μετατροπές των μορφηματικών συστατικών τους όταν συνδυάζονται σε λέξεις. Τα μορφήματα που δεν μπορούν να βρεθούν στο λεξικό μετατρέπονται από κανόνες. Αφού έχει ληφθεί μια πρώτη φωνητική μετατροπή κάθε λέξης, εφαρμόζεται κάποια φωνητική μετα-επεξεργασία, ώστε να εξομαλύνει τα φαινόμενα συνάρθρωσής. Αυτή η προσέγγιση έχει ακολουθηθεί από το σύστημα MITTALK [1] και ένα λεξικό μέχρι μορφημάτων κάλυψε περίπου 95% των λέξεων εισαγωγής. Μια μάλλον διαφορετική στρατηγική υιοθετείται στα βασισμένα σε κανόνες συστήματα [11], τα οποία μεταφέρουν το μεγαλύτερο μέρος της φωνολογικής «αξίας» των λεξικών σε ένα σύνολο letter to ound (ή grapheme to phoneme) κανόνων. Αυτή τη φορά,μόνο εκείνες οι λέξεις που προφέρονται με έναν τέτοιο ιδιαίτερο τρόπο, ώστε να αποτελούν έναν κανόνα από μόνες τους, αποθηκεύονται σε ένα λεξικό εξαιρέσεων. Στα αγγλικά, παραδείγματος χάριν, 2000 λέξεις αρκούν χαρακτηριστικά να καλύψουν το 70% των λέξεων σε ένα κείμενο Τα πρώτα χρόνια των παντοδύναμων μεθόδων βασισμένων σε λεξικά είχε υποστηριχτεί ότι ήταν ικανές να πετύχουν μεγαλύτερη ακρίβεια από τις μεθόδους βασισμένες σε κανόνες, δεδομένης της δυνατότητας πολύ μεγάλων φωνετικών λεξικών σε Η/Υ. Αφ' ετέρου, ιδιαίτερες προσπάθειες έχουν καταβληθεί πρόσφατα για το σχεδιασμό συνόλων κανόνων με μια πολύ ευρεία κάλυψη (που αρχίζουν από τα 8

12 αυτοματοποιημένα λεξικά,που προσθέτουν κανόνες και εξαιρέσεις έως ότου καλύπτονται όλες οι λέξεις. Είναι προφανές πως σε αυτές τις δύο τάσεις θα πρέπει να υπάρξει κάποιος συμβιβασμός και αυτός ο συμβιβασμός είναι εξαρτώμενος από τη φύση της γλώσσα που μας ενδιαφέρει σε κάθε περίπτωση[10]. Παραγωγή Προσωδίας (Proody Generaton) Ο όρος προσωδία αναφέρεται σε ορισμένες ιδιότητες του σήματος ομιλίας που συσχετίζονται με τις ευδιάκριτες αλλαγές στο ύψος και στην ένταση της φωνής, στο μήκος συλλαβών κτλ [13]. Τα προσωδιακά γνωρίσματα έχουν συγκεκριμένες λειτουργίες στη λεκτική επικοινωνία (βλ. Σχήμα 1.4). Η προφανέστερη επίδραση της προσωδίας είναι αυτή της εστίασης. Παραδείγματος χάριν, υπάρχουν ορισμένες περιπτώσεις ύψους φωνής που κάνουν μια συλλαβή να ξεχωρίσει μέσα στη φράση, και έμμεσα, η λέξη ή η συντακτική ομάδα που ανήκει, θα τονιστεί ως σημαντικό ή νέο συστατικό της έννοιας αυτής της φράσης. Το που θα τονιστεί μια φράση μπορεί να έχει διάφορα αποτελέσματα, όπως να παρουσιάζει αντίθεση ή να αλλάζει το σημασιολογικό πλαίσιο της φράσης. Σχήμα 1.4. Διαφορετικά είδη πληροφορίας που παρέχονται από την προσωδία (οι γραμμές δείχνουν τις μετακινήσεις του ύψους φωνής- οι έντονες γραμμές δείχνουν τον τονισμό ). a. Εστίαση ή δεδομένες/ νέες πληροφορίες b. Σχέσεις μεταξύ των λέξεων (aw-yeterday; I-yeterday; I-hm) c. Σκοπός (κορυφή) ή συνέχεια (κατώτατο σημείο), όπως εμφανίζεται στην τελευταία συλλαβή d. Κατάτμηση της πρότασης σε ομάδες συλλαβών. 9

13 Τα προσωδιακά χαρακτηριστικά γνωρίσματα δημιουργούν μια κατάτμηση της λεκτικής αλυσίδας σε ομάδες συλλαβών, ή αντίθετα, προκαλούν την ομαδοποίηση των συλλαβών και των λέξεων σε μεγαλύτερα κομμάτια. Επιπλέον, υπάρχουν προσωδιακά χαρακτηριστικά γνωρίσματα που υποδεικνύουν τις σχέσεις μεταξύ τέτοιων ομάδων, που δείχνουν δηλαδή ότι δύο ή περισσότερες ομάδες συλλαβών συνδέονται με κάποιο τρόπο. Αυτή η επίδραση ομαδοποίησης είναι ιεραρχική, αν και όχι απαραιτήτως ίδια με τη συντακτική δόμηση της έκφρασης. Αυτό δεν σημαίνει ότι τα TTS συστήματα είναι καταδικασμένα σε μια "ρομπότικη" προσωδία, αν δεχτεί κανείς έναν σημαντικό περιορισμό στη φυσικότητα της συνθετικής φωνής, δηλ. ότι η προσωδία της διατηρείται σε ένα "αποδεκτά ουδέτερο" επίπεδο: "Η αποδεκτή προσωδία πρέπει να είναι εύλογη, αλλά δεν χρειάζεται να είναι η καταλληλότερη προσωδία για μια συγκεκριμένη έκφραση:δεν χρειάζεται να γίνει καμία υπόθεση της κατανόησης ή της παραγωγής της, από τη μηχανή. Η ουδέτερη προσωδία δεν εκφράζει ασυνήθιστη έμφαση, συγκριτικό τονισμό ή υφολογικά στυλ: είναι η προσωδία που θα χρησιμοποιηθεί για μια έκφραση χωρίς νόημα (...) Αυτή η προσέγγιση αφαιρεί την ανάγκη για την αναφορά στο νόημα της φράσης ή την παγκόσμια γνώση ενώ διατηρεί τους φιλόδοξους γλωσσικούς στόχους της."[14] Η βασική ιδέα είναι ότι η "σωστή" συντακτική δομή, αυτή που απαιτεί ακριβώς κάποια σημασιολογική και πραγματική διορατικότητα, δεν είναι ουσιαστική για την παραγωγή μιας τέτοιας προσωδίας. Έχοντας υπ όψιν αυτές τις εκτιμήσεις, δεν είναι προκαλεί έκπληξη το γεγονός ότι τα εμπορικά αναπτυγμένα σύστημα έχουν επικεντρωθεί στην εμπορική κάλυψη παρά στη γλωσσική εκλέπτυνση, με τη συγκέντρωση των προσπαθειών τους στις στρατηγικές ανάλυσης κειμένων που στοχεύουν να τμηματοποιήσουν τη δομή επιφάνειας των προτάσεων εισόδου, σε αντιδιαστολή με τη συντακτικά, σημασιολογικά, και πρακτικά βαθιά δομή. Με άλλα λόγια, εστιάζουν στη λήψη μιας αποδεκτής κατάτμησης και το μεταφράζουν σε σημεία συνέχειας ή σκοπού του Σχήματος 1.4.c, αλλά αγνοούν τις σχέσεις ή τη συγκριτική έννοια του Σχήματος 1.4.a και b. Άλλες, περιπλοκότερες προσεγγίσεις περιλαμβάνουν τα βασισμένα στη σύνταξη έμπειρα συστήματα και τις μεθόδους βασισμένες σε αυτόματη συλλογή ηχητικών στοιχείων γλώσσας. Μόλις παραχθεί η συντακτική-προσωδιακή δομή μιας πρότασης, χρησιμοποιείται για να ληφθεί η ακριβής χρονική διάρκεια κάθε φωνήματος (και των παύσεων), καθώς επίσης και της προσωδίας που θα εφαρμοστεί σε αυτή. Εντούτοις ούτε αυτό το τελευταίο βήμα, δεν είναι απλό Απαιτεί να τυποποιηθεί πολύ μεγάλη ποσότητα φωνητικών ή φωνολογικών δεδομένων, που είτε λαμβάνεται από τους εμπειρογνώμονες είτε αποκτάται αυτόματα από δεδομένα με στατιστικές μεθόδους. 10

14 1.3.2 Βαθμίδα Ψηφιακής Επεξεργασίας Σήματος (Dgtal Sgnal Proceng - DSP) Εύκολα μπορεί να καταλάβει κανείς ότι οι διαδικασίες που περιλαμβάνονται στην ενότητα DSP θα είναι το υπολογιστικό ανάλογο του δυναμικού ελέγχου των μυών άρθρωσής και της συχνότητας διέγερσης των φωνητικών χορδών έτσι ώστε το σήμα εξόδου να έχει τα επιθυμητά χαρακτηριστικά. Προκειμένου να μπορέσει να το επιτύχει αυτό, η ενότητα DSP πρέπει να λάβει με κάποιο τρόπο υπόψη, τους περιορισμούς στην άρθρωση, μιας και εδώ και πολύ καιρό είναι γνωστό ότι οι φωνητικές μεταβάσεις είναι σημαντικότερες από τις σταθερές καταστάσεις για την κατανόηση της ομιλίας. Αυτό, στη συνέχεια, μπορεί να γίνει εφικτό με δύο τρόπους: Με τη μορφή μιας σειράς κανόνων που περιγράφουν τυπικά την επιρροή ενός φωνήματος σε ένα άλλο Mε την αποθήκευση παραδειγμάτων των φωνητικών μεταβάσεων και των συναρθρώσεων σε μια βάση δεδομένων τμημάτων ομιλίας, και τη χρήση τους ακριβώς στη μορφή που είναι, δηλαδή ως απόλυτες ακουστικές μονάδες (αντί των φωνημάτων). Δύο κύριες κατηγορίες Text To Speech (TTS) συστημάτων έχουν προκύψει από τους δυο παραπάνω τρόπους, οι οποίες μετατράπηκαν γρήγορα σε φιλοσοφίες σύνθεσης, δεδομένου των αποκλίσεων που παρουσιάζουν στα μέσα και τους στόχους τους: σύνθεση με κανόνες και σύνθεση με συνένωση. Σύνθεση με κανόνες Οι βασισμένοι σε κανόνες ynthezer προτιμούνται συνήθως από φωνητιστές και φωνολόγους, δεδομένου ότι αποτελούν μια γνωστική και παραγωγική προσέγγιση του μηχανισμού φώνησης. Η ευρεία διάδοση του Klatt ynthezer [15], παραδείγματος χάριν, οφείλεται κυρίως στην ανεκτίμητη βοήθειά του στη μελέτη των χαρακτηριστικών της φυσικής ομιλίας, αφού παρείχε τη δυνατότητα λεπτομερής ακρόασης ομιλίας συνθεμένης με κανόνες. Επίσής η ύπαρξη των παραμέτρων άρθρωσης και των εισόδων του μοντέλου Klatt το καταστά ένα πρακτικό εργαλείο για τη διερεύνηση των περιορισμών φυσιολογίας Για ιστορικούς και πρακτικούς λόγους (κυρίως η ανάγκη για μια φυσική ερμηνεία του προτύπου), οι βασισμένοι σε κανόνες ynthezer εμφανίζονται πάντα με τη μορφή formant ynthezer.formant ή συντονισμοί ονομάζονται οι φυσικές συχνότητες του φωνητικού καναλιού. Αυτοί περιγράφουν την ομιλία ως τη δυναμική εξέλιξη μέχρι και 60 παραμέτρων, οι οποίες συνήθως σχετίζονται με τις formant και αντί-formant 11

15 συχνότητες και εύρη ζώνης καθώς και με γλωττιδικές κυματομορφές. Σαφώς, ο μεγάλος αριθμός παραμέτρων περιπλέκει το στάδιο ανάλυσης και τείνει να παραγάγει λάθη ανάλυσης καθώς επίσης και οτι οι formant συχνότητες και εύρη ζώνης είναι από τη φύση τους δύσκολο να υπολογιστούν από τα δεδομένα ομιλίας. Η ανάγκη για εντατικές δοκιμές και λάθη προκειμένου να αντιμετωπιστούν τα σφάλματα ανάλυσης, κάνει την ανάπτυξη τέτοιων συστημάτων αρκετά χρονοβόρα Ακόμα, η ποιότητα σύνθεσης που έχει επιτευχθεί έως τώρα εισάγει χαρακτηριστικά προβλήματα θορύβου τα οποία προέρχονται από τους ίδιους τους κανόνες που χρησιμοποιούνται για τη σύνθεση: η εισαγωγή ενός υψηλού βαθμού φυσικότητας είναι θεωρητικά δυνατή, αλλά οι κανόνες που θα το καταφέρουν αυτό δεν έχουν ακόμα οριστεί. Παρόλα αυτά οι βασισμένοι σε κανόνες ynthezer παραμένουν, εντούτοις, μια ισχυρή και με πολλές δυνατότητες προσέγγιση στη σύνθεση ομιλίας. Επιτρέπουν, παραδείγματος χάριν, να μελετηθούν γνωρίσματα φωνής που εξαρτώνται από τον ομιλητή έτσι ώστε η μετατροπή από μια συνθετική φωνή σε μια άλλη να μπορεί να επιτευχθεί με τη βοήθεια εξειδικευμένων κανόνων στη βάση δεδομένων κανόνών. Με την ίδια λογική, η σύνθεση με κανόνες φαίνεται να είναι ένας φυσικός τρόπος χειρισμού των αλλαγών, λόγω άρθρωσης, στις μορφές ομιλίας (σε αντιπαράθεση με το προσωδιακό τους συμπλήρωμα, το οποίο μπορεί να επεξεργαστεί από τους ynthezer βασισμένους σε συνένωση). Δεν αποτελεί έκπληξη λοιπόν το γεγονός ότι τέτοιοι ynthezer έχούν ενσωματωθεί ευρέως σε TTS συστήματα (MITTALK [1] και ο JSRU ynthezer [11] για τα αγγλικά, το πολύγλωσσο σύστημα INFOVOX [12], και το σύστημα I.N.R.S [16] για τα γαλλικά). Σύνθεση με συνένωση Σε αντιδιαστολή με τους βασισμένους σε κανόνες ynthezer, οι ynthezer με συνένωση κατέχουν μια πολύ περιορισμένη γνώση των στοιχείων που χειρίζονται: το μεγαλύτερο μέρος της οποίας ενσωματώνεται στα τμήματα που θα συνενωθούν[17]. Αυτό φαίνεται καθαρά στο Σχήμα 1.5, όπου όλες οι διαδικασίες που εκτελούνται θα μπορούσαν πολύ άνετα να χρησιμοποιηθούν και στα πλαίσια ενός μουσικού ynthezer (δηλ. χωρίς να γίνεται οποιαδήποτε αναφορά στην εσωτερική φύση των ήχων που υποβάλλονται σε επεξεργασία) έχουν ομαδοποιηθεί σε μια πλήρης επεξεργαστική μονάδα, σε αντίθεση με την προαναφερθείσα μονάδα επεξεργασίας ομιλίας, της οποίας ο σχεδιασμός απαιτεί τουλάχιστον κάποια κατανόηση της φωνολογίας 12

16 Σχήμα 1.5. Το διάγραμμα ενός γενικού ynthezer σύνθεσης με συνένωση. Οι διαδικασίες και τα δεδομένα που εξαρτώνται από τη γλώσσα υποδεικνύονται από μια σημαία Προετοιμασία Της Βάσης Δεδομένων Μια σειρά προκαταρκτικών βημάτων πρέπει να εκπληρωθεί προτού να μπορέσει να παραγάγει ο ynthezer την πρώτη του έκφρασή[18]. Αρχικά, τα τμήματα ομιλίας επιλέγονται έτσι ώστε να ελαχιστοποιηθούν τα μελλοντικά προβλήματα στη συνένωση. Ένας συνδυασμός διφώνων (δηλ. μονάδων που αρχίζουν στη μέση της σταθερής κατάστασης ενός φωνήματος και τελειώνουν στη μέση του επόμενου), οι μισές 13

17 συλλαβές, και τρίφωνα (που διαφέρουν από τα δίφωνα στο ότι περιλαμβάνουν ένα πλήρες κεντρικό φώνημα) επιλέγονται συχνά ως λεκτικές μονάδες, δεδομένου ότι περιλαμβάνουν τις περισσότερες από τις μεταβάσεις και τις συναρθρώσεις απαιτώντας για την αποθήκευσή τους μια λογική ποσότητα μνήμης. Όταν συμπληρωθεί ένας πλήρης κατάλογος τμημάτων ομιλίας, ένας αντίστοιχος κατάλογος λέξεων δημιουργείται, κατά τέτοιο τρόπο ώστε κάθε τμήμα να εμφανίζεται τουλάχιστον μία φορά (αν και δύο φορές είναι καλύτερα, για λόγους ασφάλειας). Ανεπιθύμητα μέρη, όπως εσωτερικά τονισμένες συλλαβές, αποκλείονται. Στη συνέχεια ένα κυρίως σώμα, μια συλλογή ηχητικών στοιχείων από τα παραπάνω τμήματα ομιλίας, καταγράφεται ψηφιακά και αποθηκεύεται, και τα επιλεγμένα τμήματα εντοπίζονται, είτε χειροκίνητα με τη βοήθεια εργαλείων απεικόνισης σημάτων, είτε αυτόματα χάρη στους αλγορίθμους κατάτμησης, οι αποφάσεις των οποίων ελέγχονται και διορθώνονται αμφίδρομα. Μια βάση δεδομένων τμημάτων ομιλίας συγκεντρώνει τελικά τα αποτελέσματα, με μορφή των ονομάτων, των κυματομορφών, των διαρκειών, και των εσωτερικών υποδιαιρέσεων των τμημάτων που περιέχει. Στην περίπτωση των διφώνων, παραδείγματος χάριν, πρέπει να αποθηκευτεί η θέση των ορίων μεταξύ των φωνημάτων που αποτελούν το δίφωνο, ώστε να είναι σε θέση να τροποποιηθεί διάρκεια του ενός φωνήματος του διφώνου χωρίς να αλλοιωθεί το άλλο φώνημα. Στα τμήματα έπειτα δίνεται μια παραμετρική έκφραση, με τη μορφή μιας προσωρινής ακολουθίας διανυσμάτων από παραμέτρους που συλλέγονται στην έξοδο ενός αναλυτή ομιλίας και που αποθηκεύονται σε μια παραμετρική βάση δεδομένων τμημάτων. Το πλεονέκτημα από τη χρήση ενός πρότυπου ομιλίας έγκειται στο γεγονός ότι: τα καλά επιλεγμένα λεκτικά πρότυπα επιτρέπουν τη μείωση μεγέθους στοιχείων, ένα πλεονέκτημα καθόλου ευκαταφρόνητο στη σύνθεση με συνένωση δεδομένου της ποσότητας των στοιχείων που χρειάζονται να αποθηκευτούν. Συνεπώς, η συσκευή ανάλυσης ομιλίας συχνά ακολουθείται από έναν παραμετρικό κωδικοποίητη ομιλίας. Διάφορα πρότυπα διαχωρίζουν ξεκάθαρα τις συνεισφορές της ηχητικής πηγής και της φωνητικής οδού, μια λειτουργία χρήσιμη για τις διαδικασίες πριν τη σύνθεση: την επίτευξη της επιθυμητής προσωδίας και την συνένωση των τμημάτων ομιλίας Όντως, ο πραγματικός στόχος του ynthezer είναι να παράγει, σε πραγματικό χρόνο, μια ικανοποιητική ακολουθία τμημάτων, τα οποία εξάγονται από την παραμετρική βάση δεδομένων τμημάτων. Το δεύτερο στοιχείο που πρέπει να παράγει είναι η προσωδία, οποία προκύπτει από τη ρύθμιση των αρχικών τιμών του ύψους φωνής (ptch) και της διάρκειας των τμημάτων ομιλίας που υπάρχουν στην βάση, στις τιμές που προέκυψαν από την ενότητα επεξεργασίας γλώσσας. Συνεπώς, οι αντίστοιχες εργασίες που εκτελούνται από τις ενότητες συνένωσης και καθορισμού προσωδίας διευκολύνονται αρκετά όταν τα τμήματα εισόδου παρουσιάζονται σε μια μορφή που επιτρέπει την εύκολη τροποποίηση του ύψους φωνής (ptch), της διάρκειας, και της φασματικής περιβάλλουσας τους σε αντίθεση με την απλή χρήση των μη επεξεργασμένων δειγμάτων κυματομορφής. 14

18 Δεδομένου ότι τα τμήματα που θα χρησιμοποιηθούν για τη σύνθεση έχουν εξαχθεί από διαφορετικές λέξεις, δηλαδή από διαφορετικά φωνητικά πλαίσια, παρουσιάζουν συχνά προβλήματα ομαλού ταιριάσματος εύρους και χροιάς μεταξύ των τμημάτων. Ακόμη και στην περίπτωση των στάσιμων φωνηεντικών ήχων, μια ακατέργαστη συνένωση των παραμέτρων παρουσιάζει ευδιάκριτες ηχητικές ασυνέχειες. Αυτά τα προβλήματα μπορούν να αντιμετωπιστούν κατά τη διάρκεια της δημιουργίας της βάσης δεδομένων τμημάτων σύνθεσης, με μια ισοστάθμιση στην οποία εφαρμόζονται παρόμοια φάσματα εύρους σε σχετιζόμενες άκρες των τμημάτων. Στην πράξη, εντούτοις, αυτή η λειτουργία, είναι περιορισμένη στις παραμέτρους εύρους: το στάδιο ισοστάθμισης τροποποιεί ομαλά τα ενεργειακά επίπεδα στην αρχή και στο τέλος των τμημάτων, με τέτοιο τρόπο ώστε να απομακρύνεται οποιοδήποτε μη σωστό ταίριασμα εύρους (με το να τεθεί η ενέργεια όλων των μερών ενός δεδομένου φωνήματος στη μέση τιμή των ενεργειών τους). Αντίθετα, οι διαφορές στη χροιά αντιμετωπίζονται καλύτερα στο χρόνο εκτέλεσης, με την εξομάλυνση μεμονωμένων ζευγών τμημάτων όταν χρειάζεται, παρά με την άπαξ ισοστάθμισή τους, έτσι ώστε να διατηρείται μέρος της φωνητικής μεταβλητότητας, που εισάγεται φυσικά από την συνάρθρωση. Στην πράξη, η ισοστάθμιση του εύρους μπορεί να εκτελεσθεί είτε πριν είτε μετά από τη ανάλυση ομιλίας (δηλ. στα ακατέργαστα δείγματα ή στις λεκτικές παραμέτρους). Εφ όσον έχει ολοκληρωθεί η παραμετρική βάση διδόμενων, η διαδικασία της σύνθεση μπορεί πλέον να ξεκινήσει. Σύνθεση Της Ομιλίας Μια ακολουθία τμημάτων συνάγεται αρχικά από τη φθογγική εισόδο του ynthezer, σε μια μονάδα που καλείται παραγωγή λίστας τμημάτων, η οποία φαίνεται στο Σχήμα 1.5, και διασύνδεει τις NLP και DSP ενότητες. Μόλις οριστούν σωστά τα προσωδιακά χαρακτηριστικά στα μεμονωμένα τμήματα, η ενότητα καθορισμού προσωδίας ρωτά τη βάση δεδομένων τμημάτων σύνθεσης για τις πραγματικές παραμέτρους, των βασικών ήχων που θα χρησιμοποιηθούν, και τα προσαρμόζει ενα προς ένα στην επιθυμητή προσωδία. Στη συνέχει η ενότητα συνένωσης τμημάτων αναλαμβάνει το δυναμικό ταίριασμα των τμημάτων, με τη εξομάλυνση των συνεχειών. Εδώ πάλι, μια επαρκής μοντελοποίηση της ομιλίας είναι ιδιαίτερα επιθυμητή, υπό τον όρο ότι τα πρότυπα παρεμβολής που εφαρμόζονται στις παραμέτρους, αντιστοιχούν, χοντρικά, σε ομαλές ακουστικές μεταβάσεις μεταξύ των ήχων. Η προκύπτουσα σειρά των παραμέτρων εφαρμόζεται τελικά στην εισαγωγή μια μονάδας σύνθεσης, με στόχο να παράγει την ομιλία. 15

19 Ποιότητα Τμημάτων Ομιλίας Η αποδοτικότητα των ynthezer συνένωσης για την παραγωγή υψηλής ποιότητας ομιλίας υπόκειται κυρίως: 1. στον τύπο των τμημάτων που επιλέγονται. Τα τμήματα πρέπει προφανώς να παρουσιάζουν μερικές βασικές ιδιότητες: θα πρέπει να μπορούν να επιτρέψουν όσο το δυνατόν περισσότερο την εμφάνιση της επίδρασης της συνάρθρωσης δεδομένου των περιορισμένων ικανοτήτων εξομάλυνσης της μονάδας συνένωσης πρέπει να είναι εύκολα συνδέσιμα. ο αριθμός και το μήκος τους πρέπει να κρατηθούν όσο το δυνατόν μικρότερο. αφ' ετέρου, οι μακρύτερες μονάδες μειώνουν την πυκνότητα των σημείων συνένωσης, παρέχοντας επομένως καλύτερη ποιότητα ομιλίας. Ομοίως, ένας προφανής τρόπος για να συμπεριληφθούν διαφορετικά φαινόμενα άρθρωσης είναι να παρασχεθούν πολλές παραλλαγές για κάθε φώνημα, το οποίο είναι σαφώς σε αντίφαση με τον περιορισμό για χρήση ελάχιστης μνήμης. Δίφωνα επιλέγονται συχνά γι αυτό το σκοπό και χρησιμοποιούνται εκτενώς. Ο αριθμός τους δεν είναι πολύ μεγάλος, (π.χ. περίπου 1200 για τα γαλλικά, συμπεριλαμβανομένων και ακολουθιών φωνήματος που βρίσκονται μόνο στα όρια λέξεων, για 3 λεπτά ομιλίας χρειάζονται περίπου 5 Mbyte σε ρυθμό δειγματοληψίας 16 khz και ανάλυση 16 bt) και ενσωματώνουν τις περισσότερες φωνητικές μεταβάσεις Εντούτοις, εμπεριέχουν μια υψηλή πυκνότητα των σημείων συνένωσης (ένα ανά φώνημα), η οποία ενισχύει τη σημασία ενός αποδοτικού αλγορίθμου συνένωσης. Εκτός αυτού, μπορούν μόνο μερικώς να συμπεριλάβουν τα πολλά αποτελέσματα συνάρθρωσης του προφορική λόγου, δεδομένου ότι αυτά συχνά επιδρούν σε ολόκληρο το φώνημα παρά μόνο στο δεξιό ή αριστερό μισό του. Τέτοια αποτελέσματα αντιμετωπίζονται ειδικά όταν ημι-μεταβατικά φωνήματα, όπως τα υγρά και (τα χειρότερα όλων) τα ημίφωνα, πρόκειται να συνδεθούν το ένα με το άλλο. Έτσι δικαιολογείται και η χρήση μερικών μεγαλύτερων μονάδων όπως τα τρίφωνα. 2. το μοντέλο του σήματος ομιλίας στο οποίο ανάγονται οι αλγόριθμοι ανάλυσης και σύνθεσης Τα πρότυπα που χρησιμοποιούνται στα πλαίσια της σύνθεσης με συνένωση μπορούν να ταξινομηθούν κατά προσέγγιση σε δύο ομάδες, ανάλογα με τη σχέση τους με την πραγματική διαδικασία φώνησης. Τα πρότυπα παραγωγής παρέχουν τα μαθηματικά ισοδύναμα του ρόλού που παίζούν η φωνητική οδός, τα ρινικά και φωνητικά μέρη, και η χειλική ακτινοβολία. Τα αντιπροσωπευτικότερα μέλη τους είναι ynthezer κωδικοποίησης γραμμικής πρόβλεψης (LPC) [20], και οι formant ynthezer που 16

20 αναφέρθηκάν σε προηγούμενη παράγραφο (Σύνθεση Με Κανόνες). Αντίθετα, τα φαινομενολογικά πρότυπα απορρίπτουν σκόπιμα οποιαδήποτε αναφορά στον ανθρώπινο μηχανισμό παραγωγής. Μεταξύ αυτών των καθαρών εργαλείων ψηφιακής επεξεργασίας σήματος, οι φασματικές προσεγγίσεις και οι προσεγγίσεις στο πεδίο του χρόνου συναντούνται όλο και περισσότερο στα TTS συστήματα. Υπάρχουν δύο τέτοια πρότυπα: το υβριδικό αρμονικό/στοχαστικό πρότυπο (Harmonc/Stochatc H/S) [21] και το Tme-Doman Ptch-Synchronou-Over Lap-Add - TD-PSOLA) [19] Το τελευταίο πρότυπό είναι ένας αλγόριθμος στο πεδίο του χρόνου και ουσιαστικά δεν χρησιμοποιεί κανένα πρότυπο ομιλίας. Παρουσιάζει πολύ ενδιαφέροντα πρακτικά χαρακτηριστικά γνωρίσματα: μια πολύ υψηλή ποιότητα ομιλίας, συνδυασμένη με ένα πολύ χαμηλό υπολογιστικό κόστος (7 διαδικασίες ανά δείγμα στο μέσο όρο). Το υβριδικό αρμονικό/στοχαστικό πρότυπο είναι πραγματικά ισχυρότερο από το TD- PSOLA, αλλά είναι επίσης περίπου δέκα φορές υπολογιστικά απαιτητικότερο. Οι PSOLA ynthezer χρησιμοποιούνται πλέον ευρέως στην σύνθεση ομιλίας. Ο πρόσφατα αναπτυγμένος αλγόριθμος MBROLA [18,3] παρέχει ακόμα έναν αλγόριθμο στο πεδίο του χρόνου που παρουσιάζει πολύ αποδοτικές ικανότητες εξομάλυνσης σε σχέση με το πρότυπο H/S (για τα μη ταιριαστά σημεία συνένωσης της φασματικής περιβάλλουσας) καθώς επίσης και πολύ υψηλές αναλογίες συμπίεσης δεδομένων (μέχρι 10 με σχεδόν κανένα επιπλέον υπολογιστικό κόστος) ενώ διατηρεί την υπολογιστική πολυπλοκότητα του αλγορίθμου PSOLA. Θα δούμε αναλυτικότερα το PSOLA αλγόριθμο σε επόμενο κεφάλαιο. 17

21 ΚΕΦΑΛΑΙΟ 2 ΤΕΧΝΙΚΕΣ ΣΥΝΘΕΣΗΣ ΟΜΙΛΙΑΣ 2.1 ΚΑΤΗΓΟΡΙΕΣ ΤΕΧΝΙΚΩΝ ΣΥΝΘΕΣΗΣ ΟΜΙΛΙΑΣ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΣΗΜΑΤΩΝ Η ευρύτερη υποδιαίρεση των στρατηγικών που χρησιμοποιούνται για τη σύνθεση ομιλίας στους υπολογιστές είναι στα μοντέλα συστημάτων, τα οποία προσπαθούν να μοντελοποιήσουν ανθρώπινα σύστημα παραγωγής ομιλίας και στα μοντέλα σημάτων, τα οποία προσπαθούν να μοντελοποιήσουν μόνο το προκύπτον σήμα ομιλίας. Η προσέγγιση των μοντέλων συστημάτων είναι γνωστή και ως αρθρωτική σύνθεση. Η προσέγγιση μοντέλων σημάτων είναι ίσως η απλούστερη των δύο, και υπό αυτήν τη μορφή και έχει ερευνηθεί πιο λεπτομερώς, και επιτυχώς ΣΥΝΘΕΣΗ ΒΑΣΙΣΜΕΝΗ ΣΕ ΚΑΝΟΝΕΣ ΚΑΙ ΣΥΝΘΕΣΗ ΜΕ ΣΥΝΕΝΩΣΗ Η προσέγγιση μοντέλων μπορεί να υποδιαιρεθεί περαιτέρω στις μεθόδους που περιγράφονται ευρέως ως βασισμένη σε κανόνες formant σύνθεση και σύνθεση συνένωσης, τις οποίες είδαμε αναλυτικότερα σε προηγούμενο κεφάλαιο. Αναφέρονται πάλι εδώ σύντομα για λόγους πληρότητας. Τα βασισμένα στους κανόνες formant συστήματα σύνθεσης ήταν για πολλά χρόνια οι επιτυχέστερες μέθοδοι την ομιλία. Οι formant ynthezer χρησιμοποιούν ένα σήμα διέγερσης για να διεγείρουν ένα ψηφιακό φίλτρο, το οποίο κατασκευάζεται έτσι ώστε να προσεγγίζει την διαμόρφωση της φωνητικής οδού. Ο χωρισμός της συνάρτησης μεταφοράς της φωνητικής οδού και του σήματος διέγερσης είναι γνωστός ως η θεωρία πηγή-φίλτρού της παραγωγής ομιλίας. Η σύνθεση συνένωσης λειτουργεί με τη σύνδεση των κατάλληλων μονάδων σύνθεσης ώστε να κατασκευαστεί η απαραίτητη ομιλία. Σε αυτό το είδος συστημάτων σύνθεσης ομιλίας, πρέπει να εφαρμοστεί επεξεργασία σήματος για να αλλάξει τις θεμελιώδεις συχνότητες και τις διάρκειες των μονάδων σύνθεσης σε εκείνές που είναι επιθυμητές για την συνθετική ομιλία. Επιπλέον, εκτός και αν οι μονάδες επιλέγονται πολύ προσεκτικά, η επεξεργασία σήματος πρέπει επίσης να είναι σε θέση να εξομαλύνει τυχόν φασματικές ασυνέχειες μεταξύ των μονάδων. 18

22 2.1.3 ΣΥΝΘΕΣΗ ΓΡΑΜΜΙΚΗΣ ΠΡΟΒΛΕΨΗΣ ΚΑΙ PSOLA ΣΥΝΘΕΣΗ Δύο μορφές επεξεργασίας σήματος, και οι παραλλαγές τους, έχουν χρησιμοποιηθεί εκτενώς στα συστήματα συνένωσης. Αυτές είναι η σύνθεση γραμμική πρόβλεψης (Lnear Predcton - LP) και (Ptch-Synchronou-Over Lap-Add - PSOLA).Η LP σύνθεση είναι μια προσέγγιση βασισμένη στο μοντέλο πηγής-φίλτρου.η PSOLA προσέγγιση αντίθετα δεν είναι και λειτουργεί απλά με την παραθυροποίηση και την επανασύνδεση ήδη υπαρχόντων κυματομορφών σύνθεσης Θα συζητήσουμε τις προαναφερθείσες τεχνικές σύνθεσης στις ακόλουθες παραγράφους. 2.2 FORMANT ΣΥΝΘΕΣΗ Η formant σύνθεση είναι μια μέθοδος πηγής-φίλτρου παραγωγής ομιλίας, στην οποία το φίλτρο φωνητικού καναλιού κατασκευάζεται έτσι ώστε να είναι παρόμοιο με τα formant της φυσικής ομιλίας. Γενικά απαιτούνται μέχρι τρία formant για να συνθέσουν καταληπτή ομιλία, τέσσερα ή πέντε όμως επαρκούν για να παραγάγουν υψηλής ποιότητας ομιλία. Κάθε formant διαμορφώνεται συνήθως χρησιμοποιώντας ένα φίλτρο δύο-πόλων, το οποίο επιτρέπει να καθοριστεί η formant συχνότητα και το εύρος ζώνης του. Υπάρχουν δύο μέθοδοι συνδυασμού των formant για να παραχθεί ένα πρότυπο του φωνητικού καναλιού. Στον παράλληλο formant ynthezer η διέγερση εφαρμόζεται σε όλα formant παράλληλα και οι έξοδοί αθροίζονται, επιτρέποντας να καθοριστεί το κέρδος (gan) του κάθε formant ξεχωριστά. Στο σειριακό formant ynthezer η έξοδος ένα formant εφαρμόζεται στην είσόδο του επόμενου. Οι δύο μορφές παρουσιάζονται στο Σχήμα

23 Σχήμα 2.1. Γενικό σχεδιάγραμμα formant ynthezer 2.3 ΣΥΝΘΕΣΗ ΓΡΑΜΜΙΚΗΣ ΠΡΟΒΛΕΨΗΣ Η σύνθεση γραμμικής πρόβλεψης (LP) είναι μια άλλη μέθοδος πηγής-φίλτρού σύνθεσης ομιλίας. Το ψηφιακό φίλτρο υπολογίζεται αυτόματα από ένα πλαίσιο της φυσικής ομιλίας χρησιμοποιώντας έναν αποδοτικό αλγόριθμο. Η LP σύνθεση έχει χρησιμοποιηθεί εκτενώς στα συστήματα συνένωσης, δεδομένου ότι επιτρέπει τη γρήγορη κωδικοποίηση των μονάδων συνένωσης. Δεν ανήκει ουσιαστικά σε συστήματα βασισμένα σε κανόνες, μια και οι κανόνες καθορίζονται ευκολότερα με χρήση των formant, και η σχέση μεταξύ των συντελεστών που χρησιμοποιούνται για να καθορίσουν το φίλτρο LP και των formant δεν είναι απλή. Η βάση της θεωρίας γραμμικής πρόβλεψης είναι η υπόθεση ότι το τρέχον δείγμα ομιλίας y(n) μπορεί να προβλεφθεί ως γραμμικός συνδυασμός των P προηγούμενων δειγμάτων ομιλίας, συν έναν μικρό όρο λάθους e (n). Κατά συνέπεια, e P ( n) = a( ) y( n ) όπου α(0) =1 = 0 20

24 O όρος a() ονομάζεται γραμμικός συντελεστής πρόβλεψης, και το P τάξη γραμμικής πρόβλεψης. Οι συντελεστές LP, a() υπολογίζονται με την ελαχιστοποίηση του αθροίσματος των τετραγώνων των λαθών σε όλο το πλαίσιο της ομιλίας που εφαρμόζεται η ανάλυση. Δύο μέθοδοι εκτέλεσης αυτών των πράξεων χρησιμοποιούνται συνήθως. Ονομάζονται μέθοδος συνδιακύμανσης και μέθοδος αυτοσυσχέτισης και διαφέρουν στο n, στο οποίο το λάθος ελαχιστοποιείται. Οι συντελεστές, που υπολογίζονται χρησιμοποιώντας τη μέθοδο αυτοσυσχέτισης, έχουν το πλεονέκτημα ότι το φίλτρο που καθορίζουν είναι εγγυημένα σταθερό 2.4 PSOLA ΣΥΝΘΕΣΗ ΓΕΝΙΚΕΣ ΑΡΧΕΣ ΤΗΣ PSOLA ΣΥΝΘΕΣΗΣ Ο αλγόριθμος PSOLA αναπτύχθηκε από τη France Telecom στο CNET. Η τεχνική δεν συνθέτει την ομιλία αυτή καθ εαυτή, αλλά ενώνει ομαλά ηχογραφημένα εκ των προτέρων τμήματα ομιλίας, επιτρέποντας ταυτόχρονα τη μεταβολή τη διάρκειας και του ύψους φωνής (ptch) αυτών των τμημάτων. Είναι επομένως χρησιμότερος στη σύνθεση συνένωσης αντί της γραμμικής πρόβλεψης, η οποία χρησιμοποιήθηκε παραδοσιακά για να εκτελέσει αυτόν τον ρόλο. Το πλεονέκτημα της σύνθεσης PSOLA σε σχέση με τη σύνθεση LP είναι ότι η παραγόμενη ομιλία είναι πολύ υψηλότερης ποιότητας. Όλες οι εκδόσεις του αλγορίθμου PSOLA λειτουργούν ουσιαστικά με τον ίδιο τρόπο. Ένα τμήμα φυσικής ομιλίας τεμαχίζεται από ένα παράθυρο Hannng σε πολλά μικρότερα βραχύχρονα τμήματα ομιλίας - σήματα.όταν υπάρχουν ηχηρές (voced) περιοχές στο σήμα τότε εφαρμόζεται σύγχρονη ανάλυση ύψους φωνής (ptch ynchronou analy), ενώ στις άηχες (unvoced) περιοχές η ανάλυση γίνεται σε σταθερά διαστήματα. Τα βραχύχρονα τμήματα επανασυνδέονται έπειτα για να παράξουν τη συνθετική ομιλία. Το μέγεθος του παραθύρου Hannng που χρησιμοποιείται επηρεάζει την ποιότητα της συνθετικής ομιλίας. Το ύψος φωνής αυξάνει ή μειώνεται από την μεταβολή της απόστασης των βραχύχρονων σημάτων κατά τη σύνθεση και η διάρκεια μεταβάλλεται ταυτόχρονα με την επανάληψη ή τη διαγραφή των βραχύχρονων σημάτων από τη συνθετική ομιλία. Η επανασύνθεση εκτελείται χρησιμοποιώντας τη μέθοδο επικάλυψης και πρόσθεσης (overlap-add), η οποία προσθέτει τα νέα βραχύχρονα σήματα, που προέκυψαν μετά την επεξεργασία, στα νέα διαστήματα. Αυτή η διαδικασία αντισταθμίζει τον αριθμό και το εύρος των παραθύρων Hannng που συνεισφέρουν στο συνθετικό σήμα σε κάθε χρονικό σημείο. Η πιο περίπλοκη από αυτές, η μέθοδος των ελάχιστων τετραγώνων προσπαθεί να ελαχιστοποιήσει το λάθος μεταξύ των φασμάτων των βραχύχρονων σημάτων και των αντίστοιχων βραχύχρονων φασμάτων της συνθετικής ομιλίας. 21

25 2.4.2 TD-PSOLA Η απλούστερη έκδοση PSOLA είναι αυτή στο πεδίο του χρόνου (tme-doman), ή TD- PSOLA, η οποία περιγράφεται παρακάτω. Η TD-PSOLA είναι η ο πιο αποδοτική, υπολογιστικά, έκδοση PSOLA. Η ποιότητα συνθετικής ομιλίας που προκύπτει από την TD-PSOLA σύνθεση είναι σαφώς ανώτερη από αυτήν που λαμβάνεται με τη LP σύνθεση. Εντούτοις, αυτή η βελτίωση δεν είναι χωρίς κάποιο κόστος. Όλες οι εκδόσεις PSOLA απαιτούν μεγάλα ποσά μνήμης για την αποθήκευση της βάσης δεδομένων των κυματομορφών που χρησιμοποιούνται ως μονάδες συνένωσης, αν και στην πράξη αυτό το πρόβλημα μπορεί να περιοριστεί με συμπίεση της ομιλίας χρησιμοποιώντας, παραδείγματος χάριν, mult-pule codng (mpc). H TD-PSOLA σύνθεση έχει επίσης το μειονέκτημα, συγκριτικά με την LP σύνθεση, ότι δεν μπορεί να εκτελέσει φασματική εξομάλυνση στα όρια των μονάδων συνένωσης. Οι μονάδες σύνθεσης πρέπει επομένως να επιλεχτούν πολύ προσεκτικά ώστε αποφευχθούν οι formant ασυνέχειες κατά τη διάρκεια της σύνθεσης. 22

26 ΚΕΦΑΛΑΙΟ 3 Ο ΑΛΓΟΡΙΘΜΟΣ PSOLA 3.1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πριν παρουσιαστούν αναλυτικότερα οι λεπτομέρειές του αλγορίθμου PSOLA, γίνεται μια γρήγορη αναφορά σε μερικές βασικές έννοιες που αφορούν τον αλγόριθμο ΗΧΗΡΟΙ ΚΑΙ ΑΗΧΟΙ ΗΧΟΙ Ηχηρή ομιλία (voced): Πρόκειται για ένα περιοδικό τμήμα ομιλίας. Παράγεται όταν εκφέρεται ένας ήχος με διέγερση των φωνητικών χορδών. Συνήθως, τα φωνήεντα και μερικά σύμφωνα είναι ηχηρά και μπορεί κανείς να δει σαφή περιοδικότητα στην ηχηρή ομιλία. Μερικά ηχηρά φωνήματα είναι το α, το μ, κτλ. Άηχη ομιλία (unvoced): Τυχαίο τμήμα σημάτων της ομιλίας. Παράγεται χωρίς διέγερσή των φωνητικών χορδών. Μερικά σύμφωνα ανήκουν σε αυτό το είδος, όπως το π, το τ, το σ, κτλ. Σχήμα 3.1 Άηχα και ηχηρά τμήματα ομιλίας 23

27 3.1.2 ΥΨΟΣ ΦΩΝΗΣ (PITCH) Ύψος Φωνής (Ptch) : Το ύψος φωνής είναι η θεμελιώδης συχνότητα ομιλίας. Αναλύοντας το σήμα ομιλίας στην περιοχή συχνοτήτων, μπορούμε να δούμε πολλά στοιχεία συχνότητας. Το πρώτο formant είναι η θεμελιώδης συχνότητα και συμβολίζεται συνήθως ως F0. Το ύψος φωνής έχει νόημα μόνο σε ηχηρές περιοχές ομιλίας και αυτό γιατί η άηχη ομιλία δεν έχει καμία περιοδικότητα, και ως εκ τούτου δεν έχει ύψος φωνής. Εξετάζοντας τη κυματομορφής ενός ηχηρού τμήματος ομιλίας, μια ptch περίοδος είναι μια ολόκληρη περίοδος του σήματος, όπως φαίνεται στο Σχήμα 3.2 Σχήμα 3.2. Απεικόνιση του ύψους φωνής (ptch) ΠΕΡΙΒΑΛΛΟΥΣΑ ΥΨΟΥΣ ΦΩΝΗΣ (PITCH CONTOUR) Περιβάλλουσα ύψους φωνής (Ptch Contour) : Η περιβάλλουσα του ύψούς φωνής είναι οι μεταβολές του ύψους φωνής στο χρόνο. Προκύπτει ουσιαστικά αν συμβολίσει κανείς με σημεία τις μεταβολές στο ύψος φωνής που συμβαίνουν με το πέρασμα του χρόνο στο κομμάτι ομιλίας που εξετάζεται και στη συνέχεια ενώσει αυτά τα σημεία. Μια τέτοια διαδικασία παρουσιάζεται στο Σχήμα 3.3 Από αυτό το σημείο και πέρα οι αναφορές στα μεγέθη και έννοιες που εξετάστηκαν μέχρι τώρα ( ηχηρά κα άηχα κομμάτια ομιλίας, ύψος φωνής, περιβάλλουσα ύψους φωνής, διάρκεια τμημάτων ομιλίας) θα γίνεται σύμφωνα με τις διεθνείς ονομασίες τους ( voced και unvoced peech, ptch, ptch contour και duraton) 24

Θέµα 5 ο Σύνθεση Οµιλίας

Θέµα 5 ο Σύνθεση Οµιλίας Θέµα 5 ο Σύνθεση Οµιλίας Εισαγωγή Γενικά µε τον όρο σύνθεση οµιλίας εννοούµε την αυτόµατη παραγωγή κυµατοµορφών οµιλίας. Ουσιαστικά αναφερόµαστε στην µετατροπή ενός κειµένου εισόδου (που αποτελείται από

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 6 ΟΥ ΚΕΦΑΛΑΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ 6.1 Τι ονοµάζουµε πρόγραµµα υπολογιστή; Ένα πρόγραµµα

Διαβάστε περισσότερα

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Σημειώσεις Δικτύων Αναλογικά και ψηφιακά σήματα Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Χαρακτηριστικά

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το

Διαβάστε περισσότερα

Αναπτυξιακά ορόσημα λόγου

Αναπτυξιακά ορόσημα λόγου Αναπτυξιακά ορόσημα λόγου 0-6 μηνών 7-12 μηνών 13-18 μηνών 19-24 μηνών 2-3 ετών 3-4 ετών 4-5 ετών 5-6 ετών 6-7 ετών 0-6 μηνών Επαναλαμβάνει τους ίδιους ήχους Συχνά μουρμουρίζει, γελά και παράγει ευχάριστους

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ Ενότητα 4: Χαρακτηριστικά της Ομιλίας Φωνητική και Φωνολογία (2ο Μέρος) Οκαλίδου Αρετή Τμήμα Εκπαιδευτικής και Κοινωνικής Πολιτικής Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής Κωδικοποίηση ήχου Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής T. Painter and A. Spanias, Perceptual Coding of Digital Audio, Proceedings of the IEEE, pp. 451-513, April 2000. P. Noll, MPEG digital audio

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1 Ήχος και φωνή Φύση του ήχου Ψηφιοποίηση µε µετασχηµατισµό Ψηφιοποίηση µε δειγµατοληψία Παλµοκωδική διαµόρφωση Αναπαράσταση µουσικής Ανάλυση και σύνθεση φωνής Μετάδοση φωνής Τεχνολογία Πολυµέσων 4-1 Φύση

Διαβάστε περισσότερα

MULTICOM 112. Οδηγίες χρήσης

MULTICOM 112. Οδηγίες χρήσης MULTICOM 112 Οδηγίες χρήσης Σκοπός Στόχος του προγράμματος Multicom-112 είναι να βοηθήσει το προσωπικό των επιχειρησιακών κέντρων να αναπτύξουν βασικές γλωσσικές δεξιότητες μέχρι το σημείο όπου θα είναι

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ Ενότητα 1: Επικοινωνία, Λόγος, Ομιλία (2ο Μέρος) Οκαλίδου Αρετή Τμήμα Εκπαιδευτικής και Κοινωνικής Πολιτικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Εργαστήριο φωνής: Ακουστική ανάλυση ομιλίας και φωνής

Εργαστήριο φωνής: Ακουστική ανάλυση ομιλίας και φωνής Εργαστήριο φωνής: Ακουστική ανάλυση ομιλίας και φωνής Ηλίας Παπαθανασίου Αν Καθηγητής Τμήμα Λογοθεραπείας, ΤΕΙ Πάτρας Επιστημ. Συνεργάτης Α Πανεπιστημιακής ΩΡΛ Κλινικής Ιατρική Σχολή, ΕΚΠΑ 1 3/23/15 Ακουστική

Διαβάστε περισσότερα

25/3/2009. Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου. Φλώρος Ανδρέας Επίκ. Καθηγητής Παράμετροι ελέγχου

25/3/2009. Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου. Φλώρος Ανδρέας Επίκ. Καθηγητής Παράμετροι ελέγχου Από το προηγούμενο μάθημα... Μάθημα: «Ψηφιακή Επεξεργασία Ήχου» Δάλ Διάλεξη 4 η : «Επεξεργαστές Ε ξ έ Δυναμικής Περιοχής (Mέρος έ ΙΙ)» Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου

Διαβάστε περισσότερα

Κεφάλαιο 7 Σύνθεση Οµιλίας

Κεφάλαιο 7 Σύνθεση Οµιλίας Κεφάλαιο 7 Σύνθεση Οµιλίας σελ.235 Κεφάλαιο 7 Σύνθεση Οµιλίας 7.1 Εισαγωγή Γενικά µε τον όρο σύνθεση οµιλίας εννοούµε την αυτόµατη παραγωγή κυµατοµορφών οµιλίας. Ουσιαστικά αναφερόµαστε στην µετατροπή

Διαβάστε περισσότερα

Φωνολογική Ανάπτυξη και Διαταραχές

Φωνολογική Ανάπτυξη και Διαταραχές 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Φωνολογική Ανάπτυξη και Διαταραχές Ενότητα 1: Εισαγωγικές Επισημάνσεις Ζακοπούλου Βικτωρία 2 Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου Τμήμα

Διαβάστε περισσότερα

- Καθυστέρηση λόγου (LLI)

- Καθυστέρηση λόγου (LLI) Πολλά άτομα με βαρηκοΐα/κώφωση (Είναι η μερική ή ολική απώλεια των ηχητικών ερεθισμάτων μέσω της ακουστικής οδού. Γίνεται λοιπόν κατανοητό πως προκύπτει δυσκολία επεξεργασίας και παραγωγής των ήχων συνεπώς

Διαβάστε περισσότερα

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1 Ήχος Χαρακτηριστικά του ήχου Ψηφιοποίηση με μετασχηματισμό Ψηφιοποίηση με δειγματοληψία Κβαντοποίηση δειγμάτων Παλμοκωδική διαμόρφωση Συμβολική αναπαράσταση μουσικής Τεχνολογία Πολυμέσων και Πολυμεσικές

Διαβάστε περισσότερα

Ψυχογλωσσολογία. Ενότητα 3 : Αντίληψη προφορικού λόγου. Χριστίνα Μανουηλίδου, Επίκουρη Καθηγήτρια Τμήμα Φιλολογίας

Ψυχογλωσσολογία. Ενότητα 3 : Αντίληψη προφορικού λόγου. Χριστίνα Μανουηλίδου, Επίκουρη Καθηγήτρια Τμήμα Φιλολογίας Ψυχογλωσσολογία Ενότητα 3 : Αντίληψη προφορικού λόγου Χριστίνα Μανουηλίδου, Επίκουρη Καθηγήτρια Τμήμα Φιλολογίας Σκοποί ενότητας Αντίληψη λόγου Προσωδία Θεωρίες για την αντίληψη του λόγου Ακουστική Κινητική

Διαβάστε περισσότερα

Πότε πρέπει να αρχίζει η λογοθεραπεία στα παιδιά - λόγος και μαθησιακές δυσκολίες

Πότε πρέπει να αρχίζει η λογοθεραπεία στα παιδιά - λόγος και μαθησιακές δυσκολίες Η διάγνωση των διαταραχών λόγου πρέπει να γίνεται έγκαιρα, μόλις οι γονείς αντιληφθούν οτι κάτι ισως δεν πάει καλά και πρέπει να παρουσιάσουν το παιδί τους στον ειδικό. Ο ειδικός θα λάβει μέτρα για την

Διαβάστε περισσότερα

MPEG-7 : Περιγραφή πολυμεσικού περιεχομένου

MPEG-7 : Περιγραφή πολυμεσικού περιεχομένου MPEG-7 : Περιγραφή πολυμεσικού περιεχομένου Εξαγωγή μεταδεδομένων / περιγραφών Χαμηλού επιπέδου περιγραφείς Συντακτικός και σημασιολογικός ορισμός Ανάκτηση πολυμεσικών τεκμηρίων XML / OWL Δημοσίευση 2002

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ ΜΕΡΛΙΑΟΥΝΤΑΣ ΣΤΕΦΑΝΟΣ, ΠΕ19 ΚΕΦΑΛΑΙΟ 3 Αλγόριθμοι 3. Αλγόριθμοι 2 3. Αλγόριθμοι 3.1 Η έννοια του αλγορίθμου 3.2 Χαρακτηριστικά αλγορίθμου 3.3 Ανάλυση αλγορίθμων

Διαβάστε περισσότερα

Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (3)

Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (3) Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (3) Δυσκολίες στην ανάγνωση Τα θεωρητικά μέρη του δικτύου οπτικής αναγνώρισης λέξεων και οι εκτιμώμενες θέσεις τους στο αριστερό ημισφαίριο του εγκεφάλου του έμπειρου

Διαβάστε περισσότερα

Η γλώσσα ως σύστημα και ως χρήση. Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ

Η γλώσσα ως σύστημα και ως χρήση. Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ Η γλώσσα ως σύστημα και ως χρήση Ασπασία Χατζηδάκη, Επίκουρη καθηγήτρια ΠΤΔΕ 2009-10 Τι είναι γλώσσα; Γλώσσα είναι το σύστημα ήχων ( φθόγγων ) και εννοιών που χρησιμοποιούν οι ανθρώπινες κοινότητες για

Διαβάστε περισσότερα

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ και ΔΟΜΗ ΑΚΟΛΟΥΘΙΑΣ 2.1 Να δοθεί ο ορισμός

Διαβάστε περισσότερα

Συστήματα αναγνώρισης ομιλίας και χρήση τους. Αναστάσιος Φραντζής

Συστήματα αναγνώρισης ομιλίας και χρήση τους. Αναστάσιος Φραντζής Συστήματα αναγνώρισης ομιλίας και χρήση τους Αναστάσιος Φραντζής ΓΤΠ 61 0/0/202 01/04/2012 Συσκευές αλληλεπίδρασης εισόδου 1. Εισαγωγής κειμένου 3. Αναγνώριση κειμένου, χειρογράφου, φωνής Πληκτρολόγιο

Διαβάστε περισσότερα

Φωνολογική Ανάπτυξη και Διαταραχές

Φωνολογική Ανάπτυξη και Διαταραχές 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Φωνολογική Ανάπτυξη και Διαταραχές Ενότητα 6: Φώνημα Ζακοπούλου Βικτωρία 2 Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου Τμήμα Λογοθεραπείας

Διαβάστε περισσότερα

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Τεράστιες ανάγκες σε αποθηκευτικό χώρο ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα: CD-ROM έχει χωρητικότητα 650MB, χωρά 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου, αλλά 30 sec ασυμπίεστου βίντεο. Μαγνητικοί δίσκοι χωρητικότητας

Διαβάστε περισσότερα

Ε Ι Α Γ Ω Γ Η Σ Ο Ν Π Ρ Ο Γ Ρ Α Μ Μ Α Σ Ι Μ Ο Κ Ε Υ Α Λ Α Ι Ο 6. Σο πρόγραμμα γράφεται σε κάποια γλώσσα προγραμματισμού.

Ε Ι Α Γ Ω Γ Η Σ Ο Ν Π Ρ Ο Γ Ρ Α Μ Μ Α Σ Ι Μ Ο Κ Ε Υ Α Λ Α Ι Ο 6. Σο πρόγραμμα γράφεται σε κάποια γλώσσα προγραμματισμού. Κεφάλαιο 6 6.1 Η έννοια του προγράμματος Η επίλυση ενός προβλήματος με τον υπολογιστή περιλαμβάνει τρία σημαντικά στάδια : Σον ακριβή προσδιορισμό του προβλήματος Σην ανάπτυξη του αντίστοιχου αλγορίθμου

Διαβάστε περισσότερα

29. Βοηθητικό ρόλο στους μαθητές με δυσγραφία κατέχει η χρήση: Α) ηλεκτρονικών υπολογιστών Β) αριθμομηχανών Γ) λογογράφων Δ) κανένα από τα παραπάνω

29. Βοηθητικό ρόλο στους μαθητές με δυσγραφία κατέχει η χρήση: Α) ηλεκτρονικών υπολογιστών Β) αριθμομηχανών Γ) λογογράφων Δ) κανένα από τα παραπάνω ΔΥΣΓΡΑΦΙΑ Ερωτήσεις 1. Η δυσγραφία μπορεί να χωριστεί στις δύο ακόλουθες κατηγορίες: Α) γενική και μερική Β) γενική και ειδική Γ) αναπτυξιακή και επίκτητη Δ) αναπτυξιακή και μαθησιακή 2. Η αναπτυξιακή

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 21η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία: «Artificial Intelligence A Modern Approach» των. Russel

Διαβάστε περισσότερα

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων 5. Απλή Ταξινόμηση 2 ομές εδομένων 4 5 Χρήστος ουλκερίδης Τμήμα Ψηφιακών Συστημάτων 11/11/2016 Εισαγωγή Η

Διαβάστε περισσότερα

Βέλτιστη Επιλογή Κειμένου για Σύστημα Σύνθεσης Φωνής

Βέλτιστη Επιλογή Κειμένου για Σύστημα Σύνθεσης Φωνής Πολυτεχνείο Κρήτης Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Τομέας Τηλεπικοινωνιών Διπλωματική Εργασία Βέλτιστη Επιλογή Κειμένου για Σύστημα Σύνθεσης Φωνής Από Διονύσιο Κ. Παπαϊωάννου (Α.Μ.

Διαβάστε περισσότερα

Δημιουργία προσβάσιμων παρουσιάσεων με χρήση MS-PowerPoint 2010

Δημιουργία προσβάσιμων παρουσιάσεων με χρήση MS-PowerPoint 2010 Δημιουργία προσβάσιμων παρουσιάσεων με χρήση MS-PowerPoint 2010 Άδειες χρήσης Το παρόν υλικό υπόκειται σε άδειες χρήσης Creative Commons. Ανοικτά Ψηφιακά Μαθήματα 2 Περιεχόμενα Εισαγωγή Προσβάσιμες παρουσιάσεις

Διαβάστε περισσότερα

Προηγµένη ιασύνδεση µε τοπεριβάλλον

Προηγµένη ιασύνδεση µε τοπεριβάλλον Προηγµένη ιασύνδεση µε τοπεριβάλλον! Επεξεργασία φυσικής γλώσσας # Κατανόηση φυσικής γλώσσας # Παραγωγή φυσικής γλώσσας! Τεχνητή όραση! Ροµποτική Κατανόηση Φυσικής Γλώσσας! Αναγνώριση οµιλίας (Speech recognition)!

Διαβάστε περισσότερα

Ο γραπτός λόγος στην αναπηρία. Ε. Ντεροπούλου

Ο γραπτός λόγος στην αναπηρία. Ε. Ντεροπούλου Ο γραπτός λόγος στην αναπηρία Ε. Ντεροπούλου ΘΕΩΡΗΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Η εκμάθηση, η κατανόηση, η κατάκτηση της αναγνωστικής διαδικασίας και η πολυπλοκότητα του αναγνωστικού μηχανισμού απασχολεί ένα ευρύ

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

E [ -x ^2 z] = E[x z]

E [ -x ^2 z] = E[x z] 1 1.ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτήν την διάλεξη θα πάμε στο φίλτρο με περισσότερες λεπτομέρειες, και θα παράσχουμε μια νέα παραγωγή για το φίλτρο Kalman, αυτή τη φορά βασισμένο στην ιδέα της γραμμικής

Διαβάστε περισσότερα

Ύψος Συχνότητα Ένταση Χροιά. Ο ήχος Ο ήχος είναι μια μορφή ενέργειας. Ιδιότητες του ήχου. Χαρακτηριστικά φωνής

Ύψος Συχνότητα Ένταση Χροιά. Ο ήχος Ο ήχος είναι μια μορφή ενέργειας. Ιδιότητες του ήχου. Χαρακτηριστικά φωνής Ο ήχος Ο ήχος είναι μια μορφή ενέργειας Είναι οι παλμικές δονήσεις που δημιουργούνται από ένα οποιοδήποτε σώμα, όταν τεθεί σε κίνηση, σε κραδασμό Την κίνηση σε ένα σώμα που βρίσκεται σε αδράνεια, μπορεί

Διαβάστε περισσότερα

Ε π ε ξ ε ρ γ α σ ί α Ο μ ι λ ί α ς κ α ι Φ υ σ ι κ ή ς Γ λ ώ σ σ α ς

Ε π ε ξ ε ρ γ α σ ί α Ο μ ι λ ί α ς κ α ι Φ υ σ ι κ ή ς Γ λ ώ σ σ α ς Τμήμα Πληροφορικής και Τηλεπικοινωνιών Ε π ε ξ ε ρ γ α σ ί α Ο μ ι λ ί α ς κ α ι Φ υ σ ι κ ή ς Γ λ ώ σ σ α ς Ενότητα 2: Βασικά χαρακτηριστικά της ομιλίας Γ ε ώ ρ γ ι ο ς Κ ο υ ρ ο υ π έ τ ρ ο γ λ ο υ koupe@di.uoa.gr

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 3: Συστήματα πολυμέσων Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ Καθηγητής Πληροφορικής ΠΕ19 1 ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΚΕΦΑΛΑΙΟ 6 ο : ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΙΣΤΟΣΕΛΙΔΑ ΜΑΘΗΜΑΤΟΣ: http://eclass.sch.gr/courses/el594100/ Η έννοια του προγράμματος

Διαβάστε περισσότερα

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1 ΣΥΝΑΡΤΗΣΕΙΣ Η έννοια της συνάρτησης είναι θεμελιώδης στο λογισμό και διαπερνά όλους τους μαθηματικούς κλάδους. Για το φοιτητή είναι σημαντικό να κατανοήσει πλήρως αυτή

Διαβάστε περισσότερα

Οδηγός γρήγορης εκκίνησης του PowerSuite

Οδηγός γρήγορης εκκίνησης του PowerSuite Το PowerSuite είναι η ολοκληρωμένη λύση απόδοσης για τον υπολογιστή σας. Ενσωματώνοντας το RegistryBooster, το DriverScanner και το SpeedUpMyPC σε ένα ενιαίο περιβάλλον εργασίας σάρωσης, το PowerSuite

Διαβάστε περισσότερα

Κεφάλαιο 6 ο Εισαγωγή στον Προγραμματισμό 1

Κεφάλαιο 6 ο Εισαγωγή στον Προγραμματισμό 1 Κεφάλαιο 6 ο Εισαγωγή στον Προγραμματισμό 1 Ποιες γλώσσες αναφέρονται ως φυσικές και ποιες ως τεχνητές; Ως φυσικές γλώσσες αναφέρονται εκείνες οι οποίες χρησιμοποιούνται για την επικοινωνία μεταξύ ανθρώπων,

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης

Κεφάλαιο 7. ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης ΕΠΑΛ Σύμης Εφαρμογές πληροφορικής Ερωτήσεις επανάληψης Κεφάλαιο 7 1. Σε τι διαφέρει ο Η/Υ από τις υπόλοιπες ηλεκτρικές και ηλεκτρονικές συσκευές; Που οφείλεται η δυνατότητά του να κάνει τόσο διαφορετικές

Διαβάστε περισσότερα

Ο Οδηγός γρήγορης εκκίνησης

Ο Οδηγός γρήγορης εκκίνησης Ο Οδηγός γρήγορης εκκίνησης του Microsoft PowerPoint 2013 έχει διαφορετική εμφάνιση από προηγούμενες εκδόσεις. Γι αυτό το λόγο, δημιουργήσαμε αυτόν τον οδηγό για να ελαχιστοποιήσουμε την καμπύλη εκμάθησης.

Διαβάστε περισσότερα

Η ΓΛΩΣΣΙΚΗ ΑΝΑΠΤΥΞΗ ΤΩΝ ΠΑΙΔΙΩΝ ΓΕΝΝΗΣΗ 6 ΕΤΩΝ ΓΛΩΣΣΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ

Η ΓΛΩΣΣΙΚΗ ΑΝΑΠΤΥΞΗ ΤΩΝ ΠΑΙΔΙΩΝ ΓΕΝΝΗΣΗ 6 ΕΤΩΝ ΓΛΩΣΣΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ Η ΓΛΩΣΣΙΚΗ ΑΝΑΠΤΥΞΗ ΤΩΝ ΠΑΙΔΙΩΝ ΓΕΝΝΗΣΗ 6 ΕΤΩΝ ΗΛΙΚΙΑ γέννηση ΓΛΩΣΣΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ Αναγνωρίζει και προτιμά τη φωνή της μητέρας καθώς και ήχους της γλώσσας. Μιμείται ήχους της γλώσσας. 2 μηνών Συνδυάζει

Διαβάστε περισσότερα

Τι μαθησιακός τύπος είναι το παιδί σας;

Τι μαθησιακός τύπος είναι το παιδί σας; Για τους γονείς και όχι μόνο από το Τι μαθησιακός τύπος είναι το παιδί σας; Ακουστικός, οπτικός ή μήπως σφαιρικός; Ανακαλύψτε ποιος είναι ο μαθησιακός τύπος του παιδιού σας, δηλαδή με ποιο τρόπο μαθαίνει

Διαβάστε περισσότερα

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

Προβλήματα, αλγόριθμοι, ψευδοκώδικας Προβλήματα, αλγόριθμοι, ψευδοκώδικας October 11, 2011 Στο μάθημα Αλγοριθμική και Δομές Δεδομένων θα ασχοληθούμε με ένα μέρος της διαδικασίας επίλυσης υπολογιστικών προβλημάτων. Συγκεκριμένα θα δούμε τι

Διαβάστε περισσότερα

Τεχνολογία σύνθεσης φωνής από κείμενο

Τεχνολογία σύνθεσης φωνής από κείμενο Τεχνολογία σύνθεσης φωνής από κείμενο Ηεξέλιξησεδιεθνέςεπίπεδο Πρώτο σύστημα ~1939 Ταχύτερη εξέλιξη δεκαετία 70 με την ανάπτυξη των υπολογιστών Πρώτα χρήσιμα συστήματα τέλη δεκαετίας 80 Ωρίμανση της τεχνολογίας

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Πρόβλημα είναι μια κατάσταση η οποία χρήζει αντιμετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή, ούτε προφανής.

Πρόβλημα είναι μια κατάσταση η οποία χρήζει αντιμετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή, ούτε προφανής. Κεφάλαιο 2 - Πρόβλημα 2.1.1. Η έννοια του προβλήματος Πρόβλημα είναι μια κατάσταση η οποία χρήζει αντιμετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή, ούτε προφανής. 2.1.2. Κατηγορίες προβλημάτων

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο Φίλτρα Kalman Εξαγωγή των εξισώσεων τους με βάση το κριτήριο ελαχιστοποίησης της Μεθόδου των Ελαχίστων Τετραγώνων. Αναλυτικές Μέθοδοι στη Γεωπληροφορική Μεταπτυχιακό Πρόγραμμα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ ιατύπωση του

Διαβάστε περισσότερα

Keywords λέξεις κλειδιά:

Keywords λέξεις κλειδιά: ΑΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΕΠΙΣΤΗΜΩΝ Τμήμα Μηχανικών Μουσικής Τεχνολογίας & Ακουστικής ''Κοχλιακά εμφυτεύματα: προσομοίωση της ακοής μέσω εφαρμογής και απεικόνιση της διασποράς ηλεκτρικού πεδίου με

Διαβάστε περισσότερα

Ψευδοκώδικας. November 7, 2011

Ψευδοκώδικας. November 7, 2011 Ψευδοκώδικας November 7, 2011 Οι γλώσσες τύπου ψευδοκώδικα είναι ένας τρόπος περιγραφής αλγορίθμων. Δεν υπάρχει κανένας τυπικός ορισμός της έννοιας του ψευδοκώδικα όμως είναι κοινός τόπος ότι οποιαδήποτε

Διαβάστε περισσότερα

ΕΙΔΗ,ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙ- ΣΜΟΥ

ΕΙΔΗ,ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙ- ΣΜΟΥ Κεφάλαιο 7 ΕΙΔΗ,ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙ- ΣΜΟΥ Ερωτήσεις 1. Να αναφέρετε διαφορές μεταξύ γλωσσών μηχανής και γλωσσών χαμηλού επιπέδου. Οι γλώσσες μηχανής κωδικοποιούν τις εντολές τους με ομάδες

Διαβάστε περισσότερα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων ΜΕΡΟΣ 1 Γενική Εικόνα του Μαθήματος 1. Μοντελοποίηση (Μοντέλο Ο/Σ, Σχεσιακό, Λογικός Σχεδιασμός) 2. Προγραμματισμός (Σχεσιακή Άλγεβρα, SQL) ημιουργία/κατασκευή Εισαγωγή εδομένων

Διαβάστε περισσότερα

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ

Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση. Τηλεπισκόπηση 24/6/2013. Τηλεπισκόπηση. Κ. Ποϊραζίδης ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ ΤΑΞΙΝΟΜΗΣΗ ΕΙΚΟΝΑΣ Κ. Ποϊραζίδης Η ταξινόμηση εικόνας αναφέρεται στην ερμηνεία με χρήση υπολογιστή των τηλεπισκοπικών εικόνων. Παρόλο που ορισμένες διαδικασίες έχουν τη δυνατότητα να συμπεριλάβουν πληροφορίες

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Ενότητα 1η. Εισαγωγή στην Πληροφορική

Ενότητα 1η. Εισαγωγή στην Πληροφορική Ενότητα 1η Εισαγωγή στην Πληροφορική 1.1 Τι είναι Πληροφορική Ένας σύντομος ορισμός για το τι είναι πληροφορική είναι ο παρακάτω: όλα εκείνα που χρειάζεται κανείς για να παράγει, να οργανώνει και να διαχειρίζεται

Διαβάστε περισσότερα

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΥΠΟΛΟΓΙΣΤΩΝ

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΥΠΟΛΟΓΙΣΤΩΝ Εισαγωγή ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΥΠΟΛΟΓΙΣΤΩΝ Όπως για όλες τις επιστήμες, έτσι και για την επιστήμη της Πληροφορικής, ο τελικός στόχος της είναι η επίλυση προβλημάτων. Λύνονται όμως όλα τα προβλήματα;

Διαβάστε περισσότερα

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o ΕΘΝΙΚΟ & ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τομέας Επικοινωνιών και Επεξεργασίας Σήματος Τμήμα Πληροφορικής & Τηλεπικοινωνιών

Διαβάστε περισσότερα

Βασίλειος Κοντογιάννης ΠΕ19

Βασίλειος Κοντογιάννης ΠΕ19 Ενότητα2 Προγραμματιστικά Περιβάλλοντα Δημιουργία Εφαρμογών 5.1 Πρόβλημα και Υπολογιστής Τι ονομάζουμε πρόβλημα; Πρόβλημα θεωρείται κάθε ζήτημα που τίθεται προς επίλυση, κάθε κατάσταση που μας απασχολεί

Διαβάστε περισσότερα

Διαχείριση Βάσης Δεδομένων (dbadmin)

Διαχείριση Βάσης Δεδομένων (dbadmin) Published on PRISMA Win Help - Megasoft (http://docs.megasoft.gr) Home > Εμπορική Διαχείριση > Διαχείριση Βάσης Δεδομένων (dbadmin) Διαχείριση Βάσης Δεδομένων (dbadmin) Μέσα από τη διαχείριση βάσης δεδομένων

Διαβάστε περισσότερα

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής 15/3/9 Από το προηγούμενο μάθημα... Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου Μάθημα: «Ψηφιακή Επεξεργασία Ήχου» Δάλ Διάλεξη 3 η : «Επεξεργαστές Ε ξ έ Δυναμικής Περιοχής» Φλώρος

Διαβάστε περισσότερα

Οι διαταραχές του λόγου και τις οµιλίας στην παιδική ηλικία. Αναστασία Λαµπρινού Δεκέµβριος 2001

Οι διαταραχές του λόγου και τις οµιλίας στην παιδική ηλικία. Αναστασία Λαµπρινού Δεκέµβριος 2001 Οι διαταραχές του λόγου και τις οµιλίας στην παιδική ηλικία Αναστασία Λαµπρινού Δεκέµβριος 2001 Γλώσσα- είναι µία ταξινοµική αρχή, ένας κώδικας επικοινωνίας, ένα κοινωνικό φαινόµενο έξω από το άτοµο. Οµιλία-

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 8 η : Κατάτμηση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στην κατάτμηση εικόνας Τεχνικές

Διαβάστε περισσότερα

Επεξεργασία Ερωτήσεων

Επεξεργασία Ερωτήσεων Εισαγωγή Επεξεργασία Ερωτήσεων Σ Β Βάση εδομένων Η ομή ενός ΣΒ Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 1 Βάσεις Δεδομένων 2006-2007 Ευαγγελία Πιτουρά 2 Εισαγωγή Εισαγωγή ΜΕΡΟΣ 1 (Χρήση Σ Β ) Γενική

Διαβάστε περισσότερα

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5α. Σημειώσεις μαθήματος: E mail:

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5α. Σημειώσεις μαθήματος: E mail: Ιατρικά Ηλεκτρονικά Δρ. Π. Ασβεστάς Τμήμα Μηχανικών Βιοϊατρικής Τεχνολογίας Τ.Ε Χρήσιμοι Σύνδεσμοι Σημειώσεις μαθήματος: http://medisp.bme.teiath.gr/eclass/courses/tio127/ E mail: pasv@teiath.gr 2 1 Περιοδικά

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ Σχολή Οικονομίας Διοίκησης και Πληροφορικής Τμήμα Πληροφορικής και Τηλεπικοινωνιών ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ Αρχές Τηλ/ων Συστημάτων Εργαστήριο 7 ο : Δειγματοληψία και Ανασύσταση Βασική

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ]

ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ] Κατερέλος - 2.3. ΟΙ ΕΡΩΤΗΣΕ1Σ III: ΟΙ ΚΛΙΜΑΚΕΣ] Η χρήση των κλιμάκων στην ψυχολογία είναι εξαιρετικά ευρεία: δοκιμασίες ικανοτήτων, μέτρηση απόψεων και στάσεων ή και κλινικές παρατηρήσεις. Ειδικότερα στην

Διαβάστε περισσότερα

Παρεμβάσεις για τις μαθησιακές δυσκολίες

Παρεμβάσεις για τις μαθησιακές δυσκολίες Παρεμβάσεις για τις μαθησιακές δυσκολίες α) Εξατομικευμένα προγράμματα Μοντέλα με στόχο τις φωνολογικές δεξιότητες Μοντέλα με στόχο την αποκωδικοποίηση και την ευχέρεια Μοντέλα με έμφαση στις δεξιότητες

Διαβάστε περισσότερα

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων Γλωσσική Τεχνολογία Ακαδημαϊκό Έτος 2011-2012 Ημερομηνία Παράδοσης: Στην εξέταση του μαθήματος ΑΣΚΗΣΗ Δημιουργία Ευρετηρίων Συλλογής Κειμένων Σκοπός της άσκησης είναι η υλοποίηση ενός συστήματος επεξεργασίας

Διαβάστε περισσότερα

Κεφ. 2 Θέματα Θεωρητικής Επιστήμης Υπολογιστών. Κοντογιάννης Βασίλειος ΠΕ19

Κεφ. 2 Θέματα Θεωρητικής Επιστήμης Υπολογιστών. Κοντογιάννης Βασίλειος ΠΕ19 Κεφ. 2 Θέματα Θεωρητικής Επιστήμης Υπολογιστών Κεφ. 2 Θεωρητική Επιστήμη Υπολογιστών 2.3.1.1 Έννοια προγράμματος Τι είναι πρόγραμμα και τι προγραμματισμός; Πρόγραμμα είναι το σύνολο εντολών που χρειάζεται

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο 2

Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο 2 Ερωτήσεις πολλαπλής επιλογής - Κεφάλαιο 2 1. Ο αλγόριθμος είναι απαραίτητος μόνο για την επίλυση προβλημάτων Πληροφορικής 2. Ο αλγόριθμος αποτελείται από ένα πεπερασμένο σύνολο εντολών 3. Ο αλγόριθμος

Διαβάστε περισσότερα

Κεφάλαιο 4: Λογισμικό Συστήματος

Κεφάλαιο 4: Λογισμικό Συστήματος Κεφάλαιο 4: Λογισμικό Συστήματος Ερωτήσεις 1. Να αναφέρετε συνοπτικά τις κατηγορίες στις οποίες διακρίνεται το λογισμικό συστήματος. Σε ποια ευρύτερη κατηγορία εντάσσεται αυτό; Το λογισμικό συστήματος

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ Ενότητα 1: Επικοινωνία, Λόγος, Ομιλία (1 ο Μέρος) Οκαλίδου Αρετή Τμήμα Εκπαιδευτικής και Κοινωνικής Πολιτικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Διακριτός Μετασχηματισμός Fourier

Διακριτός Μετασχηματισμός Fourier Διακριτός Μετασχηματισμός Fourier 1 Διακριτός Μετασχηματισμός Fourier Ο μετασχηματισμός Fourier αποτελεί τον ακρογωνιαίο λίθο της επεξεργασίας σήματος αλλά και συχνή αιτία πονοκεφάλου για όσους πρωτοασχολούνται

Διαβάστε περισσότερα

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή Το λογισμικό της εννοιολογικής χαρτογράυησης Inspiration Η τεχνική της εννοιολογικής χαρτογράφησης αναπτύχθηκε από τον καθηγητή Joseph D. Novak, στο πανεπιστήμιο του Cornell. Βασίστηκε στις θεωρίες του

Διαβάστε περισσότερα

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG Κωδικοποίηση ήχου Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG Τεχνολογία Πολυµέσων και Πολυµεσικές Επικοινωνίες 10-1 Κωδικοποίηση καναλιού φωνής

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS Ακαδημαϊκό Έτος 2016-2017, Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS A. Εισαγωγή στις βάσεις δεδομένων - Γνωριμία με την ACCESS B. Δημιουργία Πινάκων 1. Εξήγηση των

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο. Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΣΙΝΑΤΚΑΣ Ι. ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο. Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΣΙΝΑΤΚΑΣ Ι. ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΜΑΘΗΜΑ 8 Ο Ταξινόμηση και Αναζήτηση Συναρτήσεις χειρισμού οθόνης ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ 2010-11 1 Εισαγωγή Η τακτοποίηση των δεδομένων με ιδιαίτερη σειρά είναι πολύ σημαντική λειτουργία που ονομάζεται

Διαβάστε περισσότερα

Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα

Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα Ενότητες βιβλίου: 6.4, 6.7 Ώρες διδασκαλίας: 1 Τεχνικές σχεδίασης προγραμμάτων Στο βιβλίο γίνεται αναφορά σε μία τεχνική για την ανάπτυξη

Διαβάστε περισσότερα

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Παλαιγεωργίου Γιώργος Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πανεπιστήμιο Θεσσαλίας Ιανουάριος 2011 Ψυχομετρία Η κατασκευή

Διαβάστε περισσότερα

Πέντε Προτάσεις Αντιμετώπισης των υσκολιών στην Ανάγνωση

Πέντε Προτάσεις Αντιμετώπισης των υσκολιών στην Ανάγνωση Πέντε Προτάσεις Αντιμετώπισης των υσκολιών στην Ανάγνωση Tο φαινόμενο της ανάγνωσης προσεγγίζεται ως ολική διαδικασία, δηλαδή ως λεξιλόγιο, ως προφορική έκφραση και ως κατανόηση. ημήτρης Γουλής Πρώτη Πρόταση

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

Ερωτήσεις- Απαντήσεις Πολυμέσα Απο το Βιβλίο Εφαρμογές Η/Υ Α,Β,Γ Λυκείου

Ερωτήσεις- Απαντήσεις Πολυμέσα Απο το Βιβλίο Εφαρμογές Η/Υ Α,Β,Γ Λυκείου Ερωτήσεις- Απαντήσεις Πολυμέσα Απο το Βιβλίο Εφαρμογές Η/Υ Α,Β,Γ Λυκείου 1. Τι ονομάζουμε κόμβο και τι σύνδεσμο σε μια μη γραμμικά διαρθρωμένη ύλη; Με την έννοια σύνδεσμος (link) σε μια μη γραμμικά διαρθρωμένη

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων Ενότητα 4 Επεξεργασία πινάκων 36 37 4.1 Προσθήκη πεδίων Για να εισάγετε ένα πεδίο σε ένα πίνακα που υπάρχει ήδη στη βάση δεδομένων σας, βάζετε τον κέρσορα του ποντικιού στο πεδίο πάνω από το οποίο θέλετε

Διαβάστε περισσότερα

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB )

Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB ) Μια «ανώδυνη» εισαγωγή στο μάθημα (και στο MATLAB ) Μια πρώτη ιδέα για το μάθημα χωρίς καθόλου εξισώσεις!!! Περίγραμμα του μαθήματος χωρίς καθόλου εξισώσεις!!! Παραδείγματα από πραγματικές εφαρμογές ==

Διαβάστε περισσότερα

Δομές Δεδομένων & Αλγόριθμοι

Δομές Δεδομένων & Αλγόριθμοι Θέματα Απόδοσης Αλγορίθμων 1 Η Ανάγκη για Δομές Δεδομένων Οι δομές δεδομένων οργανώνουν τα δεδομένα πιο αποδοτικά προγράμματα Πιο ισχυροί υπολογιστές πιο σύνθετες εφαρμογές Οι πιο σύνθετες εφαρμογές απαιτούν

Διαβάστε περισσότερα