PRAAT Σύντομος Οπτικός Οδηγός Χρήσης Εισαγωγικό Μάθημα με εικόνες Αθανάσιος Ν. Καρασίμος Δημήτριος Παπαζαχαρίου Εργαστήριο Νεοελληνικών Διαλέκτων Τμήμα Φιλολογίας, Πανεπιστήμιο Πατρών ΈΚΔΟΣΗ v.1.0 (Praat 5.x), ΦΕΒΡΟΥΑΡΙΟΣ 2010 1
PRAAT Σύντομος Οπτικός Οδηγός Χρήσης Αθανάσιος Ν. Καρασίμος 1. Εισαγωγή Το λογισμικό Praat (a system for doing phonetics) έχει δημιουργηθεί από τους Paul Boersma & David Weenink στο Phonetics Science Department, University of Amsterdam. Ο παρών οδηγός αποτελεί μια εισαγωγή για την χρήση του προγράμματος και των βασικών λειτουργιών του Praat, το οποίο είναι ένα freeware πρόγραμμα ανάλυσης και επεξεργασίας ακουστικών σημάτων και ήχων. Ο συγκεκριμένος οδηγός έχει λάβει υπόψιν του τα αντίστοιχα tutorials των Sidney Wood και Pascal Van Lieshout. To Praat μπορεί να χρησιμοποιηθεί σχεδόν σε όλα τα λειτουργικά συστήματα, αλλά ο συγκεκριμένος οδηγός βασίστηκε στην έκδοση για Windows (XP) OS. Το πρόγραμμα μπορείτε να το κατεβάστε από την επίσημη ιστοσελίδα: http://www.fon.hum.uva.nl/praat/ (διαφορετικές εκδόσεις, κώδικας, συνεχείς αναβαθμίσεις). Το Praat είναι ένα ιδιαίτερα διαδεδομένο και ευέλικτο εργαλείο στο τομέα της επεξεργασίας ομιλίας (speech processing). Προσφέρει ένα μεγάλο εύρος από στάνταρτ και όχι μόνο διαδικασίες ανάμεσα σε άλλα φασματογραφήματα, αρθρωτική σύνθεση και νευρωνικά δίκτυα. Αυτός ο οδηγός χρήσης στοχεύει σε αυτούς που θέλουν να μάθουν περισσότερα για το πρόγραμμα PRAAT για την ακουστική ανάλυση και επεξεργασία ομιλίας. 2. Εγκατάσταση Για την χρήση του προγράμματος πρέπει να κατεβάστε την κατάλληλη έκδοση του Praat ανάλογα με λειτουργικό σύστημα (για τα Windows η σελίδα είναι η ακόλουθη: http://www.fon.hum.uva.nl/praat/download_win.html). Αφού κατεβάστε το αρχείο, το πρόγραμμα θα αποσυμπιεστεί όπου επιλέξτε (συνήθως στην Επιφάνεια Εργασίας). Το συγκεκριμένο λογισμικό δεν κάνει κανονική εγκατάσταση και τρέχει χωρίς install. Επίσης συνίσταται από την ίδια σελίδα να κατεβάστε και τις δύο γραμματοσειρές που δίνονται (DoulosSIL και CharisSIL), ώστε να λειτουργεί καλύτερα το πρόγραμμα στις περιπτώσεις που πρέπει να γράψτε κάτι είτε σε ορθογραφική είτε σε φωνητική γραφή. Για περισσότερες πληροφορίες πώς να εγκαταστήσετε γραμματοσειρές, δείτε στην ίδια τη σελίδα. Στην ίδια σελίδα θα βρείτε διάφορες άλλες πληροφορίες σχετικά το πρόγραμμα, όπως on-line βοήθεια, FAQs και άλλες πληροφορίες. Επίσης στην αρχική σελίδα υπάρχει και ένα manual σε html μορφή για γρήγορη πλοήγηση. 3. Χρησιμοποιώντας το PRAAT 3.1. Χρήση του manual Όταν τρέξτε το πρόγραμμα, τότε θα εμφανιστούν δύο διαφορετικά παράθυρα: 2
Το παράθυρο στα αριστερά είναι το Praat objects παράθυρο. Στο λευκό φόντο της αριστερής του πλευράς θα εμφανιστεί μια λίστα με αρχεία που θα χρησιμοποιήστε ή θα δημιουργείστε για το πρόγραμμα ('objects' στη γλώσσα PRAAT) τα οποία μπορεί να δημιουργηθούν από το μηδέν (όπως θα δούμε σε επόμενη ενότητα) ή να ανοίξουμε/ διαβάσουμε ένα ήδη υπάρχον αρχείο (βλ. παρακάτω). Το παράθυρο στα δεξιά είναι το Praat picture παράθυρο και χρησιμεύει για το σχεδιασμό γραφημάτων. Αυτά μπορούν να αποθηκευτούν σε διάφορες μορφές, ακόμα και σε postscript format ή Windows Metadata για να επεξεργαστούν στη συνέχεια από κάποιον κειμενογράφο ή να εκτυπωθούν αμέσως με την επιλογή print (CTRL-P) στο File μενού. Περισσότερες πληροφορίες για το πρόγραμμα και για τις δυνατότητές τους μπορούν να βρεθούν στο εγχειρίδιο του PRAAT, στο οποίο έχετε πρόσβαση με το κουμπί Help από το κεντρικό μενού του παραθύρου PRAAT objects. Αν κάνετε κλικ στη συγκεκριμένη επιλογή, τότε θα εμφανιστεί το ακόλουθο drop-down menu: 3
Οι περισσότερες επιλογές είναι κατανοητές για το τι περιέχουν μόνο από το όνομά τους δοκιμάστε να δείτε τι περιέχει το καθένα. Τα tutorials είναι ιδιαίτερα χρήσιμα μιας και παρέχουν περισσότερες και συγκεκριμένες πληροφορίες για θέματα που καλύπτει το πρόγραμμα PRAAT. Όπως έχει ήδη ειπωθεί, για αυτούς θέλουν να μάθουν να προγραμματίζουν scripts για το PRAAT ώστε να αυτοματοποιήσουν μερικές διαδικασίες, το Scripting tutorial συνιστάται και επιβάλλεται να διαβαστεί. Περισσότερες πληροφορίες σχετικά με τις formulas, τους operators, τις λειτουργίες κτλ. μπορούν να βρεθούν στο Formulas tutorial. Επίσης τσεκάρετε την ενότητα Frequently Asked Questions με απαντήσεις σχετικά με συχνές απορίες των χρηστών και βεβαιωθείτε ότι έχετε ελέγξει τις τελευταίες αλλαγές από τις νεότερες εκδόσεις στην ενότητα What s new?. Η επιλογή όμως που χρησιμοποιείται κατά κόρον από τους χρήστες είναι η επιλογή για αναζήτηση στο εγχειρίδιο Search Praat manual. Επιπλέον παρατηρήστε ότι μερικές επιλογές έχουν συντομεύσεις, όπως για παράδειγμα το Ctrl-M για την αναζήτηση στο εγχειρίδιο. Εάν κάνετε κλικ στη συγκεκριμένη επιλογή, τότε το παράθυρο που θα εμφανιστεί είναι το ακόλουθο: Απλώς πληκτρολογήστε μια ακολουθία λέξεων που θέλετε να αναζητήστε στο κενό μέρος του παραθύρου και θα βρείτε τις πληροφορίες που είναι διαθέσιμες για το προς αναζήτηση θέμα. Για παράδειγμα μπορείτε να βρείτε πληροφορίες σχετικά με τα ακόλουθα ζητήματα όπως: - Συχνότητες συντονισμού (formats) - Επιτονισμός (pitch) - Ένταση (intensity) - Σπεκτογράφημα (spectrogram) - Εκτύπωση (printing) - Σχολιασμός (tiers) Όπως θα παρατηρήστε, κάποιες ερωτήσεις θα σας δώσουν πολλές επιλογές, ενώ κάποιες άλλες θα είναι περιορισμένες. Να θυμάστε ότι μπορείτε πάντα και ανά πάσα στιγμή να καταφύγετε στη Βοήθεια, όπου κι αν βρισκόσαστε στο πρόγραμμα και ότι οι περισσότερες λειτουργίες του προγράμματος επιτρέπουν να αποκτήστε συγκεκριμένη βοήθεια από το ίδιο το παράθυρο εργασίες που βρήσκεστε. 3.2. Δημιουργία αντικειμένου ομιλίας Προτού να αναλύσουμε δείγματα ήχου, είναι ιδιαίτερα σημαντικό να ρυθμίσουμε σωστά τις απαραίτητες επιλογές από την κάρτα ήχου του συστήματος. Για να αποκτήσουμε πρόσβαση σε αυτές τις επιλογές, πρέπει να ανοίξτε το παράθυρο Volume control. Για τα Windows αυτό γίνεται με το ακόλουθο τρόπο: 1) Επιλέξτε Έναρξη στο κάτω αριστερό μέρος των Windows. 2) Πηγαίνετε στο 'Προγράμματα' -> Βοηθήματα -> Διασκέδαση -> επιλέξτε Έλεγχος Ήχου. 3) Τότε θα εμφανιστεί το ακόλουθο (ή παρόμοιο) παράθυρο (εξαρτάται από την κάρτα ήχου, καθώς και από την έκδοση των Windows) 4
4) Πηγαίνετε στις Επιλογές -> Ιδιότητες -> επιλέξτε Ηχογράφηση 5) Τώρα θα βλέπετε μια ομάδα από επιλογές, όπως το Line-In & Microphone. 6) Επιλέξτε το 'microphone' κάνοντας κλικ στο κουμπί select (το λευκό κουτάκι κάτω από τον μετρητή) και αποεπιλέξτε όλες τις υπόλοιπες επιλογές. Ρυθμίστε το Μετρητή Έντασης εάν είναι αναγκαίο πάνω από το μέσον. Μπορείτε να αφήσετε το παράθυρο ανοιχτό και να το τοποθετήστε στην Μπάρα Εργασίας κάνοντας κλικ στο κουμπί της ελαχιστοποίησης (στην δεξιά πάνω γωνία είναι το πρώτο από αριστερά σύμβολο [_]). Αυτό θα σας επιτρέπει να κάνετε άμεσες αλλαγές στις ρυθμίσεις σε περίπτωση που το κρίνετε απαραίτητο. Όταν τελειώσετε με τις βασικές ρυθμίσεις του ήχου, τότε είστε έτοιμοι, για να δημιουργήστε ένα νέο αρχείο ήχου. Από το βασικό μενού του PRAAT objects παραθύρου επιλέξτε NEW. Αυτό θα ανοίξει το ακόλουθο παράθυρο: Στις περισσότερες περιπτώσεις, θα χρειαστεί να κάνετε μια απλή ηχογράφηση ή επιλογή δείγματος ήχου και για αυτό τον σκοπό θα διαλέξετε την επιλογή Record mono Sound. Εάν επιθυμείτε να κάνετε στερεοφωνικές ηχογραφήσεις, τότε προφανώς θα πρέπει να χρησιμοποιήστε την επιλογή Record stereo Sound. Η τελευταία επιλογή για παράδειγμα μπορεί να ψηφιοποιήσει ένα αρχείο τύπου EG-2 PC Electroglottograph από την Glottal Enterprises (http://www.glottal.com/electroglottograph.html), που μπορεί να σας δίνει αυτόματά παράληλα το σήμα του ήχου μαζί με το EGG σήμα. Ακολούθως θα εμφανιστεί το παράθυρο SoundRecorder για να συνεχίσετε με τις επιλογές σας. Το screenshot που ακολουθεί είναι από την επιλογή της μονοφωνικής ηχογράφησης. 5
(α.) Πρώτα από όλα πρέπει να διαλέξτε τη συχνότητα δείγματος. Στις περισσότερες περιπτώσεις ως προεπιλεγμένο είναι τα 44,1 khz, τα οποία είναι παραπάνω από ικανοποιητικά. Στις περιπτώσεις που ο σκληρός δίσκος του συστήματος δεν έχει μεγάλη χωρητικότητα συνίσταται να κατέβει η συχνότητα δείγματος στα 11 ΚHz ή 22 KHz. Εάν επιθυμείτε να ηχογραφήσετε σε ποιότητα CD quality, επιλέξτε τα 44 ΚHz ή ακόμα υψηλότερα όπως είναι τα 96 KHz ή 192 KHz (το τελευταίο θέλει αρκετό αποθηκευτικό χώρο και θεωρείται αρκετά υπερβολικό για δείγμα συχνότητας). Για να γίνει πιο κατανοητό τι ακριβώς είναι η συχνότητα δείγματος, θεωρούμε πως για παράδειγμα εάν επιλέξουμε την 44,1 ΚΗz, τότε έχουμε 44100 δείγματα ήχου ανά δευτερόλεπτο σε κάθε κανάλι ήχου. (β.) Για ηχογραφήστε ένα σήμα, χρησιμοποιήστε (προτιμείστε) ένα μικρόφωνο υψηλής ευκρίνειας (Hi-Def) που θα το συνδέστε στην είσοδο MIC (μην χρησιμοποιήστε την είσοδο Line In!) από την κάρτα ήχου σας (είτε είναι αυτόνομή είτε είναι on-board πάνω στην μητρική πλακέτα συνήθως η είσοδος έχει χρώμα ροζ) και κάντε κλικ στο κουμπί Record. Κάποια στάνταρ φτηνά μικρόφωνα υπολογιστών δεν πρόκειται να καταγράφουν συχνότητες που είναι χαμηλότερες των 100 Hz. (γ.) Πάρτε μια βαθειά ανάσα και ξεκινήστε να ηχογραφείτε κάποιες προτάσεις. Όπως για παράδειγμα «δοκιμάζουμε να κάνουμε μια ηχογράφηση» για τρεις φορές. Παρακολουθήστε πως δείχνει ο μετρητής την ένταση με τις πράσινες μπάρες. Όταν τελειώστε με την ηχογράφηση, κλικάρετε το κουμπί Stop. Τώρα το σήμα έχει αποθηκευτεί στην μνημη RAM, αλλά δεν είναι ακόμα έτοιμο για περαιτέρω επεξεργασία (εκτός από την επιλογή να ακούσετε την ηχογράφησή σας κάνοντας κλικ στο Play ). (δ.) Εάν η ηχογράφηση είναι ικανοποιητική (ελέγξετε την με το Play ), μπορείτε να προσθέσετε ένα όνομα για την ηχογράφηση στο κουτί που γράφει Name: Untitled. Όταν θα αποθηκεύστε το αρχείο σας αυτό θα εμφανιστεί στο μέρος της λίστας του παράθυρου Objects window. (ε.) Πλέον στο παράθυρο Objects window θα βρείτε πλέον ένα αντικείμενο ήχου που έχει το όνομα Sound {όνομα που δώσατε}. Μπορείτε ανά πάσα στιγμή να αλλάξετε το όνομα οποιουδήποτε αρχείου, εάν επιθυμείτε. Απλώς κάνετε κλικ στο Rename (στην κάτω αριστερή γωνία του παραθύρου υπάρχει το συγκεκριμένο κουμπί) και δώστε του το όνομα που θέλετε (π.χ. test_recording). Κρίνετε απαραίτητη στρατηγική να δίνετε αναγνωρίσιμα 6
ονόματα ή ονόματα σε συστηματική κωδικοποιημένη ονομασία, ώστε να είναι άμεσα κατανοητά όσον αφορά το περιεχόμενό τους. (στ.) Αυτό ήταν ένα απλό παράδειγμα δημιουργίας ενός αντικειμένου ήχου. Μπορείτε επίσης να ψηφιοποιήσετε ένα αρχείο από κάποιο αναλογικό μέσο (DAT ή κασέτα) χρησιμοποιώντας την είσοδο Line-in της κάρτας ήχου σας. Αλλά, βεβαιωθείτε προηγουμένως ότι έχετε επιλέξει Line-In από το παράθυρο Ελέγχου Ήχου και αποεπιλέξτε το μάλλον προεπιλεγμένο μικρόφωνο. Επίσης, καλό είναι να θέσετε την ένταση από το Line-In (επιλέξτε Playback στο μενού του options -> Properties ) στη σίγαση (mute), αλλιώς θα έχετε ένα συνεχή ηχητικό θόρυβο στο βάθος της ηχογράφησης. (ζ.) Τέλος, μπορείτε να διαβάσετε/ ανοίξετε αρχεία που υπάρχουν ήδη στον σκληρό σας δίσκο ή σε κάποιο άλλο φορητό σύστημα αποθήκευσης ή σε κάποιο οπτικό δίσκο, όπως CD/ DVD, μιας και το PRAAT υποστηρίζει διάφορους τύπους αρχείων, όπως για παράδειγμα τα λεγόμενα long sound files. Βασικά, αυτά είναι προεγγεγραμμένα αρχεία ήχου που έχουν αποθηκευτεί σε κάποιον δίσκο και το πρόγραμμα σας επιτρέπει να επιλέξετε ένα μικρό μέρος τους από το συνολικό σήμα για ανάλυση. Με αυτό τον τρόπο, μπορείτε να έχετε αρχεία τα οποία περιέχουν αρκετές ώρες ήχου (εφόσον ο υπολογιστής σας έχει ικανοποιητικό ελεύθερο χώρο στο δίσκο). Σε αυτό το tutorial, θα δούμε αργότερα πως ανοίγουμε και πως επεξεργαζόμαστε μεγάλου τύπου ηχητικά αρχεία. 3.3. Επεξεργασία σήματος (προαιρετικό) Υπάρχουν πολλά πράγματα που μπορείτε να κάνετε σχετικά με την επεξεργασία ενός αντικειμένου ήχου. Μπορείτε να φιλτράρετε το σήμα, να ενισχύσετε κάποια συγκεκριμένη συχνότητα ή κάποιο εύρος συχνοτήτων κτλ. Σε αυτήν την υποενότητα, θα περιγράψουμε μόνο την επιλογή του φιλτραρίσματος στο σήμα. Γενικά, δεν είναι αναγκαίο στο PRAAT, αλλά αν θέλετε να επικεντρωθείτε σε ένα συγκεκριμένο εύρος συχνοτήτων (ή να απαλλαγείτε από μερικές συχνότητες), η επιλογή του φίλτρου είναι ιδιαίτερα χρήσιμη. (1.) Το πρώτο βήμα είναι διαλέξουμε το αρχείο που θέλουμε να επεξεργαστούμε (κάντε απλώς ένα κλικ στο όνομα αρχείου). 2) Για να φιλτράρετε ένα σήμα πρέπει να κάνετε τα ακόλουθα: 2.1. Επιλέξτε Filter (στο δεξί μέρος του παραθύρου Object) -> Filter (formula) 2.2. Αλλάξτε τη φόρμουλα σε χαμηλή ή υψηλή τιμή (σε αυτή τη περίπτωση θα δημιουργήσουμε ένα low pass filter στα 10 Hz και ένα high pass filter στα 5000 Hz): if x<10 or x>5000 then 0 else self fi; rectangular band filter (Σημείωση: το x<10 είναι μια αυθαίρετη χαμηλή τιμή; Εάν το μικρόφωνό σας δεν καταγράφει συχνότητες χαμηλότερες των 100 Hz, θέστε την τιμή στο 100) και κάντε κλικ OK. 2.3. Αυτό θα δημιουργήσει ένα νέο (φιλτραρισμένο) αντικείμενο στη λίστα της μορφής{name}_filt. 3) Αναπαράγεται και τα δύο αρχεία, το αρχικό και το επεξεργασμένο (δοκιμάστε το τώρα). Μπορείτε να ακούστε κάποια διαφορά? 3.4. Ετικέτα για μια κυματομορφή Μερικές φορές μπορεί να είναι χρήσιμο να τεμαχίζεται μια κυματομορφή ομιλίας και να επισυνάπτετε ετικέτες σε κάθε κομμάτι για να επιπλέον επεξεργασία αργότερα. (1.) Επιλέξτε το πρωτότυπο αρχείο ήχου κάνοντας απλώς κλικ στο όνομα του. (2.) Πηγαίνετε στο δεξί μέρος του παραθύρου που λέει Annotate και επιλέξτε το To TextGrid. Αυτό θα οδηγήσει στο να εμφανιστεί το ακόλουθο παράθυρο. 7
(3.) Αλλάξτε τα ονόματα στο πεδίο Tier names για να δώσετε το επίπεδο ή την κατηγορία διαχωρισμού, π.χ., λέξεις, συλλαβές, φωνήματα (να χρησιμοποιείτε πάντα ένα κενό [space] ανάμεσα στα ονόματα). Επομένως, οι ετικέτες που έχει τοποθετήσει ανταποκρίνονται σε κάποιο επίπεδο κατάτμησης και όχι σε συγκεκριμένα αντικείμενα. Βεβαιωθείτε ότι έχετε διαγράψει τα αρχικά ονόματα (Mary John bell), γιατί αυτά δεν θα βγάζουν κανένα νόημα αργότερα. Για την ακριβή κωδικοποίηση των ετικετών των tiers, θα σας δοθεί σε ξεχωριστή ενότητα. Να σημειωθεί μόνο ότι εφόσον οι ομιλητές είναι από δύο και άνω, τότε στα επίπεδα διαχωρισμού καλό είναι να υπάρχει και κάποια κωδικοποίηση των ομιλητών. Το 'Tier names' χρησιμοποιείται για να προσφέρει ετικέτες για διαστήματα ήχου ή για συγκεκριμένα χρονικά σημεία. Οι ετικέτες που εμφανίζονται στο κουτί Point tiers τοποθετούνται αυτόματα σε σημεία, όπου οι ετικέτες που έχουν ονοματοδοθεί από το Tier names έχουν ανατεθεί σε προσωρινά χρονικά διαστήματα π.χ., η διάρκεια των λέξεων σε μια συγκεκριμένη πρόταση. Επειδή εμείς θα επικεντρωθούμε σε interval tiers αυτό το πεδίο, θα το αφήσουμε κενό (σβήστε το bell που υπάρχει). 4) Επιλέξτε και τα δύο αρχεία, το αρχείο ήχου και το Text grid που μόλις δημιουργήσατε (έχουν το ίδιο όνομα) χρησιμοποιώντας το πλήκτρο CTRL (κάντε κλικ στο αρχείο ήχου, κρατώντας πατημένο το CTRL κάντε κλικ στο Text grid). 5) Στο δεξί μέρος του παραθύρου θα εμφανιστεί ένα νέο μενού. Επιλέξτε το Edit και θα εμφανιστεί τότε το ακόλουθο παράθυρο (φυσικά το σήμα του ήχου θα είναι τελείως διαφορετικό, όπως και τα ονόματα των tiers): (9.) Εάν μια πρόταση περιλαμβάνει πολυσύλλαβες λέξεις,,μπορείτε να κάνετε το ίδιο πράγμα με τις λέξεις, μόνο που αυτή τη φορά το tier θα έχει στο όνομά του το syllable 8
και ομοίως, μπορείτε να επαναλάβετε τη διαδικασία και για τρίτο tier για τα φωνήματα κτλ. (10.) Τώρα μπορείτε να κρατήστε και ένα σχέδιο από αυτό το σήμα. Αρχικά επιλέξτε το παράθυρο PRAAT picture. Επιλέξτε το φυσικό μέγεθος της εικόνας που θέλετε να βγάλετε με το να αλλάξετε το επιλεγμένο κομμάτι στο παράθυρο Praat picture (το ροζ ορθογώνιο σχήμα) προτού σχεδιάσετε το γράφημα. Κάντε κλικ στην περιοχή του 'Praat picture (π.χ., στην πάνω αριστερή γωνία) και ενώ κρατάτε πατημένο το αριστερό πλήκτρο του ποντικιού, σύρετέ το μέχρι το σημείο που θέλετε. Τώρα κλείστε το παράθυρο TextGrid, βεβαιωθείτε ότι και τα δύο αρχεία είναι επιλεγμένα (ηχητικό αρχείο + TextGrid) στο κεντρικό παράθυρο PRAAT objects και επιλέξετε το draw από το μενού στο δεξιό μέρος του παραθύρου (μείνετε στις προκαθορισμένες τιμές). Αυτό θα δημιουργήσει μια εικόνα στο παράθυρο PRAAT picture από το ακουστικό σήμα μαζί με τις ετικέτες από κάτω. Εάν θέλετε να δείξετε μόνο το κομμάτι που έχετε σχολιάσει, τότε δημιουργήστε μια καινούργια εικόνα στο συγκεκριμένο παράθυρο και επαναλάβετε τα προηγούμενα βήματα, μόνο που αυτή τη φορά πρέπει να συγκεκριμενοποιήσετε το χρόνο έναρξης και τέλους (σε δευτερόλεπτα) για το σχολιασμένο κομμάτι. Αναλλακτικά, μπορείτε να επαναλάβετε τη διαδικασία επεξεργασίας μόνο για ένα επιλεγμένο κομμάτι του αρχικού σήματος. Αυτή η εικόνα μπορεί να αποθηκευτεί ως αρχείο post-script (.ps) και να εκτυπωθεί με την χρήση του Ghostview ή να εκτυπωθεί απευθείας με τη χρήση του CTRL-P (ή επιλέξτε το print από το file μενού) εφόσον έχετε συνδεμένο κάποιον εκτυπωτή στα Windows. Για να επιλέξτε ένα κομμάτι από το ηχητικό σήμα στο παράθυρο sound object και στη συνέχεια στο μενού file, επιλέξτε τη δυνατότητα extract selection (time zero) αυτό θα δημιουργήσει ένα νέο αρχείο που θα περιέχει το επιλεγμένο κομμάτι και θα βρίσκεται στην αρχική λίστα των αρχείων. Επαναλάβετε την διαδικασία για όσα κομμάτια θέλετε να αποκόψετε ή για να τα δώσετε κάποιες ετικέτες με tiers. 11) Όταν θα έχετε τεμαχίσει το σήμα ήχου (εφόσον είναι απαραίτητο και το επιθυμείτε, μπορείτε έχοντας δημιουργήσει textgrids να εξάγετε κάποιο tier ή και όλα τα tiers ταυτόχρονα. Επιλέξτε αρχικά τα δύο αρχεία, δηλαδή το αρχείο ήχου και textgrid και στη συνέχεια επιλέγετε Extract > Extract intervals where και στο παράθυρο που θα εμφανιστεί επιλέξτε τον αριθμό του tier που επιθυμείτε (εδώ κάθε αριθμός αντιστοιχεί και στο tier ανάλογα με τη σειρά εμφάνισης) και δώστε ένα κομμάτι που θέλετε να εξάγετε, π.χ., "καλημέρα" (μια λέξη που ξέρετε ότι υπάρχει στο συγκεκριμένο tier). Αυτό θα εξάγει το κομμάτι που αντιστοιχεί για τη λέξη καλημέρα από το ηχητικό σήμα και θα το τοποθετήσει στο παράθυρο 'Praat objects ως ένα νέο αντικείμενο. Εάν επιλέξτε Extract all intervals..., όλα τα intervals θα μπουν σε ξεχωριστά αρχεία το καθένα (δοκιμάστε το τώρα). Σημειώστε πως σε αυτή την περίπτωση, ότι ακόμα και τα κενά intervals θα εξαχθούν ως χωριστά αρχεία! Μπορείτε να δείτε το εξαγόμενο σήμα με το να επιλέξτε το αρχείο που επιθυμείτε και στη συνέχεια να κάνετε κλικ στο Edit από το βασικό μενού στο δεξιό μέρος του παραθύρου PRAAT objects, για να το δείτε και να το ακούσετε (δοκιμάστε το). 9
Στο παράθυρο Edit (θα το συζητήσουμε πιο αναλυτικά στην επόμενη ενότητα), μπορείτε να κάνετε επιλογές παρόμοιες με αυτές που δοκιμάσαμε προηγουμένως (χρησιμοποιώντας το ποντίκι κρατώντας το αριστερό πλήκτρο πατημένο). Σε περίπτωση που το παράθυρο μοιάζει να εξαφανίζεται μέρος του στο κάτω μέρος της οθόνης, απλώς επιλέξτε το παράθυρο να είναι πλήρους οθόνης (χρησιμοποιώντας το πλήκτρο πάνω δεξιά). 3.5. Γενική Ανάλυση (Κυματομορφή, Ένταση, Φασματογράφημα, Επιτονισμός, Διάρκεια) Το PRAAT προσφέρει ένα γενικά εξόχως ευέλικτο εργαλείο στην επιλογή Edit... για να οπτικοποιήσετε, να αναπαράγετε και να εξάγετε πληροφορίες από ένα αντικείμενο ήχου. Για κάθε μία από τις ακόλουθες επιλογές θα υπάρξει συζήτηση αργότερα: (1.) Αρχικά, δημιουργήστε ένα καινούργιο αντικείμενο ήχου για ένα επιμηκυμένο /a/. (2.) Επιλέξτε το συγκεκριμένο αντικείμενο ήχου και κάνετε κλικ στο Edit από το κεντρικό μενού στο δεξί μέρος του παραθύρου. Ένα νέο παράθυρο θα εμφανιστεί. Εάν το ηχητικό σήμα σας καταλαμβάνει μόνο ένα μέρος της οθόνης, μεγιστοποιήστε το παράθυρο. Επίσης διαλέξτε το σχετικό κομμάτι (το /α/) από τον ήχου σας και εξάγετε το συγκεκριμένο κομμάτι ως αντικείμενο ήχου στην λίστα των αντικειμένων, όπως έχει ειπωθεί σε προηγούμενη υποενότητα. Τότε κλείστε το παράθυρο Edit, επιλέξτε το εξαγόμενο ηχητικό αντικείμενο και επιλέξτε ξανά edit. (3.) Στο κεντρικό μενού του νέου παραθύρου υπάρχουν οι ακόλουθες επιλογές: File (Αυτό σας επιτρέπει να εξάγετε επιλεγμένα κομμάτια με διαφορετικούς τρόπους, να ανοίξετε ένα αρχείο script κτλ.) Edit (αυτό σας επιτρέπει να αντιγράψτε ή να επικολλήστε μέρος του σήματος κτλ.) Query (αυτό σας επιτρέπει να πάρετε πληροφορίες για τη θέση του κέρσορα, τα όρια επιλογής, να καθορίσετε τις ρυθμίσεις για τα logs και τις αναφορές κτλ.) View (αυτό σας επιτρέπει να επιλέξετε το περιεχόμενο του παραθύρου (σπεκτογράφημα, ένταση) και τις ρυθμίσεις για την επιλογή του ζουμ) Select (αυτό σας επιτρέπει να ελέγξετε τις επιλογές του κέρσορα) Spectrum (Αυτό σας επιτρέπει να ελέγξετε τις ρυθμίσεις του σπεκτογραφήματος και τις σχετικές πληροφορίες, τις τιμές συχνότητας σημειώνονται στο αριστερό κομμάτι) Pitch (αυτό σας επιτρέπει να ελέγξετε τον επιτονισμό [pitch], τις ρυθμίσεις του και τις πληροφορίες τους είναι προκαθορισμένο το pitch να δείχνεται με μια έντονα μπλε γραμμή και η τιμή της στη θέση του κέρσορα είναι δοσμένη στο δεξί μέρος της οθόνης σε σκούρα μπλε γραμματοσειρά) Intensity (αυτό σας επιτρέπει να αλλάξετε τις ρυθμίσεις της έντασης του σήματος και εξάγετε τις πληροφορίες της είναι προκαθορισμένο το σήμα της έντασης να δείχνετε με μια κίτρινη έντονη γραμμή και η τιμή της είναι δοσμένη στο δεξί μέρος της οθόνης με ανοιχτή πράσινη γραμματοσειρά) Formant (αυτό σας επιτρέπει να ρυθμίσετε τις επιλογές των formants και να εξάγετε τις πληροφορίες τους είναι προκαθορισμένο τα formants να δείχνονται με κόκκινες διακεκομμένες γραμμές). Το μέγεθος παραθύρου που παρουσιάζει τις τιμές των formants μπορεί να δοθεί από την επιλογή Formant settings... (θέστε το maximum duration (s) σε μια ικανοποιητική τιμή). Pulses (αυτό σας επιτρέπει να ρυθμίσετε τα pulses (απαραίτητα για την ανάλυση του επιτονισμού) και να εξάγετε συγκεκριμένες πληροφορίες σχετικά με παραμέτρους της φωνής, όπως τρεμούλιασμα τα pulses δίνονται στο πάνω μέρος της οθόνης με έντονες σκούρες μπλε κάθετες γραμμές) 10
(4.) Το ακόλουθο παράθυρο δείχνει πως δείχνει το σήμα ενός τονισμένου /e/ ήχου: Εάν επιλέξετε ένα μικρό κομμάτι του σήματος (με το συνήθη τρόπο), ζουμάρετε (κάντε κλικ στο κουμπί sel στην κάτω αριστερή γωνία) και έτσι θα δείτε περισσότερες λεπτομέρειες του σήματος (δοκιμάστε το τώρα). Με την επιλογή out προφανώς το πρόγραμμα ξεζουμάρει από το σήμα σας, ενώ με το κουμπί all σας δίνεται η επιλογή να δείτε όλο το σήμα στην οθόνη σας (δοκιμάστε τώρα). (7.) Εάν κάνετε κλικ σε μια συγκεκριμένη θέση του σήματος, θα δείτε τότε τον χρονικό σημείο του να αναπαρίσταται στη θέση του κέρσορα, όπως επίσης σας δίνετε η δυνατότητα να εξάγετε πληροφορίες σχετικά με τον επιτονισμό, την ένταση, τις αρμονικές (formants) και τις τιμές των jitter/shimmer. Για παράδειγμα, τοποθετήστε τον κέρσορα στο μέσον ενός φωνήεντος και κάνετε τα ακόλουθα: Αρχικά βεβαιωθείτε ότι το επιλεγμένο τμήμα είναι μικρότερα από 10 δετερόλεπτα. Πηγαίνετε στο μενού Pitch και επιλέξετε το Get pitch (το πλήκτρο F5 είναι η συντόμευσή του). Μια τιμή της τρέχουσας θέσης του επιτονισμού θα παρουσιαστεί σε ξεχωριστό παράθυρο. Πηγαίνετε στο μενού Intensity και επιλέξετε το Get intensity (ή τη συντόμευση του F8). Η τιμή της τρέχουσας έντασης θα παρουσιαστεί σε ξεχωριστό παράθυρο. Πηγαίνετε στο μενού Formant και επιλέξετε το Get first formant (το F1 είναι η συντόμευσή του). Η τρέχουσα τιμή του θα εμφανιστεί σε ξεχωριστό παράθυρο. Κάνετε το ίδιο και τις υπόλοιπες αρμονικές, δηλαδή για το δεύτερο formant (F2), για το τρίτο formant (F3) και για το τέταρτο formant (F4). Είναι επίσης πιθανόν να πάρετε και μια συνολική λίστα όλων των τιμών των formants από το επιλεγμένο κομμάτι του σήματος με την επιλογή formant listing από το μενού Formant. Εάν επιλέξετε ένα κομμάτι από το σήμα και όχι 11
ένα συγκεκριμένο σημείο, τότε η αναφορά των formants θα περιλαμβάνει μια μακρά λίστα των τιμών που περιλαμβάνει το συγκεκριμένο κομμάτι. (8.) Όλες οι τιμές μπορούν να αποθηκευτούν σε ένα αρχείο που κρατάει ημερολόγιο κάτω από το μενού του Query. Ωστόσο, αυτή η επιλογή δεν θα συζητηθεί περαιτέρω μιας και μπορείτε να βρείτε αναλυτικότερες πληροφορίες στο εγχειρίδιο που περιλαμβάνει το PRAAT (αναζήτηση για τα log files ). (Δοκιμάστε διάφορες επιλογές για την εξαγωγή πληροφοριών από διαφορετικά σημεία του σήματος και σύγκριση υπάρχει διαφοροποίηση γιατί;;;). (9.) Οι ρυθμίσεις για καθένα από τα σήματα (φασματογράφημα, formants, επιτονισμός & ένταση) μπορούν να αλλαχθούν από τις επιλογές του αντίστοιχου μενού όπως αυτό υποδηλώνεται στο πάνω μέρος του παραθύρου. Γενικά, αν δεν υπάρχει συγκεκριμένος λόγος για αλλαγή των προκαθορισμένων τιμών των ρυθμίσεων, μην τις πειράζετε! Εντούτοις, εάν επιθυμείτε να αλλάξετε συγκεκριμένες τιμές και επιλογές, όπως την απεικόνιση ενός μονοδιάστατου φασματογραφήματος, εκεί θα βρείτε την επιλογή αυτή. Για παράδειγμα, ένα στενής ζώνης φασματογράφημα μπορεί να δημιουργηθεί ως εξής: Επιλέξτε από το μενού Spectrum την επιλογή Spectrogram settings. Για μια συνηθισμένη επιλογή ευρείας μπάντας (για τις ανδρικές φωνές) των 300 Hz αλλαξτε την τιμή του Window length box σε 0.0043. Για μια επιλογή περιορισμένης μπάντας (43 Hz) αλλάξτε την τιμή σε 0.03. Δοκιμάστε και τις δύο επιλογές και δείτε τις διαφορές (δοκιμάστε το τώρα) συγκρίνετέ το με την προκαθορισμένη τιμή που είναι το 0.005 (260 Hz). Περισσότερες πληροφορίες για αυτές τις επιλογές θα βρείτε στο μενού της βοήθειας για τις ρυθμίσεις του φασματογραφήματος, όπως και σε επόμενη ενότητα (7.4). Επιπλέον υπάρχουν και οι Advanced spectrogram settings, αλλά είναι για έμπειρους χρήστες και για αυτό είναι προτιμότερο να μην αλλαχθούν αυτές οι τιμές. (10.) Επιπροσθέτως για τις πληροφορίες που συζητήσαμε παραπάνω, το παράθυρο επεξεργασίας μας επιτρέπει να κάνουμε ακριβείς χρονικές μετρήσεις, π.χ. ο καθορισμός του Voice Onset Time (VOT) για λέξεις όπως το /cε/. Μπορείτε να κάνετε τα ακόλουθα: Δημιουργήστε μια ηχογράφηση επαναλαμβάνοντας το «και» /cε/ τρεις φορές ή αναζητήστε σε ηχογραφημένο αρχείο 3 διαφορετικά «και». Επιλέξτε το αρχείο που θέλετε να επεξεργαστείτε και επιλέξτε το Edit από το κεντρικό μενού στα δεξιά. Συνιστάται να ζουμάρετε στην λέξη που θέλουμε να εξετάσουμε με την επιλογή selection (επιλέξτε το κομμάτι του σήματος που επιθυμείτε και έπειτα κάντε κλικ στο κουμπί sel από την κάτω αριστερή γωνία του παραθύρου). Επιλέξτε το ενδιάμεσο κομμάτι από την αρχή έκρηξης του /c/ μέχρι το σημείο έναρξης του φωνήεντος /ε/. Αυτό το κομμάτι είναι το VOT (δοκιμάστε το τώρα). Η διάρκεια του κομματιού (σε δευτερόλεπτα [sec]) σημειώνεται από πάνω και από κάτω από το επιλεγμένο μέρος του σήματος (αυτής της ροζ επιλεγμένης περιοχής). Παρακαλώ σημειώσετε ότι για την ακριβή τοποθέτηση των ορίων, το αριστερό και δεξί μέρος του επιλεγμένου κομματιού (που καθορίζεται από τις διακεκομμένες γραμμές) τοποθετείται ακριβώς στο σημείο που κάνατε το αρχικό κλικ με το ποντίκι και εκεί που κάνατε το τελικό. Εάν επιθυμείτε, μπορείτε από το μενού του Select και μετακινήστε την αρχή ή το τέλος του επιλεγμένου κομματιού στο πλησιέστερο zero crossing σημείο. Αυτό θα σας δώσει ένα σταθερό onset και offset σημείο πλησίον του επιλεγμένου κομματιού σας. 3.6. Χρήση ορίων για σχολιασμό στα tiers 12
Το PRAAT προσφέρει τη δυνατότητα να τοποθετήσετε όρια σε διάφορα σημεία του ηχητικού σήματος και αυτά να καταχωρηθούν στα tiers του αρχείου TextGrid. Για να το επιτύχουμε αυτό θα πρέπει να κάνουμε τα ακόλουθα βήματα: (1.) Αρχικά επιλέξτε το αρχείο ήχου από το παράθυρο Praat Objects που βρίσκεται στη λίστα και από το κεντρικό μενού στο δεξιά επιλέξτε Annotate > To TextGrid. (2.) Στο νέο παράθυρο που ανοίγει δώστε τα κατάλληλα ονόματα ανάλογα με το τι θέλετε να περιέχουν τα tiers σας. Για περισσότερα δείτε στην ενότητα 3.4. (3.) Επιλέξτε και τα δύο αρχεία (αρχείου ήχου και αρχείο TextGrid) και από κεντρικό μενού κάντε κλικ στο Edit. (4.) Στο παράθυρο επεξεργασίας ήχου που έχετε πλέον μπροστά σας βλέπετε την κυματομορφή του ήχου και τα tiers που δημιουργήσατε. Για να τοποθετήστε κάποιο όριο κάντε ένα κλικ στο σημείο που θέλετε στην κυματομορφή ή στο φασματογράφημα (όχι μέσα στα tiers, γιατί τότε θα επιλεγεί όλο το παράθυρο και θα γίνει ροζ). Τότε θα υπάρχει μια κόκκινη διακεκομμένη γραμμή στο σημείο της κυματομορφής (/φασματογραφήματος) και γκρι με κύκλους στην κορυφή σε κάθε tier, όπως στην ακόλουθη εικόνα: (5.) Κάντε κλικ μέσα στον κύκλο του αντίστοιχου tier που θέλετε να τοποθετήσετε το όριο. Τότε το γκρι κομμάτι της γραμμής θα γίνει κόκκινο (με μπλε χρώμα είναι τα όρια που δεν είναι ενεργά ή επιλεγμένα). (6.) Για να μετακινήσετε κάποιο όριο προς δεξιά ή αριστερά, κάντε κλικ πάνω του (μέσα στο tier) και κρατώντας πατημένο το αριστερό κουμπί του ποντικιού, το μετακινείτε προς το σημείο που θέλετε να τοποθετηθεί και εκεί αφήνετε το κουμπί. (7.) Για να διαγράψετε ένα όριο, κάνετε κλικ επάνω του και στη συνέχεια έχετε δύο επιλογές. Είτε να το σβήσετε μέσω του νέου μενού Boundary που εμφανίστηκε στο πάνω μέρος του παραθύρου με την εντολή Remove, είτε να το διαγράψετε με τη συντόμευση ALT+BACKSPACE. (8.) Κάνοντας κλικ μέσα σε ένα tier ανάμεσα σε δύο όριο, τότε αυτομάτως το κομμάτι αυτό θεωρείται επιλεγμένο και μπορείτε να πληκτρολογήσετε οποιοδήποτε κείμενο θέλετε. Σε αυτό μπορείτε να επανέρθετε ανά πάσα στιγμή και να γράψετε κάτι επιπλέον, να διαγράψετε και να διορθώσετε. (9.) Προσοχή: είναι πολύ σημαντικό κατά τη διάρκεια της ενασχόλησης με το PRAAT να αποθηκεύουμε συχνά την δουλειά που κάνουμε. Για το TextGrid επιλέγουμε από το μενού File και στη συνέχεια Write TextGrid to Text File ή αλλιώς η συντόμευση CTRL+S. 13
4. Ανάλυση φωνής και ηχηρότητας Μια επιλογή που ενδιαφέρει πρωτίστως του κλινικούς φωνητικούς ή λογοθεραπευτές που δουλεύουν με ασθενείς με προβλήματα φωνής είναι το μενού Pulses. Το μενού περιέχει έναν αριθμό από μετρήσεις που παραμετροποιούν τις μη κανονικότητες στη διάρκεια (jitter) και το εύρος (shimmer) των ατομικών κύκλων (είναι μαρκαρισμένες με μπλε puls γραμμές στην κυματομορφή του παραθύρου Edit ) στα ηχηρά. Ωστόσο, πρέπει να ξέρετε ότι οι προκαθορισμένες ρυθμίσεις για την ανάλυση επιτονισμού (δείτε Pitch settings... από το μενού Pitch στο παράθυρο επεξεργασίας σήματος) έχουν βελτιστοποιηθεί για την έρευνα της επιτόνισης. Στην επιλογή Advanced pitch settings, μπορείτε να αλλάξετε τις τιμές για τις αναλύσεις επιτονισμού που είναι πιο κατάλληλες για την ανάλυση ηχηρότητας. Σε παλαιότερες εκδόσεις του Praat (έως v.4.1) επισημαίνονταν να μην γίνουν αλλαγές στο silence threshold και στο octave jump cost, αλλά μόνο να αλλαχθεί η έκταση του επιτονισμού (pitch range) από την επιλογή Pitch settings.... Το προκαθορισμένο εύρος για την ανάλυση επιτονισμού είναι 75-600 Hz, αλλά για φωνές με παθολογικά προβλήματα θα πρέπει να μεγαλώσετε την έκταση για να συμπεριλάβετε χαμηλές συχνότητες (π.χ. 50 Hz) για τις ανδρικές φωνές. Για να δούμε την χρήση της ανάλυσης ηχηρότητας θα δοκιμάσουμε τα ακόλουθα: (1.) Δοκιμάζουμε έναν ήχου που έχει διάρκεια, όπως ένα παρατεταμένο /a/ (6 δευτερόλεπτα ή περισσότερο). (2.) Επιλέξτε το αρχείο που περιέχει τον συγκεκριμένο ήχο και έπειτα Edit από το κεντρικό μενού στα δεξιά. (3.) Στο παράθυρο Edit, επιλέξτε ένα σταθερό κομμάτι από το κέντρο του φωνήεντος (± 4 δευτερόλεπτα) και εξάγετε το συγκεκριμένο κομμάτι ως ξεχωριστό αρχείο (για να γίνει αυτό πηγαίνετε στο File -> Extract selection). (4.) Κλείστε το παράθυρο Edit και επιλέξτε το καινούργιο ξεχωριστό αρχείο που δημιουργήσαμε από τη λίστα στο κεντρικό παράθυρο του Praat και επιλέξετε το Edit από το κεντρικό μενού στα δεξιά. Βεβαιωθείτε ότι οι ρυθμίσεις για το pitch παραμένουν οι προκαθορισμένες από το πρόγραμμα. (5.) Ένα από τα πρώτα πράγματα που μπορείτε να κάνετε είναι στο μενού Pitch και να επιλέξετε το extract the visible pitch contour. Αυτό θα δημιουργήσει ένα αντικείμενο επιτονισμού (Pitch object) στη λίστα αρχείων στο παράθυρο Praat objects. Επιλέξτε το συγκεκριμένο αντικείμενο από τη λίστα (έχει το όνομα Pitch untitled, εκτός αν είχατε δώσει τον ξεχωριστό αρχείο κάποιο όνομα). (6.) Κάντε κλικ στο κουμπί Info στο κεντρικό μενού (στο κάτω μέρος του παραθύρου Praat Objects) και ένα ξεχωριστό παράθυρο θα ανοίξει που περιέχει διάφορες πληροφορίες για την παραγωγή του συγκεκριμένου φωνήεντος σχετικά με διαφοροποιήσεις του επιτονισμού και άλλα συναφή (τα πιο κοινά σε χρήση είναι αυτά που σημειώνονται με το βέλος): 14
(7.) Το median, το 10-90% spread στο the median, το range, το average και standard deviation είναι τιμές μπορούν να σας δώσουν πληροφορίες σχετικά με στιγμές της κατανομής (για να γίνουν πιο κατανοητές αυτές οι τιμές καταφύγετε σε βιβλία στατιστικής). Οι τιμές δίδονται σε διαφορετικά συστήματα μέτρησης (Hertz [Hz], Mel, Semitones και ERB). Για γενικούς χρήστες, τα Hertz είναι εντάξει για τη δουλειά τους, αλλά αν ενδιαφέρεστε να μάθετε περισσότερα για αυτές τις μονάδες, μια καλή εισαγωγή στο διαδίκτυο με links μπορείτε να βρείτε στην ακόλουθη διεύθυνση: (και τα δύο είναι γραμμένα στην αγγλική γλώσσα) www.ling.ed.ac.uk/~bert/leipzig.ppt και http://en.wikipedia.org/wiki/psychoacoustics (8.) Η μέτρηση στο πάνω μέρος του παραθύρου (number of frames) μας δίνει δύο τιμές: τον αριθμό των frames και τον αριθμό των ηχηρών frames. Όπως μπορείτε να δείτε σε αυτή τη περίπτωση, η διαφορά είναι μηδενική. Ωστόσο, σε παθολογικές περιπτώσεις φωνών θα πρέπει να υπάρχει διαφθορά ηχηρότητας (voice interruptions) μιας και οι ασθενείς δεν μπορούν να χρησιμοποιήσουν παρατεταμένα την ηχηρότητα, π.χ., στην σπασμωδική δυσφωνία και σε αυτές τις περιπτώσεις αυτοί οι δύο αριθμοί θα είναι διαφορετικοί. Οποιαδήποτε πληροφορία αυτού του παραθύρου μπορεί να επιλεγεί με τη χρήση του ποντικιού όντας ένα απλό αρχείο κειμένου και να αντιγραφεί σε έναν επεξεργαστή κειμένου για μελλοντική χρήση και αναφορά. (9.) Επιστρέφοντας στο παράθυρο επεξεργασίας του Praat, μπορείτε να βρείτε έξτρα τιμές αξιολόγησης ηχηρότητας στο μενού Pulses. Πιο συγκεκριμένα, αυτό το μενού δίνει τη δυνατότητα για τιμές σχετικά με jitter (διακυμάνσεις στον επιτονισμό/ στη συχνότητα) και shimmer (ακανόνιστες αλλαγές στην ένταση). Μια πολύ χρήση γενική ανάλυση διάφορων μετρήσεων ηχηρότητας μπορούν να συλλεχθούν από την επιλογή voice report από το μενού pulses στο παράθυρο Edit. Για να πραγματοποιηθεί αυτή η αναφορά θα πρέπει να έχετε επιλέξει ένα μέρος του σήματος. Ένα παράδειγμα αυτής αναφοράς είναι στην ακόλουθη εικόνα από την λέξη «καταφανής». 15
(10.) Μια αναλυτική περιγραφή για τις διάφορες παραμέτρους και τον τρόπο με τον οποίο μετριούνται μπορείτε να το βρείτε στο κομμάτι Voice section στο βασικό εγχειρίδιο του PRAAT. Για να διαβάσετε περισσότερες πληροφορίες σχετικά με τις τιμές των jitter and shimmer υπάρχει ένα κατατοπιστικό βιβλίο Baken, R.J., & Orlikoff, R.F. (2000), Clinical Measurement of Speech and Voice. San Diego: Singular Publishing Group, Inc.). Μια απλή αναφορά θα βρείτε στα ακόλουθα με αντιστοιχίσεις στις σελίδες του βιβλίου: Jitter (local) => see jitter ratio (but without the multiplication by 1000) on p. 201-202 Jitter (local, absolute) => as jitter ratio but without division by average period duration Jitter (rap) => see relative average perturbation on p.203-205 and table 6-34 on p. 208 Jitter (ppq5) => similar to jitter (rap) but with 5-point (as opposed to 3-point) estimate Jitter (ddp) => original PRAAT jitter measure, which equals 3 times jitter (rap) Shimmer (local) => see p. 133 but this is the non-db version! Shimmer (local, db) => see p. 133-134 and table 5-22. Shimmer (apq3) => see p. 134-135 (APQ) and table 5-23 (but read carefully the comments in Baken & Orlikoff as the values cannot be directly compared to the data generated in Praat) Shimmer (apq5) => see shimmer (apq3); the 5-point window size is preferred by some (see B & O, p. 135). Shimmer (apq11) => see shimmer (apq3); this is the original APQ measure suggested by Takahashi & Koike (see p. 134, B & O). Shimmer (ddp) => original Praat shimmer measures; 3 times the value of shimmer (apq3) 5. Φασματογραφική ανάλυση (προαιρετικό) Επιπροσθέτως από την βασική επιλογή στο μενού Edit, η οποία είναι επαρκής για τους περισσότερους χρήστες του PRAAT, μπορείτε να ζητήσετε επιπλέον επιλογές στην 16
φασματογραφική ανάλυση του PRAAT. Σε αυτή την ενότητα θα παρουσιαστεί ο συγκεκριμένος τρόπος: 1.) Μπορείτε να επιλέξετε το αρχείο που κάποιο τονισμένο ή άτονο φωνήεν. 2.) Επιλέξτε το Spectrum από το κεντρικό μενού (στο δεξί μέρος του παραθύρου). 3.) Επιλέξτε το To Spectrogram από το μενού Spectrum και θα εμφανιστεί το ακόλουθο παράθυρο: 4.) Δεν χρειάζεται να ασχοληθείτε με τις παραμέτρους του Time step (s) ή του Frequency step (Hz) (είναι για προχωρημένους χρήστες) και κρατήστε τις προκαθορισμένες τιμές. Επίσης, αφήστε την επιλογή του Window shape στο Gaussian. Ωστόσο, Ωστόσο αλλάξτε την τιμή του Maximum frequency (Hz) της Nyquist-συχνότητας του αντικειμένου ήχου. 5.) Επιπροσθέτως, μπορείτε να αλλάξετε την τιμή παραμέτρου Analysis width (s) μιας και αυτή καθορίζει το εύρος της ανάλυσής σας (όπως έχει ήδη σε προηγούμενη ενότητα). Για να επαναλάβουμε ένας απλός κανόνας μνήμης για τις τιμές είναι: Wide-band = 300 Hz = 0.0043 seconds Narrow band = 43 Hz = 0.03 seconds Η προκαθορισμένη τιμή είναι 0.005 seconds (περίπου για 260 Hz) Δοκιμάστε τις διάφορες τιμές για να δείτε τις διαφοροποιήσεις. 6.) Με στόχο να πάρετε συγκεκριμένες τιμές στα formats, καθορίστε ένα συγκεκριμένο σημείο χρόνου από το οποίο θέλετε να λάβετε τις τιμές. 7.) Κλείστε το παράθυρο του φασματογραφήματος και επιλέξτε από το κεντρικό μενού στα δεξιά σας την επιλογή Spectrum > To Spectrum.... Συγκεκριμενοποιήστε την χρονική στιγμή που θέλετε σε δευτερόλεπτα και κάντε κλικ στο OK. Τώρα θα εμφανιστεί ένα καινούργιο αντικείμενο στην λίστα αντικειμένου του αρχικού παραθύρου με όνομα Spectrum_{name}. 8.) Επιλέξτε το αντικείμενο και έπειτα κάντε κλικ στην επιλογή Edit από το κεντρικό μενού. Αυτό θα σας εμφανίσει ένα παράθυρο που θα μοιάζει με αυτό: 17
9.) Ο κέρσορας μπορεί να μεταφερθεί σε οποιαδήποτε σημείο του φάσματος (σε αυτή την περίπτωση απλώς τοποθετήστε τον στην δεύτερη βασική κορυφή, δηλαδή στην δεύτερη αρμονική) και η αντίστοιχη τιμή του format μπορεί να διαβαστεί στην κορυφή του παραθύρου (ο οριζόντιος κέρσορας μας δηλώνει την τιμή της έντασης db για τη συγκεκριμένη συχνότητα). 10.) Εάν συγκρίνετε τα αποτελέσματα από το φάσμα με εκείνα τα αντίστοιχα του παραθύρου Edit (δείτε πως σε προηγούμενη ενότητα) μπορείτε να παρατηρήσετε ότι για ένα φωνήεν, όπως για παράδειγμα για το /a/ η F1 και F2 δεν διαφοροποιούνται ιδιαίτερα και εύκολα στο φάσμα. Έτσι, υπό αυτή την έννοια, το φάσμα είναι λιγότερο ακριβές από το παράθυρο Edit για την εξακρίβωση των formats. 11.) Υπάρχει ένας άλλος τρόπος για να πάρετε περισσότερες πληροφορίες σχετικά με τις τιμές των συχνοτήτων συντονισμού και το εύρος τους: Κλείστε το παράθυρο του φάσματος. Επιλέξτε το ίδιο φωνήεν που δοκιμάσουμε προηγουμένως, π.χ. το /a/. Από το κεντρικό μενού επιλέξτε το Formants & LPC. Επιλέξτε To Formant (burg)... και θα εμφανιστεί το ακόλουθο παράθυρο. 18