ΕΓΧΕΙΡΙ ΙΟ ΒΑΣΙΚΩΝ ΛΕΙΤΟΥΡΓΙΩΝ ΓΙΑ ΤΟ ΠΡΟΓΡΑΜΜΑ PRAAT ΕΙΣΑΓΩΓΗ Το Praat είναι ένα εργαλείο για ανάλυση και επεξεργασία ηχητικών αρχείων, το οποίο διατίθεται δωρεάν. ηµιουργήθηκε από τους Paul Boersma (paul.boersma@uva.nl) και David Weenink (David.Weenink@uva.nl), οι οποίοι υπάγονται στο Ινστιτούτο Φωνητικής Επιστήµης του Πανεπιστηµίου του Amsterdam (www.fon.hum.uva.nl). Η ιστοσελίδα για την προµήθεια του προγράµµατος και την υποστήριξη είναι http://www.fon.hum.uva.nl/praat/. Το Praat προσφέρει ένα ευρύ φάσµα τυπικών και µη τυπικών διαδικασιών, µεταξύ των οποίων φασµατογραφική ανάλυση, αρθρωτική σύνθεση και νευρωνικά δίκτυα. Το εγχειρίδιο αυτό αναφέρεται στις βασικές λειτουργίες του PRAAT και δηµιουργήθηκε σαν οδηγός για να καλύψει τις ανάγκες των φοιτητών στο Εργαστήριο Φωνητικής και Υπολογιστικής Γλωσσολογίας του Πανεπιστήµίου Αθηνών. Τα θέµατα που επιχειρεί να καλύψει αφορούν στους εξής τοµείς: 1. ηµιουργία ενός ήχου - Αποθήκευση. 2. Επεξεργασία σήµατος. 3. Επισηµείωση του ήχου. 4. Γενική Ανάλυση του ήχου (κυµατοµορφή, φασµατογράφηµα, επιτονισµός, ένταση, διάρκεια, διαµορφωτές). Το θεωρητικό υπόβαθρο για τα παραπάνω θέµατα διδάσκεται στους προπτυχιακούς φοιτητές του Τµήµατος Φιλολογίας του Πανεπιστηµίου Αθηνών. 1
ΒΑΣΙΚΕΣ ΛΕΙΤΟΥΡΓΙΕΣ Ανοίγοντας το Praat, εµφανίζονται δύο παράθυρα, το praat picture και το praat objects. Αρχικά κλείνουµε το praat picture και εργαζόµαστε µόνο στο praat objects. Λίστα αντικειµένων ΗΧΟΓΡΑΦΗΣΗ Για να ξεκινήσουµε µία νέα ηχογράφηση στο Praat, επιλέγουµε από το µενού New Record mono Sound και µας εµφανίζεται το παράθυρο ηχογράφησης του Praat. 2
Προσοχή: εάν δεν έχετε δώσει όνοµα σε µία ηχογράφηση και δεν έχετε κάνει save to list, η ηχογράφησή σας θα χαθεί µε την έναρξη µιας καινούργιας. 3
Μόλις εµφανιστεί η ηχογράφηση στο παράθυρο του Praat, ενεργοποιούνται πέντε κουµπιά στο κάτω µέρος του παραθύρου, µε τις εξής λειτουργίες: Μετονοµασία αντικειµένου (Rename) ηµιουργία αντιγράφου αντικειµένου (Copy) ιαγραφή αντικειµένου (Remove) Γενικές πληροφορίες για το αρχείο (Info) Επισκόπηση εσωτερικών δεδοµένων ενός αντικειµένου (Inspect). Στο δεξί µέρος του παραθύρου εµφανίζεται άλλη µία οµάδα κουµπιών µε τις εξής λειτουργίες: Sound Help: Η βοήθεια του Praat. Edit: Ανοίγει ένα νέο παράθυρο µε διάφορες αναλύσεις για τον ήχο (αναλυτικότερα σε επόµενο κεφάλαιο). Play: Αναπαραγωγή του ήχου. 4
Draw: Ανοίγει το παράθυρο Praat Picture, όπου µπορούµε να επεξεργαστούµε τα γραφήµατα του ήχου. Query: Παρέχει διάφορες πληροφορίες για την ηχογράφηση, όπως η διάρκεια κ.λπ. Modify: Επιτρέπει πράξεις, όπως η αντιστροφή του ήχου, αύξηση της έντασης του ήχου και άλλα πολλά. Annotate: ηµιουργεί επισηµειώσεις στον ήχο. (Γίνεται αναλυτικότερη αναφορά παρακάτω). Οι επόµενες οµάδες δεν χρησιµοποιούνται στα πλαίσια των προπτυχιακών εργασιών. Θα αναφέρουµε επιγραµµατικά τις λειτουργίες τους: Στην οµάδα εργαλείων Analyze µπορούν να δηµιουργήσουµε από τον ήχο µας νέα διαφορετικά αντικείµενα. Στην οµάδα Manipulation µπορούµε να «πειράξουµε» τον ήχο (π.χ. να επέµβουµε στον επιτονισµό). Στην οµάδα Synthesize µπορούµε να µετατρέψουµε τον ήχο σε µονοφωνικό ή στερεοφωνικό, να αποµονώσουµε κανάλια ήχου, να χρησιµοποιήσουµε φίλτρα και να «παντρέψουµε» ήχους. Μετά τη διαδικασία της ηχογράφησης, ο ήχος µας εµφανίζεται πλέον στην λίστα αντικειµένων του Praat και προς το παρόν είναι αποθηκευµένος µόνο στη προσωρινή µνήµη του προγράµµατος. Αυτό θα έχει σαν αποτέλεσµα να χάσουµε τον ήχο µόλις κλείσουµε το πρόγραµµα. Για οριστική αποθήκευση του ήχου, επιλέγουµε από το µενού Write To wav file και αποθηκεύουµε τον ήχο µας και στον υπολογιστή. Για να ανοίξουµε έναν ήχο από το Praat, επιλέγουµε στο µενού Read Read from file. 5
ΑΝΑΛΥΣΗ ΚΑΙ ΜΕΛΕΤΗ ΗΧΟΥ (EDIT) Στο Praat από το κουµπί Edit µπορούµε να έχουµε µία οπτική αναπαράσταση του ήχου και να πάρουµε πληροφορίες πάνω σε διάφορα χαρακτηριστικά. Υπάρχουν δύο κύρια µέρη στο παράθυρο αυτό, η κυµατοµορφή µε τους παλµούς στο επάνω µέρος και το φασµατογράφηµα, η ένταση, ο επιτονισµός και οι διαµορφωτές στο κάτω µέρος. Ο οριζόντιος άξονας µας δίνει πληροφορίες για το χρόνο (διάρκεια κ.λπ). Ο αριστερός κάθετος άξονας µας δίνει πληροφορίες για την ακουστότητα, ενώ ο δεξιός κάθετος άξονας µας δίνει πληροφορίες για τη συχνότητα του επιτονισµού και το εύρος της έντασης. Αναλυτικότερα: Κυµατοµορφή Κυµατοµορφή µε παλµούς (pulses) Από το µενού Pulses µπορούµε να ρυθµίσουµε επιλογές, καθώς και αν θα φαίνεται ή όχι. Φασµατογράφηµα (spectrogram) Από το µενού Spectrum µπορούµε να ρυθµίσουµε επιλογές, καθώς και αν θα φαίνεται ή όχι. Επιτονισµός ύψος φωνής (pitch) Από το µενού Pitch µπορούµε να ρυθµίσουµε επιλογές,καθώς και αν θα φαίνεται ή όχι. ιαµορφωτές (formants) Από το µενού Formants µπορούµε να ρυθµίσουµε επιλογές, καθώς και αν θα φαίνεται ή όχι. Ένταση (intensity) Από το µενού Intensity µπορούµε να ρυθµίσουµε επιλογές, καθώς και αν θα φαίνεται ή όχι. 6
Οι τρεις ράβδοι κάτω από τις αναλύσεις λειτουργούν σαν κουµπιά αναπαραγωγής. Αριθµοί (εκφράζουν τη διάρκεια): Αναπαράγουν τις περιοχές στις οποίες είναι χωρισµένη η ηχογράφησή µας. (π.χ. 1,06: αναπαραγωγή της περιοχής πριν την επιλογή, 0,40 αναπαραγωγή της επιλεγµένης περιοχής (αχνό ροζ), 1,16 αναπαραγωγή της περιοχής µετά την επιλογή). Visible Part: Αναπαράγει το κοµµάτι της ηχογράφησης που βλέπουµε (στις περιπτώσεις που έχουµε κάνει zoom in) Total duration: Αναπαράγει όλη την ηχογράφηση. Στο κάτω αριστερά µέρος του παραθύρου ανάλυσης του ήχου εµφανίζονται τα εξής κουµπιά: all -- εµφανίζει όλη την ηχογράφηση in -- κάνει αυτόµατο zoom in out -- κάνει αυτόµατο zoom out sel -- εµφανίζει µόνο την επιλεγµένη περιοχή. 7
Στο γραφικό αυτό περιβάλλον του ήχου, εµφανίζονται πληροφορίες για το επιλεγµένο σηµείο (όπου κάναµε κλικ). Στα αριστερά εµφανίζεται η συχνότητα σε Hz (κόκκινή γραµµατοσειρά) frequency. Αυτή η τιµή εµφανίζεται µόνο αν έχουµε show στο φασµατογράφηµα ή στους διαµορφωτές. Στα δεξιά, µε µπλε γραµµατοσειρά, εµφανίζεται η συχνότητα του επιτονισµού, καθώς και το εύρος του επιτονισµού (min max). Στα δεξιά, επίσης, µε πράσινη γραµµατοσειρά, εµφανίζεται η τιµή της έντασης. Ανάλυση του µενού του sound editor File: Επιτρέπει την εξαγωγή επιλεγµένων τµηµάτων σε λίστα αντικειµένων ή σε άλλο αρχείο. Edit: Το γνωστό κουµπί για αντιγραφή-αποκοπή-επικόλληση κοµµατιών του ήχου. Κάνει επίσης αντιστροφή του ήχου. Query: Παίρνουµε διάφορες πληροφορίες για το επιλεγµένο σηµείο και µπορούµε να δηµιουργήσουνε txt αρχεία µε αυτές τις πληροφορίες. View: Μπορούµε να επιλέξουµε τι πληροφορίες θα εµφανίζονται στο γραφικό µας (View Show analyses), να αναπαράγουµε τον ήχο µας καθώς και να κάνουµε zoom. Select: Μενού για επιλογή σηµείου ή και περιοχής. Spectrum: Μπορούµε να ρυθµίσουµε επιλογές για το φασµατογράφηµα, καθώς και αν θα φαίνεται ή όχι. Pitch: Μπορούµε να ρυθµίσουµε επιλογές για τον επιτονισµό, καθώς και αν θα φαίνεται ή όχι. Επιλέγοντας get pitch, παίρνουµε την τιµή του επιτονισµού για το επιλεγµένο σηµείο ή τον µέσο όρο του επιτονισµού για την επιλεγµένη περιοχή. Επιλέγοντας pitch listing, παίρνουµε τις τιµές του επιτονισµού για κάθε χρονικό σηµείο της επιλεγµένης περιοχής. Από το Pitch settings µπορούµε να αλλάξουµε τα όρια του επιτονισµού. Τέλος, από την επιλογή Pitch Draw, µπορούµε να 8
αποµονώσουµε το γραφικό κοµµάτι του επιτονισµού για να το επισυνάψουµε σε ένα έγγραφο κειµένου. Τότε θα εµφανιστεί το παράθυρο PRAAT PICTURE, από το οποίο αντιγράφουµε την εικόνα (file copy to clipboard) και την επισυνάπτουµε στο έγγραφο που µας ενδιαφέρει. Intensity: Μπορούµε να ρυθµίσουµε επιλογές για την ένταση καθώς και αν θα φαίνεται ή όχι. Επιλέγοντας get intensity, παίρνουµε την τιµή της έντασης για το επιλεγµένο σηµείο ή τον µέσο όρο της έντασης για την επιλεγµένη περιοχή. Επιλέγοντας intensity listing, παίρνουµε τις τιµές της έντασης σε κάθε χρονικό σηµείο της επιλεγµένης περιοχής. Από το intensity settings µπορούµε να αλλάξουµε τα όρια της έντασης. Τέλος, από την επιλογή Intensity Draw, µπορούµε να αποµονώσουµε το γραφικό κοµµάτι της έντασης. Τότε θα εµφανιστεί το παράθυρο PRAAT PICTURE, από το οποίο αντιγράφουµε την εικόνα (file copy to clipboard) και την επισυνάπτουµε στο έγγραφο που µας ενδιαφέρει. Formant: Μπορούµε να ρυθµίσουµε επιλογές για τους διαµορφωτές, καθώς και αν θα φαίνονται ή όχι. Επιλέγοντας formant listing παίρνουµε τις τιµές των διαµορφωτών για κάθε εύρος φάσµατος και σε κάθε χρονικό σηµείο της επιλεγµένης περιοχής. Εναλλακτικά, µπορούµε να εµφανίσουµε τιµές διαµορφωτών µόνο στο εύρος φάσµατος που µας ενδιαφέρει. Από το formant settings µπορούµε να αλλάξουµε τις ρυθµίσεις των διαµορφωτών. Τέλος, από την επιλογή Formant Draw, µπορούµε να αποµονώσουµε το γραφικό κοµµάτι των διαµορφωτών. Τότε θα εµφανιστεί το παράθυρο PRAAT PICTURE, από το οποίο αντιγράφουµε την εικόνα (file copy to clipboard) και την επισυνάπτουµε στο έγγραφο που µας ενδιαφέρει. Pulse: Μπορούµε να ρυθµίσουµε επιλογές για τους φωνητικούς παλµούς, καθώς και αν θα φαίνονται ή όχι. Μας παρέχονται και σηµαντικές πληροφορίες ειδικά όταν γίνεται µελέτη του επιτονισµού. Η ανάλυση αυτή παρέχεται από το voice report. 9
ΕΠΙΣΗΜΕΙΩΣΗ ΚΕΙΜΕΝΟΥ (TEXT GRID) Το Praat δέχεται και άλλα αντικείµενα εκτός από ήχους. Ένα από αυτά είναι το Text Grid. Το Text Grid χρησιµεύει όταν θέλουµε να παραθέσουµε µέσα στον ήχο ένα κείµενο. ηµιουργία επισηµείωσης Έχοντας επιλεγµένο τον ήχο που µας ενδιαφέρει στο παράθυρο του Praat, πάµε Annotate To text grid. Εµφανίζεται το ακόλουθο παράθυρο: All tier names: Εδώ δηλώνουµε πόσες και ποιες κατηγορίες επισηµειώσεων κάνουµε. Π.χ. αν δηλώσουµε «Πρόταση Λέξη Τόνος», θα εµφανίσει τρεις επιπλέον γραµµές στο Praat για να επισηµειώσουµε αυτές τις κατηγορίες. ηλώνουµε όσες κατηγορίες χρειαζόµαστε, αφήνοντας κενά µεταξύ των λέξεων. Point tiers: Εδώ δηλώνουµε ποιες από αυτές τις επισηµειώσεις αφορούν ένα σηµείο και µόνο της ηχογράφησης. Στην περίπτωσή µας είναι ο Τόνος. Εδώ δηλώνουµε κάτι µόνο αν χρειάζεται να επισηµειώσουµε σηµεία, αλλιώς το αφήνουµε κενό. Μόλις πατήσουµε OK εµφανίζεται άλλο ένα αντικείµενο στο παράθυρο του Praat. 10
Επιλέγουµε το TextGrid µαζί µε τον ήχο µας και, πατώντας EDIT, έχουµε το παράθυρο, στο οποίο θα κάνουµε την επισηµείωση. Για να χωρίσουµε τις γραµµές που εµφανίστηκαν πρέπει να δηλώσουµε τα όρια της κάθε περίπτωσης (boundaries). Τα όρια αυτά δηλώνονται, κάνοντας κλικ στον ήχο στο σηµείο που µας ενδιαφέρει και δηλώνοντας αυτό το σηµείο ποιας περίπτωσης είναι όριο (Boundary Add on όποιο tier θέλουµε, ή add on all tiers αν πρόκειται για την αρχή και το τέλος της ηχογράφησης). Μόλις δηµιουργήσουµε τις οριοθετηµένες περιοχές, µπορούµε κάνοντας κλικ στην κάθε µία να γράψουµε το αντίστοιχο κείµενο. Τελικά, θα έχουµε την επεξηγηµατική µορφή που θέλουµε. 11
Αποθήκευση επισηµείωσης ήχου Ένα επισηµειωµένο αρχείο πρέπει να αποθηκευτεί ξεχωριστά από τον ήχο µας. Έχοντας επιλεγµένο µόνο το TextGrid µας, πάµε στο µενού Write Write to binary file. Αν στη συνέχεια θέλουµε να ανατρέξουµε στην επισηµείωση, πρέπει να ανοίξουµε τόσο το αρχείο ήχου, όσο και το binary αρχείο από το µενού Read From file. 12