ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Κατεύθυνση Επεξεργασία Σήµατος για Επικοινωνίες και Πολυµέσα ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Το φαινόµενο του formant tuning στην ψαλτική φωνή: Μελέτη βασισµένη στην ψηφιακή επεξεργασία σήµατος Γεώργιος Αποστόλου Χρυσοχοΐδης Επιβλέποντες: Γεώργιος Κουρουπέτρογλου, Αναπληρωτής Καθηγητής ΑΘΗΝΑ ΙΟΥΛΙΟΣ 2013
ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Το φαινόµενο του formant tuning στην ψαλτική φωνή: Μελέτη βασισµένη στην ψηφιακή επεξεργασία σήµατος Γεώργιος Απ. Χρυσοχοΐδης Α.Μ.: Μ1016 ΕΠΙΒΛΕΠΟΝΤΕΣ: Γεώργιος Κουρουπέτρογλου, Αναπληρωτής Καθηγητής ΕΞΕΤΑΣΤΙΚΗ ΕΠΙΤΡΟΠΗ: Γεώργιος Κουρουπέτρογλου, Αναπληρωτής Καθηγητής Ιούλιος 2013
ΠΕΡΙΛΗΨΗ Το αντικείµενο της παρούσας διπλωµατικής εργασίας είναι η διερεύνηση του φαινοµένου του formant tuning στην ψαλτική τραγουδιστική φωνή. Με τον όρο formant tuning αναφερόµαστε στο φαινόµενο ο ψάλτης να χρησιµοποιεί συστηµατικά µία µέθοδο ελέγχου της θέσεως των κύριων συχνοτήτων αντήχησης της φωνητικής οδού (formant) κατά τρόπο τέτοιο που να συµπίπτουν µε τις αρµονικές της θεµελιώδους συχνότητας, έχοντας σαν αποτέλεσµα την αύξηση της ακουστότητας του ήχου. Η ερευνητική εργασία ξεκίνησε αναζητώντας και µελετώντας παλαιότερες εργασίες σχετικές µε το ζήτηµα του formant tuning, σχηµατίζοντας έτσι µία γενική εικόνα του state-of-the-art. Σε δεύτερη φάση συγκεντρώθηκαν οι υπάρχουσες µέθοδοι ανάλυσης του φαινοµένου και αξιολογήθηκαν τα αποτελέσµατα της εφαρµογής τους σε είδη τραγουδιστικής φωνής, όπως η οπερατική φωνή και κάποια είδη ψαλµωδίας δυτικού τύπου. Έχοντας σκιαγραφήσει τους βασικούς άξονες στους οποίους θα κινούνταν η έρευνά µας, επιλέξαµε το ηχητικό υλικό για την ανάλυση. Πρόκειται για ηχογραφήσεις ψαλτικής τραγουδιστικής φωνής που αποτελούν µέρος του πρότυπου corpus ψαλτικών φωνών ΔΑΜΑΣΚΗΝΟΣ. Το corpus αυτό αποτελείται από ηχογραφήσεις ψαλτών από όλη την Ελληνική επικράτεια, οι οποίες έγιναν κάτω από αυστηρά ελεγχόµενες συνθήκες στο τµήµα Πληροφορικής και Τηλεπικοινωνιών κατά τα έτη 2005-2008. Συγκεκριµένα αναλύθηκαν ηχογραφήσεις 5 διαφορετικών ψαλτών σε µουσικές κλίµακες (ανιούσεςκατιούσες) του διατονικού και χρωµατικού γένους στα φωνήεντα α,ε, ι, ο, ου (/a/, /e/, /i/, /o/, /u/). Η µέθοδος ανάλυσης περιλάµβανε µία ηµι-αυτόµατη µέθοδο κατάτµησης του ηχητικού υλικού των κλιµάκων σε µικρότερα ηχητικά τµήµατα που αντιστοιχούσαν στους διακριτούς µουσικούς τόνους της κάθε κλίµακας για το κάθε φωνήεν. Για το σκοπό αυτό καθώς και για την εξαγωγή των µετρήσεων χρησιµοποιήθηκε το λογισµικό ανάλυσης φωνής PRAAT και η ανάλυση των µετρήσεων αυτών έγινε στη συνέχεια σε περιβάλλον MATLAB. ΘΕΜΑΤΙΚΗ ΠΕΡΙΟΧΗ: Επεξεργασία Φωνής ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: επεξεργασία οµιλίας, τραγουδιστική φωνή, ψαλτική φωνή, formant tuning, Βυζαντινή µουσική
ABSTRACT The object of this thesis is to investigate the effect of formant tuning in the context of the Byzantine Ecclesiastic chant voice, the psaltic voice as it is called. The term formant tuning refers to the phenomenon in which the chanter systematically uses a method of controlling the position of the main resonance frequencies of their vocal tract (formants) in such way as to coincide with the harmonics of the fundamental frequency, resulting in increased sound loudness. The research began by studying previous works relevant to formant tuning, thus forming an overview of state-of-the-art. In the next phase we gathered the existing methods of analysis and evaluated the results in other types of singing voice, like the operatic voice and some types of Western-style chant. After defining the research aims and deciding the objectives, we selected the audio material for analysis. The selected recordings are part of the DAMASKINOS prototype Acoustic Corpus of Byzantine Ecclesiastic Chant Voices. The DAMASKINOS corpus consists of recordings of Byzantine music chanters, from different places of the Greek territory. The recordings took place in the Department of Informatics and Telecommunications of the Kapodestrian University of Athens, during the years 2005-2008. Specifically, we analyzed recordings of 5 different chanters in ascending and descending musical scales of the diatonic genre, for the vowels /a/, /e/, /i/, /o/, /u/. The method of analysis included a semi-automatic segmentation method of the audio material, by dividing the scales into smaller audio segments corresponding to distinct musical tones, for each vowel, followed by a series of processing steps in order to extract the data. For this purpose, the speech analysis software PRAAT was used. Subsequent processing of the measurements was done in MATLAB. SUBJECT AREA: Speech Processing KEYWORDS: speech processing, singing voice, psaltic voice, formant tuning, byzantine music
ΕΥΧΑΡΙΣΤΙΕΣ Θερµές ευχαριστίες οφείλω στον επιβλέποντα καθηγητή µου κ. Γεώργιο Κουρουπέτρογλου και τον διδάκτορα του τµήµατος και συνεργάτη κ. Δηµήτριο Δελβινιώτη για την ουσιαστική συνεισφορά τους στην εκπόνηση της παρούσας διατριβής. Η στήριξή τους σε θέµατα τόσο επιστηµονικά, όσο υλοποίησης ήταν καθοριστική. Μέσα από συζητήσεις, κατευθύνσεις, συµβουλές, παρατηρήσεις, προσφορά υλικού και βιβλιογραφίας συνέβαλαν στην ολοκλήρωση της εργασίας.
ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ... 21 1. ΕΙΣΑΓΩΓΗ... 23 1.1 Περιγραφή του αντικειμένου της εργασίας... 23 1.2 Βιβλιογραφία σχετική με το Formant Tuning... 24 1.2.1 Formant Tuning Strategies in Professional Male Opera Singers, J. Sundberg et al. - 2012... 24 1.2.2 Vocal tract resonances in singing: Strategies used by sopranos, altos, tenors, and baritones, N. Henrich et al. - 2011... 25 1.2.3 Resonance strategies used in Bulgarian women s singing style: A pilot study, N. Henrich et al. - 200726 1.2.4 Formant frequency tuning in singing, G. Carlsson and J. Sundberg - 1992... 26 1.2.5 Formant tuning in a professional baritone, D. G. Miller and H. K. Schutte - 1990... 29 2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΗΜΑΤΩΝ ΦΩΝΗΣ... 31 2.1 Διαδικασία παραγωγής της φωνής... 31 2.2 Μοντελοποίηση παραγωγής φωνής... 32 2.3 Formants... 33 2.4 Μοντέλο πηγής- φίλτρου... 34 2.5 Ο φωνοσυντονισμός του τραγουδιστή (singer s formant)... 36 2.6 Τραγουδιστική φωνή... 37 2.7 Βυζαντινή μουσική Ψαλτική τραγουδιστική φωνή... 38 3. ΜΕΘΟΔΟΣ ΕΡΓΑΣΙΑΣ... 41 3.1 Επιλογή ηχητικού υλικού... 41 3.2 Πρότυπο σώμα ηχογραφήσεων ψαλτικών φωνών ΔΑΜΑΣΚΗΝΟΣ... 41 3.3 Λογισμικό ανάλυσης... 42 3.4 Μέθοδος ανάλυσης... 43 3.5 Επεξεργασία αποτελεσμάτων... 44
4. ΑΠΟΤΕΛΕΣΜΑΤΑ... 45 4.1 Παρουσίαση των αποτελεσμάτων... 45 4.2 Επιμέρους αποτελέσματα ψαλτών... 46 4.2.1 Ψάλτης 1: Αθανάσιος Βουγιουκλής... 46 4.2.2 Ψάλτης 2: Γεώργιος Χατζηχρόνογλου... 46 4.2.3 Ψάλτης 3: Χουρμούζιος Νταραβάνογλου... 47 4.2.4 Ψάλτης 4: Γρηγόριος Νταραβάνογλου... 47 4.2.5 Ψάλτης 5: Αντώνιος Πλαΐτης... 48 5. ΣΥΜΠΕΡΑΣΜΑΤΑ... 49 5.1 Ύπαρξη του φαινομένου... 49 5.2 Κοινή πρακτική συντονισμού... 50 5.3 Χρήση του formant tuning... 50 5.4 Αλλοίωση ακουστικών χαρακτηριστικών φωνηέντων... 51 ΠΙΝΑΚΑΣ ΟΡΟΛΟΓΙΑΣ... 53 ΣΥΝΤΜΗΣΕΙΣ ΑΡΚΤΙΚΟΛΕΞΑ ΑΚΡΩΝΥΜΙΑ... 54 ΠΑΡΑΡΤΗΜΑ Ι... 55 Επιμέρους μετρήσεις ψαλτών... 55 Ψάλτης 1: Αθανάσιος Βουγιουκλής... 57 Ψάλτης 2: Γεώργιος Χατζηχρόνογλου... 62 Ψάλτης 3: Χουρμούζιος Νταραβάνογλου... 68 Ψάλτης 4: Γρηγόριος Νταραβάνογλου... 74 Ψάλτης 5: Αντώνιος Πλαΐτης... 77 ΠΑΡΑΡΤΗΜΑ ΙΙ... 83 Συγκεντρωτικά διαγράμματα ψαλτών για κάθε φωνήεν... 83 ΠΑΡΑΤΗΜΑ ΙΙΙ... 91 Σύγκριση μεταξύ ανοδικής καθοδικής κίνησης... 91 Ψάλτης 1: Αθανάσιος Βουγιουκλής... 91
Ψάλτης 2: Γεώργιος Χατζηχρόνογλου... 94 Ψάλτης 3: Χουρμούζιος Νταραβάνογλου... 97 Ψάλτης 5: Αντώνιος Πλαΐτης... 100 ΠΑΡΑΡΤΗΜΑ IV... 103 5.5 Κώδικας PRAAT... 103 5.6 Κώδικας MATLAB... 114 ΑΝΑΦΟΡΕΣ... 121
ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ Σχήµα 1: Το σύστηµα των φωνητικών οργάνων... 31 Σχήµα 2: Μοντέλο παραγωγής φωνής σύµφωνα µε τους Rabiner και Schafer... 32 Σχήµα 3: Τα τρία πρώτα formants F1, F2 και F3 για δύο διαφορετικά φωνήεντα... 33 Σχήµα 4: Θέσεις των formant F1 και F2 για τα φωνήεντα της Ελληνικής γλώσσας.... 34 Σχήµα 5: Μοντέλο παραγωγής φωνής φίλτρου-πηγής Αναπαράσταση στο φασµατικό πεδίο της πηγής, του φίλτρου και του τελικού σήµατος φωνής... 35 Σχήµα 6: Ο φωνοσυντονισµός του τραγουδιστή ΦΤ (singer s formant) όπως εµφανίζεται στο φασµατικό πεδίο... 37
ΚΑΤΑΛΟΓΟΣ ΕΙΚΟΝΩΝ Εικόνα 1: Παράδειγµα Βυζαντινής µουσικής σηµειογραφίας... 39 Εικόνα 2: Βυζαντινή µουσική σηµειογραφία: Μουσικά σύµβολα, µαρτυρίες... 40 Εικόνα 3: Κλίµακα µαλακού διατόνου... 40
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ Πίνακας 1: Αντιστοιχία µεταξύ ονόµατα τόνων, διαστήµατα ηµιτονίων από το D2 (73Hz) και συχνότητες (Hz)... 55
ΠΡΟΛΟΓΟΣ Η παρούσα διπλωµατική εργασία εκπονήθηκε στο πλαίσιο του µεταπτυχιακού προγράµµατος σπουδών της κατεύθυνσης «Επεξεργασία Σήµατος για Επικοινωνίες και Πολυµέσα» του τµήµατος Πληροφορικής και Τηλεπικοινωνιών του Καποδιστριακού Πανεπιστηµίου Αθηνών. Το θέµα της και η µέθοδος εργασίας διαµορφώθηκαν κατόπιν συζήτησης µε τον επιβλέποντα καθηγητή κ. Γεώργιο Κουρουπέτρογλου και τον διδάκτορα του τµήµατος και καθηγητή Βυζαντινής µουσικής κ. Δηµήτριο Δελβινιώτη κατά το έτος 2010. Από την στιγµή αυτή και κατά τη διάρκεια της εργασίας υπήρξε συνεχή υποστήριξη τόσο σε επιστηµονικά θέµατα αλλά και σε θέµατα υλοποίησης. Η συµβολή και των δύο ήταν καθοριστική για την αρτιότητα του αποτελέσµατος και τους ευχαριστώ θερµά. Ιδιαίτερες ευχαριστίες θέλω να εκφράσω στον επιβλέποντα καθηγητή κ. Κουρουπέτρογλου για το χρόνο που αφιέρωσε στις διορθώσεις και την τελική επιµέλεια του κειµένου. Αθήνα, Μάρτιος 2013
1. ΕΙΣΑΓΩΓΗ 1.1 Περιγραφή του αντικειµένου της εργασίας Ο όρος formant tuning χρησιµοποιείται για το φαινόµενο κατά το οποίο οι δύο χαµηλότερες συχνότητες αντήχησης της φωνητικής οδού (formant) πλησιάζουν ή/και συµπίπτουν µε µία από τις αρµονικές της θεµελιώδους συχνότητας που παράγεται από την φωνητική πηγή. Τα formant εµφανίζονται σαν κορυφές στην φασµατική περιβάλλουσα του φίλτρου του φωνητικού σωλήνα. Είναι εύκολα κατανοητό ότι οι αρµονικές που βρίσκονται κοντά στις κορυφές των formant ενισχύονται ακόµα περισσότερο. Έχει παρατηρηθεί ότι η συνολική ένταση του ήχου ενός φωνήεντος αυξάνεται αν η συχνότητα του πρώτου formant πλησιάσει την ισχυρότερη αρµονική. Υποστηρίζεται από πολλούς ότι ορισµένοι τραγουδιστές συντονίζουν τα 2 χαµηλότερα formants (συχνότητες αντήχησης της φωνητικής οδού) µε κάποιες αρµονικές της θεµελιώδους συχνότητας, επιτυγχάνοντας κατ αυτό τον τρόπο να αυξήσουν την ακουστότητα της φωνής τους [1]. Η τελευταία παρατήρηση σχετικά µε την ένταση του εκπεµπόµενου ήχου υπήρξε αφορµή για την υπόθεση ότι οι τραγουδιστές ενδέχεται να χρησιµοποιούν συστηµατικά τη µέθοδο αυτή, ελέγχοντας τη θέση των formant κατά τρόπο τέτοιο που να συµπίπτουν µε τις αρµονικές, έχοντας σαν αποτέλεσµα την αύξηση στην ένταση του παραγόµενου ήχου χωρίς επιπλέον φωνητική καταπόνηση. Το φαινόµενο αυτό ονοµάστηκε formant tuning [1]. Το φαινόµενο του formant tuning δεν έχει µόνο θετικές επιπτώσεις στην παραγωγή του ήχου. Σύµφωνα µε τα ακουστικά δεδοµένα της οµιλίας µετατόπιση των formant αντιστοιχεί σε αλλοίωση της ποιότητας των φωνηέντων. Μέχρι τώρα έχουν παρουσιαστεί µελέτες που εξετάζουν το φαινόµενο αυτό µε δεδοµένα και µετρήσεις από το κλασικό τραγούδι (oπερατική φωνή) και το σύγχρονο [2][3][4][5]. Η παρούσα εργασία θα επιχειρήσει να προσεγγίσει το φαινόµενο του formant tuning στο πλαίσιο της ψαλτικής τραγουδιστικής φωνής θέλοντας αρχικά να δώσει απαντήσεις σε βασικά ερωτήµατα όπως αν το φαινόµενο εµφανίζεται ή όχι αλλά και να ερµηνεύσει τα δεδοµένα που προκύπτουν από τις µετρήσεις και να θέσει καινούργια ενδιαφέροντα ερωτήµατα προς διερεύνηση. 23 Γ. Χρυσοχοΐδης
1.2 Βιβλιογραφία σχετική µε το Formant Tuning Στη συνέχεια ακολουθεί µία παράθεση σχετικών άρθρων. Για κάθε άρθρο εµφανίζεται µία περίληψη, η µέθοδος ανάλυσης που ακολουθήθηκε και τα τελικά αποτελέσµατασυµπεράσµατα. Η σειρά παρουσίασης είναι από τις πιο πρόσφατες προς τις παλαιότερες εργασίες. 1.2.1 Formant Tuning Strategies in Professional Male Opera Singers, J. Sundberg et al. - 2012 Η µελέτη αυτή [5] αρχικά παρουσιάζει ένα συγκεντρωτικό πίνακα µε τα ευρήµατα προηγούµενων εργασιών που σχετίζονται µε το φαινόµενο του formant tuning, σηµειώνοντας τα σηµεία στα οποία εµφανίζονται περιορισµοί και αντιθέσεις µεταξύ των εργασιών αυτών, αιτιολογώντας έτσι την ανάγκη για περαιτέρω έρευνα του φαινοµένου. Η µελέτη αποτελεί συνέχεια µιας σειράς εργασιών της ίδιας ερευνητικής οµάδας. Στην έρευνα αυτή έλαβαν µέρος 8 τραγουδιστές µε κλασική εκπαίδευση, ηλικίας 23-42 χρόνων, διαφόρων επιπέδων, από µαθητές έως και οπερατικούς τραγουδιστές διεθνούς καριέρας. Η τραγουδιστές εκτέλεσαν ανιούσες και κατιούσες κλίµακες 9 µουσικών τόνων για 4 διαφορετικά φωνήεντα, σε 3 διαφορετικές µελωδικές βάσεις οι οποίες διέφεραν κατά ένα ηµιτόνιο. Η µελωδικές βάσεις επιλέχθηκαν κατά τρόπο ώστε να περιλαµβάνεται η φωνητική µελωδική περιοχή γνωστή ως «passaggio» (µετάβαση, πέρασµα). Η τραγουδιστές κλήθηκαν να εκτελέσουν τις περιοχές του «passaggio» τόσο µε κλασική τεχνική όσο και µε µη-κλασικό τρόπο. Η ανάλυση περιλάµβανε αρχικά ένα ψυχοακουστικό τεστ κατά το οποίο επιλέχθηκαν 28 από τις ηχογραφηµένες κλίµακες κατά τυχαίο τρόπο, µε σκοπό την σαφή διάκριση µεταξύ τυπικών περιπτώσεων κλασικού και µη-κλασικού τρόπου τραγουδιού. Ακολούθησε ανάλυση για τον προσδιορισµό των τιµών συχνότητας των φωνοσυντονισµών χρησιµοποιώντας την τεχνική του inverse filtering (λογισµικό DeCap). Στη συνέχεια η τιµές αυτές χρησιµοποιήθηκαν για την σύνθεση των αντίστοιχων µουσικών τόνων. Οι συνθετικοί τόνοι αποτέλεσαν µέσο ελέγχου της ακρίβειας προσδιορισµού των τιµών συχνότητας των formant, κατά τον ακουστικό έλεγχο της ποιότητας του παραγόµενου συνθετικού ήχου από τους συγγραφείς. Επίσης η µελέτη περιλάµβανε ανάλυση των διαγραµµάτων ροής αέρα. Η µελέτη αυτή µπορεί να αναδείξει το φαινόµενο του format tuning κατά το οποίο παρατηρείται απόκλιση από την τυπική µορφή διαγραµµάτων ροής αέρα, λόγω της µη γραµµικής σχέσης µεταξύ πηγήςφίλτρου. Γ. Χρυσοχοΐδης 24
Τα αποτελέσµατα της έρευνας παρουσιάζονται κυρίως µε τη µορφή διαγραµµάτων στα οποία εµφανίζονται οι κυµατοµορφές των τιµών συχνότητας των φωνοσυντονισµών και των αρµονικών, οπότε µπορεί να γίνει εύκολα προσδιορισµός των περιπτώσεων εµφάνισης του υπό µελέτη φαινοµένου στα σηµεία που οι δύο κυµατοµορφές συµπίπτουν. Τα συµπεράσµατα της έρευνας επικεντρώνουν σε δύο ερωτήσεις: α. Υπάρχει κοινή στρατηγική formant tuning µεταξύ των τραγουδιστών που πήραν µέρος, ιδίως στην περιοχή του «passaggio»; β. Ποιες είναι οι τιµές συχνότητας των formant και που βρίσκονται σε σύγκριση µε τις αρµονικές; Η απάντηση στο πρώτο ερώτηµα είναι αρνητική, δηλαδή στις περισσότερες περιπτώσεις δεν υπήρχε κοινή στρατηγική formant tuning, αλλά κάθε τραγουδιστής εφάρµοσε µία προσωπική τακτική συντονισµού προσαρµοσµένη στα χαρακτηριστικά της φωνής του. Όσο αφορά την δεύτερη ερώτηση παρατηρείται ότι η τιµή του πρώτου φωνοσυντονισµού F1 δεν έπεσε σε καµία περίπτωση κάτω από την πρώτη αρµονική. Σε κάθε περίπτωση βρέθηκαν πολύ λίγες περιπτώσεις συντονισµού των δύο πρώτων formant F1 και F2 µε κάποια από τις αρµονικές. 1.2.2 Vocal tract resonances in singing: Strategies used by sopranos, altos, tenors, and baritones, N. Henrich et al. - 2011 Η εργασία αυτή [6] πραγµατεύεται τη µελέτη των στρατηγικών formant tuning που χρησιµοποιούνται από τραγουδιστές και τραγουδίστριες µε κλασική (οπερατική) εκπαίδευση. Συγκεκριµένα εξετάστηκαν 22 τραγουδιστές σε 4 διαφορετικά φωνήεντα στην φυσική φωνητική τους έκταση. Η προσδιορισµός των formants και των αρµονικών συχνοτήτων έγινε µε τη χρήση µίας τεχνικής εισαγωγής ενός ακουστικού σήµατος διέγερσης στην φωνητική οδό του τραγουδιστή, ενώ παράλληλα ένα µικρόφωνο χρησιµοποιήθηκε για την καταγραφή της απόκρισης της φωνητικής οδού στην διέγερση που δέχθηκε. Η µέθοδος αυτή υπόσχεται ακριβή αποτελέσµατα µετρήσεων τόσο στις τιµές των formant όσο και στις αρµονικές συχνότητες. Ένα από τα ευρήµατα που παρουσιάζονται είναι αυτό της µη ύπαρξης συσχέτισης µεταξύ των τιµών των formant και της φωνητικής κατηγορίας (βάσει φωνητικής έκτασηςsoprano, alto, tenor, baritone) του τραγουδιστή. Τα υποκείµενα που έλαβαν µέρος στην έρευνα φαίνεται να µεταβάλλουν τις τιµές των formant, σε σχέση µε τις αντίστοιχες τιµές της οµιλίας. Η µελέτη καταλήγει στο συµπέρασµα ότι σε υψηλές συχνοτικές περιοχές 25 Γ. Χρυσοχοΐδης
παρουσιάζεται το φαινόµενο του formant tuning. Η ίδια µελέτη αναφέρει στη συνέχεια στοιχεία για την κάθε φωνητική κατηγορία (soprano, alto, tenors-baritones) ξεχωριστά. 1.2.3 Resonance strategies used in Bulgarian women s singing style: A pilot study, N. Henrich et al. - 2007 Η εργασία αυτή [7] αφορά την µελέτη των δύο κύριων κατηγοριών γυναικείας φωνής της Βουλγαρικής παραδοσιακής µουσικής. Μετά από µία σύντοµη παρουσίαση των κύριων χαρακτηριστικών (φωνητική έκταση, τονικά χαρακτηριστικά) η εργασία προσπαθεί να δώσει απάντηση στο ερώτηµα γιατί παρατηρείται αυξηµένη φωνητική ένταση στις γυναικείες φωνές του µουσικού αυτού είδους. Η µέθοδος µέτρησης που χρησιµοποιήθηκε σε αυτή την εργασία είναι ίδια µε αυτή που περιγράψαµε προηγουµένως, δηλαδή εισάγοντας ένα ακουστικό σήµα διέγερσης στην φωνητική οδό του τραγουδιστή και µετρώντας την απόκρισή της σε αυτό. Στη έρευνα αυτή έλαβε µέρος µία καθηγήτρια παραδοσιακού Βουλγαρικού τραγουδιού. Ηχογραφήθηκαν 6 διαφορετικά φωνήεντα διάρκειας 4 δευτερολέπτων το καθένα, χωρίς βιµπράτο, σε 4 διαφορετικά µουσικά ύψη, για κάθε είδος φωνής. Τα αποτελέσµατα των µετρήσεων δείχνουν σαφώς ότι και στα δύο είδη φωνής παρουσιάζεται το φαινόµενο του formant tuning. Ακόµα γίνεται σαφές ότι το φαινόµενο του συντονισµού εµφανίζεται σε όλη την φωνητική έκταση που µελετήθηκε. 1.2.4 Formant frequency tuning in singing, G. Carlsson and J. Sundberg - 1992 Η δηµοσίευση αυτή [8] ασχολείται µε το κατά πόσο οι αλλοιώσεις που προκαλούνται από την εσκεµµένη µετατόπιση των συχνοτήτων των formant, ώστε να πλησιάσουν ή ακόµα και να συµπέσουν µε τις αρµονικές (formant tuning), γίνονται αντιληπτές από τον ακροατή. Το πρώτο και το δεύτερο formant είναι καθοριστικά στη διαµόρφωση της ποιότητας εκφοράς του φωνήεντος, ενώ τα υψηλότερα formant επηρεάζουν περισσότερο την ποιότητα-χροιά της φωνής. Το φαινόµενο του formant tuning προκαλεί αλλοίωση της ποιότητας των φωνηέντων ενώ παράλληλα αυξάνει την συνολική ένταση του ήχου. Σε αυτό το πλαίσιο το ερώτηµα που προκύπτει είναι κατά πόσο η αύξηση της έντασης είναι σηµαντικότερη από την ποιότητα εκφοράς των φωνηέντων. Για το σκοπό αυτό χρησιµοποιήθηκε µία µηχανή σύνθεσης τραγουδιστικής φωνής. Τέσσερις περιπτώσεις εξετάστηκαν: ηχητικά τµήµατα φωνής µε σταθερές συχνότητες Γ. Χρυσοχοΐδης 26
formant καθώς και 3 περιπτώσεις όπου οι συχνότητες των formant προσαρµόζονται στην βασική συχνότητα ακολουθώντας τρεις διαφορετικές στρατηγικές. Το αποτέλεσµα της ποιότητας της συνθετικής τραγουδιστικής φωνής κρίθηκε από ειδικούς της τραγουδιστική φωνή (καθηγητές τραγουδιού) σε ένα ακουστικό πείραµα που περιλάµβανε κατιούσες χρωµατικές κλίµακες. Η έκβαση του πειράµατος έδειξε ότι η πλειοψηφία των ακροατών επέλεξε τα τµήµατα µε σταθερή συχνότητα formant, κάτι που ήταν αναµενόµενο αφού ο συντονισµός των formant στις αρµονικές προϋποθέτει αρκετά σηµαντικές µεταβολές στη συχνότητα των formant µεταξύ γειτονικών τόνων του ίδιου φωνήεντος, τέτοιες ώστε να γίνεται αντιληπτή η µεταβολή της ποιότητας εκφοράς του φωνήµατος. Μεταξύ των άλλων η εργασία αυτή σηµειώνει ότι στην υψηλή περιοχή της φωνητικής έκτασης η τιµή της συχνότητας του πρώτου formant είναι συχνά χαµηλότερη από την τιµή της θεµελιώδους συχνότητας (F0) του τόνου. Σε αυτές τις περιπτώσεις έχει παρατηρηθεί σε τραγουδίστριες soprano να υψώνεται το πρώτο formant ελαφρώς πάνω από την θεµελιώδη συχνότητα. Με αυτό τον τρόπο ενισχύεται η ένταση του ήχου αφού η περιοχή του πρώτου formant δεν είναι κενή σε σχέση µε τις αρµονικές του τόνου. Ακόµα µία σπανιότερη περίπτωση formant tuning εµφανίζεται σε µερικούς τύπους ψαλτικής µουσικής δυτικού τύπου. Σε αυτή την περίπτωση εµφανίζεται µία οµαδοποίηση-συγχώνευση του δεύτερου και τρίτου formant επηρεάζοντας την αρµονική που βρίσκεται σε κοντινή συχνότητα κατά τρόπο τόσο έντονο που την καθιστά προεξέχουσα συχνότητα µαζί µε την θεµελιώδη. Φυσικά η περίπτωση να συµπίπτει η συχνότητα κάποιας αρµονικής µε αυτή ενός formant µπορεί συµβεί και από απλή σύµπτωση. Το ερώτηµα συνεπώς που τίθεται από την µελέτη αυτή και παρουσιάζει εξαιρετικό ενδιαφέρον είναι κατά πόσο οι επαγγελµατίες τραγουδιστές χρησιµοποιούν ηθεληµένα και ελέγχουν το φαινόµενο του formant tuning. Η πιθανότητα να εµφανίζονται τα formant κοντά σε αρµονικές της θεµελιώδους συχνότητας αυξάνεται στην χαµηλή περιοχή της φωνητικής έκτασης, όπου η πυκνότητα των αρµονικών είναι πολύ µεγαλύτερη σε σχέση µε την υψηλή περιοχή. Η πιθανότητα να απέχει το formant από µία αρµονική απόσταση µικρότερη από το µισό εύρος ζώνης του (BW/2) µπορεί να εκφραστεί από την ποσότητα BW/F0. Το ενδιαφέρον εστιάζεται στα τρία χαµηλότερα formants καθώς η συνεισφορά τους είναι καθοριστική στην ένταση του παραγόµενου ήχου. 27 Γ. Χρυσοχοΐδης
Σχετικά µε τη µέθοδο που ακολουθήθηκε, η συνθετική τραγουδιστική φωνή αποτελεί ιδανικό εργαλείο για την διερεύνηση των υποθέσεων που σχετίζονται µε το formant tuning. Συγκεκριµένα χρησιµοποιήθηκε η ψηφιακή εκδοχή (MUSSE DIG) του αναλογικού συνθέτη τραγουδιστικής φωνής MUSSE, ο οποίος έχει χρησιµοποιηθεί στο παρελθόν για την διερεύνηση ζητηµάτων αντίληψης τραγουδιστικής φωνής. Συγκεκριµένα προκειµένου να διερευνηθεί το κατά πόσο είναι αποδεκτό µε βάση τα αισθητικά µουσικά πρότυπα το φαινόµενο του formant tuning δηµιουργήθηκαν µε τη χρήση του MUSSE DIG ένα σύνολο ηχητικών µέρη τραγουδιστικής φωνής. Τα µέρη αυτά που αποτελούν τµήµατα κατιουσών χρωµατικών κλιµάκων έκτασης µίας οκτάβας του φωνήεντος /a/, ξεκινώντας από το C4 (261 Hz) χρησιµοποιήθηκαν στη συνέχεια ως ακουστικά ερεθίσµατα των υποκειµένων που έλαβαν µέρος στο ακουστικό πείραµα που περιγράφεται παρακάτω. Τέσσερις διαφορετικές στρατηγικές ακολουθήθηκαν κατά την παραγωγή των ακουστικών ερεθισµάτων. Στην στρατηγική Α το πρώτο formant συντονίστηκε σταθερά στην αρµονική που βρίσκεται στην περιοχή των 550 Hz. Στην στρατηγική Β το δεύτερο formant συντονίστηκε στην αρµονική που βρίσκεται στην περιοχή των 1000 Hz. Στην στρατηγική C ένα εκ των δύο formant πρώτου και δευτέρου συντονίστηκε στην πλησιέστερη αρµονική των 550 Hz ή 1000 Hz. Η επιλογή του formant έγινε µε βάση την µικρότερη απόσταση µετακίνησης του formant από την αρχική του θέση. Επιπλέον στην στρατηγική D τα δύο formant, πρώτο και δεύτερο, κρατήθηκαν σταθερά συντονισµένα στις συχνότητες 550 και 1000 Hz αντίστοιχα σε όλη την έκταση της κλίµακας. Έτσι σχηµατίστηκαν τρία ζεύγη ακουστικών ερεθισµάτων που χρησιµοποιήθηκαν στο ακουστικό πείραµα. Κάθε ζευγάρι αποτελούνταν από µία από τις κλίµακες των τρόπων A, B ή C και από την κλίµακα του τρόπου D. Έτσι κάθε ζεύγος περιείχε µία κλίµακα µε µεταβαλλόµενο ένα εκ των δύο formant και µία κλίµακα µε σταθερά formant σε όλη την έκταση. Στο πείραµα συµµετείχαν 19 µέλη από την οµάδα των καθηγητών τραγουδιού του κρατικού Ωδείου της Στοκχόλµης. Τα υποκείµενα άκουσαν τα τρία ζευγάρια των ακουστικών ερεθισµάτων από µεγάφωνο και στη συνέχεια απάντησαν σε ερωτηµατολόγιο στο οποίο κλήθηκαν να επιλέξουν µεταξύ της κλίµακας των µεταβαλλόµενων και αυτή των σταθερών formant, για κάθε ζεύγος κλιµάκων. Τα αποτελέσµατα έδειξαν ότι σε όλες τις περιπτώσεις τα υποκείµενα προτίµησαν τις κλίµακες µε τα σταθερά formant (στρατηγική D), εκτός από µία περίπτωση. Το συµπέρασµα που εξάγεται είναι ότι σύµφωνα µε τα µουσικά αισθητικά πρότυπα των καθηγητών τραγουδιού η τεχνική του formant tuning δεν µπορεί να χρησιµοποιηθεί Γ. Χρυσοχοΐδης 28
γενικά στη συνολική έκταση της κλίµακας. Παρόµοια αποτελέσµατα εξήχθησαν και από την έρευνα του Miller και Schutte σύµφωνα µε την οποία η τεχνική του formant tuning δεν χρησιµοποιήθηκε στις κλίµακες που εξέτασαν (δες την επόµενη εργασία). Όπως φαίνεται το τίµηµα της ποιοτικής αλλοίωσης των φωνηέντων είναι αρκετά ακριβότερο σε σχέση µε το όφελος που εµφανίζεται στην αύξηση της έντασης (SPL). 1.2.5 Formant tuning in a professional baritone, D. G. Miller and H. K. Schutte - 1990 Η εργασία αυτή [2] διερευνά το φαινόµενο του formant tuning χρησιµοποιώντας µία σειρά µετρήσεων που προκύπτουν από την ανάλυση ηχογραφήσεων ενός κλασικού βαρύτονου τραγουδιστή, καθώς και δεδοµένων ηλεκτρογλωττιδογραφήµατος (EGG), υπογλωττιδικής και υπεργλωττιδικής πίεσης. Το υποκείµενο κινήθηκε φωνητικά στην µελωδική έκταση µεταξύ B3 ύφεση και F4, περιοχή στην οποία εµφανίζεται το λεγόµενο passaggio για το συγκεκριµένο είδος ανδρικής φωνής. Ο τραγουδιστής κλήθηκε να εκφωνήσει δύο σειρές µελωδικών φράσεων: α. (do-mi-sol-mi-do) σε συλλαβές /bibibi/ β. καθοδική κλίµακα σε συλλαβή /i/. Η µελέτη των αποτελεσµάτων αποκαλύπτει το παράδοξο να έχουµε σε κάποιους τόνους χαµηλότερη υπογλωττιδική πίεση αλλά υψηλότερα επίπεδα SPL. Σε αυτά τα σηµεία εµφανίζεται το φαινόµενο του formant tuning µε το οποίο µπορεί να ερµηνευτεί το παράδοξο αυτό γεγονός. Οι συγγραφείς αναφέρουν ότι το φαινόµενο του formant tuning παρουσιάζεται σε κάποιες περιπτώσεις. Σηµαντικές είναι οι επιπτώσεις του συντονισµού αυτού στο επίπεδο SPL του ήχου καθώς και στην ποιότητα του παραγόµενου φωνήεντος. Σε ορισµένες περιπτώσεις, η αλλοίωση της ποιότητας των φωνηέντων που παρουσιάζεται δεν αποκλείεται να οφείλεται σε ηθεληµένη ιδιόµορφη προφορά του τραγουδιστή, γεγονός που καθιστά τυχαίο το φαινόµενο του formant tuning. 29 Γ. Χρυσοχοΐδης
2. ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΗΜΑΤΩΝ ΦΩΝΗΣ 2.1 Διαδικασία παραγωγής της φωνής Με τον όρο φωνή χαρακτηρίζουµε κάθε ήχο που παράγεται από το σύµπλεγµα των ανθρώπινων φωνητικών οργάνων [9]. Το σύµπλεγµα αυτό αποτελείται από τους πνεύµονες, την τραχεία, τον λάρυγγα, τον φάρυγγα, την ρινική και τη στοµατική κοιλότητα, σχηµατίζοντας ένα συνδεόµενο αγωγό που φαίνεται στην παρακάτω εικόνα [10]. Άρθρωση Σταφυλή Γλώσσα- Χείλη Κάτω γνάθος Ρινική κοιλότητα Φωνητική οδός Φώνηση Λάρυγγας Οισοφάγος Πνεύµονες Σχήµα 1: Το σύστηµα των φωνητικών οργάνων Η διαδικασία παραγωγής οµιλίας περιλαµβάνει τρεις επιµέρους διαδικασίες: γέννηση πηγής, άρθρωση και µετάδοση [9]. Όταν οι κοιλιακοί µύες ωθούν το διάφραγµα προς τα πάνω, πιέζεται ο αέρας από τους πνεύµονες. Ο αέρας περνά στη συνέχεια από την τραχεία, τη γλωττίδα και το λάρυγγα. Η γλωττίδα ή αλλιώς το άνοιγµα ανάµεσα στις δύο φωνητικές χορδές στενεύει µε αποτέλεσµα το ρεύµα αέρα να διακόπτεται περιοδικά προκαλώντας την ταλάντωση των φωνητικών χορδών, παίζοντας το ρόλο της γλωττιδικής πηγής ή πηγής οµιλίας [9][10]. Η περίοδος των δονήσεων των φωνητικών χορδών αποκαλείται θεµελιώδης περίοδος, ενώ το αντίστροφό της θεµελιώδης συχνότητα της φωνητικής πηγής. Η πηγή του ήχου πέρα από την θεµελιώδη συχνότητα αποτελείται και από µία σειρά αρµονικών 31 Γ. Χρυσοχοΐδης
(ακέραιων πολλαπλάσιων της θεµελιώδους συχνότητας) [12][11][9]. Το κύµα του ήχου από την φωνητική πηγή διέρχεται στη συνέχεια από την φωνητική οδό και διαµορφώνεται ανάλογα µε το φωνήεν που είναι να παραχθεί. Επιπλέον, οι µηχανισµοί παραγωγής συµφώνων συµπληρώνουν την διαδικασία µετατροπής του κύµατος αέρα σε ήχους οµιλίας. Η προσαρµογή του σχήµατος της φωνητικής οδού για την παραγωγή των διαφόρων ήχων οµιλίας ονοµάζεται άρθρωση. Τα όργανα που κινούνται ενεργά κατά τη διάρκεια της προσαρµογής αυτής ονοµάζονται αρθρωτές. Τέτοια όργανα είναι η γλώσσα, τα χείλη, η σταφυλή και η κάτω γνάθος. Το κύµα του διαµορφωµένου ήχου εκπέµπεται από τα χείλη στον αέρα και διαχέεται. Στους έρρινους ήχους το κύµα εκπέµπεται από τα ρουθούνια. 2.2 Μοντελοποίηση παραγωγής φωνής Ένα απλό µοντέλο παραγωγής φωνής σύµφωνα µε τους Rabiner και Schafer [13] είναι το παρακάτω: Σχήµα 2: Μοντέλο παραγωγής φωνής σύµφωνα µε τους Rabiner και Schafer Μπορούµε να διακρίνουµε µία γεννήτρια παλµών η οποία διεγείρει γλωττιδικό µοντέλο παραγωγής ηχητικών κυµάτων φωνής G(z) και µία γεννήτρια τυχαίου θορύβου µε την οποία σχηµατίζονται τα σύµφωνα. Τα δύο στοιχεία ενίσχυσης που φαίνονται στο σχήµα παίζουν τον ρόλο των ενισχυτών του σήµατος. Ο ρόλος αυτός στην πραγµατικότητα, κατά κύριο λόγο, ανήκει στους πνεύµονες, οι οποίοι καθορίζουν την ένταση του ήχου Γ. Χρυσοχοΐδης 32
µέσω της ροής αέρα. Ο παραγόµενος ήχος πηγής διέρχεται από το φίλτρο της φωνητικής οδού V(z) για να καταλήξει µέσω του φίλτρου εκποµπής R(z) στον αέρα. Για τους έµφωνους ήχους που µας ενδιαφέρουν στην παρούσα εργασία, η γεννήτρια παλµών καθορίζει την θεµελιώδη συχνότητα (pitch) της φωνής, ενώ το γλωττιδικό µοντέλο παραγωγής ηχητικών κυµάτων είναι υπεύθυνο για τις αρµονικές (harmonics) που περιέχονται στο σήµα της πηγής. 2.3 Formants Τα κυρίαρχα στοιχεία συχνότητας που χαρακτηρίζουν τους έµφωνους ήχους αντιστοιχούν στα στοιχεία συχνότητας αντήχησης της φωνητικής οδού και ονοµάζονται φωνοσυντονισµοί (formants) και οι αντίστοιχες συχνότητές τους φωνοσυντονιστικές συχνότητες [12][11][9]. Τα formants διαφοροποιούνται ανάλογα µε το φωνήεν που προφέρεται κάθε φορά, αφού από αυτό εξαρτάται η θέση των αρθρωτών. Η ηλικία και το φύλο παίζουν επίσης ρόλο, καθώς και γενικότερα τα ανατοµικά χαρακτηριστικά του ατόµου. Τα formants συµβολίζονται συνήθως ως F1, F2, F3 κλπ. Στο µοντέλο των Rabiner και Schafer που παρουσιάσαµε πιο πάνω τα formants καθορίζουν την απόκριση του φίλτρου της φωνητικής οδού και εµφανίζονται ως κορυφές της περιβάλλουσας του φάσµατος του φίλτρου αυτού. Ο τρόπος µε τον οποίο τα formants καθορίζουν τη συνάρτηση µεταφοράς του φίλτρου της φωνητικής οδού, όπως αυτό παρουσιάζεται στο Σχήµα 2, περιγράφεται από την θεωρία µεταφοράς ήχου στον ταλαντωτή της φωνητικής οδού [13]. Σχήµα 3: Τα τρία πρώτα formants F1, F2 και F3 για δύο διαφορετικά φωνήεντα 33 Γ. Χρυσοχοΐδης
Κάθε formant χαρακτηρίζεται από: α) την συχνότητα του (formant frequency) β) την στάθµη του (formant level), και γ) το εύρος ζώνης του (formant bandwidth) [14]. Το τελευταίο ορίζεται σαν την περιοχή συχνοτήτων γύρω από την φωνοσυντονιστική συχνότητα που τα όρια της προσδιορίζονται στο µισό της ισχύος (-3dB) από την µέγιστη τιµή ισχύος του formant. Τα δύο formant F1 και F2 καθορίζουν την φωνητική ποιότητα των φωνηέντων ανάλογα µε τις διάφορες θέσεις των συχνοτήτων τους [12][11][9][14][16][1] καθώς και την έντασή τους, ενώ τα υψηλότερης τάξης formants επηρεάζουν αυτό που χαρακτηρίζουµε συνήθως ως «χροιά» ή «ηχόχρωµα» της φωνής [15][16]. Για τους άντρες οι συχνότητες των φωνοσυντονισµών κυµαίνονται, για τον πρώτο F1 250-1000 Hz (µουσικοί τόνοι B3- Β5), για τον δεύτερο F2 600-2500 Hz (µουσικοί τόνοι D5-D#7). Οι θέσεις των formant F1 και F2 σε σχέση µε το παραγόµενο φωνήεν παρουσιάζονται στον διάγραµµα που ακολουθεί. Σχήµα 4: Θέσεις των formant F1 και F2 για τα φωνήεντα της Ελληνικής γλώσσας. 2.4 Μοντέλο πηγής-φίλτρου Ένα ακόµα πιο απλοποιηµένο µοντέλο σε σχέση µε αυτό του Rabiner και Schafer είναι το µοντέλο πηγής-φίλτρου που παρουσιάζουµε στο παρακάτω σχήµα. Γ. Χρυσοχοΐδης 34
Σχήµα 5: Μοντέλο παραγωγής φωνής φίλτρου-πηγής Αναπαράσταση στο φασµατικό πεδίο της πηγής, του φίλτρου και του τελικού σήµατος φωνής Στο παραπάνω µοντέλο οι περιοδικοί παλµοί της φωνητικής πηγής διαµορφώνονται από το φίλτρο της φωνητικής οδού δίνοντας το τελικό σήµα. 35 Γ. Χρυσοχοΐδης
Παρατηρώντας το φασµατικό περιεχόµενο του περιοδικού σήµατος πηγής, χρησιµοποιώντας την µέθοδο ανάλυσης κατά Fourier, διαπιστώνουµε ότι αυτό αποτελείται πέρα από την θεµελιώδη συχνότητα f0 από µία σειρά αρµονικών συνιστωσών συχνοτήτων που είναι ακέραια πολλαπλάσια της θεµελιώδους, 2 f0, 3 f0, 4 f0, κλπ. Είναι δηλαδή ένα άθροισµα αρµονικών συνιστωσών (harmonics) ή µερικών (partials), όπως λέγονται [12][15][16]. 2.5 Ο φωνοσυντονισµός του τραγουδιστή (singer s formant) Ο τραγουδιστής οφείλει να εκφέρει τα φωνήεντα κατά τρόπο τέτοιο που να εξυπηρετεί τις καλλιτεχνικές ανάγκες που επιτάσσει η τεχνοτροπία και το µουσικό περιβάλλον στο οποίο ανήκει. Η τεχνοτροπία αυτή της τραγουδιστικής φωνής καθορίζει σε µεγάλο βαθµό κατά πόσο µία φωνή εκφέρει αισθητικά σωστά ένα τόνο. Ακόµα πολλές φορές ο χώρος στον οποίο λαµβάνει χώρα η µουσική παράσταση επιτάσσει η φωνή να έχει την κατάλληλη ακουστότητα ώστε να γίνει αντιληπτή από το σύνολο του ακροατηρίου. Οι περισσότερες από αυτές τις απαιτήσεις καλύπτονται σε µεγάλο βαθµό από την κίνηση των αρθρωτών (γλώσσα, χείλια και σιαγόνα) οι οποίοι προκαλούν µεταβολές στις συχνότητες συντονισµού (formant) του αντηχείου της φωνητικής οδού. Ένα από τα βασικά χαρακτηριστικά της ανδρικής τραγουδιστικής οπερατικής φωνής είναι η παρουσία ενός φωνοσυντονισµού ανώτερης τάξης, γνωστός ως «φωνοσυντονισµός του τραγουδιστή» (singer s formant) [15][16][14]. Στο φασµατικό πεδίο ο φωνοσυντονισµός αυτός δηµιουργείται από συνένωση του 3 ου,4 ου και 5 ου formant [15][16][14]. Στο σχήµα που ακολουθεί εµφανίζεται το φάσµα οµιλίας, ορχήστρας και τραγουδιού. Ο φωνοσυντονισµός του τραγουδιστή εµφανίζεται ως µία ενισχυµένη ευρεία κορυφή στο φασµατικό πεδίο. Γ. Χρυσοχοΐδης 36
Σχήµα 6: Ο φωνοσυντονισµός του τραγουδιστή ΦΤ (singer s formant) όπως εµφανίζεται στο φασµατικό πεδίο Παρατηρούµε ότι το φάσµα της φωνής ενός οπερατικού τραγουδιστή καθώς και το αντίστοιχο της ορχήστρας διαφέρουν σηµαντικά στην περιοχή των 2800 Hz περίπου. Η παρουσία της ενισχυµένης κορυφής του singer s formant βοηθάει στο να διακρίνεται η τραγουδιστική φωνή από την ορχήστρα στο ακροατήριο. Η εξήγηση βασίζεται στη διεισδυτικότητα των υψηλών συχνοτήτων αρµονικών, που µεταδίδονται κατευθείαν προς το ακροατήριο, έναντι των χαµηλών αρµονικών, οι οποίες διαχέονται προς όλες τις κατευθύνσεις του χώρου, έχουν δηλαδή µειωµένη διεισδυτική ικανότητα [15][16][1]. 2.6 Τραγουδιστική φωνή Σε αυτή την παράγραφο θα αναφέρουµε κάποιες µουσικές έννοιες [14], για λόγους κατανόησης του υπόλοιπου κειµένου. Οι όροι που θα ορίσουµε είναι οι ακόλουθοι: 1. Το ρεγκίστρο ή φωνητικό διάγραµµα (register) 2. Την φωνητική έκταση (pitch range) Ο όρος ρεγκίστρο ή φωνητικό διάγραµµα (register) δεν έχει κάποια γενικά αποδεκτή έννοια. Συνήθως αναφέρεται σε µία περιοχή συχνοτήτων φώνησης εντός της οποίας όλες οι νότες, για την ίδια φωνή, γίνονται αντιληπτές σαν να έχουν την ίδια φωνητική 37 Γ. Χρυσοχοΐδης
ποιότητα, και οι οποίες έχουν παραχθεί µε παρόµοιο τρόπο µέσα στο φωνητικό όργανο [14][16]. Υπάρχουν διάφορα φωνητικά διαγράµµατα από τα οποία µπορούµε να διακρίνουµε τα ακόλουθα [14]: 1. το τυπικό (modal) διάγραµµα, το οποίο χρησιµοποιείται στις χαµηλές συχνότητες φώνησης 2. το ψεύτικο (falsetto) διάγραµµα το οποίο χρησιµοποιούν οι ανδρικές φωνές µιµούµενοι τη γυναικεία φωνή 3. το θωρακικό (chest) διάγραµµα 4. το µεσαίο (middle) διάγραµµα 5. το κεφαλικό (head) διάγραµµα Τα σηµεία αλλαγής φωνητικών διαγραµµάτων (περάσµατα) για την αντρική φωνή είναι τα εξής: τυπικό-µεσαίο (200(G3) 350(F4)Hz), θωρακικό-µεσαίο (400(G4)Hz), και µεσαίο-κεφαλικό(660(e5)hz). Η περιοχή µεταξύ της πρώτης και της δεύτερης αλλαγής ρεγκίστρου στους οπερατικούς τραγουδιστές ονοµάζεται περιοχή περάσµατος (zona di passaggio) [1][14]. Η φωνή όταν βρίσκεται σε αυτή τη ζώνη και πρόκειται να µετατραπεί σε κεφαλική λέγεται «µεικτή» φωνή. Οι νότες οι οποίες αντιστοιχούν στα φωνητικά περάσµατα καθορίζουν τη φωνητική κατηγορία που ανήκει ο τραγουδιστής. Στην οπερατική φωνή τα περάσµατα εντοπίζονται ως εξής: για τον λυρικό οξύφωνο D4 G4, 300 400 Hz (24-30 ηµιτόνια πάνω από το D2(73Hz)), για τον βαρύτονο B3 E4, 247 330Hz (21-26 ηµιτόνια πάνω από το D2(73Hz)). Η φωνητική έκταση (pitch range) για µία τραγουδιστική φωνή ορίζεται η περιοχή συχνοτήτων φώνησης, δηλαδή όλοι οι µουσικοί τόνοι τους οποίους µπορεί να παράγει το φωνητικό όργανο ενός τραγουδιστή. 2.7 Βυζαντινή µουσική Ψαλτική τραγουδιστική φωνή Βυζαντινή µουσική (ΒΜ) είναι η παραδοσιακή µουσική της Ανατολικής Ορθόδοξης Εκκλησίας. Πρόκειται για µία µονοφωνική φωνητική µουσική, που εκτελείται κατά την τέλεση των ιερών ακολουθιών της Ανατολικής Ορθόδοξης Εκκλησίας. Η ΒΜ έχει µία αδιάκοπη ιστορική ροή, η πηγή της οποίας µπορεί να εντοπισθεί στις ψαλτικές διαλέκτους των πρώτων ευχαριστιακών κοινοτήτων της Χριστιανοσύνης. Με Γ. Χρυσοχοΐδης 38
την πάροδο των αιώνων, γνώρισε µία φυσική εξέλιξη εντός συγκεκριµένου παραδοσιακού πλαισίου. Η σηµειογραφία που χρησιµοποίησε η Βυζαντινή µουσική πέρασε από διάφορα στάδια εξέλιξης. Από την εκφωνητική µορφή πέρασε στη στενογραφική και κατέληξε στην σύγχρονη αναλυτική µορφή της µετά την µεταρρύθµιση των Τριών Διδασκάλων το 1814 [17][18]. Συγκεκριµένα, χρησιµοποιεί µία σειρά συµβόλων (Βυζαντινοί Μουσικοί Χαρακτήρες) για να περιγράψει τις µελωδίες, έχοντας σαν βάση ένα θεωρητικό µοντέλο κλιµάκων, Ήχων, όπως ονοµάζονται την Βυζαντινή Μουσική. Κάθε µελωδία περιγράφεται µε µία ακολουθία τέτοιων συµβόλων που αναπαριστούν µουσικά διαστήµατα ξεκινώντας από ένα αρχικό τονικό ύψος, την λεγόµενη Βάση του Ήχου, µίας ορισµένης µουσικής κλίµακας η οποία συµβολίζεται συνήθως µε µία αρχική µαρτυρία, την Μαρτυρία του Ήχου. Ανάµεσα στους µουσικούς χαρακτήρες παρεµβάλλονται κατά διαστήµατα σύµβολα που ονοµάζονται Μαρτυρίες και φανερώνουν τη βαθµίδα της κλίµακας του Ήχου στην οποία βρίσκεται το µέλος. Κάτω από τα µουσικά σύµβολα αναγράφονται οι στίχοι του εκκλησιαστικού κειµένου. Στις επόµενες εικόνες παρουσιάζουµε παραδείγµατα Βυζαντινής Μουσικής Σηµειογραφίας µε τα διάφορα στοιχεία που αναφέραµε παραπάνω. Εικόνα 1: Παράδειγµα Βυζαντινής µουσικής σηµειογραφίας 39 Γ. Χρυσοχοΐδης
Εικόνα 2: Βυζαντινή µουσική σηµειογραφία: Μουσικά σύµβολα, µαρτυρίες Το θεωρητικό µοντέλο των Ήχων πάνω στο οποίο βασίστηκε η Βυζαντινή Μουσική περιλαµβάνει οκτώ διαφορετικούς Ήχους τους οποίους κατατάσσει σε τρία γένη: διατονικό, εναρµόνιο, χρωµατικό, βάσει των διαστηµάτων µεταξύ των βαθµίδων της κλίµακας. Επιπλέον υπάρχουν και υποκατηγορίες των γενών όπως Μαλακό Χρωµατικό ή Σκληρό Χρωµατικό [17][18]. Για την περιγραφή των κλιµάκων χρησιµοποιείται το συγκερασµένο σύστηµα διαίρεσης του µουσικού διαστήµατος της οκτάβας σε 72 ίσα µέρη ( 72 2 σε λόγο συχνοτήτων), που ονοµάζονται µόρια. Στο σχήµα 3 παρουσιάζεται µία θεωρητική αναπαράσταση της διατονικής κλίµακας. Εικόνα 3: Κλίµακα µαλακού διατόνου Τα «εργαλεία» µελέτης και έρευνας της φωνής, τόσο της οµιλίας όσο και της τραγουδιστικής φωνής, βασίζονται σε τεχνικές επεξεργασίας ψηφιακού σήµατος και κυρίως στα φίλτρα [14]. Θεωρώντας το σύστηµα παραγωγής της φωνής σαν ένα απλό σύστηµα πηγής-φίλτρου, όπως αυτό που παρουσιάσαµε σε προηγούµενη παράγραφο, όπου η πηγή είναι οι φωνητικές χορδές και το φίλτρο είναι η φωνητική οδός, το αρχικόπηγαίο σήµα (όπως λέγεται ο πηγαίος-πρωτογενής ήχος) παραγόµενο από την φωνητική πηγή φιλτράρεται µέσα στις κοιλότητες της φωνητικής οδού και εξέρχεται από τα χείλη σαν ήχος φωνής. Γ. Χρυσοχοΐδης 40
3. ΜΕΘΟΔΟΣ ΕΡΓΑΣΙΑΣ 3.1 Επιλογή ηχητικού υλικού Η επιλογή του ηχητικού υλικού για τις αναλύσεις ήταν σχετικά εύκολη αφού το τµήµα Πληροφορικής και Τηλεπικοινωνιών διαθέτει µία πρότυπη συλλογή ηχογραφήσεων ψαλτικής φωνής, η οποία περιγράφεται στην επόµενη παράγραφο. Από την συλλογή επιλέχθηκαν 5 ψάλτες, οι εξής: 1. Αθανάσιος Βουγιουκλής 2. Γεώργιος Χατζηχρόνογλου 3. Χουρµούζιος (Χάρης) Νταραβάνογλου 4. Γρηγόριος Νταραβάνογλου 5. Αντώνιος Πλαΐτης Από το ηχογραφηµένο υλικό του κάθε ψάλτη εστιάσαµε στις ηχογραφήσεις της ανιούσας-κατιούσας διατονικής κλίµακας, έκτασης 2 οκτάβων, µεταξύ των τόνων A2 (110 Hz) και Α4 (440 Hz), που εκφωνήθηκαν για όλα τα φωνήεντα της Ελληνικής γλώσσας /a/, /e/, /i/, /o/ και /u/. Οι κλίµακες µας έδωσαν την δυνατότητα να βρούµε ηχητικά µέρη µέσης διάρκειας 1 sec, µε σχετικά «σταθερές» φωνητικές παραµέτρους, δηλαδή τµήµατα στα οποία τόσο η θεµελιώδης συχνότητα (pitch) αλλά η µορφή του φωνητικού σωλήνα παραµένουν σταθερές. Ένα ακόµα πλεονέκτηµα των κλιµάκων είναι ότι ο ψάλτης εξαντλεί τις δυνατότητες του σε ότι αφορά την φωνητική έκταση, περνώντας από όλα τα ρεγκίστρα. Αυτό µας δίνεται τη δυνατότητα να εξετάσουµε αν υπάρχει κάποια σχέση µεταξύ του formant tuning και των περιοχών-περασµάτων, που περιγράψαµε σε προηγούµενη παράγραφο, όπως αναφέρεται σε µελέτες που έχουν γίνει για την οπερατική φωνή [2][3][4][5]. 3.2 Πρότυπο σώµα ηχογραφήσεων ψαλτικών φωνών ΔΑΜΑΣΚΗΝΟΣ Ο όρος σώµα ηχογραφήσεων αναφέρεται σε συλλογή ηχογραφήσεων Βυζαντινής Εκκλησιαστικής Ψαλµωδίας (ΒΕΨ) µαζί µε την κατάλληλη επισηµείωση, µετα-δεδοµένα και φυσικά την αντίστοιχη τεκµηρίωση. Ο όρος επισηµείωση αναφέρεται στο σύνολο της πληροφορίας που µπορεί να παρασταθεί µέσω συµβόλων, σηµείων διαχωρισµού και 41 Γ. Χρυσοχοΐδης
ετικετών, που σχετίζονται άµεσα µε τα ηχογραφηµένα χρονικά σήµατα. Είναι δηλαδή µία διακριτή περιγραφή ενός χρονικού σήµατος. Το corpus ΔΑΜΑΣΚΗΝΟΣ [19][20][21] αποτελεί µία πρότυπη επισηµειωµένη συλλογή Βυζαντινής Εκκλησιαστικής ψαλµωδίας, µε καταγραφές από 20 καλά επιλεγµένους αντιπροσωπευτικούς ψάλτες, αυστηρά κάτω από τις ίδιες ελεγχόµενες συνθήκες ψηφιακής ηχογράφησης, µε παράλληλη-συγχρονισµένη καταγραφή ηλεκτρολαρυγγογραφήµατος (EGG), υπογλωττιδικής πίεσης και ροής αέρα. Η ψαλτική εκτέλεση κάθε υποκειµένου ακολούθησε δοµηµένο πρωτόκολλο και περιλάµβανε: α) συγκεκριµένα µουσικά µαθήµατα (παπαδικά, στιχηραρικά, ειρµολογικά και, γενικά, ποικίλα τροπάρια) όλων των ήχων της ΒΕΨ και β) µουσικές ασκήσεις σε όλες τις µουσικές κλίµακες ανά ήχο. Όλα τα µαθήµατα και οι ασκήσεις ηχογραφήθηκαν, εκτός της ψαλµώδησής τους, και κατά την προφορική και έµµελη απαγγελία τους από τα ίδια 20 υποκείµενα, κυρίως σε κανονική ένταση φωνής και στην βασική οκτάβα του C3. Το συγκεκριµένο σώµα ηχογραφήσεων αναπτύχθηκε στο τµήµα Πληροφορικής και Τηλεπικοινωνιών του Καποδιστριακού Πανεπιστηµίου Αθηνών, κατά τα έτη 2005-2008, µε σκοπό τη σχεδίαση και υλοποίηση ενός αξιόπιστου σώµατος ηχογραφήσεων Βυζαντινής Εκκλησιαστικής Ψαλµωδίας και Ελληνικού Οπερατικού Τραγουδιού, τέτοιο που να είναι εύκολα προσπελάσιµο και χρήσιµο σε µελλοντικές µελέτες και έρευνες. 3.3 Λογισµικό ανάλυσης Οι µετρήσεις που χρησιµοποιήθηκαν στην εργασία αυτή έγιναν µε τη χρήση του λογισµικού ανάλυσης φωνής PRAAT [22]. Το PRAAT αποτελεί ένα ευρέως διαδεδοµένο εργαλείο στο χώρο της ανάλυσης φωνής. Το λογισµικό αυτό περιλαµβάνει ενσωµατωµένες τις περισσότερες λειτουργίες που χρειαστήκαµε στην παρούσα ανάλυση. Είναι ικανό να χειριστεί σχετικά εύκολα τα πιο διαδεδοµένα είδη ηχητικών αρχείων εισάγοντάς τα (import) ως αντικείµενα (objects) στο περιβάλλον εργασίας του. Πάνω στα αντικείµενα αυτά είναι δυνατό να εφαρµοστούν ένα µεγάλο πλήθος λειτουργιών. Εκτός από τον χειρισµό των αρχείων ήχου το PRAAT είναι ικανό να χρησιµοποιηθεί ως εργαλείο επισηµείωσης κάνοντας χρήση ειδικών αρχείων (tagging files). Η επισηµείωση µπορεί να γίνει σε πολλαπλά επίπεδα (tiers). Κάθε επίπεδο επισηµείωσης αποτελείται από διαχωριστικά (boundaries) και τα διαστήµατα µεταξύ τους (intervals). Ετικέτες (labels) µπορούν να προστεθούν στα διαστήµατα µεταξύ των διαχωριστικών επιτυγχάνοντας κατ αυτό τον τρόπο την επισηµείωση του ηχητικού υλικού. Πολλά Γ. Χρυσοχοΐδης 42
επίπεδα επισηµείωσης µπορούν να αποτελέσουν ένα είδους αντικειµένου το οποίο το PRAAT ονοµάζει TextGrid object. Τα κύρια χαρακτηριστικά του PRAAT είναι: α. Μπορεί να χειριστεί µεγάλα αρχεία ήχου β. Μπορεί να εξάγει µετρήσεις χρησιµοποιώντας ένα µεγάλο πλήθος ενσωµατωµένων λειτουργιών φωνητικής ανάλυσης γ. Μπορεί να χρησιµοποιηθεί στην επισηµείωση του ηχητικού υλικού δ. Χρησιµοποιεί µία scripting γλώσσα µε την οποία µπορούν να αυτοµατοποιηθούν οι διαδικασίες ανάλυσης. Η scripting γλώσσα του PRAAT περιλαµβάνει µεταβλητές, loops, jumps, συναρτήσεις, πίνακες και άλλες προγραµµατιστικές δοµές. Το περιβάλλον αυτό σε συνδυασµό µε τις ενσωµατωµένες λειτουργίες ανάλυσης του PRAAT παρέχουν στον χρήστη ένα ευέλικτο προγραµµατιστικό περιβάλλον για την ανάπτυξη διαδικασιών και αλγορίθµων ανάλυσης φωνής. Η κύριες λειτουργίες που χρησιµοποιήθηκαν στην παρούσα έρευνα αυτές που σχετίζονται µε την εξαγωγή τιµών θεµελιώδους συχνότητας και συχνοτήτων formant. Για τον προσδιορισµό των τιµών της θεµελιώδους συχνότητας το PRAAT χρησιµοποιεί ένα αλγόριθµο ανίχνευσης της ακουστικής περιοδικότητας βασισµένο σε µία ακριβή µέθοδο αυτοσυσχέτισης [23]. Οι τιµές των φωνοσυντονισµών υπολογίζονται µε τη χρήση του αλγορίθµου του Burg [24][25]. Το λογισµό ανάλυσης PRAAT έχει χρησιµοποιηθεί σε ένα µεγάλο πλήθος δηµοσιεύσεων σε διεθνή συνέδρια και περιοδικά [26][27][28][29][30][31][32]. 3.4 Μέθοδος ανάλυσης Σε πρώτη φάση η µέθοδος ανάλυσης περιλάµβανε την κατάτµηση του ηχητικού υλικού των κλιµάκων στις µελωδικές υποµονάδες τους, τους τόνους της κλίµακας. Η κατάτµηση έγινε µε ηµιαυτόµατο τρόπο χρησιµοποιώντας το λογισµικό ανάλυσης φωνής PRAAT, το οποίο περιγράφεται µε περισσότερες λεπτοµέρειες στην προηγούµενη παράγραφο. Συγκεκριµένα, µία σειρά από scripts γραµµένα για το PRAAT χρησιµοποιήθηκαν για την ανάλυση της έντασης (intensity) και της θεµελιώδους συχνότητας (pitch) του ήχου [21]. Ακολούθησε η εισαγωγή των διαχωριστικών σε κατάλληλα σηµεία µε σκοπό την διάκριση των voiced/unvoiced περιοχών και των µουσικών τόνων της κλίµακας στα σηµεία αλλαγής τους pitch. Κατόπιν δόθηκε η δυνατότητα στον χρήστη να κάνει αλλαγές στην θέση των διαχωριστικών ώστε να πετύχει την επιθυµητή ακρίβεια. Στη συνέχεια εισήχθησαν ετικέτες µε την τιµή της µέσης 43 Γ. Χρυσοχοΐδης
θεµελιώδους συχνότητας και του ονόµατος της νότας στην οποία αντιστοιχεί η συχνότητα αυτή, σε καθεµία από τις περιοχές µεταξύ των διαχωριστικών. Οι επισηµειωµένες περιοχές εξήχθησαν (extract) και αποθηκεύτηκαν ως ξεχωριστά wav αρχεία ήχου. Η µέση διάρκεια αυτών των ηχητικών τµηµάτων ήταν 1 sec. Στη δεύτερη φάση κάθε ένα από τα επιµέρους αρχεία ήχου που εξήχθησαν αναλύθηκαν χρησιµοποιώντας τις ενσωµατωµένες λειτουργίες του PRAAT, έτσι ώστε να πάρουµε τις τελικές µετρήσεις. Συγκεκριµένα, οι ακόλουθες τρεις παράµετροι µετρούνταν κάθε 10 msec: τιµή θεµελιώδους συχνότητας f0, τιµές συχνότητας για τα formants F1 και F2 καθώς και κάποιες επιπλέον µετρήσεις όπως ένταση ήχου (intensity), εύρος ζώνης των formant, επίπεδο ισχύος των formant, επίπεδο ισχύος αρµονικών, οι οποίες όµως δεν χρησιµοποιήθηκαν στην παρούσα εργασία. Όλες οι µετρήσεις εξήχθησαν και αποθηκεύτηκαν σε tab-delimited αρχεία κειµένου. Ο scripting κώδικας για το PRAAT που αναφέρουµε παραπάνω βρίσκεται στο παράρτηµα IV της παρούσας εργασίας. 3.5 Επεξεργασία αποτελεσµάτων Για την επεξεργασία των αποτελεσµάτων χρησιµοποιήθηκε το πακέτο λογισµικού MATLAB. To MATLAB είναι λογισµικό που έχει καθιερωθεί παγκοσµίως στον χώρο των επιστηµονικών µετρήσεων και παρέχει µία µεγάλη γκάµα επιλογών για επεξεργασία, αναπαράσταση και προβολή των αποτελεσµάτων. Για την επεξεργασία των µετρήσεων αρχικά εισήχθησαν (import) τα tab-delimited αρχεία κειµένου των µετρήσεων και στη συνέχεια υπολογίστηκε για κάθε αρχείο η µέση τιµή του pitch και του κάθε formant F1 και F2. Ακολούθησε η αναπαράσταση των αποτελεσµάτων µε γραφικές παραστάσεις όπου παρουσιάζονται παράλληλα οι κυµατοµορφές των δύο formant F1 και F2 και αυτές των αρµονικών της θεµελιώδους συχνότητας, όπως φαίνεται στα παραρτήµατα ΠΑΡΑΡΤΗΜΑ Ι και ΠΑΡΑΤΗΜΑ ΙΙΙ, ενώ στο ΠΑΡΑΡΤΗΜΑ ΙΙ εµφανίζονται συγκεντρωτικά αποτελέσµατα για κάθε φωνήεν σε µορφή box plot διαγραµµάτων, 2 για κάθε φωνήεν, για την ανιούσα και κατιούσα κλίµακα αντίστοιχα. Ο κώδικας MATLAB που χρησιµοποιήσαµε βρίσκεται στο παράρτηµα IV της παρούσας εργασίας. Γ. Χρυσοχοΐδης 44
4. ΑΠΟΤΕΛΕΣΜΑΤΑ 4.1 Παρουσίαση των αποτελεσµάτων Σε αυτή την ενότητα θα γίνει παρουσίαση των αποτελεσµάτων των µετρήσεων για κάθε έναν από τους 5 ψάλτες, των οποίων οι ηχογραφήσεις αναλύθηκαν. Όπως έχουµε αναφέρει, µελετήσαµε για κάθε ψάλτη την περιοχή της διατονικής µουσικής κλίµακας, έκτασης 2 οκτάβες, µεταξύ των τόνων A2 (110 Hz) και Α4 (440 Hz), που εκφωνήθηκε για όλα τα φωνήεντα της Ελληνικής γλώσσας /a/, /e/, /i/, /o/ και /u/. Κάποιοι από τους ψάλτες επεκτάθηκαν ακόµα περισσότερο, κυρίως χαµηλότερα, και φυσικά συµπεριλάβαµε και αυτά τα αποτελέσµατα στην έρευνά µας. Ιδιαίτερη βαρύτητα δώσαµε στην παρατήρηση της περιοχής που είναι γνωστή ως «passaggio» (µετάβαση, πέρασµα), που για την αντρική φωνή του λυρικού οξύφωνου οπερατικού τραγουδιστή εντοπίζεται µεταξύ των τόνων E4-G4, 330-400 Hz (26-30 ηµιτόνια πάνω από το D2(73Hz)). Θυµίζουµε ότι ο όρος passaggio χρησιµοποιείται για την µεταβατική περιοχή µίας κλίµακας, µέσα στην οποία συµβαίνει η αλλαγή ρεγκίστρου φωνής, δηλαδή αποτελεί το πέρασµα µεταξύ στηθικής και κεφαλικής φωνής. Σύµφωνα µε την υπάρχουσα βιβλιογραφία το φαινόµενο του formant tuning παρουσιάζεται σε αυτή την περιοχή και ψηλότερα από αυτή [5]. Οι αρµονικές της θεµελιώδους συχνότητας f0 που εµφανίζονται στα διαγράµµατα είναι οι εξής: h2=2 f0, h3=3 f0, h4=4 f0, h5=5 f0, h6=6 f0, h7=7 f0, h8=8 f0. Τα διαγράµµατα χρησιµοποιούν σύστηµα αξόνων βαθµονοµηµένων σε ηµιτόνια µε βάση τη συχνότητα D2 = 73Hz (A4=440 Hz). Για την ευκολία του αναγνώστη παραθέτουµε τον πίνακα 1 στο ΠΑΡΑΡΤΗΜΑ Ι µε τις αντιστοιχίες µεταξύ του ονόµατος του τόνου, των αριθµό των ηµιτονίων µε βάση το D2 και τη συχνότητα σε Hz. Το σύνολο των διαγραµµάτων για κάθε ψάλτη παρατίθεται αναλυτικά στο ΠΑΡΑΡΤΗΜΑ Ι. 45 Γ. Χρυσοχοΐδης
4.2 Επιµέρους αποτελέσµατα ψαλτών Στην παράγραφο αυτή θα παρουσιάσουµε αναλυτικά τα αποτελέσµατα και τις σχετικές παρατηρήσεις για κάθε ψάλτη. 4.2.1 Ψάλτης 1: Αθανάσιος Βουγιουκλής Φωνήεν /a/ Στην άνοδο παρατηρούµε ότι µετά τον τόνο A#3 το δεύτερο formant συντονίζεται στην αρµονική h4 ενώ ένα τόνο ψηλότερα το πρώτο formant συντονίζεται και αυτό µε την αρµονική h2. Στην κάθοδο έχουµε παρόµοια συµπεριφορά καθώς στην ίδια περιοχή έχουµε συντονισµό των δύο κατώτερων formant F1 και F2 µε τις αρµονικές h2 και h4 αντίστοιχα. Φωνήεν /e/ Με εξαίρεση τους 4 υψηλότερους τόνους όπου εµφανίζεται συντονισµός του πρώτου formant µε την αρµονική h2 τόσο στην άνοδο όσο και στην κάθοδο, δεν παρουσιάζεται κάποιο άλλο φαινόµενο συντονισµού. Φωνήεν /i/ Παρουσιάζεται συντονισµός του πρώτου formant στην αρµονική h2 στο µεγαλύτερο µέρος της κλίµακας, στην ανάβαση και στην κατάβαση. Φωνήεν /o/ Παρατηρούµε συντονισµό των δύο formant F1 και F2 στις αρµονικές h2 και h4 αντίστοιχα, από τον τόνο G3 και πάνω κατά την άνοδο, ενώ στην κάθοδο το ίδιο φαινόµενο εµφανίζεται λίγο υψηλότερα από τον τόνο A3 και πάνω. Φωνήεν /u/ Παρουσιάζεται συντονισµός του πρώτου formant στην αρµονική h2, από τον τόνο G3 και πάνω, καθώς και του δεύτερου formant στους 3 υψηλότερους τόνους τις κλίµακας, κατά την άνοδο. Στην κάθοδο για το ίδιο φωνήεν δεν παρουσιάζεται κάποιο φαινόµενο συντονισµού. 4.2.2 Ψάλτης 2: Γεώργιος Χατζηχρόνογλου Σηµειώνουµε ότι ο συγκεκριµένος ψάλτης στην ανιούσα κλίµακα φτάνει έως τον τόνο A4, ενώ στην κατιούσα κλίµακα δεν περιέλαβε τους τόνους πάνω από D4. Γ. Χρυσοχοΐδης 46
Φωνήεν /a/ Στην άνοδο παρατηρούµε ότι µετά τον τόνο D4 τα δύο formant F1 και F2 συντονίζονται µε τις αρµονικές h2 και h4 αντίστοιχα, ενώ αντίθετα στην κάθοδο δεν εµφανίζεται συντονισµός. Φωνήεν /e/ Κατά παρόµοιο τρόπο παρατηρούµε ότι µετά τον τόνο D4 τα formant F1 συντονίζεται στην αρµονική h2. Στην ίδια συχνοτική περιοχή το F2 συντονίζεται αρχικά µε την αρµονική h5, ενώ στον υψηλότερο τόνο της κλίµακας συντονίζεται µε την αρµονική h4. Στην κάθοδο δεν παρουσιάζεται συντονισµός των formant. Φωνήεν /i/ Κατά το µεγαλύτερο µέρος της ανιούσας κλίµακας το πρώτο formant είναι συντονισµένο στην αρµονική h2. Το ίδιο συµβαίνει και στην κατιούσα κλίµακα για την περιοχή πάνω από τον τόνο G3. Φωνήεν /o/ Παρουσιάζεται συντονισµός των δύο formant F1 και F2 στις αρµονικές h2 και h4 αντίστοιχα, από τον τόνο C4 και πάνω. Κατά την κάθοδο φαίνεται να υπάρχει συντονισµός του F1 µε την αρµονική h3 κάτω από τον τόνο F3. Φωνήεν /u/ Κατά την άνοδο παρατηρούµε συντονισµό του πρώτου formant αρχικά στην αρµονική h3 (µέχρι τον τόνο E3) και στην συνέχεια στην αρµονική h2. Στην κατιούσα κλίµακα εµφανίζεται συντονισµός του F1 µε την h2 πάνω από τον τόνο G3. 4.2.3 Ψάλτης 3: Χουρµούζιος Νταραβάνογλου Ο συγκεκριµένος ψάλτης δεν παρουσιάζει το φαινόµενο του formant tuning παρά µόνο σε πολύ µικρά τµήµατα γεγονός που µας οδηγεί να πιστέψουµε ότι είναι συµπτωµατικό. Σε γενικές γραµµές τα δύο formant F1 και F2 εµφανίζονται να κινούνται ανεξάρτητα από τις αρµονικές. 4.2.4 Ψάλτης 4: Γρηγόριος Νταραβάνογλου Σηµειώνουµε ότι για αυτόν τον ψάλτη τα δεδοµένα µας περιορίζονται στις ανιούσες κλίµακες µόνο. 47 Γ. Χρυσοχοΐδης