Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Τομέας Τηλεπικοινωνιών Εργαστήριο Ηλεκτρακουστικής και Τηλεοπτικών Συστημάτων ΣΧΕΔΙΑΣΗ ΠΕΡΙΦΕΡΕΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΗΧΗΤΙΚΗΣ ΑΝΑΠΑΡΑΓΩΓΗΣ ΜΕ ΧΡΗΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΟΙΧΙΩΝ ΜΕΓΑΦΩΝΩΝ διπλωματική εργασία του Αλέξανδρου Κατσαπρακάκη Α.Ε.Μ.: 5199 Επιβλέπων καθηγητής: Γεώργιος Παπανικολάου Θεσσαλονίκη 2009 1
Για τη συμβολή τους στην εκπόνηση αυτής της διπλωματικής εργασίας θα ήθελα να ευχαριστήσω: Τον επιβλέποντα καθηγητή μου κ.γ.παπανικολάου για την κατάθεση της ιδέας στην οποία βασίστηκε αυτή η εργασία και τη βοήθειά του στον τομέα της θεωρίας. Τον υποψήφιο διδάκτορα κ.χ.σεβαστιάδη για τη βοήθεια και την επίβλεψη του στον τομέα της μοντελοποίησης και τη συμπαράσταση. 2
Κατάλογος περιεχομένων 1. Εισαγωγή.... 4 1.1.Η περιφερειακή αναπαραγωγή με γραμμικές συστοιχίες...5 2. Πολυκαναλικά και περιφερειακά ηχοσυστήματα.... 6 2.1.Πρότυπα και διατάξεις αναπαραγωγής περιφερειακού ήχου...6 3 κανάλια (3-0)...6 4 κανάλια (3-1)...7 7.1 κανάλια...8 10.2 κανάλια...8 2.2.Ιδιωτικά συστήματα...9 3. Εντοπισμός ηχητικής πηγής-στερεοφωνική αντίληψη ήχου.... 10 3.1.Διωτική διαφορά χρόνου (Interaural Time Difference - ITD)...10 3.2.Διωτική διαφορά έντασης (Interaural Level Difference - ILD)...12 3.3.Διωτική καθυστέρηση (binaural delay) και διάφορες μορφές του φαινόμενου προβαδίσματος (precedence effect)...13 3.4.Εντοπισμός σχετικά με την ηχητική αναπαραγωγή...15 3.5.IACC Interaural Cross-Correlation Coefficient Συντελεστής διωτικής ετεροσυσχέτισης.. 16 3.6.Φαινομενικό πλάτος πηγής (Apparent Source Width ASW)...17 3.7. Άλλοι παράγοντες εντοπισμού...19 4. Συστοιχίες μεγαφώνων.... 20 4.1.Περιοχές ακτινοβολίας γραμμικής συστοιχίας...20 4.2.Κατευθυντικότητα και απόκριση γραμμικής συστοιχίας...22 4.3.Διαστήματα μεταξύ των διπλανών στοιχείων γραμμικής συστοιχίας...27 4.4.Λογαριθμική συστοιχία...28 5. Σχεδίαση του συστήματος γραμμικών συστοιχιών.... 30 5.1.Προσαρμογή του συστήματος σε κλειστό χώρο...30 5.2.Καθορισμός των φίλτρων των συστοιχιών...31 5.3.Μοντελοποίηση εμβόλου...33 6. Μοντελοποίηση και προσομοίωση της προτεινόμενης διάταξης και της διάταξης 5.1.... 36 6.1.Μεταβολή του διαστήματος μεταξύ διαδοχικών πηγών της συστοιχίας...37 6.2.Μεταβολή του πλήθους των πηγών της συστοιχίας...40 6.3.Μεταβολή της τροφοδοσίας...44 6.4.Σύγκριση μεταξύ συστημάτων πραγματικών πηγών και συστημάτων ιδανικών εμβόλων...47 6.5.Μεταβολή των διαστάσεων του χώρου...48 6.6.Μεταβολή του συντελεστή απορρόφησης...57 6.7.Συμπεράσματα...59 6.8.Προτάσεις για μελλοντική μελέτη...59. ΠΑΡΑΡΤΗΜΑ A.Φυσιολογία του ακουστικού συστήματος..... 60.Α.1 Έξω αυτί...60 Ωτικό πτερύγιο (Pinna)...60 Εξωτερικό ακουστικό κανάλι (External Auditory Canal)...61.Α.2 Μέσο αυτί...61.α.3 Εσωτερικό αυτί...62.α.4 Απ'τον κοχλία στον εγκέφαλο...63 Άνω ελαιώδες σύμπλεγμα (Superior Olivary Complex-SOC)...64 Κάτω διδύμιο του μεσεγκεφάλου (Inferior Colliculus)...65. ΠΑΡΑΡΤΗΜΑ Β. Η μέθοδος των εικόνων.... 66 7. Βιβλιογραφία.... 67 3
1 Εισαγωγή Η ηχητική αναπαραγωγή είναι ένα κομμάτι της καθημερινής μας ζωής. Η ψυχαγωγία, η επικοινωνία, ακόμα και η ασφάλεια σχετίζονται ολοένα και περισσότερο με τη δυνατότητα αναπαραγωγής του ήχου και τα χαρακτηριστικά της. Η απεύθυνσή της αρχίζει να γίνεται μαζικότερη και τα ακροατήρια πιο σύνθετα και απαιτητικά. Η σύγχρονη τεχνολογία καλείται να καλύψει αυτά τα ακροατήρια με τρόπο οικονομικό, πρακτικό και αποτελεσματικό. Η ηχητική αναπαραγωγή που συνοδεύει την τηλεθέαση είναι ένας ιδιαίτερος τομέας, καθώς επηρεάζεται και επηρεάζει το αίσθημα του ακροατή που παρακολουθεί την κινούμενη εικόνα. Τα συστήματα αναπαραγωγής που σχεδιάζονται γι αυτό το σκοπό προσπαθούν να προσδώσουν στον ακροατή το αίσθημα του ρεαλισμού, την αίσθηση δηλαδή ότι βρίσκεται κι αυτός μέσα στο οπτικοακουστικό πεδίο που παρακολουθεί. Για να το πετύχουν αυτό απαιτείται η δυνατότητα περιφερειακής αναπαραγωγής ώστε ο ακροατής να δέχεται ηχητική πληροφορία απ'όλες τις δυνατές κατευθύνσεις όπως συμβαίνει και στην πραγματικότητα και όχι μόνο απ την κατεύθυνση της εικόνας που παρακολουθεί, όπως συμβαίνει μέχρι τις μέρες μας στη μουσική αναπαραγωγή. Για το λόγο αυτό χρησιμοποιείται ένας αριθμός καναλιών ο οποίος διατάσσεται στο χώρο με σαφή προσανατολισμό προς το μπροστινό μέρος του ακροατή όπου βρισκεται και η οθόνη στα σύγχρονα τηλεοπτικά συστήματα, αλλά και με τρόπο τέτοιο που να δίνει στον παραγωγό τη δυνατότητα να κατευθύνει το δυνατόν καλύτερα τον ήχο προς τον ακροατή, αν είναι δυνατόν κι απ'όλες τις κατευθύνσεις γύρω απ'το κεφάλι του. Για το σκοπό αυτό διερευνάται η δυνατότητα χρήσης γραμμικών συστοιχιών μεγαφώνων σε σύγκριση με τη χρήση ανεξάρτητων πηγών διανεμημένων στο χώρο, σύμφωνα με τη δημοφιλέστερη σύγχρονη διάταξη των 3/2 ή αλλιώς 5.1 καναλιών. 4
1.1 Η περιφερειακή αναπαραγωγή με γραμμικές συστοιχίες Η περιφερειακή αναπαραγωγή γίνεται πολύ δημοφιλής ιδιαίτερα στην κάλυψη μικρών χώρων, καθώς το ακροατήριο είναι πολύ περιορισμένο και είναι ευκολότερη και αποδοτικότερη η προσαρμογή του κάθε συστήματος σε μία μικρή περιοχή ακρόασης. Πολλά σπίτια είναι πλέον εξοπλισμένα με περιφερειακά συστήματα αναπαραγωγής. Παρατηρείται όμως συχνά η λάθος τοποθέτηση των συστημάτων με αποτέλεσμα αυτά να μην αποδίδουν σύμφωνα με τις προδιαγραφές τους. Επίσης, με την αύξηση των χρησιμοποιούμενων καναλιών δημιουργείται πρόβλημα με την εκτενή καλωδίωση που απαιτείται, ιδιαίτερα όταν τα ηχεία πρέπει να είναι διάσπαρτα στο χώρο. Μία πρόταση που ίσως μπορεί να δώσει λύση σ'αυτά τα προβλήματα είναι η χρήση συστοιχιών μεγαφώνων για την αναπαραγωγή του κάθε καναλιού. Όλες οι συστοιχίες θα μπορούν να τοποθετηθούν κάτω απ'την οθόνη, στη θέση του κεντρικού καναλιού. Το μεν κεντρικό κανάλι θα λειτουργεί κανονικά, με τις πρόσθετες δυνατότητες που προσφέρουν οι συστοιχίες, ενώ τα πλαϊνά κανάλια θα στοχεύουν τον ακροατή μέσω μιας ανάκλασης στον πλαϊνό τοίχο. Το ίδιο μπορεί να γίνει και για το πίσω μέρος της περιοχής ακρόασης, με δύο συστοιχίες που θα στοχεύουν προς το θεατή μέσω του τοίχου. Ένας σημαντικός παράγοντας που θα επηρέαζε ένα τέτοιο σύστημα θα ήταν ο ίδιως ο χώρος στον οποίο θα έπρεπε να λειτουργήσει και συγκεκριμένα οι διαστάσεις του και τα ανακλαστικά του χαρακτηριστικά. Η προσαρμογή του συστήματος στις διαστάσεις του χώρου επιτυγχάνεται με τη στρέψη της συστοιχίας, μία διαδικασία που θα μπορούσε να γίνει μηχανικά ή ηλεκτρονικά ακόμα και με αυτόματο τρόπο. Η επιρροή της απορρόφησης του χώρου διερευνάται στα πλαίσια ενός τυπικού οικιακού χώρου. 5
2 Πολυκαναλικά και περιφερειακά ηχοσυστήματα Η αρχή της πολυκαναλικής αναπαραγωγής έγινε το 1933 με ένα πείραμα στα εργαστήρια της Bell, όπου μία συναυλία της Ορχήστρας της Φιλαδέλφεια μεταδόθηκε στην Washington DC χρησιμοποιόντας τηλεφωνικές γραμμές για τη μετάδοση τριών καναλιών. Το 1940, η ταινία κινουμένων σχεδίων Fantasia της Disney ήταν η πρώτη που προβλήθηκε με περιφερειακό ήχο. Η πολυκαναλική εφαρμογή ονομάστηκε 'Fantasound' και αποτελούνταν από τρία ηχητικά κανάλια. Στη δεκαετία του 1950, ο Γερμανός συνθέτης Karlheinz Stockhausen πειραματίστηκε σε συνθέσεις του όπως τα Gesang der Jünglinge και Kontakte χρησιμοποιώντας πλήρως διακριτούς και περιστρεφόμενους τετραφωνικούς ήχους που είχαν παραχθεί ηλεκτρονικά. Το 'ηλεκτρονικό ποίημα' (Poeme Electronique) του συνθέτη Edgar Varese δημιουργήθηκε για το σχεδιασμένο απ'τον Ιάννη Ξενάκι Philips Pavilion το 1958 στις Βρυξέλλες και χρησιμοποιούσε 425 μεγάφωνα για να 'κινεί' τον ήχο μέσα στο ακροατήριο. Κι άλλοι συνθέτες επίσης πειραματίστηκαν με τον περιφερειακό ήχο εκείνη την εποχή. Στο πεδίο των καταναλωτικών εφαρμογών το 1970 κυκλοφόρησε ένα τετραφωνικό στερεοφωνικό σύστημα, στο οποίο καταβλήθηκε μεγάλη προσπάθεια στη βελτίωση του υλικού αλλά η κύρια αιτία της εμπορικής αποτυχίας ήταν η έλλειψη κατάλληλης λογισμικής υποστήριξης. Παρά την αποτυχία, η έρευνα γύρω απ'τον πολυκαναλικό ήχο συνεχίστηκε, κυρίως σε σχέση με το υψηλής ανάλυσης βίντεο. Το δημοφιλές σήμερα Surround Sound, ή αλλιώς περιφερειακός ήχος ήταν το αποτέλεσμα. Σημαντικός διαχωρισμός πρέπει να γίνει μεταξύ προτύπων/συμβάσεων τα οποία καθορίζουν το νούμερο και τη διάταξη των καναλιών ή ηχείων και των ιδιωτικών συστημάτων κωδικοποίησης και παράδοσης πολυκαναλικού ακουστικού σήματος. Στο θέμα επικρατεί μεγάλη σύγχυση. Στη συνέχεια γίνεται αναφορά κατ'αρχάς στις διάφορες διατάξεις που υλοποιούν τα συστήματα περιφερειακού ήχου και στη συνέχεια στα ιδιωτικά συστήματα[1]. 2.1 Πρότυπα και διατάξεις αναπαραγωγής περιφερειακού ήχου Οι δύο επικρατέστερες εμπορικές διατάξεις αναπαραγωγής ήχου είναι αναμφίβολα τη συγκεκριμένη χρονική περίοδο η χρησιμοποίηση δύο καναλιων στη μουσική και η χρησιμοποίηση των 5.1 καναλιών στον ήχο που συνοδεύει το βίντεο. Κάθε διάταξη ονομάζεται με δύο αριθμούς οι οποίοι εκφράζουν τον αριθμό των μπροστινών και τον αριθμό των πίσω καναλιών. 3 κανάλια (3-0) Διαθέτει δύο πλευρικά (αριστερό-l(left) και δεξί-r(right)) κι ένα κεντρικό (C-center) κανάλι. Χρησιμοποιείται για μεγάλο πλάτος περιοχής ακρόασης. Το μεγάλο πλάτος της κινηματογραφικής οθόνης επιβάλει την τοποθέτηση των πλευρικών ηχείων/καναλιών σε μεγάλη απόσταση μεταξύ τους, κάνοντας την ακουστική 'εικόνα' λιγότερο συμπαγή. Τα καταναλωτικά συστήματα χρησιμοποιούν μόνο τα πλευρικά ηχεία, παραλείποντας το κεντρικό, ως πιο εύκολη και οικονομική λύση (είναι και πιο εύκολη η τύπωση δύο καναλιών στον αναλογικό δίσκο), καθώς οι αποστάσεις είναι συνήθως μικρότερες. Το σύστημα ονομάζεται τότε 2-0,γνωστό και ως stereo, αν και ο όρος μάλλον δεν είναι δόκιμος. Συγκεκριμένα τα πλεονεκτήματα της χρησιμοποίησης και του κεντρικού καναλιού είναι η δυσκολότερη κατάρευση της ηχητικής 'εικόνας' κοντά σε ένα κανάλι, η πλατύτερη ηχητική σκηνή (τα κανάλια L,R μπορούν να τοποθετηθούν μέχρι και στις ±45 όταν χρησιμοποιείται και κεντρικό κανάλι αντί για τις ±30 στο 2-0). Επίσης, η κεντρική εικόνα υποστηρίζεται από την πραγματική πηγή στο κέντρο κι έτσι δε 6
διαμορφώνεται εξ ολοκλήρου απ'την αλληλεπίδραση των πλαϊνών πηγών και τα ελλατώματά της. Ως μειονέκτημα παρουσιάζεται η δυσκολία τοποθέτησης του κεντρικού καναλιού, καθώς η θέση του συμπίπτει με αυτή της οθόνης, εκτός της περίπτωσης ακουστικά διαφανούς οθόνης προβολής. 4 κανάλια (3-1) Στον κινηματογράφο επιχειρήθηκε ήδη απ'τη δεκαετία του 50 και με πρωτοπόρο τη Century Fox (Cinemascope) η χρησιμοποίηση ενός επιπλέον 'περιφερειακού/εφέ' καναλιού (Surround-S), χωρίς την πρόθεση δημιουργίας ηχητικής 'εικόνας' σε όλο το χώρο γύρω απ'τον ακροατή. Το περιφερειακό κανάλι λειτουργούσε απλά ως κανάλι εφέ διαχέοντας το περιφερειακό σήμα σε διάφορα περιμετρικά ηχεία. Μειονέκτημα θεωρήθηκε η κακή αίσθηση περίκλεισης και ευρυχωρίας (envelopment και spaciousness) που προκύπτει όταν τα σήματα που φτάνουν στα δύο αυτιά απ'το περιφερειακό κανάλι δεν είναι διαφορετικά ή τουλάχιστον ασυσχέτιστα σ'ένα βαθμό. 5.1 κανάλια (3-2) Εικόνα 2.1: Διάταξη αναφοράς του συστήματος 5.1 Η διάταξη προτυποποιήθηκε το 1993 στο ITU-R BS.775. Η χρήση του προτείνεται για μικρούς χώρους και αποστάσεις ακρόασης από 2 έως 4m. Τα δύο πίσω κανάλια υποστηρίζουν τα εφέ, τη δημιουργία 'ατμόσφαιρας' του δωματίου ή την 'εντύπωση' του δωματίου. Μπορεί να επιτευχθεί δημιουργία 'εικόνας' σε όλο το εύρος των 360 μόνο μέσω τεχνικών ηχογράφησης ή επεξεργασίας του σήματος, όπως είναι οι περίπλοκοι νόμοι οριζόντιας στάθμισης (panning) και η χρήση ψυχοακουστικών πινάκων. Η τοποθέτηση των δύο πίσω καναλιών στις ±110 είναι ένας συμβιβασμός μεταξύ της απαίτησης για panning και της απαίτησης για πλαϊνή ενέργεια για καλύτερη αίσθηση περίκλεισης. Υπάρχει η δυνατότητα για περισσότερα περιφερειακά κανάλια ομοιόμορφα διανεμημένα όπως στο 3-1. Εισάγει ένα εφέ κανάλι με περιεχόμενο στις πολύ χαμηλές συχνότητες έως και τα 120Hz (LFE-Low Frequency Effect). Κάθε ήχος χαμηλής συχνότητας που είναι σημαντικός για την ακεραιότητα και την κατανόηση του περιεχόμενου δεν πρέπει να περιλαμβάνεται στο LFE, αλλά στα κανάλια ευρείας ζώνης. Η χρησιμοποίηση του καναλιού αυτού είναι απαραίτητη μόνο για την 'καλλιτεχνική ακεραιότητα'. Οι περιορισμοί του πρότυπου είναι η στενή μπροστινή ηχητική σκηνή 7
λόγω και πάλι της απαίτησης συμβατότητας με το 2-0, όπως και η επίτευξη ακριβής 'εικόνας' σε όλο το εύρος των 360. Ακόμα παρατηρείται μία μεγάλη 'τρύπα' στην 'εικόνα' πίσω απ'το θεατή και το κεντρικό κανάλι μπορεί να προκαλέσει προβληματική ισοστάθμιση στο δικαναλικό μουσικό περιεχόμενο. Ένα τελευταίο πρακτικό πρόβλημα, το οποίο είναι αρκετά σημαντικό και συναντάται και στις επόμενες πιο πολύπλοκες διατάξεις είναι αυτό της καλωδίωσης, καθώς με δεδομένο πλέον το χαμηλό κόστος ενός τέτοιου συστήματος, ο καταναλωτής καλείται να το τοποθετήσει συνήθως μόνος του. 7.1 κανάλια Περιλαμβάνει τα κανάλια του 5.1 και επιπλέον ένα κεντρικό αριστερό (CL) κι ένα κεντρικό δεξί κανάλι (CR). Χρησιμοποιείται σε μεγάλους κινηματογράφους και μπορεί να δημιουργεί πολύ πλατιές 'εικόνες'. Χρησιμοποιείται στα Sony SDDS και στο Dolby Stereo των 70mm. 10.2 κανάλια Δημιουργήθηκε για να 'καλύψει τις τρύπες' των προγούμενων συστημάτων χρησιμοποιώντας κεντρικά πίσω κανάλια, 2 κανάλια ύψους και τοποοθετώντας τα μπροστινα πλευρικά κανάλια σε μια πιο πλατιά διάταξη. Επίσης προβλέπει δεύτερο LFE για την επίτευξη αίσθηση ευρυχωρίας μέσω του πλευρικού διαχωρισμού του αποσυσχετισμένου περιεχομένου χαμηλών συχνοτήτων. 8
2.2 Ιδιωτικά συστήματα Για την κωδικοποίηση και μεταφορά του πολυκαναλικού ήχου δεν υπάρχει συγκεκριμένη προτυποποίηση κι έτσι χρησιμοποιούνται ιδιόκτητα συστήματα. Πριν την εισαγωγή της ψηφιακής τεχνολογίας στο συγκεκριμένο πεδίο, χρησιμοποιήθηκαν μέθοδοι κωδικοποίησης οι οποίες επέτρεψαν τη μετατροπή του δικαναλικού ήχου σε πολυκαναλικό και αντίστροφα. Απ'τις πιο γνωστές είναι το Dolby Stereo το οποίο έχει τη δυνατότητα να μεταφέρει 6 κανάλια στο φίλμ 70mm και 4 κανάλια στο φίλμ 35mm. Το περιφερειακό (S) κανάλι είναι μονοφωνικό. Το Dolby Surround είναι το αντίστοιχο καταναλωτικό σύστημα. Στο περιφερειακό κανάλι επιβάλλεται μια καθυστέρηση 2030ms στον αποκωδικοποιητή ώστε να εντοπίζεται η ακουστική 'εικόνα' μπροστά απ'το θεατή και να μην υπάρχει σύγχυση στον εντοπισμό στο επίπεδο μηδενικού αζιμούθιου. Το Dolby ProLogic είναι μεταγενέστερο και χρησιμοποιεί εξελιγμένους μηχανισμούς στρέψης (sophisticated steering mechanisms) του ήχου. Το Circle Surround της Rocktron Corporation είναι το πρώτο που εισάγει το στερεοφωνικό περιφερειακό κανάλι. Παρέχει δυνατότητα λειτουργίας για μουσική και μπορεί να στρέφει ξεχωριστά τα πίσω κανάλια. Το Lexicon Logic 7 παραδίδει 7 εισόδους ηχείων (L,C,R,RS,LS,side L, side R) ώστε τα περιφερειακά ηχεία να μπορούν έτσι να μεταφερθούν πιο πίσω 'γεμίζοντας την τρύπα' στο πίσω μέρος του ακροατή. Το Dolby EX ('98) είναι ένα υβριδικό (discrete/matrixed) σύστημα το οποίο έχει τη δυνατότητα να παραδίδει ένα πίσω κεντρικό κανάλι. Με την εισαγωγή της ψηφιακής τεχνολογίας έγινε εφικτή η ταυτόχρονη και διακριτή μεταφορά πολλαπλών καναλιών. Το Dolby Digital ή AC-3, που είναι η ψηφιακή εκδοχή των Dolby Stereo/Surround, μπορεί να χρησιμοποιηθεί για διάφορες απαιτήσεις ηχητικών σημάτων και παρέχει ρυθμούς δεδομένων από 32Κbps έως 640Kbps. Χρησιμοποιείται ευρέως στα φιλμ κινηματογραφικών ταινιών 35mm και για περιφερειακό ήχο σε DVD και ψηφιακές μεταδόσεις. Εφαρμόζει μια ολίσθηση φάσης 90 στα πίσω κανάλια για να πετύχει καλύτερο διαχωρισμό της μπροστά και πίσω ηχητικής 'σκηνής'. Το DTS (Digital Theatre Systems) προσφέρει ρυθμούς δεδομένων από 32Kbps έως και 4,096Mbps και έως 8 ηχητικά κανάλια με δυνατότητα μεταβλητού ρυθμού δεδομένων (Variable Bit Rate VBR) και δυνατότητα μη απωλεστικής κωδικοποίησης. Το SDDS (Sony Dynamic Digital Sound) υποστηρίζει τη διάταξη 5.1 και προσφέρει 5:1 συμπίεση σε σχέση με το PCM. Το MPEG-2 κυκλοφορεί σε έκδοση συμβατή προς τα πίσω (MPEG-2 BC) και σε μη συμβατή (MPEG-2 AAC). To MPEG-4 περιέχει διάφορες κλιμακωτές επιλογές πολυκαναλικής κωδικοποίησης. Το MLP (Meridian Lossless Packing) έχει δυνατότητα παράδοσης πολλών καναλιών και ενσωμάτωσης ιεραρχικών διαδικασιών κωδικοποίησης όπως τα Ambisonics. Αυτά επεκτείνονται εκτός της κωδικοποίησης και στη διαδικασία εγγραφής και αναπαραγωγής του ήχου με στόχο την πλήρη αναπαράσταση ενός διδιάστατου ή και τρισδιάστατου ηχητικού πεδίου. 9
3 Εντοπισμός ηχητικής πηγής-στερεοφωνική αντίληψη ήχου Μία απ'τις πολύ σημαντικές ιδιότητες της ακοής είναι η ικανότητα εντοπισμού της χωρικής προέλευσης μιας ηχητικής πηγής, δηλαδή του καθορισμού των συντεταγμένων της θέσης της πηγής σε σχέση με τον ακροατή. Οι πιο χρήσιμες συντεταγμένες φαίνεται να είναι οι πολικές: η απόσταση του κεφαλιού του ακροατή από την πηγή (μήκος ακτίνας),η γωνία μεταξύ της ακτίνας και της κάθετης επιφάνειας συμμετρίας του κεφαλιού (αζιμούθιο) και η γωνία μεταξύ της ακτίνας και της οριζόντιας επιφάνειας που περνάει μέσα απ'τα κέντρα των αυτιών (γωνία ανύψωσης). Η αντίληψη του ήχου είναι υποκειμενική και το θέμα του μηχανισμού που χρησιμοποιεί ο εγκέφαλος για να εντοπίσει τη θέση μιας ηχητικής πηγής είναι ακόμα υπό μελέτη. Ο βασικός μηχανισμός της κατευθυντικής ακοής περιγράφτηκε ήδη στα τέλη του 19ου αιώνα απ'τον Rayleigh με μία θεωρία που βασιζόταν στις χρονικές διαφορές ανάμεσα στα αυτιά για τις χαμηλές συχνότητες και τις διαφορές έντασης για τις ψηλότερες συχνότητες. Το μοντέλο Woodworth θεωρεί το κεφάλι ως μια στερεά σφαίρα και θέτει τα 1500Hz ως τη συχνότητα διαχωρισμού των παραπάνω συμπεριφορών και οι μετρήσεις του Feddersen και άλλων δείχνουν να το ενισχύουν, αποδεικνύεται όμως λανθασμένο από μεταγενέστερες παρατηρήσεις. Αποδεικνύεται ότι οι χρονικές διαφορές έχουν μία μικρή εξάρτηση απ'τη συχνότητα, ειδικά για την περιοχή πάνω απ'τα 500Hz και κάτω απ'τα 3KHz. Ακόμα, ο εντοπισμός σύνθετων ήχων ψηλής συχνότητας βασίζεται μεν στις διαφορές έντασης, αλλά επηρεάζεται και απ'τις χρονικές διαφορές. Ακόμα, υπάρχει εξάρτηση των μηχανισμών εντοπισμού μιας ηχητικής πηγής απ'την ίδια την πηγή, απ'τη φύση δηλαδή του προσλαμβανόμενου ηχητικού σήματος. Το μεγαλύτερο μέρος της λειτουργίας του εντοπισμού χωρικής προέλευσης μιας ηχητικής πηγής βασίζεται στην ύπαρξη δύο αυτιών και στις διαφορές των σημάτων σε αυτά, αν και έχει αποδειχθεί η δυνατότητα καθορισμού της χωρικής προέλευσης μιας ηχητικής πηγής σε λειτουργία με ένα μόνο αυτί. Όπως φαίνεται και στην εικόνα 3.1 διακρίνονται δύο είδη διαφορών: οι διωτικές διαφορές έντασης/στάθμης (Interaural Intensity/Level Difference IID/ILD) και οι διωτικές διαφορές χρόνου (Interaural Time Difference ITD). Οι χρονικές διαφορές μπορούν να χωριστούν σε δύο κατηγορίες: τις διαφορές στο 'φάκελο' του σήματος (ITD στο σχήμα) και τις διαφορές στις λεπτομέρειες της κυματομορφής (IPD Interaural Phase Difference Διωτική διαφορά φάσης). Οι δεύτερες είναι πιο σημαντικές για την αντίληψη της χωρικής προέλευσης. 3.1 Διωτική διαφορά χρόνου (Interaural Time Difference - ITD) Μία ηχητική πηγή που βρίσκεται σε κάθε θέση εκτός του κύριου άξονα (γωνία αζιμούθιου 0 μοίρες, ευθεία μπροστά απ το κεφάλι του ακροατή) θα έχει ως αποτέλεσμα μια χρονική διαφορά στα σήματα που φτάνουν στα δύο αυτιά. Η διαφορά αυτή εξαρτάται απ'τη γωνία πρόσπτωσης και γίνεται μέγιστη για πηγές ακριβώς απέναντι από το ένα αυτί (αζιμούθιο ±90 μοιρών) με τιμή 650μs που ονομάζεται διωτική καθυστέρηση (binaural delay). Ο ανθρώπινος εγκέφαλος είναι ικανός να διακρίνει την κατεύθυνση προέλευσης με ανάλυση μέχρι και μερικές μοίρες με αυτή τη μέθοδο. Απ'την άλλη δεν υπάρχει δυνατότητα εντοπισμού της γωνίας ανύψωσης όπως και διάκρισης μεταξύ μπροστινών και πισινών πηγών, αλλά ένας τρόπος για να αντιμετωπιστεί αυτό είναι λαμβάνοντας υπ'όψιν την κίνηση του κεφαλιού (ή και την 10
κίνηση των ίδιων των αυτιών σε ζώα). Για παράδειγμα, για δύο πηγές που βρίσκονται η μία στο μπροστινό και η άλλη στο πίσω μέρος του κεφαλιού και στην ίδια γωνία αζιμούθιου η κίνηση του κεφαλιού προς μία συγκεκριμένη κατεύθυνση θα έχει ως αποτέλεσμα αντίθετες αλλαγές στη χρονική άφιξη των σημάτων των δύο πηγών. Οι 'ιδέες' -τα στοιχεία δηλαδή που χρησιμοποιεί ο εγκέφαλος για τον εντοπισμόπου είναι διαθέσιμες από την επεξεργασία των χρονικών διαφορών καταγράφονται κυρίως στην διάρκεια έναρξης και λήξης των ήχων (onset και offset) και φαίνεται να βασίζονται στο περιεχόμενο χαμηλών συχνοτήτων του σήματος. Η ευαισθησία αρχίζει να υποβαθμίζεται πάνω απ'τα 1000-1500Hz, όπου το μήκος κύματος αρχίζει να γίνεται μικρότερο απ'την απόσταση μεταξύ των αυτιών. Στις ψηλές συχνότητες χρησιμοποιύνται οι διαφορές στα onset και offset του συνολικού φακέλου του σήματος. Θεωρώντας ημιτονοειδή σήματα η διαφορά στους χρόνους άφιξης του ήχου στα δύο αυτιά είναι ισοδύναμη με μία διαφορά φάσης. Εικόνα 3.1: Διωτικές διαφορές έντασης(ild) και χρόνου (ITD/IPD) 11
3.2 Διωτική διαφορά έντασης (Interaural Level Difference - ILD) Το μέγεθος του κεφαλιού αποτελεί ένα σημαντικό εμπόδιο για τον ήχο στις ψηλές συχνότητες αλλά όχι και στις χαμηλές. Ακόμα, το περίεργο σχήμα του έξω αυτιού (pinna) δημιουργεί ανακλάσεις και συντονισμούς που αλλάζουν το φάσμα του ήχου σε συνάρτηση με τη γωνία πρόσπτωσης. Παρόμοια αλλά σε πολύ μικρότερο βαθμό επιδρούν οι ανακλάσεις απ'τους ώμους και το σώμα. Επίσης, για μια πηγή πολύ κοντά στο κεφάλι κι εκτός του κεντρικού άξονα και διάδοση σφαιρικού κύματος, μία 'ιδέα' μπορεί να δοθεί απ τη διαφορά στην απόσβεση λόγω της επιπλέον απόστασης που διανύεται μεταξύ των αυτιών (για συνήθεις αποστάσεις η διαφορά αυτή είναι ασήμαντη αφού η επιπλέον απόσταση είναι αμελητέα σε σχέση με αυτή που ήδη έχει διανυθεί). Το άθροισμα όλων αυτών των λειτουργιών είναι μια μοναδική ανατομική συνάρτηση μεταφορας (ATF-anatomical transfer function ή HRTF-head related transfer function) για κάθε απόσταση πηγής και γωνία πρόσπτωσης, συμπεριλαμβανομένων διαφορετικών γωνιών ανύψωσης και θέσεων κατά τον κεντρικό άξονα (μπροστά-πίσω). Για κάθε δυνατή κατεύθυνση στη συνάρτηση μεταφοράς υπάρχουν διάφορες φασματικές κορυφές και βυθίσματα, ειδικά στις ψηλές συχνότητες. Αυτή είναι μια μοναδική μορφή κατευθυντικής κωδικοποίησης που μπορεί να μάθει ο εγκέφαλος. Τυπικά, οι πηγές στο πισω μέρος του ακροατή προκαλούν μειωμένη απόκριση ψηλών συχνοτήτων σε σχέση με πηγές που βρίσκονται μπροστά του, κάτι που οφείλεται στο ελαφρώς προς τα μπροστά κεκλιμένο σχήμα του εξωτερικού αυτιού. Έχουν βρεθεί στοιχεία για την ύπαρξη 'κατευθυντικών ζωνών', περιοχών δηλαδή του φάσματος συχνοτήτων που εμφανίζονται αποσβεσμένες ή ενισχυμένες για συγκεκριμένες θέσεις στο κάθετο επίπεδο συμμετρίας του κεφαλιού. Η περιοχή γύρω απ'τα 8kHz φαίνεται να αντιστοιχίζεται στην αντίληψη πηγής πάνω απ το κεφάλι, ενώ οι περιοχές 300-600 και 3000-6000Hz σχετίζονται με την αντίληψη στο μπροστινό μέρος του κεφαλιού. Με την αντίληψη της χωρικής προέλευσης ενός ήχου στο πίσω μέρος του κεφαλιού φαίνεται να σχετίζονται περιοχές με κέντρο τα 1200 και 12000Hz (Blauert). Εκτός απ'αυτές τις ευρείες ζώνες συχνοτήτων έχουν αναγνωριστεί στενά φασματικά βυθίσματα και κορυφές που αντιστοιχούν σε συγκεκριμένες θέσεις πηγών, όπως: μπροστά οκταβικό βύθισμα με το κατώτερο άκρο μεταξύ 4 και 8kHz και αυξημένη ενέργεια πάνω απ'τα 13kHz, πάνω τεταρτοκταβική κορυφή μεταξύ 7 και 9kHz, πίσω μία μικρή κορυφή μεταξύ 10 και 12kHz με μείωση της ενέργειας πάνω και κάτω απ'αυτήν. Ακόμα, η ανύψωση της πηγής στο μπροστινό μέρος του κεφαλιού προκαλεί μεταβλητό οκταβικό βύθισμα με χαμηλότερη συχνότητα αποκοπής μεταξύ 5 και 11kHz (Herbank και Wright)[1]. Όπως αναφέρθηκε και πριν, έχει αποδειχθεί η ικανότητα εντοπισμού με ένα αυτί. Οι HRTFs υπερθέτονται στο φυσικό φάσμα των πηγών. Είναι γι αυτό δύσκολο να καταλάβουμε πως ο εγκέφαλος μπορεί να χρησιμοποιεί τα μονοωτικά φασματικά χαρακτηριστικά των ήχων για να καθορίσει την προέλευσή τους, αφού θα ήταν δύσκολο να ξεχωρίσει τα τονικά χαρακτηριστικά των πηγών από αυτά που προσθέτονται από τις ανατομικές συναρτήσεις μεταφοράς. Υπάρχουν όμως στοιχεία για μονοωτικές 'ιδέες' που παρέχουν πληροφορία για την κατευθυντικότητα. Φαίνεται πως ο εγκέφαλος είναι ικανός να συγκρίνει μονοωτικές HRTF με αποθηκευμένα μοτίβα για να καθορίσει τη θέση της πηγής. Οι μονοωτικές 'ιδέες' είναι πιο ανιχνεύσιμες με κινούμενες πηγές και ίσως σχετίζονται με τον εντοπισμό στο κάθετο επίπεδο συμμετρίας του κεφαλιού, όπου οι διαφορές μεταξύ των αυτιών είναι ελάχιστες. Για γωνία αζιμούθιου διάφορη του 0 είναι πιο πιθανό να είναι οι διαφορές μεταξύ των HRTFs αυτές που βοηθούν τον εγκέφαλο στον ηχοεντοπισμό. Τα ανθρώπινα ωτικά πτερύγια ποικίλουν ευρέως σε σχήμα και μέγεθος. Το ίδιο λοιπόν και οι HRTFs, κάτι που δυσκολεύει τη γενίκευση των συναρτήσεων σε μεγάλο 12
αριθμό ατόμων. Σε πειράματα όπου στα υποκείμενα αποκλείονται τα ωτικά πτερύγια και τα σήματα τροφοδοτούνται απευθείας στο ακουστικό κανάλι προσομοιώνοντας έτσι την HRTF κάποιου άλλου ανθρώπου, η ικανότητα εντοπισμού μειώνεται σημαντικά. Μετά από λίγο χρόνο όμως παρατηρείται προσαρμογή στα νέα δεδομένα[2]! Έχει γίνει προσπάθεια γενίκευσης των λεπτομερειών των HRTF και έχει αποδειχθεί ότι είναι εφικτό αλλά οι άνθρωποι φυσικά εντοπίζουν καλύτερα με τη δική τους HRTF. 3.3 Διωτική καθυστέρηση (binaural delay) και διάφορες μορφές του φαινόμενου προβαδίσματος (precedence effect) Υπάρχει μία σημαντική διαφορά σε αυτό που αντιλαμβανόμαστε όταν δύο αυτιά εντοπίζουν ένα μέτωπο κύματος με μία σχετική καθυστέρηση και όταν δύο αφίξεις του ίδιου ή όμοιου ήχου φτάνουν από διαφορετικές κατευθύνσεις και γίνονται αντιληπτές κι απ'τα δύο αυτιά. Η πρώτη περίπτωση αναφέρθηκε πριν και ονομάζεται διωτική καθυστέρηση και η δεύτερη συμβάλει κι αυτή στον εντοπισμό με τις διάφορες μορφές του φαινόμενου προβαδίσματος (precedence effect) ή αλλίως νόμο του πρώτου μετώπου κύματος όπως αυτό ονομάζεται(εικ.3.2). Για ακρόαση με ηχεία και όχι ακουστικά το φαινόμενο προβαδίσματος είναι σημαντικό. Σ'αυτήν την περίπτωση υπάρχουν τουλάχιστον δύο ηχητικές πηγές που εκπέμπουν διαφορετικές εκδοχές του ίδιου ήχου, ίσως με μία διαφορά χρόνου ή πλάτους ώστε να προσδίδεται κατευθυντική πληροφορία. Είναι φαινόμενο κυρίως των 'transient' ήχων ( μικρής διάρκειας, ασυνεχείς ήχοι) περισσότερο απ'ότι των συνεχών. Και τα δύο αυτιά ακούνε όλα τα ηχεία και ο εγκέφαλος τείνει να εντοπίσει τον ήχο βασιζόμενος στη διωτική καθυστέρηση που προκύπτει απ'το πρώτο μέτωπο κύματος. Η πηγή φαίνεται να έρχεται απ'την κατεύθυνση απ'την οποία φτάνει το πρώτο σήμα. Υπάρχουν όμως όρια στη λειτουργία αυτής της διαδικασίας. Λειτουργεί με καθυστερήσεις που είναι λίγο μεγαλύτερες από την διωτική καθυστέρηση, της τάξης μερικών milliseconds. Όμοιοι ήχοι οι οποίοι φτάνουν με διαφορά μέχρι 50ms μεταξύ τους τείνουν να 'αναμιγνύονται' αντιληπτικά, έτσι ώστε να μη γίνονται αντιληπτοί ο ένας ως η ηχώ του άλλου. Η χρονική καθυστέρηση για την οποία συμβαίνει αυτό το φαινόμενο 'μίξης' εξαρτάται απ'την ίδια την πηγή, με τα κλικς να ξεχωρίζουν νωρίτερα απ'ότι οι σύνθετοι ήχοι όπως η μουσική ή η ομιλία Μία μορφή του φαινόμενου προβαδίσματος αναφέρεται ως φαινόμενο Haas απ'το Δανό επιστήμονα που πραγματοποίησε κάποια απ'τα αρχικά πειράματα γύρω απ'την αντίληψη της ομιλίας, με παρουσία μίας και μοναδικής ηχούς. O Haas αντιλήφθηκε ότι η καθυστερημένη ηχώ έπρεπε να γίνει αρκετά πιο ηχηρή απ'τον αρχικό ήχο για να γίνει Εικόνα 3.3: Φαινόμενο Haas αντιληπτή ως ίση. Η σχετική διαφορά στάθμης μεταξύ ανάκλασης και αρχικού ήχου που 13
απαιτείται ώστε και τα δύο να ακούγονται ίσα, εξαρτάται απ το πόσο καθυστερημένη είναι η ανάκλαση, όπως φαίνεται και στην εικόνα 3.3. Εικόνα 3.2: α)διωτική καθυστέρηση και β) φαινόμενο προβαδίσματος 14
3.4 Εντοπισμός σχετικά με την ηχητική αναπαραγωγή Οι διαφορές χρόνου και έντασης ανάμεσα στα δύο αυτιά χρησιμοποιούνται παράλληλα απ'τον εγκέφαλο για τον εντοπισμό της ηχητικής πηγής και μάλιστα έχει αποδειχθεί ότι είναι δυνατό ο ένας μηχανισμός να αντισταθμίσει την επίδραση του άλλου. Διάφοροι ερευνητές έχουν ασχοληθεί με το θέμα και έχουν καταλήξει σε διαφορετικές τιμές για το νούμερο των db, το μέγεθος δηλαδή της διαφοράς έντασης που απαιτείται ώστε να αντισταθμίσει μία συγκεκριμένη τιμή μs της χρονικής διαφοράς. Φαίνεται να υπάρχει σ'ένα βαθμό εξάρτηση απ'τη φύση της ηχητικής διέγερσης στο απαιτούμενο μέγεθος για την αντιστάθμιση. Μία σύνοψη αυτής της διαδικασίας φαίνεται στην εικόνα 3.4(Madsen). Εδώ, η ανταλλαγή χρόνου-πλάτους σταματάει να είναι δυνατή μόλις η καθυστέρηση φτάσει τη μέγιστη τιμή της διωτικής καθυστέρησης. Για μεγαλύτερες καθυστερήσεις αντιλαμβανόμαστε την προέλευση του ήχου προς την κατεύθυνση του ήχου που φτάνει πρώτος μέχρι οι δύο ήχοι να γίνονται αντιληπτοί ως διαφορετικοί. Υπάρχει πάντως τεράστια διαφορά μεταξύ των τιμών στις οποίες έχουν καταλήξει διάφοροι ερευνητές για να επιτευχθεί ανταλλαγή των φαινομένων της διαφοράς χρόνου και έντασης ως προς τον εντοπισμό. Οι τιμές ποικίλουν από 1.7μs/dB μέχρι και 120μs/dB, σε πειράματα όμως που πραγματοποιήθηκαν με διαφορετικές διεγέρσεις. Γενικά, οι transients ήχοι φαίνονται να παρουσιάζουν το φαινόμενο της ανταλλαγής ευκολότερα απ'ότι οι τόνοι. Εικόνα 3.4: Περιοχές λειτουργίας μηχανισμών διαφορών χρόνου και έντασης 15
3.5 IACC Interaural Cross-Correlation Coefficient Συντελεστής διωτικής ετεροσυσχέτισης Είναι η μέτρηση της συσχέτισης των ήχων που φτάνουν στα δύο αυτιά ενός ακροατή. Συνήθως υπολογίζεται ηχογραφώντας τις εξόδους δύο πολύ μικρών μικρόφωνων που τοποθετούνται στις εισόδους των ακουστικών καναλιών του κάθε αυτιού ενός ατόμου ή ενός τεχνητού εξομοιωτή κεφαλιού (dummy head). Στη συνέχεια με ένα υπολογιστικό πρόγραμμα υπολογίζονται τρεις διαοφορετικές εκδοχές του συντελεστή. Στην παρούσα εργασία τα σήματα στις εισόδους των ακουστικών καναλιών είναι διαθέσιμα απ'το EARS module του EASE και για τον υπολογισμό του IACC χρησιμοποιείται το πρόγραμμα Dirac 3.0 της Brüel & Kjær. Η συνάρτηση διωτικής ετεροσυσχέτισης δίνεται από τον εξής τύπο: t2 IACFt1t2 (τ ) = όπου p L2 (t ) pr2 (t + τ )dt t1 t2 t2 2 2 p ( t ) dt p ( t ) dt L t R t1 1 1/ 2 (3.1) pl η κρουστική απόκριση στην είσοδο του αριστερού ακουστικού καναλιού pr η κρουστική απόκριση στην είσοδο του δεξιού ακουστικού καναλιού Ο συντελεστής διωτικής ετεροσυσχέτισης IACC υπολογίζεται τότε ως εξής: IACCt1t2 = max IACFt1t 2 (τ ) για -1ms < τ < +1ms (3.2) Οι τρεις εκδοχές του συντελεστή διαφοροποιούνται ως προς τα όρια ολοκλήρωσης της συνάρτησης. Ο IACC0,80 εμπλέκει μόνο τον απευθείας ήχο και τις αρχικές ανακλάσεις, ο IACC80,+ το αντηχητικό πεδίο και ο IACC0,+ και τα δύο. Το '80' δηλώνει 80ms και το '+' το πάνω όριο του χρόνου παρατήρησης της μέτρησης. Η εκδοχή που μας ενδιαφέρει έιναι η πρώτη καθώς το διάστημα από 0 έως 80ms είναι εκείνο στο οποίο γίνεται ο προσδιορισμός της χωρικής προέλευσης του ήχου και επίσης έχει αποδειχθεί ότι είναι μια ευαίσθητη μέτρηση για τον καθορισμό του φαινομενικού πλάτους πηγής (Apparent Source Width ASW), όπως αυτό γίνεται αντιληπτό από τον ακροατή. Η διαδικασία εύρεσης του μέγιστου απολύτου της συνάρτησης στο χρονικό διάστημα -1 έως 1 ms ουσιαστικά αντισταθμίζει τη διαφορά χρονικής άφιξης των σημάτων στα δύο αυτιά η οποία δε μπορεί να υπερβαίνει τα 800μs. Ο IACC 0,80 παίρνει τιμές από 0 έως 1. Η μέγιστη τιμή 1 εκφράζει την πλήρη ομοιότητα των δύο σημάτων και για τις μεσαίες και ψηλές συχνότητες όπου το ωτικό πτερύγιο λειτουργεί ως φίλτρο δηλώνει την προέλευση του ήχου από θέση συμμετρική ως προς τα δύο αυτιά, δηλαδή από γωνία μηδενικού αζιμούθιου σε συνθήκες ελεύθερου πεδίου. Η ελάχιστη τιμή 0 δηλώνει την πλήρη διαφοροποίηση ως προς το πλάτος των σημάτων. Σωστός διαχωρισμός των καναλιών στη θέση ακρόασης συνεπάγεται την αντίληψη ενός πλαϊνού καναλιού με ξεκάθαρη προέλευση απ'το πλαϊνό μέρος του κεφαλιού του ακροατή, από μεγάλη δηλαδή γωνία αζιμούθιου, κάτι που σχετίζεται με τη μείωση του συντελεστή IACC[3]. Επιδίωξη λοιπόν ενός περιφερειακού συστήματος αναπαραγωγής ήχου για τη λειτουργία των πλευρικών καναλιών είναι η μείωση του συντελεστή IACC0,80. 16
3.6 Φαινομενικό πλάτος πηγής (Apparent Source Width ASW) ASW είναι το ακουστικό πλάτος της ηχητικής πηγής όπως το αντιλαμβάνεται ο ακροατής. Είναι γενικά αποδεκτό ότι το ASW μπορεί να καθοριστεί απ'το ηχητικό πεδίο που φτάνει στα αυτιά του ακροατή στα πρώτα 80ms μετά την άφιξη του απευθείας ήχου (συμπεριλαμβανομένου φυσικά του απευθείας ήχου). Μετριέται σε μοίρες. Γενικά, εξαρτάται απ'το φασματικό περιεχόμενο του σήματος της πηγής, όπως επίσης και απ το πλάτος της συνάρτησης διωτικής ετεροσυσχέτισης (interaural crosscorrelation function-iacc) [4]. Για παράδειγμα, αν το IACC κρατηθεί σταθερό, το φαινομενικό πλάτος πηγής ASW αυξάνεται όσο μειώνεται η κεντρική συχνότητα του οκταβικού θορύβου της μέτρησης ή όσο αυξάνονται οι χαμηλόσυχνες συνιστώσες. Το γεγονός ότι για μια πηγή με κυρίαρχες χαμηλές συχνότητες γίνεται αντιληπτή πλατύτερη ηχητική σκηνή αντανακλάται στη συνάρτηση διωτικής ετεροσυσχέτισης. Η κορυφή της συνάρτησης γίνεται ευρύτερη καθώς η κεντρική συχνότητα του θόρυβου μειώνεται. Εισάγεται λοιπόν το πλάτος της διωτικής συνάρτησης ετεροσυσχέτισης (width of the interaural cross-correlation function WIACC), το οποίο ορίζεται ως το διάστημα του χρόνου καθυστέρησης μέχρι μία τιμή 10% κάτω απ το συντελεστή IACC. Η συνάρτηση διωτικής ετεροσυσχέτισης αναπαριστά την αλληλεξάρτηση μεταξύ του σήματος στο ένα αυτί στην αρχή του χρόνου (ή για κάποια χρονική στιγμή) και του σήματος στο άλλο αυτί σε μία καθυστερημένη χρονική στιγμή εντός του 1 ms. Έτσι, το WIACC έχει μονάδα χρόνου. Η στάθμη ηχητικής πίεσης, SPL, επίσης επηρεάζει το ASW. Εικόνα 3.5: Ορισμός των IACC, WIACC και τiacc για τη διωτική συνάρτηση ετεροσυσχέτισης Σύμφωνα με τη μελέτη των Y.Ando, H.Sakai και S.Sato για σύνθετους θόρυβους (σύνθεση τριών ζωνοπερατών στοιχείων θορύβου) η σχέση μεταξύ της τιμής κλίμακας του ASW και του WIACC φαίνεται στην εικόνα 3.5. Υπάρχει σημαντική διαφορά μεταξύ των τιμών για ζωνοπερατό θόρυβο και των τιμών για σύνθετο θόρυβο. Ο παράγοντας LL(listening level-στάθμη ακρόασης) είναι επίσης σημαντικός. Η αλληλεπίδραση μεταξύ WIACC και LL δεν είναι σημαντική, οπότε αυτά συνεισφέρουν ανεξάρτητα στην τιμή κλίμακας του ASW: s ( ASW ) f (WIACC ) + f ( LL) (3.3) 17
Η τιμή κλίμακας ουσιατστικά εκφράζει το αντιληπτό πλάτος της πηγής κανονικοποιημένο σύμφωνα με τα αποτελέσματα των υποκειμενικών πειραμάτων. Διαμορφώνεται με παρεμβολή από μία μη γραμμική εξίσωση για διέγερση σύνθετων θορύβων: s( ASW ) a(wiacc )1/ 2 + b( LL)3 / 2 (3.4) όπου τα a και b πρέπει να υπολογιστούν. Οι τιμές των εκθετών καθορίζονται ώστε να δίνουν την καλύτερη συσχέτιση μεταξύ συγκριτικών πειραμάτων και τιμών κλίμακας της εξίσωσης. Οι τιμές της εικόνας 3.6 επιβεβαιώνουν τις υπολογισμένες τιμές της εξίσωσης(υπολογισμός με με πολλαπλή αναδρομή (multiple regression)) για a 2.40 b 0.003 (3.5) Είναι αξιοσημείωτο ότι και για τριτοκταβικούς ζωνοπερατούς θόρυβους η τιμή κλίμακας του ASW εκφράζεται επίσης ως ½ δύναμη του WIACC και ότι ο συντελεστής του W IACC είναι κοντά σ'αυτόν αυτής της μελέτης για σύνθετους θόρυβους [5]. Ο τύπος υπολογισμού s( ASW ) = f ( IACC ) + f (WIACC ) a( IACC ) 3/ 2 + b(wiacc ) 1/ 2 (3.6) και οι συντελεστές υπολογίζονται a 1.64 b 2.44 (3.7) Εικόνα 3.6: Μέσες τιμές κλίμακας σα συνάρτηση του WIACC και με παράμετρο το LL. Σύμφωνα με τους Okano, Beranek και Hidaka [6], με τo ASW σχετίζονται περισσότερες μετρήσεις εκτός του συντελεστή διωτικής ετεροσυσχέτισης και της στάθμης ακρόασης, όπως το πλευρικό κλάσμα (Lateral Fraction - LFE) και ο παράγοντας δύναμης των χαμηλών συχνοτικών συνιστωσών(strength Factor Glow), χωρίς όμως να δίνεται τύπος υπολογισμού της εξάρτησης αυτής. 18
3.7 Άλλοι παράγοντες εντοπισμού Αξίζει να σημειωθεί ότι οι ανακλάσεις επίσης επηρεάζουν και μάλιστα σημαντικά την χωρική αντίληψη του ήχου. Οι ανακλάσεις σε μικρό χρονικό διάστημα μετά τον απευθείας ήχο (μέχρι 50-80ms) συνήθως διευρύνουν ή βαθαίνουν τα χωρικά χαρακτηρηστικά της πηγής που αντιλαμβανόμαστε. Σε χρονικό διάστημα μέχρι και τα 20ms μπορούν να προκαλέσουν σημαντική παραμόρφωση του σήματος αν είναι ψηλής έντασης. Μετά τα 80ms τείνουν να συνεισφέρουν περισσότερο στην αίσθηση περίκλεισης και ευρυχωρίας (envelopment και spaciousness) του περιβάλλοντος. Οι ανακλάσεις μπορεί μάλιστα να βοηθούν στον εντοπισμό, καθώς έχουμε μάθει να ζούμε και να προσανατολιζόμαστε μέσα σε αντηχητικά πεδία. Είναι αξιοσημείωτο ότι ένας ανηχοϊκός θάλαμος δεν είναι σίγουρα το καλύτερο περιβάλλον ακρόασης, αφού δεν έχουμε συνηθίσει να ακούμε ήχους χωρίς να ακούμε τις ανακλάσεις τους. Κάποια από τα στοιχεία που χρησιμοποιεί ο εγκέφαλος για τη χωρική αντίληψη του ήχου είναι εξαρτώμενα από την ίδια την ηχητική πηγή και μπορούν να επηρεαστούν σε πολύ μεγάλο βαθμό από την αλληλεπίδραση με άλλες αισθήσεις και κυρίως την όραση. Η εμπειρία κάνει τον εγκέφαλο να περιμένει συγκεκριμένες χωρικές 'ιδέες' να αντιστοιχούν σε συγκεκριμένες χωρικές θέσεις πηγών και αν αυτό δε συμβαίνει προκαλείται σύγχυση. Για παράδειγμα, έχουμε συνηθίσει να ακούμε τον ήχο τον αεροπλάνων από πάνω μας και σε πειράματα όπου παρουσιάστηκαν αμφιωτικές ηχογραφήσεις αεροπλάνων τα υποκείμενα αυθόρμητα έστρεφαν το κεφάλι προς τα πάνω αν και οι χωρικές 'ιδέες' δεν υπονοούσαν αυτή την κατεύθυνση. Είναι φυσικό να βασιζόμαστε στην αίσθηση της όρασης για κάθε πληροφορία ενός γεγονότος που βρίσκεται μέσα στο οπτικό μας πεδίο και μάλιστα όταν ακούμε αμφιωτικές ηχογραφήσεις χωρίς τη συνοδεία εικόνας τείνουμε να εντοπίζουμε τη σκηνή προς το πίσω μέρος του κεφαλιού. Στην πραγματικότητα το να εντοπίσουμε ηχητικές εικόνες στο μπροστινό μέρος του κεφαλιού με ένα αμφιωτικό σύστημα είναι αρκετά δύσκολο. Η διάσταση μεταξύ ηχητικών και οπτικών 'σκηνών' σε όρους εντοπισμού φαίνεται να εξαρτάται από το επίπεδο της εμπειρίας των ακροατών (Komiyama,1989). Ενδιαφέροντα είναι τα πειράματα σύγκρισης της ικανότητας εντοπισμού μεταξύ τυφλών και μη υποκειμένων [7]. Τα αποτελέσματα δείχνουν ότι σε συνθήκες ελεύθερου πεδίου οι τυφλοί έχουν την ίδια ικανότητα με τους μη τυφλούς. Όταν εφαρμόζεται θόρυβος υπόβαθρου στο ακουστικό περιβάλλον, η επίδοση των τυφλών υποκειμένων χειροτερεύει γρηγορότερα, μόνο όμως για τον εντοπισμό στη γωνία ανύψωσης και όχι για το αζιμούθιο. Αυτό υποδεικνύει ότι το οπτικό σύστημα βοηθάει στην ακριβή αντιστοίχιση των 'ιδεών' εντοπισμού που προέρχονται από τη μορφή του φάσματος (και τη δομή ουσιαστικά του ωτικού πτερύγιου). 19
4 Συστοιχίες μεγαφώνων Οι συστοιχίες μεγαφώνων χρησιμοποιούνται όλο και περισσότερο στην επαγγελματική ηχητική αναπαραγωγή και ιδιαίτερα στην κάλυψη ζωντανής μουσικής για μεγάλα ακροατήρια. Αυτό δεν είναι κάτι καινούργιο αφού γραμμικές συστοιχίες χρησιμοποιούνται ήδη απ'τη δεκαετία του '60. Αυτό που είναι καινούργιο είναι η πρακτική της κατασκευής των συστοιχιών, η οποία σήμερα καταφέρνει να αποδώσει πολύ ελεγχόμενες κατευθυντικές αποκρίσεις, ψηλή ισχύ εξόδου και ψηλή ποιότητα ήχου για ένα εκτεταμένο εύρος συχνοτήτων. Τυπικά τα μεγάφωνα τοποθετούνται σε μία κάθετη στοίβα. Η απόκριση κατευθυντικότητας στο κάθετο επίπεδο αλλάζει ουσιωδώς με τη συχνότητα. Όσο αυξάνει η συχνότητα ο κύριος λοβός στενεύει και παρατηρούνται ισχυροί πλευρικοί λοβοί. Οι κατασκευαστές σήμερα σχεδιάζουν ειδικούς κυματοδηγούς στη θέση μεμονωμένων μεγαφώνων για τη ζώνη των ψηλών συχνοτήτων. Επίσης σχεδιάζονται και κατασκευάζονται καμπύλες συστοιχίες για να παράγουν μη συμμετρική απόκριση στο κάθετο επίπεδο, προσαρμοζόμενες μάλιστα στην κάθε περιοχή ακρόασης. 4.1 Περιοχές ακτινοβολίας γραμμικής συστοιχίας Το ηχητικό πεδίο ενός συνόλου πηγών μπορεί να χωριστεί χοντρικά σε τρεις περιοχές: την κοντινή, τη μεταβατική και τη μακρινή. Οι όροι κοντινή και μεταβατική παραπέμπουν στην απόσταση μεταξύ πηγών και ακροατή, στην πραγματικότητα όμως τα όρια μεταξύ των περιοχών εξαρτώνται απ'τη συχνότητα. Για παράδειγμα, το μακρινό πεδίο μπορεί να βρίσκεται μόνο λίγα εκατοστά ή και εκατοντάδες μέτρα μακριά από τη συστοιχία. Βοηθάει λοιπόν μία διαφορετική ονομασία των περιοχών ακτινοβολίας. Η κοντινή περιοχή μπορεί να ονομαστεί περιοχή Fresnel και μπορεί να προσεγγιστεί αρκετά σωστά. Η περιοχή μετάβασης ονομάζεται χαοτική περιοχή επειδή περιλαμβάνει πολλά μοτίβα ακτινοβολίας και δεν προσφέρεται για απλή αναλυτική περιγραφή. Η μακρινή περιοχή ονομάζεται περιοχή Fraunhofer και μπορεί να περιγραφεί παρά τα πολλά μοτίβα αλληλοπαρεμβολής των πηγών. Τα όρια μεταξύ των περιοχών υπολογίζονται γεωμετρικά [8]: a 3 D2 f r0 = 0 2 a0 12 f γ ια f > a0 3D r1 = a 3 DSTEPf STEP a0 γ ια f > 0 2 a0 9 Df 3D r2 = 3 2 1 Ν STEP 2 f 2 12 f γ ια f > 1 3 NSTEP (4.1) όπου D η διάμετρος ή το ύψος της κάθε πηγής σε m f η συχνότητα σε Hz α0 1.24 για κυκλικά έμβολα και 1 για ορθογωνικά Ν το πλήθος των πηγών της συστοιχίας STEP το διάστημα μεταξύ διαδοχικών πηγών 20
Εικόνα 4.1: Περιοχές ακτινοβολίας γραμμικής συστοιχίας Κι άλλοι τρόποι υπολογισμού των ορίων, όπως η ανάλυση Fresnel καταλήγουν σε παρόμοια αποτελέσματα. Για απλότητα η απόσταση στην οποία ξεκινάει το μακρινό πεδίο μπορεί να γραφεί[9]: r2 = 3 1 FH 2 1 2 ( 3FH ) 2 (4.2) όπου F η συχνότητα σε khz H η μεγάλη διάσταση της συστοιχίας σε m Στο κοντινό πεδίο μιας γραμμικής συστοιχίας το κύμα διαδίδεται κυλινδρικά ενώ στο μακρινό πεδίο σφαιρικά. Στο μακρινό πεδίο δηλαδή η πτώση της στάθμης ηχητικής πίεσης (SPL) είναι -6dB ανά διπλασιασμό της απόστασης ενώ στο κοντινό πεδίο -3dB ανά διπλασιασμό της απόστασης. 21
4.2 Κατευθυντικότητα και απόκριση γραμμικής συστοιχίας Ενώ ένα πολικό διάγραμμα της στάθμης ηχητικής πίεσης είναι ικανό να χαρακτηρίσει μία μοναδική ηχητική πηγή, μια συστοιχία πολλαπλών πηγών δεν είναι τόσο απλή. Αφού η ακτινοβολία των ανεξάρτητων στοιχείων εξαρτάται απ'τη συχνότητα, τα ηχητικά κύματα που ακτινοβολούνται από μια συστοιχία δε συζεύγονται σε φάση, αλλά συμβάλλουν και ακυρώνονται μεταξύ τους ανάλογα με τη συχνότητα και τη θέση ακρόασης. Εικόνα 4.2: Γεωμετρία στο μακρινό πεδίο γραμμικής πηγής Μία γραμμική πηγή μπορεί να μοντελοποιηθέι ως ένα συνεχές απειροστά μικρών γραμμικών τμημάτων κατανεμημένων κατά μήκος μιας γραμμής [10]. Παραλείποντας τον όρο της χρονικής αρμονικής μεταβολής, η ηχητική πίεση που ακτινοβολεί μια γραμμική πηγή είναι: L/2 p= L/2 A(l )e j[ kr ( l ) + φ ( l )] dl r (l ) όπου L A(l) (4.3) το μήκος της πηγής η συνάρτηση πλάτους κατά μήκος της γραμμής φ(l) η συνάρτηση φάσης κατά μήκος της γραμμής k ο κυματάριθμος r(l) η απόσταση από κάθε τμήμα dl της γραμμής μέχρι το σημείο παρατήρησης P Θεωρώντας ότι το σημείο παρατήρησης βρίσκεται σε απόσταση πολύ μεγαλύτερη απ'το μήκος της πηγής, άρα οι αποστάσεις από δύο οποιαδήποτε τμήματα μέχρι το P είναι ίσες, η ανάλυση απλοποιείται σημαντικά. Ο όρος πλάτους μπορεί να απλοποιηθεί 1 1 1 r ( L / 2) r ( L / 2) r (4.4) 22
Για τον όρο φάσης όμως, οι διαφορές απόστασης των τμημάτων απ'το P δεν είναι μικρές σε σχέση με τα μήκη κύματος των ψηλών συχνοτήτων. Η εικόνα 4.2 δείχνει ότι ο όρος απόστασης στον εκθέτη μπορεί να εκφραστεί ως r (l ) = l sin α (4.5) όπου α είναι η γωνία μεταξύ της διχοτόμου της πηγής και μίας ευθείας απ'το μέσο της πηγής ως το P. Αντικαθιστώντας, η πίεση σε μία γωνία α και στο μακρινό πεδίο μίας ηχητικής πηγής είναι L/2 1 p (α ) = A(l )e j [ kl sin a + ϕ ( l ) ] dl r L/2 (4.6) Η συνάρτηση κατευθυντικότητας της πηγής είναι ουσιαστικά το πλάτος σε μία γωνία α ως προς το μέγιστο δυνατό πλάτος. Η συνάρτηση κατευθυντικότητας προϋποθέτει σφαιρική ακτινοβολιά για να συγκρίνει την απόκριση σε διάφορες γωνίες και έχει λοιπόν νόημα μόνο στο μακρινό πεδίο. Η μέγιστη πίεση παρατηρείται όταν όλα τα τμήματα της συστοιχίας ακτινοβολούν σε φάση: L/2 R (α ) = p (α ) p max = A(l )e j [ kl sin(α ) + φ ( l )] dl L/2 L/2 (4.7) A(l )dl L/2 Ομοιόμορφη συστοιχία είναι αυτή που έχει σταθερό πλάτος Α(l)=A και μηδενική ολίσθηση φάσης φ(l)=0 σε όλο το μήκος της. Η συνάρτηση κατευθυντικότητάς της: RU (a ) = 1 L L/2 e jkl sin a dl RU (a ) = L/2 sin[(π L / λ ) sin a ] (π L / λ ) sin a (4.8) Το πολικό διάγραμμα απόκρισης είναι ουσιαστικά η συνάρτηση κατευθυντικότητας εκφρασμένη σε db και εκτυπωμένη σε ένα πολικό διάγραμμα. Η πίεση πάνω στον κύριο άξονα που περνάει απ'το κέντρο της συστοιχίας (α=0 ) χρησιμοποιείται σαν πίεση αναφοράς και ο τύπος υπολογισμού της πολικής απόκρισης είναι R( a ) π ο λ ι κ ή α π όκ ρ ι σ η = 20 log 10 R( 0 ) (4.9) 23
Εικόνα 4.3: Πολικά διαγράμματα απόκρισης ομοιόμορφης γραμμικής πηγής Στην εικόνα 4.3 φαίνονται πολικές αποκρίσεις για διάφορους λόγους του μήκους της συστοιχίας προς το μήκος κύματος (L/λ). Η απόκριση είναι ευρεία και η συστοιχία ακτινοβολεί σχεδόν πανακατευθυντικά για χαμηλούς λόγους ενώ όσο αυξάνεται ο λόγος η απόκριση παρουσιάζει μηδενικά και επιπλέον λοβούς. Η συνάρτηση κατευθυντικότητας έχει τη γενική μορφή sinz/z,συνάρτησης δηλαδή sinc(z). Για να εκτιμήσουμε την απόκριση πάνω στον κύριο άξονα πρέπει να βρούμε το όριο για z = 0. sin z = cos( 0) = 1 z lim z 0 (4.10) Η συνάρτηση τείνει στο 1 για τιμές πάνω στον άξονα οπότε πάντα υπάρχει μέγιστο κατά τον κύριο άξονα.οι γωνίες μηδενισμού βρίσκονται: RU ( a ) = 0 πl λ sin a = mπ sin a = m λ L (4.11) όπου m μη μηδενικός ακέραιος Οι εκτός κύριου άξονα λοβοί παρουσιάζοναι μεταξύ των μηδενικών δηλαδή για sin a = (m + 1 / 2)λ L και το σχετικό πλάτος τους μπορεί να υπολογιστεί Am = cos( mπ ) mπ + π / 2 (4.12) (4.13) όπου m = 1,2,3,... 24
Η γωνία στην οποία παρατηρείται η μισή πίεση (-6 db), δηλαδή το ¼ της ισχύος: sin z πl = 0.5 z = sin a = 1.895 z λ 1.895λ 0.6λ θ 6 db = 2a = 2 sin 1 = 2 sin 1 πl L (4.14) Εικόνα 4.4: Γωνία ¼ ισχύος ομοιόμορφης γραμμικής πηγής Η γωνία μισής πίεσης είναι συνάρτηση του λόγου του μήκους της συστοιχίας προς το μήκος κύματος όπως φαίνεται και στην εικόνα 4.4. Το πεδίο πίεσης που δημιουργεί μια γραμμική συστοιχία υπολογίζεται ξαναγράφοντας την έκφραση της ακτινοβολούμενης πίεσης σε καρτεσιανές συντεταγμένες σύμφωνα με το δίπλα σχήμα. p ( x, y ) = L/2 L/2 r ( x, y, l ) = A( l ) e j [ kr ( x, y,l ) + ϕ ( l ) ] dl r ( x, y, l ) x2 + ( y l) 2 (4.15) 25
Εικόνα 4.5: Γεωμετρία για τον υπολογισμό του πεδίου ακουστικής πίεσης μίας γραμμικής πηγής Εικόνα 4.6: Πεδίο πίεσης μίας ομοιόμορφης γραμμικής συστοιχίας 4 μέτρων σε διάφορες μπάντες συχνοτήτων 26
4.3 Διαστήματα μεταξύ των διπλανών στοιχείων γραμμικής συστοιχίας Οι γραμμικές συστοιχίες δεν είναι τέλεια συνεχείς γραμμικές πηγές. Μεταξύ των διπλανών μεγαφώνων υπάρχουν κενά λόγω του πάχους του υλικού που χρησιμοποιείται για να περικλείσει τα μεγάφωνα και ίσως κενά που χρησιμοποιούνται σκόπιμα για να προκύψει η επιθυμητή απόκριση. Αυτά τα κενά είναι τμήματα που δεν ακτινοβολούν και επιδρούν στην απόδοση της συστοιχίας. Η μοντελοποίηση μπορεί να γίνει περιορίζοντας την ολοκλήρωση της κατευθυντικότητας της γραμμικής πηγής μόνο στα τμήματα που ακτινοβολούν. Η κατευθυντικότητα μιας γραμμικής πηγής με Ν στοιχεία μήκους L και κενά μήκους d μεταξύ τους είναι: NL d R( a ) = N 1 ) A( l ) e j [ kl sin a + ϕ ( l ) ] dl ( N 1 L+ d NL d ) A( l ) dl (4.16) ( N 1 L+ d Γενικά, τα κενά επηρεάζουν περισσότερο τη δομή των πλευρικών λοβών και μηδενικών εκτός του κύριου άξονα απ'ότι τον κύριο λοβό. Σε χαμηλες συχνότητες όπου τα κενά είναι ένα μικρό κλάσμα του μήκους κύματος η επιρροή δεν είναι σημαντική, στις ψηλές συχνότητες όμως το στερεό ακτινοβολίας αλλάζει ουσιαστικά με το μήκος των διαστημάτων [10]. Μία ίσως πιο ποιοτική προσέγγιση δίνεται απ'τους Heil, Urban και Bauman[9]. Σύμφωνα μ'αυτήν μια πραγματική συστοιχία είναι ισοδύναμη με το άθροισμα δύο εικονικών πηγών: μιας τέλειας γραμμικής πηγής και ενός πλέγματος πηγών που 'διαταράσσουν' τη συνολική απόκριση, όπως φαίνεται και παρακάτω. Το πλέγμα αυτό των πηγών θεωρείται σε αντίθεση φάσης με τη γραμμική πηγή. Το πλάτος της πίεσης που προκύπτει απ'αυτό είναι ανάλογο του πάχους των τοιχωμάτων των ηχείων. Εικόνα 4.7: Ανάλυση Fresnel για ακροατή Εικόνα 4.8: Ισοδύναμο άθροισμα πηγών γραμμικής σε άπειρη απόσταση συστοιχίας με διαστήματα Στις εικόνες 4.6 και 4.7 φαίνεται πως μπορεί να προβλεφθεί η επίδραση του πλέγματος διαταραχής, δηλαδή των διαστημάτων μεταξύ διαδοχικών μεγαφώνων της συστοιχίας. Εφαρμόζοντας την ανάλυση Fresnel για έναν παρατηρητή που βρίσκεται στο άπειρο, οι κύκλοι που τέμνουν το πλέγμα γίνονται ευθείες. Διερευνώντας ως προς την πολική 27
γωνία θ, στη μπροστινή κατεύθυνση (θ = 0) όλες οι πηγές φαίνονται σε φάση. Στη γωνία θdip οι μισές πηγές φαίνονται σε φάση ενώ οι άλλες μισές σε αντίθεση φάσης, οπότε και ακυρώνονται μεταξύ τους και η προκύπτουσα SPL είναι πολύ μικρή. Στη γωνία θpeak όλες οι πηγές είναι και πάλι σε φάση και η προκύπτουσα SPL είναι η ίδια με αυτή του κύριου άξονα. Οι γωνίες αυτές δίνονται από τους εξής τύπους: λ = sin 1 STEP λ /2 STEP sin (θ dip ) = λ / 2 θ dip = sin 1 STEP STEP sin (θ peak )= λ θ peak (4.17) 4.4 Λογαριθμική συστοιχία Η προηγούμενη ανάλυση βασίστηκε σε ομοιόμορφες συστοιχίες ή ομοιόμορφα γραμμικά τμήματα ακτινοβολίας. Στην πραγματικότητα οι ακουστικές πηγές απέχουν απ'αυτό το μοντέλο. Έστω p1 η πίεση λόγω της μίας πηγής σε κάποιο σημείο του χώρου. Η πίεση που προκύπτει από Ν όμοιες πηγές μπορεί να γραφεί ως το γινόμενο της πίεσης που προκύπτει από μία πηγή επί έναν παράγοντα της συστοιχίας [8]: PN ( r,θ, ϕ ) = p1 ( r, θ, ϕ ) FN (θ, ϕ FN (θ, ϕ ) = N 1 e rδ jk r ) (4.18) όπου δ το διάνυσμα μετατόπισης της κάθε πηγής ως προς αυτή που ορίζεται ως αρχή. Ο παράγοντας συστοιχίας περιέχει τη γεωμετρική πληροφορία της συστοιχίας ενώ ο πρώτος όρος που ονομάζεται στοιχειακός παράγοντας προσδιορίζεται από την ηλεκτρική διέγερση και περιέχει την κατευθυντική πληροφορία του κάθε μεγαφώνου της συστοιχίας. Στη συγκεκριμένη εφαρμογή τα μεγάφωνα των χρησιμοποιούμενων συστοιχιών είναι μικρά και η ακτινοβολία τους θεωρητικά σχεδόν πανκατευθυντική στο μεγαλύτερο τμήμα του φάσματος. Σύμφωνα με την εξίσωση 4.12 πλευρικοί λοβοί δε θα εμφανίζονται σε ένα ιδανικό έμβολο 4 μέχρι και τη συχνότητα των 5000Hz. Οπότε ο έλεγχος επικεντρόνεται στους λοβούς που προκύπτουν απ τον παράγοντα συστοιχίας. Στόχος είναι η ύπαρξη όσο το δυνατόν στενότερων λοβών, χωρίς όμως την παρουσία πλευρικών λοβών καθώς αυτοί στην προτεινόμενη διάταξη ίσως κατευθύνονται απευθείας στον ακροατή (απ'τη θέση βέβαια του κεντρικού καναλιού)! 28
Η απαίτηση για στενούς λοβούς ακόμα και στις χαμηλές συχνότητες έρχεται σε αντίθεση με τους φυσικούς νόμους που σχετίζονται με το πρόβλημα. Μία λύση είναι διασπάσουμε τη συστοιχία σε περιοχές συχνοτήτων και να διατάξουμε τα στοιχεία έτσι ώστε σε κάθε υποσυστοιχία οι αποστάσεις των στοιχείων της να είναι διπλάσιες αυτών της αμέσως μικρότερης υποσυστοιχίας. Κάθε υποσυστοιχία χαρακτηρίζεται από μια απόσταση di και είναι ενεργή σε ένα τμήμα του συνολικούς εύρους συχνοτήτων όπως φαίνεται στην εικόνα 4.9. Αυτό επιτυγχάνεται με τη χρήση φίλτρων. Οι συχνότητες αποκοπής τους επιλέγονται έτσι ώστε στη συχνότητα σχεδίασης να επιτυγχάνεται στενός λοβός και όχι πλευρικοί λοβοί. Μία βολική τιμή για το άνω όριο του έυρους για τη ζώνη i είναι: f max = 0.8c / d i (4.19) Τα μεγάφωνα μοιράζονται σε υποσυστοιχίες, μειώνοντας το συνολικό αριθμό μεγαφώνων. Η αρμονική κατανομή, για την οποία ισχύει ο τύπος 4.20 οδηγεί στη μεγιστοποίηση του αριθμού των μεγαφώνων και η σχεδιάση ονομάζεται λογαριθμική [11]. d i = 2 i 1 d (i=1,2,..,p, P το πλήθος των υποσυστοιχιών) (4.20) Εικόνα 4.9: Κανόνας κατασκευής λογαριθμικής συστοιχίας 29