Συγκεντρωτική µελέτη της επίδρασης του ήχου και της µουσικής στον άνθρωπο

Σχετικά έγγραφα
Ψηφιακή Επεξεργασία Σηµμάτων

Ψηφιακή Επεξεργασία Σηµμάτων

Διάλεξη 9. Η Φυσική της Μουσικής Τ.Ε.Ι. Ιονίων Νήσων. Αντίληψη συνδυασμών τόνων Μορφές ακοής Συνήχηση & παραφωνία Θεωρίες αντίληψης ύψους

Ο Ήχος. Υπεύθυνος Καθηγητής: Παζούλης Παναγιώτης

Διάλεξη 8. Η Φυσική της Μουσικής Τ.Ε.Ι. Ιονίων Νήσων. Αντιληπτό ύψος καθαρού τόνου Απόλυτο ύψος

Ο Ήχος ως Σήμα & η Ακουστική Οδός ως Σύστημα

Μάθημα: Τεχνολογία Ήχου

ΘΟΡΥΒΟΣ Αξιολόγηση και µέτρα αντιµετώπισης

Επικοινωνίες I FM ΔΙΑΜΟΡΦΩΣΗ. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών

Σύστημα ενίσχυσης ήχου εξωτερικού χώρου (Outdoor Sound Reinforcement System)

Ψηφιακός ήχος και κινούμενα γραφικά

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΑΚΟΥΣΤΙΚΕΣ ΣΤΑΘΜΕΣ, ΜΕΤΡΗΣΕΙΣ, ΘΟΡΥΒΟΣ, ΗΧΟΜΟΝΩΣΗ ΓΙΑΝΝΗΣ ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΚΑΘΗΓΗΤΗΣ

Φυσική για Μηχανικούς

Φυσική για Μηχανικούς

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5α. Σημειώσεις μαθήματος: E mail:

Doppler Radar. Μεταφορά σήµατος µε την βοήθεια των µικροκυµάτων.

Μάθημα: Τεχνολογία Ήχου

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Εργαστήριο Ηλεκτρoακουστικής Άσκηση 2 - Σελίδα 1 ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΑΣΚΗΣΗ 2

Κεφάλαιο 3 ο : ΕΙΣΑΓΩΓΗ στις ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ. ΗΛΕΚΤΡΟΜΑΓΝΗΤΙΚΟ ΚΥΜΑ και ΤΕΧΝΙΚΕΣ ΙΑΜΟΡΦΩΣΗΣ

Τηλεπικοινωνιακά Συστήματα Ι

Φυσική για Μηχανικούς

ΘΟΡΥΒΟΣ ΗΧΟΔΟΣΙΜΕΤΡΙΑ Σιδερής Ευστάθιος

Ειδικά Θέματα Ηλεκτρονικών 1

Κλινική χρήση των ήχων

Τηλεπικοινωνιακά Συστήματα ΙΙ

Ηλεκτρομαγνητικά Διαδίδονται στο κενό

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

AKOH HXOΣ. ένταση. τόνος. Χροιά : πολυπλοκότητα ηχητικών κυµάτων.

Κεφάλαιο 1 ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΝΕΥΡΟΦΥΣΙΟΛΟΓΙΑΣ

Τηλεπικοινωνικακά Συστήματα Ι - Ενδεικτικές Ερωτήσεις Ασκήσεις 1)

Μάθημα: Ακουστική και Ψυχοακουστική

Μάθημα: Ακουστική και Ψυχοακουστική

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Νυκτά Όργανα: Κιθάρα. Δρ. Χρυσούλα Αλεξανδράκη ΤΕΙ Κρήτης Σχολή Εφαρμοσμένων Επιστημών Τμήμα Μηχανικών Μουσικής Τεχνολογίας και Ακουστικής

Συναρτήσεις Συσχέτισης

Επικοινωνίες I FM ΔΙΑΜΟΡΦΩΣΗ. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών

«Επικοινωνίες δεδομένων»

ΨΥΧΟΑΚΟΥΣΤΙΚΗ σύνδεσης φυσικού φαινομένου/ήχος υποκειμενικού αισθήματος πως συμπεράσματα

Φυσική για Μηχανικούς

ΦΥΣΙΚΗ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ & ΕΠΑ.Λ. Β 10 ΙΟΥΝΙΟΥ 2014 ΕΚΦΩΝΗΣΕΙΣ

Ευαισθησία πειράµατος (Signal to noise ratio = S/N) ιάρκεια πειράµατος (signal averaging)) ιάρκεια 1,38 1,11 0,28 5,55. (h) πειράµατος.

Ασκήσεις στα Συστήµατα Ηλεκτρονικών Επικοινωνιών Κεφάλαιο 3 ο : ΕΙΣΑΓΩΓΗ στις ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ ΗΛΕΚΤΡΟΜΑΓΝΗΤΙΚΟ ΚΥΜΑ και ΤΕΧΝΙΚΕΣ ΙΑΜΟΡΦΩΣΗΣ

ΜΗΧΑΝΙΚΑ ΚΥΜΑΤΑ ΣΥΜΠΛΗΡΩΜΑ ΘΕΩΡΙΑΣ

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2017 Α ΦΑΣΗ

Ψηφιακή Επεξεργασία Σηµμάτων

1/3/2009. Φλώρος Ανδρέας Επίκ. Καθηγητής. Ευαισθησία μικροφώνων

Από τις τριγωνομετρικές συναρτήσεις στο Mp3

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

ΑΣΚΗΣΕΙΣ ΚΥΜΑΤΙΚΗΣ ΟΠΤΙΚΗΣ

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5γ. Σημειώσεις μαθήματος: E mail:

Μαθηματική Εισαγωγή Συναρτήσεις

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Ψηφιακή Επεξεργασία Σημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ύψος Συχνότητα Ένταση Χροιά. Ο ήχος Ο ήχος είναι μια μορφή ενέργειας. Ιδιότητες του ήχου. Χαρακτηριστικά φωνής

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 7 Ακούγοντας Πρώτη Ματιά στην Ανάλυση Fourier. Σύστημα Συλλογής & Επεξεργασίας Μετρήσεων

ΠΕΡΙΕΧΟΜΕΝΑ. ΕΙΣΑΓΩΓΗ: Γνωριμία με την ΑΚΟΥΣΤΙΚΗ 1 ΜΕΡΟΣ ΠΡΩΤΟ: ΘΕΩΡΙΑ 5. 1 ος ΘΕΜΑΤΙΚΟΣ ΑΞΟΝΑΣ: ΤΑΛΑΝΤΩΣΕΙΣ 7 Προσδοκώμενα αποτελέσματα 8

Ηχητικά κύματα Διαμήκη κύματα

Όρια ακοής, κρίσιμες ζώνες Εντοπισμός ήχου Σύγκριση ακοής & όρασης Ηχηρότητα καθαρού τόνου Ύψος καθαρού τόνου

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Πολιτικός Μηχανικός Ph.D.

Συστήματα Επικοινωνιών ΙI

25/3/2009. Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου. Φλώρος Ανδρέας Επίκ. Καθηγητής Παράμετροι ελέγχου

Δομικά Υλικά Μάθημα ΙΙΙ. Ηχος & Ηχητικά Φαινόμενα

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Κεφάλαιο T3. Ηχητικά κύµατα

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗΣ

Κεφάλαιο 5 ο : Μηχανικά Κύματα

4. Ποιο από τα παρακάτω δεν ισχύει για την ευαισθησία ενός δέκτη ΑΜ; Α. Ευαισθησία ενός δέκτη καθορίζεται από την στάθμη θορύβου στην είσοδό του.

ΚΕΦΑΛΑΙΟ 6 Διαφορικός ενισχυτής

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Γνωστική Ψυχολογία Ι (ΨΧ32)

7 ο ΚΕΦΑΛΑΙΟ ΕΡΩΤΗΣΕΙΣ ΑΥΤΟΕΞΕΤΑΣΗΣ. 1) Ποιος είναι ο ρόλος του δέκτη στις επικοινωνίες.

Σήματα και Συστήματα. Διάλεξη 6: Ανάλυση Σημάτων σε Ανάπτυγμα Σειράς Fourier. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

Ιατρικά Ηλεκτρονικά. Δρ. Π. Ασβεστάς Εργαστήριο Επεξεργασίας Ιατρικού Σήματος & Εικόνας Τμήμα Τεχνολογίας Ιατρικών Οργάνων

ΔΙΑΓΩΝΙΣΜΑ 05 ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ Διάρκεια: 3 ώρες ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΠΕΝΤΕ (5) U β A

«Επικοινωνίες δεδομένων»

Μαθηματική Εισαγωγή Συναρτήσεις

ΘΟΡΥΒΟΣ. Λεοτσινίδης Μιχάλης Καθηγητής Υγιεινής

ΕΛΛΗΝΙΚΟ ΑΝΟΙΧΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΦΥΕ η ΕΡΓΑΣΙΑ

Ã. ÁÓÉÁÊÇÓ ÐÅÉÑÁÉÁÓ Γ ΛΥΚΕΙΟΥ ΦΥΣΙΚΗ ΚΑΤΕΥΘΥΝΣΗΣ. ΘΕΜΑ 1 ο

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα συντεταγμένων

ΣΤΑΣΙΜΑ ΚΥΜΑΤΑ. A. Στάσιμα κύματα σε χορδές


Ακουστική)και)Ψυχοακουστική

ΕΦΑΡΜΟΣΜΕΝΗ ΑΚΟΥΣΤΙΚΗ II

Εισαγωγή στις Τηλεπικοινωνίες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις

Transcript:

!! ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΗΧΟΥ ΚΑΙ ΜΟΥΣΙΚΩΝ ΟΡΓΑΝΩΝ Συγκεντρωτική µελέτη της επίδρασης του ήχου και της µουσικής στον άνθρωπο ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Δηµήτρης Τσίπης ΛΗΞΟΥΡΙ 2010

ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΗΧΟΥ ΚΑΙ ΜΟΥΣΙΚΩΝ ΟΡΓΑΝΩΝ Συγκεντρωτική µελέτη της επίδρασης του ήχου και της µουσικής στον άνθρωπο ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Δηµήτρης Τσίπης Δρ. Δ. Κατερέλος Επίκουρος Καθηγητής Κ. Δρόσος Επιστηµονικός Συνεργάτης

1 Περιεχόµενα Περιεχόµενα... σελ.1 1. Εισαγωγή... 3 2. Βιβλιογραφική ανασκόπιση... 4 3. Απόλυτα όρια... 6 4. Επιλεκτικότητα Συχνότητας και Επικάλυψη (Frequency selectivity and masking)... 10! 4.1. Η έννοια του ακουστικού φίλτρου και ψυχοφυσικές καµπύλες συντονισµού... 10 4.2. Η µέθοδος Notched-Noise... 13 4.3. Σχηµατοµορφές Επικάλυψης και Διέγερσης... 16 5. Ακουστότητα... 20 5.1. Στάθµη ακουστότητας και καµπύλες ίσης ακουστότητας... 20 5.2. Νευρωνική κωδικοποίηση και µοντελοποίηση της ακουστότητας... 22 5.3. Επίδραση του εύρους ζώνης στην ακουστότητα... 23 5.4. Διάκριση έντασης... 25 6. Χρονική επεξεργασία στο ακουστικό σύστηµα... 27 6.1. Χρονική ανάλυση βασισµένη στις εντός του καναλιού διεργασίες... 27 6.2. Μοντελοποίηση της χρονικής ανάλυσης... 30 6.3. Αλλοίωση τόνου... 31 6.4. Διάκριση διάρκειας... 32 7. Αντίληψη ύψους... 33 7.1. Θεωρίες της αντίληψης του ύψους... 33 7.2. Αντίληψη του ύψους στους καθαρούς τόνους... 35 7.2.1. Διάκριση συχνότητας στους καθαρούς τόνους... 35 7.2.2. Αντίληψη των µουσικών διαστηµάτων... 36 7.2.3. Η επίδραση της στάθµης στο ύψος... 37 7.3. Αντίληψη του ύψους στους σύνθετους τόνους... 38

2 7.3.1. Ακούγοντας Παράγωγες σε σύνθετους τόνους... 38 7.3.2. Το φαινόµενο της χαµένης θεµελιώδους... 39 7.3.3. Θεωρίες της αντίληψης του ύψους για τους σύνθετους τόνους... 41 8. Αντίληψη Χροιάς... 44 8.1. Χρονικά µη ποικίλες καµπύλες και χροιά... 44 8.2. Ποικίλου χρόνου καµπύλες και αναγνώριση ακουστικών αντικειµένων... 45 9. Ο εντοπισµός του ήχου... 48 9.1. Αµφιωτικές νύξεις... 48 9.2. Ο ρόλος του λοβού και του κορµού... 49 9.3. Το φαινόµενο της προπορείας... 50 10. Ανάλυση της ακουστικής σκηνής (Auditory scene analysis)... 52 10.1. Διαχωρισµός ακουστικών αντικειµένων... 52 10.1.1. Θεµελιώδης συχνότητα και φασµατική οµαλότητα... 52 10.1.2. Σύγκριση ερεθισµάτων µε προηγούµενους ήχους... 53 10.1.3. Συσχετισµός αλλαγών στο πλάτος ή τη συχνότητα... 54 10.1.4. Τοποθεσία ήχου... 55 10.2. Η αντίληψη των ακολουθιών του ήχου... 57 10.2.1. Διαχωρισµός ρευµάτων... 57 10.2.2. Κρίση της χρονικής σειράς... 59 10.3. Γενικές αρχές αντιληπτικής οργάνωσης... 60 10.3.1. Οµοιότητα (Similarity)... 60 10.3.2. Καλή συνέχεια (good continuation)... 60 10.3.3. Αρµονικοί παράλληλης συχνότητας και πλάτους (common fate)... 61 11. Συµπεράσµατα... 62 12.Επίλογος... 68 13. Βιβλιογραφία... 69

3 1. Εισαγωγή. Η επίδραση του ήχου στον άνθρωπο ξεκινά από την οριοθέτηση της αντίληψης. Τα απόλυτα όρια για ανιχνεύσιµα ηµίτονα είναι εν µέρει καθορισµένα από τη διάδοση του ήχου στο εξωτερικό και µέσο αυτί. Το περιφερικό, αυτό, ακουστικό σύστηµα συµπεριφέρεται σαν να περιέχει µία τράπεζα φίλτρων, όπου κάθε φίλτρο µε διαφορετική συχνότητα αντιστοιχεί σε διαφορετικό σηµείο της βασικής µεµβράνης, η οποία ανταποκρίνεται σε περιορισµένο φάσµα συχνοτήτων. Για να καθοριστεί το σχήµα αυτών των φίλτρων σηµαντικό ρόλο έχουν οι ψυχοφυσικές καµπύλες συντονισµού, η µέθοδος notched-noise καθώς και το φαινόµενο της επικάλυψης. Βάση αυτών από την έξοδο των φίλτρων προκύπτουν οι καµπύλες επικάλυψης και διέγερσης. Τέτοιου είδους καµπύλες, που ονοµάζονται περιγράµµατα ίσης ακουστότητας, συναντούµε και στην ακουστότητα, η οποία είναι η υποκειµενική αίσθηση της έντασης και η στάθµη της µετριέται σε phons. Για την αντίληψη της έντασης σηµαντική είναι η επίδραση του εύρους ζώνης στην ακουστότητα και η διάκριση έντασης. Η χρονική επεξεργασία του ακουστικού συστήµατος, βασίζεται στην χρονική ανάλυση, την αλλοίωση τόνου και τη διάκριση διάρκειας. Η αντίληψη ύψους γίνεται συχνοτικά και χρονικά, ενώ η αντίληψη της χροιάς επιτρέπει στον ακροατή να διακρίνει δύο όµοιους ήχους σε ακουστότητα και ύψος. Ο εντοπισµός του ήχου από τον άνθρωπο οφείλεται σε ανακλάσεις στο λοβό και το σώµα του, στο φαινόµενο precedence effect και στη θέση της πηγής από τα αυτιά του. Στην ανάλυση της ακουστικής σκηνής, ο διαχωρισµός ακουστικών αντικειµένων γίνεται βάση θεµελιώδους συχνότητας και φασµατικής οµαλότητας, σύγκρισης ερεθισµάτων µε προηγούµενους ήχους και συσχετισµό αλλαγών στο πλάτος ή τη συχνότητα, η αντίληψη των ακολουθιών του ήχου γίνεται βάση του διαχωρισµού επιπέδων και της κρίσης της χρονικής σειράς και οι γενικές αρχές αντιληπτικής οργάνωσης είναι η οµοιότητα, η καλή συνέχεια και οι αρµονικοί παράλληλης συχνότητας και πλάτους. Σύµφωνα µε τα παραπάνω, τα οποία θα αναλυθούν στα κεφάλαια που θα ακολουθήσουν, η συγκεκριµένη εργασία έχει ως στόχο µέσω της φυσικής υπόστασης της ακουστικής αντίληψης του ανθρώπου, να συσχετίσει τον τρόπος µε τον οποίο ο ήχος και η µουσική επιδρούν στον άνθρωπο.

4 2. Βιβλιογραφική ανασκόπηση. Τον 6 ο αιώνα π.χ. ο Πυθαγόρας [1] χρησιµοποιώντας το µοντέλο του µονόχορδου κατάφερε να συσχετίσει τους πρώτους αριθµούς, µε τα ταλαντούµενα σώµατα (χορδές, αέριες στήλες, ράβδοι) θέτοντας τις βάσεις της επιστήµης της µουσικής ακουστικής. Η µελέτη της αισθητικής διάστασης των συµφωνιών και διαφωνιών από τους Πυθαγόρειους (Αριστόξενος 4 ος αιών. π.χ.) [1] θέτει τις βάσεις ενός ακόµη επιστηµονικού πεδίου στο χώρο της ακουστικής που ονοµάζεται ψυχοακουστική [1]. Στον 20 ο αιώνα ακολούθησαν επιστήµονες, που θεµελίωσαν νόµους και θεωρήµατα που αφορούν το τονικό ύψος, όπως οι Marsenne, Galileo, Fourier, Ohm, Helmholtz, von Bekesy, Fletcher και de Cheveigne (σύµφωνα µε τον τελευταίο) [2]. Οι Zwicker και Fastl [3] ασχολήθηκαν µε ψυχοακουστικές µετρήσεις επικάλυψης καθαρών τόνων, οι οποίες σχετίζονται µε τις σχηµατοµορφές διέγερσης, τις καµπύλες συντονισµού, την υποκειµενική διάρκεια, την ακουστότητα και την αντίληψη ύψους για καθαρούς και σύνθετους τόνους. Στις ίδιες εργασίες κινείται και ο B. C. J. Moore [4], ασχολούµενος περισσότερο µε την καθιέρωση των προτύπων για µετρήσεις που χρησιµοποιούνται στην ακοολογία. Παράλληλα ο W. M. Hartmann [5] µελετάει την επεξεργασία σήµατος και προχωρηµένα θέµατα αλλοίωσης καθαρών και σύνθετων τόνων µέσω των επιστηµών της φυσικής και των µαθηµατικών. Οι Pressnitzer και McAdams [6] µελέτησαν τη σχέση µεταξύ ακουστικής, ψυχοακουστικής και φασµατικής µουσικής ( spectral music ), µέσο της συµπεριφοράς του τόνου στην αρµονία µουσικών κοµµατιών λαµβάνοντας υπόψη την οργάνωση του ανθρώπινου ακουστικού συστήµατος και οι Jackendoff και Lerdhl [7] τα βασικά συστατικά της µουσικής οργάνωσης όπως ρυθµός, τονική οργάνωση κι επίδραση, µέσω του διαχωρισµού των ρευµάτων και των γενικών αρχών αντιληπτικής οργάνωσης. Ο Bregman [8] από το 1970 µέχρι σήµερα θεσπίζει µία καινούργια κατηγορία στην ακουστική, γνωστή ως ανάλυση ακουστικής σκηνής (auditory scene analysis),όπου εξηγεί πως το ανθρώπινο ακουστικό σύστηµα και ο εγκέφαλος επεξεργάζονται σύνθετες ακουστικές σκηνές, όπου υπάρχουν πολλές πηγές, οι οποίες αλλάζουν ακουστικές ιδιότητες ανεξάρτητα µε το χρόνο. Ο R. P. Carlyon [9] εξηγεί πως ο ανθρώπινος εγκέφαλος διαχωρίζει τον ήχο µέσω των ακουστικών ρευµάτων και πως αυτό σχετίζεται µε την επίδραση του ήχου στον άνθρωπο. Τέλος ο J. Blauert [10] καλύπτωντας µε τις

5 εργασίες του αρκετά πεδία της επιστήµης της ακουστική που σχετίζονται µε τον άνθρωπο, έχει προχωρίσει τις ιδέες για την αντίληψη της ανθρώπινης επικοινωνίας.

6 3. Απόλυτα Όρια. Στην καθηµερινή ζωή δεν υπάρχει κάποια εύκολα αντιληπτή στάθµη ήχου, στην οποία ένας ήχος γίνεται ξαφνικά ανιχνεύσιµος από το ανθρώπινο ακουστικό σύστηµα, και να σχετίζεται µε την οριοθέτιση της ακοής. Απόλυτο όριο ενός ήχου είναι η χαµηλότερη αντιληπτή στάθµη αυτού του ήχου στην απουσία οποιουδήποτε άλλου [11]. Σχετικά η πιθανότητα ανίχνευσης ενός ήχου αυξάνεται προοδευτικά καθώς η στάθµη του αυξάνεται από µία πολύ χαµηλή τιµή. Σχήμα 3.1.: Αναπαράσταση της σχέσης των καμπυλών MAP και MAF [4]. Απεικονίζεται η σχέση του απόλυτου ορίου σε μονάδες db SPL με τη συχνότητα σε μονάδες khz. Άρα το απόλυτο όριο ορίζεται ως η στάθµη του ήχου κατά την οποία ένα άτοµο ορίζει τον ήχο µε µία ορισµένη πιθανότητα [12] και είναι εν µέρει καθορισµένο από τη διάδοση του ήχου διαµέσου των τµηµάτων του εξωτερικού και µέσου αυτιού, τα οποία έχουν ως λειτουργία την υποδοχή και µεταβίβαση των ηχητικών κυµάτων στο εσωτερικό αυτί. Με µία πρώτη προσέγγιση το εσωτερικό αυτί, στο οποίο βρίσκονται τα υποδεκτικά όργανα των αισθήσεων της ακοής και του χώρου, είναι εξίσου ευαίσθητο σε όλες τις συχνότητες, εκτός ίσως από τις πολύ χαµηλές και τις πολύ υψηλές συχνότητες [13]. Το απόλυτο όριο µετριέται µε δύο τρόπους σε άτοµα µε κανονική ακοή. Αυτόν του ελάχιστου ακουστού πεδίου ( minimum audible field - MAF ), που αφορά την αµφιωτική ακοή, και αυτόν της ελάχιστης ακουστής πίεσης ( minimum audible

7 pressure - MAP 1 ), που αφορά την µονοωτική ακοή, όπως φαίνεται στο Σχήµα 3.1. Για την ελάχιστη ακουστή πίεση, η στάθµη του ήχου µετριέται σε ένα σηµείο κοντά στο τύµπανο (του αυτιού), ενώ για το ελάχιστο ακουστό πεδίο η µέτρηση της ηχητικής στάθµης πραγµατοποιείται αφού ο ακροατής αποχωρήσει από το ηχητικό πεδίο, στο σηµείο το οποίο κατείχε το κέντρο του κεφαλιού του (ακροατή). Για τη µέτρηση αυτή, ο ήχος παρουσιάζεται σε ελεύθερο πεδίο (ανηχοϊκός θάλαµος), µε κατεύθυνση κλίσης 0 απευθείας µπροστά από τον ακροατή [12]. Κατά µέσο όρο τα όρια είναι περίπου 2dB χαµηλότερα όταν και τα δύο αυτιά χρησιµοποιούνται, εν αντιθέση µε το ένα, παρόλο που η ακριβής αξία της διαφοράς ποικίλει ανάµεσα στις µελέτες από 0 εώς 3 db και µπορεί να οφείλεται στην ενδοωτική φάση του τόνου 2 [14]. Όπως φαίνεται στο Σχήµα 3.1, η καµπύλη που αναπαριστά τα όρια για την MAF είναι αρκετά διαφορετική από την καµπύλη που αναπαριστά την MAP, γεγονός το οποίο οφείλεται στην επιρροή οργάνων του ανθρώπινου σώµατος στο ηχητικό πεδίο, µε κύριο λόγο το κεφάλι, το λοβό και τον πόρο. Η καµπύλη MAP (σχήµα 3.1) δείχνει µόνο κορυφές και βυθίσεις τις τάξεως +-5 db για συχνότητες ανάµεσα περίπου στα 0.2 Hz και 13 khz, ενώ η καµπύλη MAF δείχνει ένα ευδιάκριτο βύθισµα στην περιοχή των 3 khz µε 4 khz και µια κορυφή στην περιοχή των 8 khz εώς 9 khz. Αυτή η διαφορά προέρχεται κυρίως από έναν ευρύ συντονισµό που παράγεται από τον πόρο και το λοβό και η στάθµη του ήχου στο τύµπανο είναι ενισχυµένη αισθητά για συχνότητες της τάξεως των 1.5 khz εώς 16 khz, µε µια µεγιστη ενίσχυση στα 3 khz περίπου 15 db. Μια εναλλακτική µέθοδος προσδιορισµού απόλυτων ορίων συχνά χρησιµοποιείται όταν µετράµε την ακοή σε κλινική κατάσταση, όταν για παράδειγµα υπάρχουν υποψίες για ένα πρόβληµα ακοής. Τα όρια σε αυτή την περίπτωση προσδιορίζονται συγκριτικά µε το µέσο όρο του ορίου σε κάθε συχνότητα για νεαρούς, υγιείς ακροατές, µε κανονική ακοή. Στην ίδια περίπτωση η στάθµη του ήχου προσδιορίζεται συγκριτικά, µε τη διαφορά πως γνώµονας είναι οι τυποποιηµένες τιµές 1 Η λέξη MAP, η οποία θα χρησιµοποιηθεί στη συγκεκριµένη εργασία, αναφέρεται στο εύρος της πίεσης που ασκείται στο τύµπανο του αυτιού του παρατηρητή. Στην βιβλιογραφία συναντάται και ως MAPC, που σηµαίνει minimum audible pressure in a coupler και αναφέρεται στην πίεση του ακουστικού (earphone-coupler).-(βλέπε σχόλια 3 και 4) 2 Τόνος: είναι ο ήχος, ο οποίος έχει καθορισµένο ύψος (κεφ. 7).

8 που παράγονται από ένα συγκεκριµένο ακουστικό σε ένα συγκεκριµένο σύνδεσµο 3 (coupler). Τα ακουστικά στις µετρήσεις αυτές ποικίλουν από χώρα σε χώρα. Το πιο απλό παράδειγµα που µπορεί να περιγραφεί είναι αυτό που υποδεικνύει πως τα Telephonics TDH49 4 ή TDH50 συνήθως χρησιµοποιούνται στο Ηνωµένο Βασίλειο και στις Η.Π.Α., καθώς τα Beyer DT48 χρησιµοποιούνται στη Γερµανία. Ορίζοντας τα όρια Σχήµα 3.2: Σύγκριση κλινικού ακοογράµατος για απώλεια ακοής, της τάξεως των 50 db σε στάθµη σε όλες τις συχνότητες, (αριστερά) και την καµπύλη απόλυτου ορίου για την ίδια περίπτωση απώλειας ακοής, απεικονισµένη µε µια καµπύλη MAP (δεξιά) [4]. κατά αυτόν τον τρόπο οι µονάδες µέτρησης διαφέρουν από περιοχή σε περιοχή, µε αντιστοιχία µονάδων σε db HL (hearing level) για την Ευρώπη και db HTL (hearing threshold level) για τις Η.Π.Α. Η διαφορά των µονάδων γίνεται πιο εµφανής όταν για παράδειγµα, ένα όριο της τάξεως των 40 db HL στη συχνότητα των 1 khz σηµαίνει ότι το άτοµο εχεί ένα όριο, το οποίο είναι της τάξεως των 40 db υψηλότερο από το κανονικό στη συγκεκριµένη συχνότητα. Η µέση τιµή του κανονικού ορίου απεικονίζεται ως µια οριζόντια γραµµή στην κορυφή της χάραξης (0 db για όλες τις συχνότητες) και ο βαθµός της απώλειας της ακοής υποδεικνύεαι από την πτώση του ορίου κάτω από την γραµµή. Αυτό το είδος του σχεδίου ονοµάζεται ακοόγραµµα. Το Σχήµα 3.2 συγκρίνει ένα ακοόγραµµα, σε µία 3 Σύνδεσµος (coupler) είναι µία συσκευή, η οποία χρησιµοποιείται για τον καθορισµό ή διόρθωση (calibration) των διαβαθµίσεων του ακουστικού και παρουσιάζει µια ακουστική εµπέδηση στο ακουστικό, ισοδύναµη της αντίστασης που παρουσιάζεται από το µέσο ανθρώπινο αυτί [15][16]. 4 Διαφορετικοί τύποι ακουστικών χρησιµοποιούνται ανά τις µελέτες συνδιαζόµενα µε διαφορετικούς τύπους συνδέσµου [12] (earphone-coupler).

9 υποθετική περίπτωση, όπου υπάρχει διαταραγµένης ακοής άτοµο µε επίπεδη απώλεια ακοής, µε ένα σχεδιάγραµµα των ίδιων ορίων να παριστάνεται ως τιµές MAP. Πρέπει να σηµειωθεί πως τα όρια σε µονάδες db HL µπορούν να έχουν αρνητικό πρόσηµο. Σε ένα απλό παράδειγµα, όπου το όριο θα ήταν -10 db σηµαίνει ότι το άτοµο είναι κατά 10 db περισσότερο ευαίσθητο από το κανονικό. Η µεγαλύτερη ακουστή συχνότητα ωστόσο µπορεί να ποικίλει και αυτό να οφείλεται στην ηλικία. Νεαρά άτοµα (παιδιά) µπορούν να ακούσουν τόνους τόσο ψηλούς όσο η συχνότητα των 20 khz, αλλά για τους περισσότερους ενήλικες το όριο µειώνεται ραγδαία λίγο πάνω από τα 15 khz. Η απώλεια της ευαισθησίας στην ακοή µε την αύξηση της ηλικίας είναι µεγαλύτερη στις υψηλές συχνότητες σε σύγκριση µε τις χαµηλές. Για παράδειγµα, ήχοι όπως αυτοί του κουδουνίσµατος του τηλεφώνου, της οµιλίας σε θορυβώδες περιβάλλον, το κελάηδισµα των πουλιών, δεν γίνονται εύκολα αντιληπτοί λόγω των υψηλών συχνοτήτων που περιέχουν. Φαίνεται να µην υπάρχουν σαφώς καθορισµένα απόλυτα όρια για την ακοή, αν και πολύ έντονοι χαµηλής συχνότητας τόνοι µπορούν να γίνουν αισθητοί ως δονήσεις πριν να ακουστούν. Το όριο των χαµηλών συχνοτήτων για την πραγµατική ακοή, όσον αφορά τους καθαρούς τόνους 5 πιθανότατα κυµαίνεται στα 20 Hz. Αυτό είναι κοντά στη χαµηλότερη συχνότητα, η οποία προκαλεί µια εντύπωση ή αίσθηση τονικού ύψους [17]. Αντίθετα το σηµείο στο οποίο ο ήχος (ή µια συχνότητα) γίνεται επώδυνη για έναν άνθρωπο είναι το όριο πόνου (της πίεσης) ( pain threshold pressure ) για αυτόν τον άνθρωπο τη συγκεκριµένη στιγµή. Άτοµα τα οποία έχουν εκτεθεί σε περισσότερο θόρυβο ή µουσική συχνά έχουν ένα υψηλότερο όριο (πόνου) [18]. Οι µετρήσεις για τα όρια συνήθως πραγµατοποιούνται µε σήµατα µικρής διάρκειας ( tone bursts ) 6. Για διάρκειες οι οποίες ξεπερνούν τα 500 ms, η στάθµη του ήχου είναι ανεξάρτητη της διάρκειας, ενώ για διάρκειες µικρότερες από 200 ms, η στάθµη του ήχου αυξάνεται καθώς η διάρκεια µειώνεται. 5 Ένας τόνος µε ηµιτονοειδή κυµατοµορφή λέγεται καθαρός τόνος καθώς θεωρείται ως η απλούστερη µορφή τόνου και ακούγεται καθαρός όταν αναπαράγεται σε ησυχία. 6 Το tone-burst είναι ένα πολύ σύντοµο σήµα (ή µήνυµα) που χρησιµοποιείται σε ακουστικές µετρήσεις για να καταστεί δυνατή η διαφοροποίηση των επιθυµητών σηµάτων από φαινοµενική αντανάκλαση [19].

10 4. Επιλεκτικότητα Συχνότητας και Επικάλυψη (Frequency selectivity and masking). Η επιλεκτικότητα συχνότητας αναφέρεται στην ικανότητα του ανθρώπου να διαχωρίζει ηµιτονοειδείς συνιστώσες σε ένα σύνθετο ήχο. Είναι µια βασική πτυχή της ανάλυσης του ήχου από το ακουστικό σύστηµα και επηρεάζει πολλές πτυχές της ακουστικής αντίληψης, συµπεριλαµβανοµένων της αντίληψης της ακουστότητας, του ύψους, και της χροιάς. Συνήθως αποδεικνύεται και µετράται µελετώντας την επικάλυψη, η οποία έχει οριστεί ως η διαδικασία µε την οποία το όριο της ακουστότητας για έναν ήχο εγείρεται από την παρουσία ενός άλλου ήχου (επικάλυψης),[ the process by which the threshold of audibility for one sound is raised by the presence of another (masking) sound ] 7 [20]. Είναι γνωστό ότι ένα ηχητικό σήµα είναι πιο εύκολο να επικαλυφθεί από έναν ήχο έχοντας στοιχεία συχνότητας 8 κοντά σε ή ίδια µε αυτά του σήµατος [21]. Αυτό οδήγησε στην ιδέα ότι η ικανότητα του ανθρώπου να ξεχωρίσει τα στοιχεία ενός σύνθετου ήχου εξαρτάται, τουλάχιστον εν µέρει, από την ανάλυση της συχνότητας που γίνεται στη βασική µεµβράνη (όπου είναι η αφετηρία της µετατροπής των ακουστικών ερεθισµάτων σε ηλεκτρικά και την προώθησή τους στο ακουστικό νεύρο, από όπου µεταφέρονται στον εγκέφαλο) [22]. 4.1. Η έννοια του ακουστικού φίλτρου και ψυχοφυσικές καµπύλες συντονισµού. Ο Helmholtz [2,23] υποστήριξε ότι το περιφερικό ακουστικό σύστηµα συµπεριφέρεται σαν να περιέχει µια τράπεζα ζωνοπερατών (bandpass) φίλτρων. Τα φίλτρα αυτά ονοµάζονται ακουστικά φίλτρα. Ο Fletcher [24] επαλήθευσε αυτή τη θεωρία µέσω πειραµάτων και υποστήριζε µε τη σειρά του ότι η βασική µεµβράνη 7 Ο παραπάνω ορισµός που δίνεται είναι από την ANSI (American National Standards Institute), ωστόσο υπάρχει και ο παρακάτω το ποσό µε το οποίο το όριο της ακουστότητας ενός ήχου εγείρεται από την παρουσία ενός άλλου ήχου (επικάλυψης),[ the amount by which the threshold of audibility of a sound is raised by the presence of another (masking) sound ] [20] 8 Ένα ηχητικό σήµα µπορεί να περιγραφεί ως ένα άθροισµα στοιχείων συχνότητάς του µέσω διεργασιών, και συγκεκριµένα µέσω της φασµατικής αναλυσης (spectrum analysis). Σκοπός αυτής της διεργασίας είναι το σύνθετο σήµα να αναλυθεί σε απλούστερη µορφή.

11 παρείχε τη βάση για τα ακουστικά φίλτρα. Κάθε τοποθεσία στη βασική µεµβράνη ανταποκρίνεται σε περιορισµένο φάσµα συχνοτήτων, έτσι κάθε διαφορετικό σηµείο αντιστοιχεί σε ένα φίλτρο µε διαφορετική κεντρική συχνότητα. Όταν γίνεται προσπάθεια ανίχνευσης ενός σήµατος σε ένα θόρυβο βάθους ευρύ φάσµατος, ο ακροατής υποτίθεται ότι πρέπει να κάνει χρήση ενός φίλτρου µε µία κεντρική συχνότητα κοντά σε εκείνη του σήµατος. Αυτό το φίλτρο επιτρέπει να περάσει το σήµα, αλλά αφαιρεί ένα µεγάλο βαθµό θορύβου 9. Μόνο τα στοιχεία του θορύβου, τα οποία περνούν µέσα από το φίλτρο, δεν έχουν καµία επίπτωση στην επικάλυψη του σήµατος. Συχνά θεωρείται ότι το όριο για την ανίχνευση του σήµατος προσδιορίζεται από το ποσό του θορύβου που διέρχεται στο ακουστικό φίλτρο. Συγκεκριµένα, το όριο υποτίθεται ότι αντιστοιχεί σε ένα συγκεκριµένο λόγο σήµατος προς θόρυβο στην έξοδο του φίλτρου. Αυτό το σύνολο των υποθέσεων έχει γίνει γνωστό ως µοντέλο δυναµικού φάσµατος της επικάλυψης ( power spectrum model of masking ) [25]. Οι περισσότερες µέθοδοι για την εκτίµηση του σχήµατος του ακουστικού φίλτρου σε µια δεδοµένη κεντρική συχνότητα βασίζονται στις υποθέσεις του µοντέλου δυναµικού φάσµατος της επικάλυψης. Το όριο του σήµατος, του οποίου η συχνότητα είναι καθορισµένη, µετράται στην παρουσία ενός ήχου επικάλυψης ή επισκιάζων ( masker 10 ), του οποίου το φασµατικό περιεχόµενο ποικίλει. Υποτίθεται µε µια πρώτη προσέγγιση ότι το σήµα γίνεται αντιληπτό χρησιµοποιώντας το ακουστικό φίλτρο, το οποίο βρίσκεται εστιασµένο στο κέντρο της συχνότητας του σήµατος και αυτό το όριο αντιστοιχεί σε ένα σταθερό λόγο σήµα προς ήχο επικάλυψης ( signalto-masker ) στην έξοδο αυτού του φίλτρου. Μία µέθοδος µέτρησης του σχήµατος των φίλτρων περιλαµβάνει µια διαδικασία, η οποία είναι ανάλογη µε πολλούς τρόπους στον προσδιορισµό µιας 9 Ο θόρυβος συχνά ορίζεται (σε σχέση µε την ένταση) ως ένας µη ευχάριστος ή ενοχλητικός ήχος. Στη συγκεκριµένη περίπτωση ορίζεται µε βάση το συχνοτικό φάσµα. Υπάρχουν διάφορα είδη θορύβων όπως λευκός, ροζ, καφέ, µπλε, βιολετί. Όλοι οι θόρυβοι, ορίζονται ώς 1/f ν (λευκός, ροζ, καφέ) ή µε την πυκνότητα ανάλογη του f ν (µπλε, βιολετί). 10 Επισκιάζων ή ήχος επικάλυψης λέγεται ο ήχος, ο οποίος καλύπτει έναν άλλον ήχο ή περισσότερους, ώστε στην παρουσία τους να γίνει µονον αυτός αντιληπτός (ακουστικά) ή µερικές φορές και µόνον ένα µερος του, µε την προϋπόθεση στην τελευταία περίπτωση, ο επισκιάζων ήχος να είναι συνθετος.

12 Σχήµα 4.1: Οι ψυχοφυσικές καµπύλες συντονισµού (PTC) προσδιορίζονται στην ταυτόχρονη επικάλυψη (simultaneous masking), µε τη χρήση ηµιτονοειδών σηµάτων στα 10 db SL. Για κάθε καµπύλη, ο κύκλος από κάτω δείχνει τη συχνότητα και το επίπεδο του σήµατος. Ο ήχος επικάλυψης είναι ένα ηµίτονο, το οποίο έχει σταθερή σχέση φάσης µε το σήµα των 50 ms. Η στάθµη του ήχου επικάλυψης που απαιτείται ως όριο είναι σχεδιασµένο σε λογαριθµική κλίµακα. Η διακεκοµµένη γραµµή δείχνει το απόλυτο όριο για το σήµα [25]. νευρωνικής καµπύλης συντονισµού 11 και η λειτουργία που προκύπτει συχνά αποκαλείται ψυχοφυσική καµπύλη συντονισµού ( psychoacoustical tuning curve ) και συµβολίζεται µε PTC [26]. Για να καθοριστεί µια PTC το σήµα είναι σταθερό σε στάθµη, συνήθως σε πολύ χαµηλή στάθµη (π.χ. 10 db SL) πάνω από το απόλυτο όριο. Ο ήχος επικάλυψης µπορεί να είναι ένα ηµίτονο ή µία περιοχή θορύβου καλύπτοντας ένα µικρό φάσµα συχνοτήτων. Για κάθε µία από τις πολλές συχνότητες επικάλυψης, προσδιορίζεται η στάθµη του ήχου επικάλυψης που χρειάζεται απλά για να καλύψει το σήµα. Επειδή το σήµα βρίσκεται σε χαµηλή στάθµη θεωρείται ότι προκαλεί κατά κύριο λόγο δραστηριότητα στην έξοδο ενός ακουστικού φίλτρου. Θεωρείται επίσης ότι στο απόλυτο όριο ο ήχος επικάλυψης προκαλεί µια σταθερή έξοδο από αυτό το φίλτρο, προκειµένου να καλύψει το σταθερό σήµα. Έτσι η PTC δείχνει το επίπεδο επικάλυψης που χρειάζεται για να παραχθεί µια σταθερή έξοδος από το ακουστικό φίλτρο ως συνάρτηση της συχνότητας (σχήµα 4.1). Κανονικά ένα χαρακτηριστικό φίλτρο προσδιορίζεται σχηµατίζοντας την έξοδο από ένα φίλτρο για µια είσοδο που ποικίλει σε 11 Μια νευρωνική καµπύλη συντονισµού προέρχεται από τον προσδιορισµό της στάθµης του τόνου διέγερσης, που απαιτείται για την παραγωγή σταθερής αύξησης στο spike-count (αν και το χρονικό πρότυπο των εντολών µπορεί να ποικίλει) από το νευρώνα ως συνάρτηση της συχνότητας του τόνου διέγερσης. Spike-count (rate) ονοµάζεται o αριθµός των εντολών που λαµβάνει και στέλνει ένας νευρώνας µέσα σε ένα συγκεκριµένο χρονικό διάστηµα.

13 συχνότητα και είναι σταθερή σε στάθµη. Ένα πρόβληµα στην ερµηνεία των ψυχοφυσικών καµπύλων συντονισµού είναι ότι στην πράξη ο ακροατής, µπορεί να χρησιµοποιεί την πληροφορία από περισσότερα του ενός φίλτρα. Σε αυτή τη διαδικασία ο ακροατής µπορεί να επιλέξει ένα φίλτρο χαµηλότερα από τη συχνότητα του σήµατος, ώστε να βελτιώσει την ακουστική του επίδοση. Αυτό το εκτός συχνότητας φίλτρο µειώνει τη στάθµη του ήχου επικάλυψης περισσότερο από το σήµα στην στάθµη έξοδου του φίλτρου, γεγονός το οποίο σηµαίνει ότι ο ακροατής µπορεί να ακούσει το σήµα πιο καθαρά και ως εκ τούτου προκαλεί την βελτίωση της ακουστικής του απόδοσης. Αυτή η διαδικασία είναι γνωστή ως άκουσµα εκτός συχνότητας ( offfrequency listening ) [27]. Το Σχήµα 4.2 δείχνει ένα τέτοιο παράδειγµα. Σχήµα 4.2: Το διάγραµµα 6a δείχνει το ακουστικό φίλτρο κεντραρισµένο στο σήµα και πως τµήµα του ήχου επικάλυψης εµπίπτει στο εν λόγω φίλτρο. Αυτό έχει ως αποτέλεσµα έναν χαµηλό λόγο σήµατος προς ήχο επικάλυψης (signal to noise ratio). Το διάγραµµα 6b δείχνει το επόµενο φίλτρο, το οποίο δεν είναι κεντραρισµένο στο σήµα, αλλά περιλαµβάνει ένα σηµαντικό ποσό του εν λόγο σήµατος και λιγότερο του ήχου επικάλυψης. Αυτό µειώνει την επίδραση του ήχου επικάλυψης, αυξάνοντας τον λόγο σήµατος προς ήχο επικάλυψης. 4.2. Η µέθοδος Notched-Noise. Ο Patterson [4] περιέγραψε µία µέθοδο καθορισµού του σχήµατος των ακουστικών φίλτρων, η οποία µείωνει το εκτός συχνότητας άκουσµα. Η µέθοδος απεικονίζεται στο Σχήµα 4.3. Το σήµα είναι σταθερό σε συχνότητα και ο ήχος Σχήµα 4.3: Σχηµατική απεικόνιση της τεχνικής που χρησιµοποιήθηκε από τον Petterson, ώστε να προσδιορίσει το σχήµα των ακουστικών φίλτρων. Το όριο του ηµιτονοειδούς σήµατος (απεικονίζεται από την έντονη κάθετη γραµµή) µετράται ως συνάρτηση του πλάτους της φασµατικής εγκοπής στο θόρυβο επικάλυψης.

14 επικάλυψης είναι ένας θόρυβος µε αποκοπή ζώνης. Η απόκλιση της κάθε άκρης του θορύβου από την κεντρική συχνότητα συµβολίζεται µε f (Σχήµα 4.3). Το πλάτος του εύρους ζώνης ποικίλει και το όριο του σήµατος καθορίζεται σε συνάρτηση µε το πλάτος του εύρους ζώνης. Δεδοµένου ότι η περιοχή τοποθετείται συµµετρικά γύρω από τη συχνότητα του σήµατος, η µέθοδος δεν µπορεί να αποκαλύψει ασυµµετρίες στο ακουστικό φίλτρο, καθώς και η ανάλυση λαµβάνει υπόψη ότι το φίλτρο είναι συµµετρικό σε κλίµακα συχνοτήτων. Αυτή η υπόθεση δεν φαίνεται παράλογη, τουλάχιστον για το άνω µέρος του φίλτρου και σε µέτρια επίπεδα θορύβου, δεδοµένου ότι οι ψυχοφυσικές καµπύλες συντονισµού είναι αρκετά συµµετρικές γύρω από τις άκρες. Για ένα σήµα συµµετρικά τοποθετηµένο σε θόρυβο (µε φίλτρο) απόρριψης ζώνης, το βέλτιστο ποσοστό σήµατος προς ήχο επικάλυψης στην έξοδο του ακουστικού φίλτρου επιτυγχάνεται µε ένα φίλτρο στο κέντρο του συχνοτικού σήµατος (σχήµα 4.3). Καθώς το πλάτος της φασµατικής ζώνης αυξάνεται, λιγότερος θόρυβος περνά µέσα από το ακουστικό φίλτρο. Έτσι και το όριο του σήµατος µειώνεται. Το ποσό του θορύβου που διέρχεται από το ακουστικό φίλτρο είναι ανάλογο µε την περιοχή κάτω από το φίλτρο, στο φάσµα συχνοτήτων που καλύπτεται από θόρυβο. Υποθέτοντας ότι το όριο αυτό αντιστοιχεί σε ένα σταθερό ποσοστό σήµατος προς ήχο επικάλυψης στην έξοδο του φίλτρου, η αλλαγή στο όριο του σήµατος µε ζώνη απόρριψης πλάτους δείχνει πως η περιοχή κάτω από το φίλτρο ποικίλει ανάλογα µε το f. Η σχετική απόκριση του φίλτρου για µια δεδοµένη απόκλιση, f, από την κεντρική συχνότητα είναι ίση µε την κλίση της συνάρτησης που αφορούν το όριο του σήµατος στο πλάτος απόρριψης ζώνης, κατά την εν λόγω τιµή του f. Ένα ακουστικό φίλτρο που παράγεται µε τη µέθοδο αυτή φαίνεται στο σχήµα 4.4. Έχει στρογγυλή κορυφή και αρκετά απότοµες άκρες. Η Σχήµα 4.4: Ένα σχήµα ακουστικού φίλτρου που σχηµατίζεται µε τη χρήση της µεθόδου notched-noise. Το φίλτρο είναι κεντραρισµένο στη συχνότητα των 1 khz. Η σχετική απόκριση του φίλτρου, σε µονάδες db, αναπαρίσταται ως συνάρτηση της συχνότητας.

15 οξύτητα του φίλτρου συχνά ορίζεται ως το εύρος ζώνης του φίλτρου, στην οποία η απόκριση έχει µειωθεί π.χ. κατά 3dB. Ένα εναλλακτικό µετρο είναι το ισοδύναµο ορθογώνιο εύρους ζώνης ( equivalent rectangular bandwidth-erb ), το οποίο ορίζεται ως το πλάτος ενός ορθογώνιου φίλτρου, του οποίου το ύψος είναι ίσο µε το µέγιστο κέρδος (gain 12 ) του φίλτρου, και το οποίο διέρχεται η ίδια συνολική ενέργεια µε το φίλτρο (δίνεται µια επίπεδη φασµατικά είσοδος, όπως ένας λευκός θόρυβος). H µέση τιµή ERB του ακουστικού φίλτρου προσδιορίζεται χρησιµοποιώντας νεαρούς ακροατές µε φυσιολογική ακοή και ένα µέτριο επίπεδο θορύβου, και συµβολίζεται µε ERBN (όπου ο δείκτης Ν χαρακτηρίζει φυσιολογική ακοή). Μια εξίσωση που περιγράφει την αξία του ERBN ως συνάρτηση της κεντρικής συχνότητας, F (σε Hz), είναι [28]: (1.1) ERBN =24.7(0.00437F+1). Μερικές φορές είναι χρήσιµο να αναπαρασταθούν ψυχοακουστικά δεδοµένα σε συχνοτική κλίµακα που σχετίζονται µε το ERBN. Ουσιαστικά η αξία των ERBN χρησιµοποιείται ως µονάδα της συχνότητας. Για παράδειγµα, η αξία των ERBN για µια κεντρική συχνότητα 1kHz είναι περίπου 132 Hz, έτσι µια αύξηση στη συχνότητα 934 µε 1066 Hz, αποτελεί ένα βήµα ενός ERBN. Ένας τύπος που αφορά ERBN αριθµό σε συχνότητα είναι: (1.2) ERBN number = 21.4 log10 (0.00437 F + 1), όπου F είναι η συχνότητα σε Hz. Αυτή η κλίµακα είναι εννοιολογικά παρόµοια µε την κλίµακα Bark που προτάθηκε από τον Zwicker [3], αν και διαφέρει κάπως σε αριθµητικές τιµές. Η µέθοδος notched-noise έχει επεκταθεί για να συµπεριλάβει τις προϋποθέσεις, όπου η φασµατική περιοχή στο θόρυβο τοποθετείται ασσύµετρα σχετικά µε τη συχνότητα σήµατος. Αυτό επιτρέπει τη µέτρηση των οποιονδήποτε ασσυµετριών στο ακουστικό φίλτρο. Η ανάλυση των αποτελεσµάτων είναι πιο δύσκολη, δεδοµένου ότι πρέπει να ληφθεί υπόψη το εκτός συχνότητας άκουσµα [27]. Τα αποτελέσµατα 12 Κέρδος (gain) είναι το µέτρο της ικανότητας ενός φίλτρου να αυξήσει την στάθµη ή πλάτος, ενός σήµατος που διέρχεται από αυτό, από την είσοδο στην έξοδό του.

16 δείχνουν ότι το ακουστικό φίλτρο είναι αρκετά συµµετρικό σε µέτριου επιπέδου ήχους, αλλά γίνεται όλο και πιο ασύµµετρο σε υψηλά επίπεδα. 4.3. Καµπύλες Επικάλυψης και Διέγερσης Πολλά από τα πρώτα πειράµατα στην επικάλυψη κράταγαν τον ήχο επικάλυψης σταθερό εξίσου σε στάθµη και συχνότητα και µέτραγαν το όριο του σήµατος ως συνάρτηση της συχνότητας του σήµατος. Τα αποτελέσµατα των λειτουργιών αυτών ονοµάζονται καµπύλες επικάλυψης. Οι καµπύλες επικάλυψης παρουσιάζουν απότοµες κλίσεις στην πλευρά της χαµηλής συχνότητας (όταν η συχνότητα του σήµατος είναι κάτω από τον ήχο επικάλυψης), µεταξύ 55 db και 240 db ανά οκτάβα. Οι κλίσεις στην πλευρά της υψηλής συχνότητας είναι λιγότερο απότοµες και εξαρτώνται από τη στάθµη του ήχου επικάλυψης. Ένα σύνολο αποτελεσµάτων φαίνεται στο Σχήµα 4.5. Παρατηρούµε ότι στην πλευρά της υψηλής συχνότητας η καµπύλη είναι πιο ρηχή στο µεγαλύτερο επίπεδο. Γύρω από την άκρη της καµπύλης επικάλυψης, η ανάπτυξη της επικάλυψης είναι περίπου γραµµική και µία αύξηση της τάξεως των 10 db στη στάθµη επικάλυψης, οδηγεί σε µια αύξηση της τάξεως των 10 db περίπου στο όριο του σήµατος. Ωστόσο, Σχήµα 4.5: Σχηµατοµορφές επικάλυψης για περιορισµένη περιοχή θορύβου κεντραρισµένη στη συχνότητα των 410 Hz. Κάθε καµπύλη δείχνει την ανύψωση του ορίου ενός ηµιτονοειδούς σήµατος ως συνάρτηση της συχνότηας του σήµατος.

17 για συχνότητες σήµατος στην περιοχή από περίπου 1300 µε 2000 Hz, όταν η στάθµη του ήχου επικάλυψης αυξάνεται κατά 10 db (π.χ. από 70 σε 80 db SPL), το όριο επικάλυψης αυξάνει περισσότερο από 10 db και το ποσό της επικάλυψης µεγαλώνει µη γραµµικά στην πλευρά της υψηλής συχνότητας. Αυτό λέγεται ανωδική εξάπλωση της επικάλυψης ( upward spread of masking ) [29, 30]. Οι καµπύλες επικάλυψης δεν αντικατοπτρίζουν τη χρήση ενός µόνο ακουστικού φίλτρου. Πιθανόν, για κάθε συχνότητα σήµατος ο ακροατής χρησιµοποιεί ένα φίλτρο κεντραρισµένο κοντά στη συχνότητα σήµατος και κατ αυτόν τον τρόπο το ακουστικό φίλτρο µετατοπίζεται καθώς η συχνότητα του σήµατος µεταβάλεται. Ένας τρόπος ερµηνείας της καµπύλης επικάλυψης είναι ως ακατέργαστος δείκτης της καµπύλης διέγερσης του ήχου επικάλυψης [3]. Η καµπύλη διέγερσης είναι µια αναπαράσταση του πραγµατικού ποσού διέγερσης που προκαλείται από ένα ερέθισµα ως συνάρτηση της χαρακτηριστικής συχνότητας 13 στη βασική µεµβράνη [31]. Στην περίπτωση του ήχου επικάλυψης, η καµπύλη διέγερσης µπορεί να θεωρηθεί ότι αντιπροσωπεύει το σχετικό ποσό της δόνηση που προκαλείται από τον ήχο επικάλυψης στα διάφορα σηµεία κατά µήκος της βασικής µεµβράνης. Το σήµα ανιχνεύεται όταν η διέγερση που προκαλεί είναι περίπου σταθερό ποσοστό της διέγερσης που προκαλείται από τον ήχο επικάλυψης σε µέρη της βασικής µεµβράνης (βλέπε Κεφ.7) µε κεντρικές συχνότητες κοντά στη συχνότητα σήµατος. Έτσι το όριο του σήµατος ως συνάρτηση της συχνότητας είναι ανάλογο της στάθµης διέγερσης του ήχου επικάλυψης. Η καµπύλη επικάλυψης πρέπει να είναι παράλληλη µε τη καµπύλη της διέγερσης του επισκιάζοντα, αλλά µετατοπίζεται κάθετα από ένα µικρό ποσό. Στην πράξη, η κατάσταση δεν είναι τόσο απλή, εφόσον το σχήµα της καµπύλης επικάλυψης επηρεάζεται από παράγοντες 13 Xαρακτηριστική συχνότητα (CF) µιας ακουστικής νευρικής ίνας είναι η συχνότητα, στην οποία ελάχιστη ενέργεια χρειάζεται για να τη διεγείρει. Κάθε νευρική ίνα έχει ξεχωριστή CF και ξεχωριστό κατώτατο όριο. Η CF µιας νευρικής ίνας είναι περίπου ίδια [6].

18 Σχήµα 4.6: Υπολογισµένες σχηµατοµορφές διέγερσης για ηµίτονο της συχνότητας των 1 khz µε κυµαινόµενες στάθµες από 20 ως 90 db SPL µε βήµα 10. όπως το εκτός συχνότητας άκουσµα, η ανίχνευση των διακροτηµάτων και των συνδυασµών των τόνων [32]. Στο Σχήµα 4.6 αναπαρίσταται σχηµατοµορφές διέγερσης για ηµίτονο των 1 khz. Οι Moore και Glasberg [33] περιέγραψαν έναν τρόπο που απορρέουν τα σχήµατα από τις καµπύλες διέγερσης, χρησιµοποιώντας την έννοια του ακουστικού φίλτρου. Εισηγήθηκαν ότι η καµπύλη της διέγερσης ενός δεδοµένου ήχου µπορεί να θεωρηθεί ως η έξοδος των ακουστικών φίλτρων σχεδιασµένα ως συνάρτηση της κεντρικής τους συχνότητας. Για να υπολογιστεί η καµπύλη της διέγερσης ενός δεδοµένου ήχου, είναι απαραίτητο να υπολογιστεί η έξοδος κάθε ακουστικού φίλτρου ανταποκρινόµενο σε αυτό τον ήχο και να σχεδιαστεί η έξοδος ως συνάρτηση της κεντρικής συχνότητας των φίλτρων. Τα χαρακτηριστικά των ακουστικών φίλτρων προσδιορίζονται χρησιµοποιώντας τη µέθοδο notched-noise που αναφέρθηκε νωρίτερα. Από τις εργασίες των επιστηµόνων πάνω στους τοµείς που αναφέρθηκαν µέχρι τώρα [3, 24, 26], αλλά κυρίως απο τις εργασίες των Schroeder [34] και Krasner [35] προέκυψαν κάποια πρότυπα ψηφιακής κωδικοποιησης ήχου 14 (π.χ. MP3, ACC [36]), τα οποία βασίζονται στην απωλεστική συµπίεση δεδοµένων. Τα δεδοµένα που αφαιρούνται από το αρχείο του ήχου που δηµιουργείται, λόγω της συµπίεσης, είναι αυτά τα οποία, όπως αναφέρθηκε νωρίτερα, είναι περιττή ακουστική πληροφορία για τον άνθρωπο. Οι πληροφορίες του σήµατος που αποκόπτονται είναι αυτές που λόγω (περισσότερο) της επικάλυψης δεν γίνονται αντιληπτές, καθώς και πληροφορίες συχνότητας χαµηλής έντασης, οι οποίες δεν είναι εύκολα ακουστές (κυρίως από µη 14 Η ψηφιακή κωδικοποίηση ήχου (digital audio coding), η οποία λειτουργεί βάσει αλγορίθµων, χρησιµοποιείται για να επιτευχθούν συµπαγείς ψηφιακές αναπαραστάσεις υψηλής πιστότητας (ευρείας ζώνης) ηχητικών σηµάτων µε σκοπό την αποτελεσµατική διαβίβαση ή την αποθήκευση [27].

19 έµπειρους ακροατές (βλ. παράγρ. 7.1). Αν και όλα τα παραπάνω ισχύουν, γίνονται προσπάθειες από τους επιστήµονες [37,38,39], ώστε τα πρότυπα αυτά να πλησιάσουν το ιδανικό.

20 5. Ακουστότητα Το ανθρώπινο αυτί, σύµφωνα µε όσα εξετάσαµε στην Ενότητα 3, αλλά και θα εξετάσουµε στις παρακάτω ενότητες, είναι αξιοθαύµαστο, τόσο από πλευράς της απόλυτης ευαισθησίας του, όσο και στο εύρος της έντασης του ήχου, στο οποίο µπορεί να ανταποκριθεί. Ο πιο έντονος ήχος ο οποίος µπορεί να ακουστεί χωρίς να βλάψει το ανθρώπινο αυτί έχει µία στάθµη της τάξεως περίπου των 120 db πάνω από το απόλυτο όριο. Η ακουστότητα ανταποκρίνεται στην υποκειµενική εντύπωση του µεγέθους ενός ήχου. Ο τυπικός ορισµός της ακουστότητας είναι αυτό το εντατικό χαρακτηριστικό τής ακουστικής αίσθησης από την άποψη του οποίου, οι ήχοι µπορούν να ταξινοµηθούν σε µια κλίµακα η οποία εκτείνεται από το ήπιο στο δυνατό [40]. Επειδή η ακουστότητα είναι υποκειµενική, είναι πολύ δύσκολο να µετρηθεί µε έναν ποσοτικό τρόπο. Εκτιµήσεις της ακουστότητας µπορεί να δέχονται επιρροές διαφόρων ειδών σε µεγάλο βαθµό [41,42]. Για παράδειγµα η εντύπωση της ακουστότητας ενός ήχου µε µέτρια στάθµη (περίπου 60 db SPL) µπορεί να επηρεαστεί παρουσιάζοντας µιας υψηλής στάθµης ήχο (περίπου 100 db SPL) πριν τον µέτριας στάθµης ήχο. 5.1. Στάθµη ακουστότητας και καµπύλες ίσης ακουστότητας Για να µπορούµε να κατανοήσουµε την διαφορά στην ακουστότητα (όπως αναφέρθηκε) είναι συχνά χρήσιµο να µπορούµε να συγκρίνουµε την ακουστότητα των ήχων µε αυτή ενός ήχου αναφοράς 15. Η στάθµη ακουστότητας ενός ήχου ορίζεται ως η στάθµη της έντασης ενός ηµίτονου των 1 khz, η οποία είναι ίση σε ακουστότητα µε τον ήχο. Η µονάδα της στάθµης ακουστότητας είναι το phon. Έτσι, η στάθµη ακουστότητας οποιουδήποτε ήχου σε phons είναι η στάθµη (σε db SPL) ενός ηµίτονου των 1 khz, το οποίο ακούγεται ίσο στην ακουστότητα. Για παράδειγµα αν ένας ήχος εµφανιστεί να είναι τόσο δυνατός όσο ένα ηµίτονο των 1 khz, µε µία στάθµη των 45 db SPL, τότε ο ήχος έχει µία στάθµη ακουστότητας 45 phons. Σε µια πιθανή κατάσταση όπου (ένα 15 Ο πιο συνήθης ήχος αναφοράς είναι ένα ηµίτονο των 1 khz που παρουσιάζεται αµφιωτικά σε ελεύθερο πεδίο, µε τον ήχο να έρχεται κατευθείαν µπροστά από τον ακροατή µε κλίση 0.

21 ηµίτονο των 1 khz και ένας ήχος παρουσιάζονται εναλλάξ και όχι ταυτόχρονα) ένας ακροατής προσπαθεί να καθορίσει τη στάθµη ακουστότητας ενός δεδοµένου ήχου. προσαρµόζει τη στάθµη του ηµίτονου των 1 khz µέχρι να εµφανιστεί να έχει την ίδια ακουστότητα µε τον ήχο. Σε µια παραλλαγή αυτής της κατάστασης, το ηµίτονο των 1 khz είναι καθορισµένο σε επίπεδο και ο ήχος προσαρµόζεται ώστε να δώσει µία αντίστοιχη ακουστότητα πάλι µε εναλλασσόµενη παρουσία. Εάν αυτό επαναληφθεί για διάφορες συχνότητες ενός ηµιτονοειδούς ήχου, δηµιουργείται µια καµπύλη ίσης ακουστότητας [40,43]. Για παράδειγµα, αν το ηµίτονο των 1 khz είναι καθορισµένο στη στάθµη των 40 db SPL, τότε δηµιουργούνται οι καµπύλες ίσης ακουστότητας των 40 phon. To Σχήµα 5.1 δείχνει καµπύλες ίσης ακουστότητας που δηµοσιεύτηκαν ως το πρότυπο ISO 226:2003 [44]. Οι συνθήκες ακοής σε αυτή την περίπτωση είναι παρόµοιες µε αυτές του κεφαλαίου 3 για τον καθορισµό της καµπύλης MAF, όπου ο ήχος ήρθε από µία εµπρόσθια κατεύθυνση σε ένα ελεύθερο πεδίο. Οι καµπύλες ίσης ακουστότητας είναι παρόµοιες σε σχήµα µε την καµπύλη MAF, αλλά τείνουν να γίνουν πιο επίπεδες στις υψηλότερες στάθµες ακουστότητας. Η υποκειµενική ακουστότητα ενός ήχου δεν είναι απευθείας ανάλογη µε τη στάθµη ακουστότητας σε Phons. Για παράδειγµα, ένας ήχος µε στάθµη ακουστότητας Σχήµα 5.1: Απεικονίζονται καµπύλες ίσης ακουστότητας για στάθµες ακουστότητας από 10 phons ως 100 phons, για ήχους που παρουσιάστηκαν αµφιωτικά από την εµπρόσθια κατεύθυνση. Αναπαρίσταται επείσης η καµπύλη ελάχιστου ακουστού πεδίου (MAF).

22 80 phons ηχεί πολύ περισσότερο από το διπλάσιο σε ένταση από έναν ήχο µε στάθµη ακουστότητας 40 phons. Τα 40 phons είναι ισοδύναµα µε ένα sone (η σχέση phonssones φαίνεται στο Σχήµα 5.2). Ο αριθµός των sones που αντιστοιχούν σε ένα phon, επιλέχθηκε, επειδή ο διπλασιασµός του αριθµού των sones ακούγεται στο ανθρώπινο αυτί ως διπλασιασµός της ακουστότητας. Αυτό επίσης ανταποκρίνεται στην αύξηση της στάθµης ηχητικής πίεσης ( sound pressure level ) περίπου κατά 10 db. Σχήµα 5.2: Στο σχήµα φαίνεται η κλίµα των phons σε αντιστοιχία µε την κλίµα των sones. 5.2. Νευρωνική κωδικοποίηση και µοντελοποίηση της ακουστότητας Οι µηχανισµοί της αντίληψης της ακουστότητας δεν είναι εντελώς κατανοητοί από την επιστήµη. Μια συνήθης υπόθεση είναι ότι κατά κάποιο τρόπο η ακουστότητα σχετίζεται µε τη συνολική νευρική δραστηριότητα που προκαλείται από έναν ήχο, παρόλο που όλο αυτό αµφισβητείται [45,46,47]. Σε κάθε περίπτωση, γενικά θεωρείται, ότι η ακουστότητα εξαρτάται από ένα σύνολο εισφοράς της ακουστότητας από διάφορα κανάλια συχνότητας (π.χ. διαφορετικά ακουστικά φίλτρα). Μοντέλα που ενσωµατώνουν αυτή τη βασική έννοια έχουν προταθεί από τους επιστήµονες [3,48,49,50]. Τα µοντέλα επιχειρούν να υπολογίσουν τη µέση ακουστότητα που θα µπορούσε να εκληφθεί από ένα µεγάλο αριθµό ακροατών µε κανονική ακοή. Ένα διάγραµµα τυπικού µοντέλου απεικονίζεται στο Σχήµα 5.3. Το πρώτο στάδιο βρίσκεται ένα σταθερό φίλτρο, το οποίο υπολογίζει τη µετάβαση του ήχου δια µέσου του έξω και Σχήµα 5.3: Διάγραµµα ενός τυπικού µοντέλου για τον υπολογισµό της ακουστότητας βάσει µοντέλων που έχουν προταθεί και εφαρµόζονται [19,42,43,44,45].

23 του µέσω αυτιού. Το επόµενο στάδιο είναι ο υπολογισµός της καµπύλης διέγερσης για τον υπό µελέτη ήχο. Στα περισσότερα από τα µοντέλα, η καµπύλη διέγερσης υπολογίζεται από δεδοµένα επικάλυψης, όπως περιγράφηκαν νωρίτερα. Η καµπύλη διέγερσης δειγµατίζεται σε τακτά διαστήµατα κατά µήκος της αριθµηµένης κλίµακας ERBN, κάθε τιµή δείγµατος ανταποκρίνεται στο ποσό της διέγερσης σε µια συγκεκριµένη κεντρική συχνότητα. Το επόµενο στάδιο είναι ο µετασχηµατισµός από στάθµη διέγερσης (db) σε ειδική ακουστότητα ( specific loudness ), η οποία είναι ένα είδος πυκνότητας της ακουστότητας (loudness density). Αντιπροσωπεύει την ακουστότητα που θα προκαλούνταν από την διέγερση µέσα σε µία µικρή σταθερή απόσταση κατά µήκος της βασικής µεµβράνης, εάν ήταν δυνατόν να παρουσιαστεί η διέγερση µόνο (χωρίς οποιαδήποτε διέγερση σε γειτονικές περιοχές της βασικής µεµβράνης). Η ειδική ακουστότητα που σχηµατίζεται ως λειτουργία του ERBN αριθµού λέγεται καµπύλη ειδικής ακουστότητας ( specific loudness pattern ). Η ειδική ακουστότητα δεν µπορεί να µετρηθεί ούτε φυσικά ούτε υποκειµενικά. Είναι µία θεωρητική κατασκευή που χρησιµοποιείται ως ενδιάµεσο στάδιο στο µοντέλο της ακουστότητας. Παρόλο που τα µοντέλα είναι βασισµένα σε ψυχοακουστικά δεδοµένα, αυτός ο µετασχηµατισµός µπορεί να θεωρηθεί ως ο τρόπος αναπαράστασης που η φυσική διέγερση µετασχηµατίζεται σε νευρική δραστηριότητα. Η ειδική ακουστότητα υποτίθεται ότι σχετίζεται µε το ποσό της νευρικής δραστηριότητας στην αντίστοιχη κεντρική συχνότητα. Η συνολική συχνότητα ενός δεδοµένου ήχου, σε sones, υποτίθεται ότι είναι ανάλογη µε τη συνολική έκταση στα πλαίσια της σχηµατοµορφής της ειδικής ακουστότητας. Με άλλα λόγια, η συνολική ακουστότητα υπολογίζεται αθροίζοντας τις τιµές της ειδικής ακουστότητας διαµέσου όλων των ERBN αριθµών (ανταποκρινόµενη σε όλες τις κεντρικές συχνότητες). 5.3. Επίδραση του εύρους ζώνης στην ακουστότητα Θεωρείται ένας ήχος µε σταθερή ενέργεια και εύρος ζώνης (bandwidth) B 16. Εάν το B είναι µικρότερο από ένα ορισµένο εύρος, λέγεται κρίσιµο εύρος ζώνης ( critical bandwidth-cbl ) για την ακουστότητα, τότε η ακουστότητα του ήχου 16 Ο συµβολισµός B προέρχεται από το αρχικό της λέξης bandwidth.

24 είναι ανεξάρτητη του B. Ο ήχος είναι περίπου τόσο δυνατός όσο ένας καθαρός τόνος ή περιορισµένης περιοχής θορύβος ίσης έντασης στην κεντρική συχνότητα της περιοχής. Ωστόσο εάν το B αυξηθεί πέραν του CBL, η ακουστότητα του σύνθετου ήχου ξεκινάει να αυξάνει, το οποίο συµβαίνει στην περίπτωση για τις ζώνες του θορύβου [3] και για τους σύνθετους ήχους που αποτελούνται από διάφορους καθαρούς τόνους, των οποίων ο διαχωρισµός της συχνότητας ποικίλει [52]. Η τιµή του CBL είναι παρόµοια µε, αλλά λίγο µεγαλύτερη από, το ERBN του ακουστικού φίλτρου. Έτσι για δεδοµένο ποσό ενέργειας, ένας σύνθετος ήχος είναι δυνατότερος εάν το εύρος ζώνης του υπερβαίνει ένα ERBN, εκτός εάν το εύρος ζώνης του είναι µικρότερο από ένα ERBN. Στην τελευταία περίπτωση, όπου ήχος έχει εύρος ζώνης µικρότερο από ένα ERBN σε µια δεδοµένη κεντρική συχνότητα, η σχηµατοµορφή διέγερσης και η σχηµατοµορφή ειδικής ακουστότητας είναι περίπου ανεξάρτητες του εύρους ζώνης του ήχου [53]. Ακόµη, η συνολική ακουστότητα κυριαρχείται από την ειδική ακουστότητα στην κορυφή της καµπύλης. Γενικά, καθώς το εύρος ζώνης αυξάνει πέραν του ενός ERBN, η ακουστότητα ανεβαίνει, επειδή η µείωση στην ακουστότητα ανά ERBN είναι περισσότερο σαν αντιστάθµιση από την αύξηση σε έναν αριθµό καναλιών που συµβάλει σηµαντικά στην συνολική ακουστότητα. Δεδοµένου ότι η αύξηση στην ακουστότητα εξαρτάται από το άθροισµα της ειδικής ακουστότητας σε διαφορετικές κεντρικές συχνότητες, η αύξηση στην ακουστότητα συχνά περιγράφεται ως άθροισµα ακουστότητας. Στα χαµηλότερα επίπεδα αίσθησης (γύρω στα 10 20 db SL), η ακουστότητα ενός σύνθετου ήχου είναι περίπου ανάλογη του εύρους ζώνης. Αυτό µπορεί επίσης να εξηγηθεί από την άποψη των µοντέλων της ακουστότητας που περιγράφονται παραπάνω. Σε αυτές τις χαµηλές στάθµες, η ειδική ακουστότητα αλλάζει γρήγορα µε τη στάθµη διέγερσης και το ίδιο ισχύει για την ακουστότητα. Σαν αποτέλεσµα, η συνολική έκταση της καµπύλης της ειδικής ακουστότητας παραµένει σχεδόν σταθερή καθώς το εύρος ζώνης µεταβάλλεται, ακόµα και για B µεγαλύτερα από το CBL. Έτσι η ακουστότητα είναι ανεξάρτητη του B. Όταν ένας ήχος στενής περιοχής έχει στάθµη πολύ χαµηλής αίσθησης (κάτω από 10 db), τότε εάν το εύρος ζώνης αυξάνει κρατώντας τη συνολική ενέργεια σταθερή, η έξοδος του κάθε ακουστικού φίλτρου καθίσταται ανεπαρκής για να κάνει τον ήχο ακουστό.

25 5.4. Διάκριση έντασης Η µικρότερη ανιχνεύσιµη αλλαγή στην ένταση ενός ήχου έχει µετρηθεί για διαφόρων ειδών ερεθίσµατα µε πληθώρα µεθόδων. Τρεις από τις κυριότερες µεθόδους είναι οι: Α) Ανίχνευση διαφοροποίησης ( modulation detection ). Το ερέθισµα διαφοροποιείται κατά πλάτος σε ένα αργό κανονικό ρυθµό και ο ακροατής σε αυτή την κατάσταση εντοπίζει την αλλοίωση. Συνήθως η αλλοίωση είναι ηµιτονοειδής. Β) Ανίχνευση αύξησης ( increment detection ). Ένα συνεχόµενο ερέθισµα βάθους (background stimulus) παρουσιάζεται και ο ακροατής σε αυτήν την κατάσταση εντοπίζει µία σύντοµη αύξηση στη στάθµη βάθους. Γ) Διάκριση έντασης ( intensity discrimination ). Δύο (ή περισσότεροι) ξεχωριστοί παλµοί ήχου παρουσιάζονται διαδοχικά, µε τον ένα να είναι πιο έντονος από τους άλλους και ο ακροατής σε αυτή την κατάσταση εντοπίζει, ποιος παλµός είναι ο πιο έντονος. Σε όλες αυτές τις καταστάσεις, η υποκειµενική εντύπωση του ακροατή είναι µια αλλαγή στην ακουστότητα. Για παράδειγµα, στη µέθοδο 1 η διαφοροποίηση ακούγεται σαν διακύµανση στην ακουστότητα. Στη µέθοδο 2 η αύξηση ακούγεται ως µια σύντοµη αύξηση στην ακουστότητα βάθους ή κάποιες φορές σαν επιπλέον ήχος επάνω στο φόντο 17. Στη µέθοδο 3 ο πιο έντονος παλµός εµφανίζεται πιο δυνατός από τους άλλους. Παρόλο που υπάρχουν µικρές διαφορές στα πειραµατικά αποτελέσµατα για τις διαφορετικές µεθόδους, η γενική τάση είναι παρόµοια. Για ευρείας ζώνης θόρυβο ή για ζωνοδιαβατά φιλτραρισµένο θόρυβο, η µικρότερη ανιχνεύσιµη αλλαγή της έντασης, ΔΙ, είναι περίπου ένα σταθερό κλάσµα της έντασης του ερεθίσµατος, Ι. Με άλλα λόγια, ΔΙ / Ι είναι περίπου σταθερό. Αυτό είναι ένα παράδειγµα Νόµου του Weber, το οποίο ορίζει ότι η µικρότερη ανιχνεύσιµη αλλαγή σε ένα ερέθισµα είναι ανάλογη µε το µέγεθος αυτού του ερεθίσµατος. Η τιµή του ΔI / I λέγεται ο Λόγος του Weber. Όρια για τον εντοπισµό της αλλαγής της έντασης καθορίζονται συχνά ως η µεταβολή σε στάθµη στο όριο, ΔL, σε decibels. Η τιµή του ΔL δίνεται από τη συνάρτηση: (1.3) ΔL = 10 log10 [ (I +ΔI ) / I ]. 17 Σε αυτή την περίπτωση το φόντο είναι συνώνυµο του βάθους. Και οι δύο λέξεις προέρχονται από την αγγλική background.

26 Καθώς το ΔI/I είναι σταθερό, το ΔL είναι επίσης σταθερό, ανεξάρτητα από το απόλυτο όριο και για τον ευρείας ζώνης θόρυβο έχει τιµή περίπου 0.5 1 db. Αυτό ισχύει από περίπου 20 db πάνω από το απόλυτο όριο, µέχρι 100 db πάνω από το απόλυτο όριο [54,55]. Για ηµιτονοειδή ερεθίσµατα η κατάσταση είναι κάπως διαφορετική, όπου οι διακρίσεις έντασης, όπως µετρήθηκαν από το Λόγο του Weber, βελτιώνονται σε υψηλά επίπεδα. Τα δεδοµένα [56] για την ανίχνευση διαφοροποίησης δείχνουν µία τιµή του ΔL των 1.5 db στα 20 db SL, 0.7 db στα 40 db SL και 0.3 db στα 80 db SL (για ηµίτονο των 1 khz). Ο Λόγος του Weber µπορεί να αυξάνει κάπως σε πολύ υψηλά επίπεδο ήχου (πάνω από 100 db SPL) [57]. Στην καθηµερινή ζωή, µία αλλαγή στην στάθµη της τάξεως του 1 db θα ήταν δύσκολο να παρατηρηθεί, αλλά µια αλλαγή στην στάθµη της τάξεως των 3 db (που αντιστοιχεί στο διπλασιασµό ή στη µείωση κατά το ήµισυ της έντασης) θα µπορούσε αρκετά εύκολα να ακουστεί.

27 6. Χρονική επεξεργασία στο ακουστικό σύστηµα Αυτό το τµήµα αφορά κυρίως τη χρονική ανάλυση, η οποία αναφέρεται στην ικανότητα του ανθρώπινου ακουστικού συστήµατος να ανιχνεύει µεταβολές στα ερεθίσµατα κατά το χρόνο. Για παράδειγµα, να αντιλαµβάνεται ένα σύντοµο κενό µεταξύ δύο ερεθισµάτων ή να αντιλαµβάνεται ότι ο ήχος αλλοιώνεται τονικά κατά κάποιο τρόπο. Όπως σηµειώθηκε από τους Viemeister και Plack [58], είναι επίσης σηµαντικό να διαχωριστούν οι γρήγορες µεταβολές της πίεσης σε έναν ήχο (λεπτή δοµή - fine structure), από τη βραδύτερη συνολική αλλαγή στο πλάτος αυτών των διακυµάνσεων, περιβάλλουσα (envelope). Η χρονική ανάλυση συνήθως αναφέρεται στην ανάλυση των αλλαγών της περιβάλλουσας και όχι στην λεπτή δοµή. Χαρακτηρίζοντας τη χρονική ανάλυση στο ακουστικό σύστηµα, είναι σηµαντικό να ληφθεί υπόψη το φιλτράρισµα που λαµβάνει χώρα στο περιφερικό ακουστικό σύστηµα. Η χρονική ανάλυση εξαρτάται από δύο κύριες διεργασίες: α) ανάλυση της χρονικής κατανοµής που γίνεται σε κάθε κανάλι συχνότητας β) σύγκριση της χρονικής κατανοµής διαµέσου καναλιών. Μια σηµαντική δυσκολία στη µέτρηση της χρονικής ανάλυσης του ακουστικού συστήµατος είναι ότι οι αλλαγές στη χρονική κατανοµή ενός ήχου γενικά συνδέονται µε αλλαγές στο φασµατικό του µέγεθος. Έτσι, η ανίχνευση µιας αλλαγής στη χρονική κατανοµή µπορεί µερικές φορές να εξαρτάται όχι στην χρονική ανάλυση, αλλά στην ανίχνευση των αλλαγών στο φασµατικό µέγεθος. Υπήρχουν δύο γενικές προσεγγίσεις γύρω από αυτό το πρόβληµα. Η µία χρησιµοποιεί σήµατα των οποίων το φασµατικό µέγεθος δεν αλλάζει όταν η χρονική κατανοµή µεταβάλλεται. Για παράδειγµα, το φασµατικό µέγεθος του λευκού θορύβου παραµένει επίπεδο εάν ο ήχος διακόπτεται (π.χ. αν ένα κενό εισαχθεί µέσα στο θόρυβο). Η δεύτερη προσέγγιση χρησιµοποιεί ερεθίσµατα, των οποίων τα φασµατικά µεγέθη µεταβάλλονται από την αλλαγή στη χρονική κατανοµή, αλλά επιπλέον ήχοι προστίθενται στο βάθος ώστε να επικαλύψουν τις φασµατικές αλλαγές. 6.1. Χρονική ανάλυση βασισµένη στις εντός του καναλιού διεργασίες Το όριο για την ανίχνευση ενός κενού σε έναν ευρείας περιοχής θόρυβο παρέχει ένα απλό και βολικό µέτρο χρονικής ανάλυσης. Σε µια πιθανή κατάσταση παρουσιάζονται στον ακροατή δύο διαδοχικοί κρότοι θορύβου, και είτε ο πρώτος ή ο

28 δεύτερος κρότος (τυχαία) διακόπτεται για να προκαλέσει ένα κενό. Ο στόχος του ακροατή είναι να υποδείξει ποιος κρότος περιείχε το κενό. Το όριο του κενού είναι συνήθως 2 3ms [59]. Το όριο αυξάνει σε πολύ χαµηλά επίπεδα ήχου, όταν το επίπεδο του θορύβου προσεγγίζει το απόλυτο όριο ακοής, αλλά είναι σχετικά αµετάβλητο για µέτρια ως υψηλά επίπεδα. Το φασµατικό µέγεθος σε βάθος χρόνου ενός ήχου δεν αλλάζει όταν αυτός ο ήχος είναι ανεστραµµένος κατά το χρόνο (time reverse). Έτσι, αν ένας ανεστραµµένος κατά το χρόνο ήχος µπορεί να διαχωριστεί από τον αυθεντικό, αυτό αντικατοπτρίζει µια ευαισθησία στη διαφορά της χρονικής κατανοµής των δύο ήχων. Αυτό αξιοποιήθηκε από τον Ronken [60], ο οποίος σε πείραµα χρησιµοποίησε ζεύγη ερεθισµάτων (click) που διέφεραν σε πλάτος. Τα ζεύγη των clicks ονοµάστηκαν Α και Β, µε το Α να έχει πλάτος µεγαλύτερο από το Β. Οι ακροατές σε αυτό το πείραµα όφειλαν να διακρίνουν τα ζεύγη των click στη σειρά των Α και Β: είτε σαν ΑΒ είτε σαν ΒΑ (time reverse). Η ικανότητα τους µετρήθηκε ως συνάρτηση του χρονικού διαστήµατος ή κενού µεταξύ Α και Β. Ο Ronken βρήκε ότι οι ακροατές θα µπορούσαν να διακρίνουν τα ζεύγη των click για κενά στα 2 3ms. Έτσι, το όριο της χρονικής ανάλυσης που βρέθηκε, είναι παρόµοιο µε αυτό που βρέθηκε για την ανίχνευση ενός κενού σε έναν ευρείας ζώνης θόρυβο. Μία πιο ολοκληρωµένη προσέγγιση είναι να µετρήσουµε το όριο για τον εντοπισµό των αλλαγών στο πλάτος ενός ήχου ως συνάρτηση της ταχύτητας των αλλαγών. Στην απλούστερη περίπτωση, ένας λευκός θόρυβος διαµορφώνεται ηµιτονοειδώς κατά πλάτος και το όριο για τον εντοπισµό της αλλοίωσης προσδιορίζεται ως συνάρτηση του ποσοστού διαφοροποίησης. Η λειτουργία που σχετίζει το όριο µε το ποσοστό διαφοροποίησης είναι γνωστή ως χρονική αλλοίωση τόνου µεταφοράς διαµόρφωσης ( temporal modulation transfer function-tmtf ). Η διαµόρφωση του λευκού θορύβου δεν αλλάζει το φασµατικό του µέγεθος [61]. Για χαµηλά ποσοστά διαφοροποίησης η απόδοση περιορίζεται από την ανάλυση πλάτους του αυτιού και όχι από την χρονική ανάλυση. Έτσι το όριο είναι ανεξάρτητο του ποσοστού διαφοροποίησης για ποσοστά µέχρι περίπου 50 Hz. Καθώς το ποσοστό αυξάνει πέραν των 50 Hz, το απόλυτο όριο αυξάνει και για ποσά πάνω από περίπου 1 khz, η διαφοροποίηση δεν µπορεί να ανιχνευθεί καθόλου. Έτσι η ευαισθησία στην

29 διαµόρφωση πλάτους µειώνεται προοδευτικά καθώς το ποσοστό διαφοροποίησης αυξάνει. Για να διερευνηθεί κατά πόσο η χρονική ανάλυση ποικίλει µε την κεντρική συχνότητα µπορούν να χρησιµοποιηθούν ερεθίσµατα, τα οποία να αποτελούνται από ένα σύντοµο παλµό ηµίτονου, στο οποίο η στάθµη του πρώτου µισού του παλµού είναι κατά 10 db υψηλότερη από το δεύτερο µισό [62]. Σε µια τέτοια κατάσταση οι ακροατές κάνουν διάκριση ανάµεσα σε δύο σήµατα, που διαφέρουν ως προς το κατά πόσον το µισό µε την υψηλή στάθµη είναι το πρώτο ή το δεύτερο. Ένας θόρυβος βάθους βοηθάει στην επικάλυψη του φασµατικού πιτσιλίσµατος που προκαλείται από την απενεργοποίηση και ενεργοποίηση του ήχου, που γίνεται ώστε να παραχθεί το κενό. Συνολικά, φαίνεται ότι η χρονική ανάλυση είναι περίπου ανεξάρτητη της συχνότητας για µεσαίες και υψηλές συχνότητες, αλλά επιδεινώνει σε πολύ χαµηλές κεντρικές συχνότητες. Η µέτρηση της TMTF χρησιµοποιώντας ηµιτονοειδής φορείς 18 (sinusoidal carriers) περιπλέκεται από την άποψη ότι η διαφοροποίηση εισάγει πλευρικές φασµατικές ζώνες, οι οποίες µπορούν να ανιχνευθούν ως ξεχωριστά στοιχεία, εάν είναι µακριά σε συχνότητα από τη φέρουσα συχνότητα. Όταν η φέρουσα συχνότητα είναι υψηλή, η επίδραση της ανάλυσης της πλευρικής περιοχής ενδέχεται να είναι µικρή για τις συχνότητες διαµόρφωσης µέχρι µερικές εκατοντάδες Hertz, καθώς το εύρος ζώνης του ακουστικού φίλτρου είναι µεγάλο για υψηλές κεντρικές συχνότητες. Σύµφωνα µε αυτό, η TMTF για υψηλές φέρουσες συχνότητες δείχνουν ένα αρχικό επίπεδο τµήµα (ευαισθησία ανεξάρτητη της συχνότητας διαφοροποίησης). Tότε ένα τµήµα, όπου το όριο αυξάνει µε αυξητική συχνότητα διαφοροποίησης, πιθανόν αντανακλά τα όρια της χρονικής ανάλυσης και ένα τµήµα όπου το όριο µειώνει ξανά, πιθανόν αντανακλά την ανίχνευση των πλευρικών φασµατικών περιοχών [63]. Το αρχικό επίπεδο τµήµα της TMTF εκτείνεται σε περίπου 100 120 Hz για ηµιτονοειδής φορείς, αλλά µόνο για 50 ή 60 Hz για έναν ευρείας ζώνης θόρυβο. Η διαφορά παρουσιάζεται επειδή οι εγγενείς διακυµάνσεις του πλάτους στο φορέα θόρυβο περιορίζουν την ικανότητα ανίχνευσης της διαµόρφωσης [64,65]. Η επίδραση των εγγενών διακυµάνσεων εξαρτάται από την 18 Αναφέρεται σε σήµα συνεχούς ηµιτονοειδούς µορφής, του οποίου οι ιδιότητες µπορούν να διαµορφώνονται σύµφωνα µε µια δεύτερη πληροφορία που µεταφέρει σήµα. Ο ίδιος ο µεταφορέας δεν µεταφέρει πληροφορίες, µέχρι να αλλάξει µε κάποιο τρόπο, όπως για παράδειγµα να αλλάξει το πλάτος του (amplitude modulation), να αλλάξει τη συχνότητά του (frequency modulation) ή τη φάση του (phase modulation). Αυτές οι αλλαγές φέρουν την πληροφορία.

30 οµοιότητά τους µε την διαµόρφωση. Όταν χρησιµοποιείται ένας θόρυβος φορέας στενής ζώνης, ο οποίος έχει σχετικά αργές εγγενείς διακυµάνσεις πλάτους, η TMTF δείχνει τη µικρότερη ευαισθησία για χαµηλές συχνότητες διαφοροποίησης [64]. 6.2. Μοντελοποίηση της χρονικής ανάλυσης Τα περισσότερα µοντέλα χρονικής ανάλυσης είναι βασισµένα στην ιδέα της ύπαρξης επεξεργασίας στις στάθµες του ακουστικού συστήµατος υψηλότερα από το ακουστικό νεύρο, το οποίο είναι κατά κάποιο τρόπο υποτονικό και έτσι περιορίζει την χρονική ανάλυση. Τα µοντέλα υποθέτουν ότι η εσωτερική αναπαράσταση των ερεθισµάτων εξοµαλύνεται κατά την πάροδο του χρόνου, έτσι ώστε οι ταχείς χρονικές µεταβολές να µειώνονται σε µέγεθος, αλλά οι πιο αργές να διατηρούνται. Ωστόσο αυτή η διαδικασία εξοµάλυνσης είναι σχεδόν σίγουρο ότι λειτουργεί στη νευρική δραστηριότητα. Τα πιο ευρέως χρησιµοποιούµενα µοντέλα βασίζονται σε µια απλή εξοµάλυνση µετατροπής του ερεθίσµατος αντί στην νευρική του αναπαράσταση. Περιλαµβάνουν ένα αρχικό στάδιο του ζωνο-διαβατού φιλτραρίσµατος, αντικατοπτρίζοντας τη δράση των ακουστικών φίλτρων. Κάθε φίλτρο ακολουθείται από µία µη γραµµική διάταξη. Αυτή η διάταξη έχει ως στόχο να αντικατοπτρίσει τη λειτουργία των διαφόρων διαδικασιών που εµφανίζονται στο περιφερικό ακουστικό σύστηµα, όπως συµπίεση στην βασική µεµβράνη και νευρική µεταγωγή. Η έξοδος της µη γραµµικής διάταξης τροφοδοτείται σε µια διάταξη εξοµάλυνσης, η οποία µπορεί να υλοποιείται είτε ως ένα χαµηλοπερατό φίλτρο [66] ή αντίστοιχα, ως ένας χρονικά συρόµενος ολοκληρωτής ( sliding temporal integretor ) [67]. Η διάταξη προσδιορίζει ένα είδος σταθµισµένου µέσου της εξόδου της συµπιεστικής µη γραµµικότητας πάνω από ένα χρονικό διάστηµα ή παράθυρο. Αυτή η σταθµισµένη λειτουργία µερικές φορές φέρεται ως το σχήµα του χρονικού παράθυρου (temporal window). Το ίδιο το παράθυρο υποτίθεται ότι ολισθαίνει στο χρόνο, έτσι ώστε η έξοδος του χρονικού ολοκληρωτή είναι σαν ένα σταθµισµένο τρέχον µέσο όρο της εισόδου. Όταν ένας ήχος ενεργοποιείται απότοµα, η έξοδος του χρονικού ολοκληρωτή παίρνει κάποια ώρα για να δηµιουργηθεί. Οµοίως, όταν ένας ήχος απενεργοποιείται, η έξοδος του ολοκληρωτή χρειάζεται κάποιο χρόνο για να µειώσει (decay). Το σχήµα του παραθύρου υποτίθεται ότι είναι ασύµµετρο στο χρόνο, έτσι ώστε η δηµιουργία της εξόδου του, ανταποκρινόµενη στην έναρξη ενός ήχου είναι περισσότερο ταχεία από το decay της

31 εξόδου του ανταποκρινόµενη στην παύση ενός ήχου. Η έξοδος του ολοκληρωτή τροφοδοτείται σε µια συσκευή απόφασης (decision device). Η συσκευή απόφασης µπορεί να χρησιµοποιεί διαφορετικούς κανόνες εξαρτώµενη στην κατάσταση που απαιτείται. Για παράδειγµα, αν η ακουστική κατάσταση απαιτεί να ανιχνευθεί ένα µικρό χρονικό κενό στο σήµα, η συσκευή απόφασης µπορεί να ψάξει για µία βύθιση (dip) στην έξοδο του χρονικού ολοκληρωτή. Εάν η κατάσταση απαιτεί να ανιχνευθεί µία αλλοίωση πλάτους ενός ήχου, η συσκευή µπορεί να εκτιµήσει το ποσό της αλλοίωσης στην έξοδο του συρόµενου χρονικού ολοκληρωτή [66]. 6.3. Αλλοίωση τόνου Όπως στην παράγραφο 6.2, όπου η χρονική ανάλυση ήταν βασισµένη στη νευρική δραστηριότητα, και η ανάλυση των ήχων µε διαµόρφωση πλάτους εξαρτάται από ένα ειδικευµένο τµήµα του εγκεφάλου που περιέχει µια συστοιχία νευρώνων (array of neurons), εκ των οποίων καθένας είναι συντονισµένος µε διαφορετικό ποσοστό διαφοροποίησης. Κάθε νευρώνας µπορεί να θεωρηθεί ως ένα φίλτρο στο πεδίο της διαφοροποίησης και οι συστοιχίες νευρώνων είναι γνωστές συλλογικά ως µια τράπεζα φίλτρων διαφοροποίησης (modulation filter bank). Η τράπεζα φίλτρων διαφοροποίησης έχει προταθεί ως µια πιθανή εξήγηση για ορισµένα φαινόµενα που αφορούν την αντίληψη, τα οποία περιγράφονται παρακάτω. Πρέπει να δοθεί έµφαση, ωστόσο, ότι αυτό εξακολουθεί να είναι µια αµφιλεγόµενη έννοια. Το όριο για την ανίχνευση της αλλοίωσης πλάτους ενός δεδοµένου φέρον ήχου γενικά αυξάνεται εάν πρόσθετη αλλοίωση πλάτους βρίσκεται πάνω στον εν λόγω φορέα. Αυτό το αποτέλεσµα λέγεται επικάλυψη διαφοροποίησης (modulation masking). Ο Houtgast [68] µελέτησε την ανίχνευση των ηµιτονοειδών αλλοιώσεων πλάτους σε ένα ροζ θόρυβο φορέα. Τα όρια για την ανίχνευση της αλλοίωσης µετρήθηκαν όταν δεν παρουσιαζόταν άλλη διαφοροποίηση και όταν ένας επισκιάζων διαφοροποιητής (masker modulator) ήταν παρόν (στο ακουσικό περιβάλλον). Οι Bacon και Grantham [69] µέτρησαν τα όρια για την ανιχνεύσιµη ηµιτονοειδή αλλοίωση πλάτους ενός ευρείας ζώνης λευκού θορύβου στην παρουσία ενός ηµιτονοειδούς επισκιάζων διαφοροποιητή. Όταν η επισκιάζουσα συχνότητα διαφοροποίησης ήταν 16 ή 64 Hz, η περισσότερη επικάλυψη διαφοροποίησης συνέβη όταν η συχνότητα διαµόρφωσης του σήµατος ήταν κοντά στη συχνότητα. Τέλος, πρέπει να σηµειωθεί ότι η ευκρίνεια (sharpness) του

32 συντονισµού της υποθετικής τράπεζας φίλτρων διαφοροποίησης, είναι πολύ µικρότερη από την ευκρίνεια του συντονισµού των ακουστικών φίλτρων στο πεδίο της ακουστικής συχνότητας. Τα εύρη ζώνης εκτιµώνται µεταξύ 0.5 και 1 φορές η κεντρική συχνότητα [70]. Τα φίλτρα διαφοροποίησης, εάν υπάρχουν, δεν είναι άκρως επιλεκτικά. 6.4. Διάκριση διάρκειας Η διάκριση διάρκειας έχει µελετηθεί παρουσιάζοντας δύο διαδοχικούς ήχους, οι οποίοι έχουν το ίδιο φάσµα ισχύος αλλά διαφέρουν σε διάρκεια [71, 72, 73]. Τα αποτελέσµατα ήταν σχετικά ανεξάρτητα από το συνολικό επίπεδο των ερεθισµάτων και ήταν παρόµοια για κρότους διαφόρων εύρους ζώνης και κρότους από ένα ηµιτονοειδές κύµα 1 khz. Οι µελέτες έδειξαν ότι, για τιµές του Τ (=κύρια διάρκεια) άνω των 10ms, το ΔT (= η µικρότερη ανιχνεύσιµη αύξηση της διάρκειας) αυξάνει µε Τ και ΔΤ να είναι σχεδόν ανεξάρτητα από τα φασµατικά χαρακτηριστικά των ήχων. Αυτό αληθεύει τόσο για τη διάκριση διάρκειας των ήχων όσο και για τη διάκριση των σιωπηλών διαστηµάτων που οριοθετούνται από ακουστικούς δείκτες, υπό την προϋπόθεση ότι οι δείκτες είναι όµοιοι και στις δύο πλευρές του διαστήµατος. Ωστόσο, το ΔΤ αυξάνει στα χαµηλά επίπεδα ήχου και επίσης αυξάνει όταν οι δείκτες διαφέρουν σε στάθµη ή συχνότητα σε κάθε πλευρά του διαστήµατος.

33 7. Αντίληψη ύψους Ύψος είναι ένα χαρακτηριστικό του ήχου που ορίζεται σε σχέση µε το τι ακούγεται. Ορίζεται επισήµως ως, αυτή η ιδιότητα της ακουστικής αίσθησης από την άποψη της οποίας, οι ήχοι µπορούν να διαταχθούν σε µια κλίµακα εκτινόµενοι από το χαµηλό στο υψηλό ( that attribute of auditory sensation in terms of which sounds can be ordered on a scale extending from low to high ) [2]. Σχετίζεται µε το φυσικό ρυθµό επανάληψης ενός ήχου. Για ένα καθαρό τόνο (ένα ηµίτονο) αυτό αντιστοιχεί στη συχνότητα και για περιοδικούς σύνθετους τόνους στη θεµελιώδη συχνότητα. Η αύξηση του ποσοστού επανάληψης δίνει την αίσθηση της αύξησης του ύψους. Κατάλληλες διακυµάνσεις στην ταχύτητα επανάληψης µπορεί να δηµιουργήσουν µια αίσθηση µελωδίας. Οι µεταβολές στο ύψος είναι επίσης συσχετισµένες µε τον τονισµό των φωνών και προκαλούν νύξεις για το κατά πόσο µια άρθρωση είναι µια ερώτηση ή δήλωση ως προς το συναίσθηµα του οµιλητή. Εφόσον το ύψος είναι υποκειµενική ιδιότητα, δεν µπορεί να µετρηθεί άµεσα. Συχνά, το ύψος ενός σύνθετου ήχου αξιολογείται προσαρµόζοντας τη συχνότητα ενός ηµίτονου, µέχρι το ύψος του ηµίτονου να ταυτιστεί µε το ύψος του ζητούµενου ήχου. Η συχνότητα του ηµίτονου στη συνέχεια δίνει το µέτρο του ύψους του ήχου. 7.1. Θεωρίες της αντίληψης του ύψους Υπάρχουν δύο θεωρίες που αφορούν την αντίληψη του ύψους. Η πρώτη λέγεται θεωρία των σηµείων (place theory) και βασίζεται στο γεγονός, ότι διαφορετικές συχνότητες ή στοιχεία συχνότητας σε έναν σύνθετο ήχο διεγείρουν διαφορετικά σηµεία της βασική µεµβράνης και ως εκ τούτου νευρώνες µε διαφορετικές κεντρικές συχνότητες. Το Σχήµα 7.1 δείχνει µια σχηµατική αναπαράσταση της θεωρίας. Η θεωρία Σχήµα 7.1: Απεικονίζεται σχηµατικά η θεωρία των σηµείων που ανταποκρίνεται στη βασική µεµβράνη.

34 των σηµείων υποθέτει ότι το ύψος ενός ήχου είναι µε τη σχηµατοµορφή διέγερσης που παράγεται από αυτόν τον ήχο. Για έναν καθαρό τόνο το ύψος θεωρείται εν γένει ότι καθορίζεται από τη θέση της µέγιστης διέγερσης [74]. Η δεύτερη θεωρία λέγεται χρονική θεωρία (temporal theory) και βασίζεται στην υπόθεση ότι το ύψος ενός ήχου είναι συναφές µε τη χρονική κατανοµή των νευρικών ερεθισµάτων που αναφέρονται από αυτόν τον ήχο [74]. Αυτά τα ερεθίσµατα συνήθως εµφανίζονται σε µια συγκεκριµένη φάση της κυµατοµορφής στη βασική µεµβράνη, ένα φαινόµενο που ονοµάζεται κλείδωµα φάσης (phase locking). Το Σχήµα 7.2 δείχνει αυτό το φαινόµενο. Τα διαστήµατα µεταξύ διαδοχικών νευρικών ερεθισµάτων είναι κατά προσέγγιση ακέραια πολλαπλάσια της περιόδου της κυµατοµορφής και αυτά τα διαστήµατα υποτίθεται ότι καθορίζουν το αντιλαµβανόµενο ύψος. Η χρονική θεωρία δεν µπορεί να ισχύει στις πολύ υψηλές συχνότητες, εφόσον το κλείδωµα φάσης δεν εµφανίζεται για συχνότητες πάνω από 6 khz [75]. Ωστόσο, οι τόνοι που παράγονται από τα περισσότερα όργανα, την ανθρώπινη φωνή και οι περισσότερες καθηµερινές πηγές έχουν θεµελιώδεις συχνότητες αρκετά κάτω από αυτή την περιοχή. Πολλοί ερευνητές πιστεύουν ότι η αντίληψη του ύψους περιλαµβάνει τόσο µηχανισµούς σηµείων (place theory) όσο και χρονικούς µηχανισµούς (temporal theory). Ωστόσο, ένας µηχανισµός µπορεί να κατέχει δεσπόζουσα θέση για µια συγκεκριµένη εργασία ή πτυχή της αντίληψης του ύψους και σχετικό ρόλο των δύο µηχανισµών που σχεδόν διαφέρουν ανάλογα µε την κεντρική συχνότητα. Σχήµα 7.2: Απεικονίζεται το φαινόµενο του κλειδώµατος φάσης (phase locking) για χαµηλής συχνότητας ηχητικό κύµα. Το φαινόµενο ανταποκρίνεται σε κάθε κύκλο του κύµατος.

35 7.2. Αντίληψη του ύψους στους καθαρούς τόνους 7.2.1. Διάκριση συχνότητας στους καθαρούς τόνους Είναι σηµαντική η διάκριση ανάµεσα στην επιλεκτικότητα συχνοτήτων (frequency selectivity) και στη διάκριση συχνοτήτων (frequency discrimination). Η επιλεκτικότητα συχνοτήτων αναφέρεται στην ικανότητα (του ανθρώπινου ακουστικού συστήµατος) να αναλύει τις συνιστώσες συχνότητας ενός σύνθετου ήχου. Η διάκριση συχνότητας αναφέρεται στην ικανότητα να ανιχνεύει αλλαγές στη συχνότητα δια µέσω του χρόνου. Συχνά οι αλλαγές στη συχνότητα ακούγονται ως αλλαγές στο ύψος. Η µικρότερη ανιχνεύσιµη αλλαγή στη συχνότητα λέγεται όριο διαφοράς συχνότητας (frequency difference limen - DL) [76]. Oι συχνότητες DL έχουν µετρηθεί ως συνάρτηση της κεντρικής συχνότητας. Υπάρχουν δύο µέθοδοι µέτρησης διάκρισης της συχνότητας. Η µία αφορά τη διάκριση των δύο διαδοχικών σταθερών τόνων µε ελαφρώς διαφορετικές συχνότητες. Το µέτρο αυτό ονοµάζεται όριο διαφοράς για τη συχνότητα (difference limen for frequency - DLF). Ένα δεύτερο µέτρο που ονοµάζεται όριο ανίχνευσης διαµόρφωσης συχνότητας (frequency modulation detection limen - FMDL), χρησιµοποιεί τόνους, οι οποίοι είναι διαµορφωµένοι συχνοτικά. Σε τέτοιους τόνους, η συχνότητα κινείται πάνω και κάτω σε ένα διαρκή περιοδικό ρυθµό, σχετικά µε τη µέση µεταφέρουσα συχνότητα. Ο αριθµός των φορών ανά δευτερόλεπτο κατά τον οποίο η συχνότητα κινείται πάνω και κάτω ονοµάζεται ποσοστό διαφοροποίησης (modulation rate). Τυπικά το ποσοστό διαφοροποίησης είναι µάλλον χαµηλό (2 20Hz) και η αλλαγή στη συχνότητα ακούγεται σαν διακύµανση στο ύψος (ένα είδος κελαηδίσµατος). Μεταξύ των DLF και FMDL υπάρχει απόκλιση που πιθανόν οφείλεται στο γεγονός ότι τα DLF στις χαµηλές συχνότητες εξαρτώνται από τη χρήση των χρονικών πληροφοριών από το κλείδωµα φάσης. Το κλείδωµα φάσης γίνεται λιγότερο ακριβές στις συχνότητες πάνω από 1 khz, και χάνεται εντελώς σε συχνότητες άνω των 5 khz. Αυτό µπορεί να εξηγήσει την αισθητή αύξηση των DLF στις υψηλές συχνότητες [77]. Για χαµηλές κεντρικές συχνότητες, οι FMDL είναι µικρότερες για ένα ποσοστό διαφοροποίησης της τάξεως των 2 Hz από ότι για ένα ποσοστό της τάξεως των 10 Hz, ενώ για τις υψηλές συχνότητες (πάνω από 4 khz), ισχύει το αντίθετο. Η συχνότητα προσδιορίζεται πάνω σε µικρά χρονικά διαστήµατα, χρησιµοποιώντας πληροφορίες κλειδώµατος φάσης, και

36 αλλαγές στην εκτιµώµενη συχνότητα, κατά την πάροδο του χρόνου, δείχνουν την παρουσία της διαµόρφωσης στη συχνότητα. Οι µέθοδοι της διάκρισης συχνότητας συµφωνούν µε την ιδέα ότι τα DLF και FMDL για πολύ χαµηλά ποσοστά διαφοροποίησης καθορίζονται από χρονικές πληροφορίες (phase locking), για συχνότητες µέχρι περίπου 4 5 khz [78]. Η ακρίβεια του κλειδώµατος φάσης µειώνει µε την αυξανόµενη συχνότητα πάνω από 1 2 khz και είναι σχεδόν απούσα πάνω από περίπου 5 khz. Αυτό µπορεί να εξηγήσει γιατί τα DLF αυξάνουν σηµαντικά σε υψηλές συχνότητες. Τα FMDL για τα µέσα εως ψηλά ποσοστά διαµόρφωσης µπορεί να καθορίζεται από ένα µηχανισµό place, π.χ. από την ανίχνευση των αλλαγών στη σχηµατοµορφή διέγερσης. Ο µηχανισµός αυτός µπορεί επίσης να υπολογίσει για DLF και για FMDL για χαµηλά ποσοστά διαφοροποίησης, όταν η κεντρική συχνότητα είναι πάνω από 5 khz. 7.2.2. Αντίληψη των µουσικών διαστηµάτων Αν η χρονική πληροφορία παίζει ένα ρόλο στον καθορισµό του ύψους των καθαρών τόνων, τότε θα ήταν λογικό να συµβούν αλλαγές στην αντίληψη για συχνότητες πάνω από 5 khz, όµως στο κλείδωµα φάσης δεν εµφανίζεται. Δύο πτυχές στην αντίληψη όντως µεταβάλλονται κατά τον αναµενόµενο τρόπο, δηλαδή η αντίληψη των µουσικών διαστηµάτων και των µελωδιών. Δύο τόνοι οι οποίοι χωρίζονται σε συχνότητα από ένα διάστηµα µιας οκτάβας (ο ένας έχει τη διπλάσια συχνότητα από τον άλλο - f2 = 2f1) ακούγονται παρόµοια. Ωστόσο έχουν το ίδιο όνοµα στη µουσική κλίµακα (π.χ. Ντο3 και Ντο4). Αυτό έχει οδηγήσει αρκετούς θεωρητικούς να εισηγηθούν ότι υπάρχουν τουλάχιστον δύο διαστάσεις στο µουσικό ύψος. Μια πτυχή σχετίζεται µονοτονικά µε συχνότητα (για ένα καθαρό τόνο) και είναι γνωστό ως tone height. Το άλλο σχετίζεται µε την τάξη του ύψους (π.χ. το όνοµα της νότας) και ονοµάζεται tone chroma [2,79]. Για παράδειγµα, δύο ηµίτονα µε συχνότητες 220 και 440 Hz θα έχουν το ίδιο tone chroma ( θα ονοµάζονται και οι δύο Λα στη µουσική κλίµακα), αλλά, καθώς χωρίζονται από µία οκτάβα, θα έχουν διαφορετικά τονικά ύψη. Σε µια µουσική ορχήστρα (π.χ. φιλαρµονική), όπου οι µουσικοί καλούνται να κουρδίσουν τα όργανά τους σε ένα συγκεκριµένο τόνο f1, ενώ κάποιοι µουσικοί

37 λιγότερο βαρύτονων, ίσως, µουσικών οργάνων του συνόλου καλούνται να προσαρµόσουν τη συχνότητα f2 ενός δεύτερου τόνου, έτσι ώστε να φαίνεται ότι είναι µια οκτάβα ψηλότερη σε ύψος, ρυθµίζουν γενικά ώστε f2 να είναι περίπου διπλάσια της f1. Ωστόσο, όταν η f1 βρίσκεται πάνω από 2.5 khz, η f2 θα βρίσκεται πάνω από 5 khz και το ταίριασµα της οκτάβας γίνεται ασταθές [80]. Εµφανίζεται ότι το µουσικό διάστηµα µιας οκτάβας είναι σαφώς αντιληπτό όταν και οι δύο τόνοι είναι κάτω από 5 khz. Άλλες πτυχές της αντίληψης του ύψους επίσης αλλάζουν πάνω από 5 khz, όπως µια ακολουθία καθαρών τόνων, όπου δεν παράγει µια σαφή αίσθηση της µελωδίας [81]. Είναι πιθανό να ακουστεί η αλλαγή του ύψους όταν η συχνότητα έχει αλλάξει, αλλά τα µουσικά διαστήµατα δεν ακούγονται καθαρά. Επίσης άτοµα µε απόλυτο ύψος 19 (absolute pitch) είναι πολύ φτωχή σε ονοµατοδοσία νοτών πάνω από 4 µε 5 khz [82]. Αυτά τα αποτελέσµατα είναι σταθερά µε την ιδέα ότι το ύψος των καθαρών τόνων καθορίζεται από διάφορους µηχανισµούς πάνω και κάτω από 5 khz, ειδικά από ένα χρονικό µηχανισµό στις χαµηλές συχνότητες και ένα µηχανισµό σηµείων (place) στις υψηλές συχνότητες. Φαίνεται ότι η αντιληπτική διάσταση του tone height εξακολουθεί να υφίσταται σε όλο το φάσµα συχνοτήτων, αλλά το tone chroma εµφανίζεται µόνο στη συχνοτική περιοχή κάτω από 5 khz. Μουσικά διαστήµατα είναι ξεκάθαρα αντιληπτά, όταν οι συχνότητες των τόνων κυµαίνονται στην περιοχή όπου χρονικές πληροφορίες είναι διαθέσιµες. 7.2.3. Η επίδραση της στάθµης στο ύψος Το ύψος ενός καθαρού τόνου είναι καθορισµένο κατά κύριο λόγο από τη συχνότητά του. Ωστόσο, η στάθµη του ήχου επίσης συνεισφέρει. Κατά µέσο όρο, το ύψος των τόνων µε συχνότητες κάτω από περίπου 2 khz µειώνεται όσο αυξάνεται η στάθµη, ενώ το ύψος των τόνων µε συχνότητες πάνω από περίπου 4 khz αυξάνεται µε την αύξηση της ηχητικής στάθµης. Τα πρώτα στοιχεία του Stevens [83] έδειχναν µεγάλες επιδράσεις της στάθµης του ήχου στο ύψος, αλλά και άλλα στοιχεία γενικά παρουσιάζουν πολύ µικρότερες επιδράσεις [84]. Για τόνους µε συχνότητες ανάµεσα σε 1 και 2 khz, αλλαγές στο ύψος είναι γενικά µικρότερη από 1%. Για τόνους µικρότερων και µεγαλύτερων συχνοτήτων, η αλλαγή µπορεί να είναι µεγαλύτερη (µέχρι 5%). 19 Απόλυτο ύψος είναι η δυνατότητα του ατόµου να εκχωρεί ορθά ονόµατα στις νότες χωρίς αναφορά σε άλλες νότες.

38 Υπάρχουν επίσης σηµαντικές ατοµικές διαφορές, τόσο στο µέγεθος των µετατοπίσεων ύψους (pitch shifts), όσο και στην κατεύθυνσή τους [85]. 7.3. Αντίληψη του ύψους στους σύνθετους τόνους 7.3.1. Ακούγοντας Παράγωγες σε σύνθετους τόνους Ένας σύνθετος τόνος, όπως ένας τόνος που παράγεται από µουσικό όργανο, συνήθως θυµίζει ένα µοναδικό τονικό ύψος. Αυτό το τονικό ύψος (ή µουσικός ήχος εφόσον προέρχεται από µουσικό όργανο) περιέχει πολλές άλλες παράγωγες συχνότητες εκτός από την κυρίως αντιληπτή, οι οποίες όµως είναι ελάχιστα ακουστές. Οι συχνοτητες αυτές είναι ακέραια πολλαπλάσια της βασικής ή θεµελιώδους συχνότητας και µεγαλύτερες από αυτήν κι αντιστοιχούν σε δευτερεύοντες συχνότητες, που εποµένως είναι οξύτερες από την βασική. Οι παράγωγες συχνότητες ονοµάζονται αρµονικοί 20 (harmonic) και η κύρια συχνότητα θεµελιώδης ή θεµέλιος (fundamental). Κάθε θεµελιώδης συχνότητα παράγει 16 (δεκαέξι) αρµονικούς 21, οι οποίοι συνιστούν την αρµονική στήλη (harmonic series - overtone series). Στο Σχήµα 7.3, αναπαρίστανται οι πρώτες δεκαέξι αρµονικές της αρµονικής στήλης. Οι αρµονικοί παράγονται Σχήµα 7.3: Αναπαράσταση των πρώτων 16 παραγώγων της αρµονικής στήλης µε θεµέλιο συχνότητα 262 Hz (νότα Ντο1) σε αντιστοιχία µουσικής σηµειογραφίας σε κλειδιά ΣΟΛ και ΦΑ, και σχεδιαγράµµατος, συνάρτησης έντασης-συχνότητας. 20 Στην ελληνική είθιστε να χρησιµοποιείται ο όρος αρµονική (harmonic) για την παραγώµενη συχνότητα (partial ή inharmonic-η οποία δεν είναι ακέραιο πολ/σιο της θεµελιώδους). Στην αγγλική και συνήθως σε κείµενα που αφορούν την ακουστική η λέξη overtone χρησιµοποείται για να προσδιορίσει τις λέξεις harmonic και partial. Στην ελληνική η λέξη overtone µεταφράζεται ως αρµονική [86]. 21 Θεωρητικά οι αρµονικοί στην αρµονική στήλη είναι άπειροι.

39 διαδοχικά και η ένταση της κάθε νέας παράγωγης συχνοτητας είναι µικρότερη από την προηγούµενη. Τονικά ύψη που αντιστοιχούν στις συχνότητες των επιµέρους παραγώγων συνήθως δεν γίνονται αντιληπτά. Όµως τέτοια τονικά ύψη µπορούν να ακουστούν, εάν η προσοχή από τον ακροατή κατευθυνθεί κατάλληλα. Οι Plomp και Mimpen [25] µε πειράµατά 22 τους, χρησιµοποιώντας σύνθετους τόνους µε 12 ίσου πλάτους ηµιτονοειδή στοιχεία για να ερευνήσουν τα όρια αυτής της ικανότητας, απέδειξαν ότι οι παράγωγες µπορούσαν να ακουστούν εάν βρίσκονταν αρκετά µακριά σε συχνότητα από τις γειτονικές παράγωγες. Τα δεδοµένα αυτά, είναι σύµφωνα µε την υπόθεση που υποδεικνύει ότι µία παράγωγος µπορεί να ακουστεί (µε 75 % ακρίβεια) όταν χωρίζεται από γειτονικές (ίσου πλάτους) παράγωγες από 1.25 φορές το ERBN του ακουστικού φίλτρου. Για αρµονικούς σύνθετους τόνους, µόνο οι πρώτοι (χαµηλότεροι) πέντε µε οχτώ αρµονικοί µπορούν να ακουστούν, καθώς οι υψηλότερες αρµονικές είναι χωρισµένες σε λιγότερο από 1.25 ERBN. Φαίνεται πιθανό ότι η ανάλυση των παραγώγων από ένα σύνθετο ήχο εξαρτάται εν µέρει από άλλους παράγοντες εκτός από την ανάλυση συχνότητας που λαµβάνει µέρος στη βασική µεµβράνη. Σε µια παραλαγή του πειράµατος του Plomp, ο Soderquist [25] σύγκρινε µουσικούς και µη µουσικούς, και βρήκε ότι οι µουσικοί ήταν αισθητά ανώτεροι. Αυτό το αποτέλεσµα θα µπορούσε να σηµαίνει ότι οι µουσικοί έχουν µικρότερο εύρος ακουστικού φίλτρου από ότι οι µη µουσικοί. Ωστόσο οι Oxenham et al. [87] έδειξαν ότι το εύρος του ακουστικού φίλτρου, σύµφωνα µε τις εκτιµήσεις σε πείραµα επικάλυψης, δεν διέφερε για µουσικούς και µη µουσικούς. Φαίνεται ότι µερικοί µηχανισµοί, εκτός από τα περιφερικά φίλτρα, εµπλέκονται στο άκουσµα των παραγώγων από σύνθετους τόνους και οι µουσικοί εξ αιτίας της µεγάλης τους εµπειρίας, είναι ικανοί να καταστήσουν πιο αποτελεσµατική τη χρήση αυτού του µηχανισµού. 22 Ο Plomp χρησιµοποίησε δύο ειδών σύνθετων τόνων, που τα αποτελέσµατα ίσχυαν εξίσου και για τους δύο: α) Έναν αρµονικό σύνθετο που περιείχε αρµονικές 1 ως 12, όπου οι συχνότητες των στοιχείων ήταν ακέραια πολλαπλάσια από αυτά της θεµελιώδους β) έναν µη αρµονικό σύνθετο όπου οι συχνότητες των στοιχείων ήταν ασυντόνιστες από απλές αναλογίες συχνότητας.

40 7.3.2. Το φαινόµενο της χαµένης θεµελιώδους Για τους σύνθετους τόνους το ύψος, γενικά, δεν ανταποκρίνεται στη θέση της µέγιστης διέγερσης στη βασική µεµβράνη. Εξετάσουµε, σαν παράδειγµα, έναν ήχο µε θεµελιώδη συχνότητα f0 = 200 Hz που περιέχει αρµονικές µε συχνότητες σε ακέραια πολλαπλάσια της f0, όπως 200, 400, 600, 800... Hz. Ο ήχος έχει ένα χαµηλό ύψος, το οποίο είναι πολύ κοντά στο ύψος του θεµελιώδους στοιχείου του (200 Hz) και µια έντονη χροιά (βλέπε κεφάλαιο 8). Ωστόσο, αν ο ήχος είναι φιλτραρισµένος ώστε να αφαιρεθεί το θεµελιώδες στοιχείο, το ύψος δεν αλλοιώνεται. Το µόνο αποτέλεσµα είναι µια µικρή αλλαγή στη χροιά. Αυτό ονοµάζεται το φαινόµενο της χαµένης θεµελιώδους [88]. Πράγµατι, όλοι εκτός από µια µικρή οµάδα αρµονικών µεσαίων συχνοτήτων µπορούν να εξαλειφθούν και το χαµηλό ύψος να παραµείνει το ίδιο, αν και η χροιά γίνεται αισθητά διαφορετική. Ο Schouten [2,88] ονόµασε υπόλειµµα (residue) το χαµηλό ύψος που συνδέεται µε µια οµάδα υψηλών αρµονικών. Διάφορες άλλες ονοµασίες έχουν χρησιµοποιηθεί για να ονοµαστεί αυτό το ύψος, συµπεριλαµβανοµένου periodicity pitch, virtual pitch και low pitch. Ο όρος χαµηλό ύψος (low pitch) θα χρησιµοποιηθεί σε αυτή την εργασία. Ο Schouten επισήµανε ότι είναι δυνατόν να ακουστεί η αλλαγή που παράγεται από την αφαίρεση των θεµελιωδών στοιχείων και την επαναφορά στη συνέχεια. Πράγµατι, όταν το βασικό στοιχείο είναι παρόν, είναι δυνατόν να ακουστεί ως ξεχωριστός ήχος και το ύψος του τόνου συνήθως καθορίζεται από αρµονικές εκτός της θεµελιώδους. Το ύψος αυτού του στοιχείου είναι σχεδόν το ίδιο µε το ύψος του ολόκληρου ήχου. Συνεπώς, η παρουσία ή απουσία των θεµελιωδών στοιχείων δεν επηρεάζει σηµαντικά το ύψος του ολόκληρου ήχου. Επείσης το χαµηλό ύψος µπορεί να ακουστεί όταν κάθε στοιχείο στη θεµελιώδη συχνότητα επικαλύπτεται από χαµηλής συχνότητας θόρυβο. Χάρη σε αυτό που ονοµάζεται χαµηλό ύψος οι άνθρωποι µπορούν να απολαµβάνουν τη µουσική σε ένα µικρό ραδιόφωνο µε αµελητέα ανταπόκριση στις χαµηλές συχνότητες [89]. Σύµφωνα από τον Terhardt [90], αυτό αποτελεί τον πυρήνα των θεµελιωδών µπάσων του Rameau 23. Δεδοµένου ότι το θεµελιώδες µπάσο και οι σύγχρονοι οµόλογοί του αποτελούν βασικό στοιχείο για τη µελωδική και αρµονική 23 Ο Jean-Philippe Rameau ήταν ο πιο σηµαντικός µουσικοθεωρητικός και συνθέτης της γαλλικής όπερας την εποχή του µπαρόκ, µετά τον Jean-Batiste Lully. Επίσης θεωρείται ως ο µεγαλύτερος Γάλλος συνθέτης για το κλαβίχορδο µαζί µε τον Francois Couperin.

41 δοµή των µουσικών ήχων, µια φυσική βάση για το χαµηλό ύψος µπορεί να συµβάλει στην οικοδόµηση µιας αντικειµενικά θεµελιωµένης θεωρίας της µουσικής. 7.3.3. Θεωρίες της αντίληψης του ύψους για τους σύνθετους τόνους Για να κατανοηθούν οι θεωρίες της αντίληψης του ύψους για σύνθετους τόνους, είναι χρήσιµο να εξεταστεί το πως οι σύνθετοι τόνοι παρουσιάζονται στο περιφερικό ακουστικό σύστηµα. Μία προσοµοίωση της ανταπόκρισης της βασικής µεµβράνης σε ένα σύνθετο τόνο απεικονίζεται στο Σχήµα 7.4. Σε αυτό το παράδειγµα, ο σύνθετος τόνος είναι µια σειρά από σύντοµους παλµούς, των οποίων το φάσµα περιλαµβάνει πολλές ίσου πλάτους αρµονικές. Ο αριθµός των παλµών ανά δευτερόλεπτο (λέγεται επίσης και ρυθµός επανάληψης) είναι 200 και οι αρµονικές πρέπει να είναι ακέραια πολλαπλάσια των 200 Hz. Οι χαµηλότερες αρµονικές επιλύονται εν µέρει στη βασική µεµβράνη, και δίνουν αύξηση σε διαφορετικές κορυφές στη δραστηριότητα της σχηµατοµορφής κατά µήκος της βασικής µεµβράνης. Σε ένα σηµείο συντονισµένο µε τη συχνότητα της χαµηλής αρµονικής, η κυµατοµορφή στη Σχήµα 7.4: Απεικονίζεται ένα ήχητικό σήµα (παλµός) συχνότητας 200 Hz µε τις παράγωγες αρµονικές του.