Εξάλειψη αντήχησης από ηχητικά σήματα με υποκειμενικά / ψυχοακουστικά κριτήρια



Σχετικά έγγραφα
ΚΑΝΟΝΙΣΜΟΣ ΕΚΠΟΝΗΣΗΣ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ «ΕΠΕΞΕΡΓΑΣΙΑ ΨΗΦΙΑΚΟΥ ΣΗΜΑΤΟΣ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ ΥΛΙΚΟΥ»

Ψηφιακή Επεξεργασία Σηµμάτων

Ψηφιακή Επεξεργασία Σηµμάτων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

15/3/2009. Ένα ψηφιακό σήμα είναι η κβαντισμένη εκδοχή ενός σήματος διάκριτου. χρόνου. Φλώρος Ανδρέας Επίκ. Καθηγητής

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ. Θωμά Σ. Ζαρούχα

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Μελέτη και Ανάπτυξη Λογισµικού για την Εξοµοίωση Κλειστού Χώρου

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

Εργαστήριο Ηλεκτρoακουστικής Άσκηση 6 - Σελίδα 1 ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΑΣΚΗΣΗ 6 ΥΠΟΛΟΓΙΣΤΙΚΗ ΠΡΟΣΟΜΟΙΩΣΗ ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗΣ ΕΓΚΑΤΑΣΤΑΣΗΣ

Ακουστική)και)Ψυχοακουστική

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΗΧΗΤΙΚΕΣ ΕΓΚΑΤΑΣΤΑΣΕΙΣ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΗΧΗΤΙΚΩΝ Ε ΟΜΕΝΩΝ ΓΙΑ ΑΝΑΠΑΡΑΓΩΓΗ ΣΕ ΧΩΡΟΥΣ ΜΕ ΑΝΤΗΧΗΣΗ ΘΩΜΑ Σ. ΖΑΡΟΥΧΑ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ

Σύστημα ψηφιακής επεξεργασίας ακουστικών σημάτων με χρήση προγραμματιζόμενων διατάξεων πυλών. Πτυχιακή Εργασία. Φοιτητής: ΤΣΟΥΛΑΣ ΧΡΗΣΤΟΣ

Δρ. Φώτης Κοντομίχος Δρ. Θωμάς Ζαρούχας Δρ. Παναγιώτης Χατζηαντωνίου

1/3/2009. ιδάσκων. Ορολόγιο πρόγραμμα του μαθήματος. Φλώρος Ανδρέας Επίκ. Καθηγητής. Εκπόνηση εργασίας / εργασιών. ιαλέξεις. Εργαστηριακό / Εργαστήριο

Αφήγηση Μαρτυρία. Μουσική. Ενίσχυση μηνύματος Μουσική επένδυση Ηχητικά εφέ

H Επίδραση της Μιγαδικής Φασµατικής Εξοµάλυνσης στις Αποκρίσεις Ακουστικών Χώρων

1/3/2009. Τα ψηφιακά ηχητικά συστήματα πρέπει να επικοινωνήσουν με τον «αναλογικό» ανθρώπινο κόσμο. Φλώρος Ανδρέας Επίκ. Καθηγητής.

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ 9. ΗΧΗΤΙΚΕΣ ΕΓΚΑΤΑΣΤΑΣΕΙΣ ΑΚΟΥΣΤΙΚΗ ΚΑΛΥΨΗ ΓΙΑΝΝΗΣ ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΚΑΘΗΓΗΤΗΣ

Ψηφιακή Επεξεργασία Σηµμάτων

Keywords λέξεις κλειδιά:

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗΣ

Φλώρος Ανδρέας. Επίκ. Καθηγητής

28/4/2015. Papadakis Nikos 1. Ακουστική Μεγάλων Χώρων. Ακουστική Μικρών Κλειστών Χώρων. Ακουστική Συναυλιακών Χώρων και Επίδραση στην Ακοή

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

MIDI [8] MIDI. [9] Hsu [1], [2] [10] Salamon [11] [5] Song [6] Sony, Minato, Tokyo , Japan a) b)

Εξάμηνο σπουδών: Τεχνολογία Συστημάτων Ήχου, Εικόνας και Εκπομπής

Σύστημα ενίσχυσης ήχου εξωτερικού χώρου (Outdoor Sound Reinforcement System)

Μάθημα: Ακουστική και Ψυχοακουστική

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ & ΤΕΧΝΟΛΟΓΙΑ ΗΧΟΥ εισαγωγή

Ακουστική Κλειστών Χώρων

Διακριτές ανακλάσεις = συμβολή κυμάτων

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ειδικά Θέματα Ακουστικού Σχεδιασμού και Πολυμέσων

υπολογιστικών συστημάτων. Παρουσίαση με τίτλο "Περιεχόμενο, διαδικασία μαθήματος και εισαγωγή"

Μάθημα: Τεχνολογία Ήχου

Ακουστική Προσοµοίωση Τελετουργικών και ηµόσιων Χώρων της Αρχαίας Ελλάδας

Η Χ Ο Σ ΚΑΙ ΑΡΧΑΙΟ ΘΕΑΤΡΟ

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

X = (L + R) / 2 και Y = (L - R)

Μάθημα: Ψηφιακή Επεξεργασία Ήχου

Κεφάλαιο 4 Συμπίεση Ήχου

Ιόνιο Πανεπιστήμιο Τμήμα Τεχνών Ήχου και Εικόνας. Ακαδημαϊκό Έτος

Συλλογή & Επεξεργασία Δεδομένων Εργαστήριο 7 Ακούγοντας Πρώτη Ματιά στην Ανάλυση Fourier. Σύστημα Συλλογής & Επεξεργασίας Μετρήσεων

25 ευρώ συνολικά και για τα τέσσερα διαφορετικά εργαστήρια µουσικής τεχνολογίας

25/3/2009. Η επεξεργασία του ψηφιακού σήματος υλοποιείται μέσω κατάλληλου αλγορίθμου. Φλώρος Ανδρέας Επίκ. Καθηγητής Παράμετροι ελέγχου

ΙΕΜΑ Κύκλος διαλέξεων μουσικής ακουστικής

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογικό Eκπαιδευτικό Ίδρυμα Kρήτης TMHMA MHXANOΛOΓIAΣ. Δρ. Φασουλάς Γιάννης

ΧΡΟΝΙΚΑ ΜΕΤΑΒΑΛΛΟΜΕΝΑ ΦΙΛΤΡΑ ΓΙΑ ΕΠΕΞΕΡΓΑΣΙΑ ΗΧΗΤΙΚΩΝ ΣΗΜΑΤΩΝ TIME VARYING FILTERING METHODS FOR AUDIO SIGNALS

HMY 220: Σήματα και Συστήματα Ι

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Ραδιοτηλεοπτικά Συστήματα Ενότητα 3: Θεωρία Ψηφιοποίησης

Μετάδοση πληροφορίας - Διαμόρφωση

Μάθημα: Τεχνολογία Ήχου

Μέτρηση του χρόνου αντήχησης

ΑΔΑΜΑΝΤΙΑ Κ. ΣΠΑΝΑΚΑ Σύντομες Προδιαγραφές Συγγραφής Εκπαιδευτικού Υλικού εξ αποστάσεως εκπαίδευσης: Σημεία Προσοχής ΠΛΣ

Ο Ήχος ως Σήμα & η Ακουστική Οδός ως Σύστημα

Ασύρματες Ζεύξεις - Εργαστήριο

27/4/2009. Για την υλοποίηση τέτοιων αλγορίθμων επεξεργασίας απαιτείται η χρήση μνήμης. T η περίοδος δειγματοληψίας. Επίκ. Καθηγητής.

Fourier transform, STFT 5. Continuous wavelet transform, CWT STFT STFT STFT STFT [1] CWT CWT CWT STFT [2 5] CWT STFT STFT CWT CWT. Griffin [8] CWT CWT

Μάθημα: Ακουστική και Ψυχοακουστική

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ Δρ. ΣΩΤΗΡΙΟΣ Α. ΔΑΛΙΑΝΗΣ

Εργαστήριο Ηλεκτρoακουστικής Άσκηση 2 - Σελίδα 1 ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΑΣΚΗΣΗ 2

Μετάδοση πληροφορίας - Διαμόρφωση

19/2/2009. ιδάσκων. Ορολόγιο πρόγραμμα του μαθήματος. Εκπόνηση εργασίας / εργασιών. Ανδρέας Φλώρος(floros@ionio.gr) Ώρες διαλέξεων : TBD

Μετρήσεις και Ανάλυση της Ακουστικής του Θεάτρου της Επιδαύρου

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΜΙΚΡΟΦΩΝΑ ΓΙΑΝΝΗΣ ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΚΑΘΗΓΗΤΗΣ

Ήχος και φωνή. Τεχνολογία Πολυµέσων 04-1

Κύκλος διαλέξεων ακουστικής. Εισαγωγή στα θέματα

Estimation, Evaluation and Guarantee of the Reverberant Speech Recognition Performance based on Room Acoustic Parameters

Public Address (PA) Ενίσχυση Συναυλιών. Κύκλος Διαλέξεων Ηλεκτρακουστικής 20/2/2012. Δευτέρα, 20 Φεβρουαρίου 12

Μάθημα: Τεχνολογία Ήχου

Μάθημα: Ακουστική και Ψυχοακουστική

ΑΣΚΗΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗΣ

ΠΛΗ21 Κεφάλαιο 1. ΠΛΗ21 Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 1 Εισαγωγή

ΗΛΕΚΤΡΟΑΚΟΥΣΤΙΚΗ ΑΚΟΥΣΤΙΚΕΣ ΣΤΑΘΜΕΣ, ΜΕΤΡΗΣΕΙΣ, ΘΟΡΥΒΟΣ, ΗΧΟΜΟΝΩΣΗ ΓΙΑΝΝΗΣ ΜΟΥΡΤΖΟΠΟΥΛΟΣ ΚΑΘΗΓΗΤΗΣ

Ασύρματες Ζεύξεις - Εργαστήριο

Συμπίεση Δεδομένων

Συνθετικές εδαφικές κινήσεις Κεφ.22. Ε.Σώκος Εργαστήριο Σεισμολογίας Παν.Πατρών

Content. Introduction... 1

Ψηφιακός ήχος και κινούμενα γραφικά

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΠΑΡΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΣΗΜΑΤΟΣ

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Παραμετρική ανάλυση του συντελεστή ανάκλασης από στρωματοποιημένο πυθμένα δύο στρωμάτων με επικλινή διεπιφάνεια 1

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΤΗΛΕΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ

Άσκηση 8: Παραγωγή αλλοιωμένης φωνής (Alien voices generation)

Μάθημα: Τεχνολογία Ήχου

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

Σεραφείµ Καραµπογιάς ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ

Αλληλεπίδραση με εφαρμογές ήχου

Transcript:

Εξάλειψη αντήχησης από ηχητικά σήματα με υποκειμενικά / ψυχοακουστικά κριτήρια Θωμάς Ζαρούχας Διπλ. Ηλ/γος Μηχανικός thozar@wcl.ee.upatras.gr Παναγιώτης Χατζηαντωνίου Δρ. Ηλ/γος Μηχανικός hagianto@wcl.ee.upatras.gr Ιωάννης Μουρτζόπουλος Αν. Καθηγητής mourjop@wcl.ee.upatras.gr ΠΕΡΙΛΗΨΗ Η αναπαραγωγή ηχητικών σημάτων σε κλειστούς χώρους με αντήχηση συνοδεύεται από την παρουσία παραμορφώσεων που επηρεάζουν αρνητικά την ηχητική ποιότητα. Στην εργασία αυτή θα παρουσιαστεί μια μέθοδος για την μείωση των παραμορφώσεων αυτών, με βάση ψυχοακουστικά κριτήρια. Για το σκοπό αυτό ένα κατάλληλο Υπολογιστικό Μοντέλο Ακουστικής Επικάλυψης (ΥΜΑΕ) (Computational Auditory Masing Model - CAMM) χρησιμοποιείται, το οποίο περιγράφει επιτυχώς διάφορες πτυχές της επεξεργασίας ενός ηχητικού σήματος από το σύστημα ακοής. Ηχογραφημένα σήματα σε διαφορετικούς χώρους με διαφορετικές ακουστικές ιδιότητες καθώς και τα αντίστοιχα σήματα εξόδου θα παρουσιαστούν, αποδεικνύοντας την ικανότητα της μεθόδου αυτής να περιορίσει τις παραμορφώσεις λόγω αντήχησης. Suppressing reverberation from audio signals using perceptual criteria ABSTRACT The reproduction of audio signals in reverberant rooms introduces audible distortions which generally degrade the overall audio quality. A novel signaldependent approach is followed here for suppressing distortions due to reverberation based on perceptual criteria. A Computational Auditory Masing Model (CAMM) is employed which efficiently emulate various aspects of the monaural signal processing of the auditory system. Audio signals recorded in rooms with different acoustical properties and the corresponding post-processed signals will be presented, indicating the effectiveness of the proposed method to model and suppress the perceived distortions due to reverberation.

Εισαγωγή Οι ιδιότητες των ακουστικών συστημάτων, όπως οι χώροι ακρόασης, εισάγουν σημαντικό ποσοστό αντήχησης στα ακουστικά σήματα κατά την αναπαραγωγή τους μέσα σε αυτούς. Η αντήχηση αυτή περιγράφεται συνήθως από μια, εξαρτώμενη των ακουστικών συστημάτων (system-depended), προσέγγιση και από τις αντίστοιχες γραμμικές συναρτήσεις απόκρισης αυτών των συστημάτων (π.χ. σχέσεις εισόδου/εξόδου που χρησιμοποιούν τη Συνάρτηση Μεταφοράς Χώρου). Μια τέτοια προσέγγιση έχει τη σημασία της, ειδικά για υλοποιήσεις που βασίζονται στην Ψηφιακή Επεξεργασία Σήματος και που ανάλογα με την εκάστοτε εφαρμογή, μπορούν να διαμορφώσουν, να συνθέσουν ή να καταστείλουν μερικώς την αντήχηση [-3]. Εντούτοις, η ακουστική αντίληψη της αντήχησης χώρων είναι ένα σύνθετο φαινόμενο, που επηρεάζεται από ένα πλήθος, εξαρτημένων από το σήμα (signal-depended), παραγόντων (π.χ. χρόνο-συχνοτικές αλλοιώσεις, καθυστερήσεις, ηχητική στάθμη, κατευθυντικότητα) όπως έχει περιγραφεί πρόσφατα από το Χωρικό Μοντέλο Επικάλυψης [4,5,6]. Στην τρέχουσα περίοδο, υπάρχει ένα σημαντικό χάσμα μεταξύ της αντικειμενικής (εξαρτώμενης από το σύστημα) προσέγγισης και οποιασδήποτε εξαρτώμενης από το σήμα (βασιζόμενη σε αντιληπτικά κριτήρια), προσέγγισης για την ανάλυση τέτοιων φαινομένων. Διάφορες, εξαρτώμενες από το σήμα, (εκ των υστέρων) επεξεργασίες για την μείωση της αντήχησης προτάθηκαν στο παρελθόν στις δημοσιευμένες εργασίες [7,8]. Τα χαρακτηριστικά των ηχητικών σημάτων χρησιμοποιήθηκαν, επίσης, στη δημιουργία του μοντέλου περιβάλλουσας της αντήχησης, που εισήχθηκε από τις εργασίες [9,0]. Στη συνέχεια, η ερευνητική εργασία που έγινε κυρίως από την επιστημονική κοινότητα της Τεχνολογίας Ομιλίας οδήγησε στη χρησιμοποίηση παρόμοιων προσεγγίσεων για τον περιορισμό της αντήχησης σε χώρους ακρόασης. Στην παρούσα εργασία, περιγράφεται μια πρώτη προσπάθεια χρησιμοποίησης ενός Υπολογιστικού Μοντέλου Ακουστικής Επικάλυψης (Computational Auditory Masing Model, CAMM) [,2] για να περιγράψει τις αντιληπτές παραμορφώσεις, λόγω αντήχησης, στα ακουστικά σήματα. Το παρόν μοντέλο δίνει μια απλουστευμένη έκδοση της αρχής της Χωρικής Επικάλυψης (Room Masing) και υιοθετεί δεδομένα ενός καναλιού (μονοφωνικά) χρησιμοποιώντας ως εισόδους το ακουστικό σήμα της πηγής και το αντίστοιχο σήμα με αντήχηση. Ως εκ τούτου η μέθοδος μπορεί να σχετίζεται εννοιολογικά με παρόμοια οριζόμενα κριτήρια όπως τα NMR και PAQM [3,4] και επίσης με το ορισμένο στο πεδίο του χρόνου ακουστικό μοντέλο που περιγράφεται στην επιστημονική εργασία [5]. Σύμφωνα με την προτεινόμενη προσέγγιση, είναι δυνατό να εντοπιστούν στο σήμα από τις υπολογιζόμενες "εσωτερικές αναπαραστάσεις", περιοχές («χάρτες») χρόνου/συχνότητας με σημαντική παραμόρφωση λόγω της αντήχησης. Η παρούσα εργασία επεξηγεί επίσης μια νέα προσέγγιση για την τροποποίηση αυτών των περιοχών χρόνου/συχνότητας των ακουστικών σημάτων, με χρήση κατάλληλων συναρτήσεων επεξεργασίας προκειμένου να παραχθεί μία έκδοση «εξαλειμμένης αντήχησης» του παραμορφωμένου σήματος. Το παρόν κείμενο οργανώνεται ως εξής: Στην ενότητα, αναλύεται εν συντομία το Υπολογιστικό Μοντέλο Ακουστικής Επικάλυψης (ΥΜΑΕ) και παρουσιάζεται η χρήση του στη διαδικασία της «εξάλειψης αντήχησης». Στις ενότητες 2 και 3 περιγράφονται η μοντελοποίηση και η επεξεργασία των παραμορφώσεων λόγω

αντήχησης, κατά την έννοια της ακουστικής αντίληψης. Στην ενότητα 4 αποτελέσματα της επεξεργασίας των ηχητικών σημάτων θα παρουσιασθούν. Συμπεράσματα και μελλοντικές προεκτάσεις θα επισημανθούν στην ενότητα 5.. Το Υπολογιστικό Μοντέλο Ακουστικής Επικάλυψης (ΥΜΑΕ) Το Υπολογιστικό Μοντέλο Ακουστικής Επικάλυψης (ΥΜΑΕ) που χρησιμοποιήθηκε στην παρούσα εργασία, περιγράφει επιτυχώς διάφορες πτυχές της επεξεργασίας των ηχητικών σημάτων από το ανθρώπινο ακουστικό σύστημα [,2]. Η βασική υπόθεση στην οποία βασίζεται το ΥΜΑΕ (βλ. Σχήμα.) είναι η Συμπίεση Εξαρτώμενη Σήματος (ΣΕΣ) (Signal Dependent Compression, SDC), βάση της οποίας το ανθρώπινο ακουστικό σύστημα επιτελεί μια συμπίεση στο πλάτος του σήματος εισόδου, της οποίας τα χαρακτηριστικά εξαρτώνται από την χρονική εξέλιξη του σήματος. Σχήμα. Δομικό διάγραμμα του Υπολογιστικού Μοντέλου Ακουστικής Επικάλυψης Με βάση το ΥΜΑΕ, τα σήματα εισόδου εισάγονται σε ένα στάδιο προεπεξεργασίας το οποίο αποτελείται από μια υβριδική τράπεζα φίλτρων η οποία περιγράφει τη συχνοτική ανάλυση που επιτελείται στη βασική μεμβράνη, από μια διάταξη ανόρθωσης και ένα χαμηλοδιαβατό φίλτρο, τα οποία αναφέρονται στη μετατροπή (μηχανική σε ηλεκτρική) που υλοποιείται στα τριχοειδή κύτταρα (inner hair cells). Τα σήματα που προκύπτουν από την παραπάνω επεξεργασία οδηγούνται στο ΣΕΣ στάδιο (όπου παράλληλα υλοποιείται και μια χρονική ολοκλήρωση) και στην συνέχεια σε μια διαδικασία απόφασης όπου με την χρήση κατάλληλων κατωφλίων ορίζεται αν η υπολογισθείσα παραμόρφωση είναι υποκειμενικά σημαντική. Για την επιτυχή μοντελοποίηση της αντήχησης σε διάφορους χώρους, μια υβριδική τράπεζα φίλτρων χρησιμοποιήθηκε, η οποία διαχωρίζει το ακουστικό εύρος συχνοτήτων σε 39 περιοχές. Οι πρώτες 8 περιοχές καλύπτουν περιοχή συχνοτήτων 0~690Hz με εύρος 86.25 Hz, ενώ για τις υπόλοιπες περιοχές το εύρος συχνοτήτων είναι αντίστοιχο με αυτό της τράπεζας φίλτρων που χρησιμοποιείται στο πρότυπο MPEG- (ISO/IEC 72-3) για την κωδικοποίηση ηχητικών δεδομένων [6].

x x z z Σχήμα.2 Υποκειμενική εκτίμηση παραμορφώσεων Η υποκειμενική εκτίμηση των παραμορφώσεων λόγω αντήχησης, με τη χρήση του ΥΜΑΕ, επιτυγχάνεται ως εξής (βλ. Σχήμα.2) : x n, Ως είσοδος στο ΥΜΑΕ χρησιμοποιείται το ανηχωικό ηχητικό σήμα ( ) καθώς και το αντίστοιχο ηχογραφημένο σήμα x, παρέχοντας ως έξοδο τις αντίστοιχες «εσωτερικές αναπαραστάσεις» z ( n ) και z ανά συχνοτική περιοχή. Οι «εσωτερικές αναπαραστάσεις» χρησιμοποιούνται σε κατάλληλες Διαδικασίες Απόφασης (ΔΑ). Η βασική αρχή στην οποία βασίζονται οι ΔΑ είναι η Just Noticeable Difference (JND), όπου ουσιαστικά υπολογίζεται η διαφορά των παραπάνω «εσωτερικών αναπαραστάσεων», εξασφαλίζοντας τη δυνατότητα προσδιορισμού χρονο-συχνοτικών περιοχών με σημαντική υποκειμενική παραμόρφωση λόγω αντήχησης. 2. Μοντελοποίηση παραμορφώσεων λόγω αντήχησης Ένα σχηματικό διάγραμμα το οποίο αναφέρεται στην παραπάνω μέθοδο φαίνεται στο Σχήμα 2.. x x z D Δ x x Σχήμα 2. Διαδικασία ανάλυσης για τον προσδιορισμό της παραμέτρου D ( n ) Είσοδος στην υβριδική τράπεζα φίλτρων είναι το ανηχωικό x( n ) σήμα και το αντίστοιχο ηχητικό σήμα x με αντήχηση, όπως μπορεί να καταγραφεί σε οποιοδήποτε κλειστό χώρο με τη χρήση παντοκατευθυντικού μικροφώνου. Τα x n οδηγούνται στο σήματα από τις αντίστοιχες συχνοτικές περιοχές x ( n ) και ( ) ΥΜΑΕ το οποίο παρέχει τις αντίστοιχες «εσωτερικές αναπαραστάσεις» z ( ) z n και

z. Ο υπολογισμός της διαφοράς των «εσωτερικών αναπαραστάσεων» πραγματοποιείται σε μια Διαδικασία Απόφασης βάση της ακόλουθης σχέσης Δ n = z n z n (2.) ( ) ( ) ( ) Με τη χρήση ενός κατάλληλου συνόλου κατωφλίων υπολογίζεται η παρακάτω παράμετρος D =Δ T (2.2) η οποία υποδεικνύει την ένταση των παραμορφώσεων λόγω αντήχησης (πάνω από το προκαθορισμένο κατώφλι) στο πεδίο χρόνου-συχνότητας. Για τη βελτιστοποίηση των τιμών των κατωφλίων είναι δυνατό να χρησιμοποιηθεί η Συνάρτηση Μεταφοράς Χώρου. 3. Ελαχιστοποίηση παραμορφώσεων λόγω αντήχησης Λαμβάνοντας υπόψη τις παραμέτρους D ( ) n, είναι εφικτή η ελαχιστοποίηση των υποκειμενικά σημαντικών παραμορφώσεων λόγω αντήχησης. Κατάλληλες συναρτήσεις κέρδους/τροποποίησης είναι δυνατό να ορισθούν με τη χρήση ενός κατάλληλου γραμμικού μετασχηματισμού I {}., { } G D Η χρήση των παραπάνω συναρτήσεων G ( ) σημάτων x φαίνεται στο Σχήμα 3.2. D =I (3.3) n, για την τροποποίηση των x x 2 G xˆ xˆ 2 x xˆ xˆ x Σχήμα 3.2 Διαδικασία σύνθεσης σημάτων με υποκειμενικά μικρότερη αντήχηση Τα σήματα ˆx ( n ) οδηγούνται σε μια τράπεζα σύνθεσης (λαμβάνοντας υπόψη τις σχετικές καθυστερήσεις) δημιουργώντας το σήμα ˆx( n ), στο οποίο η xˆ

παραμόρφωση είναι υποκειμενικά μικρότερη. Σήμα με υποκειμενικά μικρότερη παραμόρφωση παρουσιάζεται στο Σχήμα 3.3. Σχήμα 3.2 Απεικόνιση της παραμέτρου D ( ) Πλάτος 0-0 - 0 - n στο πεδίο χρόνου-συχνότητας 0 2000 24000 36000 Δείγματα Σχήμα 3.3 (a)τμήμα ανηχωικού σήματος, (b) αντίστοιχο τμήμα ηχογραφημένου σήματος στο χώρο 3, (c) επεξεργασμένο σήμα Πρέπει να σημειωθεί ότι η μέθοδος δεν αποσκοπεί στο να ανασυνθέσει το ηχογραφημένο ηχητικό σήμα στην αρχική του μορφή (ανηχωικό), αλλά να περιορίσει υποκειμενικά τις παραμορφώσεις λόγω αντήχησης. 4. Αποτελέσματα Μετρήσεις πραγματοποιήθηκαν έχοντας ως αναφορά μονοφωνικά ηχητικά σήματα, με ευκρίνεια κβαντισμού 6 bit και συχνότητα δειγματοληψίας 4400Hz. Οι ηχογραφήσεις πραγματοποιήθηκαν σε 3 χώρους με διαφορετικές ακουστικές ιδιότητες, όπως φαίνεται στον Πίνακα. Τα αντίστοιχα επεξεργασμένα ηχητικά (a) (b) (c)

δείγματα μπορούν να αποκτηθούν από την δικτυακή διεύθυνση http://www.wcl.ee.upatras.gr/audiogroup/demos. Η απεικόνιση της παραμέτρου D ( n ) για το χώρο 3 και για συγκεκριμένες συχνοτικές περιοχές φαίνεται στο Σχήμα 3.2. Στο Σχήμα 3.3 παρουσιάζονται το επεξεργασμένο σήμα ˆx σε σύγκριση με το ηχογραφημένο και το ανηχωικό σήμα. Από άτυπες δοκιμές ακρόασης επιβεβαιώνεται ότι η προτεινόμενη μέθοδος μπορεί να μοντελοποιήσει επιτυχώς την αντιληπτή αντήχηση και μπορεί να επιτύχει μείωση της, ανεξαρτήτως χώρου και θέσης ακρόασης. Πιστεύεται ότι η απόδοση της μεθόδου για αυτού του είδους επεξεργασίες, υπερβαίνει την απόδοση των υπαρχουσών μεθόδων αποσυνέλιξης. Χώρος Πίνακας 4. Ιδιότητες χώρων ηχογράφησης Διαστάσεις ΜxΠxΥ(m) RT (sec) Τύπος 7.5x4.60x2.90 0.368 Εργαστήριο 2 0.20x7.05x2.65. 3 60x42x3.8 6.4 Αίθουσα διδασκαλίας Κλειστό γήπεδο 5. Συμπεράσματα Η παρούσα μελέτη δείχνει ότι η πρόσφατη πρόοδος που έχει επιτευχθεί στην προσομοίωση της ακουστικής επικάλυψης δημιουργεί ευοίωνες προοπτικές για τη χρήση της στην περιγραφή και επεξεργασία των αντιληπτών αποτελεσμάτων της αντήχησης. Αυτή η προσέγγιση αποκλίνει σημαντικά από τις κυρίαρχες, εξαρτώμενες του συστήματος, μεθόδους που χρησιμοποιούνται σε πολλές εφαρμογές DSP για την αντιμετώπιση προβλημάτων αυτής της κατηγορίας, ακολουθώντας μια τεχνική εξαρτώμενη του σήματος. Τα προφανή πλεονεκτήματα μιας τέτοιας προσέγγισης είναι, ότι τα γνωστά προβλήματα που παρουσιάζονται στις ακριβείς μετρήσεις της Συνάρτησης Μεταφοράς Χώρου μπορούν να αποφευχθούν και επίσης μπορεί να επιτευχθεί η επεξεργασία των καθυστερημένων παραμορφώσεων λόγω αντήχησης σε μια μεγαλύτερη κλίμακα, δεδομένου ότι μόνο οι, από πλευράς ακουστικής αντίληψης, σημαντικές περιοχές του σήματος επηρεάζονται μετά από την επεξεργασία. Στην παρούσα φάση, η παραπάνω μέθοδος βασίζεται σε μονοωτικές ιδιότητες επικάλυψης και χρησιμοποιεί μια απλουστευμένη εκδοχή της πολυδιάστατης αρχής της Χωρικής Επικάλυψης (Room Masing) αλλά αναμένεται να συμπληρωθεί από κατάλληλες επεκτάσεις για να χειριστεί διάφορες παραμέτρους του σήματος (χρονικές καθυστερήσεις, διαφορές στάθμης, κ.λ.π) που διαμορφώνονται κατά την διάδοση του στους χώρους ακρόασης.

6. Αναφορές [] M. R. Schroeder, B. F. Logan, Colorless Artificial Reverberation, Journal of the Audio Engineering Society, Vol. 9, p. 92, (96). [2] S. T. Neely, J. B. Allen, Invertibility of a Room Impulse Response, Journal of the Acoustical Society of America, Vol. 66, pp. 65-69, (979). [3] J. N. Mourjopoulos, Digital Equalization of Room Acoustics, Journal of the Audio Engineering Society, Vol. 42, No, pp. 884-900, (994). [4] J. Blauert Spatial Hearing: The Psychophysics of Human Localization (Revised Edition), The MIT press, USA-Cambridge (997). [5] J. M. Buchholz, J. Mourjopoulos, J. Blauert, Room Masing: Understanding and Modeling the Masing of Room Reflections, 0 th AES Convention, Amsterdam, (200). [6] R. H. Bolt, A. D. MacDonald, Theory of Speech Masing by Reverberation, Journal of the Acoustical Society of America, Vol. 2(6), pp. 577-580, (949). [7] J. L. Flanagan, R. C. Lummis, Signal Processing to Reduce Multipath Distortions in Small Rooms, Journal of the Audio Engineering Society, Vol. 47, pp. 475-48, (970). [8] J. B. Allen, D. A. Berley, J. Blauert, Multimicrophone Signal Processing Technique to Remove Room Reverberation from Speech Signals, Journal of the Acoustical Society of America, Vol. 64(2), pp. 92-95, (977). [9] T. Langhams, H. W. Strube, Speech Enhancement by Nonlinear Multiband Envelope Filtering, IEEE, in Proc. ICASPP, (982). [0] J. Mourjopoulos, J. K. Hammond, Modeling and Enhancement of Reverberant Speech using an Envelope Convolution Method, IEEE, in Proc. ICASSP, (983). [] J. M. Buchholz, J. Mourjopoulos, A Computational Auditory Masing Model Based on Signal-Dependent Compression. I. Model Description and Performance Analysis, Acta Acustica United with Acustica, Vol. 90, pp.873-886, (2004). [2] J. M. Buchholz, J. Mourjopoulos, A Computational Auditory Masing Model Based on Signal-Dependent Compression. II. Model Simulations and Analytical Approximations, Acta Acustica United with Acustica, Vol. 90, pp.887-900, (2004). [3] J. Herre, E. Eberlein, H. Schott, K. Brandenburg, Advanced Audio Measurement System using Psychoacoustic Properties, 92 nd AES Convention, March, (992). [4] J. G. Beerends, J. A. Stemerdin, A Perceptual Audio Quality Measure Based on a Psychoacoustic Sound Representation, Journal of the Audio Engineering Society, Vol. 40, No 2, pp. 963-978, (992). [5] D. J. M. Robinson, M. J. Hawsford, Time-Domain Auditory Model for the Assessment of High-quality Coded Audio, 07 th AES Convention, September (999). [6] ISO/IEC 72-3, Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about.5 Mbit/s, Part 3: Audio